aboutsummaryrefslogtreecommitdiffhomepage
path: root/src/jumper
diff options
context:
space:
mode:
authorGravatar Mike Klein <mtklein@chromium.org>2017-08-24 13:06:23 -0400
committerGravatar Skia Commit-Bot <skia-commit-bot@chromium.org>2017-08-24 18:51:57 +0000
commitfb126fa96e0f49f5dc17a9a043acced68be99e93 (patch)
tree5a9616cb9fdf2600e4ad9454e96d6f8a1492a7a5 /src/jumper
parentf05bddaac3d8219fcaf623b64897ced81c05d437 (diff)
rework plus blend mode
The most interesting parts of this are how plus interacts with partial coverage. Plus needs its clamp to happen after the lerp. Luckily, some of its math folds away: d' = clamp[ d*(1-c) + (s+d)*c ] == clamp[ d - dc + sc + dc ] == clamp[ d + sc ] What's nice there is that coverage can be folded into the src term. This suggests that we can re-write the plus stage to clamp internally (and thus, be viable for 8-bit) if we always pre-scale with coverage. We don't have a way to pre-scale with 565 coverage until now, but it's only a step or two away from there. We can use the alternate formulation we derived for alpha for lerp_565, calculating the alpha coverage from red, green, and blue coverages _and_ the values of src and dst alpha. While we already pre-scale srcover today for 8-bit or constant coverage, we cannot do the same for 565. When evaluating the expression d' = s + (1-a)d we need the a term to be pre-scaled with red's coverage when calculating dr', with blue's when calculating db', etc. Essentially we need to carry around a bunch of extra values, and we've got no way to do that. So instead, we'll just carefully pre-scale plus with any coverage, and keep post-lerping srcover when we have 565 coverage. Change-Id: I7a7a52eec7d482e1b98bb8a01ea0a3d5e67bef65 Reviewed-on: https://skia-review.googlesource.com/38300 Commit-Queue: Mike Klein <mtklein@chromium.org> Reviewed-by: Florin Malita <fmalita@chromium.org>
Diffstat (limited to 'src/jumper')
-rw-r--r--src/jumper/SkJumper.cpp1
-rw-r--r--src/jumper/SkJumper_generated.S9724
-rw-r--r--src/jumper/SkJumper_generated_win.S8580
-rw-r--r--src/jumper/SkJumper_stages.cpp29
-rw-r--r--src/jumper/SkJumper_stages_8bit.cpp17
5 files changed, 9820 insertions, 8531 deletions
diff --git a/src/jumper/SkJumper.cpp b/src/jumper/SkJumper.cpp
index b36084ccac..afd12e073c 100644
--- a/src/jumper/SkJumper.cpp
+++ b/src/jumper/SkJumper.cpp
@@ -99,6 +99,7 @@ using StartPipelineFn = void(size_t,size_t,size_t,size_t, void**,K*);
M(multiply) \
M(screen) \
M(xor_) \
+ M(plus_) \
M(darken) \
M(lighten) \
M(difference) \
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S
index e072a564c9..93848bac3e 100644
--- a/src/jumper/SkJumper_generated.S
+++ b/src/jumper/SkJumper_generated.S
@@ -385,9 +385,14 @@ FUNCTION(_sk_plus__aarch64)
_sk_plus__aarch64:
.long 0xf8408425 // ldr x5, [x1], #8
.long 0x4e24d400 // fadd v0.4s, v0.4s, v4.4s
+ .long 0x4f03f610 // fmov v16.4s, #1.000000000000000000e+00
.long 0x4e25d421 // fadd v1.4s, v1.4s, v5.4s
.long 0x4e26d442 // fadd v2.4s, v2.4s, v6.4s
.long 0x4e27d463 // fadd v3.4s, v3.4s, v7.4s
+ .long 0x4eb0f400 // fmin v0.4s, v0.4s, v16.4s
+ .long 0x4eb0f421 // fmin v1.4s, v1.4s, v16.4s
+ .long 0x4eb0f442 // fmin v2.4s, v2.4s, v16.4s
+ .long 0x4eb0f463 // fmin v3.4s, v3.4s, v16.4s
.long 0xd61f00a0 // br x5
HIDDEN _sk_screen_aarch64
@@ -1307,7 +1312,7 @@ _sk_srcover_rgba_8888_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb5000504 // cbnz x4, 11c4 <_sk_srcover_rgba_8888_aarch64+0xbc>
+ .long 0xb5000504 // cbnz x4, 11d8 <_sk_srcover_rgba_8888_aarch64+0xbc>
.long 0x3dc00104 // ldr q4, [x8]
.long 0x6f00e625 // movi v5.2d, #0xff000000ff
.long 0x6f380486 // ushr v6.4s, v4.4s, #8
@@ -1342,42 +1347,42 @@ _sk_srcover_rgba_8888_aarch64:
.long 0x6e21a871 // fcvtnu v17.4s, v3.4s
.long 0x4f385631 // shl v17.4s, v17.4s, #24
.long 0x4eb11e10 // orr v16.16b, v16.16b, v17.16b
- .long 0xb5000284 // cbnz x4, 1200 <_sk_srcover_rgba_8888_aarch64+0xf8>
+ .long 0xb5000284 // cbnz x4, 1214 <_sk_srcover_rgba_8888_aarch64+0xf8>
.long 0x3d800110 // str q16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000300 // b.eq 122c <_sk_srcover_rgba_8888_aarch64+0x124> // b.none
+ .long 0x54000300 // b.eq 1240 <_sk_srcover_rgba_8888_aarch64+0x124> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e404 // movi v4.2d, #0x0
- .long 0x540000c0 // b.eq 11f0 <_sk_srcover_rgba_8888_aarch64+0xe8> // b.none
+ .long 0x540000c0 // b.eq 1204 <_sk_srcover_rgba_8888_aarch64+0xe8> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffa61 // b.ne 112c <_sk_srcover_rgba_8888_aarch64+0x24> // b.any
+ .long 0x54fffa61 // b.ne 1140 <_sk_srcover_rgba_8888_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x4d408124 // ld1 {v4.s}[2], [x9]
.long 0xfd400105 // ldr d5, [x8]
.long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8
.long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8
- .long 0x17ffffcc // b 112c <_sk_srcover_rgba_8888_aarch64+0x24>
+ .long 0x17ffffcc // b 1140 <_sk_srcover_rgba_8888_aarch64+0x24>
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000180 // b.eq 1238 <_sk_srcover_rgba_8888_aarch64+0x130> // b.none
+ .long 0x54000180 // b.eq 124c <_sk_srcover_rgba_8888_aarch64+0x130> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 1224 <_sk_srcover_rgba_8888_aarch64+0x11c> // b.none
+ .long 0x540000a0 // b.eq 1238 <_sk_srcover_rgba_8888_aarch64+0x11c> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd01 // b.ne 11b8 <_sk_srcover_rgba_8888_aarch64+0xb0> // b.any
+ .long 0x54fffd01 // b.ne 11cc <_sk_srcover_rgba_8888_aarch64+0xb0> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4d008130 // st1 {v16.s}[2], [x9]
.long 0xfd000110 // str d16, [x8]
- .long 0x17ffffe4 // b 11b8 <_sk_srcover_rgba_8888_aarch64+0xb0>
+ .long 0x17ffffe4 // b 11cc <_sk_srcover_rgba_8888_aarch64+0xb0>
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x0d408104 // ld1 {v4.s}[0], [x8]
- .long 0x17ffffbe // b 112c <_sk_srcover_rgba_8888_aarch64+0x24>
+ .long 0x17ffffbe // b 1140 <_sk_srcover_rgba_8888_aarch64+0x24>
.long 0x0d008110 // st1 {v16.s}[0], [x8]
- .long 0x17ffffdf // b 11b8 <_sk_srcover_rgba_8888_aarch64+0xb0>
+ .long 0x17ffffdf // b 11cc <_sk_srcover_rgba_8888_aarch64+0xb0>
HIDDEN _sk_clamp_0_aarch64
.globl _sk_clamp_0_aarch64
@@ -1680,44 +1685,44 @@ HIDDEN _sk_rgb_to_hsl_aarch64
.globl _sk_rgb_to_hsl_aarch64
FUNCTION(_sk_rgb_to_hsl_aarch64)
_sk_rgb_to_hsl_aarch64:
- .long 0x4e21f410 // fmax v16.4s, v0.4s, v1.4s
- .long 0x4ea1f411 // fmin v17.4s, v0.4s, v1.4s
+ .long 0x4e22f430 // fmax v16.4s, v1.4s, v2.4s
+ .long 0x4ea2f431 // fmin v17.4s, v1.4s, v2.4s
.long 0x6ea1e454 // fcmgt v20.4s, v2.4s, v1.4s
.long 0x4f00f715 // fmov v21.4s, #6.000000000000000000e+00
- .long 0x4e22f610 // fmax v16.4s, v16.4s, v2.4s
- .long 0x4ea2f631 // fmin v17.4s, v17.4s, v2.4s
+ .long 0x4e30f410 // fmax v16.4s, v0.4s, v16.4s
+ .long 0x4eb1f411 // fmin v17.4s, v0.4s, v17.4s
.long 0x4f03f612 // fmov v18.4s, #1.000000000000000000e+00
.long 0x4e341eb4 // and v20.16b, v21.16b, v20.16b
.long 0x4eb1d615 // fsub v21.4s, v16.4s, v17.4s
.long 0x4ea2d433 // fsub v19.4s, v1.4s, v2.4s
- .long 0x4ea0d456 // fsub v22.4s, v2.4s, v0.4s
- .long 0x4f026417 // movi v23.4s, #0x40, lsl #24
- .long 0x6e35fe42 // fdiv v2.4s, v18.4s, v21.4s
- .long 0x4ea1d418 // fsub v24.4s, v0.4s, v1.4s
- .long 0x4f00f619 // fmov v25.4s, #4.000000000000000000e+00
- .long 0x4f0167fa // movi v26.4s, #0x3f, lsl #24
- .long 0x4eb0d6f2 // fsub v18.4s, v23.4s, v16.4s
- .long 0x4e36cc57 // fmla v23.4s, v2.4s, v22.4s
- .long 0x4e31e616 // fcmeq v22.4s, v16.4s, v17.4s
+ .long 0x4ea0d442 // fsub v2.4s, v2.4s, v0.4s
+ .long 0x4f026416 // movi v22.4s, #0x40, lsl #24
+ .long 0x4ea1d417 // fsub v23.4s, v0.4s, v1.4s
+ .long 0x4f00f618 // fmov v24.4s, #4.000000000000000000e+00
+ .long 0x6e35fe52 // fdiv v18.4s, v18.4s, v21.4s
+ .long 0x4f0167f9 // movi v25.4s, #0x3f, lsl #24
+ .long 0x4e33ce54 // fmla v20.4s, v18.4s, v19.4s
+ .long 0x4eb0d6d3 // fsub v19.4s, v22.4s, v16.4s
+ .long 0x4e22ce56 // fmla v22.4s, v18.4s, v2.4s
+ .long 0x4e37ce58 // fmla v24.4s, v18.4s, v23.4s
+ .long 0x4e31e612 // fcmeq v18.4s, v16.4s, v17.4s
.long 0x4e20e600 // fcmeq v0.4s, v16.4s, v0.4s
.long 0x4e21e601 // fcmeq v1.4s, v16.4s, v1.4s
.long 0x4e31d610 // fadd v16.4s, v16.4s, v17.4s
.long 0x52a7c548 // mov w8, #0x3e2a0000
- .long 0x4e33cc54 // fmla v20.4s, v2.4s, v19.4s
- .long 0x4e38cc59 // fmla v25.4s, v2.4s, v24.4s
- .long 0x6e3ade02 // fmul v2.4s, v16.4s, v26.4s
+ .long 0x6e39de02 // fmul v2.4s, v16.4s, v25.4s
.long 0x72955568 // movk w8, #0xaaab
.long 0xf8408425 // ldr x5, [x1], #8
- .long 0x4eb1d651 // fsub v17.4s, v18.4s, v17.4s
- .long 0x6ebae452 // fcmgt v18.4s, v2.4s, v26.4s
- .long 0x6e791ee1 // bsl v1.16b, v23.16b, v25.16b
- .long 0x4e040d13 // dup v19.4s, w8
- .long 0x6e701e32 // bsl v18.16b, v17.16b, v16.16b
+ .long 0x4eb1d671 // fsub v17.4s, v19.4s, v17.4s
+ .long 0x6eb9e453 // fcmgt v19.4s, v2.4s, v25.4s
+ .long 0x6e781ec1 // bsl v1.16b, v22.16b, v24.16b
+ .long 0x4e040d1a // dup v26.4s, w8
+ .long 0x6e701e33 // bsl v19.16b, v17.16b, v16.16b
.long 0x6e611e80 // bsl v0.16b, v20.16b, v1.16b
- .long 0x6e32fea1 // fdiv v1.4s, v21.4s, v18.4s
- .long 0x6e33dc00 // fmul v0.4s, v0.4s, v19.4s
- .long 0x4e761c00 // bic v0.16b, v0.16b, v22.16b
- .long 0x4e761c21 // bic v1.16b, v1.16b, v22.16b
+ .long 0x6e33fea1 // fdiv v1.4s, v21.4s, v19.4s
+ .long 0x6e3adc00 // fmul v0.4s, v0.4s, v26.4s
+ .long 0x4e721c00 // bic v0.16b, v0.16b, v18.16b
+ .long 0x4e721c21 // bic v1.16b, v1.16b, v18.16b
.long 0xd61f00a0 // br x5
HIDDEN _sk_hsl_to_rgb_aarch64
@@ -1823,7 +1828,7 @@ _sk_scale_u8_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 1814 <_sk_scale_u8_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 1828 <_sk_scale_u8_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -1848,12 +1853,12 @@ _sk_scale_u8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 1860 <_sk_scale_u8_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 1874 <_sk_scale_u8_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e410 // movi d16, #0x0
- .long 0x540000c0 // b.eq 1840 <_sk_scale_u8_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 1854 <_sk_scale_u8_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 17dc <_sk_scale_u8_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 17f0 <_sk_scale_u8_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x4e0a1d30 // mov v16.h[2], w9
@@ -1864,11 +1869,83 @@ _sk_scale_u8_aarch64:
.long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h
.long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4
.long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4
- .long 0x17ffffe0 // b 17dc <_sk_scale_u8_aarch64+0x3c>
+ .long 0x17ffffe0 // b 17f0 <_sk_scale_u8_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x4e021d10 // mov v16.h[0], w8
- .long 0x17ffffdc // b 17dc <_sk_scale_u8_aarch64+0x3c>
+ .long 0x17ffffdc // b 17f0 <_sk_scale_u8_aarch64+0x3c>
+
+HIDDEN _sk_scale_565_aarch64
+.globl _sk_scale_565_aarch64
+FUNCTION(_sk_scale_565_aarch64)
+_sk_scale_565_aarch64:
+ .long 0xf9400028 // ldr x8, [x1]
+ .long 0xb9400909 // ldr w9, [x8, #8]
+ .long 0xf9400108 // ldr x8, [x8]
+ .long 0x1b037d29 // mul w9, w9, w3
+ .long 0x8b29c508 // add x8, x8, w9, sxtw #1
+ .long 0xd3607c49 // lsl x9, x2, #32
+ .long 0x8b897d08 // add x8, x8, x9, asr #31
+ .long 0xb50004c4 // cbnz x4, 1938 <_sk_scale_565_aarch64+0xb4>
+ .long 0xfd400110 // ldr d16, [x8]
+ .long 0x52a6f088 // mov w8, #0x37840000
+ .long 0x72842108 // movk w8, #0x2108
+ .long 0x4e040d12 // dup v18.4s, w8
+ .long 0x321b17e8 // orr w8, wzr, #0x7e0
+ .long 0x4e040d13 // dup v19.4s, w8
+ .long 0x52a74048 // mov w8, #0x3a020000
+ .long 0x2f10a610 // uxtl v16.4s, v16.4h
+ .long 0x4f072711 // movi v17.4s, #0xf8, lsl #8
+ .long 0x72810428 // movk w8, #0x821
+ .long 0x4f0007f4 // movi v20.4s, #0x1f
+ .long 0x4e040d15 // dup v21.4s, w8
+ .long 0x52a7a088 // mov w8, #0x3d040000
+ .long 0x4e311e11 // and v17.16b, v16.16b, v17.16b
+ .long 0x72842108 // movk w8, #0x2108
+ .long 0x4e341e14 // and v20.16b, v16.16b, v20.16b
+ .long 0x4e331e10 // and v16.16b, v16.16b, v19.16b
+ .long 0x4e21da31 // scvtf v17.4s, v17.4s
+ .long 0x6e32de31 // fmul v17.4s, v17.4s, v18.4s
+ .long 0x4e040d12 // dup v18.4s, w8
+ .long 0x4e21da94 // scvtf v20.4s, v20.4s
+ .long 0x4e21da10 // scvtf v16.4s, v16.4s
+ .long 0x6e32de92 // fmul v18.4s, v20.4s, v18.4s
+ .long 0x6e35de10 // fmul v16.4s, v16.4s, v21.4s
+ .long 0xf9400425 // ldr x5, [x1, #8]
+ .long 0x6e22de42 // fmul v2.4s, v18.4s, v2.4s
+ .long 0x4eb2f614 // fmin v20.4s, v16.4s, v18.4s
+ .long 0x4e32f612 // fmax v18.4s, v16.4s, v18.4s
+ .long 0x6ea3e4f3 // fcmgt v19.4s, v7.4s, v3.4s
+ .long 0x6e20de20 // fmul v0.4s, v17.4s, v0.4s
+ .long 0x6e21de01 // fmul v1.4s, v16.4s, v1.4s
+ .long 0x4eb4f630 // fmin v16.4s, v17.4s, v20.4s
+ .long 0x4e32f631 // fmax v17.4s, v17.4s, v18.4s
+ .long 0x6e711e13 // bsl v19.16b, v16.16b, v17.16b
+ .long 0x6e23de63 // fmul v3.4s, v19.4s, v3.4s
+ .long 0x91004021 // add x1, x1, #0x10
+ .long 0xd61f00a0 // br x5
+ .long 0x12000489 // and w9, w4, #0x3
+ .long 0x7100053f // cmp w9, #0x1
+ .long 0x54000220 // b.eq 1984 <_sk_scale_565_aarch64+0x100> // b.none
+ .long 0x7100093f // cmp w9, #0x2
+ .long 0x2f00e410 // movi d16, #0x0
+ .long 0x540000c0 // b.eq 1964 <_sk_scale_565_aarch64+0xe0> // b.none
+ .long 0x71000d3f // cmp w9, #0x3
+ .long 0x54fffaa1 // b.ne 18a8 <_sk_scale_565_aarch64+0x24> // b.any
+ .long 0x91001109 // add x9, x8, #0x4
+ .long 0x0e020ff0 // dup v16.4h, wzr
+ .long 0x0d405130 // ld1 {v16.h}[2], [x9]
+ .long 0x79400109 // ldrh w9, [x8]
+ .long 0x79400508 // ldrh w8, [x8, #2]
+ .long 0x4e041d31 // mov v17.s[0], w9
+ .long 0x4e0c1d11 // mov v17.s[1], w8
+ .long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h
+ .long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4
+ .long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4
+ .long 0x17ffffca // b 18a8 <_sk_scale_565_aarch64+0x24>
+ .long 0x0e020ff0 // dup v16.4h, wzr
+ .long 0x0d404110 // ld1 {v16.h}[0], [x8]
+ .long 0x17ffffc7 // b 18a8 <_sk_scale_565_aarch64+0x24>
HIDDEN _sk_lerp_1_float_aarch64
.globl _sk_lerp_1_float_aarch64
@@ -1900,7 +1977,7 @@ _sk_lerp_u8_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50003e4 // cbnz x4, 1940 <_sk_lerp_u8_aarch64+0x94>
+ .long 0xb50003e4 // cbnz x4, 1a60 <_sk_lerp_u8_aarch64+0x94>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -1933,12 +2010,12 @@ _sk_lerp_u8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 198c <_sk_lerp_u8_aarch64+0xe0> // b.none
+ .long 0x54000220 // b.eq 1aac <_sk_lerp_u8_aarch64+0xe0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e410 // movi d16, #0x0
- .long 0x540000c0 // b.eq 196c <_sk_lerp_u8_aarch64+0xc0> // b.none
+ .long 0x540000c0 // b.eq 1a8c <_sk_lerp_u8_aarch64+0xc0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc61 // b.ne 18e8 <_sk_lerp_u8_aarch64+0x3c> // b.any
+ .long 0x54fffc61 // b.ne 1a08 <_sk_lerp_u8_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x4e0a1d30 // mov v16.h[2], w9
@@ -1949,11 +2026,11 @@ _sk_lerp_u8_aarch64:
.long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h
.long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4
.long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4
- .long 0x17ffffd8 // b 18e8 <_sk_lerp_u8_aarch64+0x3c>
+ .long 0x17ffffd8 // b 1a08 <_sk_lerp_u8_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x4e021d10 // mov v16.h[0], w8
- .long 0x17ffffd4 // b 18e8 <_sk_lerp_u8_aarch64+0x3c>
+ .long 0x17ffffd4 // b 1a08 <_sk_lerp_u8_aarch64+0x3c>
HIDDEN _sk_lerp_565_aarch64
.globl _sk_lerp_565_aarch64
@@ -1966,60 +2043,60 @@ _sk_lerp_565_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb50005c4 // cbnz x4, 1a70 <_sk_lerp_565_aarch64+0xd4>
+ .long 0xb50005c4 // cbnz x4, 1b90 <_sk_lerp_565_aarch64+0xd4>
.long 0xfd400110 // ldr d16, [x8]
- .long 0x321b17e8 // orr w8, wzr, #0x7e0
- .long 0x4e040d12 // dup v18.4s, w8
.long 0x52a6f088 // mov w8, #0x37840000
- .long 0x2f10a610 // uxtl v16.4s, v16.4h
- .long 0x4f072711 // movi v17.4s, #0xf8, lsl #8
.long 0x72842108 // movk w8, #0x2108
- .long 0x4f0007f3 // movi v19.4s, #0x1f
- .long 0x4e311e11 // and v17.16b, v16.16b, v17.16b
- .long 0x4e331e13 // and v19.16b, v16.16b, v19.16b
- .long 0x4e321e10 // and v16.16b, v16.16b, v18.16b
.long 0x4e040d12 // dup v18.4s, w8
+ .long 0x321b17e8 // orr w8, wzr, #0x7e0
+ .long 0x2f10a610 // uxtl v16.4s, v16.4h
+ .long 0x4f072711 // movi v17.4s, #0xf8, lsl #8
+ .long 0x4e040d13 // dup v19.4s, w8
.long 0x52a7a088 // mov w8, #0x3d040000
.long 0x72842108 // movk w8, #0x2108
- .long 0x4e21da31 // scvtf v17.4s, v17.4s
- .long 0x6e32de31 // fmul v17.4s, v17.4s, v18.4s
- .long 0x4e040d12 // dup v18.4s, w8
+ .long 0x4f0007f5 // movi v21.4s, #0x1f
+ .long 0x4e311e11 // and v17.16b, v16.16b, v17.16b
+ .long 0x4e040d14 // dup v20.4s, w8
.long 0x52a74048 // mov w8, #0x3a020000
+ .long 0x4e351e15 // and v21.16b, v16.16b, v21.16b
+ .long 0x4ea4d416 // fsub v22.4s, v0.4s, v4.4s
+ .long 0x4e21da20 // scvtf v0.4s, v17.4s
.long 0x72810428 // movk w8, #0x821
- .long 0x4ea4d414 // fsub v20.4s, v0.4s, v4.4s
- .long 0x4e21da60 // scvtf v0.4s, v19.4s
- .long 0x6e32dc12 // fmul v18.4s, v0.4s, v18.4s
- .long 0x4e040d00 // dup v0.4s, w8
+ .long 0x4e331e10 // and v16.16b, v16.16b, v19.16b
+ .long 0x6e32dc11 // fmul v17.4s, v0.4s, v18.4s
+ .long 0x4ea5d432 // fsub v18.4s, v1.4s, v5.4s
+ .long 0x4e21daa1 // scvtf v1.4s, v21.4s
+ .long 0x6e34dc34 // fmul v20.4s, v1.4s, v20.4s
+ .long 0x4e040d01 // dup v1.4s, w8
.long 0x4e21da10 // scvtf v16.4s, v16.4s
- .long 0x6e20de10 // fmul v16.4s, v16.4s, v0.4s
+ .long 0x6e21de10 // fmul v16.4s, v16.4s, v1.4s
+ .long 0x4ea51ca1 // mov v1.16b, v5.16b
+ .long 0xf9400425 // ldr x5, [x1, #8]
+ .long 0x4e32ce01 // fmla v1.4s, v16.4s, v18.4s
+ .long 0x4eb4f612 // fmin v18.4s, v16.4s, v20.4s
+ .long 0x4e34f610 // fmax v16.4s, v16.4s, v20.4s
+ .long 0x6ea3e4f3 // fcmgt v19.4s, v7.4s, v3.4s
.long 0x4ea41c80 // mov v0.16b, v4.16b
- .long 0x4e34ce20 // fmla v0.4s, v17.4s, v20.4s
- .long 0x4ea7d463 // fsub v3.4s, v3.4s, v7.4s
- .long 0x4ea71cf4 // mov v20.16b, v7.16b
- .long 0x4ea5d433 // fsub v19.4s, v1.4s, v5.4s
- .long 0x4ea6d441 // fsub v1.4s, v2.4s, v6.4s
+ .long 0x4eb2f632 // fmin v18.4s, v17.4s, v18.4s
+ .long 0x4e30f630 // fmax v16.4s, v17.4s, v16.4s
+ .long 0x4ea6d455 // fsub v21.4s, v2.4s, v6.4s
+ .long 0x4e36ce20 // fmla v0.4s, v17.4s, v22.4s
.long 0x4ea61cc2 // mov v2.16b, v6.16b
- .long 0x4e23ce34 // fmla v20.4s, v17.4s, v3.4s
- .long 0x4ea71cf1 // mov v17.16b, v7.16b
- .long 0x4e21ce42 // fmla v2.4s, v18.4s, v1.4s
- .long 0x4e23ce51 // fmla v17.4s, v18.4s, v3.4s
- .long 0x4ea71cf2 // mov v18.16b, v7.16b
- .long 0xf9400425 // ldr x5, [x1, #8]
- .long 0x4e23ce12 // fmla v18.4s, v16.4s, v3.4s
- .long 0x4ea51ca1 // mov v1.16b, v5.16b
- .long 0x4e31f643 // fmax v3.4s, v18.4s, v17.4s
- .long 0x4e33ce01 // fmla v1.4s, v16.4s, v19.4s
- .long 0x4e23f683 // fmax v3.4s, v20.4s, v3.4s
+ .long 0x4ea7d476 // fsub v22.4s, v3.4s, v7.4s
+ .long 0x4ea71ce3 // mov v3.16b, v7.16b
+ .long 0x6e701e53 // bsl v19.16b, v18.16b, v16.16b
+ .long 0x4e35ce82 // fmla v2.4s, v20.4s, v21.4s
+ .long 0x4e36ce63 // fmla v3.4s, v19.4s, v22.4s
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 1abc <_sk_lerp_565_aarch64+0x120> // b.none
+ .long 0x54000220 // b.eq 1bdc <_sk_lerp_565_aarch64+0x120> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e410 // movi d16, #0x0
- .long 0x540000c0 // b.eq 1a9c <_sk_lerp_565_aarch64+0x100> // b.none
+ .long 0x540000c0 // b.eq 1bbc <_sk_lerp_565_aarch64+0x100> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fff9a1 // b.ne 19c0 <_sk_lerp_565_aarch64+0x24> // b.any
+ .long 0x54fff9a1 // b.ne 1ae0 <_sk_lerp_565_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x0d405130 // ld1 {v16.h}[2], [x9]
@@ -2030,10 +2107,10 @@ _sk_lerp_565_aarch64:
.long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h
.long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4
.long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4
- .long 0x17ffffc2 // b 19c0 <_sk_lerp_565_aarch64+0x24>
+ .long 0x17ffffc2 // b 1ae0 <_sk_lerp_565_aarch64+0x24>
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x0d404110 // ld1 {v16.h}[0], [x8]
- .long 0x17ffffbf // b 19c0 <_sk_lerp_565_aarch64+0x24>
+ .long 0x17ffffbf // b 1ae0 <_sk_lerp_565_aarch64+0x24>
HIDDEN _sk_load_tables_aarch64
.globl _sk_load_tables_aarch64
@@ -2042,7 +2119,7 @@ _sk_load_tables_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400109 // ldr x9, [x8]
.long 0x8b020929 // add x9, x9, x2, lsl #2
- .long 0xb50006e4 // cbnz x4, 1bb0 <_sk_load_tables_aarch64+0xe8>
+ .long 0xb50006e4 // cbnz x4, 1cd0 <_sk_load_tables_aarch64+0xe8>
.long 0x3dc00122 // ldr q2, [x9]
.long 0xa940a909 // ldp x9, x10, [x8, #8]
.long 0x6f00e620 // movi v0.2d, #0xff000000ff
@@ -2099,22 +2176,22 @@ _sk_load_tables_aarch64:
.long 0xd61f00a0 // br x5
.long 0x1200048a // and w10, w4, #0x3
.long 0x7100055f // cmp w10, #0x1
- .long 0x540001a0 // b.eq 1bec <_sk_load_tables_aarch64+0x124> // b.none
+ .long 0x540001a0 // b.eq 1d0c <_sk_load_tables_aarch64+0x124> // b.none
.long 0x7100095f // cmp w10, #0x2
.long 0x6f00e402 // movi v2.2d, #0x0
- .long 0x540000c0 // b.eq 1bdc <_sk_load_tables_aarch64+0x114> // b.none
+ .long 0x540000c0 // b.eq 1cfc <_sk_load_tables_aarch64+0x114> // b.none
.long 0x71000d5f // cmp w10, #0x3
- .long 0x54fff881 // b.ne 1adc <_sk_load_tables_aarch64+0x14> // b.any
+ .long 0x54fff881 // b.ne 1bfc <_sk_load_tables_aarch64+0x14> // b.any
.long 0x9100212a // add x10, x9, #0x8
.long 0x4e040fe2 // dup v2.4s, wzr
.long 0x4d408142 // ld1 {v2.s}[2], [x10]
.long 0xfd400120 // ldr d0, [x9]
.long 0x6e004040 // ext v0.16b, v2.16b, v0.16b, #8
.long 0x6e004002 // ext v2.16b, v0.16b, v0.16b, #8
- .long 0x17ffffbd // b 1adc <_sk_load_tables_aarch64+0x14>
+ .long 0x17ffffbd // b 1bfc <_sk_load_tables_aarch64+0x14>
.long 0x4e040fe2 // dup v2.4s, wzr
.long 0x0d408122 // ld1 {v2.s}[0], [x9]
- .long 0x17ffffba // b 1adc <_sk_load_tables_aarch64+0x14>
+ .long 0x17ffffba // b 1bfc <_sk_load_tables_aarch64+0x14>
HIDDEN _sk_load_tables_u16_be_aarch64
.globl _sk_load_tables_u16_be_aarch64
@@ -2123,7 +2200,7 @@ _sk_load_tables_u16_be_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400109 // ldr x9, [x8]
.long 0x8b020d29 // add x9, x9, x2, lsl #3
- .long 0xb5000744 // cbnz x4, 1cec <_sk_load_tables_u16_be_aarch64+0xf4>
+ .long 0xb5000744 // cbnz x4, 1e0c <_sk_load_tables_u16_be_aarch64+0xf4>
.long 0x0c400520 // ld4 {v0.4h-v3.4h}, [x9]
.long 0xa940a909 // ldp x9, x10, [x8, #8]
.long 0x2f07b7e0 // bic v0.4h, #0xff, lsl #8
@@ -2183,14 +2260,14 @@ _sk_load_tables_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606120 // ld4 {v0.h-v3.h}[0], [x9]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fff8c0 // b.eq 1c0c <_sk_load_tables_u16_be_aarch64+0x14> // b.none
+ .long 0x54fff8c0 // b.eq 1d2c <_sk_load_tables_u16_be_aarch64+0x14> // b.none
.long 0x9100212a // add x10, x9, #0x8
.long 0x0d606940 // ld4 {v0.h-v3.h}[1], [x10]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fff843 // b.cc 1c0c <_sk_load_tables_u16_be_aarch64+0x14> // b.lo, b.ul, b.last
+ .long 0x54fff843 // b.cc 1d2c <_sk_load_tables_u16_be_aarch64+0x14> // b.lo, b.ul, b.last
.long 0x91004129 // add x9, x9, #0x10
.long 0x0d607120 // ld4 {v0.h-v3.h}[2], [x9]
- .long 0x17ffffbf // b 1c0c <_sk_load_tables_u16_be_aarch64+0x14>
+ .long 0x17ffffbf // b 1d2c <_sk_load_tables_u16_be_aarch64+0x14>
HIDDEN _sk_load_tables_rgb_u16_be_aarch64
.globl _sk_load_tables_rgb_u16_be_aarch64
@@ -2200,7 +2277,7 @@ _sk_load_tables_rgb_u16_be_aarch64:
.long 0x321f07ea // orr w10, wzr, #0x6
.long 0xf9400109 // ldr x9, [x8]
.long 0x9b0a2449 // madd x9, x2, x10, x9
- .long 0xb5000664 // cbnz x4, 1df0 <_sk_load_tables_rgb_u16_be_aarch64+0xdc>
+ .long 0xb5000664 // cbnz x4, 1f10 <_sk_load_tables_rgb_u16_be_aarch64+0xdc>
.long 0x0c404520 // ld3 {v0.4h-v2.4h}, [x9]
.long 0xa940a909 // ldp x9, x10, [x8, #8]
.long 0x2f07b7e0 // bic v0.4h, #0xff, lsl #8
@@ -2253,14 +2330,14 @@ _sk_load_tables_rgb_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d406120 // ld3 {v0.h-v2.h}[0], [x9]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fff9a0 // b.eq 1d2c <_sk_load_tables_rgb_u16_be_aarch64+0x18> // b.none
+ .long 0x54fff9a0 // b.eq 1e4c <_sk_load_tables_rgb_u16_be_aarch64+0x18> // b.none
.long 0x9100192a // add x10, x9, #0x6
.long 0x0d406940 // ld3 {v0.h-v2.h}[1], [x10]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fff923 // b.cc 1d2c <_sk_load_tables_rgb_u16_be_aarch64+0x18> // b.lo, b.ul, b.last
+ .long 0x54fff923 // b.cc 1e4c <_sk_load_tables_rgb_u16_be_aarch64+0x18> // b.lo, b.ul, b.last
.long 0x91003129 // add x9, x9, #0xc
.long 0x0d407120 // ld3 {v0.h-v2.h}[2], [x9]
- .long 0x17ffffc6 // b 1d2c <_sk_load_tables_rgb_u16_be_aarch64+0x18>
+ .long 0x17ffffc6 // b 1e4c <_sk_load_tables_rgb_u16_be_aarch64+0x18>
HIDDEN _sk_byte_tables_aarch64
.globl _sk_byte_tables_aarch64
@@ -3003,7 +3080,7 @@ _sk_load_a8_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 2908 <_sk_load_a8_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 2a28 <_sk_load_a8_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -3028,12 +3105,12 @@ _sk_load_a8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2954 <_sk_load_a8_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 2a74 <_sk_load_a8_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e402 // movi d2, #0x0
- .long 0x540000c0 // b.eq 2934 <_sk_load_a8_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 2a54 <_sk_load_a8_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 28d0 <_sk_load_a8_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 29f0 <_sk_load_a8_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe2 // dup v2.4h, wzr
.long 0x4e0a1d22 // mov v2.h[2], w9
@@ -3044,11 +3121,11 @@ _sk_load_a8_aarch64:
.long 0x0e401800 // uzp1 v0.4h, v0.4h, v0.4h
.long 0x2e002040 // ext v0.8b, v2.8b, v0.8b, #4
.long 0x2e002002 // ext v2.8b, v0.8b, v0.8b, #4
- .long 0x17ffffe0 // b 28d0 <_sk_load_a8_aarch64+0x3c>
+ .long 0x17ffffe0 // b 29f0 <_sk_load_a8_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe2 // dup v2.4h, wzr
.long 0x4e021d02 // mov v2.h[0], w8
- .long 0x17ffffdc // b 28d0 <_sk_load_a8_aarch64+0x3c>
+ .long 0x17ffffdc // b 29f0 <_sk_load_a8_aarch64+0x3c>
HIDDEN _sk_load_a8_dst_aarch64
.globl _sk_load_a8_dst_aarch64
@@ -3060,7 +3137,7 @@ _sk_load_a8_dst_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 29d8 <_sk_load_a8_dst_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 2af8 <_sk_load_a8_dst_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -3085,12 +3162,12 @@ _sk_load_a8_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2a24 <_sk_load_a8_dst_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 2b44 <_sk_load_a8_dst_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e406 // movi d6, #0x0
- .long 0x540000c0 // b.eq 2a04 <_sk_load_a8_dst_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 2b24 <_sk_load_a8_dst_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 29a0 <_sk_load_a8_dst_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 2ac0 <_sk_load_a8_dst_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe6 // dup v6.4h, wzr
.long 0x4e0a1d26 // mov v6.h[2], w9
@@ -3101,11 +3178,11 @@ _sk_load_a8_dst_aarch64:
.long 0x0e401884 // uzp1 v4.4h, v4.4h, v0.4h
.long 0x2e0420c4 // ext v4.8b, v6.8b, v4.8b, #4
.long 0x2e042086 // ext v6.8b, v4.8b, v4.8b, #4
- .long 0x17ffffe0 // b 29a0 <_sk_load_a8_dst_aarch64+0x3c>
+ .long 0x17ffffe0 // b 2ac0 <_sk_load_a8_dst_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe6 // dup v6.4h, wzr
.long 0x4e021d06 // mov v6.h[0], w8
- .long 0x17ffffdc // b 29a0 <_sk_load_a8_dst_aarch64+0x3c>
+ .long 0x17ffffdc // b 2ac0 <_sk_load_a8_dst_aarch64+0x3c>
HIDDEN _sk_gather_a8_aarch64
.globl _sk_gather_a8_aarch64
@@ -3157,7 +3234,7 @@ _sk_store_a8_aarch64:
.long 0x0e612a10 // xtn v16.4h, v16.4s
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb5000184 // cbnz x4, 2b08 <_sk_store_a8_aarch64+0x5c>
+ .long 0xb5000184 // cbnz x4, 2c28 <_sk_store_a8_aarch64+0x5c>
.long 0x0e0e3e09 // umov w9, v16.h[3]
.long 0x0e0a3e0a // umov w10, v16.h[2]
.long 0x0e063e0b // umov w11, v16.h[1]
@@ -3171,21 +3248,21 @@ _sk_store_a8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000180 // b.eq 2b40 <_sk_store_a8_aarch64+0x94> // b.none
+ .long 0x54000180 // b.eq 2c60 <_sk_store_a8_aarch64+0x94> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 2b2c <_sk_store_a8_aarch64+0x80> // b.none
+ .long 0x540000a0 // b.eq 2c4c <_sk_store_a8_aarch64+0x80> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 2afc <_sk_store_a8_aarch64+0x50> // b.any
+ .long 0x54fffee1 // b.ne 2c1c <_sk_store_a8_aarch64+0x50> // b.any
.long 0x0e0a3e09 // umov w9, v16.h[2]
.long 0x39000909 // strb w9, [x8, #2]
.long 0x0e023e09 // umov w9, v16.h[0]
.long 0x0e063e0a // umov w10, v16.h[1]
.long 0x3900050a // strb w10, [x8, #1]
.long 0x39000109 // strb w9, [x8]
- .long 0x17fffff0 // b 2afc <_sk_store_a8_aarch64+0x50>
+ .long 0x17fffff0 // b 2c1c <_sk_store_a8_aarch64+0x50>
.long 0x0e023e09 // umov w9, v16.h[0]
.long 0x39000109 // strb w9, [x8]
- .long 0x17ffffed // b 2afc <_sk_store_a8_aarch64+0x50>
+ .long 0x17ffffed // b 2c1c <_sk_store_a8_aarch64+0x50>
HIDDEN _sk_load_g8_aarch64
.globl _sk_load_g8_aarch64
@@ -3197,7 +3274,7 @@ _sk_load_g8_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 2bc0 <_sk_load_g8_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 2ce0 <_sk_load_g8_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -3222,12 +3299,12 @@ _sk_load_g8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2c0c <_sk_load_g8_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 2d2c <_sk_load_g8_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e400 // movi d0, #0x0
- .long 0x540000c0 // b.eq 2bec <_sk_load_g8_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 2d0c <_sk_load_g8_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 2b88 <_sk_load_g8_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 2ca8 <_sk_load_g8_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x4e0a1d20 // mov v0.h[2], w9
@@ -3238,11 +3315,11 @@ _sk_load_g8_aarch64:
.long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
.long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
.long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
- .long 0x17ffffe0 // b 2b88 <_sk_load_g8_aarch64+0x3c>
+ .long 0x17ffffe0 // b 2ca8 <_sk_load_g8_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x4e021d00 // mov v0.h[0], w8
- .long 0x17ffffdc // b 2b88 <_sk_load_g8_aarch64+0x3c>
+ .long 0x17ffffdc // b 2ca8 <_sk_load_g8_aarch64+0x3c>
HIDDEN _sk_load_g8_dst_aarch64
.globl _sk_load_g8_dst_aarch64
@@ -3254,7 +3331,7 @@ _sk_load_g8_dst_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 2c90 <_sk_load_g8_dst_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 2db0 <_sk_load_g8_dst_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -3279,12 +3356,12 @@ _sk_load_g8_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2cdc <_sk_load_g8_dst_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 2dfc <_sk_load_g8_dst_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e404 // movi d4, #0x0
- .long 0x540000c0 // b.eq 2cbc <_sk_load_g8_dst_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 2ddc <_sk_load_g8_dst_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 2c58 <_sk_load_g8_dst_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 2d78 <_sk_load_g8_dst_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x4e0a1d24 // mov v4.h[2], w9
@@ -3295,11 +3372,11 @@ _sk_load_g8_dst_aarch64:
.long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h
.long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4
.long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4
- .long 0x17ffffe0 // b 2c58 <_sk_load_g8_dst_aarch64+0x3c>
+ .long 0x17ffffe0 // b 2d78 <_sk_load_g8_dst_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x4e021d04 // mov v4.h[0], w8
- .long 0x17ffffdc // b 2c58 <_sk_load_g8_dst_aarch64+0x3c>
+ .long 0x17ffffdc // b 2d78 <_sk_load_g8_dst_aarch64+0x3c>
HIDDEN _sk_gather_g8_aarch64
.globl _sk_gather_g8_aarch64
@@ -3347,7 +3424,7 @@ _sk_load_565_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb50003c4 // cbnz x4, 2df8 <_sk_load_565_aarch64+0x94>
+ .long 0xb50003c4 // cbnz x4, 2f18 <_sk_load_565_aarch64+0x94>
.long 0xfd400100 // ldr d0, [x8]
.long 0x321b17e8 // orr w8, wzr, #0x7e0
.long 0x4e040d02 // dup v2.4s, w8
@@ -3379,12 +3456,12 @@ _sk_load_565_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2e44 <_sk_load_565_aarch64+0xe0> // b.none
+ .long 0x54000220 // b.eq 2f64 <_sk_load_565_aarch64+0xe0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e400 // movi d0, #0x0
- .long 0x540000c0 // b.eq 2e24 <_sk_load_565_aarch64+0xc0> // b.none
+ .long 0x540000c0 // b.eq 2f44 <_sk_load_565_aarch64+0xc0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffba1 // b.ne 2d88 <_sk_load_565_aarch64+0x24> // b.any
+ .long 0x54fffba1 // b.ne 2ea8 <_sk_load_565_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d405120 // ld1 {v0.h}[2], [x9]
@@ -3395,10 +3472,10 @@ _sk_load_565_aarch64:
.long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
.long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
.long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
- .long 0x17ffffd2 // b 2d88 <_sk_load_565_aarch64+0x24>
+ .long 0x17ffffd2 // b 2ea8 <_sk_load_565_aarch64+0x24>
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d404100 // ld1 {v0.h}[0], [x8]
- .long 0x17ffffcf // b 2d88 <_sk_load_565_aarch64+0x24>
+ .long 0x17ffffcf // b 2ea8 <_sk_load_565_aarch64+0x24>
HIDDEN _sk_load_565_dst_aarch64
.globl _sk_load_565_dst_aarch64
@@ -3411,7 +3488,7 @@ _sk_load_565_dst_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb50003c4 // cbnz x4, 2ee4 <_sk_load_565_dst_aarch64+0x94>
+ .long 0xb50003c4 // cbnz x4, 3004 <_sk_load_565_dst_aarch64+0x94>
.long 0xfd400104 // ldr d4, [x8]
.long 0x321b17e8 // orr w8, wzr, #0x7e0
.long 0x4e040d06 // dup v6.4s, w8
@@ -3443,12 +3520,12 @@ _sk_load_565_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2f30 <_sk_load_565_dst_aarch64+0xe0> // b.none
+ .long 0x54000220 // b.eq 3050 <_sk_load_565_dst_aarch64+0xe0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e404 // movi d4, #0x0
- .long 0x540000c0 // b.eq 2f10 <_sk_load_565_dst_aarch64+0xc0> // b.none
+ .long 0x540000c0 // b.eq 3030 <_sk_load_565_dst_aarch64+0xc0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffba1 // b.ne 2e74 <_sk_load_565_dst_aarch64+0x24> // b.any
+ .long 0x54fffba1 // b.ne 2f94 <_sk_load_565_dst_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d405124 // ld1 {v4.h}[2], [x9]
@@ -3459,10 +3536,10 @@ _sk_load_565_dst_aarch64:
.long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h
.long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4
.long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4
- .long 0x17ffffd2 // b 2e74 <_sk_load_565_dst_aarch64+0x24>
+ .long 0x17ffffd2 // b 2f94 <_sk_load_565_dst_aarch64+0x24>
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d404104 // ld1 {v4.h}[0], [x8]
- .long 0x17ffffcf // b 2e74 <_sk_load_565_dst_aarch64+0x24>
+ .long 0x17ffffcf // b 2f94 <_sk_load_565_dst_aarch64+0x24>
HIDDEN _sk_gather_565_aarch64
.globl _sk_gather_565_aarch64
@@ -3538,24 +3615,24 @@ _sk_store_565_aarch64:
.long 0x4eb11e10 // orr v16.16b, v16.16b, v17.16b
.long 0x8b897d08 // add x8, x8, x9, asr #31
.long 0x0e612a10 // xtn v16.4h, v16.4s
- .long 0xb50000a4 // cbnz x4, 3054 <_sk_store_565_aarch64+0x68>
+ .long 0xb50000a4 // cbnz x4, 3174 <_sk_store_565_aarch64+0x68>
.long 0xfd000110 // str d16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 3080 <_sk_store_565_aarch64+0x94> // b.none
+ .long 0x54000120 // b.eq 31a0 <_sk_store_565_aarch64+0x94> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 3078 <_sk_store_565_aarch64+0x8c> // b.none
+ .long 0x540000a0 // b.eq 3198 <_sk_store_565_aarch64+0x8c> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 3048 <_sk_store_565_aarch64+0x5c> // b.any
+ .long 0x54fffee1 // b.ne 3168 <_sk_store_565_aarch64+0x5c> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0d005130 // st1 {v16.h}[2], [x9]
.long 0x91000909 // add x9, x8, #0x2
.long 0x0d004930 // st1 {v16.h}[1], [x9]
.long 0x0d004110 // st1 {v16.h}[0], [x8]
- .long 0x17fffff1 // b 3048 <_sk_store_565_aarch64+0x5c>
+ .long 0x17fffff1 // b 3168 <_sk_store_565_aarch64+0x5c>
HIDDEN _sk_load_4444_aarch64
.globl _sk_load_4444_aarch64
@@ -3568,7 +3645,7 @@ _sk_load_4444_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb5000444 // cbnz x4, 312c <_sk_load_4444_aarch64+0xa4>
+ .long 0xb5000444 // cbnz x4, 324c <_sk_load_4444_aarch64+0xa4>
.long 0xfd400100 // ldr d0, [x8]
.long 0x52a6f108 // mov w8, #0x37880000
.long 0x2f10a400 // uxtl v0.4s, v0.4h
@@ -3604,12 +3681,12 @@ _sk_load_4444_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 3178 <_sk_load_4444_aarch64+0xf0> // b.none
+ .long 0x54000220 // b.eq 3298 <_sk_load_4444_aarch64+0xf0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e400 // movi d0, #0x0
- .long 0x540000c0 // b.eq 3158 <_sk_load_4444_aarch64+0xd0> // b.none
+ .long 0x540000c0 // b.eq 3278 <_sk_load_4444_aarch64+0xd0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffb21 // b.ne 30ac <_sk_load_4444_aarch64+0x24> // b.any
+ .long 0x54fffb21 // b.ne 31cc <_sk_load_4444_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d405120 // ld1 {v0.h}[2], [x9]
@@ -3620,10 +3697,10 @@ _sk_load_4444_aarch64:
.long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
.long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
.long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
- .long 0x17ffffce // b 30ac <_sk_load_4444_aarch64+0x24>
+ .long 0x17ffffce // b 31cc <_sk_load_4444_aarch64+0x24>
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d404100 // ld1 {v0.h}[0], [x8]
- .long 0x17ffffcb // b 30ac <_sk_load_4444_aarch64+0x24>
+ .long 0x17ffffcb // b 31cc <_sk_load_4444_aarch64+0x24>
HIDDEN _sk_load_4444_dst_aarch64
.globl _sk_load_4444_dst_aarch64
@@ -3636,7 +3713,7 @@ _sk_load_4444_dst_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb5000444 // cbnz x4, 3228 <_sk_load_4444_dst_aarch64+0xa4>
+ .long 0xb5000444 // cbnz x4, 3348 <_sk_load_4444_dst_aarch64+0xa4>
.long 0xfd400104 // ldr d4, [x8]
.long 0x52a6f108 // mov w8, #0x37880000
.long 0x2f10a484 // uxtl v4.4s, v4.4h
@@ -3672,12 +3749,12 @@ _sk_load_4444_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 3274 <_sk_load_4444_dst_aarch64+0xf0> // b.none
+ .long 0x54000220 // b.eq 3394 <_sk_load_4444_dst_aarch64+0xf0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e404 // movi d4, #0x0
- .long 0x540000c0 // b.eq 3254 <_sk_load_4444_dst_aarch64+0xd0> // b.none
+ .long 0x540000c0 // b.eq 3374 <_sk_load_4444_dst_aarch64+0xd0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffb21 // b.ne 31a8 <_sk_load_4444_dst_aarch64+0x24> // b.any
+ .long 0x54fffb21 // b.ne 32c8 <_sk_load_4444_dst_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d405124 // ld1 {v4.h}[2], [x9]
@@ -3688,10 +3765,10 @@ _sk_load_4444_dst_aarch64:
.long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h
.long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4
.long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4
- .long 0x17ffffce // b 31a8 <_sk_load_4444_dst_aarch64+0x24>
+ .long 0x17ffffce // b 32c8 <_sk_load_4444_dst_aarch64+0x24>
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d404104 // ld1 {v4.h}[0], [x8]
- .long 0x17ffffcb // b 31a8 <_sk_load_4444_dst_aarch64+0x24>
+ .long 0x17ffffcb // b 32c8 <_sk_load_4444_dst_aarch64+0x24>
HIDDEN _sk_gather_4444_aarch64
.globl _sk_gather_4444_aarch64
@@ -3774,24 +3851,24 @@ _sk_store_4444_aarch64:
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
.long 0x8b897d08 // add x8, x8, x9, asr #31
.long 0x0e612a10 // xtn v16.4h, v16.4s
- .long 0xb50000a4 // cbnz x4, 33b4 <_sk_store_4444_aarch64+0x70>
+ .long 0xb50000a4 // cbnz x4, 34d4 <_sk_store_4444_aarch64+0x70>
.long 0xfd000110 // str d16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 33e0 <_sk_store_4444_aarch64+0x9c> // b.none
+ .long 0x54000120 // b.eq 3500 <_sk_store_4444_aarch64+0x9c> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 33d8 <_sk_store_4444_aarch64+0x94> // b.none
+ .long 0x540000a0 // b.eq 34f8 <_sk_store_4444_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 33a8 <_sk_store_4444_aarch64+0x64> // b.any
+ .long 0x54fffee1 // b.ne 34c8 <_sk_store_4444_aarch64+0x64> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0d005130 // st1 {v16.h}[2], [x9]
.long 0x91000909 // add x9, x8, #0x2
.long 0x0d004930 // st1 {v16.h}[1], [x9]
.long 0x0d004110 // st1 {v16.h}[0], [x8]
- .long 0x17fffff1 // b 33a8 <_sk_store_4444_aarch64+0x64>
+ .long 0x17fffff1 // b 34c8 <_sk_store_4444_aarch64+0x64>
HIDDEN _sk_load_8888_aarch64
.globl _sk_load_8888_aarch64
@@ -3804,7 +3881,7 @@ _sk_load_8888_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 3460 <_sk_load_8888_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 3580 <_sk_load_8888_aarch64+0x78>
.long 0x3dc00100 // ldr q0, [x8]
.long 0x6f00e621 // movi v1.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -3829,22 +3906,22 @@ _sk_load_8888_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 349c <_sk_load_8888_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 35bc <_sk_load_8888_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e400 // movi v0.2d, #0x0
- .long 0x540000c0 // b.eq 348c <_sk_load_8888_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 35ac <_sk_load_8888_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 340c <_sk_load_8888_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 352c <_sk_load_8888_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x4d408120 // ld1 {v0.s}[2], [x9]
.long 0xfd400101 // ldr d1, [x8]
.long 0x6e014000 // ext v0.16b, v0.16b, v1.16b, #8
.long 0x6e004000 // ext v0.16b, v0.16b, v0.16b, #8
- .long 0x17ffffdd // b 340c <_sk_load_8888_aarch64+0x24>
+ .long 0x17ffffdd // b 352c <_sk_load_8888_aarch64+0x24>
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x0d408100 // ld1 {v0.s}[0], [x8]
- .long 0x17ffffda // b 340c <_sk_load_8888_aarch64+0x24>
+ .long 0x17ffffda // b 352c <_sk_load_8888_aarch64+0x24>
HIDDEN _sk_load_8888_dst_aarch64
.globl _sk_load_8888_dst_aarch64
@@ -3857,7 +3934,7 @@ _sk_load_8888_dst_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 3520 <_sk_load_8888_dst_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 3640 <_sk_load_8888_dst_aarch64+0x78>
.long 0x3dc00104 // ldr q4, [x8]
.long 0x6f00e625 // movi v5.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -3882,22 +3959,22 @@ _sk_load_8888_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 355c <_sk_load_8888_dst_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 367c <_sk_load_8888_dst_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e404 // movi v4.2d, #0x0
- .long 0x540000c0 // b.eq 354c <_sk_load_8888_dst_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 366c <_sk_load_8888_dst_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 34cc <_sk_load_8888_dst_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 35ec <_sk_load_8888_dst_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x4d408124 // ld1 {v4.s}[2], [x9]
.long 0xfd400105 // ldr d5, [x8]
.long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8
.long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8
- .long 0x17ffffdd // b 34cc <_sk_load_8888_dst_aarch64+0x24>
+ .long 0x17ffffdd // b 35ec <_sk_load_8888_dst_aarch64+0x24>
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x0d408104 // ld1 {v4.s}[0], [x8]
- .long 0x17ffffda // b 34cc <_sk_load_8888_dst_aarch64+0x24>
+ .long 0x17ffffda // b 35ec <_sk_load_8888_dst_aarch64+0x24>
HIDDEN _sk_gather_8888_aarch64
.globl _sk_gather_8888_aarch64
@@ -3969,24 +4046,24 @@ _sk_store_8888_aarch64:
.long 0x4eb21e31 // orr v17.16b, v17.16b, v18.16b
.long 0x8b897908 // add x8, x8, x9, asr #30
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
- .long 0xb50000a4 // cbnz x4, 3670 <_sk_store_8888_aarch64+0x70>
+ .long 0xb50000a4 // cbnz x4, 3790 <_sk_store_8888_aarch64+0x70>
.long 0x3d800110 // str q16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 369c <_sk_store_8888_aarch64+0x9c> // b.none
+ .long 0x54000120 // b.eq 37bc <_sk_store_8888_aarch64+0x9c> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 3694 <_sk_store_8888_aarch64+0x94> // b.none
+ .long 0x540000a0 // b.eq 37b4 <_sk_store_8888_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 3664 <_sk_store_8888_aarch64+0x64> // b.any
+ .long 0x54fffee1 // b.ne 3784 <_sk_store_8888_aarch64+0x64> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4d008130 // st1 {v16.s}[2], [x9]
.long 0xfd000110 // str d16, [x8]
- .long 0x17fffff3 // b 3664 <_sk_store_8888_aarch64+0x64>
+ .long 0x17fffff3 // b 3784 <_sk_store_8888_aarch64+0x64>
.long 0x0d008110 // st1 {v16.s}[0], [x8]
- .long 0x17fffff1 // b 3664 <_sk_store_8888_aarch64+0x64>
+ .long 0x17fffff1 // b 3784 <_sk_store_8888_aarch64+0x64>
HIDDEN _sk_load_bgra_aarch64
.globl _sk_load_bgra_aarch64
@@ -3999,7 +4076,7 @@ _sk_load_bgra_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 371c <_sk_load_bgra_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 383c <_sk_load_bgra_aarch64+0x78>
.long 0x3dc00100 // ldr q0, [x8]
.long 0x6f00e621 // movi v1.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -4024,22 +4101,22 @@ _sk_load_bgra_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 3758 <_sk_load_bgra_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 3878 <_sk_load_bgra_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e400 // movi v0.2d, #0x0
- .long 0x540000c0 // b.eq 3748 <_sk_load_bgra_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 3868 <_sk_load_bgra_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 36c8 <_sk_load_bgra_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 37e8 <_sk_load_bgra_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x4d408120 // ld1 {v0.s}[2], [x9]
.long 0xfd400101 // ldr d1, [x8]
.long 0x6e014000 // ext v0.16b, v0.16b, v1.16b, #8
.long 0x6e004000 // ext v0.16b, v0.16b, v0.16b, #8
- .long 0x17ffffdd // b 36c8 <_sk_load_bgra_aarch64+0x24>
+ .long 0x17ffffdd // b 37e8 <_sk_load_bgra_aarch64+0x24>
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x0d408100 // ld1 {v0.s}[0], [x8]
- .long 0x17ffffda // b 36c8 <_sk_load_bgra_aarch64+0x24>
+ .long 0x17ffffda // b 37e8 <_sk_load_bgra_aarch64+0x24>
HIDDEN _sk_load_bgra_dst_aarch64
.globl _sk_load_bgra_dst_aarch64
@@ -4052,7 +4129,7 @@ _sk_load_bgra_dst_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 37dc <_sk_load_bgra_dst_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 38fc <_sk_load_bgra_dst_aarch64+0x78>
.long 0x3dc00104 // ldr q4, [x8]
.long 0x6f00e625 // movi v5.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -4077,22 +4154,22 @@ _sk_load_bgra_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 3818 <_sk_load_bgra_dst_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 3938 <_sk_load_bgra_dst_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e404 // movi v4.2d, #0x0
- .long 0x540000c0 // b.eq 3808 <_sk_load_bgra_dst_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 3928 <_sk_load_bgra_dst_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 3788 <_sk_load_bgra_dst_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 38a8 <_sk_load_bgra_dst_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x4d408124 // ld1 {v4.s}[2], [x9]
.long 0xfd400105 // ldr d5, [x8]
.long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8
.long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8
- .long 0x17ffffdd // b 3788 <_sk_load_bgra_dst_aarch64+0x24>
+ .long 0x17ffffdd // b 38a8 <_sk_load_bgra_dst_aarch64+0x24>
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x0d408104 // ld1 {v4.s}[0], [x8]
- .long 0x17ffffda // b 3788 <_sk_load_bgra_dst_aarch64+0x24>
+ .long 0x17ffffda // b 38a8 <_sk_load_bgra_dst_aarch64+0x24>
HIDDEN _sk_gather_bgra_aarch64
.globl _sk_gather_bgra_aarch64
@@ -4164,24 +4241,24 @@ _sk_store_bgra_aarch64:
.long 0x4eb21e31 // orr v17.16b, v17.16b, v18.16b
.long 0x8b897908 // add x8, x8, x9, asr #30
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
- .long 0xb50000a4 // cbnz x4, 392c <_sk_store_bgra_aarch64+0x70>
+ .long 0xb50000a4 // cbnz x4, 3a4c <_sk_store_bgra_aarch64+0x70>
.long 0x3d800110 // str q16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 3958 <_sk_store_bgra_aarch64+0x9c> // b.none
+ .long 0x54000120 // b.eq 3a78 <_sk_store_bgra_aarch64+0x9c> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 3950 <_sk_store_bgra_aarch64+0x94> // b.none
+ .long 0x540000a0 // b.eq 3a70 <_sk_store_bgra_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 3920 <_sk_store_bgra_aarch64+0x64> // b.any
+ .long 0x54fffee1 // b.ne 3a40 <_sk_store_bgra_aarch64+0x64> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4d008130 // st1 {v16.s}[2], [x9]
.long 0xfd000110 // str d16, [x8]
- .long 0x17fffff3 // b 3920 <_sk_store_bgra_aarch64+0x64>
+ .long 0x17fffff3 // b 3a40 <_sk_store_bgra_aarch64+0x64>
.long 0x0d008110 // st1 {v16.s}[0], [x8]
- .long 0x17fffff1 // b 3920 <_sk_store_bgra_aarch64+0x64>
+ .long 0x17fffff1 // b 3a40 <_sk_store_bgra_aarch64+0x64>
HIDDEN _sk_load_f16_aarch64
.globl _sk_load_f16_aarch64
@@ -4194,7 +4271,7 @@ _sk_load_f16_aarch64:
.long 0x8b29cd08 // add x8, x8, w9, sxtw #3
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897508 // add x8, x8, x9, asr #29
- .long 0xb5000124 // cbnz x4, 39a0 <_sk_load_f16_aarch64+0x40>
+ .long 0xb5000124 // cbnz x4, 3ac0 <_sk_load_f16_aarch64+0x40>
.long 0x0c400510 // ld4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x0e217a00 // fcvtl v0.4s, v16.4h
@@ -4205,14 +4282,14 @@ _sk_load_f16_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606110 // ld4 {v16.h-v19.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffee0 // b.eq 3984 <_sk_load_f16_aarch64+0x24> // b.none
+ .long 0x54fffee0 // b.eq 3aa4 <_sk_load_f16_aarch64+0x24> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0x0d606930 // ld4 {v16.h-v19.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffe63 // b.cc 3984 <_sk_load_f16_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffe63 // b.cc 3aa4 <_sk_load_f16_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d607110 // ld4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff0 // b 3984 <_sk_load_f16_aarch64+0x24>
+ .long 0x17fffff0 // b 3aa4 <_sk_load_f16_aarch64+0x24>
HIDDEN _sk_load_f16_dst_aarch64
.globl _sk_load_f16_dst_aarch64
@@ -4225,7 +4302,7 @@ _sk_load_f16_dst_aarch64:
.long 0x8b29cd08 // add x8, x8, w9, sxtw #3
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897508 // add x8, x8, x9, asr #29
- .long 0xb5000124 // cbnz x4, 3a08 <_sk_load_f16_dst_aarch64+0x40>
+ .long 0xb5000124 // cbnz x4, 3b28 <_sk_load_f16_dst_aarch64+0x40>
.long 0x0c400510 // ld4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x0e217a04 // fcvtl v4.4s, v16.4h
@@ -4236,14 +4313,14 @@ _sk_load_f16_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606110 // ld4 {v16.h-v19.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffee0 // b.eq 39ec <_sk_load_f16_dst_aarch64+0x24> // b.none
+ .long 0x54fffee0 // b.eq 3b0c <_sk_load_f16_dst_aarch64+0x24> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0x0d606930 // ld4 {v16.h-v19.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffe63 // b.cc 39ec <_sk_load_f16_dst_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffe63 // b.cc 3b0c <_sk_load_f16_dst_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d607110 // ld4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff0 // b 39ec <_sk_load_f16_dst_aarch64+0x24>
+ .long 0x17fffff0 // b 3b0c <_sk_load_f16_dst_aarch64+0x24>
HIDDEN _sk_gather_f16_aarch64
.globl _sk_gather_f16_aarch64
@@ -4301,21 +4378,21 @@ _sk_store_f16_aarch64:
.long 0x8b29cd08 // add x8, x8, w9, sxtw #3
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897508 // add x8, x8, x9, asr #29
- .long 0xb50000a4 // cbnz x4, 3b00 <_sk_store_f16_aarch64+0x40>
+ .long 0xb50000a4 // cbnz x4, 3c20 <_sk_store_f16_aarch64+0x40>
.long 0x0c000510 // st4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d206110 // st4 {v16.h-v19.h}[0], [x8]
- .long 0x54ffff60 // b.eq 3af4 <_sk_store_f16_aarch64+0x34> // b.none
+ .long 0x54ffff60 // b.eq 3c14 <_sk_store_f16_aarch64+0x34> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d206930 // st4 {v16.h-v19.h}[1], [x9]
- .long 0x54fffee3 // b.cc 3af4 <_sk_store_f16_aarch64+0x34> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3c14 <_sk_store_f16_aarch64+0x34> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d207110 // st4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff4 // b 3af4 <_sk_store_f16_aarch64+0x34>
+ .long 0x17fffff4 // b 3c14 <_sk_store_f16_aarch64+0x34>
HIDDEN _sk_load_u16_be_aarch64
.globl _sk_load_u16_be_aarch64
@@ -4328,7 +4405,7 @@ _sk_load_u16_be_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0x8b2ac508 // add x8, x8, w10, sxtw #1
- .long 0xb5000404 // cbnz x4, 3bc4 <_sk_load_u16_be_aarch64+0x9c>
+ .long 0xb5000404 // cbnz x4, 3ce4 <_sk_load_u16_be_aarch64+0x9c>
.long 0x0c400500 // ld4 {v0.4h-v3.4h}, [x8]
.long 0x0f185410 // shl v16.4h, v0.4h, #8
.long 0x2f180411 // ushr v17.4h, v0.4h, #8
@@ -4362,14 +4439,14 @@ _sk_load_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606100 // ld4 {v0.h-v3.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffc00 // b.eq 3b4c <_sk_load_u16_be_aarch64+0x24> // b.none
+ .long 0x54fffc00 // b.eq 3c6c <_sk_load_u16_be_aarch64+0x24> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0x0d606920 // ld4 {v0.h-v3.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffb83 // b.cc 3b4c <_sk_load_u16_be_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffb83 // b.cc 3c6c <_sk_load_u16_be_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d607100 // ld4 {v0.h-v3.h}[2], [x8]
- .long 0x17ffffd9 // b 3b4c <_sk_load_u16_be_aarch64+0x24>
+ .long 0x17ffffd9 // b 3c6c <_sk_load_u16_be_aarch64+0x24>
HIDDEN _sk_load_rgb_u16_be_aarch64
.globl _sk_load_rgb_u16_be_aarch64
@@ -4383,7 +4460,7 @@ _sk_load_rgb_u16_be_aarch64:
.long 0x0b020449 // add w9, w2, w2, lsl #1
.long 0xd3607d29 // lsl x9, x9, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb5000384 // cbnz x4, 3c7c <_sk_load_rgb_u16_be_aarch64+0x90>
+ .long 0xb5000384 // cbnz x4, 3d9c <_sk_load_rgb_u16_be_aarch64+0x90>
.long 0x0c404500 // ld3 {v0.4h-v2.4h}, [x8]
.long 0x0f185403 // shl v3.4h, v0.4h, #8
.long 0x2f180410 // ushr v16.4h, v0.4h, #8
@@ -4413,14 +4490,14 @@ _sk_load_rgb_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d406100 // ld3 {v0.h-v2.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffc80 // b.eq 3c14 <_sk_load_rgb_u16_be_aarch64+0x28> // b.none
+ .long 0x54fffc80 // b.eq 3d34 <_sk_load_rgb_u16_be_aarch64+0x28> // b.none
.long 0x91001909 // add x9, x8, #0x6
.long 0x0d406920 // ld3 {v0.h-v2.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffc03 // b.cc 3c14 <_sk_load_rgb_u16_be_aarch64+0x28> // b.lo, b.ul, b.last
+ .long 0x54fffc03 // b.cc 3d34 <_sk_load_rgb_u16_be_aarch64+0x28> // b.lo, b.ul, b.last
.long 0x91003108 // add x8, x8, #0xc
.long 0x0d407100 // ld3 {v0.h-v2.h}[2], [x8]
- .long 0x17ffffdd // b 3c14 <_sk_load_rgb_u16_be_aarch64+0x28>
+ .long 0x17ffffdd // b 3d34 <_sk_load_rgb_u16_be_aarch64+0x28>
HIDDEN _sk_store_u16_be_aarch64
.globl _sk_store_u16_be_aarch64
@@ -4460,21 +4537,21 @@ _sk_store_u16_be_aarch64:
.long 0x8b28c548 // add x8, x10, w8, sxtw #1
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0x0eb41eb3 // orr v19.8b, v21.8b, v20.8b
- .long 0xb50000a4 // cbnz x4, 3d40 <_sk_store_u16_be_aarch64+0x9c>
+ .long 0xb50000a4 // cbnz x4, 3e60 <_sk_store_u16_be_aarch64+0x9c>
.long 0x0c000510 // st4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d206110 // st4 {v16.h-v19.h}[0], [x8]
- .long 0x54ffff60 // b.eq 3d34 <_sk_store_u16_be_aarch64+0x90> // b.none
+ .long 0x54ffff60 // b.eq 3e54 <_sk_store_u16_be_aarch64+0x90> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d206930 // st4 {v16.h-v19.h}[1], [x9]
- .long 0x54fffee3 // b.cc 3d34 <_sk_store_u16_be_aarch64+0x90> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3e54 <_sk_store_u16_be_aarch64+0x90> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d207110 // st4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff4 // b 3d34 <_sk_store_u16_be_aarch64+0x90>
+ .long 0x17fffff4 // b 3e54 <_sk_store_u16_be_aarch64+0x90>
HIDDEN _sk_load_f32_aarch64
.globl _sk_load_f32_aarch64
@@ -4487,21 +4564,21 @@ _sk_load_f32_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0x8b2ac908 // add x8, x8, w10, sxtw #2
- .long 0xb50000a4 // cbnz x4, 3d98 <_sk_load_f32_aarch64+0x30>
+ .long 0xb50000a4 // cbnz x4, 3eb8 <_sk_load_f32_aarch64+0x30>
.long 0x4c400900 // ld4 {v0.4s-v3.4s}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x0d60a100 // ld4 {v0.s-v3.s}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54ffff60 // b.eq 3d8c <_sk_load_f32_aarch64+0x24> // b.none
+ .long 0x54ffff60 // b.eq 3eac <_sk_load_f32_aarch64+0x24> // b.none
.long 0x91004109 // add x9, x8, #0x10
.long 0x0d60b120 // ld4 {v0.s-v3.s}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffee3 // b.cc 3d8c <_sk_load_f32_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3eac <_sk_load_f32_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91008108 // add x8, x8, #0x20
.long 0x4d60a100 // ld4 {v0.s-v3.s}[2], [x8]
- .long 0x17fffff4 // b 3d8c <_sk_load_f32_aarch64+0x24>
+ .long 0x17fffff4 // b 3eac <_sk_load_f32_aarch64+0x24>
HIDDEN _sk_load_f32_dst_aarch64
.globl _sk_load_f32_dst_aarch64
@@ -4514,21 +4591,21 @@ _sk_load_f32_dst_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0x8b2ac908 // add x8, x8, w10, sxtw #2
- .long 0xb50000a4 // cbnz x4, 3df0 <_sk_load_f32_dst_aarch64+0x30>
+ .long 0xb50000a4 // cbnz x4, 3f10 <_sk_load_f32_dst_aarch64+0x30>
.long 0x4c400904 // ld4 {v4.4s-v7.4s}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x0d60a104 // ld4 {v4.s-v7.s}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54ffff60 // b.eq 3de4 <_sk_load_f32_dst_aarch64+0x24> // b.none
+ .long 0x54ffff60 // b.eq 3f04 <_sk_load_f32_dst_aarch64+0x24> // b.none
.long 0x91004109 // add x9, x8, #0x10
.long 0x0d60b124 // ld4 {v4.s-v7.s}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffee3 // b.cc 3de4 <_sk_load_f32_dst_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3f04 <_sk_load_f32_dst_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91008108 // add x8, x8, #0x20
.long 0x4d60a104 // ld4 {v4.s-v7.s}[2], [x8]
- .long 0x17fffff4 // b 3de4 <_sk_load_f32_dst_aarch64+0x24>
+ .long 0x17fffff4 // b 3f04 <_sk_load_f32_dst_aarch64+0x24>
HIDDEN _sk_store_f32_aarch64
.globl _sk_store_f32_aarch64
@@ -4541,21 +4618,21 @@ _sk_store_f32_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0x8b2ac908 // add x8, x8, w10, sxtw #2
- .long 0xb50000a4 // cbnz x4, 3e48 <_sk_store_f32_aarch64+0x30>
+ .long 0xb50000a4 // cbnz x4, 3f68 <_sk_store_f32_aarch64+0x30>
.long 0x4c000900 // st4 {v0.4s-v3.4s}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d20a100 // st4 {v0.s-v3.s}[0], [x8]
- .long 0x54ffff60 // b.eq 3e3c <_sk_store_f32_aarch64+0x24> // b.none
+ .long 0x54ffff60 // b.eq 3f5c <_sk_store_f32_aarch64+0x24> // b.none
.long 0x91004109 // add x9, x8, #0x10
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d20b120 // st4 {v0.s-v3.s}[1], [x9]
- .long 0x54fffee3 // b.cc 3e3c <_sk_store_f32_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3f5c <_sk_store_f32_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91008108 // add x8, x8, #0x20
.long 0x4d20a100 // st4 {v0.s-v3.s}[2], [x8]
- .long 0x17fffff4 // b 3e3c <_sk_store_f32_aarch64+0x24>
+ .long 0x17fffff4 // b 3f5c <_sk_store_f32_aarch64+0x24>
HIDDEN _sk_clamp_x_aarch64
.globl _sk_clamp_x_aarch64
@@ -5048,7 +5125,7 @@ _sk_gradient_aarch64:
.long 0x6f00e411 // movi v17.2d, #0x0
.long 0xf9400109 // ldr x9, [x8]
.long 0xf100093f // cmp x9, #0x2
- .long 0x540001c3 // b.cc 44c8 <_sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last
+ .long 0x540001c3 // b.cc 45e8 <_sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last
.long 0xf940250a // ldr x10, [x8, #72]
.long 0xd1000529 // sub x9, x9, #0x1
.long 0x6f00e401 // movi v1.2d, #0x0
@@ -5059,7 +5136,7 @@ _sk_gradient_aarch64:
.long 0x6e23e403 // fcmge v3.4s, v0.4s, v3.4s
.long 0x4e221c63 // and v3.16b, v3.16b, v2.16b
.long 0x4ea18461 // add v1.4s, v3.4s, v1.4s
- .long 0xb5ffff69 // cbnz x9, 44a8 <_sk_gradient_aarch64+0x38>
+ .long 0xb5ffff69 // cbnz x9, 45c8 <_sk_gradient_aarch64+0x38>
.long 0x6f20a431 // uxtl2 v17.2d, v1.4s
.long 0x2f20a421 // uxtl v1.2d, v1.2s
.long 0xa940b10a // ldp x10, x12, [x8, #8]
@@ -7865,19 +7942,24 @@ HIDDEN _sk_plus__vfp4
.globl _sk_plus__vfp4
FUNCTION(_sk_plus__vfp4)
_sk_plus__vfp4:
- .long 0xe2802010 // add r2, r0, #16
- .long 0xf4620aef // vld1.64 {d16-d17}, [r2 :128]
.long 0xe2802020 // add r2, r0, #32
- .long 0xf2000dc0 // vadd.f32 q0, q8, q0
+ .long 0xf2c76f50 // vmov.f32 q11, #1
+ .long 0xf4620aef // vld1.64 {d16-d17}, [r2 :128]
+ .long 0xe2802010 // add r2, r0, #16
+ .long 0xf2400dc2 // vadd.f32 q8, q8, q1
.long 0xf4622aef // vld1.64 {d18-d19}, [r2 :128]
.long 0xe2802030 // add r2, r0, #48
- .long 0xf2022dc2 // vadd.f32 q1, q9, q1
- .long 0xf4620aef // vld1.64 {d16-d17}, [r2 :128]
+ .long 0xf2422dc0 // vadd.f32 q9, q9, q0
+ .long 0xf4624aef // vld1.64 {d20-d21}, [r2 :128]
.long 0xe2802040 // add r2, r0, #64
- .long 0xf2004dc4 // vadd.f32 q2, q8, q2
- .long 0xf4622aef // vld1.64 {d18-d19}, [r2 :128]
- .long 0xf2026dc6 // vadd.f32 q3, q9, q3
+ .long 0xf2444dc4 // vadd.f32 q10, q10, q2
+ .long 0xf4628aef // vld1.64 {d24-d25}, [r2 :128]
+ .long 0xf2488dc6 // vadd.f32 q12, q12, q3
.long 0xe4912004 // ldr r2, [r1], #4
+ .long 0xf2220fe6 // vmin.f32 q0, q9, q11
+ .long 0xf2202fe6 // vmin.f32 q1, q8, q11
+ .long 0xf2244fe6 // vmin.f32 q2, q10, q11
+ .long 0xf2286fe6 // vmin.f32 q3, q12, q11
.long 0xe12fff12 // bx r2
HIDDEN _sk_screen_vfp4
@@ -8506,7 +8588,6 @@ _sk_softlight_vfp4:
.long 0xecbd8b10 // vpop {d8-d15}
.long 0xe8bd0030 // pop {r4, r5}
.long 0xe12fff12 // bx r2
- .long 0xe320f000 // nop {0}
HIDDEN _sk_hue_vfp4
.globl _sk_hue_vfp4
@@ -9280,7 +9361,7 @@ _sk_srcover_rgba_8888_vfp4:
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe2804020 // add r4, r0, #32
.long 0xe0822106 // add r2, r2, r6, lsl #2
- .long 0x1a000032 // bne 1b88 <sk_srcover_rgba_8888_vfp4+0x110>
+ .long 0x1a000032 // bne 1b98 <sk_srcover_rgba_8888_vfp4+0x110>
.long 0xf4620a8f // vld1.32 {d16-d17}, [r2]
.long 0xf3c7405f // vmov.i32 q10, #255
.long 0xe28f6f51 // add r6, pc, #324
@@ -9325,7 +9406,7 @@ _sk_srcover_rgba_8888_vfp4:
.long 0xf2f0c57c // vshl.s32 q14, q14, #16
.long 0xf26e01f4 // vorr q8, q15, q10
.long 0xf26001fc // vorr q8, q8, q14
- .long 0x1a000015 // bne 1bc8 <sk_srcover_rgba_8888_vfp4+0x150>
+ .long 0x1a000015 // bne 1bd8 <sk_srcover_rgba_8888_vfp4+0x150>
.long 0xf4420a8f // vst1.32 {d16-d17}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -9334,12 +9415,12 @@ _sk_srcover_rgba_8888_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe2036003 // and r6, r3, #3
.long 0xe3560001 // cmp r6, #1
- .long 0x0a000017 // beq 1bf4 <sk_srcover_rgba_8888_vfp4+0x17c>
+ .long 0x0a000017 // beq 1c04 <sk_srcover_rgba_8888_vfp4+0x17c>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3560002 // cmp r6, #2
- .long 0x0a000005 // beq 1bb8 <sk_srcover_rgba_8888_vfp4+0x140>
+ .long 0x0a000005 // beq 1bc8 <sk_srcover_rgba_8888_vfp4+0x140>
.long 0xe3560003 // cmp r6, #3
- .long 0x1affffc5 // bne 1ac0 <sk_srcover_rgba_8888_vfp4+0x48>
+ .long 0x1affffc5 // bne 1ad0 <sk_srcover_rgba_8888_vfp4+0x48>
.long 0xe3a06000 // mov r6, #0
.long 0xeea06b90 // vdup.32 q8, r6
.long 0xe2826008 // add r6, r2, #8
@@ -9347,24 +9428,24 @@ _sk_srcover_rgba_8888_vfp4:
.long 0xedd22b00 // vldr d18, [r2]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffbd // b 1ac0 <sk_srcover_rgba_8888_vfp4+0x48>
+ .long 0xeaffffbd // b 1ad0 <sk_srcover_rgba_8888_vfp4+0x48>
.long 0xe2033003 // and r3, r3, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000b // beq 1c04 <sk_srcover_rgba_8888_vfp4+0x18c>
+ .long 0x0a00000b // beq 1c14 <sk_srcover_rgba_8888_vfp4+0x18c>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 1bec <sk_srcover_rgba_8888_vfp4+0x174>
+ .long 0x0a000003 // beq 1bfc <sk_srcover_rgba_8888_vfp4+0x174>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe3 // bne 1b74 <sk_srcover_rgba_8888_vfp4+0xfc>
+ .long 0x1affffe3 // bne 1b84 <sk_srcover_rgba_8888_vfp4+0xfc>
.long 0xe2823008 // add r3, r2, #8
.long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32]
.long 0xedc20b00 // vstr d16, [r2]
- .long 0xeaffffdf // b 1b74 <sk_srcover_rgba_8888_vfp4+0xfc>
+ .long 0xeaffffdf // b 1b84 <sk_srcover_rgba_8888_vfp4+0xfc>
.long 0xe3a06000 // mov r6, #0
.long 0xeea06b90 // vdup.32 q8, r6
.long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffae // b 1ac0 <sk_srcover_rgba_8888_vfp4+0x48>
+ .long 0xeaffffae // b 1ad0 <sk_srcover_rgba_8888_vfp4+0x48>
.long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffd9 // b 1b74 <sk_srcover_rgba_8888_vfp4+0xfc>
+ .long 0xeaffffd9 // b 1b84 <sk_srcover_rgba_8888_vfp4+0xfc>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -9785,14 +9866,14 @@ HIDDEN _sk_rgb_to_hsl_vfp4
FUNCTION(_sk_rgb_to_hsl_vfp4)
_sk_rgb_to_hsl_vfp4:
.long 0xed2d8b0c // vpush {d8-d13}
- .long 0xf2600f42 // vmin.f32 q8, q0, q1
+ .long 0xf2620f44 // vmin.f32 q8, q1, q2
.long 0xe28f20c8 // add r2, pc, #200
.long 0xf462aacf // vld1.64 {d26-d27}, [r2]
.long 0xe28f20d0 // add r2, pc, #208
- .long 0xf2402f42 // vmax.f32 q9, q0, q1
+ .long 0xf2422f44 // vmax.f32 q9, q1, q2
.long 0xeeb7ca00 // vmov.f32 s24, #112
- .long 0xf2600fc4 // vmin.f32 q8, q8, q2
- .long 0xf2422fc4 // vmax.f32 q9, q9, q2
+ .long 0xf2600f60 // vmin.f32 q8, q0, q8
+ .long 0xf2402f62 // vmax.f32 q9, q0, q9
.long 0xf2624d44 // vsub.f32 q10, q1, q2
.long 0xf3648e42 // vcgt.f32 q12, q2, q1
.long 0xf2228de0 // vsub.f32 q4, q9, q8
@@ -10009,7 +10090,7 @@ _sk_scale_u8_vfp4:
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
- .long 0x1a000013 // bne 24f4 <sk_scale_u8_vfp4+0x7c>
+ .long 0x1a000013 // bne 2504 <sk_scale_u8_vfp4+0x7c>
.long 0xe5922000 // ldr r2, [r2]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -10032,12 +10113,12 @@ _sk_scale_u8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000012 // beq 254c <sk_scale_u8_vfp4+0xd4>
+ .long 0x0a000012 // beq 255c <sk_scale_u8_vfp4+0xd4>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 2524 <sk_scale_u8_vfp4+0xac>
+ .long 0x0a000005 // beq 2534 <sk_scale_u8_vfp4+0xac>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe8 // bne 24b8 <sk_scale_u8_vfp4+0x40>
+ .long 0x1affffe8 // bne 24c8 <sk_scale_u8_vfp4+0x40>
.long 0xe3a04000 // mov r4, #0
.long 0xe5d23002 // ldrb r3, [r2, #2]
.long 0xee804bb0 // vdup.16 d16, r4
@@ -10051,17 +10132,110 @@ _sk_scale_u8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffda // b 24b8 <sk_scale_u8_vfp4+0x40>
+ .long 0xeaffffda // b 24c8 <sk_scale_u8_vfp4+0x40>
.long 0xe3a03000 // mov r3, #0
.long 0xe5d22000 // ldrb r2, [r2]
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd5 // b 24b8 <sk_scale_u8_vfp4+0x40>
+ .long 0xeaffffd5 // b 24c8 <sk_scale_u8_vfp4+0x40>
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
+HIDDEN _sk_scale_565_vfp4
+.globl _sk_scale_565_vfp4
+FUNCTION(_sk_scale_565_vfp4)
+_sk_scale_565_vfp4:
+ .long 0xe92d4010 // push {r4, lr}
+ .long 0xe24dd004 // sub sp, sp, #4
+ .long 0xe5913000 // ldr r3, [r1]
+ .long 0xe590c000 // ldr ip, [r0]
+ .long 0xe9904004 // ldmib r0, {r2, lr}
+ .long 0xe5934000 // ldr r4, [r3]
+ .long 0xe35e0000 // cmp lr, #0
+ .long 0xe5933004 // ldr r3, [r3, #4]
+ .long 0xe0020293 // mul r2, r3, r2
+ .long 0xe0842082 // add r2, r4, r2, lsl #1
+ .long 0xe082308c // add r3, r2, ip, lsl #1
+ .long 0xe280c040 // add ip, r0, #64
+ .long 0x1a000024 // bne 2648 <sk_scale_565_vfp4+0xc8>
+ .long 0xf463074f // vld1.16 {d16}, [r3]
+ .long 0xf3d00a30 // vmovl.u16 q8, d16
+ .long 0xe3a02e7e // mov r2, #2016
+ .long 0xf2c1205f // vmov.i32 q9, #31
+ .long 0xeea42b90 // vdup.32 q10, r2
+ .long 0xe28f20e0 // add r2, pc, #224
+ .long 0xf3c76258 // vmov.i32 q11, #63488
+ .long 0xf24021f2 // vand q9, q8, q9
+ .long 0xf4628acf // vld1.64 {d24-d25}, [r2]
+ .long 0xf24041f4 // vand q10, q8, q10
+ .long 0xe28f20dc // add r2, pc, #220
+ .long 0xf3fb2662 // vcvt.f32.s32 q9, q9
+ .long 0xf462aacf // vld1.64 {d26-d27}, [r2]
+ .long 0xe28f20e0 // add r2, pc, #224
+ .long 0xf3fb4664 // vcvt.f32.s32 q10, q10
+ .long 0xf24001f6 // vand q8, q8, q11
+ .long 0xf4626acf // vld1.64 {d22-d23}, [r2]
+ .long 0xf3422df8 // vmul.f32 q9, q9, q12
+ .long 0xf3fb0660 // vcvt.f32.s32 q8, q8
+ .long 0xe5912004 // ldr r2, [r1, #4]
+ .long 0xe2811008 // add r1, r1, #8
+ .long 0xf3444dfa // vmul.f32 q10, q10, q13
+ .long 0xf3024dd4 // vmul.f32 q2, q9, q2
+ .long 0xf3400df6 // vmul.f32 q8, q8, q11
+ .long 0xf46c6aef // vld1.64 {d22-d23}, [ip :128]
+ .long 0xf3666ec6 // vcgt.f32 q11, q11, q3
+ .long 0xf2648fe2 // vmin.f32 q12, q10, q9
+ .long 0xf244afe2 // vmax.f32 q13, q10, q9
+ .long 0xf3000dd0 // vmul.f32 q0, q8, q0
+ .long 0xf2608fe8 // vmin.f32 q12, q8, q12
+ .long 0xf240afea // vmax.f32 q13, q8, q13
+ .long 0xf3042dd2 // vmul.f32 q1, q10, q1
+ .long 0xf35861fa // vbsl q11, q12, q13
+ .long 0xf3066dd6 // vmul.f32 q3, q11, q3
+ .long 0xe28dd004 // add sp, sp, #4
+ .long 0xe8bd4010 // pop {r4, lr}
+ .long 0xe12fff12 // bx r2
+ .long 0xe20e2003 // and r2, lr, #3
+ .long 0xe3520001 // cmp r2, #1
+ .long 0x0a000011 // beq 269c <sk_scale_565_vfp4+0x11c>
+ .long 0xf2c00010 // vmov.i32 d16, #0
+ .long 0xe3520002 // cmp r2, #2
+ .long 0x0a000005 // beq 2678 <sk_scale_565_vfp4+0xf8>
+ .long 0xe3520003 // cmp r2, #3
+ .long 0x1affffd3 // bne 25b8 <sk_scale_565_vfp4+0x38>
+ .long 0xe3a02000 // mov r2, #0
+ .long 0xee802bb0 // vdup.16 d16, r2
+ .long 0xe2832004 // add r2, r3, #4
+ .long 0xf4e2049f // vld1.16 {d16[2]}, [r2 :16]
+ .long 0xe5932000 // ldr r2, [r3]
+ .long 0xe58d2000 // str r2, [sp]
+ .long 0xe1a0200d // mov r2, sp
+ .long 0xf4e2183f // vld1.32 {d17[0]}, [r2 :32]
+ .long 0xf3d02a31 // vmovl.u16 q9, d17
+ .long 0xf3f62121 // vuzp.16 d18, d17
+ .long 0xf2f004a2 // vext.8 d16, d16, d18, #4
+ .long 0xf2f004a0 // vext.8 d16, d16, d16, #4
+ .long 0xeaffffc6 // b 25b8 <sk_scale_565_vfp4+0x38>
+ .long 0xe3a02000 // mov r2, #0
+ .long 0xee802bb0 // vdup.16 d16, r2
+ .long 0xf4e3041f // vld1.16 {d16[0]}, [r3 :16]
+ .long 0xeaffffc2 // b 25b8 <sk_scale_565_vfp4+0x38>
+ .long 0xe320f000 // nop {0}
+ .long 0x3d042108 // .word 0x3d042108
+ .long 0x3d042108 // .word 0x3d042108
+ .long 0x3d042108 // .word 0x3d042108
+ .long 0x3d042108 // .word 0x3d042108
+ .long 0x3a020821 // .word 0x3a020821
+ .long 0x3a020821 // .word 0x3a020821
+ .long 0x3a020821 // .word 0x3a020821
+ .long 0x3a020821 // .word 0x3a020821
+ .long 0x37842108 // .word 0x37842108
+ .long 0x37842108 // .word 0x37842108
+ .long 0x37842108 // .word 0x37842108
+ .long 0x37842108 // .word 0x37842108
+
HIDDEN _sk_lerp_1_float_vfp4
.globl _sk_lerp_1_float_vfp4
FUNCTION(_sk_lerp_1_float_vfp4)
@@ -10108,7 +10282,7 @@ _sk_lerp_u8_vfp4:
.long 0xe0824003 // add r4, r2, r3
.long 0xe2803020 // add r3, r0, #32
.long 0xe2802010 // add r2, r0, #16
- .long 0x1a00001f // bne 2688 <sk_lerp_u8_vfp4+0xb8>
+ .long 0x1a00001f // bne 27f8 <sk_lerp_u8_vfp4+0xb8>
.long 0xe5944000 // ldr r4, [r4]
.long 0xe58d4000 // str r4, [sp]
.long 0xe1a0400d // mov r4, sp
@@ -10143,12 +10317,12 @@ _sk_lerp_u8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000012 // beq 26e0 <sk_lerp_u8_vfp4+0x110>
+ .long 0x0a000012 // beq 2850 <sk_lerp_u8_vfp4+0x110>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 26b8 <sk_lerp_u8_vfp4+0xe8>
+ .long 0x0a000005 // beq 2828 <sk_lerp_u8_vfp4+0xe8>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffdc // bne 261c <sk_lerp_u8_vfp4+0x4c>
+ .long 0x1affffdc // bne 278c <sk_lerp_u8_vfp4+0x4c>
.long 0xe3a06000 // mov r6, #0
.long 0xe5d45002 // ldrb r5, [r4, #2]
.long 0xee806bb0 // vdup.16 d16, r6
@@ -10162,12 +10336,12 @@ _sk_lerp_u8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffce // b 261c <sk_lerp_u8_vfp4+0x4c>
+ .long 0xeaffffce // b 278c <sk_lerp_u8_vfp4+0x4c>
.long 0xe3a05000 // mov r5, #0
.long 0xe5d44000 // ldrb r4, [r4]
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xee004bb0 // vmov.16 d16[0], r4
- .long 0xeaffffc9 // b 261c <sk_lerp_u8_vfp4+0x4c>
+ .long 0xeaffffc9 // b 278c <sk_lerp_u8_vfp4+0x4c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -10181,73 +10355,74 @@ _sk_lerp_565_vfp4:
.long 0xe92d4070 // push {r4, r5, r6, lr}
.long 0xe24dd004 // sub sp, sp, #4
.long 0xe5912000 // ldr r2, [r1]
- .long 0xe280e020 // add lr, r0, #32
+ .long 0xe280e040 // add lr, r0, #64
.long 0xe8900058 // ldm r0, {r3, r4, r6}
- .long 0xe280c010 // add ip, r0, #16
+ .long 0xe280c020 // add ip, r0, #32
.long 0xe5925000 // ldr r5, [r2]
.long 0xe3560000 // cmp r6, #0
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0020492 // mul r2, r2, r4
.long 0xe0852082 // add r2, r5, r2, lsl #1
.long 0xe0824083 // add r4, r2, r3, lsl #1
- .long 0xe2803040 // add r3, r0, #64
.long 0xe2802030 // add r2, r0, #48
- .long 0x1a00002e // bne 2800 <sk_lerp_565_vfp4+0xf8>
+ .long 0xe2803010 // add r3, r0, #16
+ .long 0x1a00002f // bne 2974 <sk_lerp_565_vfp4+0xfc>
.long 0xf464074f // vld1.16 {d16}, [r4]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe3a04e7e // mov r4, #2016
.long 0xf2c1205f // vmov.i32 q9, #31
- .long 0xeea64b90 // vdup.32 q11, r4
- .long 0xf3c74258 // vmov.i32 q10, #63488
+ .long 0xeea44b90 // vdup.32 q10, r4
+ .long 0xe28f4f42 // add r4, pc, #264
+ .long 0xf3c76258 // vmov.i32 q11, #63488
.long 0xf24021f2 // vand q9, q8, q9
- .long 0xf24061f6 // vand q11, q8, q11
- .long 0xf24001f4 // vand q8, q8, q10
- .long 0xf3fb4666 // vcvt.f32.s32 q10, q11
- .long 0xf4636aef // vld1.64 {d22-d23}, [r3 :128]
- .long 0xe28f30f0 // add r3, pc, #240
+ .long 0xf4648acf // vld1.64 {d24-d25}, [r4]
+ .long 0xf24041f4 // vand q10, q8, q10
+ .long 0xe28f4f41 // add r4, pc, #260
.long 0xf3fb2662 // vcvt.f32.s32 q9, q9
- .long 0xf4638acf // vld1.64 {d24-d25}, [r3]
- .long 0xe28f30f4 // add r3, pc, #244
- .long 0xf463cacf // vld1.64 {d28-d29}, [r3]
- .long 0xf266ad66 // vsub.f32 q13, q3, q11
- .long 0xe28f30f8 // add r3, pc, #248
- .long 0xf344cdfc // vmul.f32 q14, q10, q14
+ .long 0xf464aacf // vld1.64 {d26-d27}, [r4]
+ .long 0xe28f4f42 // add r4, pc, #264
+ .long 0xf3fb4664 // vcvt.f32.s32 q10, q10
+ .long 0xf24001f6 // vand q8, q8, q11
.long 0xf3428df8 // vmul.f32 q12, q9, q12
- .long 0xf4632acf // vld1.64 {d18-d19}, [r3]
- .long 0xf26641f6 // vorr q10, q11, q11
- .long 0xf22661f6 // vorr q3, q11, q11
+ .long 0xf4642acf // vld1.64 {d18-d19}, [r4]
.long 0xf3fb0660 // vcvt.f32.s32 q8, q8
- .long 0xf24a4cf8 // vfma.f32 q10, q13, q12
- .long 0xf20a6cfc // vfma.f32 q3, q13, q14
- .long 0xf340edf2 // vmul.f32 q15, q8, q9
- .long 0xf46e2aef // vld1.64 {d18-d19}, [lr :128]
- .long 0xf4620aef // vld1.64 {d16-d17}, [r2 :128]
- .long 0xf2244d60 // vsub.f32 q2, q2, q8
+ .long 0xf344adfa // vmul.f32 q13, q10, q13
+ .long 0xf3406df2 // vmul.f32 q11, q8, q9
+ .long 0xf4630aef // vld1.64 {d16-d17}, [r3 :128]
+ .long 0xf260ed60 // vsub.f32 q15, q0, q8
+ .long 0xf4622aef // vld1.64 {d18-d19}, [r2 :128]
+ .long 0xf26a4fe8 // vmin.f32 q10, q13, q12
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
- .long 0xf24a6cfe // vfma.f32 q11, q13, q15
- .long 0xf262ad62 // vsub.f32 q13, q1, q9
- .long 0xf2062f64 // vmax.f32 q1, q3, q10
- .long 0xf46c4aef // vld1.64 {d20-d21}, [ip :128]
- .long 0xf2200d64 // vsub.f32 q0, q0, q10
- .long 0xf2440c78 // vfma.f32 q8, q2, q12
- .long 0xf24a2cfc // vfma.f32 q9, q13, q14
- .long 0xf2404c7e // vfma.f32 q10, q0, q15
- .long 0xf2066fc2 // vmax.f32 q3, q11, q1
- .long 0xf22041f0 // vorr q2, q8, q8
- .long 0xf22221f2 // vorr q1, q9, q9
- .long 0xf22401f4 // vorr q0, q10, q10
+ .long 0xf24acfe8 // vmax.f32 q14, q13, q12
+ .long 0xf24e0cf6 // vfma.f32 q8, q15, q11
+ .long 0xf2260fe4 // vmin.f32 q0, q11, q10
+ .long 0xf46e4aef // vld1.64 {d20-d21}, [lr :128]
+ .long 0xf266ed64 // vsub.f32 q15, q3, q10
+ .long 0xf3246ec6 // vcgt.f32 q3, q10, q3
+ .long 0xf246cfec // vmax.f32 q14, q11, q14
+ .long 0xf46c6aef // vld1.64 {d22-d23}, [ip :128]
+ .long 0xf2244d62 // vsub.f32 q2, q2, q9
+ .long 0xf310617c // vbsl q3, q0, q14
+ .long 0xf262cd66 // vsub.f32 q14, q1, q11
+ .long 0xf2442c78 // vfma.f32 q9, q2, q12
+ .long 0xf24e4cd6 // vfma.f32 q10, q15, q3
+ .long 0xf24c6cfa // vfma.f32 q11, q14, q13
+ .long 0xf22001f0 // vorr q0, q8, q8
+ .long 0xf22241f2 // vorr q2, q9, q9
+ .long 0xf22461f4 // vorr q3, q10, q10
+ .long 0xf22621f6 // vorr q1, q11, q11
.long 0xe28dd004 // add sp, sp, #4
.long 0xe8bd4070 // pop {r4, r5, r6, lr}
.long 0xe12fff12 // bx r2
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000011 // beq 2854 <sk_lerp_565_vfp4+0x14c>
+ .long 0x0a000011 // beq 29c8 <sk_lerp_565_vfp4+0x150>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 2830 <sk_lerp_565_vfp4+0x128>
+ .long 0x0a000005 // beq 29a4 <sk_lerp_565_vfp4+0x12c>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffc9 // bne 2748 <sk_lerp_565_vfp4+0x40>
+ .long 0x1affffc8 // bne 28b8 <sk_lerp_565_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xe2845004 // add r5, r4, #4
@@ -10260,12 +10435,11 @@ _sk_lerp_565_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffbc // b 2748 <sk_lerp_565_vfp4+0x40>
+ .long 0xeaffffbb // b 28b8 <sk_lerp_565_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16]
- .long 0xeaffffb8 // b 2748 <sk_lerp_565_vfp4+0x40>
- .long 0xe320f000 // nop {0}
+ .long 0xeaffffb7 // b 28b8 <sk_lerp_565_vfp4+0x40>
.long 0x3d042108 // .word 0x3d042108
.long 0x3d042108 // .word 0x3d042108
.long 0x3d042108 // .word 0x3d042108
@@ -10290,7 +10464,7 @@ _sk_load_tables_vfp4:
.long 0xe5964000 // ldr r4, [r6]
.long 0xe3530000 // cmp r3, #0
.long 0xe084e102 // add lr, r4, r2, lsl #2
- .long 0x1a000036 // bne 2994 <sk_load_tables_vfp4+0xfc>
+ .long 0x1a000036 // bne 2b04 <sk_load_tables_vfp4+0xfc>
.long 0xf46e0a8f // vld1.32 {d16-d17}, [lr]
.long 0xf3c7405f // vmov.i32 q10, #255
.long 0xe5967004 // ldr r7, [r6, #4]
@@ -10348,12 +10522,12 @@ _sk_load_tables_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe203c003 // and ip, r3, #3
.long 0xe35c0001 // cmp ip, #1
- .long 0x0a00000c // beq 29d4 <sk_load_tables_vfp4+0x13c>
+ .long 0x0a00000c // beq 2b44 <sk_load_tables_vfp4+0x13c>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe35c0002 // cmp ip, #2
- .long 0x0a000005 // beq 29c4 <sk_load_tables_vfp4+0x12c>
+ .long 0x0a000005 // beq 2b34 <sk_load_tables_vfp4+0x12c>
.long 0xe35c0003 // cmp ip, #3
- .long 0x1affffc1 // bne 28bc <sk_load_tables_vfp4+0x24>
+ .long 0x1affffc1 // bne 2a2c <sk_load_tables_vfp4+0x24>
.long 0xe3a02000 // mov r2, #0
.long 0xeea02b90 // vdup.32 q8, r2
.long 0xe28e2008 // add r2, lr, #8
@@ -10361,11 +10535,11 @@ _sk_load_tables_vfp4:
.long 0xedde2b00 // vldr d18, [lr]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffb9 // b 28bc <sk_load_tables_vfp4+0x24>
+ .long 0xeaffffb9 // b 2a2c <sk_load_tables_vfp4+0x24>
.long 0xe3a02000 // mov r2, #0
.long 0xeea02b90 // vdup.32 q8, r2
.long 0xf4ee083f // vld1.32 {d16[0]}, [lr :32]
- .long 0xeaffffb5 // b 28bc <sk_load_tables_vfp4+0x24>
+ .long 0xeaffffb5 // b 2a2c <sk_load_tables_vfp4+0x24>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -10383,7 +10557,7 @@ _sk_load_tables_u16_be_vfp4:
.long 0xe5982000 // ldr r2, [r8]
.long 0xe35e0000 // cmp lr, #0
.long 0xe082c183 // add ip, r2, r3, lsl #3
- .long 0x1a000039 // bne 2b00 <sk_load_tables_u16_be_vfp4+0x108>
+ .long 0x1a000039 // bne 2c70 <sk_load_tables_u16_be_vfp4+0x108>
.long 0xf46c004f // vld4.16 {d16-d19}, [ip]
.long 0xf3c72b3f // vbic.i16 d18, #65280
.long 0xe5986004 // ldr r6, [r8, #4]
@@ -10444,14 +10618,14 @@ _sk_load_tables_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4ec070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [ip]
.long 0xe35e0001 // cmp lr, #1
- .long 0x0affffc3 // beq 2a1c <sk_load_tables_u16_be_vfp4+0x24>
+ .long 0x0affffc3 // beq 2b8c <sk_load_tables_u16_be_vfp4+0x24>
.long 0xe28c2008 // add r2, ip, #8
.long 0xe35e0003 // cmp lr, #3
.long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3affffbf // bcc 2a1c <sk_load_tables_u16_be_vfp4+0x24>
+ .long 0x3affffbf // bcc 2b8c <sk_load_tables_u16_be_vfp4+0x24>
.long 0xe28c2010 // add r2, ip, #16
.long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeaffffbc // b 2a1c <sk_load_tables_u16_be_vfp4+0x24>
+ .long 0xeaffffbc // b 2b8c <sk_load_tables_u16_be_vfp4+0x24>
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
@@ -10469,7 +10643,7 @@ _sk_load_tables_rgb_u16_be_vfp4:
.long 0xe5982000 // ldr r2, [r8]
.long 0xe35e0000 // cmp lr, #0
.long 0xe082c083 // add ip, r2, r3, lsl #1
- .long 0x1a000033 // bne 2c2c <sk_load_tables_rgb_u16_be_vfp4+0xf4>
+ .long 0x1a000033 // bne 2d9c <sk_load_tables_rgb_u16_be_vfp4+0xf4>
.long 0xf46c044f // vld3.16 {d16-d18}, [ip]
.long 0xf3c72b3f // vbic.i16 d18, #65280
.long 0xe5987004 // ldr r7, [r8, #4]
@@ -10524,14 +10698,14 @@ _sk_load_tables_rgb_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4ec060f // vld3.16 {d16[0],d17[0],d18[0]}, [ip]
.long 0xe35e0001 // cmp lr, #1
- .long 0x0affffc9 // beq 2b60 <sk_load_tables_rgb_u16_be_vfp4+0x28>
+ .long 0x0affffc9 // beq 2cd0 <sk_load_tables_rgb_u16_be_vfp4+0x28>
.long 0xe28c2006 // add r2, ip, #6
.long 0xe35e0003 // cmp lr, #3
.long 0xf4e2064f // vld3.16 {d16[1],d17[1],d18[1]}, [r2]
- .long 0x3affffc5 // bcc 2b60 <sk_load_tables_rgb_u16_be_vfp4+0x28>
+ .long 0x3affffc5 // bcc 2cd0 <sk_load_tables_rgb_u16_be_vfp4+0x28>
.long 0xe28c200c // add r2, ip, #12
.long 0xf4e2068f // vld3.16 {d16[2],d17[2],d18[2]}, [r2]
- .long 0xeaffffc2 // b 2b60 <sk_load_tables_rgb_u16_be_vfp4+0x28>
+ .long 0xeaffffc2 // b 2cd0 <sk_load_tables_rgb_u16_be_vfp4+0x28>
.long 0xe320f000 // nop {0}
.long 0x3f800000 // .word 0x3f800000
.long 0x3f800000 // .word 0x3f800000
@@ -11584,7 +11758,7 @@ _sk_load_a8_vfp4:
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
- .long 0x1a000012 // bne 3c10 <sk_load_a8_vfp4+0x78>
+ .long 0x1a000012 // bne 3d80 <sk_load_a8_vfp4+0x78>
.long 0xe5922000 // ldr r2, [r2]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -11606,12 +11780,12 @@ _sk_load_a8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000012 // beq 3c68 <sk_load_a8_vfp4+0xd0>
+ .long 0x0a000012 // beq 3dd8 <sk_load_a8_vfp4+0xd0>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 3c40 <sk_load_a8_vfp4+0xa8>
+ .long 0x0a000005 // beq 3db0 <sk_load_a8_vfp4+0xa8>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe9 // bne 3bd8 <sk_load_a8_vfp4+0x40>
+ .long 0x1affffe9 // bne 3d48 <sk_load_a8_vfp4+0x40>
.long 0xe3a04000 // mov r4, #0
.long 0xe5d23002 // ldrb r3, [r2, #2]
.long 0xee804bb0 // vdup.16 d16, r4
@@ -11625,12 +11799,12 @@ _sk_load_a8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffdb // b 3bd8 <sk_load_a8_vfp4+0x40>
+ .long 0xeaffffdb // b 3d48 <sk_load_a8_vfp4+0x40>
.long 0xe3a03000 // mov r3, #0
.long 0xe5d22000 // ldrb r2, [r2]
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd6 // b 3bd8 <sk_load_a8_vfp4+0x40>
+ .long 0xeaffffd6 // b 3d48 <sk_load_a8_vfp4+0x40>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -11659,7 +11833,7 @@ _sk_load_a8_dst_vfp4:
.long 0xf4430aef // vst1.64 {d16-d17}, [r3 :128]
.long 0xe082300c // add r3, r2, ip
.long 0xe280c040 // add ip, r0, #64
- .long 0x1a000011 // bne 3d24 <sk_load_a8_dst_vfp4+0x94>
+ .long 0x1a000011 // bne 3e94 <sk_load_a8_dst_vfp4+0x94>
.long 0xe5932000 // ldr r2, [r3]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -11680,12 +11854,12 @@ _sk_load_a8_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe20e2003 // and r2, lr, #3
.long 0xe3520001 // cmp r2, #1
- .long 0x0a000012 // beq 3d7c <sk_load_a8_dst_vfp4+0xec>
+ .long 0x0a000012 // beq 3eec <sk_load_a8_dst_vfp4+0xec>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3520002 // cmp r2, #2
- .long 0x0a000005 // beq 3d54 <sk_load_a8_dst_vfp4+0xc4>
+ .long 0x0a000005 // beq 3ec4 <sk_load_a8_dst_vfp4+0xc4>
.long 0xe3520003 // cmp r2, #3
- .long 0x1affffea // bne 3cf0 <sk_load_a8_dst_vfp4+0x60>
+ .long 0x1affffea // bne 3e60 <sk_load_a8_dst_vfp4+0x60>
.long 0xe3a05000 // mov r5, #0
.long 0xe5d32002 // ldrb r2, [r3, #2]
.long 0xee805bb0 // vdup.16 d16, r5
@@ -11699,12 +11873,12 @@ _sk_load_a8_dst_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffdc // b 3cf0 <sk_load_a8_dst_vfp4+0x60>
+ .long 0xeaffffdc // b 3e60 <sk_load_a8_dst_vfp4+0x60>
.long 0xe5d32000 // ldrb r2, [r3]
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd7 // b 3cf0 <sk_load_a8_dst_vfp4+0x60>
+ .long 0xeaffffd7 // b 3e60 <sk_load_a8_dst_vfp4+0x60>
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -11770,7 +11944,7 @@ _sk_store_a8_vfp4:
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000005 // bne 3e88 <sk_store_a8_vfp4+0x58>
+ .long 0x1a000005 // bne 3ff8 <sk_store_a8_vfp4+0x58>
.long 0xf3f20121 // vuzp.8 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
@@ -11779,21 +11953,21 @@ _sk_store_a8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000a // beq 3ec0 <sk_store_a8_vfp4+0x90>
+ .long 0x0a00000a // beq 4030 <sk_store_a8_vfp4+0x90>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 3eac <sk_store_a8_vfp4+0x7c>
+ .long 0x0a000003 // beq 401c <sk_store_a8_vfp4+0x7c>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 3e78 <sk_store_a8_vfp4+0x48>
+ .long 0x1afffff4 // bne 3fe8 <sk_store_a8_vfp4+0x48>
.long 0xeeb03bb0 // vmov.u16 r3, d16[2]
.long 0xe5c23002 // strb r3, [r2, #2]
.long 0xee903bf0 // vmov.u16 r3, d16[1]
.long 0xee904bb0 // vmov.u16 r4, d16[0]
.long 0xe5c23001 // strb r3, [r2, #1]
.long 0xe5c24000 // strb r4, [r2]
- .long 0xeaffffed // b 3e78 <sk_store_a8_vfp4+0x48>
+ .long 0xeaffffed // b 3fe8 <sk_store_a8_vfp4+0x48>
.long 0xee903bb0 // vmov.u16 r3, d16[0]
.long 0xe5c23000 // strb r3, [r2]
- .long 0xeaffffea // b 3e78 <sk_store_a8_vfp4+0x48>
+ .long 0xeaffffea // b 3fe8 <sk_store_a8_vfp4+0x48>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -11814,7 +11988,7 @@ _sk_load_g8_vfp4:
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
- .long 0x1a000013 // bne 3f5c <sk_load_g8_vfp4+0x7c>
+ .long 0x1a000013 // bne 40cc <sk_load_g8_vfp4+0x7c>
.long 0xe5922000 // ldr r2, [r2]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -11837,12 +12011,12 @@ _sk_load_g8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000012 // beq 3fb4 <sk_load_g8_vfp4+0xd4>
+ .long 0x0a000012 // beq 4124 <sk_load_g8_vfp4+0xd4>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 3f8c <sk_load_g8_vfp4+0xac>
+ .long 0x0a000005 // beq 40fc <sk_load_g8_vfp4+0xac>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe8 // bne 3f20 <sk_load_g8_vfp4+0x40>
+ .long 0x1affffe8 // bne 4090 <sk_load_g8_vfp4+0x40>
.long 0xe3a04000 // mov r4, #0
.long 0xe5d23002 // ldrb r3, [r2, #2]
.long 0xee804bb0 // vdup.16 d16, r4
@@ -11856,12 +12030,12 @@ _sk_load_g8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffda // b 3f20 <sk_load_g8_vfp4+0x40>
+ .long 0xeaffffda // b 4090 <sk_load_g8_vfp4+0x40>
.long 0xe3a03000 // mov r3, #0
.long 0xe5d22000 // ldrb r2, [r2]
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd5 // b 3f20 <sk_load_g8_vfp4+0x40>
+ .long 0xeaffffd5 // b 4090 <sk_load_g8_vfp4+0x40>
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -11888,7 +12062,7 @@ _sk_load_g8_dst_vfp4:
.long 0xe0824003 // add r4, r2, r3
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a000015 // bne 4078 <sk_load_g8_dst_vfp4+0x90>
+ .long 0x1a000015 // bne 41e8 <sk_load_g8_dst_vfp4+0x90>
.long 0xe5944000 // ldr r4, [r4]
.long 0xe58d4000 // str r4, [sp]
.long 0xe1a0400d // mov r4, sp
@@ -11913,12 +12087,12 @@ _sk_load_g8_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000012 // beq 40d0 <sk_load_g8_dst_vfp4+0xe8>
+ .long 0x0a000012 // beq 4240 <sk_load_g8_dst_vfp4+0xe8>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 40a8 <sk_load_g8_dst_vfp4+0xc0>
+ .long 0x0a000005 // beq 4218 <sk_load_g8_dst_vfp4+0xc0>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffe6 // bne 4034 <sk_load_g8_dst_vfp4+0x4c>
+ .long 0x1affffe6 // bne 41a4 <sk_load_g8_dst_vfp4+0x4c>
.long 0xe3a06000 // mov r6, #0
.long 0xe5d45002 // ldrb r5, [r4, #2]
.long 0xee806bb0 // vdup.16 d16, r6
@@ -11932,12 +12106,12 @@ _sk_load_g8_dst_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffd8 // b 4034 <sk_load_g8_dst_vfp4+0x4c>
+ .long 0xeaffffd8 // b 41a4 <sk_load_g8_dst_vfp4+0x4c>
.long 0xe3a05000 // mov r5, #0
.long 0xe5d44000 // ldrb r4, [r4]
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xee004bb0 // vmov.16 d16[0], r4
- .long 0xeaffffd3 // b 4034 <sk_load_g8_dst_vfp4+0x4c>
+ .long 0xeaffffd3 // b 41a4 <sk_load_g8_dst_vfp4+0x4c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -12004,7 +12178,7 @@ _sk_load_565_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082208e // add r2, r2, lr, lsl #1
- .long 0x1a00001b // bne 4238 <sk_load_565_vfp4+0xa0>
+ .long 0x1a00001b // bne 43a8 <sk_load_565_vfp4+0xa0>
.long 0xf462074f // vld1.16 {d16}, [r2]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe3a02e7e // mov r2, #2016
@@ -12035,12 +12209,12 @@ _sk_load_565_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000011 // beq 428c <sk_load_565_vfp4+0xf4>
+ .long 0x0a000011 // beq 43fc <sk_load_565_vfp4+0xf4>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 4268 <sk_load_565_vfp4+0xd0>
+ .long 0x0a000005 // beq 43d8 <sk_load_565_vfp4+0xd0>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffdc // bne 41cc <sk_load_565_vfp4+0x34>
+ .long 0x1affffdc // bne 433c <sk_load_565_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xe2823004 // add r3, r2, #4
@@ -12053,11 +12227,11 @@ _sk_load_565_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcf // b 41cc <sk_load_565_vfp4+0x34>
+ .long 0xeaffffcf // b 433c <sk_load_565_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xf4e2041f // vld1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffcb // b 41cc <sk_load_565_vfp4+0x34>
+ .long 0xeaffffcb // b 433c <sk_load_565_vfp4+0x34>
.long 0xe320f000 // nop {0}
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
@@ -12094,7 +12268,7 @@ _sk_load_565_dst_vfp4:
.long 0xe0824083 // add r4, r2, r3, lsl #1
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001f // bne 439c <sk_load_565_dst_vfp4+0xbc>
+ .long 0x1a00001f // bne 450c <sk_load_565_dst_vfp4+0xbc>
.long 0xf464074f // vld1.16 {d16}, [r4]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe3a04e7e // mov r4, #2016
@@ -12129,12 +12303,12 @@ _sk_load_565_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000011 // beq 43f0 <sk_load_565_dst_vfp4+0x110>
+ .long 0x0a000011 // beq 4560 <sk_load_565_dst_vfp4+0x110>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 43cc <sk_load_565_dst_vfp4+0xec>
+ .long 0x0a000005 // beq 453c <sk_load_565_dst_vfp4+0xec>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffd8 // bne 4320 <sk_load_565_dst_vfp4+0x40>
+ .long 0x1affffd8 // bne 4490 <sk_load_565_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xe2845004 // add r5, r4, #4
@@ -12147,11 +12321,11 @@ _sk_load_565_dst_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcb // b 4320 <sk_load_565_dst_vfp4+0x40>
+ .long 0xeaffffcb // b 4490 <sk_load_565_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16]
- .long 0xeaffffc7 // b 4320 <sk_load_565_dst_vfp4+0x40>
+ .long 0xeaffffc7 // b 4490 <sk_load_565_dst_vfp4+0x40>
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
@@ -12263,7 +12437,7 @@ _sk_store_565_vfp4:
.long 0xf26401f0 // vorr q8, q10, q8
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000004 // bne 45ac <sk_store_565_vfp4+0x84>
+ .long 0x1a000004 // bne 471c <sk_store_565_vfp4+0x84>
.long 0xf442074f // vst1.16 {d16}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -12271,11 +12445,11 @@ _sk_store_565_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 45ec <sk_store_565_vfp4+0xc4>
+ .long 0x0a00000c // beq 475c <sk_store_565_vfp4+0xc4>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 45d0 <sk_store_565_vfp4+0xa8>
+ .long 0x0a000003 // beq 4740 <sk_store_565_vfp4+0xa8>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 459c <sk_store_565_vfp4+0x74>
+ .long 0x1afffff4 // bne 470c <sk_store_565_vfp4+0x74>
.long 0xe2823004 // add r3, r2, #4
.long 0xf4c3049f // vst1.16 {d16[2]}, [r3 :16]
.long 0xee903bb0 // vmov.u16 r3, d16[0]
@@ -12284,9 +12458,9 @@ _sk_store_565_vfp4:
.long 0xee204b90 // vmov.32 d16[1], r4
.long 0xf3f60121 // vuzp.16 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
- .long 0xeaffffeb // b 459c <sk_store_565_vfp4+0x74>
+ .long 0xeaffffeb // b 470c <sk_store_565_vfp4+0x74>
.long 0xf4c2041f // vst1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffe9 // b 459c <sk_store_565_vfp4+0x74>
+ .long 0xeaffffe9 // b 470c <sk_store_565_vfp4+0x74>
.long 0xe320f000 // nop {0}
.long 0x427c0000 // .word 0x427c0000
.long 0x427c0000 // .word 0x427c0000
@@ -12308,7 +12482,7 @@ _sk_load_4444_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082208e // add r2, r2, lr, lsl #1
- .long 0x1a00001e // bne 46b4 <sk_load_4444_vfp4+0xac>
+ .long 0x1a00001e // bne 4824 <sk_load_4444_vfp4+0xac>
.long 0xf462074f // vld1.16 {d16}, [r2]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe28f20d0 // add r2, pc, #208
@@ -12342,12 +12516,12 @@ _sk_load_4444_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000011 // beq 4708 <sk_load_4444_vfp4+0x100>
+ .long 0x0a000011 // beq 4878 <sk_load_4444_vfp4+0x100>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 46e4 <sk_load_4444_vfp4+0xdc>
+ .long 0x0a000005 // beq 4854 <sk_load_4444_vfp4+0xdc>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffd9 // bne 463c <sk_load_4444_vfp4+0x34>
+ .long 0x1affffd9 // bne 47ac <sk_load_4444_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xe2823004 // add r3, r2, #4
@@ -12360,11 +12534,11 @@ _sk_load_4444_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcc // b 463c <sk_load_4444_vfp4+0x34>
+ .long 0xeaffffcc // b 47ac <sk_load_4444_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xf4e2041f // vld1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffc8 // b 463c <sk_load_4444_vfp4+0x34>
+ .long 0xeaffffc8 // b 47ac <sk_load_4444_vfp4+0x34>
.long 0x3b888889 // .word 0x3b888889
.long 0x3b888889 // .word 0x3b888889
.long 0x3b888889 // .word 0x3b888889
@@ -12400,7 +12574,7 @@ _sk_load_4444_dst_vfp4:
.long 0xe0824083 // add r4, r2, r3, lsl #1
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a000023 // bne 4824 <sk_load_4444_dst_vfp4+0xcc>
+ .long 0x1a000023 // bne 4994 <sk_load_4444_dst_vfp4+0xcc>
.long 0xf464074f // vld1.16 {d16}, [r4]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe28f40e4 // add r4, pc, #228
@@ -12439,12 +12613,12 @@ _sk_load_4444_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000011 // beq 4878 <sk_load_4444_dst_vfp4+0x120>
+ .long 0x0a000011 // beq 49e8 <sk_load_4444_dst_vfp4+0x120>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 4854 <sk_load_4444_dst_vfp4+0xfc>
+ .long 0x0a000005 // beq 49c4 <sk_load_4444_dst_vfp4+0xfc>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffd4 // bne 4798 <sk_load_4444_dst_vfp4+0x40>
+ .long 0x1affffd4 // bne 4908 <sk_load_4444_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xe2845004 // add r5, r4, #4
@@ -12457,11 +12631,11 @@ _sk_load_4444_dst_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffc7 // b 4798 <sk_load_4444_dst_vfp4+0x40>
+ .long 0xeaffffc7 // b 4908 <sk_load_4444_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16]
- .long 0xeaffffc3 // b 4798 <sk_load_4444_dst_vfp4+0x40>
+ .long 0xeaffffc3 // b 4908 <sk_load_4444_dst_vfp4+0x40>
.long 0x37888889 // .word 0x37888889
.long 0x37888889 // .word 0x37888889
.long 0x37888889 // .word 0x37888889
@@ -12584,7 +12758,7 @@ _sk_store_4444_vfp4:
.long 0xf26001f6 // vorr q8, q8, q11
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000004 // bne 4a60 <sk_store_4444_vfp4+0x90>
+ .long 0x1a000004 // bne 4bd0 <sk_store_4444_vfp4+0x90>
.long 0xf442074f // vst1.16 {d16}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -12592,11 +12766,11 @@ _sk_store_4444_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 4aa0 <sk_store_4444_vfp4+0xd0>
+ .long 0x0a00000c // beq 4c10 <sk_store_4444_vfp4+0xd0>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 4a84 <sk_store_4444_vfp4+0xb4>
+ .long 0x0a000003 // beq 4bf4 <sk_store_4444_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 4a50 <sk_store_4444_vfp4+0x80>
+ .long 0x1afffff4 // bne 4bc0 <sk_store_4444_vfp4+0x80>
.long 0xe2823004 // add r3, r2, #4
.long 0xf4c3049f // vst1.16 {d16[2]}, [r3 :16]
.long 0xee903bb0 // vmov.u16 r3, d16[0]
@@ -12605,9 +12779,9 @@ _sk_store_4444_vfp4:
.long 0xee204b90 // vmov.32 d16[1], r4
.long 0xf3f60121 // vuzp.16 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
- .long 0xeaffffeb // b 4a50 <sk_store_4444_vfp4+0x80>
+ .long 0xeaffffeb // b 4bc0 <sk_store_4444_vfp4+0x80>
.long 0xf4c2041f // vst1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffe9 // b 4a50 <sk_store_4444_vfp4+0x80>
+ .long 0xeaffffe9 // b 4bc0 <sk_store_4444_vfp4+0x80>
HIDDEN _sk_load_8888_vfp4
.globl _sk_load_8888_vfp4
@@ -12623,7 +12797,7 @@ _sk_load_8888_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082210e // add r2, r2, lr, lsl #2
- .long 0x1a000015 // bne 4b2c <sk_load_8888_vfp4+0x84>
+ .long 0x1a000015 // bne 4c9c <sk_load_8888_vfp4+0x84>
.long 0xf4620a8f // vld1.32 {d16-d17}, [r2]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f209c // add r2, pc, #156
@@ -12648,12 +12822,12 @@ _sk_load_8888_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 4b6c <sk_load_8888_vfp4+0xc4>
+ .long 0x0a00000c // beq 4cdc <sk_load_8888_vfp4+0xc4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 4b5c <sk_load_8888_vfp4+0xb4>
+ .long 0x0a000005 // beq 4ccc <sk_load_8888_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe2 // bne 4ad8 <sk_load_8888_vfp4+0x30>
+ .long 0x1affffe2 // bne 4c48 <sk_load_8888_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xe2823008 // add r3, r2, #8
@@ -12661,11 +12835,11 @@ _sk_load_8888_vfp4:
.long 0xedd22b00 // vldr d18, [r2]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffda // b 4ad8 <sk_load_8888_vfp4+0x30>
+ .long 0xeaffffda // b 4c48 <sk_load_8888_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffd6 // b 4ad8 <sk_load_8888_vfp4+0x30>
+ .long 0xeaffffd6 // b 4c48 <sk_load_8888_vfp4+0x30>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -12689,7 +12863,7 @@ _sk_load_8888_dst_vfp4:
.long 0xe0824103 // add r4, r2, r3, lsl #2
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001a // bne 4c34 <sk_load_8888_dst_vfp4+0xa4>
+ .long 0x1a00001a // bne 4da4 <sk_load_8888_dst_vfp4+0xa4>
.long 0xf4640a8f // vld1.32 {d16-d17}, [r4]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f40b0 // add r4, pc, #176
@@ -12719,12 +12893,12 @@ _sk_load_8888_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a00000c // beq 4c74 <sk_load_8888_dst_vfp4+0xe4>
+ .long 0x0a00000c // beq 4de4 <sk_load_8888_dst_vfp4+0xe4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 4c64 <sk_load_8888_dst_vfp4+0xd4>
+ .long 0x0a000005 // beq 4dd4 <sk_load_8888_dst_vfp4+0xd4>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffdd // bne 4bcc <sk_load_8888_dst_vfp4+0x3c>
+ .long 0x1affffdd // bne 4d3c <sk_load_8888_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xe2845008 // add r5, r4, #8
@@ -12732,11 +12906,11 @@ _sk_load_8888_dst_vfp4:
.long 0xedd42b00 // vldr d18, [r4]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffd5 // b 4bcc <sk_load_8888_dst_vfp4+0x3c>
+ .long 0xeaffffd5 // b 4d3c <sk_load_8888_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xf4e4083f // vld1.32 {d16[0]}, [r4 :32]
- .long 0xeaffffd1 // b 4bcc <sk_load_8888_dst_vfp4+0x3c>
+ .long 0xeaffffd1 // b 4d3c <sk_load_8888_dst_vfp4+0x3c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -12826,7 +13000,7 @@ _sk_store_8888_vfp4:
.long 0xf2f84576 // vshl.s32 q10, q11, #24
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf26001f4 // vorr q8, q8, q10
- .long 0x1a000004 // bne 4dd8 <sk_store_8888_vfp4+0x90>
+ .long 0x1a000004 // bne 4f48 <sk_store_8888_vfp4+0x90>
.long 0xf4420a8f // vst1.32 {d16-d17}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -12834,17 +13008,17 @@ _sk_store_8888_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000007 // beq 4e04 <sk_store_8888_vfp4+0xbc>
+ .long 0x0a000007 // beq 4f74 <sk_store_8888_vfp4+0xbc>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 4dfc <sk_store_8888_vfp4+0xb4>
+ .long 0x0a000003 // beq 4f6c <sk_store_8888_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 4dc8 <sk_store_8888_vfp4+0x80>
+ .long 0x1afffff4 // bne 4f38 <sk_store_8888_vfp4+0x80>
.long 0xe2823008 // add r3, r2, #8
.long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32]
.long 0xedc20b00 // vstr d16, [r2]
- .long 0xeafffff0 // b 4dc8 <sk_store_8888_vfp4+0x80>
+ .long 0xeafffff0 // b 4f38 <sk_store_8888_vfp4+0x80>
.long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffee // b 4dc8 <sk_store_8888_vfp4+0x80>
+ .long 0xeaffffee // b 4f38 <sk_store_8888_vfp4+0x80>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -12865,7 +13039,7 @@ _sk_load_bgra_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082210e // add r2, r2, lr, lsl #2
- .long 0x1a000015 // bne 4ea4 <sk_load_bgra_vfp4+0x84>
+ .long 0x1a000015 // bne 5014 <sk_load_bgra_vfp4+0x84>
.long 0xf4620a8f // vld1.32 {d16-d17}, [r2]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f209c // add r2, pc, #156
@@ -12890,12 +13064,12 @@ _sk_load_bgra_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 4ee4 <sk_load_bgra_vfp4+0xc4>
+ .long 0x0a00000c // beq 5054 <sk_load_bgra_vfp4+0xc4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 4ed4 <sk_load_bgra_vfp4+0xb4>
+ .long 0x0a000005 // beq 5044 <sk_load_bgra_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe2 // bne 4e50 <sk_load_bgra_vfp4+0x30>
+ .long 0x1affffe2 // bne 4fc0 <sk_load_bgra_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xe2823008 // add r3, r2, #8
@@ -12903,11 +13077,11 @@ _sk_load_bgra_vfp4:
.long 0xedd22b00 // vldr d18, [r2]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffda // b 4e50 <sk_load_bgra_vfp4+0x30>
+ .long 0xeaffffda // b 4fc0 <sk_load_bgra_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffd6 // b 4e50 <sk_load_bgra_vfp4+0x30>
+ .long 0xeaffffd6 // b 4fc0 <sk_load_bgra_vfp4+0x30>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -12931,7 +13105,7 @@ _sk_load_bgra_dst_vfp4:
.long 0xe0824103 // add r4, r2, r3, lsl #2
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001a // bne 4fac <sk_load_bgra_dst_vfp4+0xa4>
+ .long 0x1a00001a // bne 511c <sk_load_bgra_dst_vfp4+0xa4>
.long 0xf4640a8f // vld1.32 {d16-d17}, [r4]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f40b0 // add r4, pc, #176
@@ -12961,12 +13135,12 @@ _sk_load_bgra_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a00000c // beq 4fec <sk_load_bgra_dst_vfp4+0xe4>
+ .long 0x0a00000c // beq 515c <sk_load_bgra_dst_vfp4+0xe4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 4fdc <sk_load_bgra_dst_vfp4+0xd4>
+ .long 0x0a000005 // beq 514c <sk_load_bgra_dst_vfp4+0xd4>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffdd // bne 4f44 <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0x1affffdd // bne 50b4 <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xe2845008 // add r5, r4, #8
@@ -12974,11 +13148,11 @@ _sk_load_bgra_dst_vfp4:
.long 0xedd42b00 // vldr d18, [r4]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffd5 // b 4f44 <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0xeaffffd5 // b 50b4 <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xf4e4083f // vld1.32 {d16[0]}, [r4 :32]
- .long 0xeaffffd1 // b 4f44 <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0xeaffffd1 // b 50b4 <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -13068,7 +13242,7 @@ _sk_store_bgra_vfp4:
.long 0xf2f84576 // vshl.s32 q10, q11, #24
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf26001f4 // vorr q8, q8, q10
- .long 0x1a000004 // bne 5150 <sk_store_bgra_vfp4+0x90>
+ .long 0x1a000004 // bne 52c0 <sk_store_bgra_vfp4+0x90>
.long 0xf4420a8f // vst1.32 {d16-d17}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -13076,17 +13250,17 @@ _sk_store_bgra_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000007 // beq 517c <sk_store_bgra_vfp4+0xbc>
+ .long 0x0a000007 // beq 52ec <sk_store_bgra_vfp4+0xbc>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 5174 <sk_store_bgra_vfp4+0xb4>
+ .long 0x0a000003 // beq 52e4 <sk_store_bgra_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 5140 <sk_store_bgra_vfp4+0x80>
+ .long 0x1afffff4 // bne 52b0 <sk_store_bgra_vfp4+0x80>
.long 0xe2823008 // add r3, r2, #8
.long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32]
.long 0xedc20b00 // vstr d16, [r2]
- .long 0xeafffff0 // b 5140 <sk_store_bgra_vfp4+0x80>
+ .long 0xeafffff0 // b 52b0 <sk_store_bgra_vfp4+0x80>
.long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffee // b 5140 <sk_store_bgra_vfp4+0x80>
+ .long 0xeaffffee // b 52b0 <sk_store_bgra_vfp4+0x80>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -13107,7 +13281,7 @@ _sk_load_f16_vfp4:
.long 0xe0020293 // mul r2, r3, r2
.long 0xe0842182 // add r2, r4, r2, lsl #3
.long 0xe082318e // add r3, r2, lr, lsl #3
- .long 0x1a000008 // bne 51e8 <sk_load_f16_vfp4+0x50>
+ .long 0x1a000008 // bne 5358 <sk_load_f16_vfp4+0x50>
.long 0xf463004f // vld4.16 {d16-d19}, [r3]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xf3b60720 // vcvt.f32.f16 q0, d16
@@ -13119,14 +13293,14 @@ _sk_load_f16_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0afffff4 // beq 51c8 <sk_load_f16_vfp4+0x30>
+ .long 0x0afffff4 // beq 5338 <sk_load_f16_vfp4+0x30>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3afffff0 // bcc 51c8 <sk_load_f16_vfp4+0x30>
+ .long 0x3afffff0 // bcc 5338 <sk_load_f16_vfp4+0x30>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeaffffed // b 51c8 <sk_load_f16_vfp4+0x30>
+ .long 0xeaffffed // b 5338 <sk_load_f16_vfp4+0x30>
HIDDEN _sk_load_f16_dst_vfp4
.globl _sk_load_f16_dst_vfp4
@@ -13145,7 +13319,7 @@ _sk_load_f16_dst_vfp4:
.long 0xe0825183 // add r5, r2, r3, lsl #3
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00000d // bne 5280 <sk_load_f16_dst_vfp4+0x70>
+ .long 0x1a00000d // bne 53f0 <sk_load_f16_dst_vfp4+0x70>
.long 0xf465004f // vld4.16 {d16-d19}, [r5]
.long 0xf3f64720 // vcvt.f32.f16 q10, d16
.long 0xf3f66721 // vcvt.f32.f16 q11, d17
@@ -13162,14 +13336,14 @@ _sk_load_f16_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xf4e5070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r5]
.long 0xe3560001 // cmp r6, #1
- .long 0x0affffef // beq 524c <sk_load_f16_dst_vfp4+0x3c>
+ .long 0x0affffef // beq 53bc <sk_load_f16_dst_vfp4+0x3c>
.long 0xe2854008 // add r4, r5, #8
.long 0xe3560003 // cmp r6, #3
.long 0xf4e4074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r4]
- .long 0x3affffeb // bcc 524c <sk_load_f16_dst_vfp4+0x3c>
+ .long 0x3affffeb // bcc 53bc <sk_load_f16_dst_vfp4+0x3c>
.long 0xe2854010 // add r4, r5, #16
.long 0xf4e4078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r4]
- .long 0xeaffffe8 // b 524c <sk_load_f16_dst_vfp4+0x3c>
+ .long 0xeaffffe8 // b 53bc <sk_load_f16_dst_vfp4+0x3c>
HIDDEN _sk_gather_f16_vfp4
.globl _sk_gather_f16_vfp4
@@ -13230,7 +13404,7 @@ _sk_store_f16_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842182 // add r2, r4, r2, lsl #3
.long 0xe082218e // add r2, r2, lr, lsl #3
- .long 0x1a000004 // bne 5388 <sk_store_f16_vfp4+0x50>
+ .long 0x1a000004 // bne 54f8 <sk_store_f16_vfp4+0x50>
.long 0xf442004f // vst4.16 {d16-d19}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -13238,14 +13412,14 @@ _sk_store_f16_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4c2070f // vst4.16 {d16[0],d17[0],d18[0],d19[0]}, [r2]
- .long 0x0afffff8 // beq 5378 <sk_store_f16_vfp4+0x40>
+ .long 0x0afffff8 // beq 54e8 <sk_store_f16_vfp4+0x40>
.long 0xe2823008 // add r3, r2, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4c3074f // vst4.16 {d16[1],d17[1],d18[1],d19[1]}, [r3]
- .long 0x3afffff4 // bcc 5378 <sk_store_f16_vfp4+0x40>
+ .long 0x3afffff4 // bcc 54e8 <sk_store_f16_vfp4+0x40>
.long 0xe2822010 // add r2, r2, #16
.long 0xf4c2078f // vst4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeafffff1 // b 5378 <sk_store_f16_vfp4+0x40>
+ .long 0xeafffff1 // b 54e8 <sk_store_f16_vfp4+0x40>
HIDDEN _sk_load_u16_be_vfp4
.globl _sk_load_u16_be_vfp4
@@ -13261,7 +13435,7 @@ _sk_load_u16_be_vfp4:
.long 0xe0020293 // mul r2, r3, r2
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082318e // add r3, r2, lr, lsl #3
- .long 0x1a00001e // bne 5458 <sk_load_u16_be_vfp4+0xa8>
+ .long 0x1a00001e // bne 55c8 <sk_load_u16_be_vfp4+0xa8>
.long 0xf463004f // vld4.16 {d16-d19}, [r3]
.long 0xf3d84030 // vshr.u16 d20, d16, #8
.long 0xe28f2094 // add r2, pc, #148
@@ -13295,14 +13469,14 @@ _sk_load_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0affffde // beq 53e0 <sk_load_u16_be_vfp4+0x30>
+ .long 0x0affffde // beq 5550 <sk_load_u16_be_vfp4+0x30>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3affffda // bcc 53e0 <sk_load_u16_be_vfp4+0x30>
+ .long 0x3affffda // bcc 5550 <sk_load_u16_be_vfp4+0x30>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeaffffd7 // b 53e0 <sk_load_u16_be_vfp4+0x30>
+ .long 0xeaffffd7 // b 5550 <sk_load_u16_be_vfp4+0x30>
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
@@ -13323,7 +13497,7 @@ _sk_load_rgb_u16_be_vfp4:
.long 0xe08e308e // add r3, lr, lr, lsl #1
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe0823083 // add r3, r2, r3, lsl #1
- .long 0x1a00001a // bne 552c <sk_load_rgb_u16_be_vfp4+0x9c>
+ .long 0x1a00001a // bne 569c <sk_load_rgb_u16_be_vfp4+0x9c>
.long 0xf463044f // vld3.16 {d16-d18}, [r3]
.long 0xf3d84030 // vshr.u16 d20, d16, #8
.long 0xe28f2088 // add r2, pc, #136
@@ -13353,14 +13527,14 @@ _sk_load_rgb_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3060f // vld3.16 {d16[0],d17[0],d18[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0affffe2 // beq 54c4 <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0x0affffe2 // beq 5634 <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe2832006 // add r2, r3, #6
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2064f // vld3.16 {d16[1],d17[1],d18[1]}, [r2]
- .long 0x3affffde // bcc 54c4 <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0x3affffde // bcc 5634 <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe283200c // add r2, r3, #12
.long 0xf4e2068f // vld3.16 {d16[2],d17[2],d18[2]}, [r2]
- .long 0xeaffffdb // b 54c4 <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0xeaffffdb // b 5634 <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe320f000 // nop {0}
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
@@ -13415,7 +13589,7 @@ _sk_store_u16_be_vfp4:
.long 0xf2d84534 // vshl.s16 d20, d20, #8
.long 0xf26811b7 // vorr d17, d24, d23
.long 0xf26401b9 // vorr d16, d20, d25
- .long 0x1a000004 // bne 5630 <sk_store_u16_be_vfp4+0xb8>
+ .long 0x1a000004 // bne 57a0 <sk_store_u16_be_vfp4+0xb8>
.long 0xf443004f // vst4.16 {d16-d19}, [r3]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -13423,14 +13597,14 @@ _sk_store_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4c3070f // vst4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
- .long 0x0afffff8 // beq 5620 <sk_store_u16_be_vfp4+0xa8>
+ .long 0x0afffff8 // beq 5790 <sk_store_u16_be_vfp4+0xa8>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4c2074f // vst4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3afffff4 // bcc 5620 <sk_store_u16_be_vfp4+0xa8>
+ .long 0x3afffff4 // bcc 5790 <sk_store_u16_be_vfp4+0xa8>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4c2078f // vst4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeafffff1 // b 5620 <sk_store_u16_be_vfp4+0xa8>
+ .long 0xeafffff1 // b 5790 <sk_store_u16_be_vfp4+0xa8>
.long 0x477fff00 // .word 0x477fff00
.long 0x477fff00 // .word 0x477fff00
.long 0x477fff00 // .word 0x477fff00
@@ -13450,7 +13624,7 @@ _sk_load_f32_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082220e // add r2, r2, lr, lsl #4
- .long 0x1a000009 // bne 56bc <sk_load_f32_vfp4+0x54>
+ .long 0x1a000009 // bne 582c <sk_load_f32_vfp4+0x54>
.long 0xf462018d // vld4.32 {d16,d18,d20,d22}, [r2]!
.long 0xf462118f // vld4.32 {d17,d19,d21,d23}, [r2]
.long 0xf22001f0 // vorr q0, q8, q8
@@ -13463,14 +13637,14 @@ _sk_load_f32_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4a20b4f // vld4.32 {d0[0],d2[0],d4[0],d6[0]}, [r2]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0afffff8 // beq 56ac <sk_load_f32_vfp4+0x44>
+ .long 0x0afffff8 // beq 581c <sk_load_f32_vfp4+0x44>
.long 0xe2823010 // add r3, r2, #16
.long 0xe35c0003 // cmp ip, #3
.long 0xf4a30bcf // vld4.32 {d0[1],d2[1],d4[1],d6[1]}, [r3]
- .long 0x3afffff4 // bcc 56ac <sk_load_f32_vfp4+0x44>
+ .long 0x3afffff4 // bcc 581c <sk_load_f32_vfp4+0x44>
.long 0xe2822020 // add r2, r2, #32
.long 0xf4a21b4f // vld4.32 {d1[0],d3[0],d5[0],d7[0]}, [r2]
- .long 0xeafffff1 // b 56ac <sk_load_f32_vfp4+0x44>
+ .long 0xeafffff1 // b 581c <sk_load_f32_vfp4+0x44>
HIDDEN _sk_load_f32_dst_vfp4
.globl _sk_load_f32_dst_vfp4
@@ -13489,7 +13663,7 @@ _sk_load_f32_dst_vfp4:
.long 0xe0824203 // add r4, r2, r3, lsl #4
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00000e // bne 5758 <sk_load_f32_dst_vfp4+0x74>
+ .long 0x1a00000e // bne 58c8 <sk_load_f32_dst_vfp4+0x74>
.long 0xf464818d // vld4.32 {d24,d26,d28,d30}, [r4]!
.long 0xf464918f // vld4.32 {d25,d27,d29,d31}, [r4]
.long 0xf26801f8 // vorr q8, q12, q12
@@ -13507,14 +13681,14 @@ _sk_load_f32_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xf4e40b4f // vld4.32 {d16[0],d18[0],d20[0],d22[0]}, [r4]
.long 0xe3560001 // cmp r6, #1
- .long 0x0afffff3 // beq 5734 <sk_load_f32_dst_vfp4+0x50>
+ .long 0x0afffff3 // beq 58a4 <sk_load_f32_dst_vfp4+0x50>
.long 0xe2845010 // add r5, r4, #16
.long 0xe3560003 // cmp r6, #3
.long 0xf4e50bcf // vld4.32 {d16[1],d18[1],d20[1],d22[1]}, [r5]
- .long 0x3affffef // bcc 5734 <sk_load_f32_dst_vfp4+0x50>
+ .long 0x3affffef // bcc 58a4 <sk_load_f32_dst_vfp4+0x50>
.long 0xe2844020 // add r4, r4, #32
.long 0xf4e41b4f // vld4.32 {d17[0],d19[0],d21[0],d23[0]}, [r4]
- .long 0xeaffffec // b 5734 <sk_load_f32_dst_vfp4+0x50>
+ .long 0xeaffffec // b 58a4 <sk_load_f32_dst_vfp4+0x50>
HIDDEN _sk_store_f32_vfp4
.globl _sk_store_f32_vfp4
@@ -13530,7 +13704,7 @@ _sk_store_f32_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082220e // add r2, r2, lr, lsl #4
- .long 0x1a000005 // bne 57c4 <sk_store_f32_vfp4+0x44>
+ .long 0x1a000005 // bne 5934 <sk_store_f32_vfp4+0x44>
.long 0xf402018d // vst4.32 {d0,d2,d4,d6}, [r2]!
.long 0xf402118f // vst4.32 {d1,d3,d5,d7}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
@@ -13539,14 +13713,14 @@ _sk_store_f32_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4820b4f // vst4.32 {d0[0],d2[0],d4[0],d6[0]}, [r2]
- .long 0x0afffff8 // beq 57b4 <sk_store_f32_vfp4+0x34>
+ .long 0x0afffff8 // beq 5924 <sk_store_f32_vfp4+0x34>
.long 0xe2823010 // add r3, r2, #16
.long 0xe35c0003 // cmp ip, #3
.long 0xf4830bcf // vst4.32 {d0[1],d2[1],d4[1],d6[1]}, [r3]
- .long 0x3afffff4 // bcc 57b4 <sk_store_f32_vfp4+0x34>
+ .long 0x3afffff4 // bcc 5924 <sk_store_f32_vfp4+0x34>
.long 0xe2822020 // add r2, r2, #32
.long 0xf4821b4f // vst4.32 {d1[0],d3[0],d5[0],d7[0]}, [r2]
- .long 0xeafffff1 // b 57b4 <sk_store_f32_vfp4+0x34>
+ .long 0xeafffff1 // b 5924 <sk_store_f32_vfp4+0x34>
HIDDEN _sk_clamp_x_vfp4
.globl _sk_clamp_x_vfp4
@@ -14227,7 +14401,7 @@ _sk_gradient_vfp4:
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe5931000 // ldr r1, [r3]
.long 0xe3510002 // cmp r1, #2
- .long 0x3a00000a // bcc 612c <sk_gradient_vfp4+0x5c>
+ .long 0x3a00000a // bcc 629c <sk_gradient_vfp4+0x5c>
.long 0xe5932024 // ldr r2, [r3, #36]
.long 0xf2c04051 // vmov.i32 q10, #1
.long 0xf2c00050 // vmov.i32 q8, #0
@@ -14238,7 +14412,7 @@ _sk_gradient_vfp4:
.long 0xf3468ee8 // vcge.f32 q12, q11, q12
.long 0xf35481f2 // vbsl q12, q10, q9
.long 0xf26808e0 // vadd.i32 q8, q12, q8
- .long 0x1afffff9 // bne 6114 <sk_gradient_vfp4+0x44>
+ .long 0x1afffff9 // bne 6284 <sk_gradient_vfp4+0x44>
.long 0xee315b90 // vmov.32 r5, d17[1]
.long 0xe5937010 // ldr r7, [r3, #16]
.long 0xee112b90 // vmov.32 r2, d17[0]
@@ -15379,7 +15553,7 @@ _sk_clut_3D_vfp4:
.long 0xee1e2b10 // vmov.32 r2, d14[0]
.long 0xf2660d40 // vsub.f32 q8, q3, q0
.long 0xf2000cf4 // vfma.f32 q0, q8, q10
- .long 0xea000003 // b 7130 <sk_clut_3D_vfp4+0x500>
+ .long 0xea000003 // b 72a0 <sk_clut_3D_vfp4+0x500>
.long 0x3f7ff972 // .word 0x3f7ff972
.long 0x3f7ff972 // .word 0x3f7ff972
.long 0x3f7ff972 // .word 0x3f7ff972
@@ -15884,7 +16058,7 @@ _sk_clut_4D_vfp4:
.long 0xf20c0cdc // vfma.f32 q0, q14, q6
.long 0xf260cd4e // vsub.f32 q14, q0, q7
.long 0xf20cecfe // vfma.f32 q7, q14, q15
- .long 0xea000003 // b 7900 <sk_clut_4D_vfp4+0x548>
+ .long 0xea000003 // b 7a70 <sk_clut_4D_vfp4+0x548>
.long 0x3f7ff972 // .word 0x3f7ff972
.long 0x3f7ff972 // .word 0x3f7ff972
.long 0x3f7ff972 // .word 0x3f7ff972
@@ -16616,7 +16790,7 @@ _sk_seed_shader_hsw:
.byte 197,249,110,194 // vmovd %edx,%xmm0
.byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,54,173,2,0 // vbroadcastss 0x2ad36(%rip),%ymm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,13,42,179,2,0 // vbroadcastss 0x2b32a(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0
.byte 197,249,110,209 // vmovd %ecx,%xmm2
@@ -16624,7 +16798,7 @@ _sk_seed_shader_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,22,173,2,0 // vbroadcastss 0x2ad16(%rip),%ymm2 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,21,10,179,2,0 // vbroadcastss 0x2b30a(%rip),%ymm2 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -16643,13 +16817,13 @@ _sk_dither_hsw:
.byte 197,121,110,201 // vmovd %ecx,%xmm9
.byte 196,66,125,88,201 // vpbroadcastd %xmm9,%ymm9
.byte 196,65,53,239,200 // vpxor %ymm8,%ymm9,%ymm9
- .byte 196,98,125,88,21,221,172,2,0 // vpbroadcastd 0x2acdd(%rip),%ymm10 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,88,21,209,178,2,0 // vpbroadcastd 0x2b2d1(%rip),%ymm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11
.byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10
- .byte 196,98,125,88,37,194,172,2,0 // vpbroadcastd 0x2acc2(%rip),%ymm12 # 2ae0c <_sk_overlay_sse2_8bit+0x44b>
- .byte 196,98,125,88,45,189,172,2,0 // vpbroadcastd 0x2acbd(%rip),%ymm13 # 2ae10 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,125,88,37,182,178,2,0 // vpbroadcastd 0x2b2b6(%rip),%ymm12 # 2b400 <_sk_overlay_sse2_8bit+0x44b>
+ .byte 196,98,125,88,45,177,178,2,0 // vpbroadcastd 0x2b2b1(%rip),%ymm13 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14
.byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14
.byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13
@@ -16664,8 +16838,8 @@ _sk_dither_hsw:
.byte 196,65,61,235,194 // vpor %ymm10,%ymm8,%ymm8
.byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,111,172,2,0 // vbroadcastss 0x2ac6f(%rip),%ymm9 # 2ae14 <_sk_overlay_sse2_8bit+0x453>
- .byte 196,98,125,24,21,106,172,2,0 // vbroadcastss 0x2ac6a(%rip),%ymm10 # 2ae18 <_sk_overlay_sse2_8bit+0x457>
+ .byte 196,98,125,24,13,99,178,2,0 // vbroadcastss 0x2b263(%rip),%ymm9 # 2b408 <_sk_overlay_sse2_8bit+0x453>
+ .byte 196,98,125,24,21,94,178,2,0 // vbroadcastss 0x2b25e(%rip),%ymm10 # 2b40c <_sk_overlay_sse2_8bit+0x457>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 196,98,125,24,0 // vbroadcastss (%rax),%ymm8
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
@@ -16699,7 +16873,7 @@ HIDDEN _sk_black_color_hsw
FUNCTION(_sk_black_color_hsw)
_sk_black_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,242,171,2,0 // vbroadcastss 0x2abf2(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,230,177,2,0 // vbroadcastss 0x2b1e6(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -16710,7 +16884,7 @@ HIDDEN _sk_white_color_hsw
FUNCTION(_sk_white_color_hsw)
_sk_white_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,217,171,2,0 // vbroadcastss 0x2abd9(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,205,177,2,0 // vbroadcastss 0x2b1cd(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -16756,7 +16930,7 @@ HIDDEN _sk_srcatop_hsw
FUNCTION(_sk_srcatop_hsw)
_sk_srcatop_hsw:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,120,171,2,0 // vbroadcastss 0x2ab78(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,108,177,2,0 // vbroadcastss 0x2b16c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0
.byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1
@@ -16772,7 +16946,7 @@ HIDDEN _sk_dstatop_hsw
.globl _sk_dstatop_hsw
FUNCTION(_sk_dstatop_hsw)
_sk_dstatop_hsw:
- .byte 196,98,125,24,5,71,171,2,0 // vbroadcastss 0x2ab47(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,59,177,2,0 // vbroadcastss 0x2b13b(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -16811,7 +16985,7 @@ HIDDEN _sk_srcout_hsw
.globl _sk_srcout_hsw
FUNCTION(_sk_srcout_hsw)
_sk_srcout_hsw:
- .byte 196,98,125,24,5,234,170,2,0 // vbroadcastss 0x2aaea(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,222,176,2,0 // vbroadcastss 0x2b0de(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -16824,7 +16998,7 @@ HIDDEN _sk_dstout_hsw
.globl _sk_dstout_hsw
FUNCTION(_sk_dstout_hsw)
_sk_dstout_hsw:
- .byte 196,226,125,24,5,201,170,2,0 // vbroadcastss 0x2aac9(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,189,176,2,0 // vbroadcastss 0x2b0bd(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -16837,7 +17011,7 @@ HIDDEN _sk_srcover_hsw
.globl _sk_srcover_hsw
FUNCTION(_sk_srcover_hsw)
_sk_srcover_hsw:
- .byte 196,98,125,24,5,168,170,2,0 // vbroadcastss 0x2aaa8(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,156,176,2,0 // vbroadcastss 0x2b09c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -16850,7 +17024,7 @@ HIDDEN _sk_dstover_hsw
.globl _sk_dstover_hsw
FUNCTION(_sk_dstover_hsw)
_sk_dstover_hsw:
- .byte 196,98,125,24,5,131,170,2,0 // vbroadcastss 0x2aa83(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,119,176,2,0 // vbroadcastss 0x2b077(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
.byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -16874,7 +17048,7 @@ HIDDEN _sk_multiply_hsw
.globl _sk_multiply_hsw
FUNCTION(_sk_multiply_hsw)
_sk_multiply_hsw:
- .byte 196,98,125,24,5,74,170,2,0 // vbroadcastss 0x2aa4a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,62,176,2,0 // vbroadcastss 0x2b03e(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -16897,9 +17071,14 @@ HIDDEN _sk_plus__hsw
FUNCTION(_sk_plus__hsw)
_sk_plus__hsw:
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
+ .byte 196,98,125,24,5,237,175,2,0 // vbroadcastss 0x2afed(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 197,244,88,205 // vaddps %ymm5,%ymm1,%ymm1
+ .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 197,236,88,214 // vaddps %ymm6,%ymm2,%ymm2
+ .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3
+ .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -16922,7 +17101,7 @@ HIDDEN _sk_xor__hsw
.globl _sk_xor__hsw
FUNCTION(_sk_xor__hsw)
_sk_xor__hsw:
- .byte 196,98,125,24,5,193,169,2,0 // vbroadcastss 0x2a9c1(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,152,175,2,0 // vbroadcastss 0x2af98(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -16956,7 +17135,7 @@ _sk_darken_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,69,169,2,0 // vbroadcastss 0x2a945(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,28,175,2,0 // vbroadcastss 0x2af1c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -16981,7 +17160,7 @@ _sk_lighten_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,240,168,2,0 // vbroadcastss 0x2a8f0(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,199,174,2,0 // vbroadcastss 0x2aec7(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -17009,7 +17188,7 @@ _sk_difference_hsw:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,143,168,2,0 // vbroadcastss 0x2a88f(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,102,174,2,0 // vbroadcastss 0x2ae66(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -17031,7 +17210,7 @@ _sk_exclusion_hsw:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,73,168,2,0 // vbroadcastss 0x2a849(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,32,174,2,0 // vbroadcastss 0x2ae20(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -17041,7 +17220,7 @@ HIDDEN _sk_colorburn_hsw
.globl _sk_colorburn_hsw
FUNCTION(_sk_colorburn_hsw)
_sk_colorburn_hsw:
- .byte 196,98,125,24,5,51,168,2,0 // vbroadcastss 0x2a833(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,10,174,2,0 // vbroadcastss 0x2ae0a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -17099,7 +17278,7 @@ HIDDEN _sk_colordodge_hsw
FUNCTION(_sk_colordodge_hsw)
_sk_colordodge_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,67,167,2,0 // vbroadcastss 0x2a743(%rip),%ymm9 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,13,26,173,2,0 // vbroadcastss 0x2ad1a(%rip),%ymm9 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -17152,7 +17331,7 @@ HIDDEN _sk_hardlight_hsw
.globl _sk_hardlight_hsw
FUNCTION(_sk_hardlight_hsw)
_sk_hardlight_hsw:
- .byte 196,98,125,24,5,93,166,2,0 // vbroadcastss 0x2a65d(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,52,172,2,0 // vbroadcastss 0x2ac34(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17203,7 +17382,7 @@ HIDDEN _sk_overlay_hsw
.globl _sk_overlay_hsw
FUNCTION(_sk_overlay_hsw)
_sk_overlay_hsw:
- .byte 196,98,125,24,5,145,165,2,0 // vbroadcastss 0x2a591(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,104,171,2,0 // vbroadcastss 0x2ab68(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17264,10 +17443,10 @@ _sk_softlight_hsw:
.byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,29,172,164,2,0 // vbroadcastss 0x2a4ac(%rip),%ymm11 # 2ae1c <_sk_overlay_sse2_8bit+0x45b>
+ .byte 196,98,125,24,29,131,170,2,0 // vbroadcastss 0x2aa83(%rip),%ymm11 # 2b410 <_sk_overlay_sse2_8bit+0x45b>
.byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12
.byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8
- .byte 196,98,125,24,37,157,164,2,0 // vbroadcastss 0x2a49d(%rip),%ymm12 # 2ae20 <_sk_overlay_sse2_8bit+0x45f>
+ .byte 196,98,125,24,37,116,170,2,0 // vbroadcastss 0x2aa74(%rip),%ymm12 # 2b414 <_sk_overlay_sse2_8bit+0x45f>
.byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8
.byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14
.byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14
@@ -17277,7 +17456,7 @@ _sk_softlight_hsw:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,76,164,2,0 // vbroadcastss 0x2a44c(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,35,170,2,0 // vbroadcastss 0x2aa23(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -17390,11 +17569,11 @@ _sk_hue_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,100,162,2,0 // vbroadcastss 0x2a264(%rip),%ymm14 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
- .byte 196,98,125,24,61,95,162,2,0 // vbroadcastss 0x2a25f(%rip),%ymm15 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,53,59,168,2,0 // vbroadcastss 0x2a83b(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,61,54,168,2,0 // vbroadcastss 0x2a836(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,80,162,2,0 // vbroadcastss 0x2a250(%rip),%ymm0 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,226,125,24,5,39,168,2,0 // vbroadcastss 0x2a827(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -17449,7 +17628,7 @@ _sk_hue_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,17,161,2,0 // vbroadcastss 0x2a111(%rip),%ymm1 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,13,232,166,2,0 // vbroadcastss 0x2a6e8(%rip),%ymm1 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -17503,11 +17682,11 @@ _sk_saturation_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,68,160,2,0 // vbroadcastss 0x2a044(%rip),%ymm14 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
- .byte 196,98,125,24,61,63,160,2,0 // vbroadcastss 0x2a03f(%rip),%ymm15 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,53,27,166,2,0 // vbroadcastss 0x2a61b(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,61,22,166,2,0 // vbroadcastss 0x2a616(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,48,160,2,0 // vbroadcastss 0x2a030(%rip),%ymm0 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,226,125,24,5,7,166,2,0 // vbroadcastss 0x2a607(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -17562,7 +17741,7 @@ _sk_saturation_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,241,158,2,0 // vbroadcastss 0x29ef1(%rip),%ymm1 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,13,200,164,2,0 // vbroadcastss 0x2a4c8(%rip),%ymm1 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -17590,11 +17769,11 @@ _sk_color_hsw:
.byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8
.byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10
.byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11
- .byte 196,98,125,24,45,166,158,2,0 // vbroadcastss 0x29ea6(%rip),%ymm13 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
- .byte 196,98,125,24,53,161,158,2,0 // vbroadcastss 0x29ea1(%rip),%ymm14 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,45,125,164,2,0 // vbroadcastss 0x2a47d(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,53,120,164,2,0 // vbroadcastss 0x2a478(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12
.byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12
- .byte 196,98,125,24,61,146,158,2,0 // vbroadcastss 0x29e92(%rip),%ymm15 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,98,125,24,61,105,164,2,0 // vbroadcastss 0x2a469(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -17650,7 +17829,7 @@ _sk_color_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,72,157,2,0 // vbroadcastss 0x29d48(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,31,163,2,0 // vbroadcastss 0x2a31f(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -17678,11 +17857,11 @@ _sk_luminosity_hsw:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10
.byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11
- .byte 196,98,125,24,45,253,156,2,0 // vbroadcastss 0x29cfd(%rip),%ymm13 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
- .byte 196,98,125,24,53,248,156,2,0 // vbroadcastss 0x29cf8(%rip),%ymm14 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,45,212,162,2,0 // vbroadcastss 0x2a2d4(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,53,207,162,2,0 // vbroadcastss 0x2a2cf(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12
.byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12
- .byte 196,98,125,24,61,233,156,2,0 // vbroadcastss 0x29ce9(%rip),%ymm15 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,98,125,24,61,192,162,2,0 // vbroadcastss 0x2a2c0(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -17738,7 +17917,7 @@ _sk_luminosity_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,159,155,2,0 // vbroadcastss 0x29b9f(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,118,161,2,0 // vbroadcastss 0x2a176(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -17768,19 +17947,19 @@ _sk_srcover_rgba_8888_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,180,0,0,0 // jne 137c <_sk_srcover_rgba_8888_hsw+0xd5>
+ .byte 15,133,180,0,0,0 // jne 1399 <_sk_srcover_rgba_8888_hsw+0xd5>
.byte 196,193,126,111,60,153 // vmovdqu (%r9,%rbx,4),%ymm7
- .byte 197,197,219,37,202,156,2,0 // vpand 0x29cca(%rip),%ymm7,%ymm4 # 2afa0 <_sk_overlay_sse2_8bit+0x5df>
+ .byte 197,197,219,37,173,162,2,0 // vpand 0x2a2ad(%rip),%ymm7,%ymm4 # 2b5a0 <_sk_overlay_sse2_8bit+0x5eb>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,69,0,45,221,156,2,0 // vpshufb 0x29cdd(%rip),%ymm7,%ymm5 # 2afc0 <_sk_overlay_sse2_8bit+0x5ff>
+ .byte 196,226,69,0,45,192,162,2,0 // vpshufb 0x2a2c0(%rip),%ymm7,%ymm5 # 2b5c0 <_sk_overlay_sse2_8bit+0x60b>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,69,0,53,240,156,2,0 // vpshufb 0x29cf0(%rip),%ymm7,%ymm6 # 2afe0 <_sk_overlay_sse2_8bit+0x61f>
+ .byte 196,226,69,0,53,211,162,2,0 // vpshufb 0x2a2d3(%rip),%ymm7,%ymm6 # 2b5e0 <_sk_overlay_sse2_8bit+0x62b>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,254,154,2,0 // vbroadcastss 0x29afe(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,213,160,2,0 // vbroadcastss 0x2a0d5(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,29,155,2,0 // vbroadcastss 0x29b1d(%rip),%ymm9 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,13,244,160,2,0 // vbroadcastss 0x2a0f4(%rip),%ymm9 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -17800,7 +17979,7 @@ _sk_srcover_rgba_8888_hsw:
.byte 196,65,53,235,202 // vpor %ymm10,%ymm9,%ymm9
.byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 13b3 <_sk_srcover_rgba_8888_hsw+0x10c>
+ .byte 117,66 // jne 13d0 <_sk_srcover_rgba_8888_hsw+0x10c>
.byte 196,65,126,127,4,153 // vmovdqu %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -17810,33 +17989,33 @@ _sk_srcover_rgba_8888_hsw:
.byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,58,255,255,255 // ja 12ce <_sk_srcover_rgba_8888_hsw+0x27>
+ .byte 15,135,58,255,255,255 // ja 12eb <_sk_srcover_rgba_8888_hsw+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,253,0,0,0 // lea 0xfd(%rip),%r11 # 149c <_sk_srcover_rgba_8888_hsw+0x1f5>
+ .byte 76,141,29,0,1,0,0 // lea 0x100(%rip),%r11 # 14bc <_sk_srcover_rgba_8888_hsw+0x1f8>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,60,153 // vmovd (%r9,%rbx,4),%xmm7
- .byte 233,27,255,255,255 // jmpq 12ce <_sk_srcover_rgba_8888_hsw+0x27>
+ .byte 233,27,255,255,255 // jmpq 12eb <_sk_srcover_rgba_8888_hsw+0x27>
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,180 // ja 1377 <_sk_srcover_rgba_8888_hsw+0xd0>
+ .byte 119,180 // ja 1394 <_sk_srcover_rgba_8888_hsw+0xd0>
.byte 65,15,182,194 // movzbl %r10b,%eax
- .byte 76,141,21,234,0,0,0 // lea 0xea(%rip),%r10 # 14b8 <_sk_srcover_rgba_8888_hsw+0x211>
+ .byte 76,141,21,237,0,0,0 // lea 0xed(%rip),%r10 # 14d8 <_sk_srcover_rgba_8888_hsw+0x214>
.byte 73,99,4,130 // movslq (%r10,%rax,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,152 // jmp 1377 <_sk_srcover_rgba_8888_hsw+0xd0>
+ .byte 235,152 // jmp 1394 <_sk_srcover_rgba_8888_hsw+0xd0>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
.byte 196,227,85,2,252,4 // vpblendd $0x4,%ymm4,%ymm5,%ymm7
.byte 196,193,122,126,36,153 // vmovq (%r9,%rbx,4),%xmm4
.byte 196,227,69,2,252,3 // vpblendd $0x3,%ymm4,%ymm7,%ymm7
- .byte 233,200,254,255,255 // jmpq 12ce <_sk_srcover_rgba_8888_hsw+0x27>
+ .byte 233,200,254,255,255 // jmpq 12eb <_sk_srcover_rgba_8888_hsw+0x27>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -17849,10 +18028,10 @@ _sk_srcover_rgba_8888_hsw:
.byte 196,227,69,56,252,1 // vinserti128 $0x1,%xmm4,%ymm7,%ymm7
.byte 196,193,122,111,36,153 // vmovdqu (%r9,%rbx,4),%xmm4
.byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- .byte 233,121,254,255,255 // jmpq 12ce <_sk_srcover_rgba_8888_hsw+0x27>
+ .byte 233,121,254,255,255 // jmpq 12eb <_sk_srcover_rgba_8888_hsw+0x27>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 233,15,255,255,255 // jmpq 1377 <_sk_srcover_rgba_8888_hsw+0xd0>
+ .byte 233,15,255,255,255 // jmpq 1394 <_sk_srcover_rgba_8888_hsw+0xd0>
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
@@ -17860,33 +18039,35 @@ _sk_srcover_rgba_8888_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,65,121,126,76,153,16 // vmovd %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,122,127,4,153 // vmovdqu %xmm8,(%r9,%rbx,4)
- .byte 233,219,254,255,255 // jmpq 1377 <_sk_srcover_rgba_8888_hsw+0xd0>
- .byte 12,255 // or $0xff,%al
+ .byte 233,219,254,255,255 // jmpq 1394 <_sk_srcover_rgba_8888_hsw+0xd0>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 9,255 // or %edi,%edi
.byte 255 // (bad)
- .byte 255,89,255 // lcall *-0x1(%rcx)
+ .byte 255,86,255 // callq *-0x1(%rsi)
.byte 255 // (bad)
- .byte 255,67,255 // incl -0x1(%rbx)
+ .byte 255,64,255 // incl -0x1(%rax)
.byte 255 // (bad)
- .byte 255,168,255,255,255,148 // ljmp *-0x6b000001(%rax)
+ .byte 255,165,255,255,255,145 // jmpq *-0x6e000001(%rbp)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,128,255,255,255,106 // incl 0x6affffff(%rax)
.byte 255 // (bad)
+ .byte 125,255 // jge 14d1 <_sk_srcover_rgba_8888_hsw+0x20d>
.byte 255 // (bad)
- .byte 255,31 // lcall *(%rdi)
+ .byte 255,103,255 // jmpq *-0x1(%rdi)
.byte 255 // (bad)
+ .byte 255,28,255 // lcall *(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 255,165,255,255,255,157 // jmpq *-0x62000001(%rbp)
+ .byte 255,162,255,255,255,154 // jmpq *-0x65000001(%rdx)
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,214 // callq *%rsi
.byte 255 // (bad)
- .byte 217,255 // fcos
.byte 255 // (bad)
- .byte 255,204 // dec %esp
+ .byte 255,201 // dec %ecx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 190,255,255,255,176 // mov $0xb0ffffff,%esi
+ .byte 187,255,255,255,173 // mov $0xadffffff,%ebx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -17907,7 +18088,7 @@ HIDDEN _sk_clamp_1_hsw
.globl _sk_clamp_1_hsw
FUNCTION(_sk_clamp_1_hsw)
_sk_clamp_1_hsw:
- .byte 196,98,125,24,5,10,153,2,0 // vbroadcastss 0x2990a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,222,158,2,0 // vbroadcastss 0x29ede(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -17919,7 +18100,7 @@ HIDDEN _sk_clamp_a_hsw
.globl _sk_clamp_a_hsw
FUNCTION(_sk_clamp_a_hsw)
_sk_clamp_a_hsw:
- .byte 196,98,125,24,5,233,152,2,0 // vbroadcastss 0x298e9(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,189,158,2,0 // vbroadcastss 0x29ebd(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -17931,7 +18112,7 @@ HIDDEN _sk_clamp_a_dst_hsw
.globl _sk_clamp_a_dst_hsw
FUNCTION(_sk_clamp_a_dst_hsw)
_sk_clamp_a_dst_hsw:
- .byte 196,98,125,24,5,203,152,2,0 // vbroadcastss 0x298cb(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,159,158,2,0 // vbroadcastss 0x29e9f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -17964,7 +18145,7 @@ HIDDEN _sk_invert_hsw
.globl _sk_invert_hsw
FUNCTION(_sk_invert_hsw)
_sk_invert_hsw:
- .byte 196,98,125,24,5,134,152,2,0 // vbroadcastss 0x29886(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,90,158,2,0 // vbroadcastss 0x29e5a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -18020,7 +18201,7 @@ FUNCTION(_sk_unpremul_hsw)
_sk_unpremul_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,22,152,2,0 // vbroadcastss 0x29816(%rip),%ymm10 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,21,234,157,2,0 // vbroadcastss 0x29dea(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -18033,16 +18214,16 @@ HIDDEN _sk_from_srgb_hsw
.globl _sk_from_srgb_hsw
FUNCTION(_sk_from_srgb_hsw)
_sk_from_srgb_hsw:
- .byte 196,98,125,24,5,35,152,2,0 // vbroadcastss 0x29823(%rip),%ymm8 # 2ae34 <_sk_overlay_sse2_8bit+0x473>
+ .byte 196,98,125,24,5,247,157,2,0 // vbroadcastss 0x29df7(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,21,152,2,0 // vbroadcastss 0x29815(%rip),%ymm11 # 2ae38 <_sk_overlay_sse2_8bit+0x477>
- .byte 196,98,125,24,37,248,151,2,0 // vbroadcastss 0x297f8(%rip),%ymm12 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,29,233,157,2,0 // vbroadcastss 0x29de9(%rip),%ymm11 # 2b42c <_sk_overlay_sse2_8bit+0x477>
+ .byte 196,98,125,24,37,204,157,2,0 // vbroadcastss 0x29dcc(%rip),%ymm12 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13
- .byte 196,98,125,24,53,253,151,2,0 // vbroadcastss 0x297fd(%rip),%ymm14 # 2ae3c <_sk_overlay_sse2_8bit+0x47b>
+ .byte 196,98,125,24,53,209,157,2,0 // vbroadcastss 0x29dd1(%rip),%ymm14 # 2b430 <_sk_overlay_sse2_8bit+0x47b>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,243,151,2,0 // vbroadcastss 0x297f3(%rip),%ymm10 # 2ae40 <_sk_overlay_sse2_8bit+0x47f>
+ .byte 196,98,125,24,21,199,157,2,0 // vbroadcastss 0x29dc7(%rip),%ymm10 # 2b434 <_sk_overlay_sse2_8bit+0x47f>
.byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0
.byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -18065,16 +18246,16 @@ HIDDEN _sk_from_srgb_dst_hsw
.globl _sk_from_srgb_dst_hsw
FUNCTION(_sk_from_srgb_dst_hsw)
_sk_from_srgb_dst_hsw:
- .byte 196,98,125,24,5,139,151,2,0 // vbroadcastss 0x2978b(%rip),%ymm8 # 2ae34 <_sk_overlay_sse2_8bit+0x473>
+ .byte 196,98,125,24,5,95,157,2,0 // vbroadcastss 0x29d5f(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,125,151,2,0 // vbroadcastss 0x2977d(%rip),%ymm11 # 2ae38 <_sk_overlay_sse2_8bit+0x477>
- .byte 196,98,125,24,37,96,151,2,0 // vbroadcastss 0x29760(%rip),%ymm12 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,29,81,157,2,0 // vbroadcastss 0x29d51(%rip),%ymm11 # 2b42c <_sk_overlay_sse2_8bit+0x477>
+ .byte 196,98,125,24,37,52,157,2,0 // vbroadcastss 0x29d34(%rip),%ymm12 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,93,168,235 // vfmadd213ps %ymm11,%ymm4,%ymm13
- .byte 196,98,125,24,53,101,151,2,0 // vbroadcastss 0x29765(%rip),%ymm14 # 2ae3c <_sk_overlay_sse2_8bit+0x47b>
+ .byte 196,98,125,24,53,57,157,2,0 // vbroadcastss 0x29d39(%rip),%ymm14 # 2b430 <_sk_overlay_sse2_8bit+0x47b>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,91,151,2,0 // vbroadcastss 0x2975b(%rip),%ymm10 # 2ae40 <_sk_overlay_sse2_8bit+0x47f>
+ .byte 196,98,125,24,21,47,157,2,0 // vbroadcastss 0x29d2f(%rip),%ymm10 # 2b434 <_sk_overlay_sse2_8bit+0x47f>
.byte 196,193,92,194,226,1 // vcmpltps %ymm10,%ymm4,%ymm4
.byte 196,195,21,74,225,64 // vblendvps %ymm4,%ymm9,%ymm13,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -18098,19 +18279,19 @@ HIDDEN _sk_to_srgb_hsw
FUNCTION(_sk_to_srgb_hsw)
_sk_to_srgb_hsw:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,255,150,2,0 // vbroadcastss 0x296ff(%rip),%ymm8 # 2ae44 <_sk_overlay_sse2_8bit+0x483>
+ .byte 196,98,125,24,5,211,156,2,0 // vbroadcastss 0x29cd3(%rip),%ymm8 # 2b438 <_sk_overlay_sse2_8bit+0x483>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,245,150,2,0 // vbroadcastss 0x296f5(%rip),%ymm11 # 2ae48 <_sk_overlay_sse2_8bit+0x487>
- .byte 196,98,125,24,37,240,150,2,0 // vbroadcastss 0x296f0(%rip),%ymm12 # 2ae4c <_sk_overlay_sse2_8bit+0x48b>
+ .byte 196,98,125,24,29,201,156,2,0 // vbroadcastss 0x29cc9(%rip),%ymm11 # 2b43c <_sk_overlay_sse2_8bit+0x487>
+ .byte 196,98,125,24,37,196,156,2,0 // vbroadcastss 0x29cc4(%rip),%ymm12 # 2b440 <_sk_overlay_sse2_8bit+0x48b>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,53,168,235 // vfmadd213ps %ymm11,%ymm9,%ymm13
- .byte 196,98,125,24,53,225,150,2,0 // vbroadcastss 0x296e1(%rip),%ymm14 # 2ae50 <_sk_overlay_sse2_8bit+0x48f>
+ .byte 196,98,125,24,53,181,156,2,0 // vbroadcastss 0x29cb5(%rip),%ymm14 # 2b444 <_sk_overlay_sse2_8bit+0x48f>
.byte 196,66,53,168,238 // vfmadd213ps %ymm14,%ymm9,%ymm13
- .byte 196,98,125,24,61,215,150,2,0 // vbroadcastss 0x296d7(%rip),%ymm15 # 2ae54 <_sk_overlay_sse2_8bit+0x493>
+ .byte 196,98,125,24,61,171,156,2,0 // vbroadcastss 0x29cab(%rip),%ymm15 # 2b448 <_sk_overlay_sse2_8bit+0x493>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,20,89,201 // vmulps %ymm9,%ymm13,%ymm9
- .byte 196,98,125,24,45,195,150,2,0 // vbroadcastss 0x296c3(%rip),%ymm13 # 2ae58 <_sk_overlay_sse2_8bit+0x497>
+ .byte 196,98,125,24,45,151,156,2,0 // vbroadcastss 0x29c97(%rip),%ymm13 # 2b44c <_sk_overlay_sse2_8bit+0x497>
.byte 196,193,124,194,197,1 // vcmpltps %ymm13,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -18139,31 +18320,31 @@ HIDDEN _sk_rgb_to_hsl_hsw
.globl _sk_rgb_to_hsl_hsw
FUNCTION(_sk_rgb_to_hsl_hsw)
_sk_rgb_to_hsl_hsw:
- .byte 197,124,95,193 // vmaxps %ymm1,%ymm0,%ymm8
- .byte 197,60,95,194 // vmaxps %ymm2,%ymm8,%ymm8
- .byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9
- .byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9
+ .byte 197,116,95,194 // vmaxps %ymm2,%ymm1,%ymm8
+ .byte 196,65,124,95,192 // vmaxps %ymm8,%ymm0,%ymm8
+ .byte 197,116,93,202 // vminps %ymm2,%ymm1,%ymm9
+ .byte 196,65,124,93,201 // vminps %ymm9,%ymm0,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,224,149,2,0 // vbroadcastss 0x295e0(%rip),%ymm11 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,29,178,155,2,0 // vbroadcastss 0x29bb2(%rip),%ymm11 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13
- .byte 196,98,125,24,53,33,150,2,0 // vbroadcastss 0x29621(%rip),%ymm14 # 2ae5c <_sk_overlay_sse2_8bit+0x49b>
+ .byte 196,98,125,24,53,243,155,2,0 // vbroadcastss 0x29bf3(%rip),%ymm14 # 2b450 <_sk_overlay_sse2_8bit+0x49b>
.byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15
.byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13
.byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12
.byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2
.byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13
- .byte 196,98,125,24,53,8,150,2,0 // vbroadcastss 0x29608(%rip),%ymm14 # 2ae64 <_sk_overlay_sse2_8bit+0x4a3>
+ .byte 196,98,125,24,53,218,155,2,0 // vbroadcastss 0x29bda(%rip),%ymm14 # 2b458 <_sk_overlay_sse2_8bit+0x4a3>
.byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13
- .byte 196,98,125,24,53,246,149,2,0 // vbroadcastss 0x295f6(%rip),%ymm14 # 2ae60 <_sk_overlay_sse2_8bit+0x49f>
+ .byte 196,98,125,24,53,200,155,2,0 // vbroadcastss 0x29bc8(%rip),%ymm14 # 2b454 <_sk_overlay_sse2_8bit+0x49f>
.byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2
.byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1
.byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,29,109,149,2,0 // vbroadcastss 0x2956d(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,63,155,2,0 // vbroadcastss 0x29b3f(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2
.byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11
.byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12
@@ -18173,7 +18354,7 @@ _sk_rgb_to_hsl_hsw:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0
.byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- .byte 196,98,125,24,5,156,149,2,0 // vbroadcastss 0x2959c(%rip),%ymm8 # 2ae68 <_sk_overlay_sse2_8bit+0x4a7>
+ .byte 196,98,125,24,5,110,155,2,0 // vbroadcastss 0x29b6e(%rip),%ymm8 # 2b45c <_sk_overlay_sse2_8bit+0x4a7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -18190,30 +18371,30 @@ _sk_hsl_to_rgb_hsw:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 197,252,40,224 // vmovaps %ymm0,%ymm4
- .byte 196,98,125,24,5,249,148,2,0 // vbroadcastss 0x294f9(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,203,154,2,0 // vbroadcastss 0x29acb(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10
.byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11
.byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
- .byte 196,98,125,24,13,56,149,2,0 // vbroadcastss 0x29538(%rip),%ymm9 # 2ae60 <_sk_overlay_sse2_8bit+0x49f>
+ .byte 196,98,125,24,13,10,155,2,0 // vbroadcastss 0x29b0a(%rip),%ymm9 # 2b454 <_sk_overlay_sse2_8bit+0x49f>
.byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9
- .byte 196,98,125,24,29,54,149,2,0 // vbroadcastss 0x29536(%rip),%ymm11 # 2ae6c <_sk_overlay_sse2_8bit+0x4ab>
+ .byte 196,98,125,24,29,8,155,2,0 // vbroadcastss 0x29b08(%rip),%ymm11 # 2b460 <_sk_overlay_sse2_8bit+0x4ab>
.byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,45,8,149,2,0 // vbroadcastss 0x29508(%rip),%ymm13 # 2ae5c <_sk_overlay_sse2_8bit+0x49b>
+ .byte 196,98,125,24,45,218,154,2,0 // vbroadcastss 0x29ada(%rip),%ymm13 # 2b450 <_sk_overlay_sse2_8bit+0x49b>
.byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0
- .byte 196,98,125,24,53,2,149,2,0 // vbroadcastss 0x29502(%rip),%ymm14 # 2ae64 <_sk_overlay_sse2_8bit+0x4a3>
+ .byte 196,98,125,24,53,212,154,2,0 // vbroadcastss 0x29ad4(%rip),%ymm14 # 2b458 <_sk_overlay_sse2_8bit+0x4a3>
.byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12
.byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12
- .byte 196,226,125,24,29,252,148,2,0 // vbroadcastss 0x294fc(%rip),%ymm3 # 2ae70 <_sk_overlay_sse2_8bit+0x4af>
+ .byte 196,226,125,24,29,206,154,2,0 // vbroadcastss 0x29ace(%rip),%ymm3 # 2b464 <_sk_overlay_sse2_8bit+0x4af>
.byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7
.byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7
.byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12
.byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,37,211,148,2,0 // vbroadcastss 0x294d3(%rip),%ymm12 # 2ae68 <_sk_overlay_sse2_8bit+0x4a7>
+ .byte 196,98,125,24,37,165,154,2,0 // vbroadcastss 0x29aa5(%rip),%ymm12 # 2b45c <_sk_overlay_sse2_8bit+0x4a7>
.byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15
.byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0
.byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -18229,7 +18410,7 @@ _sk_hsl_to_rgb_hsw:
.byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0
.byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7
.byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- .byte 196,226,125,24,5,135,148,2,0 // vbroadcastss 0x29487(%rip),%ymm0 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,226,125,24,5,89,154,2,0 // vbroadcastss 0x29a59(%rip),%ymm0 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
.byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0
.byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
@@ -18282,12 +18463,12 @@ _sk_scale_u8_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,59 // jne 1ade <_sk_scale_u8_hsw+0x54>
+ .byte 117,59 // jne 1b00 <_sk_scale_u8_hsw+0x54>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,223,156,2,0 // vpand 0x29cdf(%rip),%xmm8,%xmm8 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,57,219,5,189,162,2,0 // vpand 0x2a2bd(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,180,147,2,0 // vbroadcastss 0x293b4(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,134,153,2,0 // vbroadcastss 0x29986(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -18301,15 +18482,15 @@ _sk_scale_u8_hsw:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,182 // ja 1aa9 <_sk_scale_u8_hsw+0x1f>
+ .byte 119,182 // ja 1acb <_sk_scale_u8_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 1b78 <_sk_scale_u8_hsw+0xee>
+ .byte 76,141,29,124,0,0,0 // lea 0x7c(%rip),%r11 # 1b9c <_sk_scale_u8_hsw+0xf0>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 235,151 // jmp 1aa9 <_sk_scale_u8_hsw+0x1f>
+ .byte 235,151 // jmp 1acb <_sk_scale_u8_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -18317,7 +18498,7 @@ _sk_scale_u8_hsw:
.byte 197,121,110,200 // vmovd %eax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
- .byte 233,110,255,255,255 // jmpq 1aa9 <_sk_scale_u8_hsw+0x1f>
+ .byte 233,110,255,255,255 // jmpq 1acb <_sk_scale_u8_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -18328,22 +18509,113 @@ _sk_scale_u8_hsw:
.byte 196,65,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
- .byte 233,50,255,255,255 // jmpq 1aa9 <_sk_scale_u8_hsw+0x1f>
- .byte 144 // nop
- .byte 143 // (bad)
+ .byte 233,50,255,255,255 // jmpq 1acb <_sk_scale_u8_hsw+0x1f>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 141 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,170,255,255,255,154 // ljmp *-0x65000001(%rdx)
+ .byte 255,168,255,255,255,152 // ljmp *-0x67000001(%rax)
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,231 // jmpq *%rdi
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf001b88 <_sk_overlay_sse2_8bit+0xffffffffdefd71c7>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,211 // callq *%rbx
+ .byte 220,255 // fdivr %st,%st(7)
.byte 255 // (bad)
+ .byte 255,209 // callq *%rcx
.byte 255 // (bad)
- .byte 255,195 // inc %ebx
+ .byte 255 // (bad)
+ .byte 255,193 // inc %ecx
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // .byte 0xff
+
+HIDDEN _sk_scale_565_hsw
+.globl _sk_scale_565_hsw
+FUNCTION(_sk_scale_565_hsw)
+_sk_scale_565_hsw:
+ .byte 83 // push %rbx
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,99,80,8 // movslq 0x8(%rax),%r10
+ .byte 76,99,201 // movslq %ecx,%r9
+ .byte 77,15,175,202 // imul %r10,%r9
+ .byte 77,1,201 // add %r9,%r9
+ .byte 76,3,8 // add (%rax),%r9
+ .byte 72,99,218 // movslq %edx,%rbx
+ .byte 77,133,192 // test %r8,%r8
+ .byte 15,133,162,0,0,0 // jne 1c7a <_sk_scale_565_hsw+0xc2>
+ .byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
+ .byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
+ .byte 196,98,125,88,13,132,152,2,0 // vpbroadcastd 0x29884(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
+ .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
+ .byte 196,98,125,24,21,117,152,2,0 // vbroadcastss 0x29875(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
+ .byte 196,98,125,88,21,107,152,2,0 // vpbroadcastd 0x2986b(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
+ .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
+ .byte 196,98,125,24,29,92,152,2,0 // vbroadcastss 0x2985c(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
+ .byte 196,98,125,88,29,82,152,2,0 // vpbroadcastd 0x29852(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
+ .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
+ .byte 196,98,125,24,29,67,152,2,0 // vbroadcastss 0x29843(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
+ .byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
+ .byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
+ .byte 196,65,52,93,228 // vminps %ymm12,%ymm9,%ymm12
+ .byte 196,65,44,95,232 // vmaxps %ymm8,%ymm10,%ymm13
+ .byte 196,65,52,95,237 // vmaxps %ymm13,%ymm9,%ymm13
+ .byte 196,67,21,74,220,176 // vblendvps %ymm11,%ymm12,%ymm13,%ymm11
+ .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
+ .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
+ .byte 197,188,89,210 // vmulps %ymm2,%ymm8,%ymm2
+ .byte 197,164,89,219 // vmulps %ymm3,%ymm11,%ymm3
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 91 // pop %rbx
+ .byte 255,224 // jmpq *%rax
+ .byte 69,137,194 // mov %r8d,%r10d
+ .byte 65,128,226,7 // and $0x7,%r10b
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 65,254,202 // dec %r10b
+ .byte 65,128,250,6 // cmp $0x6,%r10b
+ .byte 15,135,75,255,255,255 // ja 1bde <_sk_scale_565_hsw+0x26>
+ .byte 69,15,182,210 // movzbl %r10b,%r10d
+ .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 1d04 <_sk_scale_565_hsw+0x14c>
+ .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
+ .byte 76,1,216 // add %r11,%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
+ .byte 197,121,110,192 // vmovd %eax,%xmm8
+ .byte 233,41,255,255,255 // jmpq 1bde <_sk_scale_565_hsw+0x26>
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm9
+ .byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
+ .byte 233,11,255,255,255 // jmpq 1bde <_sk_scale_565_hsw+0x26>
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm9
+ .byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
+ .byte 233,221,254,255,255 // jmpq 1bde <_sk_scale_565_hsw+0x26>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 236 // in (%dx),%al
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,228 // jmpq *%rsp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 220,255 // fdivr %st,%st(7)
+ .byte 255 // (bad)
+ .byte 255,207 // dec %edi
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -18377,12 +18649,12 @@ _sk_lerp_u8_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,79 // jne 1c2b <_sk_lerp_u8_hsw+0x68>
+ .byte 117,79 // jne 1db7 <_sk_lerp_u8_hsw+0x68>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,166,155,2,0 // vpand 0x29ba6(%rip),%xmm8,%xmm8 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,57,219,5,26,160,2,0 // vpand 0x2a01a(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,123,146,2,0 // vbroadcastss 0x2927b(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,227,150,2,0 // vbroadcastss 0x296e3(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -18400,15 +18672,15 @@ _sk_lerp_u8_hsw:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,162 // ja 1be2 <_sk_lerp_u8_hsw+0x1f>
+ .byte 119,162 // ja 1d6e <_sk_lerp_u8_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 1cc4 <_sk_lerp_u8_hsw+0x101>
+ .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 1e50 <_sk_lerp_u8_hsw+0x101>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 235,131 // jmp 1be2 <_sk_lerp_u8_hsw+0x1f>
+ .byte 235,131 // jmp 1d6e <_sk_lerp_u8_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -18416,7 +18688,7 @@ _sk_lerp_u8_hsw:
.byte 197,121,110,200 // vmovd %eax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
- .byte 233,90,255,255,255 // jmpq 1be2 <_sk_lerp_u8_hsw+0x1f>
+ .byte 233,90,255,255,255 // jmpq 1d6e <_sk_lerp_u8_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -18427,7 +18699,7 @@ _sk_lerp_u8_hsw:
.byte 196,65,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
- .byte 233,30,255,255,255 // jmpq 1be2 <_sk_lerp_u8_hsw+0x1f>
+ .byte 233,30,255,255,255 // jmpq 1d6e <_sk_lerp_u8_hsw+0x1f>
.byte 144 // nop
.byte 255 // (bad)
.byte 255 // (bad)
@@ -18462,24 +18734,30 @@ _sk_lerp_565_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,170,0,0,0 // jne 1daa <_sk_lerp_565_hsw+0xca>
+ .byte 15,133,182,0,0,0 // jne 1f42 <_sk_lerp_565_hsw+0xd6>
.byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
- .byte 196,98,125,88,13,104,145,2,0 // vpbroadcastd 0x29168(%rip),%ymm9 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,98,125,88,13,208,149,2,0 // vpbroadcastd 0x295d0(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,89,145,2,0 // vbroadcastss 0x29159(%rip),%ymm10 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,98,125,24,21,193,149,2,0 // vbroadcastss 0x295c1(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,88,21,79,145,2,0 // vpbroadcastd 0x2914f(%rip),%ymm10 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,98,125,88,21,183,149,2,0 // vpbroadcastd 0x295b7(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,64,145,2,0 // vbroadcastss 0x29140(%rip),%ymm11 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,98,125,24,29,168,149,2,0 // vbroadcastss 0x295a8(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,88,29,54,145,2,0 // vpbroadcastd 0x29136(%rip),%ymm11 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,98,125,88,29,158,149,2,0 // vpbroadcastd 0x2959e(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,39,145,2,0 // vbroadcastss 0x29127(%rip),%ymm11 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,98,125,24,29,143,149,2,0 // vbroadcastss 0x2958f(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
+ .byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
+ .byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
+ .byte 196,65,52,93,228 // vminps %ymm12,%ymm9,%ymm12
+ .byte 196,65,44,95,232 // vmaxps %ymm8,%ymm10,%ymm13
+ .byte 196,65,52,95,237 // vmaxps %ymm13,%ymm9,%ymm13
+ .byte 196,67,21,74,220,176 // vblendvps %ymm11,%ymm12,%ymm13,%ymm11
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,53,168,196 // vfmadd213ps %ymm4,%ymm9,%ymm0
.byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1
@@ -18487,11 +18765,7 @@ _sk_lerp_565_hsw:
.byte 197,236,92,214 // vsubps %ymm6,%ymm2,%ymm2
.byte 196,226,61,168,214 // vfmadd213ps %ymm6,%ymm8,%ymm2
.byte 197,228,92,223 // vsubps %ymm7,%ymm3,%ymm3
- .byte 196,98,101,168,207 // vfmadd213ps %ymm7,%ymm3,%ymm9
- .byte 196,98,101,168,215 // vfmadd213ps %ymm7,%ymm3,%ymm10
- .byte 196,98,101,168,199 // vfmadd213ps %ymm7,%ymm3,%ymm8
- .byte 196,193,44,95,216 // vmaxps %ymm8,%ymm10,%ymm3
- .byte 197,180,95,219 // vmaxps %ymm3,%ymm9,%ymm3
+ .byte 196,226,37,168,223 // vfmadd213ps %ymm7,%ymm11,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -18500,27 +18774,27 @@ _sk_lerp_565_hsw:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,67,255,255,255 // ja 1d06 <_sk_lerp_565_hsw+0x26>
+ .byte 15,135,55,255,255,255 // ja 1e92 <_sk_lerp_565_hsw+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 1e34 <_sk_lerp_565_hsw+0x154>
+ .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 1fcc <_sk_lerp_565_hsw+0x160>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 233,33,255,255,255 // jmpq 1d06 <_sk_lerp_565_hsw+0x26>
+ .byte 233,21,255,255,255 // jmpq 1e92 <_sk_lerp_565_hsw+0x26>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,65,57,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm9
.byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
- .byte 233,3,255,255,255 // jmpq 1d06 <_sk_lerp_565_hsw+0x26>
+ .byte 233,247,254,255,255 // jmpq 1e92 <_sk_lerp_565_hsw+0x26>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,65,57,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm9
.byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
- .byte 233,213,254,255,255 // jmpq 1d06 <_sk_lerp_565_hsw+0x26>
+ .byte 233,201,254,255,255 // jmpq 1e92 <_sk_lerp_565_hsw+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff
.byte 255 // (bad)
@@ -18547,23 +18821,23 @@ _sk_load_tables_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 117,103 // jne 1ec1 <_sk_load_tables_hsw+0x71>
+ .byte 117,103 // jne 2059 <_sk_load_tables_hsw+0x71>
.byte 196,193,126,111,28,145 // vmovdqu (%r9,%rdx,4),%ymm3
- .byte 197,229,219,13,152,145,2,0 // vpand 0x29198(%rip),%ymm3,%ymm1 # 2b000 <_sk_overlay_sse2_8bit+0x63f>
+ .byte 197,229,219,13,0,150,2,0 // vpand 0x29600(%rip),%ymm3,%ymm1 # 2b600 <_sk_overlay_sse2_8bit+0x64b>
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 76,139,72,8 // mov 0x8(%rax),%r9
.byte 76,139,80,16 // mov 0x10(%rax),%r10
.byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
.byte 196,194,109,146,4,137 // vgatherdps %ymm2,(%r9,%ymm1,4),%ymm0
- .byte 196,226,101,0,21,152,145,2,0 // vpshufb 0x29198(%rip),%ymm3,%ymm2 # 2b020 <_sk_overlay_sse2_8bit+0x65f>
+ .byte 196,226,101,0,21,0,150,2,0 // vpshufb 0x29600(%rip),%ymm3,%ymm2 # 2b620 <_sk_overlay_sse2_8bit+0x66b>
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,194,53,146,12,146 // vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1
.byte 72,139,64,24 // mov 0x18(%rax),%rax
- .byte 196,98,101,0,13,160,145,2,0 // vpshufb 0x291a0(%rip),%ymm3,%ymm9 # 2b040 <_sk_overlay_sse2_8bit+0x67f>
+ .byte 196,98,101,0,13,8,150,2,0 // vpshufb 0x29608(%rip),%ymm3,%ymm9 # 2b640 <_sk_overlay_sse2_8bit+0x68b>
.byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,192,143,2,0 // vbroadcastss 0x28fc0(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,28,148,2,0 // vbroadcastss 0x2941c(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -18572,21 +18846,21 @@ _sk_load_tables_hsw:
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,139 // ja 1e60 <_sk_load_tables_hsw+0x10>
+ .byte 119,139 // ja 1ff8 <_sk_load_tables_hsw+0x10>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,140,0,0,0 // lea 0x8c(%rip),%r11 # 1f6c <_sk_load_tables_hsw+0x11c>
+ .byte 76,141,29,140,0,0,0 // lea 0x8c(%rip),%r11 # 2104 <_sk_load_tables_hsw+0x11c>
.byte 79,99,20,147 // movslq (%r11,%r10,4),%r10
.byte 77,1,218 // add %r11,%r10
.byte 65,255,226 // jmpq *%r10
.byte 196,193,121,110,28,145 // vmovd (%r9,%rdx,4),%xmm3
- .byte 233,107,255,255,255 // jmpq 1e60 <_sk_load_tables_hsw+0x10>
+ .byte 233,107,255,255,255 // jmpq 1ff8 <_sk_load_tables_hsw+0x10>
.byte 196,193,121,110,68,145,8 // vmovd 0x8(%r9,%rdx,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
.byte 196,227,117,2,216,4 // vpblendd $0x4,%ymm0,%ymm1,%ymm3
.byte 196,193,122,126,4,145 // vmovq (%r9,%rdx,4),%xmm0
.byte 196,227,101,2,216,3 // vpblendd $0x3,%ymm0,%ymm3,%ymm3
- .byte 233,68,255,255,255 // jmpq 1e60 <_sk_load_tables_hsw+0x10>
+ .byte 233,68,255,255,255 // jmpq 1ff8 <_sk_load_tables_hsw+0x10>
.byte 196,193,121,110,68,145,24 // vmovd 0x18(%r9,%rdx,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -18599,9 +18873,9 @@ _sk_load_tables_hsw:
.byte 196,227,101,56,216,1 // vinserti128 $0x1,%xmm0,%ymm3,%ymm3
.byte 196,193,122,111,4,145 // vmovdqu (%r9,%rdx,4),%xmm0
.byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- .byte 233,245,254,255,255 // jmpq 1e60 <_sk_load_tables_hsw+0x10>
+ .byte 233,245,254,255,255 // jmpq 1ff8 <_sk_load_tables_hsw+0x10>
.byte 144 // nop
- .byte 126,255 // jle 1f6d <_sk_load_tables_hsw+0x11d>
+ .byte 126,255 // jle 2105 <_sk_load_tables_hsw+0x11d>
.byte 255 // (bad)
.byte 255,159,255,255,255,137 // lcall *-0x76000001(%rdi)
.byte 255 // (bad)
@@ -18629,7 +18903,7 @@ _sk_load_tables_u16_be_hsw:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,201,0,0,0 // jne 2067 <_sk_load_tables_u16_be_hsw+0xdf>
+ .byte 15,133,201,0,0,0 // jne 21ff <_sk_load_tables_u16_be_hsw+0xdf>
.byte 196,1,121,16,4,81 // vmovupd (%r9,%r10,2),%xmm8
.byte 196,129,121,16,84,81,16 // vmovupd 0x10(%r9,%r10,2),%xmm2
.byte 196,129,121,16,92,81,32 // vmovupd 0x20(%r9,%r10,2),%xmm3
@@ -18645,7 +18919,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1
.byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2
.byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8
- .byte 197,121,111,21,161,151,2,0 // vmovdqa 0x297a1(%rip),%xmm10 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,121,111,21,9,156,2,0 // vmovdqa 0x29c09(%rip),%xmm10 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -18667,36 +18941,36 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3
.byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,54,142,2,0 // vbroadcastss 0x28e36(%rip),%ymm8 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,98,125,24,5,146,146,2,0 // vbroadcastss 0x29292(%rip),%ymm8 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,123,16,4,81 // vmovsd (%r9,%r10,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 20cd <_sk_load_tables_u16_be_hsw+0x145>
+ .byte 116,85 // je 2265 <_sk_load_tables_u16_be_hsw+0x145>
.byte 196,1,57,22,68,81,8 // vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 20cd <_sk_load_tables_u16_be_hsw+0x145>
+ .byte 114,72 // jb 2265 <_sk_load_tables_u16_be_hsw+0x145>
.byte 196,129,123,16,84,81,16 // vmovsd 0x10(%r9,%r10,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 20da <_sk_load_tables_u16_be_hsw+0x152>
+ .byte 116,72 // je 2272 <_sk_load_tables_u16_be_hsw+0x152>
.byte 196,129,105,22,84,81,24 // vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 20da <_sk_load_tables_u16_be_hsw+0x152>
+ .byte 114,59 // jb 2272 <_sk_load_tables_u16_be_hsw+0x152>
.byte 196,129,123,16,92,81,32 // vmovsd 0x20(%r9,%r10,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,9,255,255,255 // je 1fb9 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 15,132,9,255,255,255 // je 2151 <_sk_load_tables_u16_be_hsw+0x31>
.byte 196,129,97,22,92,81,40 // vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,248,254,255,255 // jb 1fb9 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 15,130,248,254,255,255 // jb 2151 <_sk_load_tables_u16_be_hsw+0x31>
.byte 196,1,122,126,76,81,48 // vmovq 0x30(%r9,%r10,2),%xmm9
- .byte 233,236,254,255,255 // jmpq 1fb9 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,236,254,255,255 // jmpq 2151 <_sk_load_tables_u16_be_hsw+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,223,254,255,255 // jmpq 1fb9 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,223,254,255,255 // jmpq 2151 <_sk_load_tables_u16_be_hsw+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,214,254,255,255 // jmpq 1fb9 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,214,254,255,255 // jmpq 2151 <_sk_load_tables_u16_be_hsw+0x31>
HIDDEN _sk_load_tables_rgb_u16_be_hsw
.globl _sk_load_tables_rgb_u16_be_hsw
@@ -18706,7 +18980,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,193,0,0,0 // jne 21b6 <_sk_load_tables_rgb_u16_be_hsw+0xd3>
+ .byte 15,133,193,0,0,0 // jne 234e <_sk_load_tables_rgb_u16_be_hsw+0xd3>
.byte 196,129,122,111,4,81 // vmovdqu (%r9,%r10,2),%xmm0
.byte 196,129,122,111,84,81,12 // vmovdqu 0xc(%r9,%r10,2),%xmm2
.byte 196,129,122,111,76,81,24 // vmovdqu 0x18(%r9,%r10,2),%xmm1
@@ -18727,7 +19001,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
.byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2
.byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,49,150,2,0 // vmovdqa 0x29631(%rip),%xmm9 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,121,111,13,153,154,2,0 // vmovdqa 0x29a99(%rip),%xmm9 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
@@ -18744,48 +19018,48 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 196,98,125,51,194 // vpmovzxwd %xmm2,%ymm8
.byte 196,162,101,146,20,128 // vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,80,140,2,0 // vbroadcastss 0x28c50(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,172,144,2,0 // vbroadcastss 0x290ac(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0
.byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 21cf <_sk_load_tables_rgb_u16_be_hsw+0xec>
- .byte 233,90,255,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 117,5 // jne 2367 <_sk_load_tables_rgb_u16_be_hsw+0xec>
+ .byte 233,90,255,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
.byte 196,129,121,110,76,81,6 // vmovd 0x6(%r9,%r10,2),%xmm1
.byte 196,1,113,196,68,81,10,2 // vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 21fe <_sk_load_tables_rgb_u16_be_hsw+0x11b>
+ .byte 114,26 // jb 2396 <_sk_load_tables_rgb_u16_be_hsw+0x11b>
.byte 196,129,121,110,76,81,12 // vmovd 0xc(%r9,%r10,2),%xmm1
.byte 196,129,113,196,84,81,16,2 // vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 2203 <_sk_load_tables_rgb_u16_be_hsw+0x120>
- .byte 233,43,255,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,38,255,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 117,10 // jne 239b <_sk_load_tables_rgb_u16_be_hsw+0x120>
+ .byte 233,43,255,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,38,255,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
.byte 196,129,121,110,76,81,18 // vmovd 0x12(%r9,%r10,2),%xmm1
.byte 196,1,113,196,76,81,22,2 // vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 2232 <_sk_load_tables_rgb_u16_be_hsw+0x14f>
+ .byte 114,26 // jb 23ca <_sk_load_tables_rgb_u16_be_hsw+0x14f>
.byte 196,129,121,110,76,81,24 // vmovd 0x18(%r9,%r10,2),%xmm1
.byte 196,129,113,196,76,81,28,2 // vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 2237 <_sk_load_tables_rgb_u16_be_hsw+0x154>
- .byte 233,247,254,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,242,254,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 117,10 // jne 23cf <_sk_load_tables_rgb_u16_be_hsw+0x154>
+ .byte 233,247,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,242,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
.byte 196,129,121,110,92,81,30 // vmovd 0x1e(%r9,%r10,2),%xmm3
.byte 196,1,97,196,92,81,34,2 // vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 2260 <_sk_load_tables_rgb_u16_be_hsw+0x17d>
+ .byte 114,20 // jb 23f8 <_sk_load_tables_rgb_u16_be_hsw+0x17d>
.byte 196,129,121,110,92,81,36 // vmovd 0x24(%r9,%r10,2),%xmm3
.byte 196,129,97,196,92,81,40,2 // vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- .byte 233,201,254,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,196,254,255,255 // jmpq 2129 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,201,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,196,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
HIDDEN _sk_byte_tables_hsw
.globl _sk_byte_tables_hsw
FUNCTION(_sk_byte_tables_hsw)
_sk_byte_tables_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,192,139,2,0 // vbroadcastss 0x28bc0(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,28,144,2,0 // vbroadcastss 0x2901c(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -18907,7 +19181,7 @@ _sk_byte_tables_hsw:
.byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,169,137,2,0 // vbroadcastss 0x289a9(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,5,142,2,0 // vbroadcastss 0x28e05(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -19023,7 +19297,7 @@ _sk_byte_tables_rgb_hsw:
.byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,145,135,2,0 // vbroadcastss 0x28791(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,237,139,2,0 // vbroadcastss 0x28bed(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -19122,33 +19396,33 @@ _sk_parametric_r_hsw:
.byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10
.byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,135,134,2,0 // vbroadcastss 0x28687(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,98,125,24,45,130,134,2,0 // vbroadcastss 0x28682(%rip),%ymm13 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,227,138,2,0 // vbroadcastss 0x28ae3(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,45,222,138,2,0 // vbroadcastss 0x28ade(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,216,133,2,0 // vbroadcastss 0x285d8(%rip),%ymm13 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,45,52,138,2,0 // vbroadcastss 0x28a34(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,106,134,2,0 // vbroadcastss 0x2866a(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,198,138,2,0 // vbroadcastss 0x28ac6(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,96,134,2,0 // vbroadcastss 0x28660(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,188,138,2,0 // vbroadcastss 0x28abc(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,86,134,2,0 // vbroadcastss 0x28656(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,178,138,2,0 // vbroadcastss 0x28ab2(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,76,134,2,0 // vbroadcastss 0x2864c(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,168,138,2,0 // vbroadcastss 0x28aa8(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,45,134,2,0 // vbroadcastss 0x2862d(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,137,138,2,0 // vbroadcastss 0x28a89(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,35,134,2,0 // vbroadcastss 0x28623(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,127,138,2,0 // vbroadcastss 0x28a7f(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11
- .byte 196,226,125,24,5,25,134,2,0 // vbroadcastss 0x28619(%rip),%ymm0 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,5,117,138,2,0 // vbroadcastss 0x28a75(%rip),%ymm0 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,15,134,2,0 // vbroadcastss 0x2860f(%rip),%ymm10 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,21,107,138,2,0 // vbroadcastss 0x28a6b(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0
.byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,21,2,134,2,0 // vbroadcastss 0x28602(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,94,138,2,0 // vbroadcastss 0x28a5e(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19156,7 +19430,7 @@ _sk_parametric_r_hsw:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,25,133,2,0 // vbroadcastss 0x28519(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,117,137,2,0 // vbroadcastss 0x28975(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19176,33 +19450,33 @@ _sk_parametric_g_hsw:
.byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10
.byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,97,133,2,0 // vbroadcastss 0x28561(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,98,125,24,45,92,133,2,0 // vbroadcastss 0x2855c(%rip),%ymm13 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,189,137,2,0 // vbroadcastss 0x289bd(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,45,184,137,2,0 // vbroadcastss 0x289b8(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,178,132,2,0 // vbroadcastss 0x284b2(%rip),%ymm13 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,45,14,137,2,0 // vbroadcastss 0x2890e(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,68,133,2,0 // vbroadcastss 0x28544(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,160,137,2,0 // vbroadcastss 0x289a0(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,58,133,2,0 // vbroadcastss 0x2853a(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,150,137,2,0 // vbroadcastss 0x28996(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,48,133,2,0 // vbroadcastss 0x28530(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,140,137,2,0 // vbroadcastss 0x2898c(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,38,133,2,0 // vbroadcastss 0x28526(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,130,137,2,0 // vbroadcastss 0x28982(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,7,133,2,0 // vbroadcastss 0x28507(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,99,137,2,0 // vbroadcastss 0x28963(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,253,132,2,0 // vbroadcastss 0x284fd(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,89,137,2,0 // vbroadcastss 0x28959(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11
- .byte 196,226,125,24,13,243,132,2,0 // vbroadcastss 0x284f3(%rip),%ymm1 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,13,79,137,2,0 // vbroadcastss 0x2894f(%rip),%ymm1 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,233,132,2,0 // vbroadcastss 0x284e9(%rip),%ymm10 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,21,69,137,2,0 // vbroadcastss 0x28945(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
- .byte 196,98,125,24,21,220,132,2,0 // vbroadcastss 0x284dc(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,56,137,2,0 // vbroadcastss 0x28938(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19210,7 +19484,7 @@ _sk_parametric_g_hsw:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,243,131,2,0 // vbroadcastss 0x283f3(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,79,136,2,0 // vbroadcastss 0x2884f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19230,33 +19504,33 @@ _sk_parametric_b_hsw:
.byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10
.byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,59,132,2,0 // vbroadcastss 0x2843b(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,98,125,24,45,54,132,2,0 // vbroadcastss 0x28436(%rip),%ymm13 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,151,136,2,0 // vbroadcastss 0x28897(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,45,146,136,2,0 // vbroadcastss 0x28892(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,140,131,2,0 // vbroadcastss 0x2838c(%rip),%ymm13 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,45,232,135,2,0 // vbroadcastss 0x287e8(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,30,132,2,0 // vbroadcastss 0x2841e(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,122,136,2,0 // vbroadcastss 0x2887a(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,20,132,2,0 // vbroadcastss 0x28414(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,112,136,2,0 // vbroadcastss 0x28870(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,10,132,2,0 // vbroadcastss 0x2840a(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,102,136,2,0 // vbroadcastss 0x28866(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,0,132,2,0 // vbroadcastss 0x28400(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,92,136,2,0 // vbroadcastss 0x2885c(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,225,131,2,0 // vbroadcastss 0x283e1(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,61,136,2,0 // vbroadcastss 0x2883d(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,215,131,2,0 // vbroadcastss 0x283d7(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,51,136,2,0 // vbroadcastss 0x28833(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11
- .byte 196,226,125,24,21,205,131,2,0 // vbroadcastss 0x283cd(%rip),%ymm2 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,21,41,136,2,0 // vbroadcastss 0x28829(%rip),%ymm2 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,195,131,2,0 // vbroadcastss 0x283c3(%rip),%ymm10 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,21,31,136,2,0 // vbroadcastss 0x2881f(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2
.byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2
- .byte 196,98,125,24,21,182,131,2,0 // vbroadcastss 0x283b6(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,18,136,2,0 // vbroadcastss 0x28812(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19264,7 +19538,7 @@ _sk_parametric_b_hsw:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,205,130,2,0 // vbroadcastss 0x282cd(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,41,135,2,0 // vbroadcastss 0x28729(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19284,33 +19558,33 @@ _sk_parametric_a_hsw:
.byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10
.byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,21,131,2,0 // vbroadcastss 0x28315(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,98,125,24,45,16,131,2,0 // vbroadcastss 0x28310(%rip),%ymm13 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,113,135,2,0 // vbroadcastss 0x28771(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,45,108,135,2,0 // vbroadcastss 0x2876c(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,102,130,2,0 // vbroadcastss 0x28266(%rip),%ymm13 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,45,194,134,2,0 // vbroadcastss 0x286c2(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,248,130,2,0 // vbroadcastss 0x282f8(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,84,135,2,0 // vbroadcastss 0x28754(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,238,130,2,0 // vbroadcastss 0x282ee(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,74,135,2,0 // vbroadcastss 0x2874a(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,228,130,2,0 // vbroadcastss 0x282e4(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,64,135,2,0 // vbroadcastss 0x28740(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,218,130,2,0 // vbroadcastss 0x282da(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,54,135,2,0 // vbroadcastss 0x28736(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,187,130,2,0 // vbroadcastss 0x282bb(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,23,135,2,0 // vbroadcastss 0x28717(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,177,130,2,0 // vbroadcastss 0x282b1(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,13,135,2,0 // vbroadcastss 0x2870d(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11
- .byte 196,226,125,24,29,167,130,2,0 // vbroadcastss 0x282a7(%rip),%ymm3 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,29,3,135,2,0 // vbroadcastss 0x28703(%rip),%ymm3 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,157,130,2,0 // vbroadcastss 0x2829d(%rip),%ymm10 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,21,249,134,2,0 // vbroadcastss 0x286f9(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3
.byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3
- .byte 196,98,125,24,21,144,130,2,0 // vbroadcastss 0x28290(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,236,134,2,0 // vbroadcastss 0x286ec(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19318,7 +19592,7 @@ _sk_parametric_a_hsw:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,167,129,2,0 // vbroadcastss 0x281a7(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,3,134,2,0 // vbroadcastss 0x28603(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19337,35 +19611,35 @@ _sk_gamma_hsw:
.byte 197,252,40,241 // vmovaps %ymm1,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,124,91,208 // vcvtdq2ps %ymm0,%ymm10
- .byte 196,98,125,24,29,250,129,2,0 // vbroadcastss 0x281fa(%rip),%ymm11 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,226,125,24,45,245,129,2,0 // vbroadcastss 0x281f5(%rip),%ymm5 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,29,86,134,2,0 // vbroadcastss 0x28656(%rip),%ymm11 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,226,125,24,45,81,134,2,0 // vbroadcastss 0x28651(%rip),%ymm5 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 197,124,84,205 // vandps %ymm5,%ymm0,%ymm9
- .byte 196,226,125,24,37,76,129,2,0 // vbroadcastss 0x2814c(%rip),%ymm4 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,37,168,133,2,0 // vbroadcastss 0x285a8(%rip),%ymm4 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,52,86,228 // vorps %ymm4,%ymm9,%ymm12
- .byte 196,98,125,24,45,223,129,2,0 // vbroadcastss 0x281df(%rip),%ymm13 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,59,134,2,0 // vbroadcastss 0x2863b(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,168,213 // vfmadd213ps %ymm13,%ymm11,%ymm10
- .byte 196,98,125,24,13,213,129,2,0 // vbroadcastss 0x281d5(%rip),%ymm9 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,13,49,134,2,0 // vbroadcastss 0x28631(%rip),%ymm9 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,29,188,209 // vfnmadd231ps %ymm9,%ymm12,%ymm10
.byte 197,124,91,246 // vcvtdq2ps %ymm6,%ymm14
.byte 196,66,37,168,245 // vfmadd213ps %ymm13,%ymm11,%ymm14
.byte 197,124,91,255 // vcvtdq2ps %ymm7,%ymm15
.byte 196,66,37,168,253 // vfmadd213ps %ymm13,%ymm11,%ymm15
- .byte 196,98,125,24,29,185,129,2,0 // vbroadcastss 0x281b9(%rip),%ymm11 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,29,21,134,2,0 // vbroadcastss 0x28615(%rip),%ymm11 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,28,88,227 // vaddps %ymm11,%ymm12,%ymm12
- .byte 196,98,125,24,45,175,129,2,0 // vbroadcastss 0x281af(%rip),%ymm13 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,45,11,134,2,0 // vbroadcastss 0x2860b(%rip),%ymm13 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,20,94,228 // vdivps %ymm12,%ymm13,%ymm12
.byte 196,65,44,92,212 // vsubps %ymm12,%ymm10,%ymm10
.byte 196,98,125,24,32 // vbroadcastss (%rax),%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
.byte 196,67,125,8,194,1 // vroundps $0x1,%ymm10,%ymm8
.byte 196,65,44,92,192 // vsubps %ymm8,%ymm10,%ymm8
- .byte 196,226,125,24,21,139,129,2,0 // vbroadcastss 0x2818b(%rip),%ymm2 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,226,125,24,21,231,133,2,0 // vbroadcastss 0x285e7(%rip),%ymm2 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 197,44,88,210 // vaddps %ymm2,%ymm10,%ymm10
- .byte 196,226,125,24,29,130,129,2,0 // vbroadcastss 0x28182(%rip),%ymm3 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,226,125,24,29,222,133,2,0 // vbroadcastss 0x285de(%rip),%ymm3 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,61,188,211 // vfnmadd231ps %ymm3,%ymm8,%ymm10
- .byte 196,226,125,24,13,120,129,2,0 // vbroadcastss 0x28178(%rip),%ymm1 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,13,212,133,2,0 // vbroadcastss 0x285d4(%rip),%ymm1 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,116,92,192 // vsubps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,5,110,129,2,0 // vbroadcastss 0x2816e(%rip),%ymm0 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,226,125,24,5,202,133,2,0 // vbroadcastss 0x285ca(%rip),%ymm0 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,124,94,192 // vdivps %ymm8,%ymm0,%ymm8
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 197,204,84,245 // vandps %ymm5,%ymm6,%ymm6
@@ -19396,7 +19670,7 @@ _sk_gamma_hsw:
.byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1
.byte 197,252,94,193 // vdivps %ymm1,%ymm0,%ymm0
.byte 197,236,88,192 // vaddps %ymm0,%ymm2,%ymm0
- .byte 196,226,125,24,13,223,128,2,0 // vbroadcastss 0x280df(%rip),%ymm1 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,226,125,24,13,59,133,2,0 // vbroadcastss 0x2853b(%rip),%ymm1 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 197,188,89,209 // vmulps %ymm1,%ymm8,%ymm2
.byte 197,204,89,217 // vmulps %ymm1,%ymm6,%ymm3
.byte 197,252,89,225 // vmulps %ymm1,%ymm0,%ymm4
@@ -19416,26 +19690,26 @@ HIDDEN _sk_lab_to_xyz_hsw
.globl _sk_lab_to_xyz_hsw
FUNCTION(_sk_lab_to_xyz_hsw)
_sk_lab_to_xyz_hsw:
- .byte 196,98,125,24,5,157,128,2,0 // vbroadcastss 0x2809d(%rip),%ymm8 # 2aec4 <_sk_overlay_sse2_8bit+0x503>
- .byte 196,98,125,24,13,0,128,2,0 // vbroadcastss 0x28000(%rip),%ymm9 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
- .byte 196,98,125,24,21,143,128,2,0 // vbroadcastss 0x2808f(%rip),%ymm10 # 2aec8 <_sk_overlay_sse2_8bit+0x507>
+ .byte 196,98,125,24,5,249,132,2,0 // vbroadcastss 0x284f9(%rip),%ymm8 # 2b4b8 <_sk_overlay_sse2_8bit+0x503>
+ .byte 196,98,125,24,13,92,132,2,0 // vbroadcastss 0x2845c(%rip),%ymm9 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,21,235,132,2,0 // vbroadcastss 0x284eb(%rip),%ymm10 # 2b4bc <_sk_overlay_sse2_8bit+0x507>
.byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1
.byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2
- .byte 196,98,125,24,13,128,128,2,0 // vbroadcastss 0x28080(%rip),%ymm9 # 2aecc <_sk_overlay_sse2_8bit+0x50b>
+ .byte 196,98,125,24,13,220,132,2,0 // vbroadcastss 0x284dc(%rip),%ymm9 # 2b4c0 <_sk_overlay_sse2_8bit+0x50b>
.byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9
- .byte 196,226,125,24,5,118,128,2,0 // vbroadcastss 0x28076(%rip),%ymm0 # 2aed0 <_sk_overlay_sse2_8bit+0x50f>
+ .byte 196,226,125,24,5,210,132,2,0 // vbroadcastss 0x284d2(%rip),%ymm0 # 2b4c4 <_sk_overlay_sse2_8bit+0x50f>
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
- .byte 196,98,125,24,5,109,128,2,0 // vbroadcastss 0x2806d(%rip),%ymm8 # 2aed4 <_sk_overlay_sse2_8bit+0x513>
+ .byte 196,98,125,24,5,201,132,2,0 // vbroadcastss 0x284c9(%rip),%ymm8 # 2b4c8 <_sk_overlay_sse2_8bit+0x513>
.byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8
- .byte 196,98,125,24,13,99,128,2,0 // vbroadcastss 0x28063(%rip),%ymm9 # 2aed8 <_sk_overlay_sse2_8bit+0x517>
+ .byte 196,98,125,24,13,191,132,2,0 // vbroadcastss 0x284bf(%rip),%ymm9 # 2b4cc <_sk_overlay_sse2_8bit+0x517>
.byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9
.byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
- .byte 196,226,125,24,21,80,128,2,0 // vbroadcastss 0x28050(%rip),%ymm2 # 2aedc <_sk_overlay_sse2_8bit+0x51b>
+ .byte 196,226,125,24,21,172,132,2,0 // vbroadcastss 0x284ac(%rip),%ymm2 # 2b4d0 <_sk_overlay_sse2_8bit+0x51b>
.byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10
- .byte 196,98,125,24,29,70,128,2,0 // vbroadcastss 0x28046(%rip),%ymm11 # 2aee0 <_sk_overlay_sse2_8bit+0x51f>
+ .byte 196,98,125,24,29,162,132,2,0 // vbroadcastss 0x284a2(%rip),%ymm11 # 2b4d4 <_sk_overlay_sse2_8bit+0x51f>
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,37,60,128,2,0 // vbroadcastss 0x2803c(%rip),%ymm12 # 2aee4 <_sk_overlay_sse2_8bit+0x523>
+ .byte 196,98,125,24,37,152,132,2,0 // vbroadcastss 0x28498(%rip),%ymm12 # 2b4d8 <_sk_overlay_sse2_8bit+0x523>
.byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8
.byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -19450,9 +19724,9 @@ _sk_lab_to_xyz_hsw:
.byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
.byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- .byte 196,226,125,24,5,241,127,2,0 // vbroadcastss 0x27ff1(%rip),%ymm0 # 2aee8 <_sk_overlay_sse2_8bit+0x527>
+ .byte 196,226,125,24,5,77,132,2,0 // vbroadcastss 0x2844d(%rip),%ymm0 # 2b4dc <_sk_overlay_sse2_8bit+0x527>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,232,127,2,0 // vbroadcastss 0x27fe8(%rip),%ymm8 # 2aeec <_sk_overlay_sse2_8bit+0x52b>
+ .byte 196,98,125,24,5,68,132,2,0 // vbroadcastss 0x28444(%rip),%ymm8 # 2b4e0 <_sk_overlay_sse2_8bit+0x52b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19469,12 +19743,12 @@ _sk_load_a8_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,53 // jne 2f5b <_sk_load_a8_hsw+0x4e>
+ .byte 117,53 // jne 30f3 <_sk_load_a8_hsw+0x4e>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,92,136,2,0 // vpand 0x2885c(%rip),%xmm0,%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,249,219,5,196,140,2,0 // vpand 0x28cc4(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,50,127,2,0 // vbroadcastss 0x27f32(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,142,131,2,0 // vbroadcastss 0x2838e(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -19487,15 +19761,15 @@ _sk_load_a8_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,189 // ja 2f2c <_sk_load_a8_hsw+0x1f>
+ .byte 119,189 // ja 30c4 <_sk_load_a8_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 2ff4 <_sk_load_a8_hsw+0xe7>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 318c <_sk_load_a8_hsw+0xe7>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,158 // jmp 2f2c <_sk_load_a8_hsw+0x1f>
+ .byte 235,158 // jmp 30c4 <_sk_load_a8_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -19503,7 +19777,7 @@ _sk_load_a8_hsw:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,118,255,255,255 // jmpq 2f2c <_sk_load_a8_hsw+0x1f>
+ .byte 233,118,255,255,255 // jmpq 30c4 <_sk_load_a8_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -19514,7 +19788,7 @@ _sk_load_a8_hsw:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,59,255,255,255 // jmpq 2f2c <_sk_load_a8_hsw+0x1f>
+ .byte 233,59,255,255,255 // jmpq 30c4 <_sk_load_a8_hsw+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -19548,12 +19822,12 @@ _sk_load_a8_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,53 // jne 305e <_sk_load_a8_dst_hsw+0x4e>
+ .byte 117,53 // jne 31f6 <_sk_load_a8_dst_hsw+0x4e>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,89,135,2,0 // vpand 0x28759(%rip),%xmm4,%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,217,219,37,193,139,2,0 // vpand 0x28bc1(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,47,126,2,0 // vbroadcastss 0x27e2f(%rip),%ymm5 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,45,139,130,2,0 // vbroadcastss 0x2828b(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -19566,15 +19840,15 @@ _sk_load_a8_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,189 // ja 302f <_sk_load_a8_dst_hsw+0x1f>
+ .byte 119,189 // ja 31c7 <_sk_load_a8_dst_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 30f4 <_sk_load_a8_dst_hsw+0xe4>
+ .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 328c <_sk_load_a8_dst_hsw+0xe4>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,158 // jmp 302f <_sk_load_a8_dst_hsw+0x1f>
+ .byte 235,158 // jmp 31c7 <_sk_load_a8_dst_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -19582,7 +19856,7 @@ _sk_load_a8_dst_hsw:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,118,255,255,255 // jmpq 302f <_sk_load_a8_dst_hsw+0x1f>
+ .byte 233,118,255,255,255 // jmpq 31c7 <_sk_load_a8_dst_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -19593,7 +19867,7 @@ _sk_load_a8_dst_hsw:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,59,255,255,255 // jmpq 302f <_sk_load_a8_dst_hsw+0x1f>
+ .byte 233,59,255,255,255 // jmpq 31c7 <_sk_load_a8_dst_hsw+0x1f>
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -19654,7 +19928,7 @@ _sk_gather_a8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,178,124,2,0 // vbroadcastss 0x27cb2(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,14,129,2,0 // vbroadcastss 0x2810e(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -19673,14 +19947,14 @@ _sk_store_a8_hsw:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,57,124,2,0 // vbroadcastss 0x27c39(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,149,128,2,0 // vbroadcastss 0x28095(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 3221 <_sk_store_a8_hsw+0x47>
+ .byte 117,11 // jne 33b9 <_sk_store_a8_hsw+0x47>
.byte 196,65,123,17,4,25 // vmovsd %xmm8,(%r9,%rbx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -19689,25 +19963,25 @@ _sk_store_a8_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 321c <_sk_store_a8_hsw+0x42>
+ .byte 119,235 // ja 33b4 <_sk_store_a8_hsw+0x42>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,87,0,0,0 // lea 0x57(%rip),%r11 # 3298 <_sk_store_a8_hsw+0xbe>
+ .byte 76,141,29,87,0,0,0 // lea 0x57(%rip),%r11 # 3430 <_sk_store_a8_hsw+0xbe>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,20,4,25,0 // vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,201 // jmp 321c <_sk_store_a8_hsw+0x42>
+ .byte 235,201 // jmp 33b4 <_sk_store_a8_hsw+0x42>
.byte 196,67,121,20,68,25,2,4 // vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- .byte 196,98,57,0,5,60,133,2,0 // vpshufb 0x2853c(%rip),%xmm8,%xmm8 # 2b7a0 <_sk_overlay_sse2_8bit+0xddf>
+ .byte 196,98,57,0,5,164,137,2,0 // vpshufb 0x289a4(%rip),%xmm8,%xmm8 # 2bda0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 196,67,121,21,4,25,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,175 // jmp 321c <_sk_store_a8_hsw+0x42>
+ .byte 235,175 // jmp 33b4 <_sk_store_a8_hsw+0x42>
.byte 196,67,121,20,68,25,6,12 // vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
.byte 196,67,121,20,68,25,5,10 // vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
.byte 196,67,121,20,68,25,4,8 // vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- .byte 196,98,57,0,5,34,133,2,0 // vpshufb 0x28522(%rip),%xmm8,%xmm8 # 2b7b0 <_sk_overlay_sse2_8bit+0xdef>
+ .byte 196,98,57,0,5,138,137,2,0 // vpshufb 0x2898a(%rip),%xmm8,%xmm8 # 2bdb0 <_sk_overlay_sse2_8bit+0xdfb>
.byte 196,65,121,126,4,25 // vmovd %xmm8,(%r9,%rbx,1)
- .byte 235,134 // jmp 321c <_sk_store_a8_hsw+0x42>
+ .byte 235,134 // jmp 33b4 <_sk_store_a8_hsw+0x42>
.byte 102,144 // xchg %ax,%ax
.byte 178,255 // mov $0xff,%dl
.byte 255 // (bad)
@@ -19741,15 +20015,15 @@ _sk_load_g8_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,58 // jne 3307 <_sk_load_g8_hsw+0x53>
+ .byte 117,58 // jne 349f <_sk_load_g8_hsw+0x53>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,181,132,2,0 // vpand 0x284b5(%rip),%xmm0,%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,249,219,5,29,137,2,0 // vpand 0x2891d(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,139,123,2,0 // vbroadcastss 0x27b8b(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,231,127,2,0 // vbroadcastss 0x27fe7(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,8,123,2,0 // vbroadcastss 0x27b08(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,100,127,2,0 // vbroadcastss 0x27f64(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -19759,15 +20033,15 @@ _sk_load_g8_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,184 // ja 32d3 <_sk_load_g8_hsw+0x1f>
+ .byte 119,184 // ja 346b <_sk_load_g8_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 33a0 <_sk_load_g8_hsw+0xec>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 3538 <_sk_load_g8_hsw+0xec>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,153 // jmp 32d3 <_sk_load_g8_hsw+0x1f>
+ .byte 235,153 // jmp 346b <_sk_load_g8_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -19775,7 +20049,7 @@ _sk_load_g8_hsw:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,113,255,255,255 // jmpq 32d3 <_sk_load_g8_hsw+0x1f>
+ .byte 233,113,255,255,255 // jmpq 346b <_sk_load_g8_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -19786,7 +20060,7 @@ _sk_load_g8_hsw:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,54,255,255,255 // jmpq 32d3 <_sk_load_g8_hsw+0x1f>
+ .byte 233,54,255,255,255 // jmpq 346b <_sk_load_g8_hsw+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -19820,15 +20094,15 @@ _sk_load_g8_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,58 // jne 340f <_sk_load_g8_dst_hsw+0x53>
+ .byte 117,58 // jne 35a7 <_sk_load_g8_dst_hsw+0x53>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,173,131,2,0 // vpand 0x283ad(%rip),%xmm4,%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,217,219,37,21,136,2,0 // vpand 0x28815(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,131,122,2,0 // vbroadcastss 0x27a83(%rip),%ymm5 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,45,223,126,2,0 // vbroadcastss 0x27edf(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,0,122,2,0 // vbroadcastss 0x27a00(%rip),%ymm7 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,61,92,126,2,0 // vbroadcastss 0x27e5c(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 91 // pop %rbx
@@ -19838,15 +20112,15 @@ _sk_load_g8_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,184 // ja 33db <_sk_load_g8_dst_hsw+0x1f>
+ .byte 119,184 // ja 3573 <_sk_load_g8_dst_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 34a8 <_sk_load_g8_dst_hsw+0xec>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 3640 <_sk_load_g8_dst_hsw+0xec>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,153 // jmp 33db <_sk_load_g8_dst_hsw+0x1f>
+ .byte 235,153 // jmp 3573 <_sk_load_g8_dst_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -19854,7 +20128,7 @@ _sk_load_g8_dst_hsw:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,113,255,255,255 // jmpq 33db <_sk_load_g8_dst_hsw+0x1f>
+ .byte 233,113,255,255,255 // jmpq 3573 <_sk_load_g8_dst_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -19865,7 +20139,7 @@ _sk_load_g8_dst_hsw:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,54,255,255,255 // jmpq 33db <_sk_load_g8_dst_hsw+0x1f>
+ .byte 233,54,255,255,255 // jmpq 3573 <_sk_load_g8_dst_hsw+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -19927,10 +20201,10 @@ _sk_gather_g8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,254,120,2,0 // vbroadcastss 0x278fe(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,90,125,2,0 // vbroadcastss 0x27d5a(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,123,120,2,0 // vbroadcastss 0x2787b(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,215,124,2,0 // vbroadcastss 0x27cd7(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -19948,26 +20222,26 @@ _sk_load_565_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,115 // jne 3622 <_sk_load_565_hsw+0x8f>
+ .byte 117,115 // jne 37ba <_sk_load_565_hsw+0x8f>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,185,120,2,0 // vpbroadcastd 0x278b9(%rip),%ymm0 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,88,5,21,125,2,0 // vpbroadcastd 0x27d15(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,172,120,2,0 // vbroadcastss 0x278ac(%rip),%ymm1 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,13,8,125,2,0 // vbroadcastss 0x27d08(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,163,120,2,0 // vpbroadcastd 0x278a3(%rip),%ymm1 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,88,13,255,124,2,0 // vpbroadcastd 0x27cff(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,150,120,2,0 // vbroadcastss 0x27896(%rip),%ymm3 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,29,242,124,2,0 // vbroadcastss 0x27cf2(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,141,120,2,0 // vpbroadcastd 0x2788d(%rip),%ymm3 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,88,29,233,124,2,0 // vpbroadcastd 0x27ce9(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,128,120,2,0 // vbroadcastss 0x27880(%rip),%ymm3 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,29,220,124,2,0 // vbroadcastss 0x27cdc(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,229,119,2,0 // vbroadcastss 0x277e5(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,65,124,2,0 // vbroadcastss 0x27c41(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -19975,27 +20249,27 @@ _sk_load_565_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,123,255,255,255 // ja 35b5 <_sk_load_565_hsw+0x22>
+ .byte 15,135,123,255,255,255 // ja 374d <_sk_load_565_hsw+0x22>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 36a8 <_sk_load_565_hsw+0x115>
+ .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 3840 <_sk_load_565_hsw+0x115>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,89,255,255,255 // jmpq 35b5 <_sk_load_565_hsw+0x22>
+ .byte 233,89,255,255,255 // jmpq 374d <_sk_load_565_hsw+0x22>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,60,255,255,255 // jmpq 35b5 <_sk_load_565_hsw+0x22>
+ .byte 233,60,255,255,255 // jmpq 374d <_sk_load_565_hsw+0x22>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,15,255,255,255 // jmpq 35b5 <_sk_load_565_hsw+0x22>
+ .byte 233,15,255,255,255 // jmpq 374d <_sk_load_565_hsw+0x22>
.byte 102,144 // xchg %ax,%ax
.byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -20029,26 +20303,26 @@ _sk_load_565_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,115 // jne 3753 <_sk_load_565_dst_hsw+0x8f>
+ .byte 117,115 // jne 38eb <_sk_load_565_dst_hsw+0x8f>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 196,226,125,51,244 // vpmovzxwd %xmm4,%ymm6
- .byte 196,226,125,88,37,136,119,2,0 // vpbroadcastd 0x27788(%rip),%ymm4 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,88,37,228,123,2,0 // vpbroadcastd 0x27be4(%rip),%ymm4 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,205,219,228 // vpand %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,123,119,2,0 // vbroadcastss 0x2777b(%rip),%ymm5 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,45,215,123,2,0 // vbroadcastss 0x27bd7(%rip),%ymm5 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,114,119,2,0 // vpbroadcastd 0x27772(%rip),%ymm5 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,88,45,206,123,2,0 // vpbroadcastd 0x27bce(%rip),%ymm5 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,205,219,237 // vpand %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,101,119,2,0 // vbroadcastss 0x27765(%rip),%ymm7 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,61,193,123,2,0 // vbroadcastss 0x27bc1(%rip),%ymm7 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,88,61,92,119,2,0 // vpbroadcastd 0x2775c(%rip),%ymm7 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,88,61,184,123,2,0 // vpbroadcastd 0x27bb8(%rip),%ymm7 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,205,219,247 // vpand %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,79,119,2,0 // vbroadcastss 0x2774f(%rip),%ymm7 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,61,171,123,2,0 // vbroadcastss 0x27bab(%rip),%ymm7 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,180,118,2,0 // vbroadcastss 0x276b4(%rip),%ymm7 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,61,16,123,2,0 // vbroadcastss 0x27b10(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -20056,27 +20330,27 @@ _sk_load_565_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,123,255,255,255 // ja 36e6 <_sk_load_565_dst_hsw+0x22>
+ .byte 15,135,123,255,255,255 // ja 387e <_sk_load_565_dst_hsw+0x22>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 37d8 <_sk_load_565_dst_hsw+0x114>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3970 <_sk_load_565_dst_hsw+0x114>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,89,255,255,255 // jmpq 36e6 <_sk_load_565_dst_hsw+0x22>
+ .byte 233,89,255,255,255 // jmpq 387e <_sk_load_565_dst_hsw+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,60,255,255,255 // jmpq 36e6 <_sk_load_565_dst_hsw+0x22>
+ .byte 233,60,255,255,255 // jmpq 387e <_sk_load_565_dst_hsw+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,15,255,255,255 // jmpq 36e6 <_sk_load_565_dst_hsw+0x22>
+ .byte 233,15,255,255,255 // jmpq 387e <_sk_load_565_dst_hsw+0x22>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -20139,23 +20413,23 @@ _sk_gather_565_hsw:
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,215,117,2,0 // vpbroadcastd 0x275d7(%rip),%ymm0 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,88,5,51,122,2,0 // vpbroadcastd 0x27a33(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,202,117,2,0 // vbroadcastss 0x275ca(%rip),%ymm1 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,13,38,122,2,0 // vbroadcastss 0x27a26(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,193,117,2,0 // vpbroadcastd 0x275c1(%rip),%ymm1 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,88,13,29,122,2,0 // vpbroadcastd 0x27a1d(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,180,117,2,0 // vbroadcastss 0x275b4(%rip),%ymm3 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,29,16,122,2,0 // vbroadcastss 0x27a10(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,171,117,2,0 // vpbroadcastd 0x275ab(%rip),%ymm3 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,88,29,7,122,2,0 // vpbroadcastd 0x27a07(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,158,117,2,0 // vbroadcastss 0x2759e(%rip),%ymm3 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,29,250,121,2,0 // vbroadcastss 0x279fa(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,3,117,2,0 // vbroadcastss 0x27503(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,95,121,2,0 // vbroadcastss 0x2795f(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_hsw
@@ -20170,11 +20444,11 @@ _sk_store_565_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,205,117,2,0 // vbroadcastss 0x275cd(%rip),%ymm8 # 2aef0 <_sk_overlay_sse2_8bit+0x52f>
+ .byte 196,98,125,24,5,41,122,2,0 // vbroadcastss 0x27a29(%rip),%ymm8 # 2b4e4 <_sk_overlay_sse2_8bit+0x52f>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9
- .byte 196,98,125,24,21,184,117,2,0 // vbroadcastss 0x275b8(%rip),%ymm10 # 2aef4 <_sk_overlay_sse2_8bit+0x533>
+ .byte 196,98,125,24,21,20,122,2,0 // vbroadcastss 0x27a14(%rip),%ymm10 # 2b4e8 <_sk_overlay_sse2_8bit+0x533>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10
@@ -20185,7 +20459,7 @@ _sk_store_565_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 397b <_sk_store_565_hsw+0x78>
+ .byte 117,11 // jne 3b13 <_sk_store_565_hsw+0x78>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20194,22 +20468,22 @@ _sk_store_565_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 3976 <_sk_store_565_hsw+0x73>
+ .byte 119,235 // ja 3b0e <_sk_store_565_hsw+0x73>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 39d8 <_sk_store_565_hsw+0xd5>
+ .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 3b70 <_sk_store_565_hsw+0xd5>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp 3976 <_sk_store_565_hsw+0x73>
+ .byte 235,206 // jmp 3b0e <_sk_store_565_hsw+0x73>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp 3976 <_sk_store_565_hsw+0x73>
+ .byte 235,190 // jmp 3b0e <_sk_store_565_hsw+0x73>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp 3976 <_sk_store_565_hsw+0x73>
+ .byte 235,158 // jmp 3b0e <_sk_store_565_hsw+0x73>
.byte 199 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -20227,7 +20501,7 @@ _sk_store_565_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,224 // callq ffffffffe10039f0 <_sk_overlay_sse2_8bit+0xffffffffe0fd902f>
+ .byte 232,255,255,255,224 // callq ffffffffe1003b88 <_sk_overlay_sse2_8bit+0xffffffffe0fd8bd3>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -20245,28 +20519,28 @@ _sk_load_4444_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,139,0,0,0 // jne 3a9f <_sk_load_4444_hsw+0xab>
+ .byte 15,133,139,0,0,0 // jne 3c37 <_sk_load_4444_hsw+0xab>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,208,116,2,0 // vpbroadcastd 0x274d0(%rip),%ymm0 # 2aef8 <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,88,5,44,121,2,0 // vpbroadcastd 0x2792c(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,195,116,2,0 // vbroadcastss 0x274c3(%rip),%ymm1 # 2aefc <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,13,31,121,2,0 // vbroadcastss 0x2791f(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,186,116,2,0 // vpbroadcastd 0x274ba(%rip),%ymm1 # 2af00 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,88,13,22,121,2,0 // vpbroadcastd 0x27916(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,173,116,2,0 // vbroadcastss 0x274ad(%rip),%ymm2 # 2af04 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,21,9,121,2,0 // vbroadcastss 0x27909(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,164,116,2,0 // vpbroadcastd 0x274a4(%rip),%ymm2 # 2af08 <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,88,21,0,121,2,0 // vpbroadcastd 0x27900(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,151,116,2,0 // vbroadcastss 0x27497(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,243,120,2,0 // vbroadcastss 0x278f3(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,141,116,2,0 // vpbroadcastd 0x2748d(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,88,5,233,120,2,0 // vpbroadcastd 0x278e9(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,127,116,2,0 // vbroadcastss 0x2747f(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,219,120,2,0 // vbroadcastss 0x278db(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20276,27 +20550,27 @@ _sk_load_4444_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,99,255,255,255 // ja 3a1a <_sk_load_4444_hsw+0x26>
+ .byte 15,135,99,255,255,255 // ja 3bb2 <_sk_load_4444_hsw+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3b24 <_sk_load_4444_hsw+0x130>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3cbc <_sk_load_4444_hsw+0x130>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,65,255,255,255 // jmpq 3a1a <_sk_load_4444_hsw+0x26>
+ .byte 233,65,255,255,255 // jmpq 3bb2 <_sk_load_4444_hsw+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,36,255,255,255 // jmpq 3a1a <_sk_load_4444_hsw+0x26>
+ .byte 233,36,255,255,255 // jmpq 3bb2 <_sk_load_4444_hsw+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,247,254,255,255 // jmpq 3a1a <_sk_load_4444_hsw+0x26>
+ .byte 233,247,254,255,255 // jmpq 3bb2 <_sk_load_4444_hsw+0x26>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -20331,28 +20605,28 @@ _sk_load_4444_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,139,0,0,0 // jne 3beb <_sk_load_4444_dst_hsw+0xab>
+ .byte 15,133,139,0,0,0 // jne 3d83 <_sk_load_4444_dst_hsw+0xab>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 196,226,125,51,252 // vpmovzxwd %xmm4,%ymm7
- .byte 196,226,125,88,37,132,115,2,0 // vpbroadcastd 0x27384(%rip),%ymm4 # 2aef8 <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,88,37,224,119,2,0 // vpbroadcastd 0x277e0(%rip),%ymm4 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
.byte 197,197,219,228 // vpand %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,119,115,2,0 // vbroadcastss 0x27377(%rip),%ymm5 # 2aefc <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,45,211,119,2,0 // vbroadcastss 0x277d3(%rip),%ymm5 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,110,115,2,0 // vpbroadcastd 0x2736e(%rip),%ymm5 # 2af00 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,88,45,202,119,2,0 // vpbroadcastd 0x277ca(%rip),%ymm5 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,197,219,237 // vpand %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,97,115,2,0 // vbroadcastss 0x27361(%rip),%ymm6 # 2af04 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,53,189,119,2,0 // vbroadcastss 0x277bd(%rip),%ymm6 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,88,53,88,115,2,0 // vpbroadcastd 0x27358(%rip),%ymm6 # 2af08 <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,88,53,180,119,2,0 // vpbroadcastd 0x277b4(%rip),%ymm6 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
.byte 197,197,219,246 // vpand %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,75,115,2,0 // vbroadcastss 0x2734b(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,167,119,2,0 // vbroadcastss 0x277a7(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,88,5,65,115,2,0 // vpbroadcastd 0x27341(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,88,5,157,119,2,0 // vpbroadcastd 0x2779d(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,69,219,248 // vpand %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,51,115,2,0 // vbroadcastss 0x27333(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,143,119,2,0 // vbroadcastss 0x2778f(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20362,27 +20636,27 @@ _sk_load_4444_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,99,255,255,255 // ja 3b66 <_sk_load_4444_dst_hsw+0x26>
+ .byte 15,135,99,255,255,255 // ja 3cfe <_sk_load_4444_dst_hsw+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3c70 <_sk_load_4444_dst_hsw+0x130>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3e08 <_sk_load_4444_dst_hsw+0x130>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,65,255,255,255 // jmpq 3b66 <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,65,255,255,255 // jmpq 3cfe <_sk_load_4444_dst_hsw+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,36,255,255,255 // jmpq 3b66 <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,36,255,255,255 // jmpq 3cfe <_sk_load_4444_dst_hsw+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,247,254,255,255 // jmpq 3b66 <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,247,254,255,255 // jmpq 3cfe <_sk_load_4444_dst_hsw+0x26>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -20445,25 +20719,25 @@ _sk_gather_4444_hsw:
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,187,113,2,0 // vpbroadcastd 0x271bb(%rip),%ymm0 # 2aef8 <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,88,5,23,118,2,0 // vpbroadcastd 0x27617(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,174,113,2,0 // vbroadcastss 0x271ae(%rip),%ymm1 # 2aefc <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,13,10,118,2,0 // vbroadcastss 0x2760a(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,165,113,2,0 // vpbroadcastd 0x271a5(%rip),%ymm1 # 2af00 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,88,13,1,118,2,0 // vpbroadcastd 0x27601(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,152,113,2,0 // vbroadcastss 0x27198(%rip),%ymm2 # 2af04 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,21,244,117,2,0 // vbroadcastss 0x275f4(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,143,113,2,0 // vpbroadcastd 0x2718f(%rip),%ymm2 # 2af08 <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,88,21,235,117,2,0 // vpbroadcastd 0x275eb(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,130,113,2,0 // vbroadcastss 0x27182(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,222,117,2,0 // vbroadcastss 0x275de(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,120,113,2,0 // vpbroadcastd 0x27178(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,88,5,212,117,2,0 // vpbroadcastd 0x275d4(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,106,113,2,0 // vbroadcastss 0x2716a(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,198,117,2,0 // vbroadcastss 0x275c6(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -20480,7 +20754,7 @@ _sk_store_4444_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,69,113,2,0 // vbroadcastss 0x27145(%rip),%ymm8 # 2af18 <_sk_overlay_sse2_8bit+0x557>
+ .byte 196,98,125,24,5,161,117,2,0 // vbroadcastss 0x275a1(%rip),%ymm8 # 2b50c <_sk_overlay_sse2_8bit+0x557>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9
@@ -20498,7 +20772,7 @@ _sk_store_4444_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 3e37 <_sk_store_4444_hsw+0x84>
+ .byte 117,11 // jne 3fcf <_sk_store_4444_hsw+0x84>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20507,22 +20781,22 @@ _sk_store_4444_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 3e32 <_sk_store_4444_hsw+0x7f>
+ .byte 119,235 // ja 3fca <_sk_store_4444_hsw+0x7f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 3e94 <_sk_store_4444_hsw+0xe1>
+ .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 402c <_sk_store_4444_hsw+0xe1>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp 3e32 <_sk_store_4444_hsw+0x7f>
+ .byte 235,206 // jmp 3fca <_sk_store_4444_hsw+0x7f>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp 3e32 <_sk_store_4444_hsw+0x7f>
+ .byte 235,190 // jmp 3fca <_sk_store_4444_hsw+0x7f>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp 3e32 <_sk_store_4444_hsw+0x7f>
+ .byte 235,158 // jmp 3fca <_sk_store_4444_hsw+0x7f>
.byte 199 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -20540,7 +20814,7 @@ _sk_store_4444_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,224 // callq ffffffffe1003eac <_sk_overlay_sse2_8bit+0xffffffffe0fd94eb>
+ .byte 232,255,255,255,224 // callq ffffffffe1004044 <_sk_overlay_sse2_8bit+0xffffffffe0fd908f>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -20558,16 +20832,16 @@ _sk_load_8888_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 3f24 <_sk_load_8888_hsw+0x74>
+ .byte 117,87 // jne 40bc <_sk_load_8888_hsw+0x74>
.byte 196,193,126,111,28,153 // vmovdqu (%r9,%rbx,4),%ymm3
- .byte 197,229,219,5,133,113,2,0 // vpand 0x27185(%rip),%ymm3,%ymm0 # 2b060 <_sk_overlay_sse2_8bit+0x69f>
+ .byte 197,229,219,5,237,117,2,0 // vpand 0x275ed(%rip),%ymm3,%ymm0 # 2b660 <_sk_overlay_sse2_8bit+0x6ab>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,144,111,2,0 // vbroadcastss 0x26f90(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,236,115,2,0 // vbroadcastss 0x273ec(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,138,113,2,0 // vpshufb 0x2718a(%rip),%ymm3,%ymm1 # 2b080 <_sk_overlay_sse2_8bit+0x6bf>
+ .byte 196,226,101,0,13,242,117,2,0 // vpshufb 0x275f2(%rip),%ymm3,%ymm1 # 2b680 <_sk_overlay_sse2_8bit+0x6cb>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,152,113,2,0 // vpshufb 0x27198(%rip),%ymm3,%ymm2 # 2b0a0 <_sk_overlay_sse2_8bit+0x6df>
+ .byte 196,226,101,0,21,0,118,2,0 // vpshufb 0x27600(%rip),%ymm3,%ymm2 # 2b6a0 <_sk_overlay_sse2_8bit+0x6eb>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -20581,21 +20855,21 @@ _sk_load_8888_hsw:
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,155 // ja 3ed3 <_sk_load_8888_hsw+0x23>
+ .byte 119,155 // ja 406b <_sk_load_8888_hsw+0x23>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 3fd0 <_sk_load_8888_hsw+0x120>
+ .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 4168 <_sk_load_8888_hsw+0x120>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,28,153 // vmovd (%r9,%rbx,4),%xmm3
- .byte 233,124,255,255,255 // jmpq 3ed3 <_sk_load_8888_hsw+0x23>
+ .byte 233,124,255,255,255 // jmpq 406b <_sk_load_8888_hsw+0x23>
.byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
.byte 196,227,117,2,216,4 // vpblendd $0x4,%ymm0,%ymm1,%ymm3
.byte 196,193,122,126,4,153 // vmovq (%r9,%rbx,4),%xmm0
.byte 196,227,101,2,216,3 // vpblendd $0x3,%ymm0,%ymm3,%ymm3
- .byte 233,85,255,255,255 // jmpq 3ed3 <_sk_load_8888_hsw+0x23>
+ .byte 233,85,255,255,255 // jmpq 406b <_sk_load_8888_hsw+0x23>
.byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -20608,9 +20882,9 @@ _sk_load_8888_hsw:
.byte 196,227,101,56,216,1 // vinserti128 $0x1,%xmm0,%ymm3,%ymm3
.byte 196,193,122,111,4,153 // vmovdqu (%r9,%rbx,4),%xmm0
.byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- .byte 233,6,255,255,255 // jmpq 3ed3 <_sk_load_8888_hsw+0x23>
+ .byte 233,6,255,255,255 // jmpq 406b <_sk_load_8888_hsw+0x23>
.byte 15,31,0 // nopl (%rax)
- .byte 124,255 // jl 3fd1 <_sk_load_8888_hsw+0x121>
+ .byte 124,255 // jl 4169 <_sk_load_8888_hsw+0x121>
.byte 255 // (bad)
.byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp)
.byte 255 // (bad)
@@ -20644,16 +20918,16 @@ _sk_load_8888_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 4060 <_sk_load_8888_dst_hsw+0x74>
+ .byte 117,87 // jne 41f8 <_sk_load_8888_dst_hsw+0x74>
.byte 196,193,126,111,60,153 // vmovdqu (%r9,%rbx,4),%ymm7
- .byte 197,197,219,37,169,112,2,0 // vpand 0x270a9(%rip),%ymm7,%ymm4 # 2b0c0 <_sk_overlay_sse2_8bit+0x6ff>
+ .byte 197,197,219,37,17,117,2,0 // vpand 0x27511(%rip),%ymm7,%ymm4 # 2b6c0 <_sk_overlay_sse2_8bit+0x70b>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,84,110,2,0 // vbroadcastss 0x26e54(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,176,114,2,0 // vbroadcastss 0x272b0(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
- .byte 196,226,69,0,45,174,112,2,0 // vpshufb 0x270ae(%rip),%ymm7,%ymm5 # 2b0e0 <_sk_overlay_sse2_8bit+0x71f>
+ .byte 196,226,69,0,45,22,117,2,0 // vpshufb 0x27516(%rip),%ymm7,%ymm5 # 2b6e0 <_sk_overlay_sse2_8bit+0x72b>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
.byte 196,193,84,89,232 // vmulps %ymm8,%ymm5,%ymm5
- .byte 196,226,69,0,53,188,112,2,0 // vpshufb 0x270bc(%rip),%ymm7,%ymm6 # 2b100 <_sk_overlay_sse2_8bit+0x73f>
+ .byte 196,226,69,0,53,36,117,2,0 // vpshufb 0x27524(%rip),%ymm7,%ymm6 # 2b700 <_sk_overlay_sse2_8bit+0x74b>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -20667,21 +20941,21 @@ _sk_load_8888_dst_hsw:
.byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,155 // ja 400f <_sk_load_8888_dst_hsw+0x23>
+ .byte 119,155 // ja 41a7 <_sk_load_8888_dst_hsw+0x23>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 410c <_sk_load_8888_dst_hsw+0x120>
+ .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 42a4 <_sk_load_8888_dst_hsw+0x120>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,60,153 // vmovd (%r9,%rbx,4),%xmm7
- .byte 233,124,255,255,255 // jmpq 400f <_sk_load_8888_dst_hsw+0x23>
+ .byte 233,124,255,255,255 // jmpq 41a7 <_sk_load_8888_dst_hsw+0x23>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
.byte 196,227,85,2,252,4 // vpblendd $0x4,%ymm4,%ymm5,%ymm7
.byte 196,193,122,126,36,153 // vmovq (%r9,%rbx,4),%xmm4
.byte 196,227,69,2,252,3 // vpblendd $0x3,%ymm4,%ymm7,%ymm7
- .byte 233,85,255,255,255 // jmpq 400f <_sk_load_8888_dst_hsw+0x23>
+ .byte 233,85,255,255,255 // jmpq 41a7 <_sk_load_8888_dst_hsw+0x23>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -20694,9 +20968,9 @@ _sk_load_8888_dst_hsw:
.byte 196,227,69,56,252,1 // vinserti128 $0x1,%xmm4,%ymm7,%ymm7
.byte 196,193,122,111,36,153 // vmovdqu (%r9,%rbx,4),%xmm4
.byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- .byte 233,6,255,255,255 // jmpq 400f <_sk_load_8888_dst_hsw+0x23>
+ .byte 233,6,255,255,255 // jmpq 41a7 <_sk_load_8888_dst_hsw+0x23>
.byte 15,31,0 // nopl (%rax)
- .byte 124,255 // jl 410d <_sk_load_8888_dst_hsw+0x121>
+ .byte 124,255 // jl 42a5 <_sk_load_8888_dst_hsw+0x121>
.byte 255 // (bad)
.byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp)
.byte 255 // (bad)
@@ -20730,14 +21004,14 @@ _sk_gather_8888_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- .byte 197,229,219,5,202,111,2,0 // vpand 0x26fca(%rip),%ymm3,%ymm0 # 2b120 <_sk_overlay_sse2_8bit+0x75f>
+ .byte 197,229,219,5,50,116,2,0 // vpand 0x27432(%rip),%ymm3,%ymm0 # 2b720 <_sk_overlay_sse2_8bit+0x76b>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,21,109,2,0 // vbroadcastss 0x26d15(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,113,113,2,0 // vbroadcastss 0x27171(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,207,111,2,0 // vpshufb 0x26fcf(%rip),%ymm3,%ymm1 # 2b140 <_sk_overlay_sse2_8bit+0x77f>
+ .byte 196,226,101,0,13,55,116,2,0 // vpshufb 0x27437(%rip),%ymm3,%ymm1 # 2b740 <_sk_overlay_sse2_8bit+0x78b>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,221,111,2,0 // vpshufb 0x26fdd(%rip),%ymm3,%ymm2 # 2b160 <_sk_overlay_sse2_8bit+0x79f>
+ .byte 196,226,101,0,21,69,116,2,0 // vpshufb 0x27445(%rip),%ymm3,%ymm2 # 2b760 <_sk_overlay_sse2_8bit+0x7ab>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -20758,7 +21032,7 @@ _sk_store_8888_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,113,108,2,0 // vbroadcastss 0x26c71(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,205,112,2,0 // vbroadcastss 0x270cd(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -20774,7 +21048,7 @@ _sk_store_8888_hsw:
.byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8
.byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 4218 <_sk_store_8888_hsw+0x7a>
+ .byte 117,11 // jne 43b0 <_sk_store_8888_hsw+0x7a>
.byte 196,65,126,127,4,153 // vmovdqu %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20783,17 +21057,17 @@ _sk_store_8888_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 4213 <_sk_store_8888_hsw+0x75>
+ .byte 119,235 // ja 43ab <_sk_store_8888_hsw+0x75>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 4288 <_sk_store_8888_hsw+0xea>
+ .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 4420 <_sk_store_8888_hsw+0xea>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,207 // jmp 4213 <_sk_store_8888_hsw+0x75>
+ .byte 235,207 // jmp 43ab <_sk_store_8888_hsw+0x75>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 235,191 // jmp 4213 <_sk_store_8888_hsw+0x75>
+ .byte 235,191 // jmp 43ab <_sk_store_8888_hsw+0x75>
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
@@ -20801,7 +21075,7 @@ _sk_store_8888_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,65,121,126,76,153,16 // vmovd %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,122,127,4,153 // vmovdqu %xmm8,(%r9,%rbx,4)
- .byte 235,142 // jmp 4213 <_sk_store_8888_hsw+0x75>
+ .byte 235,142 // jmp 43ab <_sk_store_8888_hsw+0x75>
.byte 15,31,0 // nopl (%rax)
.byte 180,255 // mov $0xff,%ah
.byte 255 // (bad)
@@ -20813,7 +21087,7 @@ _sk_store_8888_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,218 // callq ffffffffdb00429c <_sk_overlay_sse2_8bit+0xffffffffdafd98db>
+ .byte 232,255,255,255,218 // callq ffffffffdb004434 <_sk_overlay_sse2_8bit+0xffffffffdafd947f>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,204 // dec %esp
@@ -20834,16 +21108,16 @@ _sk_load_bgra_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 4318 <_sk_load_bgra_hsw+0x74>
+ .byte 117,87 // jne 44b0 <_sk_load_bgra_hsw+0x74>
.byte 196,193,126,111,28,153 // vmovdqu (%r9,%rbx,4),%ymm3
- .byte 197,229,219,5,177,110,2,0 // vpand 0x26eb1(%rip),%ymm3,%ymm0 # 2b180 <_sk_overlay_sse2_8bit+0x7bf>
+ .byte 197,229,219,5,25,115,2,0 // vpand 0x27319(%rip),%ymm3,%ymm0 # 2b780 <_sk_overlay_sse2_8bit+0x7cb>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,156,107,2,0 // vbroadcastss 0x26b9c(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,248,111,2,0 // vbroadcastss 0x26ff8(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,182,110,2,0 // vpshufb 0x26eb6(%rip),%ymm3,%ymm0 # 2b1a0 <_sk_overlay_sse2_8bit+0x7df>
+ .byte 196,226,101,0,5,30,115,2,0 // vpshufb 0x2731e(%rip),%ymm3,%ymm0 # 2b7a0 <_sk_overlay_sse2_8bit+0x7eb>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,196,110,2,0 // vpshufb 0x26ec4(%rip),%ymm3,%ymm0 # 2b1c0 <_sk_overlay_sse2_8bit+0x7ff>
+ .byte 196,226,101,0,5,44,115,2,0 // vpshufb 0x2732c(%rip),%ymm3,%ymm0 # 2b7c0 <_sk_overlay_sse2_8bit+0x80b>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -20857,21 +21131,21 @@ _sk_load_bgra_hsw:
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,155 // ja 42c7 <_sk_load_bgra_hsw+0x23>
+ .byte 119,155 // ja 445f <_sk_load_bgra_hsw+0x23>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 43c4 <_sk_load_bgra_hsw+0x120>
+ .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 455c <_sk_load_bgra_hsw+0x120>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,28,153 // vmovd (%r9,%rbx,4),%xmm3
- .byte 233,124,255,255,255 // jmpq 42c7 <_sk_load_bgra_hsw+0x23>
+ .byte 233,124,255,255,255 // jmpq 445f <_sk_load_bgra_hsw+0x23>
.byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
.byte 196,227,117,2,216,4 // vpblendd $0x4,%ymm0,%ymm1,%ymm3
.byte 196,193,122,126,4,153 // vmovq (%r9,%rbx,4),%xmm0
.byte 196,227,101,2,216,3 // vpblendd $0x3,%ymm0,%ymm3,%ymm3
- .byte 233,85,255,255,255 // jmpq 42c7 <_sk_load_bgra_hsw+0x23>
+ .byte 233,85,255,255,255 // jmpq 445f <_sk_load_bgra_hsw+0x23>
.byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -20884,9 +21158,9 @@ _sk_load_bgra_hsw:
.byte 196,227,101,56,216,1 // vinserti128 $0x1,%xmm0,%ymm3,%ymm3
.byte 196,193,122,111,4,153 // vmovdqu (%r9,%rbx,4),%xmm0
.byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- .byte 233,6,255,255,255 // jmpq 42c7 <_sk_load_bgra_hsw+0x23>
+ .byte 233,6,255,255,255 // jmpq 445f <_sk_load_bgra_hsw+0x23>
.byte 15,31,0 // nopl (%rax)
- .byte 124,255 // jl 43c5 <_sk_load_bgra_hsw+0x121>
+ .byte 124,255 // jl 455d <_sk_load_bgra_hsw+0x121>
.byte 255 // (bad)
.byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp)
.byte 255 // (bad)
@@ -20920,16 +21194,16 @@ _sk_load_bgra_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 4454 <_sk_load_bgra_dst_hsw+0x74>
+ .byte 117,87 // jne 45ec <_sk_load_bgra_dst_hsw+0x74>
.byte 196,193,126,111,60,153 // vmovdqu (%r9,%rbx,4),%ymm7
- .byte 197,197,219,37,213,109,2,0 // vpand 0x26dd5(%rip),%ymm7,%ymm4 # 2b1e0 <_sk_overlay_sse2_8bit+0x81f>
+ .byte 197,197,219,37,61,114,2,0 // vpand 0x2723d(%rip),%ymm7,%ymm4 # 2b7e0 <_sk_overlay_sse2_8bit+0x82b>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,96,106,2,0 // vbroadcastss 0x26a60(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,188,110,2,0 // vbroadcastss 0x26ebc(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,92,89,240 // vmulps %ymm8,%ymm4,%ymm6
- .byte 196,226,69,0,37,218,109,2,0 // vpshufb 0x26dda(%rip),%ymm7,%ymm4 # 2b200 <_sk_overlay_sse2_8bit+0x83f>
+ .byte 196,226,69,0,37,66,114,2,0 // vpshufb 0x27242(%rip),%ymm7,%ymm4 # 2b800 <_sk_overlay_sse2_8bit+0x84b>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,232 // vmulps %ymm8,%ymm4,%ymm5
- .byte 196,226,69,0,37,232,109,2,0 // vpshufb 0x26de8(%rip),%ymm7,%ymm4 # 2b220 <_sk_overlay_sse2_8bit+0x85f>
+ .byte 196,226,69,0,37,80,114,2,0 // vpshufb 0x27250(%rip),%ymm7,%ymm4 # 2b820 <_sk_overlay_sse2_8bit+0x86b>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -20943,21 +21217,21 @@ _sk_load_bgra_dst_hsw:
.byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,155 // ja 4403 <_sk_load_bgra_dst_hsw+0x23>
+ .byte 119,155 // ja 459b <_sk_load_bgra_dst_hsw+0x23>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 4500 <_sk_load_bgra_dst_hsw+0x120>
+ .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 4698 <_sk_load_bgra_dst_hsw+0x120>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,60,153 // vmovd (%r9,%rbx,4),%xmm7
- .byte 233,124,255,255,255 // jmpq 4403 <_sk_load_bgra_dst_hsw+0x23>
+ .byte 233,124,255,255,255 // jmpq 459b <_sk_load_bgra_dst_hsw+0x23>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
.byte 196,227,85,2,252,4 // vpblendd $0x4,%ymm4,%ymm5,%ymm7
.byte 196,193,122,126,36,153 // vmovq (%r9,%rbx,4),%xmm4
.byte 196,227,69,2,252,3 // vpblendd $0x3,%ymm4,%ymm7,%ymm7
- .byte 233,85,255,255,255 // jmpq 4403 <_sk_load_bgra_dst_hsw+0x23>
+ .byte 233,85,255,255,255 // jmpq 459b <_sk_load_bgra_dst_hsw+0x23>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -20970,9 +21244,9 @@ _sk_load_bgra_dst_hsw:
.byte 196,227,69,56,252,1 // vinserti128 $0x1,%xmm4,%ymm7,%ymm7
.byte 196,193,122,111,36,153 // vmovdqu (%r9,%rbx,4),%xmm4
.byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- .byte 233,6,255,255,255 // jmpq 4403 <_sk_load_bgra_dst_hsw+0x23>
+ .byte 233,6,255,255,255 // jmpq 459b <_sk_load_bgra_dst_hsw+0x23>
.byte 15,31,0 // nopl (%rax)
- .byte 124,255 // jl 4501 <_sk_load_bgra_dst_hsw+0x121>
+ .byte 124,255 // jl 4699 <_sk_load_bgra_dst_hsw+0x121>
.byte 255 // (bad)
.byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp)
.byte 255 // (bad)
@@ -21006,14 +21280,14 @@ _sk_gather_bgra_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- .byte 197,229,219,5,246,108,2,0 // vpand 0x26cf6(%rip),%ymm3,%ymm0 # 2b240 <_sk_overlay_sse2_8bit+0x87f>
+ .byte 197,229,219,5,94,113,2,0 // vpand 0x2715e(%rip),%ymm3,%ymm0 # 2b840 <_sk_overlay_sse2_8bit+0x88b>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,33,105,2,0 // vbroadcastss 0x26921(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,125,109,2,0 // vbroadcastss 0x26d7d(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,251,108,2,0 // vpshufb 0x26cfb(%rip),%ymm3,%ymm0 # 2b260 <_sk_overlay_sse2_8bit+0x89f>
+ .byte 196,226,101,0,5,99,113,2,0 // vpshufb 0x27163(%rip),%ymm3,%ymm0 # 2b860 <_sk_overlay_sse2_8bit+0x8ab>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,9,109,2,0 // vpshufb 0x26d09(%rip),%ymm3,%ymm0 # 2b280 <_sk_overlay_sse2_8bit+0x8bf>
+ .byte 196,226,101,0,5,113,113,2,0 // vpshufb 0x27171(%rip),%ymm3,%ymm0 # 2b880 <_sk_overlay_sse2_8bit+0x8cb>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -21034,7 +21308,7 @@ _sk_store_bgra_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,125,104,2,0 // vbroadcastss 0x2687d(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,217,108,2,0 // vbroadcastss 0x26cd9(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -21050,7 +21324,7 @@ _sk_store_bgra_hsw:
.byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8
.byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 460c <_sk_store_bgra_hsw+0x7a>
+ .byte 117,11 // jne 47a4 <_sk_store_bgra_hsw+0x7a>
.byte 196,65,126,127,4,153 // vmovdqu %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -21059,17 +21333,17 @@ _sk_store_bgra_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 4607 <_sk_store_bgra_hsw+0x75>
+ .byte 119,235 // ja 479f <_sk_store_bgra_hsw+0x75>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 467c <_sk_store_bgra_hsw+0xea>
+ .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 4814 <_sk_store_bgra_hsw+0xea>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,207 // jmp 4607 <_sk_store_bgra_hsw+0x75>
+ .byte 235,207 // jmp 479f <_sk_store_bgra_hsw+0x75>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 235,191 // jmp 4607 <_sk_store_bgra_hsw+0x75>
+ .byte 235,191 // jmp 479f <_sk_store_bgra_hsw+0x75>
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
@@ -21077,7 +21351,7 @@ _sk_store_bgra_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,65,121,126,76,153,16 // vmovd %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,122,127,4,153 // vmovdqu %xmm8,(%r9,%rbx,4)
- .byte 235,142 // jmp 4607 <_sk_store_bgra_hsw+0x75>
+ .byte 235,142 // jmp 479f <_sk_store_bgra_hsw+0x75>
.byte 15,31,0 // nopl (%rax)
.byte 180,255 // mov $0xff,%ah
.byte 255 // (bad)
@@ -21089,7 +21363,7 @@ _sk_store_bgra_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,218 // callq ffffffffdb004690 <_sk_overlay_sse2_8bit+0xffffffffdafd9ccf>
+ .byte 232,255,255,255,218 // callq ffffffffdb004828 <_sk_overlay_sse2_8bit+0xffffffffdafd9873>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,204 // dec %esp
@@ -21109,7 +21383,7 @@ _sk_load_f16_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,101 // jne 4719 <_sk_load_f16_hsw+0x81>
+ .byte 117,101 // jne 48b1 <_sk_load_f16_hsw+0x81>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,84,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm2
.byte 196,193,121,16,92,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm3
@@ -21135,29 +21409,29 @@ _sk_load_f16_hsw:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 477f <_sk_load_f16_hsw+0xe7>
+ .byte 116,85 // je 4917 <_sk_load_f16_hsw+0xe7>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 477f <_sk_load_f16_hsw+0xe7>
+ .byte 114,72 // jb 4917 <_sk_load_f16_hsw+0xe7>
.byte 196,193,123,16,84,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 478c <_sk_load_f16_hsw+0xf4>
+ .byte 116,72 // je 4924 <_sk_load_f16_hsw+0xf4>
.byte 196,193,105,22,84,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 478c <_sk_load_f16_hsw+0xf4>
+ .byte 114,59 // jb 4924 <_sk_load_f16_hsw+0xf4>
.byte 196,193,123,16,92,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,109,255,255,255 // je 46cf <_sk_load_f16_hsw+0x37>
+ .byte 15,132,109,255,255,255 // je 4867 <_sk_load_f16_hsw+0x37>
.byte 196,193,97,22,92,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,92,255,255,255 // jb 46cf <_sk_load_f16_hsw+0x37>
+ .byte 15,130,92,255,255,255 // jb 4867 <_sk_load_f16_hsw+0x37>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,80,255,255,255 // jmpq 46cf <_sk_load_f16_hsw+0x37>
+ .byte 233,80,255,255,255 // jmpq 4867 <_sk_load_f16_hsw+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,67,255,255,255 // jmpq 46cf <_sk_load_f16_hsw+0x37>
+ .byte 233,67,255,255,255 // jmpq 4867 <_sk_load_f16_hsw+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,58,255,255,255 // jmpq 46cf <_sk_load_f16_hsw+0x37>
+ .byte 233,58,255,255,255 // jmpq 4867 <_sk_load_f16_hsw+0x37>
HIDDEN _sk_load_f16_dst_hsw
.globl _sk_load_f16_dst_hsw
@@ -21171,7 +21445,7 @@ _sk_load_f16_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,101 // jne 4816 <_sk_load_f16_dst_hsw+0x81>
+ .byte 117,101 // jne 49ae <_sk_load_f16_dst_hsw+0x81>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,116,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm6
.byte 196,193,121,16,124,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm7
@@ -21197,29 +21471,29 @@ _sk_load_f16_dst_hsw:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 487c <_sk_load_f16_dst_hsw+0xe7>
+ .byte 116,85 // je 4a14 <_sk_load_f16_dst_hsw+0xe7>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 487c <_sk_load_f16_dst_hsw+0xe7>
+ .byte 114,72 // jb 4a14 <_sk_load_f16_dst_hsw+0xe7>
.byte 196,193,123,16,116,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm6
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 4889 <_sk_load_f16_dst_hsw+0xf4>
+ .byte 116,72 // je 4a21 <_sk_load_f16_dst_hsw+0xf4>
.byte 196,193,73,22,116,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 4889 <_sk_load_f16_dst_hsw+0xf4>
+ .byte 114,59 // jb 4a21 <_sk_load_f16_dst_hsw+0xf4>
.byte 196,193,123,16,124,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm7
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,109,255,255,255 // je 47cc <_sk_load_f16_dst_hsw+0x37>
+ .byte 15,132,109,255,255,255 // je 4964 <_sk_load_f16_dst_hsw+0x37>
.byte 196,193,65,22,124,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm7,%xmm7
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,92,255,255,255 // jb 47cc <_sk_load_f16_dst_hsw+0x37>
+ .byte 15,130,92,255,255,255 // jb 4964 <_sk_load_f16_dst_hsw+0x37>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,80,255,255,255 // jmpq 47cc <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,80,255,255,255 // jmpq 4964 <_sk_load_f16_dst_hsw+0x37>
.byte 197,193,87,255 // vxorpd %xmm7,%xmm7,%xmm7
.byte 197,201,87,246 // vxorpd %xmm6,%xmm6,%xmm6
- .byte 233,67,255,255,255 // jmpq 47cc <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,67,255,255,255 // jmpq 4964 <_sk_load_f16_dst_hsw+0x37>
.byte 197,193,87,255 // vxorpd %xmm7,%xmm7,%xmm7
- .byte 233,58,255,255,255 // jmpq 47cc <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,58,255,255,255 // jmpq 4964 <_sk_load_f16_dst_hsw+0x37>
HIDDEN _sk_gather_f16_hsw
.globl _sk_gather_f16_hsw
@@ -21282,7 +21556,7 @@ _sk_store_f16_hsw:
.byte 196,65,57,98,205 // vpunpckldq %xmm13,%xmm8,%xmm9
.byte 196,65,57,106,197 // vpunpckhdq %xmm13,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne 4997 <_sk_store_f16_hsw+0x7b>
+ .byte 117,31 // jne 4b2f <_sk_store_f16_hsw+0x7b>
.byte 196,65,120,17,28,193 // vmovups %xmm11,(%r9,%rax,8)
.byte 196,65,120,17,84,193,16 // vmovups %xmm10,0x10(%r9,%rax,8)
.byte 196,65,120,17,76,193,32 // vmovups %xmm9,0x20(%r9,%rax,8)
@@ -21291,22 +21565,22 @@ _sk_store_f16_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,193 // vmovq %xmm11,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4993 <_sk_store_f16_hsw+0x77>
+ .byte 116,240 // je 4b2b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,92,193,8 // vmovhpd %xmm11,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4993 <_sk_store_f16_hsw+0x77>
+ .byte 114,227 // jb 4b2b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,84,193,16 // vmovq %xmm10,0x10(%r9,%rax,8)
- .byte 116,218 // je 4993 <_sk_store_f16_hsw+0x77>
+ .byte 116,218 // je 4b2b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,84,193,24 // vmovhpd %xmm10,0x18(%r9,%rax,8)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 4993 <_sk_store_f16_hsw+0x77>
+ .byte 114,205 // jb 4b2b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,76,193,32 // vmovq %xmm9,0x20(%r9,%rax,8)
- .byte 116,196 // je 4993 <_sk_store_f16_hsw+0x77>
+ .byte 116,196 // je 4b2b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,76,193,40 // vmovhpd %xmm9,0x28(%r9,%rax,8)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb 4993 <_sk_store_f16_hsw+0x77>
+ .byte 114,183 // jb 4b2b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,68,193,48 // vmovq %xmm8,0x30(%r9,%rax,8)
- .byte 235,174 // jmp 4993 <_sk_store_f16_hsw+0x77>
+ .byte 235,174 // jmp 4b2b <_sk_store_f16_hsw+0x77>
HIDDEN _sk_load_u16_be_hsw
.globl _sk_load_u16_be_hsw
@@ -21321,7 +21595,7 @@ _sk_load_u16_be_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,204,0,0,0 // jne 4ad8 <_sk_load_u16_be_hsw+0xf3>
+ .byte 15,133,204,0,0,0 // jne 4c70 <_sk_load_u16_be_hsw+0xf3>
.byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8
.byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2
.byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -21340,7 +21614,7 @@ _sk_load_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,39,100,2,0 // vbroadcastss 0x26427(%rip),%ymm10 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,98,125,24,21,131,104,2,0 // vbroadcastss 0x26883(%rip),%ymm10 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -21368,29 +21642,29 @@ _sk_load_u16_be_hsw:
.byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 4b3e <_sk_load_u16_be_hsw+0x159>
+ .byte 116,85 // je 4cd6 <_sk_load_u16_be_hsw+0x159>
.byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 4b3e <_sk_load_u16_be_hsw+0x159>
+ .byte 114,72 // jb 4cd6 <_sk_load_u16_be_hsw+0x159>
.byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 4b4b <_sk_load_u16_be_hsw+0x166>
+ .byte 116,72 // je 4ce3 <_sk_load_u16_be_hsw+0x166>
.byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 4b4b <_sk_load_u16_be_hsw+0x166>
+ .byte 114,59 // jb 4ce3 <_sk_load_u16_be_hsw+0x166>
.byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,6,255,255,255 // je 4a27 <_sk_load_u16_be_hsw+0x42>
+ .byte 15,132,6,255,255,255 // je 4bbf <_sk_load_u16_be_hsw+0x42>
.byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,245,254,255,255 // jb 4a27 <_sk_load_u16_be_hsw+0x42>
+ .byte 15,130,245,254,255,255 // jb 4bbf <_sk_load_u16_be_hsw+0x42>
.byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9
- .byte 233,233,254,255,255 // jmpq 4a27 <_sk_load_u16_be_hsw+0x42>
+ .byte 233,233,254,255,255 // jmpq 4bbf <_sk_load_u16_be_hsw+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,220,254,255,255 // jmpq 4a27 <_sk_load_u16_be_hsw+0x42>
+ .byte 233,220,254,255,255 // jmpq 4bbf <_sk_load_u16_be_hsw+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,211,254,255,255 // jmpq 4a27 <_sk_load_u16_be_hsw+0x42>
+ .byte 233,211,254,255,255 // jmpq 4bbf <_sk_load_u16_be_hsw+0x42>
HIDDEN _sk_load_rgb_u16_be_hsw
.globl _sk_load_rgb_u16_be_hsw
@@ -21407,7 +21681,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,204,0,0,0 // jne 4c4b <_sk_load_rgb_u16_be_hsw+0xf7>
+ .byte 15,133,204,0,0,0 // jne 4de3 <_sk_load_rgb_u16_be_hsw+0xf7>
.byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0
.byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2
.byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -21431,7 +21705,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,155,98,2,0 // vbroadcastss 0x2629b(%rip),%ymm10 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,98,125,24,21,247,102,2,0 // vbroadcastss 0x266f7(%rip),%ymm10 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -21448,41 +21722,41 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,187,97,2,0 // vbroadcastss 0x261bb(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,23,102,2,0 // vbroadcastss 0x26617(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0
.byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 4c64 <_sk_load_rgb_u16_be_hsw+0x110>
- .byte 233,79,255,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 117,5 // jne 4dfc <_sk_load_rgb_u16_be_hsw+0x110>
+ .byte 233,79,255,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
.byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1
.byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 4c93 <_sk_load_rgb_u16_be_hsw+0x13f>
+ .byte 114,26 // jb 4e2b <_sk_load_rgb_u16_be_hsw+0x13f>
.byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1
.byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 4c98 <_sk_load_rgb_u16_be_hsw+0x144>
- .byte 233,32,255,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,27,255,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 117,10 // jne 4e30 <_sk_load_rgb_u16_be_hsw+0x144>
+ .byte 233,32,255,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,27,255,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
.byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1
.byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 4cc7 <_sk_load_rgb_u16_be_hsw+0x173>
+ .byte 114,26 // jb 4e5f <_sk_load_rgb_u16_be_hsw+0x173>
.byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1
.byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 4ccc <_sk_load_rgb_u16_be_hsw+0x178>
- .byte 233,236,254,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,231,254,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 117,10 // jne 4e64 <_sk_load_rgb_u16_be_hsw+0x178>
+ .byte 233,236,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,231,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
.byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3
.byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 4cf5 <_sk_load_rgb_u16_be_hsw+0x1a1>
+ .byte 114,20 // jb 4e8d <_sk_load_rgb_u16_be_hsw+0x1a1>
.byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3
.byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- .byte 233,190,254,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,185,254,255,255 // jmpq 4bb3 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,190,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,185,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
HIDDEN _sk_store_u16_be_hsw
.globl _sk_store_u16_be_hsw
@@ -21496,7 +21770,7 @@ _sk_store_u16_be_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 196,98,125,24,5,251,97,2,0 // vbroadcastss 0x261fb(%rip),%ymm8 # 2af1c <_sk_overlay_sse2_8bit+0x55b>
+ .byte 196,98,125,24,5,87,102,2,0 // vbroadcastss 0x26657(%rip),%ymm8 # 2b510 <_sk_overlay_sse2_8bit+0x55b>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -21534,7 +21808,7 @@ _sk_store_u16_be_hsw:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne 4e05 <_sk_store_u16_be_hsw+0x10b>
+ .byte 117,31 // jne 4f9d <_sk_store_u16_be_hsw+0x10b>
.byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2)
.byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2)
.byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2)
@@ -21543,22 +21817,22 @@ _sk_store_u16_be_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4e01 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,240 // je 4f99 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4e01 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,227 // jb 4f99 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2)
- .byte 116,218 // je 4e01 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,218 // je 4f99 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 4e01 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,205 // jb 4f99 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2)
- .byte 116,196 // je 4e01 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,196 // je 4f99 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb 4e01 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,183 // jb 4f99 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2)
- .byte 235,174 // jmp 4e01 <_sk_store_u16_be_hsw+0x107>
+ .byte 235,174 // jmp 4f99 <_sk_store_u16_be_hsw+0x107>
HIDDEN _sk_load_f32_hsw
.globl _sk_load_f32_hsw
@@ -21566,7 +21840,7 @@ FUNCTION(_sk_load_f32_hsw)
_sk_load_f32_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja 4edf <_sk_load_f32_hsw+0x8c>
+ .byte 15,135,128,0,0,0 // ja 5077 <_sk_load_f32_hsw+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -21574,7 +21848,7 @@ _sk_load_f32_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,133,0,0,0 // lea 0x85(%rip),%r11 # 4f08 <_sk_load_f32_hsw+0xb5>
+ .byte 76,141,29,133,0,0,0 // lea 0x85(%rip),%r11 # 50a0 <_sk_load_f32_hsw+0xb5>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -21622,7 +21896,7 @@ FUNCTION(_sk_load_f32_dst_hsw)
_sk_load_f32_dst_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja 4fb4 <_sk_load_f32_dst_hsw+0x8c>
+ .byte 15,135,128,0,0,0 // ja 514c <_sk_load_f32_dst_hsw+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -21630,7 +21904,7 @@ _sk_load_f32_dst_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 4fdc <_sk_load_f32_dst_hsw+0xb4>
+ .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 5174 <_sk_load_f32_dst_hsw+0xb4>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -21694,7 +21968,7 @@ _sk_store_f32_hsw:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 77,133,192 // test %r8,%r8
- .byte 117,55 // jne 507b <_sk_store_f32_hsw+0x7f>
+ .byte 117,55 // jne 5213 <_sk_store_f32_hsw+0x7f>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -21707,22 +21981,22 @@ _sk_store_f32_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 5077 <_sk_store_f32_hsw+0x7b>
+ .byte 116,240 // je 520f <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 5077 <_sk_store_f32_hsw+0x7b>
+ .byte 114,227 // jb 520f <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4)
- .byte 116,218 // je 5077 <_sk_store_f32_hsw+0x7b>
+ .byte 116,218 // je 520f <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 5077 <_sk_store_f32_hsw+0x7b>
+ .byte 114,205 // jb 520f <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- .byte 116,195 // je 5077 <_sk_store_f32_hsw+0x7b>
+ .byte 116,195 // je 520f <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,181 // jb 5077 <_sk_store_f32_hsw+0x7b>
+ .byte 114,181 // jb 520f <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- .byte 235,171 // jmp 5077 <_sk_store_f32_hsw+0x7b>
+ .byte 235,171 // jmp 520f <_sk_store_f32_hsw+0x7b>
HIDDEN _sk_clamp_x_hsw
.globl _sk_clamp_x_hsw
@@ -21799,7 +22073,7 @@ _sk_mirror_x_hsw:
.byte 196,65,124,92,218 // vsubps %ymm10,%ymm0,%ymm11
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,98,125,24,192 // vbroadcastss %xmm0,%ymm8
- .byte 197,178,89,5,87,92,2,0 // vmulss 0x25c57(%rip),%xmm9,%xmm0 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 197,178,89,5,179,96,2,0 // vmulss 0x260b3(%rip),%xmm9,%xmm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
.byte 196,227,125,8,192,1 // vroundps $0x1,%ymm0,%ymm0
@@ -21826,7 +22100,7 @@ _sk_mirror_y_hsw:
.byte 196,65,116,92,218 // vsubps %ymm10,%ymm1,%ymm11
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,98,125,24,193 // vbroadcastss %xmm1,%ymm8
- .byte 197,178,89,13,243,91,2,0 // vmulss 0x25bf3(%rip),%xmm9,%xmm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 197,178,89,13,79,96,2,0 // vmulss 0x2604f(%rip),%xmm9,%xmm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,226,125,24,201 // vbroadcastss %xmm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
.byte 196,227,125,8,201,1 // vroundps $0x1,%ymm1,%ymm1
@@ -21848,7 +22122,7 @@ FUNCTION(_sk_clamp_x_1_hsw)
_sk_clamp_x_1_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,168,91,2,0 // vbroadcastss 0x25ba8(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,4,96,2,0 // vbroadcastss 0x26004(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -21866,9 +22140,9 @@ HIDDEN _sk_mirror_x_1_hsw
.globl _sk_mirror_x_1_hsw
FUNCTION(_sk_mirror_x_1_hsw)
_sk_mirror_x_1_hsw:
- .byte 196,98,125,24,5,159,91,2,0 // vbroadcastss 0x25b9f(%rip),%ymm8 # 2ae1c <_sk_overlay_sse2_8bit+0x45b>
+ .byte 196,98,125,24,5,251,95,2,0 // vbroadcastss 0x25ffb(%rip),%ymm8 # 2b410 <_sk_overlay_sse2_8bit+0x45b>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,117,91,2,0 // vbroadcastss 0x25b75(%rip),%ymm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,13,209,95,2,0 // vbroadcastss 0x25fd1(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -21884,11 +22158,11 @@ HIDDEN _sk_luminance_to_alpha_hsw
.globl _sk_luminance_to_alpha_hsw
FUNCTION(_sk_luminance_to_alpha_hsw)
_sk_luminance_to_alpha_hsw:
- .byte 196,226,125,24,29,97,92,2,0 // vbroadcastss 0x25c61(%rip),%ymm3 # 2af20 <_sk_overlay_sse2_8bit+0x55f>
- .byte 196,98,125,24,5,92,92,2,0 // vbroadcastss 0x25c5c(%rip),%ymm8 # 2af24 <_sk_overlay_sse2_8bit+0x563>
+ .byte 196,226,125,24,29,189,96,2,0 // vbroadcastss 0x260bd(%rip),%ymm3 # 2b514 <_sk_overlay_sse2_8bit+0x55f>
+ .byte 196,98,125,24,5,184,96,2,0 // vbroadcastss 0x260b8(%rip),%ymm8 # 2b518 <_sk_overlay_sse2_8bit+0x563>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1
- .byte 196,226,125,24,29,77,92,2,0 // vbroadcastss 0x25c4d(%rip),%ymm3 # 2af28 <_sk_overlay_sse2_8bit+0x567>
+ .byte 196,226,125,24,29,169,96,2,0 // vbroadcastss 0x260a9(%rip),%ymm3 # 2b51c <_sk_overlay_sse2_8bit+0x567>
.byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -22088,9 +22362,9 @@ _sk_evenly_spaced_gradient_hsw:
.byte 76,139,72,8 // mov 0x8(%rax),%r9
.byte 77,137,211 // mov %r10,%r11
.byte 73,255,203 // dec %r11
- .byte 120,7 // js 55d4 <_sk_evenly_spaced_gradient_hsw+0x19>
+ .byte 120,7 // js 576c <_sk_evenly_spaced_gradient_hsw+0x19>
.byte 196,193,242,42,203 // vcvtsi2ss %r11,%xmm1,%xmm1
- .byte 235,22 // jmp 55ea <_sk_evenly_spaced_gradient_hsw+0x2f>
+ .byte 235,22 // jmp 5782 <_sk_evenly_spaced_gradient_hsw+0x2f>
.byte 76,137,219 // mov %r11,%rbx
.byte 72,209,235 // shr %rbx
.byte 65,131,227,1 // and $0x1,%r11d
@@ -22101,7 +22375,7 @@ _sk_evenly_spaced_gradient_hsw:
.byte 197,244,89,200 // vmulps %ymm0,%ymm1,%ymm1
.byte 197,126,91,217 // vcvttps2dq %ymm1,%ymm11
.byte 73,131,250,8 // cmp $0x8,%r10
- .byte 119,70 // ja 5643 <_sk_evenly_spaced_gradient_hsw+0x88>
+ .byte 119,70 // ja 57db <_sk_evenly_spaced_gradient_hsw+0x88>
.byte 196,66,37,22,1 // vpermps (%r9),%ymm11,%ymm8
.byte 72,139,88,40 // mov 0x28(%rax),%rbx
.byte 196,98,37,22,11 // vpermps (%rbx),%ymm11,%ymm9
@@ -22117,7 +22391,7 @@ _sk_evenly_spaced_gradient_hsw:
.byte 196,226,37,22,27 // vpermps (%rbx),%ymm11,%ymm3
.byte 72,139,64,64 // mov 0x40(%rax),%rax
.byte 196,98,37,22,40 // vpermps (%rax),%ymm11,%ymm13
- .byte 235,110 // jmp 56b1 <_sk_evenly_spaced_gradient_hsw+0xf6>
+ .byte 235,110 // jmp 5849 <_sk_evenly_spaced_gradient_hsw+0xf6>
.byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,2,117,146,4,153 // vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8
@@ -22154,14 +22428,14 @@ HIDDEN _sk_gauss_a_to_rgba_hsw
.globl _sk_gauss_a_to_rgba_hsw
FUNCTION(_sk_gauss_a_to_rgba_hsw)
_sk_gauss_a_to_rgba_hsw:
- .byte 196,226,125,24,5,85,88,2,0 // vbroadcastss 0x25855(%rip),%ymm0 # 2af2c <_sk_overlay_sse2_8bit+0x56b>
- .byte 196,226,125,24,13,80,88,2,0 // vbroadcastss 0x25850(%rip),%ymm1 # 2af30 <_sk_overlay_sse2_8bit+0x56f>
+ .byte 196,226,125,24,5,177,92,2,0 // vbroadcastss 0x25cb1(%rip),%ymm0 # 2b520 <_sk_overlay_sse2_8bit+0x56b>
+ .byte 196,226,125,24,13,172,92,2,0 // vbroadcastss 0x25cac(%rip),%ymm1 # 2b524 <_sk_overlay_sse2_8bit+0x56f>
.byte 196,226,101,168,200 // vfmadd213ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,70,88,2,0 // vbroadcastss 0x25846(%rip),%ymm0 # 2af34 <_sk_overlay_sse2_8bit+0x573>
+ .byte 196,226,125,24,5,162,92,2,0 // vbroadcastss 0x25ca2(%rip),%ymm0 # 2b528 <_sk_overlay_sse2_8bit+0x573>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
- .byte 196,226,125,24,13,60,88,2,0 // vbroadcastss 0x2583c(%rip),%ymm1 # 2af38 <_sk_overlay_sse2_8bit+0x577>
+ .byte 196,226,125,24,13,152,92,2,0 // vbroadcastss 0x25c98(%rip),%ymm1 # 2b52c <_sk_overlay_sse2_8bit+0x577>
.byte 196,226,101,184,200 // vfmadd231ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,50,88,2,0 // vbroadcastss 0x25832(%rip),%ymm0 # 2af3c <_sk_overlay_sse2_8bit+0x57b>
+ .byte 196,226,125,24,5,142,92,2,0 // vbroadcastss 0x25c8e(%rip),%ymm0 # 2b530 <_sk_overlay_sse2_8bit+0x57b>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -22176,11 +22450,11 @@ _sk_gradient_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 73,131,249,1 // cmp $0x1,%r9
- .byte 15,134,180,0,0,0 // jbe 57e2 <_sk_gradient_hsw+0xc3>
+ .byte 15,134,180,0,0,0 // jbe 597a <_sk_gradient_hsw+0xc3>
.byte 76,139,80,72 // mov 0x48(%rax),%r10
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 65,187,1,0,0,0 // mov $0x1,%r11d
- .byte 196,226,125,24,21,195,86,2,0 // vbroadcastss 0x256c3(%rip),%ymm2 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,226,125,24,21,31,91,2,0 // vbroadcastss 0x25b1f(%rip),%ymm2 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
.byte 196,130,125,24,28,154 // vbroadcastss (%r10,%r11,4),%ymm3
.byte 197,228,194,216,2 // vcmpleps %ymm0,%ymm3,%ymm3
@@ -22188,10 +22462,10 @@ _sk_gradient_hsw:
.byte 196,65,101,254,201 // vpaddd %ymm9,%ymm3,%ymm9
.byte 73,255,195 // inc %r11
.byte 77,57,217 // cmp %r11,%r9
- .byte 117,226 // jne 574a <_sk_gradient_hsw+0x2b>
+ .byte 117,226 // jne 58e2 <_sk_gradient_hsw+0x2b>
.byte 76,139,80,8 // mov 0x8(%rax),%r10
.byte 73,131,249,8 // cmp $0x8,%r9
- .byte 118,121 // jbe 57eb <_sk_gradient_hsw+0xcc>
+ .byte 118,121 // jbe 5983 <_sk_gradient_hsw+0xcc>
.byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,2,117,146,4,138 // vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8
@@ -22215,7 +22489,7 @@ _sk_gradient_hsw:
.byte 196,130,21,146,28,137 // vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3
.byte 72,139,64,64 // mov 0x40(%rax),%rax
.byte 196,34,13,146,44,136 // vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13
- .byte 235,77 // jmp 582f <_sk_gradient_hsw+0x110>
+ .byte 235,77 // jmp 59c7 <_sk_gradient_hsw+0x110>
.byte 76,139,80,8 // mov 0x8(%rax),%r10
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 196,66,53,22,2 // vpermps (%r10),%ymm9,%ymm8
@@ -22275,24 +22549,24 @@ _sk_xy_to_unit_angle_hsw:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,118,86,2,0 // vbroadcastss 0x25676(%rip),%ymm13 # 2af40 <_sk_overlay_sse2_8bit+0x57f>
- .byte 196,98,125,24,53,113,86,2,0 // vbroadcastss 0x25671(%rip),%ymm14 # 2af44 <_sk_overlay_sse2_8bit+0x583>
+ .byte 196,98,125,24,45,210,90,2,0 // vbroadcastss 0x25ad2(%rip),%ymm13 # 2b534 <_sk_overlay_sse2_8bit+0x57f>
+ .byte 196,98,125,24,53,205,90,2,0 // vbroadcastss 0x25acd(%rip),%ymm14 # 2b538 <_sk_overlay_sse2_8bit+0x583>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
- .byte 196,98,125,24,45,103,86,2,0 // vbroadcastss 0x25667(%rip),%ymm13 # 2af48 <_sk_overlay_sse2_8bit+0x587>
+ .byte 196,98,125,24,45,195,90,2,0 // vbroadcastss 0x25ac3(%rip),%ymm13 # 2b53c <_sk_overlay_sse2_8bit+0x587>
.byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13
- .byte 196,98,125,24,53,93,86,2,0 // vbroadcastss 0x2565d(%rip),%ymm14 # 2af4c <_sk_overlay_sse2_8bit+0x58b>
+ .byte 196,98,125,24,53,185,90,2,0 // vbroadcastss 0x25ab9(%rip),%ymm14 # 2b540 <_sk_overlay_sse2_8bit+0x58b>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
.byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,72,86,2,0 // vbroadcastss 0x25648(%rip),%ymm10 # 2af50 <_sk_overlay_sse2_8bit+0x58f>
+ .byte 196,98,125,24,21,164,90,2,0 // vbroadcastss 0x25aa4(%rip),%ymm10 # 2b544 <_sk_overlay_sse2_8bit+0x58f>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,222,84,2,0 // vbroadcastss 0x254de(%rip),%ymm10 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,21,58,89,2,0 // vbroadcastss 0x2593a(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,200,84,2,0 // vbroadcastss 0x254c8(%rip),%ymm10 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,21,36,89,2,0 // vbroadcastss 0x25924(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -22320,23 +22594,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,200,85,2,0 // vbroadcastss 0x255c8(%rip),%ymm11 # 2af54 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,29,36,90,2,0 // vbroadcastss 0x25a24(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,167,85,2,0 // vbroadcastss 0x255a7(%rip),%ymm9 # 2af58 <_sk_overlay_sse2_8bit+0x597>
+ .byte 196,98,125,24,13,3,90,2,0 // vbroadcastss 0x25a03(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,138,85,2,0 // vbroadcastss 0x2558a(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,230,89,2,0 // vbroadcastss 0x259e6(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,27,84,2,0 // vbroadcastss 0x2541b(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,119,88,2,0 // vbroadcastss 0x25877(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -22355,23 +22629,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,48,85,2,0 // vbroadcastss 0x25530(%rip),%ymm11 # 2af54 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,29,140,89,2,0 // vbroadcastss 0x2598c(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,15,85,2,0 // vbroadcastss 0x2550f(%rip),%ymm9 # 2af58 <_sk_overlay_sse2_8bit+0x597>
+ .byte 196,98,125,24,13,107,89,2,0 // vbroadcastss 0x2596b(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,242,84,2,0 // vbroadcastss 0x254f2(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,78,89,2,0 // vbroadcastss 0x2594e(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,131,83,2,0 // vbroadcastss 0x25383(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,223,87,2,0 // vbroadcastss 0x257df(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -22389,14 +22663,14 @@ _sk_xy_to_2pt_conical_linear_hsw:
.byte 197,58,89,72,44 // vmulss 0x2c(%rax),%xmm8,%xmm9
.byte 196,66,125,24,201 // vbroadcastss %xmm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,158,84,2,0 // vbroadcastss 0x2549e(%rip),%ymm10 # 2af54 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,21,250,88,2,0 // vbroadcastss 0x258fa(%rip),%ymm10 # 2b548 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
.byte 196,98,125,184,208 // vfmadd231ps %ymm0,%ymm0,%ymm10
.byte 196,193,58,89,192 // vmulss %xmm8,%xmm8,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,129,84,2,0 // vbroadcastss 0x25481(%rip),%ymm8 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,5,221,88,2,0 // vbroadcastss 0x258dd(%rip),%ymm8 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -22436,7 +22710,7 @@ HIDDEN _sk_save_xy_hsw
FUNCTION(_sk_save_xy_hsw)
_sk_save_xy_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,193,82,2,0 // vbroadcastss 0x252c1(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,29,87,2,0 // vbroadcastss 0x2571d(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -22470,9 +22744,9 @@ HIDDEN _sk_bilinear_nx_hsw
FUNCTION(_sk_bilinear_nx_hsw)
_sk_bilinear_nx_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,177,83,2,0 // vbroadcastss 0x253b1(%rip),%ymm0 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,5,13,88,2,0 // vbroadcastss 0x2580d(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,72,82,2,0 // vbroadcastss 0x25248(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,164,86,2,0 // vbroadcastss 0x256a4(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -22483,7 +22757,7 @@ HIDDEN _sk_bilinear_px_hsw
FUNCTION(_sk_bilinear_px_hsw)
_sk_bilinear_px_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,40,82,2,0 // vbroadcastss 0x25228(%rip),%ymm0 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,5,132,86,2,0 // vbroadcastss 0x25684(%rip),%ymm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -22495,9 +22769,9 @@ HIDDEN _sk_bilinear_ny_hsw
FUNCTION(_sk_bilinear_ny_hsw)
_sk_bilinear_ny_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,104,83,2,0 // vbroadcastss 0x25368(%rip),%ymm1 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,13,196,87,2,0 // vbroadcastss 0x257c4(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,254,81,2,0 // vbroadcastss 0x251fe(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,90,86,2,0 // vbroadcastss 0x2565a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -22508,7 +22782,7 @@ HIDDEN _sk_bilinear_py_hsw
FUNCTION(_sk_bilinear_py_hsw)
_sk_bilinear_py_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,222,81,2,0 // vbroadcastss 0x251de(%rip),%ymm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,13,58,86,2,0 // vbroadcastss 0x2563a(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -22520,13 +22794,13 @@ HIDDEN _sk_bicubic_n3x_hsw
FUNCTION(_sk_bicubic_n3x_hsw)
_sk_bicubic_n3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,33,83,2,0 // vbroadcastss 0x25321(%rip),%ymm0 # 2af64 <_sk_overlay_sse2_8bit+0x5a3>
+ .byte 196,226,125,24,5,125,87,2,0 // vbroadcastss 0x2577d(%rip),%ymm0 # 2b558 <_sk_overlay_sse2_8bit+0x5a3>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,180,81,2,0 // vbroadcastss 0x251b4(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,16,86,2,0 // vbroadcastss 0x25610(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,17,82,2,0 // vbroadcastss 0x25211(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
- .byte 196,98,125,24,29,252,82,2,0 // vbroadcastss 0x252fc(%rip),%ymm11 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,109,86,2,0 // vbroadcastss 0x2566d(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,29,88,87,2,0 // vbroadcastss 0x25758(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -22538,16 +22812,16 @@ HIDDEN _sk_bicubic_n1x_hsw
FUNCTION(_sk_bicubic_n1x_hsw)
_sk_bicubic_n1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,211,82,2,0 // vbroadcastss 0x252d3(%rip),%ymm0 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,5,47,87,2,0 // vbroadcastss 0x2572f(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,106,81,2,0 // vbroadcastss 0x2516a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,198,85,2,0 // vbroadcastss 0x255c6(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,196,82,2,0 // vbroadcastss 0x252c4(%rip),%ymm9 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
- .byte 196,98,125,24,21,191,82,2,0 // vbroadcastss 0x252bf(%rip),%ymm10 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,13,32,87,2,0 // vbroadcastss 0x25720(%rip),%ymm9 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,21,27,87,2,0 // vbroadcastss 0x2571b(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,65,81,2,0 // vbroadcastss 0x25141(%rip),%ymm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,13,157,85,2,0 // vbroadcastss 0x2559d(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,167,82,2,0 // vbroadcastss 0x252a7(%rip),%ymm10 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,21,3,87,2,0 // vbroadcastss 0x25703(%rip),%ymm10 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -22558,14 +22832,14 @@ HIDDEN _sk_bicubic_p1x_hsw
FUNCTION(_sk_bicubic_p1x_hsw)
_sk_bicubic_p1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,23,81,2,0 // vbroadcastss 0x25117(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,115,85,2,0 // vbroadcastss 0x25573(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,113,82,2,0 // vbroadcastss 0x25271(%rip),%ymm10 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
- .byte 196,98,125,24,29,108,82,2,0 // vbroadcastss 0x2526c(%rip),%ymm11 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,21,205,86,2,0 // vbroadcastss 0x256cd(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,29,200,86,2,0 // vbroadcastss 0x256c8(%rip),%ymm11 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,93,82,2,0 // vbroadcastss 0x2525d(%rip),%ymm8 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,5,185,86,2,0 // vbroadcastss 0x256b9(%rip),%ymm8 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -22576,12 +22850,12 @@ HIDDEN _sk_bicubic_p3x_hsw
FUNCTION(_sk_bicubic_p3x_hsw)
_sk_bicubic_p3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,57,82,2,0 // vbroadcastss 0x25239(%rip),%ymm0 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,226,125,24,5,149,86,2,0 // vbroadcastss 0x25695(%rip),%ymm0 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,42,81,2,0 // vbroadcastss 0x2512a(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
- .byte 196,98,125,24,29,21,82,2,0 // vbroadcastss 0x25215(%rip),%ymm11 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,134,85,2,0 // vbroadcastss 0x25586(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,29,113,86,2,0 // vbroadcastss 0x25671(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -22593,13 +22867,13 @@ HIDDEN _sk_bicubic_n3y_hsw
FUNCTION(_sk_bicubic_n3y_hsw)
_sk_bicubic_n3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,240,81,2,0 // vbroadcastss 0x251f0(%rip),%ymm1 # 2af64 <_sk_overlay_sse2_8bit+0x5a3>
+ .byte 196,226,125,24,13,76,86,2,0 // vbroadcastss 0x2564c(%rip),%ymm1 # 2b558 <_sk_overlay_sse2_8bit+0x5a3>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,130,80,2,0 // vbroadcastss 0x25082(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,222,84,2,0 // vbroadcastss 0x254de(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,223,80,2,0 // vbroadcastss 0x250df(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
- .byte 196,98,125,24,29,202,81,2,0 // vbroadcastss 0x251ca(%rip),%ymm11 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,59,85,2,0 // vbroadcastss 0x2553b(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,29,38,86,2,0 // vbroadcastss 0x25626(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -22611,16 +22885,16 @@ HIDDEN _sk_bicubic_n1y_hsw
FUNCTION(_sk_bicubic_n1y_hsw)
_sk_bicubic_n1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,161,81,2,0 // vbroadcastss 0x251a1(%rip),%ymm1 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,13,253,85,2,0 // vbroadcastss 0x255fd(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,55,80,2,0 // vbroadcastss 0x25037(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,147,84,2,0 // vbroadcastss 0x25493(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,145,81,2,0 // vbroadcastss 0x25191(%rip),%ymm9 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
- .byte 196,98,125,24,21,140,81,2,0 // vbroadcastss 0x2518c(%rip),%ymm10 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,13,237,85,2,0 // vbroadcastss 0x255ed(%rip),%ymm9 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,21,232,85,2,0 // vbroadcastss 0x255e8(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,14,80,2,0 // vbroadcastss 0x2500e(%rip),%ymm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,13,106,84,2,0 // vbroadcastss 0x2546a(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,116,81,2,0 // vbroadcastss 0x25174(%rip),%ymm10 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,21,208,85,2,0 // vbroadcastss 0x255d0(%rip),%ymm10 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -22631,14 +22905,14 @@ HIDDEN _sk_bicubic_p1y_hsw
FUNCTION(_sk_bicubic_p1y_hsw)
_sk_bicubic_p1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,228,79,2,0 // vbroadcastss 0x24fe4(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,64,84,2,0 // vbroadcastss 0x25440(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,61,81,2,0 // vbroadcastss 0x2513d(%rip),%ymm10 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
- .byte 196,98,125,24,29,56,81,2,0 // vbroadcastss 0x25138(%rip),%ymm11 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,21,153,85,2,0 // vbroadcastss 0x25599(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,29,148,85,2,0 // vbroadcastss 0x25594(%rip),%ymm11 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,41,81,2,0 // vbroadcastss 0x25129(%rip),%ymm8 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,5,133,85,2,0 // vbroadcastss 0x25585(%rip),%ymm8 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -22649,12 +22923,12 @@ HIDDEN _sk_bicubic_p3y_hsw
FUNCTION(_sk_bicubic_p3y_hsw)
_sk_bicubic_p3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,5,81,2,0 // vbroadcastss 0x25105(%rip),%ymm1 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,226,125,24,13,97,85,2,0 // vbroadcastss 0x25561(%rip),%ymm1 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,245,79,2,0 // vbroadcastss 0x24ff5(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
- .byte 196,98,125,24,29,224,80,2,0 // vbroadcastss 0x250e0(%rip),%ymm11 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,81,84,2,0 // vbroadcastss 0x25451(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,29,60,85,2,0 // vbroadcastss 0x2553c(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -22794,19 +23068,19 @@ _sk_clut_3D_hsw:
.byte 197,254,127,76,36,160 // vmovdqu %ymm1,-0x60(%rsp)
.byte 72,139,0 // mov (%rax),%rax
.byte 196,193,117,254,204 // vpaddd %ymm12,%ymm1,%ymm1
- .byte 196,226,125,88,61,157,78,2,0 // vpbroadcastd 0x24e9d(%rip),%ymm7 # 2af7c <_sk_overlay_sse2_8bit+0x5bb>
+ .byte 196,226,125,88,61,249,82,2,0 // vpbroadcastd 0x252f9(%rip),%ymm7 # 2b570 <_sk_overlay_sse2_8bit+0x5bb>
.byte 196,226,117,64,207 // vpmulld %ymm7,%ymm1,%ymm1
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
.byte 196,98,77,146,4,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8
- .byte 196,98,125,88,21,17,77,2,0 // vpbroadcastd 0x24d11(%rip),%ymm10 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,88,21,109,81,2,0 // vpbroadcastd 0x2516d(%rip),%ymm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 196,193,117,254,242 // vpaddd %ymm10,%ymm1,%ymm6
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
.byte 196,226,37,146,28,176 // vgatherdps %ymm11,(%rax,%ymm6,4),%ymm3
- .byte 196,98,125,88,29,0,77,2,0 // vpbroadcastd 0x24d00(%rip),%ymm11 # 2ae10 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,125,88,29,92,81,2,0 // vpbroadcastd 0x2515c(%rip),%ymm11 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,193,117,254,203 // vpaddd %ymm11,%ymm1,%ymm1
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
.byte 196,226,77,146,36,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm4
- .byte 196,98,125,24,45,80,78,2,0 // vbroadcastss 0x24e50(%rip),%ymm13 # 2af78 <_sk_overlay_sse2_8bit+0x5b7>
+ .byte 196,98,125,24,45,172,82,2,0 // vbroadcastss 0x252ac(%rip),%ymm13 # 2b56c <_sk_overlay_sse2_8bit+0x5b7>
.byte 196,193,124,88,245 // vaddps %ymm13,%ymm0,%ymm6
.byte 197,254,91,246 // vcvttps2dq %ymm6,%ymm6
.byte 196,226,77,64,205 // vpmulld %ymm5,%ymm6,%ymm1
@@ -23026,19 +23300,19 @@ _sk_clut_4D_hsw:
.byte 197,126,91,245 // vcvttps2dq %ymm5,%ymm14
.byte 196,98,13,64,233 // vpmulld %ymm1,%ymm14,%ymm13
.byte 197,149,254,198 // vpaddd %ymm6,%ymm13,%ymm0
- .byte 196,98,125,88,21,230,73,2,0 // vpbroadcastd 0x249e6(%rip),%ymm10 # 2af7c <_sk_overlay_sse2_8bit+0x5bb>
+ .byte 196,98,125,88,21,66,78,2,0 // vpbroadcastd 0x24e42(%rip),%ymm10 # 2b570 <_sk_overlay_sse2_8bit+0x5bb>
.byte 196,194,125,64,194 // vpmulld %ymm10,%ymm0,%ymm0
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 196,98,61,146,60,128 // vgatherdps %ymm8,(%rax,%ymm0,4),%ymm15
- .byte 196,98,125,88,29,89,72,2,0 // vpbroadcastd 0x24859(%rip),%ymm11 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,88,29,181,76,2,0 // vpbroadcastd 0x24cb5(%rip),%ymm11 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,125,254,195 // vpaddd %ymm11,%ymm0,%ymm8
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,162,53,146,20,128 // vgatherdps %ymm9,(%rax,%ymm8,4),%ymm2
- .byte 196,98,125,88,37,72,72,2,0 // vpbroadcastd 0x24848(%rip),%ymm12 # 2ae10 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,125,88,37,164,76,2,0 // vpbroadcastd 0x24ca4(%rip),%ymm12 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,193,125,254,196 // vpaddd %ymm12,%ymm0,%ymm0
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 196,226,61,146,60,128 // vgatherdps %ymm8,(%rax,%ymm0,4),%ymm7
- .byte 196,98,125,24,13,151,73,2,0 // vbroadcastss 0x24997(%rip),%ymm9 # 2af78 <_sk_overlay_sse2_8bit+0x5b7>
+ .byte 196,98,125,24,13,243,77,2,0 // vbroadcastss 0x24df3(%rip),%ymm9 # 2b56c <_sk_overlay_sse2_8bit+0x5b7>
.byte 196,65,84,88,193 // vaddps %ymm9,%ymm5,%ymm8
.byte 196,65,126,91,192 // vcvttps2dq %ymm8,%ymm8
.byte 196,226,61,64,193 // vpmulld %ymm1,%ymm8,%ymm0
@@ -23363,7 +23637,7 @@ _sk_clut_4D_hsw:
.byte 197,196,92,214 // vsubps %ymm6,%ymm7,%ymm2
.byte 196,226,61,168,214 // vfmadd213ps %ymm6,%ymm8,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,69,65,2,0 // vbroadcastss 0x24145(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,161,69,2,0 // vbroadcastss 0x245a1(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,16,164,36,32,3,0,0 // vmovups 0x320(%rsp),%ymm4
.byte 197,252,16,172,36,64,3,0,0 // vmovups 0x340(%rsp),%ymm5
.byte 197,252,16,180,36,96,3,0,0 // vmovups 0x360(%rsp),%ymm6
@@ -23391,7 +23665,7 @@ _sk_start_pipeline_avx:
.byte 72,137,194 // mov %rax,%rdx
.byte 72,137,77,176 // mov %rcx,-0x50(%rbp)
.byte 73,57,206 // cmp %rcx,%r14
- .byte 115,117 // jae 6d8d <_sk_start_pipeline_avx+0xa1>
+ .byte 115,117 // jae 6f25 <_sk_start_pipeline_avx+0xa1>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,8 // lea 0x8(%rax),%rax
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
@@ -23401,7 +23675,7 @@ _sk_start_pipeline_avx:
.byte 73,137,244 // mov %rsi,%r12
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
.byte 72,57,93,184 // cmp %rbx,-0x48(%rbp)
- .byte 119,45 // ja 6d69 <_sk_start_pipeline_avx+0x7d>
+ .byte 119,45 // ja 6f01 <_sk_start_pipeline_avx+0x7d>
.byte 76,139,125,208 // mov -0x30(%rbp),%r15
.byte 69,49,192 // xor %r8d,%r8d
.byte 76,137,207 // mov %r9,%rdi
@@ -23415,10 +23689,10 @@ _sk_start_pipeline_avx:
.byte 73,131,199,16 // add $0x10,%r15
.byte 73,57,223 // cmp %rbx,%r15
.byte 73,137,215 // mov %rdx,%r15
- .byte 118,215 // jbe 6d40 <_sk_start_pipeline_avx+0x54>
+ .byte 118,215 // jbe 6ed8 <_sk_start_pipeline_avx+0x54>
.byte 73,137,216 // mov %rbx,%r8
.byte 73,41,208 // sub %rdx,%r8
- .byte 116,19 // je 6d84 <_sk_start_pipeline_avx+0x98>
+ .byte 116,19 // je 6f1c <_sk_start_pipeline_avx+0x98>
.byte 76,137,207 // mov %r9,%rdi
.byte 76,137,230 // mov %r12,%rsi
.byte 76,137,241 // mov %r14,%rcx
@@ -23427,7 +23701,7 @@ _sk_start_pipeline_avx:
.byte 76,139,77,192 // mov -0x40(%rbp),%r9
.byte 73,255,198 // inc %r14
.byte 76,59,117,176 // cmp -0x50(%rbp),%r14
- .byte 117,165 // jne 6d32 <_sk_start_pipeline_avx+0x46>
+ .byte 117,165 // jne 6eca <_sk_start_pipeline_avx+0x46>
.byte 72,131,196,40 // add $0x28,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -23452,7 +23726,7 @@ _sk_seed_shader_avx:
.byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,68,64,2,0 // vbroadcastss 0x24044(%rip),%ymm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,13,160,68,2,0 // vbroadcastss 0x244a0(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0
.byte 197,249,110,209 // vmovd %ecx,%xmm2
@@ -23461,7 +23735,7 @@ _sk_seed_shader_avx:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,30,64,2,0 // vbroadcastss 0x2401e(%rip),%ymm2 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,21,122,68,2,0 // vbroadcastss 0x2447a(%rip),%ymm2 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -23485,7 +23759,7 @@ _sk_dither_avx:
.byte 196,65,121,112,201,0 // vpshufd $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 196,65,52,87,208 // vxorps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,199,63,2,0 // vbroadcastss 0x23fc7(%rip),%ymm11 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,24,29,35,68,2,0 // vbroadcastss 0x24423(%rip),%ymm11 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9
.byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
@@ -23496,8 +23770,8 @@ _sk_dither_avx:
.byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11
.byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11
.byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- .byte 196,98,125,24,37,136,63,2,0 // vbroadcastss 0x23f88(%rip),%ymm12 # 2ae0c <_sk_overlay_sse2_8bit+0x44b>
- .byte 196,98,125,24,45,131,63,2,0 // vbroadcastss 0x23f83(%rip),%ymm13 # 2ae10 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,125,24,37,228,67,2,0 // vbroadcastss 0x243e4(%rip),%ymm12 # 2b400 <_sk_overlay_sse2_8bit+0x44b>
+ .byte 196,98,125,24,45,223,67,2,0 // vbroadcastss 0x243df(%rip),%ymm13 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14
.byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15
.byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14
@@ -23524,9 +23798,9 @@ _sk_dither_avx:
.byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8
.byte 196,65,60,86,194 // vorps %ymm10,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,238,62,2,0 // vbroadcastss 0x23eee(%rip),%ymm9 # 2ae14 <_sk_overlay_sse2_8bit+0x453>
+ .byte 196,98,125,24,13,74,67,2,0 // vbroadcastss 0x2434a(%rip),%ymm9 # 2b408 <_sk_overlay_sse2_8bit+0x453>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,228,62,2,0 // vbroadcastss 0x23ee4(%rip),%ymm9 # 2ae18 <_sk_overlay_sse2_8bit+0x457>
+ .byte 196,98,125,24,13,64,67,2,0 // vbroadcastss 0x24340(%rip),%ymm9 # 2b40c <_sk_overlay_sse2_8bit+0x457>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 196,98,125,24,8 // vbroadcastss (%rax),%ymm9
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
@@ -23560,7 +23834,7 @@ HIDDEN _sk_black_color_avx
FUNCTION(_sk_black_color_avx)
_sk_black_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,108,62,2,0 // vbroadcastss 0x23e6c(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,200,66,2,0 // vbroadcastss 0x242c8(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -23571,7 +23845,7 @@ HIDDEN _sk_white_color_avx
FUNCTION(_sk_white_color_avx)
_sk_white_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,83,62,2,0 // vbroadcastss 0x23e53(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,175,66,2,0 // vbroadcastss 0x242af(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -23617,7 +23891,7 @@ HIDDEN _sk_srcatop_avx
FUNCTION(_sk_srcatop_avx)
_sk_srcatop_avx:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,242,61,2,0 // vbroadcastss 0x23df2(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,78,66,2,0 // vbroadcastss 0x2424e(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -23638,7 +23912,7 @@ HIDDEN _sk_dstatop_avx
FUNCTION(_sk_dstatop_avx)
_sk_dstatop_avx:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
- .byte 196,98,125,24,13,176,61,2,0 // vbroadcastss 0x23db0(%rip),%ymm9 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,13,12,66,2,0 // vbroadcastss 0x2420c(%rip),%ymm9 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0
@@ -23680,7 +23954,7 @@ HIDDEN _sk_srcout_avx
.globl _sk_srcout_avx
FUNCTION(_sk_srcout_avx)
_sk_srcout_avx:
- .byte 196,98,125,24,5,75,61,2,0 // vbroadcastss 0x23d4b(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,167,65,2,0 // vbroadcastss 0x241a7(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -23693,7 +23967,7 @@ HIDDEN _sk_dstout_avx
.globl _sk_dstout_avx
FUNCTION(_sk_dstout_avx)
_sk_dstout_avx:
- .byte 196,226,125,24,5,42,61,2,0 // vbroadcastss 0x23d2a(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,134,65,2,0 // vbroadcastss 0x24186(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -23706,7 +23980,7 @@ HIDDEN _sk_srcover_avx
.globl _sk_srcover_avx
FUNCTION(_sk_srcover_avx)
_sk_srcover_avx:
- .byte 196,98,125,24,5,9,61,2,0 // vbroadcastss 0x23d09(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,101,65,2,0 // vbroadcastss 0x24165(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -23723,7 +23997,7 @@ HIDDEN _sk_dstover_avx
.globl _sk_dstover_avx
FUNCTION(_sk_dstover_avx)
_sk_dstover_avx:
- .byte 196,98,125,24,5,216,60,2,0 // vbroadcastss 0x23cd8(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,52,65,2,0 // vbroadcastss 0x24134(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
@@ -23751,7 +24025,7 @@ HIDDEN _sk_multiply_avx
.globl _sk_multiply_avx
FUNCTION(_sk_multiply_avx)
_sk_multiply_avx:
- .byte 196,98,125,24,5,147,60,2,0 // vbroadcastss 0x23c93(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,239,64,2,0 // vbroadcastss 0x240ef(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -23782,9 +24056,14 @@ HIDDEN _sk_plus__avx
FUNCTION(_sk_plus__avx)
_sk_plus__avx:
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
+ .byte 196,98,125,24,5,126,64,2,0 // vbroadcastss 0x2407e(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 197,244,88,205 // vaddps %ymm5,%ymm1,%ymm1
+ .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 197,236,88,214 // vaddps %ymm6,%ymm2,%ymm2
+ .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3
+ .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23811,7 +24090,7 @@ HIDDEN _sk_xor__avx
.globl _sk_xor__avx
FUNCTION(_sk_xor__avx)
_sk_xor__avx:
- .byte 196,98,125,24,5,222,59,2,0 // vbroadcastss 0x23bde(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,29,64,2,0 // vbroadcastss 0x2401d(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -23848,7 +24127,7 @@ _sk_darken_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,90,59,2,0 // vbroadcastss 0x23b5a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,153,63,2,0 // vbroadcastss 0x23f99(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -23874,7 +24153,7 @@ _sk_lighten_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,2,59,2,0 // vbroadcastss 0x23b02(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,65,63,2,0 // vbroadcastss 0x23f41(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -23903,7 +24182,7 @@ _sk_difference_avx:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,158,58,2,0 // vbroadcastss 0x23a9e(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,221,62,2,0 // vbroadcastss 0x23edd(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -23926,7 +24205,7 @@ _sk_exclusion_avx:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,85,58,2,0 // vbroadcastss 0x23a55(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,148,62,2,0 // vbroadcastss 0x23e94(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -23937,7 +24216,7 @@ HIDDEN _sk_colorburn_avx
.globl _sk_colorburn_avx
FUNCTION(_sk_colorburn_avx)
_sk_colorburn_avx:
- .byte 196,98,125,24,5,60,58,2,0 // vbroadcastss 0x23a3c(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,123,62,2,0 // vbroadcastss 0x23e7b(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -23999,7 +24278,7 @@ HIDDEN _sk_colordodge_avx
FUNCTION(_sk_colordodge_avx)
_sk_colordodge_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,64,57,2,0 // vbroadcastss 0x23940(%rip),%ymm9 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,13,127,61,2,0 // vbroadcastss 0x23d7f(%rip),%ymm9 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -24056,7 +24335,7 @@ HIDDEN _sk_hardlight_avx
.globl _sk_hardlight_avx
FUNCTION(_sk_hardlight_avx)
_sk_hardlight_avx:
- .byte 196,98,125,24,5,75,56,2,0 // vbroadcastss 0x2384b(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,138,60,2,0 // vbroadcastss 0x23c8a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -24111,7 +24390,7 @@ HIDDEN _sk_overlay_avx
.globl _sk_overlay_avx
FUNCTION(_sk_overlay_avx)
_sk_overlay_avx:
- .byte 196,98,125,24,5,112,55,2,0 // vbroadcastss 0x23770(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,175,59,2,0 // vbroadcastss 0x23baf(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -24177,10 +24456,10 @@ _sk_softlight_avx:
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,29,119,54,2,0 // vbroadcastss 0x23677(%rip),%ymm11 # 2ae1c <_sk_overlay_sse2_8bit+0x45b>
+ .byte 196,98,125,24,29,182,58,2,0 // vbroadcastss 0x23ab6(%rip),%ymm11 # 2b410 <_sk_overlay_sse2_8bit+0x45b>
.byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13
.byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8
- .byte 196,98,125,24,45,104,54,2,0 // vbroadcastss 0x23668(%rip),%ymm13 # 2ae20 <_sk_overlay_sse2_8bit+0x45f>
+ .byte 196,98,125,24,45,167,58,2,0 // vbroadcastss 0x23aa7(%rip),%ymm13 # 2b414 <_sk_overlay_sse2_8bit+0x45f>
.byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14
.byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8
.byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14
@@ -24191,7 +24470,7 @@ _sk_softlight_avx:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,18,54,2,0 // vbroadcastss 0x23612(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,81,58,2,0 // vbroadcastss 0x23a51(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
@@ -24318,12 +24597,12 @@ _sk_hue_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,245,51,2,0 // vbroadcastss 0x233f5(%rip),%ymm14 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,53,52,56,2,0 // vbroadcastss 0x23834(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,235,51,2,0 // vbroadcastss 0x233eb(%rip),%ymm15 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,61,42,56,2,0 // vbroadcastss 0x2382a(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,220,51,2,0 // vbroadcastss 0x233dc(%rip),%ymm0 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,226,125,24,5,27,56,2,0 // vbroadcastss 0x2381b(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -24384,7 +24663,7 @@ _sk_hue_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,137,50,2,0 // vbroadcastss 0x23289(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,200,54,2,0 // vbroadcastss 0x236c8(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -24441,12 +24720,12 @@ _sk_saturation_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,179,49,2,0 // vbroadcastss 0x231b3(%rip),%ymm14 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,53,242,53,2,0 // vbroadcastss 0x235f2(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,169,49,2,0 // vbroadcastss 0x231a9(%rip),%ymm15 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,61,232,53,2,0 // vbroadcastss 0x235e8(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,154,49,2,0 // vbroadcastss 0x2319a(%rip),%ymm0 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,226,125,24,5,217,53,2,0 // vbroadcastss 0x235d9(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -24507,7 +24786,7 @@ _sk_saturation_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,71,48,2,0 // vbroadcastss 0x23047(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,134,52,2,0 // vbroadcastss 0x23486(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -24536,12 +24815,12 @@ _sk_color_avx:
.byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp)
.byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8
.byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9
- .byte 196,98,125,24,45,249,47,2,0 // vbroadcastss 0x22ff9(%rip),%ymm13 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,45,56,52,2,0 // vbroadcastss 0x23438(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10
- .byte 196,98,125,24,53,239,47,2,0 // vbroadcastss 0x22fef(%rip),%ymm14 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,53,46,52,2,0 // vbroadcastss 0x2342e(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,224,47,2,0 // vbroadcastss 0x22fe0(%rip),%ymm15 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,98,125,24,61,31,52,2,0 // vbroadcastss 0x2341f(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -24604,7 +24883,7 @@ _sk_color_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,123,46,2,0 // vbroadcastss 0x22e7b(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,186,50,2,0 // vbroadcastss 0x232ba(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -24634,12 +24913,12 @@ _sk_luminosity_avx:
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9
- .byte 196,98,125,24,45,41,46,2,0 // vbroadcastss 0x22e29(%rip),%ymm13 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,45,104,50,2,0 // vbroadcastss 0x23268(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10
- .byte 196,98,125,24,53,31,46,2,0 // vbroadcastss 0x22e1f(%rip),%ymm14 # 2ae28 <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,53,94,50,2,0 // vbroadcastss 0x2325e(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,16,46,2,0 // vbroadcastss 0x22e10(%rip),%ymm15 # 2ae2c <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,98,125,24,61,79,50,2,0 // vbroadcastss 0x2324f(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -24702,7 +24981,7 @@ _sk_luminosity_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,171,44,2,0 // vbroadcastss 0x22cab(%rip),%ymm0 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,234,48,2,0 // vbroadcastss 0x230ea(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -24735,9 +25014,9 @@ _sk_srcover_rgba_8888_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,43,1,0,0 // jne 82f0 <_sk_srcover_rgba_8888_avx+0x14c>
+ .byte 15,133,43,1,0,0 // jne 84a5 <_sk_srcover_rgba_8888_avx+0x14c>
.byte 196,65,125,16,4,153 // vmovupd (%r9,%rbx,4),%ymm8
- .byte 197,125,40,13,205,48,2,0 // vmovapd 0x230cd(%rip),%ymm9 # 2b2a0 <_sk_overlay_sse2_8bit+0x8df>
+ .byte 197,125,40,13,24,53,2,0 // vmovapd 0x23518(%rip),%ymm9 # 2b8a0 <_sk_overlay_sse2_8bit+0x8eb>
.byte 196,193,61,84,225 // vandpd %ymm9,%ymm8,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,81,114,208,8 // vpsrld $0x8,%xmm8,%xmm5
@@ -24755,9 +25034,9 @@ _sk_srcover_rgba_8888_avx:
.byte 197,193,114,215,24 // vpsrld $0x18,%xmm7,%xmm7
.byte 196,227,61,24,255,1 // vinsertf128 $0x1,%xmm7,%ymm8,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,208,43,2,0 // vbroadcastss 0x22bd0(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,15,48,2,0 // vbroadcastss 0x2300f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,239,43,2,0 // vbroadcastss 0x22bef(%rip),%ymm9 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,13,46,48,2,0 // vbroadcastss 0x2302e(%rip),%ymm9 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,60,89,212 // vmulps %ymm4,%ymm8,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
@@ -24790,7 +25069,7 @@ _sk_srcover_rgba_8888_avx:
.byte 196,65,53,86,202 // vorpd %ymm10,%ymm9,%ymm9
.byte 196,65,61,86,193 // vorpd %ymm9,%ymm8,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,67 // jne 8328 <_sk_srcover_rgba_8888_avx+0x184>
+ .byte 117,67 // jne 84dd <_sk_srcover_rgba_8888_avx+0x184>
.byte 196,65,124,17,4,153 // vmovups %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -24800,33 +25079,33 @@ _sk_srcover_rgba_8888_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,194,254,255,255 // ja 81cb <_sk_srcover_rgba_8888_avx+0x27>
+ .byte 15,135,194,254,255,255 // ja 8380 <_sk_srcover_rgba_8888_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,4,1,0,0 // lea 0x104(%rip),%r11 # 8418 <_sk_srcover_rgba_8888_avx+0x274>
+ .byte 76,141,29,3,1,0,0 // lea 0x103(%rip),%r11 # 85cc <_sk_srcover_rgba_8888_avx+0x273>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,4,153 // vmovss (%r9,%rbx,4),%xmm8
- .byte 233,163,254,255,255 // jmpq 81cb <_sk_srcover_rgba_8888_avx+0x27>
+ .byte 233,163,254,255,255 // jmpq 8380 <_sk_srcover_rgba_8888_avx+0x27>
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,179 // ja 82eb <_sk_srcover_rgba_8888_avx+0x147>
+ .byte 119,179 // ja 84a0 <_sk_srcover_rgba_8888_avx+0x147>
.byte 65,15,182,194 // movzbl %r10b,%eax
- .byte 76,141,21,241,0,0,0 // lea 0xf1(%rip),%r10 # 8434 <_sk_srcover_rgba_8888_avx+0x290>
+ .byte 76,141,21,240,0,0,0 // lea 0xf0(%rip),%r10 # 85e8 <_sk_srcover_rgba_8888_avx+0x28f>
.byte 73,99,4,130 // movslq (%r10,%rax,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,151 // jmp 82eb <_sk_srcover_rgba_8888_avx+0x147>
+ .byte 235,151 // jmp 84a0 <_sk_srcover_rgba_8888_avx+0x147>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
.byte 196,99,85,12,196,4 // vblendps $0x4,%ymm4,%ymm5,%ymm8
.byte 196,193,123,16,36,153 // vmovsd (%r9,%rbx,4),%xmm4
.byte 196,99,61,13,196,1 // vblendpd $0x1,%ymm4,%ymm8,%ymm8
- .byte 233,80,254,255,255 // jmpq 81cb <_sk_srcover_rgba_8888_avx+0x27>
+ .byte 233,80,254,255,255 // jmpq 8380 <_sk_srcover_rgba_8888_avx+0x27>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -24840,10 +25119,10 @@ _sk_srcover_rgba_8888_avx:
.byte 196,99,61,24,196,1 // vinsertf128 $0x1,%xmm4,%ymm8,%ymm8
.byte 196,193,121,16,36,153 // vmovupd (%r9,%rbx,4),%xmm4
.byte 196,67,93,13,192,12 // vblendpd $0xc,%ymm8,%ymm4,%ymm8
- .byte 233,251,253,255,255 // jmpq 81cb <_sk_srcover_rgba_8888_avx+0x27>
+ .byte 233,251,253,255,255 // jmpq 8380 <_sk_srcover_rgba_8888_avx+0x27>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 233,8,255,255,255 // jmpq 82eb <_sk_srcover_rgba_8888_avx+0x147>
+ .byte 233,8,255,255,255 // jmpq 84a0 <_sk_srcover_rgba_8888_avx+0x147>
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -24851,35 +25130,33 @@ _sk_srcover_rgba_8888_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,65,122,17,76,153,16 // vmovss %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,121,17,4,153 // vmovupd %xmm8,(%r9,%rbx,4)
- .byte 233,212,254,255,255 // jmpq 82eb <_sk_srcover_rgba_8888_avx+0x147>
- .byte 144 // nop
- .byte 5,255,255,255,82 // add $0x52ffffff,%eax
+ .byte 233,212,254,255,255 // jmpq 84a0 <_sk_srcover_rgba_8888_avx+0x147>
+ .byte 6 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,83,255 // callq *-0x1(%rbx)
.byte 255 // (bad)
- .byte 60,255 // cmp $0xff,%al
.byte 255 // (bad)
- .byte 255,167,255,255,255,147 // jmpq *-0x6c000001(%rdi)
+ .byte 61,255,255,255,168 // cmp $0xa8ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,148,255,255,255,128,255 // callq *-0x7f0001(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,255 // jg 842d <_sk_srcover_rgba_8888_avx+0x289>
+ .byte 255,100,255,255 // jmpq *-0x1(%rdi,%rdi,8)
+ .byte 255,25 // lcall *(%rcx)
.byte 255 // (bad)
- .byte 255,99,255 // jmpq *-0x1(%rbx)
.byte 255 // (bad)
- .byte 255,24 // lcall *(%rax)
+ .byte 255,165,255,255,255,157 // jmpq *-0x62000001(%rbp)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,164,255,255,255,156,255 // jmpq *-0x630001(%rdi,%rdi,8)
.byte 255 // (bad)
+ .byte 217,255 // fcos
.byte 255 // (bad)
- .byte 216,255 // fdivr %st(7),%st
- .byte 255 // (bad)
- .byte 255,203 // dec %ebx
+ .byte 255,204 // dec %esp
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 189,255,255,255,175 // mov $0xafffffff,%ebp
+ .byte 190,255,255,255,176 // mov $0xb0ffffff,%esi
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -24900,7 +25177,7 @@ HIDDEN _sk_clamp_1_avx
.globl _sk_clamp_1_avx
FUNCTION(_sk_clamp_1_avx)
_sk_clamp_1_avx:
- .byte 196,98,125,24,5,142,41,2,0 // vbroadcastss 0x2298e(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,206,45,2,0 // vbroadcastss 0x22dce(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -24912,7 +25189,7 @@ HIDDEN _sk_clamp_a_avx
.globl _sk_clamp_a_avx
FUNCTION(_sk_clamp_a_avx)
_sk_clamp_a_avx:
- .byte 196,98,125,24,5,109,41,2,0 // vbroadcastss 0x2296d(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,173,45,2,0 // vbroadcastss 0x22dad(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -24924,7 +25201,7 @@ HIDDEN _sk_clamp_a_dst_avx
.globl _sk_clamp_a_dst_avx
FUNCTION(_sk_clamp_a_dst_avx)
_sk_clamp_a_dst_avx:
- .byte 196,98,125,24,5,79,41,2,0 // vbroadcastss 0x2294f(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,143,45,2,0 // vbroadcastss 0x22d8f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -24957,7 +25234,7 @@ HIDDEN _sk_invert_avx
.globl _sk_invert_avx
FUNCTION(_sk_invert_avx)
_sk_invert_avx:
- .byte 196,98,125,24,5,10,41,2,0 // vbroadcastss 0x2290a(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,74,45,2,0 // vbroadcastss 0x22d4a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -25013,7 +25290,7 @@ FUNCTION(_sk_unpremul_avx)
_sk_unpremul_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,154,40,2,0 // vbroadcastss 0x2289a(%rip),%ymm10 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,21,218,44,2,0 // vbroadcastss 0x22cda(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -25026,17 +25303,17 @@ HIDDEN _sk_from_srgb_avx
.globl _sk_from_srgb_avx
FUNCTION(_sk_from_srgb_avx)
_sk_from_srgb_avx:
- .byte 196,98,125,24,5,167,40,2,0 // vbroadcastss 0x228a7(%rip),%ymm8 # 2ae34 <_sk_overlay_sse2_8bit+0x473>
+ .byte 196,98,125,24,5,231,44,2,0 // vbroadcastss 0x22ce7(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,133,40,2,0 // vbroadcastss 0x22885(%rip),%ymm11 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,29,197,44,2,0 // vbroadcastss 0x22cc5(%rip),%ymm11 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12
- .byte 196,98,125,24,45,139,40,2,0 // vbroadcastss 0x2288b(%rip),%ymm13 # 2ae38 <_sk_overlay_sse2_8bit+0x477>
+ .byte 196,98,125,24,45,203,44,2,0 // vbroadcastss 0x22ccb(%rip),%ymm13 # 2b42c <_sk_overlay_sse2_8bit+0x477>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,124,40,2,0 // vbroadcastss 0x2287c(%rip),%ymm12 # 2ae3c <_sk_overlay_sse2_8bit+0x47b>
+ .byte 196,98,125,24,37,188,44,2,0 // vbroadcastss 0x22cbc(%rip),%ymm12 # 2b430 <_sk_overlay_sse2_8bit+0x47b>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,114,40,2,0 // vbroadcastss 0x22872(%rip),%ymm14 # 2ae40 <_sk_overlay_sse2_8bit+0x47f>
+ .byte 196,98,125,24,53,178,44,2,0 // vbroadcastss 0x22cb2(%rip),%ymm14 # 2b434 <_sk_overlay_sse2_8bit+0x47f>
.byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0
.byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -25062,17 +25339,17 @@ HIDDEN _sk_from_srgb_dst_avx
.globl _sk_from_srgb_dst_avx
FUNCTION(_sk_from_srgb_dst_avx)
_sk_from_srgb_dst_avx:
- .byte 196,98,125,24,5,251,39,2,0 // vbroadcastss 0x227fb(%rip),%ymm8 # 2ae34 <_sk_overlay_sse2_8bit+0x473>
+ .byte 196,98,125,24,5,59,44,2,0 // vbroadcastss 0x22c3b(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,217,39,2,0 // vbroadcastss 0x227d9(%rip),%ymm11 # 2ae24 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,29,25,44,2,0 // vbroadcastss 0x22c19(%rip),%ymm11 # 2b418 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,92,89,227 // vmulps %ymm11,%ymm4,%ymm12
- .byte 196,98,125,24,45,223,39,2,0 // vbroadcastss 0x227df(%rip),%ymm13 # 2ae38 <_sk_overlay_sse2_8bit+0x477>
+ .byte 196,98,125,24,45,31,44,2,0 // vbroadcastss 0x22c1f(%rip),%ymm13 # 2b42c <_sk_overlay_sse2_8bit+0x477>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,208,39,2,0 // vbroadcastss 0x227d0(%rip),%ymm12 # 2ae3c <_sk_overlay_sse2_8bit+0x47b>
+ .byte 196,98,125,24,37,16,44,2,0 // vbroadcastss 0x22c10(%rip),%ymm12 # 2b430 <_sk_overlay_sse2_8bit+0x47b>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,198,39,2,0 // vbroadcastss 0x227c6(%rip),%ymm14 # 2ae40 <_sk_overlay_sse2_8bit+0x47f>
+ .byte 196,98,125,24,53,6,44,2,0 // vbroadcastss 0x22c06(%rip),%ymm14 # 2b434 <_sk_overlay_sse2_8bit+0x47f>
.byte 196,193,92,194,230,1 // vcmpltps %ymm14,%ymm4,%ymm4
.byte 196,195,45,74,225,64 // vblendvps %ymm4,%ymm9,%ymm10,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -25099,20 +25376,20 @@ HIDDEN _sk_to_srgb_avx
FUNCTION(_sk_to_srgb_avx)
_sk_to_srgb_avx:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,91,39,2,0 // vbroadcastss 0x2275b(%rip),%ymm8 # 2ae44 <_sk_overlay_sse2_8bit+0x483>
+ .byte 196,98,125,24,5,155,43,2,0 // vbroadcastss 0x22b9b(%rip),%ymm8 # 2b438 <_sk_overlay_sse2_8bit+0x483>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,85,39,2,0 // vbroadcastss 0x22755(%rip),%ymm11 # 2ae4c <_sk_overlay_sse2_8bit+0x48b>
+ .byte 196,98,125,24,29,149,43,2,0 // vbroadcastss 0x22b95(%rip),%ymm11 # 2b440 <_sk_overlay_sse2_8bit+0x48b>
.byte 196,65,52,89,227 // vmulps %ymm11,%ymm9,%ymm12
- .byte 196,98,125,24,45,67,39,2,0 // vbroadcastss 0x22743(%rip),%ymm13 # 2ae48 <_sk_overlay_sse2_8bit+0x487>
+ .byte 196,98,125,24,45,131,43,2,0 // vbroadcastss 0x22b83(%rip),%ymm13 # 2b43c <_sk_overlay_sse2_8bit+0x487>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,52,89,228 // vmulps %ymm12,%ymm9,%ymm12
- .byte 196,98,125,24,53,56,39,2,0 // vbroadcastss 0x22738(%rip),%ymm14 # 2ae50 <_sk_overlay_sse2_8bit+0x48f>
+ .byte 196,98,125,24,53,120,43,2,0 // vbroadcastss 0x22b78(%rip),%ymm14 # 2b444 <_sk_overlay_sse2_8bit+0x48f>
.byte 196,65,28,88,230 // vaddps %ymm14,%ymm12,%ymm12
- .byte 196,98,125,24,61,46,39,2,0 // vbroadcastss 0x2272e(%rip),%ymm15 # 2ae54 <_sk_overlay_sse2_8bit+0x493>
+ .byte 196,98,125,24,61,110,43,2,0 // vbroadcastss 0x22b6e(%rip),%ymm15 # 2b448 <_sk_overlay_sse2_8bit+0x493>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
- .byte 196,98,125,24,37,26,39,2,0 // vbroadcastss 0x2271a(%rip),%ymm12 # 2ae58 <_sk_overlay_sse2_8bit+0x497>
+ .byte 196,98,125,24,37,90,43,2,0 // vbroadcastss 0x22b5a(%rip),%ymm12 # 2b44c <_sk_overlay_sse2_8bit+0x497>
.byte 196,193,124,194,196,1 // vcmpltps %ymm12,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -25144,12 +25421,12 @@ HIDDEN _sk_rgb_to_hsl_avx
.globl _sk_rgb_to_hsl_avx
FUNCTION(_sk_rgb_to_hsl_avx)
_sk_rgb_to_hsl_avx:
- .byte 197,124,95,193 // vmaxps %ymm1,%ymm0,%ymm8
- .byte 197,60,95,194 // vmaxps %ymm2,%ymm8,%ymm8
- .byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9
- .byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9
+ .byte 197,116,95,194 // vmaxps %ymm2,%ymm1,%ymm8
+ .byte 196,65,124,95,192 // vmaxps %ymm8,%ymm0,%ymm8
+ .byte 197,116,93,202 // vminps %ymm2,%ymm1,%ymm9
+ .byte 196,65,124,93,201 // vminps %ymm9,%ymm0,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,40,38,2,0 // vbroadcastss 0x22628(%rip),%ymm11 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,29,102,42,2,0 // vbroadcastss 0x22a66(%rip),%ymm11 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12
@@ -25159,19 +25436,19 @@ _sk_rgb_to_hsl_avx:
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
.byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,85,38,2,0 // vbroadcastss 0x22655(%rip),%ymm11 # 2ae64 <_sk_overlay_sse2_8bit+0x4a3>
+ .byte 196,98,125,24,29,147,42,2,0 // vbroadcastss 0x22a93(%rip),%ymm11 # 2b458 <_sk_overlay_sse2_8bit+0x4a3>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,67,38,2,0 // vbroadcastss 0x22643(%rip),%ymm11 # 2ae60 <_sk_overlay_sse2_8bit+0x49f>
+ .byte 196,98,125,24,29,129,42,2,0 // vbroadcastss 0x22a81(%rip),%ymm11 # 2b454 <_sk_overlay_sse2_8bit+0x49f>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,43,38,2,0 // vbroadcastss 0x2262b(%rip),%ymm2 # 2ae5c <_sk_overlay_sse2_8bit+0x49b>
+ .byte 196,226,125,24,21,105,42,2,0 // vbroadcastss 0x22a69(%rip),%ymm2 # 2b450 <_sk_overlay_sse2_8bit+0x49b>
.byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14
.byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
.byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,37,166,37,2,0 // vbroadcastss 0x225a6(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,228,41,2,0 // vbroadcastss 0x229e4(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2
.byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12
.byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11
@@ -25181,7 +25458,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0
.byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- .byte 196,98,125,24,5,213,37,2,0 // vbroadcastss 0x225d5(%rip),%ymm8 # 2ae68 <_sk_overlay_sse2_8bit+0x4a7>
+ .byte 196,98,125,24,5,19,42,2,0 // vbroadcastss 0x22a13(%rip),%ymm8 # 2b45c <_sk_overlay_sse2_8bit+0x4a7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -25198,7 +25475,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,225 // vmovaps %ymm1,%ymm4
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
- .byte 196,98,125,24,5,50,37,2,0 // vbroadcastss 0x22532(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,112,41,2,0 // vbroadcastss 0x22970(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10
.byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11
@@ -25206,23 +25483,23 @@ _sk_hsl_to_rgb_avx:
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
.byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,29,116,37,2,0 // vbroadcastss 0x22574(%rip),%ymm11 # 2ae6c <_sk_overlay_sse2_8bit+0x4ab>
+ .byte 196,98,125,24,29,178,41,2,0 // vbroadcastss 0x229b2(%rip),%ymm11 # 2b460 <_sk_overlay_sse2_8bit+0x4ab>
.byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,37,70,37,2,0 // vbroadcastss 0x22546(%rip),%ymm12 # 2ae5c <_sk_overlay_sse2_8bit+0x49b>
+ .byte 196,98,125,24,37,132,41,2,0 // vbroadcastss 0x22984(%rip),%ymm12 # 2b450 <_sk_overlay_sse2_8bit+0x49b>
.byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0
- .byte 196,98,125,24,45,64,37,2,0 // vbroadcastss 0x22540(%rip),%ymm13 # 2ae64 <_sk_overlay_sse2_8bit+0x4a3>
+ .byte 196,98,125,24,45,126,41,2,0 // vbroadcastss 0x2297e(%rip),%ymm13 # 2b458 <_sk_overlay_sse2_8bit+0x4a3>
.byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14
.byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14
.byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14
- .byte 196,226,125,24,13,53,37,2,0 // vbroadcastss 0x22535(%rip),%ymm1 # 2ae70 <_sk_overlay_sse2_8bit+0x4af>
+ .byte 196,226,125,24,13,115,41,2,0 // vbroadcastss 0x22973(%rip),%ymm1 # 2b464 <_sk_overlay_sse2_8bit+0x4af>
.byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7
.byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7
.byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14
.byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,53,12,37,2,0 // vbroadcastss 0x2250c(%rip),%ymm14 # 2ae68 <_sk_overlay_sse2_8bit+0x4a7>
+ .byte 196,98,125,24,53,74,41,2,0 // vbroadcastss 0x2294a(%rip),%ymm14 # 2b45c <_sk_overlay_sse2_8bit+0x4a7>
.byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -25241,7 +25518,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6
.byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6
.byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- .byte 196,226,125,24,5,182,36,2,0 // vbroadcastss 0x224b6(%rip),%ymm0 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,226,125,24,5,244,40,2,0 // vbroadcastss 0x228f4(%rip),%ymm0 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
.byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0
.byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3
.byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0
@@ -25296,15 +25573,15 @@ _sk_scale_u8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,75 // jne 8ac5 <_sk_scale_u8_avx+0x64>
+ .byte 117,75 // jne 8c7b <_sk_scale_u8_avx+0x64>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,8,45,2,0 // vpand 0x22d08(%rip),%xmm8,%xmm8 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,57,219,5,82,49,2,0 // vpand 0x23152(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,205,35,2,0 // vbroadcastss 0x223cd(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,11,40,2,0 // vbroadcastss 0x2280b(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -25318,15 +25595,15 @@ _sk_scale_u8_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,166 // ja 8a80 <_sk_scale_u8_avx+0x1f>
+ .byte 119,166 // ja 8c36 <_sk_scale_u8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,123,0,0,0 // lea 0x7b(%rip),%r11 # 8b60 <_sk_scale_u8_avx+0xff>
+ .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 8d14 <_sk_scale_u8_avx+0xfd>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 235,135 // jmp 8a80 <_sk_scale_u8_avx+0x1f>
+ .byte 235,135 // jmp 8c36 <_sk_scale_u8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -25334,7 +25611,7 @@ _sk_scale_u8_avx:
.byte 197,121,110,200 // vmovd %eax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
- .byte 233,94,255,255,255 // jmpq 8a80 <_sk_scale_u8_avx+0x1f>
+ .byte 233,94,255,255,255 // jmpq 8c36 <_sk_scale_u8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -25345,21 +25622,116 @@ _sk_scale_u8_avx:
.byte 196,65,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- .byte 233,34,255,255,255 // jmpq 8a80 <_sk_scale_u8_avx+0x1f>
- .byte 102,144 // xchg %ax,%ax
- .byte 142,255 // mov %edi,%?
+ .byte 233,34,255,255,255 // jmpq 8c36 <_sk_scale_u8_avx+0x1f>
+ .byte 144 // nop
.byte 255 // (bad)
- .byte 255,169,255,255,255,153 // ljmp *-0x66000001(%rcx)
.byte 255 // (bad)
+ .byte 255,171,255,255,255,155 // ljmp *-0x64000001(%rbx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde008b70 <_sk_overlay_sse2_8bit+0xffffffffddfde1af>
.byte 255 // (bad)
+ .byte 234 // (bad)
.byte 255 // (bad)
- .byte 255,210 // callq *%rdx
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,194 // inc %edx
+ .byte 223,255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,212 // callq *%rsp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,196 // inc %esp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // .byte 0xff
+
+HIDDEN _sk_scale_565_avx
+.globl _sk_scale_565_avx
+FUNCTION(_sk_scale_565_avx)
+_sk_scale_565_avx:
+ .byte 83 // push %rbx
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,99,80,8 // movslq 0x8(%rax),%r10
+ .byte 76,99,201 // movslq %ecx,%r9
+ .byte 77,15,175,202 // imul %r10,%r9
+ .byte 77,1,201 // add %r9,%r9
+ .byte 76,3,8 // add (%rax),%r9
+ .byte 72,99,218 // movslq %edx,%rbx
+ .byte 77,133,192 // test %r8,%r8
+ .byte 15,133,178,0,0,0 // jne 8e02 <_sk_scale_565_avx+0xd2>
+ .byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
+ .byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
+ .byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
+ .byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
+ .byte 196,98,125,24,13,252,38,2,0 // vbroadcastss 0x226fc(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
+ .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
+ .byte 196,98,125,24,21,237,38,2,0 // vbroadcastss 0x226ed(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
+ .byte 196,98,125,24,21,227,38,2,0 // vbroadcastss 0x226e3(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
+ .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
+ .byte 196,98,125,24,29,212,38,2,0 // vbroadcastss 0x226d4(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
+ .byte 196,98,125,24,29,202,38,2,0 // vbroadcastss 0x226ca(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
+ .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
+ .byte 196,98,125,24,29,187,38,2,0 // vbroadcastss 0x226bb(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
+ .byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
+ .byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
+ .byte 196,65,52,93,228 // vminps %ymm12,%ymm9,%ymm12
+ .byte 196,65,44,95,232 // vmaxps %ymm8,%ymm10,%ymm13
+ .byte 196,65,52,95,237 // vmaxps %ymm13,%ymm9,%ymm13
+ .byte 196,67,21,74,220,176 // vblendvps %ymm11,%ymm12,%ymm13,%ymm11
+ .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
+ .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
+ .byte 197,188,89,210 // vmulps %ymm2,%ymm8,%ymm2
+ .byte 197,164,89,219 // vmulps %ymm3,%ymm11,%ymm3
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 91 // pop %rbx
+ .byte 255,224 // jmpq *%rax
+ .byte 69,137,194 // mov %r8d,%r10d
+ .byte 65,128,226,7 // and $0x7,%r10b
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 65,254,202 // dec %r10b
+ .byte 65,128,250,6 // cmp $0x6,%r10b
+ .byte 15,135,59,255,255,255 // ja 8d56 <_sk_scale_565_avx+0x26>
+ .byte 69,15,182,210 // movzbl %r10b,%r10d
+ .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 8e8c <_sk_scale_565_avx+0x15c>
+ .byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
+ .byte 76,1,216 // add %r11,%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
+ .byte 197,121,110,192 // vmovd %eax,%xmm8
+ .byte 233,25,255,255,255 // jmpq 8d56 <_sk_scale_565_avx+0x26>
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm9
+ .byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
+ .byte 233,251,254,255,255 // jmpq 8d56 <_sk_scale_565_avx+0x26>
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,57,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
+ .byte 196,65,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm9
+ .byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
+ .byte 233,205,254,255,255 // jmpq 8d56 <_sk_scale_565_avx+0x26>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 236 // in (%dx),%al
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,228 // jmpq *%rsp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 220,255 // fdivr %st,%st(7)
+ .byte 255 // (bad)
+ .byte 255,207 // dec %edi
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -25397,15 +25769,15 @@ _sk_lerp_u8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,111 // jne 8c43 <_sk_lerp_u8_avx+0x88>
+ .byte 117,111 // jne 8f6f <_sk_lerp_u8_avx+0x88>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,174,43,2,0 // vpand 0x22bae(%rip),%xmm8,%xmm8 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,57,219,5,130,46,2,0 // vpand 0x22e82(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,115,34,2,0 // vbroadcastss 0x22273(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,59,37,2,0 // vbroadcastss 0x2253b(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
@@ -25427,15 +25799,15 @@ _sk_lerp_u8_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,130 // ja 8bda <_sk_lerp_u8_avx+0x1f>
+ .byte 119,130 // ja 8f06 <_sk_lerp_u8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,125,0,0,0 // lea 0x7d(%rip),%r11 # 8ce0 <_sk_lerp_u8_avx+0x125>
+ .byte 76,141,29,125,0,0,0 // lea 0x7d(%rip),%r11 # 900c <_sk_lerp_u8_avx+0x125>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 233,96,255,255,255 // jmpq 8bda <_sk_lerp_u8_avx+0x1f>
+ .byte 233,96,255,255,255 // jmpq 8f06 <_sk_lerp_u8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -25443,7 +25815,7 @@ _sk_lerp_u8_avx:
.byte 197,121,110,200 // vmovd %eax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
- .byte 233,55,255,255,255 // jmpq 8bda <_sk_lerp_u8_avx+0x1f>
+ .byte 233,55,255,255,255 // jmpq 8f06 <_sk_lerp_u8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -25454,7 +25826,7 @@ _sk_lerp_u8_avx:
.byte 196,65,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- .byte 233,251,254,255,255 // jmpq 8bda <_sk_lerp_u8_avx+0x1f>
+ .byte 233,251,254,255,255 // jmpq 8f06 <_sk_lerp_u8_avx+0x1f>
.byte 144 // nop
.byte 140,255 // mov %?,%edi
.byte 255 // (bad)
@@ -25462,7 +25834,7 @@ _sk_lerp_u8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf008cf0 <_sk_overlay_sse2_8bit+0xffffffffdefde32f>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf00901c <_sk_overlay_sse2_8bit+0xffffffffdefde067>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -25486,27 +25858,33 @@ _sk_lerp_565_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,209,0,0,0 // jne 8ded <_sk_lerp_565_avx+0xf1>
+ .byte 15,133,214,0,0,0 // jne 911e <_sk_lerp_565_avx+0xf6>
.byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,60,33,2,0 // vbroadcastss 0x2213c(%rip),%ymm9 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,98,125,24,13,4,36,2,0 // vbroadcastss 0x22404(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,45,33,2,0 // vbroadcastss 0x2212d(%rip),%ymm10 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,98,125,24,21,245,35,2,0 // vbroadcastss 0x223f5(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,35,33,2,0 // vbroadcastss 0x22123(%rip),%ymm10 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,98,125,24,21,235,35,2,0 // vbroadcastss 0x223eb(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,20,33,2,0 // vbroadcastss 0x22114(%rip),%ymm11 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,98,125,24,29,220,35,2,0 // vbroadcastss 0x223dc(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,29,10,33,2,0 // vbroadcastss 0x2210a(%rip),%ymm11 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,98,125,24,29,210,35,2,0 // vbroadcastss 0x223d2(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,251,32,2,0 // vbroadcastss 0x220fb(%rip),%ymm11 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,98,125,24,29,195,35,2,0 // vbroadcastss 0x223c3(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
+ .byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
+ .byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
+ .byte 196,65,52,93,228 // vminps %ymm12,%ymm9,%ymm12
+ .byte 196,65,44,95,232 // vmaxps %ymm8,%ymm10,%ymm13
+ .byte 196,65,52,95,237 // vmaxps %ymm13,%ymm9,%ymm13
+ .byte 196,67,21,74,220,176 // vblendvps %ymm11,%ymm12,%ymm13,%ymm11
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
@@ -25517,14 +25895,8 @@ _sk_lerp_565_avx:
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,236,88,214 // vaddps %ymm6,%ymm2,%ymm2
.byte 197,228,92,223 // vsubps %ymm7,%ymm3,%ymm3
- .byte 196,65,100,89,201 // vmulps %ymm9,%ymm3,%ymm9
- .byte 197,52,88,207 // vaddps %ymm7,%ymm9,%ymm9
- .byte 196,65,100,89,210 // vmulps %ymm10,%ymm3,%ymm10
- .byte 197,44,88,215 // vaddps %ymm7,%ymm10,%ymm10
- .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
+ .byte 196,193,100,89,219 // vmulps %ymm11,%ymm3,%ymm3
.byte 197,228,88,223 // vaddps %ymm7,%ymm3,%ymm3
- .byte 197,172,95,219 // vmaxps %ymm3,%ymm10,%ymm3
- .byte 197,180,95,219 // vmaxps %ymm3,%ymm9,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -25533,42 +25905,42 @@ _sk_lerp_565_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,28,255,255,255 // ja 8d22 <_sk_lerp_565_avx+0x26>
+ .byte 15,135,23,255,255,255 // ja 904e <_sk_lerp_565_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 8e74 <_sk_lerp_565_avx+0x178>
+ .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 91a8 <_sk_lerp_565_avx+0x180>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 233,250,254,255,255 // jmpq 8d22 <_sk_lerp_565_avx+0x26>
+ .byte 233,245,254,255,255 // jmpq 904e <_sk_lerp_565_avx+0x26>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,65,57,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm9
.byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
- .byte 233,220,254,255,255 // jmpq 8d22 <_sk_lerp_565_avx+0x26>
+ .byte 233,215,254,255,255 // jmpq 904e <_sk_lerp_565_avx+0x26>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,65,57,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm9
.byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- .byte 233,174,254,255,255 // jmpq 8d22 <_sk_lerp_565_avx+0x26>
- .byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
+ .byte 233,169,254,255,255 // jmpq 904e <_sk_lerp_565_avx+0x26>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,193 // inc %ecx
.byte 255 // (bad)
+ .byte 236 // in (%dx),%al
.byte 255 // (bad)
- .byte 255,180,255,255,255,239,255 // pushq -0x100001(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 255,231 // jmpq *%rdi
+ .byte 255,228 // jmpq *%rsp
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 223,255 // (bad)
+ .byte 220,255 // fdivr %st,%st(7)
.byte 255 // (bad)
- .byte 255,210 // callq *%rdx
+ .byte 255,207 // dec %edi
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -25581,9 +25953,9 @@ _sk_load_tables_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,4,2,0,0 // jne 90a8 <_sk_load_tables_avx+0x218>
+ .byte 15,133,4,2,0,0 // jne 93dc <_sk_load_tables_avx+0x218>
.byte 196,65,125,16,20,145 // vmovupd (%r9,%rdx,4),%ymm10
- .byte 197,125,40,13,14,36,2,0 // vmovapd 0x2240e(%rip),%ymm9 # 2b2c0 <_sk_overlay_sse2_8bit+0x8ff>
+ .byte 197,125,40,13,218,38,2,0 // vmovapd 0x226da(%rip),%ymm9 # 2b8c0 <_sk_overlay_sse2_8bit+0x90b>
.byte 196,193,45,84,201 // vandpd %ymm9,%ymm10,%ymm1
.byte 196,227,125,25,200,1 // vextractf128 $0x1,%ymm1,%xmm0
.byte 196,193,249,126,193 // vmovq %xmm0,%r9
@@ -25675,7 +26047,7 @@ _sk_load_tables_avx:
.byte 196,193,65,114,213,24 // vpsrld $0x18,%xmm13,%xmm7
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,222,29,2,0 // vbroadcastss 0x21dde(%rip),%ymm7 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,61,158,32,2,0 // vbroadcastss 0x2209e(%rip),%ymm7 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
@@ -25685,21 +26057,21 @@ _sk_load_tables_avx:
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,233,253,255,255 // ja 8eaa <_sk_load_tables_avx+0x1a>
+ .byte 15,135,233,253,255,255 // ja 91de <_sk_load_tables_avx+0x1a>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,148,0,0,0 // lea 0x94(%rip),%r11 # 9160 <_sk_load_tables_avx+0x2d0>
+ .byte 76,141,29,148,0,0,0 // lea 0x94(%rip),%r11 # 9494 <_sk_load_tables_avx+0x2d0>
.byte 79,99,20,147 // movslq (%r11,%r10,4),%r10
.byte 77,1,218 // add %r11,%r10
.byte 65,255,226 // jmpq *%r10
.byte 196,65,122,16,20,145 // vmovss (%r9,%rdx,4),%xmm10
- .byte 233,201,253,255,255 // jmpq 8eaa <_sk_load_tables_avx+0x1a>
+ .byte 233,201,253,255,255 // jmpq 91de <_sk_load_tables_avx+0x1a>
.byte 196,193,121,110,68,145,8 // vmovd 0x8(%r9,%rdx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,99,117,12,208,4 // vblendps $0x4,%ymm0,%ymm1,%ymm10
.byte 196,193,123,16,4,145 // vmovsd (%r9,%rdx,4),%xmm0
.byte 196,99,45,13,208,1 // vblendpd $0x1,%ymm0,%ymm10,%ymm10
- .byte 233,162,253,255,255 // jmpq 8eaa <_sk_load_tables_avx+0x1a>
+ .byte 233,162,253,255,255 // jmpq 91de <_sk_load_tables_avx+0x1a>
.byte 196,193,121,110,68,145,24 // vmovd 0x18(%r9,%rdx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -25713,9 +26085,9 @@ _sk_load_tables_avx:
.byte 196,99,45,24,208,1 // vinsertf128 $0x1,%xmm0,%ymm10,%ymm10
.byte 196,193,121,16,4,145 // vmovupd (%r9,%rdx,4),%xmm0
.byte 196,67,125,13,210,12 // vblendpd $0xc,%ymm10,%ymm0,%ymm10
- .byte 233,77,253,255,255 // jmpq 8eaa <_sk_load_tables_avx+0x1a>
+ .byte 233,77,253,255,255 // jmpq 91de <_sk_load_tables_avx+0x1a>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe 9161 <_sk_load_tables_avx+0x2d1>
+ .byte 118,255 // jbe 9495 <_sk_load_tables_avx+0x2d1>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -25744,7 +26116,7 @@ _sk_load_tables_u16_be_avx:
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
.byte 197,252,17,124,36,200 // vmovups %ymm7,-0x38(%rsp)
- .byte 15,133,84,2,0,0 // jne 93ec <_sk_load_tables_u16_be_avx+0x270>
+ .byte 15,133,84,2,0,0 // jne 9720 <_sk_load_tables_u16_be_avx+0x270>
.byte 196,1,121,16,4,81 // vmovupd (%r9,%r10,2),%xmm8
.byte 196,129,121,16,84,81,16 // vmovupd 0x10(%r9,%r10,2),%xmm2
.byte 196,129,121,16,92,81,32 // vmovupd 0x20(%r9,%r10,2),%xmm3
@@ -25759,7 +26131,7 @@ _sk_load_tables_u16_be_avx:
.byte 197,113,105,219 // vpunpckhwd %xmm3,%xmm1,%xmm11
.byte 197,177,108,200 // vpunpcklqdq %xmm0,%xmm9,%xmm1
.byte 197,49,109,224 // vpunpckhqdq %xmm0,%xmm9,%xmm12
- .byte 197,121,111,21,171,37,2,0 // vmovdqa 0x225ab(%rip),%xmm10 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,121,111,21,119,40,2,0 // vmovdqa 0x22877(%rip),%xmm10 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,193,113,219,202 // vpand %xmm10,%xmm1,%xmm1
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,193,113,105,209 // vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -25857,7 +26229,7 @@ _sk_load_tables_u16_be_avx:
.byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,182,26,2,0 // vbroadcastss 0x21ab6(%rip),%ymm7 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,226,125,24,61,118,29,2,0 // vbroadcastss 0x21d76(%rip),%ymm7 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
@@ -25865,29 +26237,29 @@ _sk_load_tables_u16_be_avx:
.byte 196,1,123,16,4,81 // vmovsd (%r9,%r10,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 9452 <_sk_load_tables_u16_be_avx+0x2d6>
+ .byte 116,85 // je 9786 <_sk_load_tables_u16_be_avx+0x2d6>
.byte 196,1,57,22,68,81,8 // vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 9452 <_sk_load_tables_u16_be_avx+0x2d6>
+ .byte 114,72 // jb 9786 <_sk_load_tables_u16_be_avx+0x2d6>
.byte 196,129,123,16,84,81,16 // vmovsd 0x10(%r9,%r10,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 945f <_sk_load_tables_u16_be_avx+0x2e3>
+ .byte 116,72 // je 9793 <_sk_load_tables_u16_be_avx+0x2e3>
.byte 196,129,105,22,84,81,24 // vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 945f <_sk_load_tables_u16_be_avx+0x2e3>
+ .byte 114,59 // jb 9793 <_sk_load_tables_u16_be_avx+0x2e3>
.byte 196,129,123,16,92,81,32 // vmovsd 0x20(%r9,%r10,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,126,253,255,255 // je 91b3 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 15,132,126,253,255,255 // je 94e7 <_sk_load_tables_u16_be_avx+0x37>
.byte 196,129,97,22,92,81,40 // vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,109,253,255,255 // jb 91b3 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 15,130,109,253,255,255 // jb 94e7 <_sk_load_tables_u16_be_avx+0x37>
.byte 196,1,122,126,76,81,48 // vmovq 0x30(%r9,%r10,2),%xmm9
- .byte 233,97,253,255,255 // jmpq 91b3 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,97,253,255,255 // jmpq 94e7 <_sk_load_tables_u16_be_avx+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,84,253,255,255 // jmpq 91b3 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,84,253,255,255 // jmpq 94e7 <_sk_load_tables_u16_be_avx+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,75,253,255,255 // jmpq 91b3 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,75,253,255,255 // jmpq 94e7 <_sk_load_tables_u16_be_avx+0x37>
HIDDEN _sk_load_tables_rgb_u16_be_avx
.globl _sk_load_tables_rgb_u16_be_avx
@@ -25899,7 +26271,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 77,133,192 // test %r8,%r8
.byte 197,252,17,124,36,200 // vmovups %ymm7,-0x38(%rsp)
.byte 197,252,17,116,36,168 // vmovups %ymm6,-0x58(%rsp)
- .byte 15,133,71,2,0,0 // jne 96cd <_sk_load_tables_rgb_u16_be_avx+0x265>
+ .byte 15,133,71,2,0,0 // jne 9a01 <_sk_load_tables_rgb_u16_be_avx+0x265>
.byte 196,129,122,111,4,81 // vmovdqu (%r9,%r10,2),%xmm0
.byte 196,129,122,111,84,81,12 // vmovdqu 0xc(%r9,%r10,2),%xmm2
.byte 196,129,122,111,76,81,24 // vmovdqu 0x18(%r9,%r10,2),%xmm1
@@ -25920,7 +26292,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
.byte 197,57,109,218 // vpunpckhqdq %xmm2,%xmm8,%xmm11
.byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,160,34,2,0 // vmovdqa 0x222a0(%rip),%xmm9 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,121,111,13,108,37,2,0 // vmovdqa 0x2256c(%rip),%xmm9 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -26010,50 +26382,50 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 196,195,105,33,211,48 // vinsertps $0x30,%xmm11,%xmm2,%xmm2
.byte 196,227,109,24,211,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,69,23,2,0 // vbroadcastss 0x21745(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,5,26,2,0 // vbroadcastss 0x21a05(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,16,116,36,168 // vmovups -0x58(%rsp),%ymm6
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0
.byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 96e6 <_sk_load_tables_rgb_u16_be_avx+0x27e>
- .byte 233,212,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 117,5 // jne 9a1a <_sk_load_tables_rgb_u16_be_avx+0x27e>
+ .byte 233,212,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
.byte 196,129,121,110,76,81,6 // vmovd 0x6(%r9,%r10,2),%xmm1
.byte 196,1,113,196,68,81,10,2 // vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 9715 <_sk_load_tables_rgb_u16_be_avx+0x2ad>
+ .byte 114,26 // jb 9a49 <_sk_load_tables_rgb_u16_be_avx+0x2ad>
.byte 196,129,121,110,76,81,12 // vmovd 0xc(%r9,%r10,2),%xmm1
.byte 196,129,113,196,84,81,16,2 // vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 971a <_sk_load_tables_rgb_u16_be_avx+0x2b2>
- .byte 233,165,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 233,160,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 117,10 // jne 9a4e <_sk_load_tables_rgb_u16_be_avx+0x2b2>
+ .byte 233,165,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 233,160,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
.byte 196,129,121,110,76,81,18 // vmovd 0x12(%r9,%r10,2),%xmm1
.byte 196,1,113,196,76,81,22,2 // vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 9749 <_sk_load_tables_rgb_u16_be_avx+0x2e1>
+ .byte 114,26 // jb 9a7d <_sk_load_tables_rgb_u16_be_avx+0x2e1>
.byte 196,129,121,110,76,81,24 // vmovd 0x18(%r9,%r10,2),%xmm1
.byte 196,129,113,196,76,81,28,2 // vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 974e <_sk_load_tables_rgb_u16_be_avx+0x2e6>
- .byte 233,113,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 233,108,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 117,10 // jne 9a82 <_sk_load_tables_rgb_u16_be_avx+0x2e6>
+ .byte 233,113,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 233,108,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
.byte 196,129,121,110,92,81,30 // vmovd 0x1e(%r9,%r10,2),%xmm3
.byte 196,1,97,196,92,81,34,2 // vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 9777 <_sk_load_tables_rgb_u16_be_avx+0x30f>
+ .byte 114,20 // jb 9aab <_sk_load_tables_rgb_u16_be_avx+0x30f>
.byte 196,129,121,110,92,81,36 // vmovd 0x24(%r9,%r10,2),%xmm3
.byte 196,129,97,196,92,81,40,2 // vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- .byte 233,67,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 233,62,253,255,255 // jmpq 94ba <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 233,67,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 233,62,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
HIDDEN _sk_byte_tables_avx
.globl _sk_byte_tables_avx
FUNCTION(_sk_byte_tables_avx)
_sk_byte_tables_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,169,22,2,0 // vbroadcastss 0x216a9(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,105,25,2,0 // vbroadcastss 0x21969(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -26172,7 +26544,7 @@ _sk_byte_tables_avx:
.byte 196,194,121,49,204 // vpmovzxbd %xmm12,%xmm1
.byte 196,194,121,49,213 // vpmovzxbd %xmm13,%xmm2
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- .byte 196,98,125,24,13,151,20,2,0 // vbroadcastss 0x21497(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,87,23,2,0 // vbroadcastss 0x21757(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -26288,7 +26660,7 @@ _sk_byte_tables_rgb_avx:
.byte 196,194,121,49,203 // vpmovzxbd %xmm11,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,116,18,2,0 // vbroadcastss 0x21274(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,52,21,2,0 // vbroadcastss 0x21534(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,121,49,202 // vpmovzxbd %xmm10,%xmm1
.byte 196,194,121,49,212 // vpmovzxbd %xmm12,%xmm2
@@ -26493,36 +26865,36 @@ _sk_parametric_r_avx:
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11
- .byte 196,98,125,24,37,61,15,2,0 // vbroadcastss 0x20f3d(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,37,253,17,2,0 // vbroadcastss 0x211fd(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,51,15,2,0 // vbroadcastss 0x20f33(%rip),%ymm12 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,243,17,2,0 // vbroadcastss 0x211f3(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,137,14,2,0 // vbroadcastss 0x20e89(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,73,17,2,0 // vbroadcastss 0x21149(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,27,15,2,0 // vbroadcastss 0x20f1b(%rip),%ymm12 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,37,219,17,2,0 // vbroadcastss 0x211db(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,17,15,2,0 // vbroadcastss 0x20f11(%rip),%ymm12 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,37,209,17,2,0 // vbroadcastss 0x211d1(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,2,15,2,0 // vbroadcastss 0x20f02(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,194,17,2,0 // vbroadcastss 0x211c2(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,248,14,2,0 // vbroadcastss 0x20ef8(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,184,17,2,0 // vbroadcastss 0x211b8(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
.byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,220,14,2,0 // vbroadcastss 0x20edc(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,156,17,2,0 // vbroadcastss 0x2119c(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,210,14,2,0 // vbroadcastss 0x20ed2(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,146,17,2,0 // vbroadcastss 0x21192(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,195,14,2,0 // vbroadcastss 0x20ec3(%rip),%ymm11 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,98,125,24,29,131,17,2,0 // vbroadcastss 0x21183(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,185,14,2,0 // vbroadcastss 0x20eb9(%rip),%ymm11 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,29,121,17,2,0 // vbroadcastss 0x21179(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,170,14,2,0 // vbroadcastss 0x20eaa(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,106,17,2,0 // vbroadcastss 0x2116a(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -26530,7 +26902,7 @@ _sk_parametric_r_avx:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,193,13,2,0 // vbroadcastss 0x20dc1(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,129,16,2,0 // vbroadcastss 0x21081(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -26552,36 +26924,36 @@ _sk_parametric_g_avx:
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11
- .byte 196,98,125,24,37,2,14,2,0 // vbroadcastss 0x20e02(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,37,194,16,2,0 // vbroadcastss 0x210c2(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,248,13,2,0 // vbroadcastss 0x20df8(%rip),%ymm12 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,184,16,2,0 // vbroadcastss 0x210b8(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,78,13,2,0 // vbroadcastss 0x20d4e(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,14,16,2,0 // vbroadcastss 0x2100e(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,224,13,2,0 // vbroadcastss 0x20de0(%rip),%ymm12 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,37,160,16,2,0 // vbroadcastss 0x210a0(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,214,13,2,0 // vbroadcastss 0x20dd6(%rip),%ymm12 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,37,150,16,2,0 // vbroadcastss 0x21096(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,199,13,2,0 // vbroadcastss 0x20dc7(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,135,16,2,0 // vbroadcastss 0x21087(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,189,13,2,0 // vbroadcastss 0x20dbd(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,125,16,2,0 // vbroadcastss 0x2107d(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1
.byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1
.byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,161,13,2,0 // vbroadcastss 0x20da1(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,97,16,2,0 // vbroadcastss 0x21061(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,151,13,2,0 // vbroadcastss 0x20d97(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,87,16,2,0 // vbroadcastss 0x21057(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,136,13,2,0 // vbroadcastss 0x20d88(%rip),%ymm11 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,98,125,24,29,72,16,2,0 // vbroadcastss 0x21048(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,126,13,2,0 // vbroadcastss 0x20d7e(%rip),%ymm11 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,29,62,16,2,0 // vbroadcastss 0x2103e(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,111,13,2,0 // vbroadcastss 0x20d6f(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,47,16,2,0 // vbroadcastss 0x2102f(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -26589,7 +26961,7 @@ _sk_parametric_g_avx:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,134,12,2,0 // vbroadcastss 0x20c86(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,70,15,2,0 // vbroadcastss 0x20f46(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -26611,36 +26983,36 @@ _sk_parametric_b_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11
- .byte 196,98,125,24,37,199,12,2,0 // vbroadcastss 0x20cc7(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,37,135,15,2,0 // vbroadcastss 0x20f87(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,189,12,2,0 // vbroadcastss 0x20cbd(%rip),%ymm12 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,125,15,2,0 // vbroadcastss 0x20f7d(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,19,12,2,0 // vbroadcastss 0x20c13(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,211,14,2,0 // vbroadcastss 0x20ed3(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,165,12,2,0 // vbroadcastss 0x20ca5(%rip),%ymm12 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,37,101,15,2,0 // vbroadcastss 0x20f65(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,155,12,2,0 // vbroadcastss 0x20c9b(%rip),%ymm12 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,37,91,15,2,0 // vbroadcastss 0x20f5b(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,140,12,2,0 // vbroadcastss 0x20c8c(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,76,15,2,0 // vbroadcastss 0x20f4c(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,130,12,2,0 // vbroadcastss 0x20c82(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,66,15,2,0 // vbroadcastss 0x20f42(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2
.byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,102,12,2,0 // vbroadcastss 0x20c66(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,38,15,2,0 // vbroadcastss 0x20f26(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,92,12,2,0 // vbroadcastss 0x20c5c(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,28,15,2,0 // vbroadcastss 0x20f1c(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,77,12,2,0 // vbroadcastss 0x20c4d(%rip),%ymm11 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,98,125,24,29,13,15,2,0 // vbroadcastss 0x20f0d(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,67,12,2,0 // vbroadcastss 0x20c43(%rip),%ymm11 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,29,3,15,2,0 // vbroadcastss 0x20f03(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,52,12,2,0 // vbroadcastss 0x20c34(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,244,14,2,0 // vbroadcastss 0x20ef4(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -26648,7 +27020,7 @@ _sk_parametric_b_avx:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,75,11,2,0 // vbroadcastss 0x20b4b(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,11,14,2,0 // vbroadcastss 0x20e0b(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -26670,36 +27042,36 @@ _sk_parametric_a_avx:
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11
- .byte 196,98,125,24,37,140,11,2,0 // vbroadcastss 0x20b8c(%rip),%ymm12 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,37,76,14,2,0 // vbroadcastss 0x20e4c(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,130,11,2,0 // vbroadcastss 0x20b82(%rip),%ymm12 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,66,14,2,0 // vbroadcastss 0x20e42(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,216,10,2,0 // vbroadcastss 0x20ad8(%rip),%ymm12 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,152,13,2,0 // vbroadcastss 0x20d98(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,106,11,2,0 // vbroadcastss 0x20b6a(%rip),%ymm12 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,37,42,14,2,0 // vbroadcastss 0x20e2a(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,96,11,2,0 // vbroadcastss 0x20b60(%rip),%ymm12 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,37,32,14,2,0 // vbroadcastss 0x20e20(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,81,11,2,0 // vbroadcastss 0x20b51(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,17,14,2,0 // vbroadcastss 0x20e11(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,71,11,2,0 // vbroadcastss 0x20b47(%rip),%ymm12 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,7,14,2,0 // vbroadcastss 0x20e07(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3
.byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3
.byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,43,11,2,0 // vbroadcastss 0x20b2b(%rip),%ymm11 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,235,13,2,0 // vbroadcastss 0x20deb(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,33,11,2,0 // vbroadcastss 0x20b21(%rip),%ymm11 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,225,13,2,0 // vbroadcastss 0x20de1(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,18,11,2,0 // vbroadcastss 0x20b12(%rip),%ymm11 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,98,125,24,29,210,13,2,0 // vbroadcastss 0x20dd2(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,8,11,2,0 // vbroadcastss 0x20b08(%rip),%ymm11 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,29,200,13,2,0 // vbroadcastss 0x20dc8(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,249,10,2,0 // vbroadcastss 0x20af9(%rip),%ymm10 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,185,13,2,0 // vbroadcastss 0x20db9(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -26707,7 +27079,7 @@ _sk_parametric_a_avx:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,16,10,2,0 // vbroadcastss 0x20a10(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,208,12,2,0 // vbroadcastss 0x20cd0(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -26726,34 +27098,34 @@ _sk_gamma_avx:
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,91,200 // vcvtdq2ps %ymm0,%ymm1
- .byte 196,98,125,24,5,99,10,2,0 // vbroadcastss 0x20a63(%rip),%ymm8 # 2ae98 <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,5,35,13,2,0 // vbroadcastss 0x20d23(%rip),%ymm8 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,89,10,2,0 // vbroadcastss 0x20a59(%rip),%ymm9 # 2ae9c <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,13,25,13,2,0 // vbroadcastss 0x20d19(%rip),%ymm9 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
- .byte 196,226,125,24,37,175,9,2,0 // vbroadcastss 0x209af(%rip),%ymm4 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,37,111,12,2,0 // vbroadcastss 0x20c6f(%rip),%ymm4 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,86,196 // vorps %ymm4,%ymm0,%ymm0
- .byte 196,98,125,24,21,66,10,2,0 // vbroadcastss 0x20a42(%rip),%ymm10 # 2aea0 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,21,2,13,2,0 // vbroadcastss 0x20d02(%rip),%ymm10 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,29,56,10,2,0 // vbroadcastss 0x20a38(%rip),%ymm11 # 2aea4 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,248,12,2,0 // vbroadcastss 0x20cf8(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,193,124,89,211 // vmulps %ymm11,%ymm0,%ymm2
.byte 197,244,92,202 // vsubps %ymm2,%ymm1,%ymm1
- .byte 196,98,125,24,37,42,10,2,0 // vbroadcastss 0x20a2a(%rip),%ymm12 # 2aea8 <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,234,12,2,0 // vbroadcastss 0x20cea(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,45,32,10,2,0 // vbroadcastss 0x20a20(%rip),%ymm13 # 2aeac <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,45,224,12,2,0 // vbroadcastss 0x20ce0(%rip),%ymm13 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,148,94,192 // vdivps %ymm0,%ymm13,%ymm0
.byte 197,244,92,192 // vsubps %ymm0,%ymm1,%ymm0
.byte 196,98,125,24,48 // vbroadcastss (%rax),%ymm14
.byte 196,193,124,89,198 // vmulps %ymm14,%ymm0,%ymm0
.byte 196,227,125,8,200,1 // vroundps $0x1,%ymm0,%ymm1
.byte 197,252,92,241 // vsubps %ymm1,%ymm0,%ymm6
- .byte 196,98,125,24,61,255,9,2,0 // vbroadcastss 0x209ff(%rip),%ymm15 # 2aeb0 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,61,191,12,2,0 // vbroadcastss 0x20cbf(%rip),%ymm15 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,124,88,199 // vaddps %ymm15,%ymm0,%ymm0
- .byte 196,226,125,24,29,245,9,2,0 // vbroadcastss 0x209f5(%rip),%ymm3 # 2aeb4 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,226,125,24,29,181,12,2,0 // vbroadcastss 0x20cb5(%rip),%ymm3 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 197,204,89,203 // vmulps %ymm3,%ymm6,%ymm1
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
- .byte 196,226,125,24,21,232,9,2,0 // vbroadcastss 0x209e8(%rip),%ymm2 # 2aeb8 <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,21,168,12,2,0 // vbroadcastss 0x20ca8(%rip),%ymm2 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
.byte 197,236,92,198 // vsubps %ymm6,%ymm2,%ymm0
- .byte 196,226,125,24,53,223,9,2,0 // vbroadcastss 0x209df(%rip),%ymm6 # 2aebc <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,226,125,24,53,159,12,2,0 // vbroadcastss 0x20c9f(%rip),%ymm6 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,204,94,192 // vdivps %ymm0,%ymm6,%ymm0
.byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
@@ -26795,7 +27167,7 @@ _sk_gamma_avx:
.byte 197,236,92,212 // vsubps %ymm4,%ymm2,%ymm2
.byte 197,204,94,210 // vdivps %ymm2,%ymm6,%ymm2
.byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,34,9,2,0 // vbroadcastss 0x20922(%rip),%ymm2 # 2aec0 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,226,125,24,21,226,11,2,0 // vbroadcastss 0x20be2(%rip),%ymm2 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 197,236,89,92,36,128 // vmulps -0x80(%rsp),%ymm2,%ymm3
.byte 197,252,89,226 // vmulps %ymm2,%ymm0,%ymm4
.byte 197,244,89,210 // vmulps %ymm2,%ymm1,%ymm2
@@ -26815,31 +27187,31 @@ HIDDEN _sk_lab_to_xyz_avx
.globl _sk_lab_to_xyz_avx
FUNCTION(_sk_lab_to_xyz_avx)
_sk_lab_to_xyz_avx:
- .byte 196,98,125,24,5,222,8,2,0 // vbroadcastss 0x208de(%rip),%ymm8 # 2aec4 <_sk_overlay_sse2_8bit+0x503>
+ .byte 196,98,125,24,5,158,11,2,0 // vbroadcastss 0x20b9e(%rip),%ymm8 # 2b4b8 <_sk_overlay_sse2_8bit+0x503>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,60,8,2,0 // vbroadcastss 0x2083c(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,252,10,2,0 // vbroadcastss 0x20afc(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,198,8,2,0 // vbroadcastss 0x208c6(%rip),%ymm9 # 2aec8 <_sk_overlay_sse2_8bit+0x507>
+ .byte 196,98,125,24,13,134,11,2,0 // vbroadcastss 0x20b86(%rip),%ymm9 # 2b4bc <_sk_overlay_sse2_8bit+0x507>
.byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2
- .byte 196,98,125,24,5,178,8,2,0 // vbroadcastss 0x208b2(%rip),%ymm8 # 2aecc <_sk_overlay_sse2_8bit+0x50b>
+ .byte 196,98,125,24,5,114,11,2,0 // vbroadcastss 0x20b72(%rip),%ymm8 # 2b4c0 <_sk_overlay_sse2_8bit+0x50b>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,168,8,2,0 // vbroadcastss 0x208a8(%rip),%ymm8 # 2aed0 <_sk_overlay_sse2_8bit+0x50f>
+ .byte 196,98,125,24,5,104,11,2,0 // vbroadcastss 0x20b68(%rip),%ymm8 # 2b4c4 <_sk_overlay_sse2_8bit+0x50f>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,158,8,2,0 // vbroadcastss 0x2089e(%rip),%ymm8 # 2aed4 <_sk_overlay_sse2_8bit+0x513>
+ .byte 196,98,125,24,5,94,11,2,0 // vbroadcastss 0x20b5e(%rip),%ymm8 # 2b4c8 <_sk_overlay_sse2_8bit+0x513>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1
- .byte 196,98,125,24,5,144,8,2,0 // vbroadcastss 0x20890(%rip),%ymm8 # 2aed8 <_sk_overlay_sse2_8bit+0x517>
+ .byte 196,98,125,24,5,80,11,2,0 // vbroadcastss 0x20b50(%rip),%ymm8 # 2b4cc <_sk_overlay_sse2_8bit+0x517>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2
.byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8
.byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8
- .byte 196,98,125,24,13,121,8,2,0 // vbroadcastss 0x20879(%rip),%ymm9 # 2aedc <_sk_overlay_sse2_8bit+0x51b>
+ .byte 196,98,125,24,13,57,11,2,0 // vbroadcastss 0x20b39(%rip),%ymm9 # 2b4d0 <_sk_overlay_sse2_8bit+0x51b>
.byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,110,8,2,0 // vbroadcastss 0x2086e(%rip),%ymm11 # 2aee0 <_sk_overlay_sse2_8bit+0x51f>
+ .byte 196,98,125,24,29,46,11,2,0 // vbroadcastss 0x20b2e(%rip),%ymm11 # 2b4d4 <_sk_overlay_sse2_8bit+0x51f>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,37,100,8,2,0 // vbroadcastss 0x20864(%rip),%ymm12 # 2aee4 <_sk_overlay_sse2_8bit+0x523>
+ .byte 196,98,125,24,37,36,11,2,0 // vbroadcastss 0x20b24(%rip),%ymm12 # 2b4d8 <_sk_overlay_sse2_8bit+0x523>
.byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1
.byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -26854,9 +27226,9 @@ _sk_lab_to_xyz_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2
.byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- .byte 196,226,125,24,5,26,8,2,0 // vbroadcastss 0x2081a(%rip),%ymm0 # 2aee8 <_sk_overlay_sse2_8bit+0x527>
+ .byte 196,226,125,24,5,218,10,2,0 // vbroadcastss 0x20ada(%rip),%ymm0 # 2b4dc <_sk_overlay_sse2_8bit+0x527>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,17,8,2,0 // vbroadcastss 0x20811(%rip),%ymm8 # 2aeec <_sk_overlay_sse2_8bit+0x52b>
+ .byte 196,98,125,24,5,209,10,2,0 // vbroadcastss 0x20ad1(%rip),%ymm8 # 2b4e0 <_sk_overlay_sse2_8bit+0x52b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -26873,15 +27245,15 @@ _sk_load_a8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,67 // jne a740 <_sk_load_a8_avx+0x5c>
+ .byte 117,67 // jne aa74 <_sk_load_a8_avx+0x5c>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,133,16,2,0 // vpand 0x21085(%rip),%xmm0,%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,249,219,5,81,19,2,0 // vpand 0x21351(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,77,7,2,0 // vbroadcastss 0x2074d(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,13,10,2,0 // vbroadcastss 0x20a0d(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -26894,15 +27266,15 @@ _sk_load_a8_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,175 // ja a703 <_sk_load_a8_avx+0x1f>
+ .byte 119,175 // ja aa37 <_sk_load_a8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # a7d8 <_sk_load_a8_avx+0xf4>
+ .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # ab0c <_sk_load_a8_avx+0xf4>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,144 // jmp a703 <_sk_load_a8_avx+0x1f>
+ .byte 235,144 // jmp aa37 <_sk_load_a8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -26910,7 +27282,7 @@ _sk_load_a8_avx:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,104,255,255,255 // jmpq a703 <_sk_load_a8_avx+0x1f>
+ .byte 233,104,255,255,255 // jmpq aa37 <_sk_load_a8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -26921,7 +27293,7 @@ _sk_load_a8_avx:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,45,255,255,255 // jmpq a703 <_sk_load_a8_avx+0x1f>
+ .byte 233,45,255,255,255 // jmpq aa37 <_sk_load_a8_avx+0x1f>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -26930,7 +27302,7 @@ _sk_load_a8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde00a7e8 <_sk_overlay_sse2_8bit+0xffffffffddfdfe27>
+ .byte 232,255,255,255,221 // callq ffffffffde00ab1c <_sk_overlay_sse2_8bit+0xffffffffddfdfb67>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -26953,15 +27325,15 @@ _sk_load_a8_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,67 // jne a850 <_sk_load_a8_dst_avx+0x5c>
+ .byte 117,67 // jne ab84 <_sk_load_a8_dst_avx+0x5c>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,117,15,2,0 // vpand 0x20f75(%rip),%xmm4,%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,217,219,37,65,18,2,0 // vpand 0x21241(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,61,6,2,0 // vbroadcastss 0x2063d(%rip),%ymm5 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,45,253,8,2,0 // vbroadcastss 0x208fd(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -26974,15 +27346,15 @@ _sk_load_a8_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,175 // ja a813 <_sk_load_a8_dst_avx+0x1f>
+ .byte 119,175 // ja ab47 <_sk_load_a8_dst_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # a8e8 <_sk_load_a8_dst_avx+0xf4>
+ .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # ac1c <_sk_load_a8_dst_avx+0xf4>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,144 // jmp a813 <_sk_load_a8_dst_avx+0x1f>
+ .byte 235,144 // jmp ab47 <_sk_load_a8_dst_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -26990,7 +27362,7 @@ _sk_load_a8_dst_avx:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,104,255,255,255 // jmpq a813 <_sk_load_a8_dst_avx+0x1f>
+ .byte 233,104,255,255,255 // jmpq ab47 <_sk_load_a8_dst_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -27001,7 +27373,7 @@ _sk_load_a8_dst_avx:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,45,255,255,255 // jmpq a813 <_sk_load_a8_dst_avx+0x1f>
+ .byte 233,45,255,255,255 // jmpq ab47 <_sk_load_a8_dst_avx+0x1f>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -27010,7 +27382,7 @@ _sk_load_a8_dst_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde00a8f8 <_sk_overlay_sse2_8bit+0xffffffffddfdff37>
+ .byte 232,255,255,255,221 // callq ffffffffde00ac2c <_sk_overlay_sse2_8bit+0xffffffffddfdfc77>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -27065,7 +27437,7 @@ _sk_gather_a8_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,168,4,2,0 // vbroadcastss 0x204a8(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,104,7,2,0 // vbroadcastss 0x20768(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -27084,14 +27456,14 @@ _sk_store_a8_avx:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,47,4,2,0 // vbroadcastss 0x2042f(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,239,6,2,0 // vbroadcastss 0x206ef(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne aa2b <_sk_store_a8_avx+0x47>
+ .byte 117,11 // jne ad5f <_sk_store_a8_avx+0x47>
.byte 196,65,123,17,4,25 // vmovsd %xmm8,(%r9,%rbx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -27100,25 +27472,25 @@ _sk_store_a8_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja aa26 <_sk_store_a8_avx+0x42>
+ .byte 119,235 // ja ad5a <_sk_store_a8_avx+0x42>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # aaa0 <_sk_store_a8_avx+0xbc>
+ .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # add4 <_sk_store_a8_avx+0xbc>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,20,4,25,0 // vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,201 // jmp aa26 <_sk_store_a8_avx+0x42>
+ .byte 235,201 // jmp ad5a <_sk_store_a8_avx+0x42>
.byte 196,67,121,20,68,25,2,4 // vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- .byte 196,98,57,0,5,50,13,2,0 // vpshufb 0x20d32(%rip),%xmm8,%xmm8 # 2b7a0 <_sk_overlay_sse2_8bit+0xddf>
+ .byte 196,98,57,0,5,254,15,2,0 // vpshufb 0x20ffe(%rip),%xmm8,%xmm8 # 2bda0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 196,67,121,21,4,25,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,175 // jmp aa26 <_sk_store_a8_avx+0x42>
+ .byte 235,175 // jmp ad5a <_sk_store_a8_avx+0x42>
.byte 196,67,121,20,68,25,6,12 // vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
.byte 196,67,121,20,68,25,5,10 // vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
.byte 196,67,121,20,68,25,4,8 // vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- .byte 196,98,57,0,5,24,13,2,0 // vpshufb 0x20d18(%rip),%xmm8,%xmm8 # 2b7b0 <_sk_overlay_sse2_8bit+0xdef>
+ .byte 196,98,57,0,5,228,15,2,0 // vpshufb 0x20fe4(%rip),%xmm8,%xmm8 # 2bdb0 <_sk_overlay_sse2_8bit+0xdfb>
.byte 196,65,121,126,4,25 // vmovd %xmm8,(%r9,%rbx,1)
- .byte 235,134 // jmp aa26 <_sk_store_a8_avx+0x42>
+ .byte 235,134 // jmp ad5a <_sk_store_a8_avx+0x42>
.byte 180,255 // mov $0xff,%ah
.byte 255 // (bad)
.byte 255,197 // inc %ebp
@@ -27151,18 +27523,18 @@ _sk_load_g8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne ab1d <_sk_load_g8_avx+0x61>
+ .byte 117,72 // jne ae51 <_sk_load_g8_avx+0x61>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,173,12,2,0 // vpand 0x20cad(%rip),%xmm0,%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,249,219,5,121,15,2,0 // vpand 0x20f79(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,117,3,2,0 // vbroadcastss 0x20375(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,53,6,2,0 // vbroadcastss 0x20635(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,242,2,2,0 // vbroadcastss 0x202f2(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,178,5,2,0 // vbroadcastss 0x205b2(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -27172,15 +27544,15 @@ _sk_load_g8_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,170 // ja aadb <_sk_load_g8_avx+0x1f>
+ .byte 119,170 // ja ae0f <_sk_load_g8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # abb4 <_sk_load_g8_avx+0xf8>
+ .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # aee8 <_sk_load_g8_avx+0xf8>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,139 // jmp aadb <_sk_load_g8_avx+0x1f>
+ .byte 235,139 // jmp ae0f <_sk_load_g8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -27188,7 +27560,7 @@ _sk_load_g8_avx:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,99,255,255,255 // jmpq aadb <_sk_load_g8_avx+0x1f>
+ .byte 233,99,255,255,255 // jmpq ae0f <_sk_load_g8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -27199,7 +27571,7 @@ _sk_load_g8_avx:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,40,255,255,255 // jmpq aadb <_sk_load_g8_avx+0x1f>
+ .byte 233,40,255,255,255 // jmpq ae0f <_sk_load_g8_avx+0x1f>
.byte 144 // nop
.byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
@@ -27208,7 +27580,7 @@ _sk_load_g8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf00abc4 <_sk_overlay_sse2_8bit+0xffffffffdefe0203>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf00aef8 <_sk_overlay_sse2_8bit+0xffffffffdefdff43>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -27231,18 +27603,18 @@ _sk_load_g8_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne ac31 <_sk_load_g8_dst_avx+0x61>
+ .byte 117,72 // jne af65 <_sk_load_g8_dst_avx+0x61>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,153,11,2,0 // vpand 0x20b99(%rip),%xmm4,%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 197,217,219,37,101,14,2,0 // vpand 0x20e65(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,97,2,2,0 // vbroadcastss 0x20261(%rip),%ymm5 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,45,33,5,2,0 // vbroadcastss 0x20521(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,222,1,2,0 // vbroadcastss 0x201de(%rip),%ymm7 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,61,158,4,2,0 // vbroadcastss 0x2049e(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 91 // pop %rbx
@@ -27252,15 +27624,15 @@ _sk_load_g8_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,170 // ja abef <_sk_load_g8_dst_avx+0x1f>
+ .byte 119,170 // ja af23 <_sk_load_g8_dst_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # acc8 <_sk_load_g8_dst_avx+0xf8>
+ .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # affc <_sk_load_g8_dst_avx+0xf8>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,139 // jmp abef <_sk_load_g8_dst_avx+0x1f>
+ .byte 235,139 // jmp af23 <_sk_load_g8_dst_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -27268,7 +27640,7 @@ _sk_load_g8_dst_avx:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,99,255,255,255 // jmpq abef <_sk_load_g8_dst_avx+0x1f>
+ .byte 233,99,255,255,255 // jmpq af23 <_sk_load_g8_dst_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -27279,7 +27651,7 @@ _sk_load_g8_dst_avx:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,40,255,255,255 // jmpq abef <_sk_load_g8_dst_avx+0x1f>
+ .byte 233,40,255,255,255 // jmpq af23 <_sk_load_g8_dst_avx+0x1f>
.byte 144 // nop
.byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
@@ -27288,7 +27660,7 @@ _sk_load_g8_dst_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf00acd8 <_sk_overlay_sse2_8bit+0xffffffffdefe0317>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf00b00c <_sk_overlay_sse2_8bit+0xffffffffdefe0057>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -27343,10 +27715,10 @@ _sk_gather_g8_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,200,0,2,0 // vbroadcastss 0x200c8(%rip),%ymm1 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,136,3,2,0 // vbroadcastss 0x20388(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,69,0,2,0 // vbroadcastss 0x20045(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,5,3,2,0 // vbroadcastss 0x20305(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -27364,29 +27736,29 @@ _sk_load_565_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,129,0,0,0 // jne ae6a <_sk_load_565_avx+0xa1>
+ .byte 15,133,129,0,0,0 // jne b19e <_sk_load_565_avx+0xa1>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,113,0,2,0 // vbroadcastss 0x20071(%rip),%ymm0 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,24,5,49,3,2,0 // vbroadcastss 0x20331(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,100,0,2,0 // vbroadcastss 0x20064(%rip),%ymm1 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,13,36,3,2,0 // vbroadcastss 0x20324(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,91,0,2,0 // vbroadcastss 0x2005b(%rip),%ymm1 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,24,13,27,3,2,0 // vbroadcastss 0x2031b(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,78,0,2,0 // vbroadcastss 0x2004e(%rip),%ymm3 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,29,14,3,2,0 // vbroadcastss 0x2030e(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,69,0,2,0 // vbroadcastss 0x20045(%rip),%ymm3 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,24,29,5,3,2,0 // vbroadcastss 0x20305(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,56,0,2,0 // vbroadcastss 0x20038(%rip),%ymm3 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,29,248,2,2,0 // vbroadcastss 0x202f8(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,157,255,1,0 // vbroadcastss 0x1ff9d(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,93,2,2,0 // vbroadcastss 0x2025d(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -27394,27 +27766,27 @@ _sk_load_565_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,109,255,255,255 // ja adef <_sk_load_565_avx+0x26>
+ .byte 15,135,109,255,255,255 // ja b123 <_sk_load_565_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # aef0 <_sk_load_565_avx+0x127>
+ .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # b224 <_sk_load_565_avx+0x127>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,75,255,255,255 // jmpq adef <_sk_load_565_avx+0x26>
+ .byte 233,75,255,255,255 // jmpq b123 <_sk_load_565_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,46,255,255,255 // jmpq adef <_sk_load_565_avx+0x26>
+ .byte 233,46,255,255,255 // jmpq b123 <_sk_load_565_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,1,255,255,255 // jmpq adef <_sk_load_565_avx+0x26>
+ .byte 233,1,255,255,255 // jmpq b123 <_sk_load_565_avx+0x26>
.byte 102,144 // xchg %ax,%ax
.byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -27448,29 +27820,29 @@ _sk_load_565_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,129,0,0,0 // jne afad <_sk_load_565_dst_avx+0xa1>
+ .byte 15,133,129,0,0,0 // jne b2e1 <_sk_load_565_dst_avx+0xa1>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,245,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- .byte 196,226,125,24,37,46,255,1,0 // vbroadcastss 0x1ff2e(%rip),%ymm4 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,24,37,238,1,2,0 // vbroadcastss 0x201ee(%rip),%ymm4 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,204,84,228 // vandps %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,33,255,1,0 // vbroadcastss 0x1ff21(%rip),%ymm5 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,45,225,1,2,0 // vbroadcastss 0x201e1(%rip),%ymm5 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,24,255,1,0 // vbroadcastss 0x1ff18(%rip),%ymm5 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,24,45,216,1,2,0 // vbroadcastss 0x201d8(%rip),%ymm5 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,204,84,237 // vandps %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,11,255,1,0 // vbroadcastss 0x1ff0b(%rip),%ymm7 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,61,203,1,2,0 // vbroadcastss 0x201cb(%rip),%ymm7 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,24,61,2,255,1,0 // vbroadcastss 0x1ff02(%rip),%ymm7 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,24,61,194,1,2,0 // vbroadcastss 0x201c2(%rip),%ymm7 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,204,84,247 // vandps %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,245,254,1,0 // vbroadcastss 0x1fef5(%rip),%ymm7 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,61,181,1,2,0 // vbroadcastss 0x201b5(%rip),%ymm7 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,90,254,1,0 // vbroadcastss 0x1fe5a(%rip),%ymm7 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,61,26,1,2,0 // vbroadcastss 0x2011a(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -27478,27 +27850,27 @@ _sk_load_565_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,109,255,255,255 // ja af32 <_sk_load_565_dst_avx+0x26>
+ .byte 15,135,109,255,255,255 // ja b266 <_sk_load_565_dst_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b034 <_sk_load_565_dst_avx+0x128>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b368 <_sk_load_565_dst_avx+0x128>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,75,255,255,255 // jmpq af32 <_sk_load_565_dst_avx+0x26>
+ .byte 233,75,255,255,255 // jmpq b266 <_sk_load_565_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,46,255,255,255 // jmpq af32 <_sk_load_565_dst_avx+0x26>
+ .byte 233,46,255,255,255 // jmpq b266 <_sk_load_565_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,1,255,255,255 // jmpq af32 <_sk_load_565_dst_avx+0x26>
+ .byte 233,1,255,255,255 // jmpq b266 <_sk_load_565_dst_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -27570,23 +27942,23 @@ _sk_gather_565_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,90,253,1,0 // vbroadcastss 0x1fd5a(%rip),%ymm0 # 2ae7c <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,24,5,26,0,2,0 // vbroadcastss 0x2001a(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,77,253,1,0 // vbroadcastss 0x1fd4d(%rip),%ymm1 # 2ae80 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,13,13,0,2,0 // vbroadcastss 0x2000d(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,68,253,1,0 // vbroadcastss 0x1fd44(%rip),%ymm1 # 2ae84 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,24,13,4,0,2,0 // vbroadcastss 0x20004(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,55,253,1,0 // vbroadcastss 0x1fd37(%rip),%ymm3 # 2ae88 <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,29,247,255,1,0 // vbroadcastss 0x1fff7(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,46,253,1,0 // vbroadcastss 0x1fd2e(%rip),%ymm3 # 2ae8c <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,24,29,238,255,1,0 // vbroadcastss 0x1ffee(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,33,253,1,0 // vbroadcastss 0x1fd21(%rip),%ymm3 # 2ae90 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,29,225,255,1,0 // vbroadcastss 0x1ffe1(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,134,252,1,0 // vbroadcastss 0x1fc86(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,70,255,1,0 // vbroadcastss 0x1ff46(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_avx
@@ -27601,14 +27973,14 @@ _sk_store_565_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,80,253,1,0 // vbroadcastss 0x1fd50(%rip),%ymm8 # 2aef0 <_sk_overlay_sse2_8bit+0x52f>
+ .byte 196,98,125,24,5,16,0,2,0 // vbroadcastss 0x20010(%rip),%ymm8 # 2b4e4 <_sk_overlay_sse2_8bit+0x52f>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
.byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- .byte 196,98,125,24,21,41,253,1,0 // vbroadcastss 0x1fd29(%rip),%ymm10 # 2aef4 <_sk_overlay_sse2_8bit+0x533>
+ .byte 196,98,125,24,21,233,255,1,0 // vbroadcastss 0x1ffe9(%rip),%ymm10 # 2b4e8 <_sk_overlay_sse2_8bit+0x533>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11
@@ -27622,7 +27994,7 @@ _sk_store_565_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne b21c <_sk_store_565_avx+0x9c>
+ .byte 117,11 // jne b550 <_sk_store_565_avx+0x9c>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -27631,22 +28003,22 @@ _sk_store_565_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja b217 <_sk_store_565_avx+0x97>
+ .byte 119,235 // ja b54b <_sk_store_565_avx+0x97>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,69,0,0,0 // lea 0x45(%rip),%r11 # b27c <_sk_store_565_avx+0xfc>
+ .byte 76,141,29,69,0,0,0 // lea 0x45(%rip),%r11 # b5b0 <_sk_store_565_avx+0xfc>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp b217 <_sk_store_565_avx+0x97>
+ .byte 235,206 // jmp b54b <_sk_store_565_avx+0x97>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp b217 <_sk_store_565_avx+0x97>
+ .byte 235,190 // jmp b54b <_sk_store_565_avx+0x97>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp b217 <_sk_store_565_avx+0x97>
+ .byte 235,158 // jmp b54b <_sk_store_565_avx+0x97>
.byte 15,31,0 // nopl (%rax)
.byte 196 // (bad)
.byte 255 // (bad)
@@ -27685,31 +28057,31 @@ _sk_load_4444_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,153,0,0,0 // jne b351 <_sk_load_4444_avx+0xb9>
+ .byte 15,133,153,0,0,0 // jne b685 <_sk_load_4444_avx+0xb9>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,30,252,1,0 // vbroadcastss 0x1fc1e(%rip),%ymm0 # 2aef8 <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,24,5,222,254,1,0 // vbroadcastss 0x1fede(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,17,252,1,0 // vbroadcastss 0x1fc11(%rip),%ymm1 # 2aefc <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,13,209,254,1,0 // vbroadcastss 0x1fed1(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,8,252,1,0 // vbroadcastss 0x1fc08(%rip),%ymm1 # 2af00 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,24,13,200,254,1,0 // vbroadcastss 0x1fec8(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,251,251,1,0 // vbroadcastss 0x1fbfb(%rip),%ymm2 # 2af04 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,21,187,254,1,0 // vbroadcastss 0x1febb(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,242,251,1,0 // vbroadcastss 0x1fbf2(%rip),%ymm2 # 2af08 <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,24,21,178,254,1,0 // vbroadcastss 0x1feb2(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,229,251,1,0 // vbroadcastss 0x1fbe5(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,165,254,1,0 // vbroadcastss 0x1fea5(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,219,251,1,0 // vbroadcastss 0x1fbdb(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,24,5,155,254,1,0 // vbroadcastss 0x1fe9b(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,205,251,1,0 // vbroadcastss 0x1fbcd(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,141,254,1,0 // vbroadcastss 0x1fe8d(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -27719,27 +28091,27 @@ _sk_load_4444_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,85,255,255,255 // ja b2be <_sk_load_4444_avx+0x26>
+ .byte 15,135,85,255,255,255 // ja b5f2 <_sk_load_4444_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b3d8 <_sk_load_4444_avx+0x140>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b70c <_sk_load_4444_avx+0x140>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,51,255,255,255 // jmpq b2be <_sk_load_4444_avx+0x26>
+ .byte 233,51,255,255,255 // jmpq b5f2 <_sk_load_4444_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,22,255,255,255 // jmpq b2be <_sk_load_4444_avx+0x26>
+ .byte 233,22,255,255,255 // jmpq b5f2 <_sk_load_4444_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,233,254,255,255 // jmpq b2be <_sk_load_4444_avx+0x26>
+ .byte 233,233,254,255,255 // jmpq b5f2 <_sk_load_4444_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -27776,31 +28148,31 @@ _sk_load_4444_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,153,0,0,0 // jne b4ad <_sk_load_4444_dst_avx+0xb9>
+ .byte 15,133,153,0,0,0 // jne b7e1 <_sk_load_4444_dst_avx+0xb9>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,253,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- .byte 196,226,125,24,37,194,250,1,0 // vbroadcastss 0x1fac2(%rip),%ymm4 # 2aef8 <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,24,37,130,253,1,0 // vbroadcastss 0x1fd82(%rip),%ymm4 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
.byte 197,196,84,228 // vandps %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,181,250,1,0 // vbroadcastss 0x1fab5(%rip),%ymm5 # 2aefc <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,45,117,253,1,0 // vbroadcastss 0x1fd75(%rip),%ymm5 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,172,250,1,0 // vbroadcastss 0x1faac(%rip),%ymm5 # 2af00 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,24,45,108,253,1,0 // vbroadcastss 0x1fd6c(%rip),%ymm5 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,196,84,237 // vandps %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,159,250,1,0 // vbroadcastss 0x1fa9f(%rip),%ymm6 # 2af04 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,53,95,253,1,0 // vbroadcastss 0x1fd5f(%rip),%ymm6 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,24,53,150,250,1,0 // vbroadcastss 0x1fa96(%rip),%ymm6 # 2af08 <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,24,53,86,253,1,0 // vbroadcastss 0x1fd56(%rip),%ymm6 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
.byte 197,196,84,246 // vandps %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,137,250,1,0 // vbroadcastss 0x1fa89(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,73,253,1,0 // vbroadcastss 0x1fd49(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,24,5,127,250,1,0 // vbroadcastss 0x1fa7f(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,24,5,63,253,1,0 // vbroadcastss 0x1fd3f(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,68,84,248 // vandps %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,113,250,1,0 // vbroadcastss 0x1fa71(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,49,253,1,0 // vbroadcastss 0x1fd31(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -27810,27 +28182,27 @@ _sk_load_4444_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,85,255,255,255 // ja b41a <_sk_load_4444_dst_avx+0x26>
+ .byte 15,135,85,255,255,255 // ja b74e <_sk_load_4444_dst_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b534 <_sk_load_4444_dst_avx+0x140>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b868 <_sk_load_4444_dst_avx+0x140>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,51,255,255,255 // jmpq b41a <_sk_load_4444_dst_avx+0x26>
+ .byte 233,51,255,255,255 // jmpq b74e <_sk_load_4444_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,22,255,255,255 // jmpq b41a <_sk_load_4444_dst_avx+0x26>
+ .byte 233,22,255,255,255 // jmpq b74e <_sk_load_4444_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,233,254,255,255 // jmpq b41a <_sk_load_4444_dst_avx+0x26>
+ .byte 233,233,254,255,255 // jmpq b74e <_sk_load_4444_dst_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -27902,25 +28274,25 @@ _sk_gather_4444_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,214,248,1,0 // vbroadcastss 0x1f8d6(%rip),%ymm0 # 2aef8 <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,24,5,150,251,1,0 // vbroadcastss 0x1fb96(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,201,248,1,0 // vbroadcastss 0x1f8c9(%rip),%ymm1 # 2aefc <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,13,137,251,1,0 // vbroadcastss 0x1fb89(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,192,248,1,0 // vbroadcastss 0x1f8c0(%rip),%ymm1 # 2af00 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,24,13,128,251,1,0 // vbroadcastss 0x1fb80(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,179,248,1,0 // vbroadcastss 0x1f8b3(%rip),%ymm2 # 2af04 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,21,115,251,1,0 // vbroadcastss 0x1fb73(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,170,248,1,0 // vbroadcastss 0x1f8aa(%rip),%ymm2 # 2af08 <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,24,21,106,251,1,0 // vbroadcastss 0x1fb6a(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,157,248,1,0 // vbroadcastss 0x1f89d(%rip),%ymm8 # 2af0c <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,93,251,1,0 // vbroadcastss 0x1fb5d(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,147,248,1,0 // vbroadcastss 0x1f893(%rip),%ymm8 # 2af10 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,24,5,83,251,1,0 // vbroadcastss 0x1fb53(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,133,248,1,0 // vbroadcastss 0x1f885(%rip),%ymm8 # 2af14 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,69,251,1,0 // vbroadcastss 0x1fb45(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -27937,7 +28309,7 @@ _sk_store_4444_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,96,248,1,0 // vbroadcastss 0x1f860(%rip),%ymm8 # 2af18 <_sk_overlay_sse2_8bit+0x557>
+ .byte 196,98,125,24,5,32,251,1,0 // vbroadcastss 0x1fb20(%rip),%ymm8 # 2b50c <_sk_overlay_sse2_8bit+0x557>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10
@@ -27964,7 +28336,7 @@ _sk_store_4444_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne b752 <_sk_store_4444_avx+0xba>
+ .byte 117,11 // jne ba86 <_sk_store_4444_avx+0xba>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -27973,22 +28345,22 @@ _sk_store_4444_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja b74d <_sk_store_4444_avx+0xb5>
+ .byte 119,235 // ja ba81 <_sk_store_4444_avx+0xb5>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,67,0,0,0 // lea 0x43(%rip),%r11 # b7b0 <_sk_store_4444_avx+0x118>
+ .byte 76,141,29,67,0,0,0 // lea 0x43(%rip),%r11 # bae4 <_sk_store_4444_avx+0x118>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp b74d <_sk_store_4444_avx+0xb5>
+ .byte 235,206 // jmp ba81 <_sk_store_4444_avx+0xb5>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp b74d <_sk_store_4444_avx+0xb5>
+ .byte 235,190 // jmp ba81 <_sk_store_4444_avx+0xb5>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp b74d <_sk_store_4444_avx+0xb5>
+ .byte 235,158 // jmp ba81 <_sk_store_4444_avx+0xb5>
.byte 144 // nop
.byte 198 // (bad)
.byte 255 // (bad)
@@ -28027,12 +28399,12 @@ _sk_load_8888_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne b875 <_sk_load_8888_avx+0xa9>
+ .byte 15,133,136,0,0,0 // jne bba9 <_sk_load_8888_avx+0xa9>
.byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9
- .byte 197,125,40,21,229,250,1,0 // vmovapd 0x1fae5(%rip),%ymm10 # 2b2e0 <_sk_overlay_sse2_8bit+0x91f>
+ .byte 197,125,40,21,177,253,1,0 // vmovapd 0x1fdb1(%rip),%ymm10 # 2b8e0 <_sk_overlay_sse2_8bit+0x92b>
.byte 196,193,53,84,194 // vandpd %ymm10,%ymm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,107,246,1,0 // vbroadcastss 0x1f66b(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,43,249,1,0 // vbroadcastss 0x1f92b(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,193,113,114,209,8 // vpsrld $0x8,%xmm9,%xmm1
.byte 196,99,125,25,203,1 // vextractf128 $0x1,%ymm9,%xmm3
@@ -28060,21 +28432,21 @@ _sk_load_8888_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,101,255,255,255 // ja b7f3 <_sk_load_8888_avx+0x27>
+ .byte 15,135,101,255,255,255 // ja bb27 <_sk_load_8888_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # b92c <_sk_load_8888_avx+0x160>
+ .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # bc60 <_sk_load_8888_avx+0x160>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9
- .byte 233,70,255,255,255 // jmpq b7f3 <_sk_load_8888_avx+0x27>
+ .byte 233,70,255,255,255 // jmpq bb27 <_sk_load_8888_avx+0x27>
.byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,99,117,12,200,4 // vblendps $0x4,%ymm0,%ymm1,%ymm9
.byte 196,193,123,16,4,153 // vmovsd (%r9,%rbx,4),%xmm0
.byte 196,99,53,13,200,1 // vblendpd $0x1,%ymm0,%ymm9,%ymm9
- .byte 233,31,255,255,255 // jmpq b7f3 <_sk_load_8888_avx+0x27>
+ .byte 233,31,255,255,255 // jmpq bb27 <_sk_load_8888_avx+0x27>
.byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -28088,9 +28460,9 @@ _sk_load_8888_avx:
.byte 196,99,53,24,200,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
.byte 196,193,121,16,4,153 // vmovupd (%r9,%rbx,4),%xmm0
.byte 196,67,125,13,201,12 // vblendpd $0xc,%ymm9,%ymm0,%ymm9
- .byte 233,202,254,255,255 // jmpq b7f3 <_sk_load_8888_avx+0x27>
+ .byte 233,202,254,255,255 // jmpq bb27 <_sk_load_8888_avx+0x27>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe b92d <_sk_load_8888_avx+0x161>
+ .byte 118,255 // jbe bc61 <_sk_load_8888_avx+0x161>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -28123,12 +28495,12 @@ _sk_load_8888_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne b9f1 <_sk_load_8888_dst_avx+0xa9>
+ .byte 15,133,136,0,0,0 // jne bd25 <_sk_load_8888_dst_avx+0xa9>
.byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9
- .byte 197,125,40,21,137,249,1,0 // vmovapd 0x1f989(%rip),%ymm10 # 2b300 <_sk_overlay_sse2_8bit+0x93f>
+ .byte 197,125,40,21,85,252,1,0 // vmovapd 0x1fc55(%rip),%ymm10 # 2b900 <_sk_overlay_sse2_8bit+0x94b>
.byte 196,193,53,84,226 // vandpd %ymm10,%ymm9,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,239,244,1,0 // vbroadcastss 0x1f4ef(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,175,247,1,0 // vbroadcastss 0x1f7af(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 196,193,81,114,209,8 // vpsrld $0x8,%xmm9,%xmm5
.byte 196,99,125,25,207,1 // vextractf128 $0x1,%ymm9,%xmm7
@@ -28156,21 +28528,21 @@ _sk_load_8888_dst_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,101,255,255,255 // ja b96f <_sk_load_8888_dst_avx+0x27>
+ .byte 15,135,101,255,255,255 // ja bca3 <_sk_load_8888_dst_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # baa8 <_sk_load_8888_dst_avx+0x160>
+ .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # bddc <_sk_load_8888_dst_avx+0x160>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9
- .byte 233,70,255,255,255 // jmpq b96f <_sk_load_8888_dst_avx+0x27>
+ .byte 233,70,255,255,255 // jmpq bca3 <_sk_load_8888_dst_avx+0x27>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
.byte 196,99,85,12,204,4 // vblendps $0x4,%ymm4,%ymm5,%ymm9
.byte 196,193,123,16,36,153 // vmovsd (%r9,%rbx,4),%xmm4
.byte 196,99,53,13,204,1 // vblendpd $0x1,%ymm4,%ymm9,%ymm9
- .byte 233,31,255,255,255 // jmpq b96f <_sk_load_8888_dst_avx+0x27>
+ .byte 233,31,255,255,255 // jmpq bca3 <_sk_load_8888_dst_avx+0x27>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -28184,9 +28556,9 @@ _sk_load_8888_dst_avx:
.byte 196,99,53,24,204,1 // vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
.byte 196,193,121,16,36,153 // vmovupd (%r9,%rbx,4),%xmm4
.byte 196,67,93,13,201,12 // vblendpd $0xc,%ymm9,%ymm4,%ymm9
- .byte 233,202,254,255,255 // jmpq b96f <_sk_load_8888_dst_avx+0x27>
+ .byte 233,202,254,255,255 // jmpq bca3 <_sk_load_8888_dst_avx+0x27>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe baa9 <_sk_load_8888_dst_avx+0x161>
+ .byte 118,255 // jbe bddd <_sk_load_8888_dst_avx+0x161>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -28243,10 +28615,10 @@ _sk_gather_8888_avx:
.byte 73,193,234,32 // shr $0x20,%r10
.byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,21,177,247,1,0 // vmovaps 0x1f7b1(%rip),%ymm10 # 2b320 <_sk_overlay_sse2_8bit+0x95f>
+ .byte 197,124,40,21,125,250,1,0 // vmovaps 0x1fa7d(%rip),%ymm10 # 2b920 <_sk_overlay_sse2_8bit+0x96b>
.byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,247,242,1,0 // vbroadcastss 0x1f2f7(%rip),%ymm9 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,183,245,1,0 // vbroadcastss 0x1f5b7(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1
.byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2
@@ -28280,7 +28652,7 @@ _sk_store_8888_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,45,242,1,0 // vbroadcastss 0x1f22d(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,237,244,1,0 // vbroadcastss 0x1f4ed(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -28305,7 +28677,7 @@ _sk_store_8888_avx:
.byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8
.byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne bc92 <_sk_store_8888_avx+0xb0>
+ .byte 117,11 // jne bfc6 <_sk_store_8888_avx+0xb0>
.byte 196,65,124,17,4,153 // vmovups %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -28314,17 +28686,17 @@ _sk_store_8888_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja bc8d <_sk_store_8888_avx+0xab>
+ .byte 119,235 // ja bfc1 <_sk_store_8888_avx+0xab>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # bd00 <_sk_store_8888_avx+0x11e>
+ .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # c034 <_sk_store_8888_avx+0x11e>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,207 // jmp bc8d <_sk_store_8888_avx+0xab>
+ .byte 235,207 // jmp bfc1 <_sk_store_8888_avx+0xab>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 235,191 // jmp bc8d <_sk_store_8888_avx+0xab>
+ .byte 235,191 // jmp bfc1 <_sk_store_8888_avx+0xab>
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -28332,7 +28704,7 @@ _sk_store_8888_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,65,122,17,76,153,16 // vmovss %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,121,17,4,153 // vmovupd %xmm8,(%r9,%rbx,4)
- .byte 235,142 // jmp bc8d <_sk_store_8888_avx+0xab>
+ .byte 235,142 // jmp bfc1 <_sk_store_8888_avx+0xab>
.byte 144 // nop
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -28368,12 +28740,12 @@ _sk_load_bgra_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne bdc5 <_sk_load_bgra_avx+0xa9>
+ .byte 15,133,136,0,0,0 // jne c0f9 <_sk_load_bgra_avx+0xa9>
.byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9
- .byte 197,125,40,21,245,245,1,0 // vmovapd 0x1f5f5(%rip),%ymm10 # 2b340 <_sk_overlay_sse2_8bit+0x97f>
+ .byte 197,125,40,21,193,248,1,0 // vmovapd 0x1f8c1(%rip),%ymm10 # 2b940 <_sk_overlay_sse2_8bit+0x98b>
.byte 196,193,53,84,202 // vandpd %ymm10,%ymm9,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,98,125,24,5,27,241,1,0 // vbroadcastss 0x1f11b(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,219,243,1,0 // vbroadcastss 0x1f3db(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,116,89,208 // vmulps %ymm8,%ymm1,%ymm2
.byte 196,193,113,114,209,8 // vpsrld $0x8,%xmm9,%xmm1
.byte 196,99,125,25,203,1 // vextractf128 $0x1,%ymm9,%xmm3
@@ -28401,21 +28773,21 @@ _sk_load_bgra_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,101,255,255,255 // ja bd43 <_sk_load_bgra_avx+0x27>
+ .byte 15,135,101,255,255,255 // ja c077 <_sk_load_bgra_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # be7c <_sk_load_bgra_avx+0x160>
+ .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # c1b0 <_sk_load_bgra_avx+0x160>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9
- .byte 233,70,255,255,255 // jmpq bd43 <_sk_load_bgra_avx+0x27>
+ .byte 233,70,255,255,255 // jmpq c077 <_sk_load_bgra_avx+0x27>
.byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,99,117,12,200,4 // vblendps $0x4,%ymm0,%ymm1,%ymm9
.byte 196,193,123,16,4,153 // vmovsd (%r9,%rbx,4),%xmm0
.byte 196,99,53,13,200,1 // vblendpd $0x1,%ymm0,%ymm9,%ymm9
- .byte 233,31,255,255,255 // jmpq bd43 <_sk_load_bgra_avx+0x27>
+ .byte 233,31,255,255,255 // jmpq c077 <_sk_load_bgra_avx+0x27>
.byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -28429,9 +28801,9 @@ _sk_load_bgra_avx:
.byte 196,99,53,24,200,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
.byte 196,193,121,16,4,153 // vmovupd (%r9,%rbx,4),%xmm0
.byte 196,67,125,13,201,12 // vblendpd $0xc,%ymm9,%ymm0,%ymm9
- .byte 233,202,254,255,255 // jmpq bd43 <_sk_load_bgra_avx+0x27>
+ .byte 233,202,254,255,255 // jmpq c077 <_sk_load_bgra_avx+0x27>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe be7d <_sk_load_bgra_avx+0x161>
+ .byte 118,255 // jbe c1b1 <_sk_load_bgra_avx+0x161>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -28464,12 +28836,12 @@ _sk_load_bgra_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne bf41 <_sk_load_bgra_dst_avx+0xa9>
+ .byte 15,133,136,0,0,0 // jne c275 <_sk_load_bgra_dst_avx+0xa9>
.byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9
- .byte 197,125,40,21,153,244,1,0 // vmovapd 0x1f499(%rip),%ymm10 # 2b360 <_sk_overlay_sse2_8bit+0x99f>
+ .byte 197,125,40,21,101,247,1,0 // vmovapd 0x1f765(%rip),%ymm10 # 2b960 <_sk_overlay_sse2_8bit+0x9ab>
.byte 196,193,53,84,234 // vandpd %ymm10,%ymm9,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,98,125,24,5,159,239,1,0 // vbroadcastss 0x1ef9f(%rip),%ymm8 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,95,242,1,0 // vbroadcastss 0x1f25f(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,84,89,240 // vmulps %ymm8,%ymm5,%ymm6
.byte 196,193,81,114,209,8 // vpsrld $0x8,%xmm9,%xmm5
.byte 196,99,125,25,207,1 // vextractf128 $0x1,%ymm9,%xmm7
@@ -28497,21 +28869,21 @@ _sk_load_bgra_dst_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,101,255,255,255 // ja bebf <_sk_load_bgra_dst_avx+0x27>
+ .byte 15,135,101,255,255,255 // ja c1f3 <_sk_load_bgra_dst_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # bff8 <_sk_load_bgra_dst_avx+0x160>
+ .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # c32c <_sk_load_bgra_dst_avx+0x160>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9
- .byte 233,70,255,255,255 // jmpq bebf <_sk_load_bgra_dst_avx+0x27>
+ .byte 233,70,255,255,255 // jmpq c1f3 <_sk_load_bgra_dst_avx+0x27>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
.byte 196,99,85,12,204,4 // vblendps $0x4,%ymm4,%ymm5,%ymm9
.byte 196,193,123,16,36,153 // vmovsd (%r9,%rbx,4),%xmm4
.byte 196,99,53,13,204,1 // vblendpd $0x1,%ymm4,%ymm9,%ymm9
- .byte 233,31,255,255,255 // jmpq bebf <_sk_load_bgra_dst_avx+0x27>
+ .byte 233,31,255,255,255 // jmpq c1f3 <_sk_load_bgra_dst_avx+0x27>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -28525,9 +28897,9 @@ _sk_load_bgra_dst_avx:
.byte 196,99,53,24,204,1 // vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
.byte 196,193,121,16,36,153 // vmovupd (%r9,%rbx,4),%xmm4
.byte 196,67,93,13,201,12 // vblendpd $0xc,%ymm9,%ymm4,%ymm9
- .byte 233,202,254,255,255 // jmpq bebf <_sk_load_bgra_dst_avx+0x27>
+ .byte 233,202,254,255,255 // jmpq c1f3 <_sk_load_bgra_dst_avx+0x27>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe bff9 <_sk_load_bgra_dst_avx+0x161>
+ .byte 118,255 // jbe c32d <_sk_load_bgra_dst_avx+0x161>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -28584,10 +28956,10 @@ _sk_gather_bgra_avx:
.byte 73,193,234,32 // shr $0x20,%r10
.byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,13,193,242,1,0 // vmovaps 0x1f2c1(%rip),%ymm9 # 2b380 <_sk_overlay_sse2_8bit+0x9bf>
+ .byte 197,124,40,13,141,245,1,0 // vmovaps 0x1f58d(%rip),%ymm9 # 2b980 <_sk_overlay_sse2_8bit+0x9cb>
.byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,167,237,1,0 // vbroadcastss 0x1eda7(%rip),%ymm10 # 2ae78 <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,21,103,240,1,0 // vbroadcastss 0x1f067(%rip),%ymm10 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,210 // vmulps %ymm10,%ymm0,%ymm2
.byte 196,193,121,114,208,8 // vpsrld $0x8,%xmm8,%xmm0
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
@@ -28621,7 +28993,7 @@ _sk_store_bgra_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,221,236,1,0 // vbroadcastss 0x1ecdd(%rip),%ymm8 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,157,239,1,0 // vbroadcastss 0x1ef9d(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -28646,7 +29018,7 @@ _sk_store_bgra_avx:
.byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8
.byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne c1e2 <_sk_store_bgra_avx+0xb0>
+ .byte 117,11 // jne c516 <_sk_store_bgra_avx+0xb0>
.byte 196,65,124,17,4,153 // vmovups %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -28655,17 +29027,17 @@ _sk_store_bgra_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja c1dd <_sk_store_bgra_avx+0xab>
+ .byte 119,235 // ja c511 <_sk_store_bgra_avx+0xab>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # c250 <_sk_store_bgra_avx+0x11e>
+ .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # c584 <_sk_store_bgra_avx+0x11e>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,207 // jmp c1dd <_sk_store_bgra_avx+0xab>
+ .byte 235,207 // jmp c511 <_sk_store_bgra_avx+0xab>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 235,191 // jmp c1dd <_sk_store_bgra_avx+0xab>
+ .byte 235,191 // jmp c511 <_sk_store_bgra_avx+0xab>
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -28673,7 +29045,7 @@ _sk_store_bgra_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,65,122,17,76,153,16 // vmovss %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,121,17,4,153 // vmovupd %xmm8,(%r9,%rbx,4)
- .byte 235,142 // jmp c1dd <_sk_store_bgra_avx+0xab>
+ .byte 235,142 // jmp c511 <_sk_store_bgra_avx+0xab>
.byte 144 // nop
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -28713,7 +29085,7 @@ _sk_load_f16_avx:
.byte 197,252,17,116,36,192 // vmovups %ymm6,-0x40(%rsp)
.byte 197,252,17,108,36,160 // vmovups %ymm5,-0x60(%rsp)
.byte 197,254,127,100,36,128 // vmovdqu %ymm4,-0x80(%rsp)
- .byte 15,133,145,2,0,0 // jne c539 <_sk_load_f16_avx+0x2cd>
+ .byte 15,133,145,2,0,0 // jne c86d <_sk_load_f16_avx+0x2cd>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,84,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm2
.byte 196,193,121,16,76,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm1
@@ -28731,13 +29103,13 @@ _sk_load_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,123,236,1,0 // vbroadcastss 0x1ec7b(%rip),%ymm12 # 2af80 <_sk_overlay_sse2_8bit+0x5bf>
+ .byte 196,98,125,24,37,59,239,1,0 // vbroadcastss 0x1ef3b(%rip),%ymm12 # 2b574 <_sk_overlay_sse2_8bit+0x5bf>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,63,236,1,0 // vbroadcastss 0x1ec3f(%rip),%xmm11 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,121,24,29,255,238,1,0 // vbroadcastss 0x1eeff(%rip),%xmm11 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,89,236,1,0 // vbroadcastss 0x1ec59(%rip),%xmm13 # 2af84 <_sk_overlay_sse2_8bit+0x5c3>
+ .byte 196,98,121,24,45,25,239,1,0 // vbroadcastss 0x1ef19(%rip),%xmm13 # 2b578 <_sk_overlay_sse2_8bit+0x5c3>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -28751,7 +29123,7 @@ _sk_load_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,15,236,1,0 // vbroadcastss 0x1ec0f(%rip),%xmm3 # 2af88 <_sk_overlay_sse2_8bit+0x5c7>
+ .byte 196,226,121,24,29,207,238,1,0 // vbroadcastss 0x1eecf(%rip),%xmm3 # 2b57c <_sk_overlay_sse2_8bit+0x5c7>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -28844,29 +29216,29 @@ _sk_load_f16_avx:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je c59f <_sk_load_f16_avx+0x333>
+ .byte 116,85 // je c8d3 <_sk_load_f16_avx+0x333>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb c59f <_sk_load_f16_avx+0x333>
+ .byte 114,72 // jb c8d3 <_sk_load_f16_avx+0x333>
.byte 196,193,123,16,84,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je c5ac <_sk_load_f16_avx+0x340>
+ .byte 116,72 // je c8e0 <_sk_load_f16_avx+0x340>
.byte 196,193,105,22,84,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb c5ac <_sk_load_f16_avx+0x340>
+ .byte 114,59 // jb c8e0 <_sk_load_f16_avx+0x340>
.byte 196,193,123,16,76,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,65,253,255,255 // je c2c3 <_sk_load_f16_avx+0x57>
+ .byte 15,132,65,253,255,255 // je c5f7 <_sk_load_f16_avx+0x57>
.byte 196,193,113,22,76,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm1,%xmm1
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,48,253,255,255 // jb c2c3 <_sk_load_f16_avx+0x57>
+ .byte 15,130,48,253,255,255 // jb c5f7 <_sk_load_f16_avx+0x57>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,36,253,255,255 // jmpq c2c3 <_sk_load_f16_avx+0x57>
+ .byte 233,36,253,255,255 // jmpq c5f7 <_sk_load_f16_avx+0x57>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,23,253,255,255 // jmpq c2c3 <_sk_load_f16_avx+0x57>
+ .byte 233,23,253,255,255 // jmpq c5f7 <_sk_load_f16_avx+0x57>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
- .byte 233,14,253,255,255 // jmpq c2c3 <_sk_load_f16_avx+0x57>
+ .byte 233,14,253,255,255 // jmpq c5f7 <_sk_load_f16_avx+0x57>
HIDDEN _sk_load_f16_dst_avx
.globl _sk_load_f16_dst_avx
@@ -28885,7 +29257,7 @@ _sk_load_f16_dst_avx:
.byte 197,252,17,84,36,192 // vmovups %ymm2,-0x40(%rsp)
.byte 197,252,17,76,36,160 // vmovups %ymm1,-0x60(%rsp)
.byte 197,254,127,68,36,128 // vmovdqu %ymm0,-0x80(%rsp)
- .byte 15,133,145,2,0,0 // jne c882 <_sk_load_f16_dst_avx+0x2cd>
+ .byte 15,133,145,2,0,0 // jne cbb6 <_sk_load_f16_dst_avx+0x2cd>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,116,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm6
.byte 196,193,121,16,108,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm5
@@ -28903,13 +29275,13 @@ _sk_load_f16_dst_avx:
.byte 197,217,105,232 // vpunpckhwd %xmm0,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- .byte 196,98,125,24,37,50,233,1,0 // vbroadcastss 0x1e932(%rip),%ymm12 # 2af80 <_sk_overlay_sse2_8bit+0x5bf>
+ .byte 196,98,125,24,37,242,235,1,0 // vbroadcastss 0x1ebf2(%rip),%ymm12 # 2b574 <_sk_overlay_sse2_8bit+0x5bf>
.byte 196,193,92,84,236 // vandps %ymm12,%ymm4,%ymm5
.byte 197,220,87,229 // vxorps %ymm5,%ymm4,%ymm4
.byte 196,195,125,25,230,1 // vextractf128 $0x1,%ymm4,%xmm14
- .byte 196,98,121,24,29,246,232,1,0 // vbroadcastss 0x1e8f6(%rip),%xmm11 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,121,24,29,182,235,1,0 // vbroadcastss 0x1ebb6(%rip),%xmm11 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,8,87,251 // vxorps %xmm11,%xmm14,%xmm7
- .byte 196,98,121,24,45,16,233,1,0 // vbroadcastss 0x1e910(%rip),%xmm13 # 2af84 <_sk_overlay_sse2_8bit+0x5c3>
+ .byte 196,98,121,24,45,208,235,1,0 // vbroadcastss 0x1ebd0(%rip),%xmm13 # 2b578 <_sk_overlay_sse2_8bit+0x5c3>
.byte 197,145,102,255 // vpcmpgtd %xmm7,%xmm13,%xmm7
.byte 196,65,88,87,211 // vxorps %xmm11,%xmm4,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -28923,7 +29295,7 @@ _sk_load_f16_dst_avx:
.byte 196,227,93,24,231,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
.byte 197,220,86,229 // vorps %ymm5,%ymm4,%ymm4
.byte 196,227,125,25,229,1 // vextractf128 $0x1,%ymm4,%xmm5
- .byte 196,226,121,24,61,198,232,1,0 // vbroadcastss 0x1e8c6(%rip),%xmm7 # 2af88 <_sk_overlay_sse2_8bit+0x5c7>
+ .byte 196,226,121,24,61,134,235,1,0 // vbroadcastss 0x1eb86(%rip),%xmm7 # 2b57c <_sk_overlay_sse2_8bit+0x5c7>
.byte 197,209,254,239 // vpaddd %xmm7,%xmm5,%xmm5
.byte 197,217,254,231 // vpaddd %xmm7,%xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -29016,29 +29388,29 @@ _sk_load_f16_dst_avx:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je c8e8 <_sk_load_f16_dst_avx+0x333>
+ .byte 116,85 // je cc1c <_sk_load_f16_dst_avx+0x333>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb c8e8 <_sk_load_f16_dst_avx+0x333>
+ .byte 114,72 // jb cc1c <_sk_load_f16_dst_avx+0x333>
.byte 196,193,123,16,116,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm6
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je c8f5 <_sk_load_f16_dst_avx+0x340>
+ .byte 116,72 // je cc29 <_sk_load_f16_dst_avx+0x340>
.byte 196,193,73,22,116,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb c8f5 <_sk_load_f16_dst_avx+0x340>
+ .byte 114,59 // jb cc29 <_sk_load_f16_dst_avx+0x340>
.byte 196,193,123,16,108,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm5
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,65,253,255,255 // je c60c <_sk_load_f16_dst_avx+0x57>
+ .byte 15,132,65,253,255,255 // je c940 <_sk_load_f16_dst_avx+0x57>
.byte 196,193,81,22,108,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm5,%xmm5
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,48,253,255,255 // jb c60c <_sk_load_f16_dst_avx+0x57>
+ .byte 15,130,48,253,255,255 // jb c940 <_sk_load_f16_dst_avx+0x57>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,36,253,255,255 // jmpq c60c <_sk_load_f16_dst_avx+0x57>
+ .byte 233,36,253,255,255 // jmpq c940 <_sk_load_f16_dst_avx+0x57>
.byte 197,209,87,237 // vxorpd %xmm5,%xmm5,%xmm5
.byte 197,201,87,246 // vxorpd %xmm6,%xmm6,%xmm6
- .byte 233,23,253,255,255 // jmpq c60c <_sk_load_f16_dst_avx+0x57>
+ .byte 233,23,253,255,255 // jmpq c940 <_sk_load_f16_dst_avx+0x57>
.byte 197,209,87,237 // vxorpd %xmm5,%xmm5,%xmm5
- .byte 233,14,253,255,255 // jmpq c60c <_sk_load_f16_dst_avx+0x57>
+ .byte 233,14,253,255,255 // jmpq c940 <_sk_load_f16_dst_avx+0x57>
HIDDEN _sk_gather_f16_avx
.globl _sk_gather_f16_avx
@@ -29099,13 +29471,13 @@ _sk_gather_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,120,229,1,0 // vbroadcastss 0x1e578(%rip),%ymm12 # 2af80 <_sk_overlay_sse2_8bit+0x5bf>
+ .byte 196,98,125,24,37,56,232,1,0 // vbroadcastss 0x1e838(%rip),%ymm12 # 2b574 <_sk_overlay_sse2_8bit+0x5bf>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,60,229,1,0 // vbroadcastss 0x1e53c(%rip),%xmm11 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,121,24,29,252,231,1,0 // vbroadcastss 0x1e7fc(%rip),%xmm11 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,86,229,1,0 // vbroadcastss 0x1e556(%rip),%xmm13 # 2af84 <_sk_overlay_sse2_8bit+0x5c3>
+ .byte 196,98,121,24,45,22,232,1,0 // vbroadcastss 0x1e816(%rip),%xmm13 # 2b578 <_sk_overlay_sse2_8bit+0x5c3>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -29119,7 +29491,7 @@ _sk_gather_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,12,229,1,0 // vbroadcastss 0x1e50c(%rip),%xmm3 # 2af88 <_sk_overlay_sse2_8bit+0x5c7>
+ .byte 196,226,121,24,29,204,231,1,0 // vbroadcastss 0x1e7cc(%rip),%xmm3 # 2b57c <_sk_overlay_sse2_8bit+0x5c7>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -29219,12 +29591,12 @@ _sk_store_f16_avx:
.byte 197,252,17,52,36 // vmovups %ymm6,(%rsp)
.byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp)
.byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp)
- .byte 196,98,125,24,13,252,226,1,0 // vbroadcastss 0x1e2fc(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,188,229,1,0 // vbroadcastss 0x1e5bc(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
.byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11
.byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12
- .byte 196,98,121,24,5,13,227,1,0 // vbroadcastss 0x1e30d(%rip),%xmm8 # 2af8c <_sk_overlay_sse2_8bit+0x5cb>
+ .byte 196,98,121,24,5,205,229,1,0 // vbroadcastss 0x1e5cd(%rip),%xmm8 # 2b580 <_sk_overlay_sse2_8bit+0x5cb>
.byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13
.byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14
.byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -29234,7 +29606,7 @@ _sk_store_f16_avx:
.byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
.byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11
.byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12
- .byte 196,98,125,24,21,212,226,1,0 // vbroadcastss 0x1e2d4(%rip),%ymm10 # 2af90 <_sk_overlay_sse2_8bit+0x5cf>
+ .byte 196,98,125,24,21,148,229,1,0 // vbroadcastss 0x1e594(%rip),%ymm10 # 2b584 <_sk_overlay_sse2_8bit+0x5cf>
.byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14
.byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15
.byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12
@@ -29321,7 +29693,7 @@ _sk_store_f16_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,70 // jne ceb0 <_sk_store_f16_avx+0x274>
+ .byte 117,70 // jne d1e4 <_sk_store_f16_avx+0x274>
.byte 196,65,120,17,28,193 // vmovups %xmm11,(%r9,%rax,8)
.byte 196,65,120,17,84,193,16 // vmovups %xmm10,0x10(%r9,%rax,8)
.byte 196,65,120,17,76,193,32 // vmovups %xmm9,0x20(%r9,%rax,8)
@@ -29337,22 +29709,22 @@ _sk_store_f16_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,193 // vmovq %xmm11,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,201 // je ce85 <_sk_store_f16_avx+0x249>
+ .byte 116,201 // je d1b9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,92,193,8 // vmovhpd %xmm11,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,188 // jb ce85 <_sk_store_f16_avx+0x249>
+ .byte 114,188 // jb d1b9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,84,193,16 // vmovq %xmm10,0x10(%r9,%rax,8)
- .byte 116,179 // je ce85 <_sk_store_f16_avx+0x249>
+ .byte 116,179 // je d1b9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,84,193,24 // vmovhpd %xmm10,0x18(%r9,%rax,8)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,166 // jb ce85 <_sk_store_f16_avx+0x249>
+ .byte 114,166 // jb d1b9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,76,193,32 // vmovq %xmm9,0x20(%r9,%rax,8)
- .byte 116,157 // je ce85 <_sk_store_f16_avx+0x249>
+ .byte 116,157 // je d1b9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,76,193,40 // vmovhpd %xmm9,0x28(%r9,%rax,8)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,144 // jb ce85 <_sk_store_f16_avx+0x249>
+ .byte 114,144 // jb d1b9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,68,193,48 // vmovq %xmm8,0x30(%r9,%rax,8)
- .byte 235,135 // jmp ce85 <_sk_store_f16_avx+0x249>
+ .byte 235,135 // jmp d1b9 <_sk_store_f16_avx+0x249>
HIDDEN _sk_load_u16_be_avx
.globl _sk_load_u16_be_avx
@@ -29367,7 +29739,7 @@ _sk_load_u16_be_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,253,0,0,0 // jne d022 <_sk_load_u16_be_avx+0x124>
+ .byte 15,133,253,0,0,0 // jne d356 <_sk_load_u16_be_avx+0x124>
.byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8
.byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2
.byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -29389,7 +29761,7 @@ _sk_load_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,254,222,1,0 // vbroadcastss 0x1defe(%rip),%ymm11 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,98,125,24,29,190,225,1,0 // vbroadcastss 0x1e1be(%rip),%ymm11 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -29423,29 +29795,29 @@ _sk_load_u16_be_avx:
.byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je d088 <_sk_load_u16_be_avx+0x18a>
+ .byte 116,85 // je d3bc <_sk_load_u16_be_avx+0x18a>
.byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb d088 <_sk_load_u16_be_avx+0x18a>
+ .byte 114,72 // jb d3bc <_sk_load_u16_be_avx+0x18a>
.byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je d095 <_sk_load_u16_be_avx+0x197>
+ .byte 116,72 // je d3c9 <_sk_load_u16_be_avx+0x197>
.byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb d095 <_sk_load_u16_be_avx+0x197>
+ .byte 114,59 // jb d3c9 <_sk_load_u16_be_avx+0x197>
.byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,213,254,255,255 // je cf40 <_sk_load_u16_be_avx+0x42>
+ .byte 15,132,213,254,255,255 // je d274 <_sk_load_u16_be_avx+0x42>
.byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,196,254,255,255 // jb cf40 <_sk_load_u16_be_avx+0x42>
+ .byte 15,130,196,254,255,255 // jb d274 <_sk_load_u16_be_avx+0x42>
.byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9
- .byte 233,184,254,255,255 // jmpq cf40 <_sk_load_u16_be_avx+0x42>
+ .byte 233,184,254,255,255 // jmpq d274 <_sk_load_u16_be_avx+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,171,254,255,255 // jmpq cf40 <_sk_load_u16_be_avx+0x42>
+ .byte 233,171,254,255,255 // jmpq d274 <_sk_load_u16_be_avx+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,162,254,255,255 // jmpq cf40 <_sk_load_u16_be_avx+0x42>
+ .byte 233,162,254,255,255 // jmpq d274 <_sk_load_u16_be_avx+0x42>
HIDDEN _sk_load_rgb_u16_be_avx
.globl _sk_load_rgb_u16_be_avx
@@ -29462,7 +29834,7 @@ _sk_load_rgb_u16_be_avx:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,243,0,0,0 // jne d1bc <_sk_load_rgb_u16_be_avx+0x11e>
+ .byte 15,133,243,0,0,0 // jne d4f0 <_sk_load_rgb_u16_be_avx+0x11e>
.byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0
.byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2
.byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -29489,7 +29861,7 @@ _sk_load_rgb_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,65,221,1,0 // vbroadcastss 0x1dd41(%rip),%ymm11 # 2ae94 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,98,125,24,29,1,224,1,0 // vbroadcastss 0x1e001(%rip),%ymm11 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -29510,41 +29882,41 @@ _sk_load_rgb_u16_be_avx:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,74,220,1,0 // vbroadcastss 0x1dc4a(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,10,223,1,0 // vbroadcastss 0x1df0a(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0
.byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne d1d5 <_sk_load_rgb_u16_be_avx+0x137>
- .byte 233,40,255,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 117,5 // jne d509 <_sk_load_rgb_u16_be_avx+0x137>
+ .byte 233,40,255,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
.byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1
.byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb d204 <_sk_load_rgb_u16_be_avx+0x166>
+ .byte 114,26 // jb d538 <_sk_load_rgb_u16_be_avx+0x166>
.byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1
.byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne d209 <_sk_load_rgb_u16_be_avx+0x16b>
- .byte 233,249,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,244,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 117,10 // jne d53d <_sk_load_rgb_u16_be_avx+0x16b>
+ .byte 233,249,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,244,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
.byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1
.byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb d238 <_sk_load_rgb_u16_be_avx+0x19a>
+ .byte 114,26 // jb d56c <_sk_load_rgb_u16_be_avx+0x19a>
.byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1
.byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne d23d <_sk_load_rgb_u16_be_avx+0x19f>
- .byte 233,197,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,192,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 117,10 // jne d571 <_sk_load_rgb_u16_be_avx+0x19f>
+ .byte 233,197,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,192,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
.byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3
.byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb d266 <_sk_load_rgb_u16_be_avx+0x1c8>
+ .byte 114,20 // jb d59a <_sk_load_rgb_u16_be_avx+0x1c8>
.byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3
.byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- .byte 233,151,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,146,254,255,255 // jmpq d0fd <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,151,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,146,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
HIDDEN _sk_store_u16_be_avx
.globl _sk_store_u16_be_avx
@@ -29558,7 +29930,7 @@ _sk_store_u16_be_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 196,98,125,24,5,138,220,1,0 // vbroadcastss 0x1dc8a(%rip),%ymm8 # 2af1c <_sk_overlay_sse2_8bit+0x55b>
+ .byte 196,98,125,24,5,74,223,1,0 // vbroadcastss 0x1df4a(%rip),%ymm8 # 2b510 <_sk_overlay_sse2_8bit+0x55b>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -29596,7 +29968,7 @@ _sk_store_u16_be_avx:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne d376 <_sk_store_u16_be_avx+0x10b>
+ .byte 117,31 // jne d6aa <_sk_store_u16_be_avx+0x10b>
.byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2)
.byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2)
.byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2)
@@ -29605,22 +29977,22 @@ _sk_store_u16_be_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je d372 <_sk_store_u16_be_avx+0x107>
+ .byte 116,240 // je d6a6 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb d372 <_sk_store_u16_be_avx+0x107>
+ .byte 114,227 // jb d6a6 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2)
- .byte 116,218 // je d372 <_sk_store_u16_be_avx+0x107>
+ .byte 116,218 // je d6a6 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb d372 <_sk_store_u16_be_avx+0x107>
+ .byte 114,205 // jb d6a6 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2)
- .byte 116,196 // je d372 <_sk_store_u16_be_avx+0x107>
+ .byte 116,196 // je d6a6 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb d372 <_sk_store_u16_be_avx+0x107>
+ .byte 114,183 // jb d6a6 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2)
- .byte 235,174 // jmp d372 <_sk_store_u16_be_avx+0x107>
+ .byte 235,174 // jmp d6a6 <_sk_store_u16_be_avx+0x107>
HIDDEN _sk_load_f32_avx
.globl _sk_load_f32_avx
@@ -29628,7 +30000,7 @@ FUNCTION(_sk_load_f32_avx)
_sk_load_f32_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja d450 <_sk_load_f32_avx+0x8c>
+ .byte 15,135,128,0,0,0 // ja d784 <_sk_load_f32_avx+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -29636,7 +30008,7 @@ _sk_load_f32_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # d478 <_sk_load_f32_avx+0xb4>
+ .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # d7ac <_sk_load_f32_avx+0xb4>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -29685,7 +30057,7 @@ FUNCTION(_sk_load_f32_dst_avx)
_sk_load_f32_dst_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja d524 <_sk_load_f32_dst_avx+0x8c>
+ .byte 15,135,128,0,0,0 // ja d858 <_sk_load_f32_dst_avx+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -29693,7 +30065,7 @@ _sk_load_f32_dst_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # d54c <_sk_load_f32_dst_avx+0xb4>
+ .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # d880 <_sk_load_f32_dst_avx+0xb4>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -29757,7 +30129,7 @@ _sk_store_f32_avx:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 77,133,192 // test %r8,%r8
- .byte 117,55 // jne d5eb <_sk_store_f32_avx+0x7f>
+ .byte 117,55 // jne d91f <_sk_store_f32_avx+0x7f>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -29770,22 +30142,22 @@ _sk_store_f32_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je d5e7 <_sk_store_f32_avx+0x7b>
+ .byte 116,240 // je d91b <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb d5e7 <_sk_store_f32_avx+0x7b>
+ .byte 114,227 // jb d91b <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4)
- .byte 116,218 // je d5e7 <_sk_store_f32_avx+0x7b>
+ .byte 116,218 // je d91b <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb d5e7 <_sk_store_f32_avx+0x7b>
+ .byte 114,205 // jb d91b <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- .byte 116,195 // je d5e7 <_sk_store_f32_avx+0x7b>
+ .byte 116,195 // je d91b <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,181 // jb d5e7 <_sk_store_f32_avx+0x7b>
+ .byte 114,181 // jb d91b <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- .byte 235,171 // jmp d5e7 <_sk_store_f32_avx+0x7b>
+ .byte 235,171 // jmp d91b <_sk_store_f32_avx+0x7b>
HIDDEN _sk_clamp_x_avx
.globl _sk_clamp_x_avx
@@ -29878,7 +30250,7 @@ _sk_mirror_x_avx:
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,99,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- .byte 197,178,89,5,143,214,1,0 // vmulss 0x1d68f(%rip),%xmm9,%xmm0 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 197,178,89,5,79,217,1,0 // vmulss 0x1d94f(%rip),%xmm9,%xmm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
@@ -29912,7 +30284,7 @@ _sk_mirror_y_avx:
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,99,117,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- .byte 197,178,89,13,2,214,1,0 // vmulss 0x1d602(%rip),%xmm9,%xmm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 197,178,89,13,194,216,1,0 // vmulss 0x1d8c2(%rip),%xmm9,%xmm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
@@ -29939,7 +30311,7 @@ FUNCTION(_sk_clamp_x_1_avx)
_sk_clamp_x_1_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,156,213,1,0 // vbroadcastss 0x1d59c(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,92,216,1,0 // vbroadcastss 0x1d85c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -29957,9 +30329,9 @@ HIDDEN _sk_mirror_x_1_avx
.globl _sk_mirror_x_1_avx
FUNCTION(_sk_mirror_x_1_avx)
_sk_mirror_x_1_avx:
- .byte 196,98,125,24,5,147,213,1,0 // vbroadcastss 0x1d593(%rip),%ymm8 # 2ae1c <_sk_overlay_sse2_8bit+0x45b>
+ .byte 196,98,125,24,5,83,216,1,0 // vbroadcastss 0x1d853(%rip),%ymm8 # 2b410 <_sk_overlay_sse2_8bit+0x45b>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,105,213,1,0 // vbroadcastss 0x1d569(%rip),%ymm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,13,41,216,1,0 // vbroadcastss 0x1d829(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -29975,12 +30347,12 @@ HIDDEN _sk_luminance_to_alpha_avx
.globl _sk_luminance_to_alpha_avx
FUNCTION(_sk_luminance_to_alpha_avx)
_sk_luminance_to_alpha_avx:
- .byte 196,226,125,24,29,85,214,1,0 // vbroadcastss 0x1d655(%rip),%ymm3 # 2af20 <_sk_overlay_sse2_8bit+0x55f>
+ .byte 196,226,125,24,29,21,217,1,0 // vbroadcastss 0x1d915(%rip),%ymm3 # 2b514 <_sk_overlay_sse2_8bit+0x55f>
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,29,76,214,1,0 // vbroadcastss 0x1d64c(%rip),%ymm3 # 2af24 <_sk_overlay_sse2_8bit+0x563>
+ .byte 196,226,125,24,29,12,217,1,0 // vbroadcastss 0x1d90c(%rip),%ymm3 # 2b518 <_sk_overlay_sse2_8bit+0x563>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,63,214,1,0 // vbroadcastss 0x1d63f(%rip),%ymm1 # 2af28 <_sk_overlay_sse2_8bit+0x567>
+ .byte 196,226,125,24,13,255,216,1,0 // vbroadcastss 0x1d8ff(%rip),%ymm1 # 2b51c <_sk_overlay_sse2_8bit+0x567>
.byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1
.byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30228,9 +30600,9 @@ _sk_evenly_spaced_gradient_avx:
.byte 72,139,24 // mov (%rax),%rbx
.byte 72,139,104,8 // mov 0x8(%rax),%rbp
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js dc8d <_sk_evenly_spaced_gradient_avx+0x25>
+ .byte 120,7 // js dfc1 <_sk_evenly_spaced_gradient_avx+0x25>
.byte 196,225,242,42,203 // vcvtsi2ss %rbx,%xmm1,%xmm1
- .byte 235,21 // jmp dca2 <_sk_evenly_spaced_gradient_avx+0x3a>
+ .byte 235,21 // jmp dfd6 <_sk_evenly_spaced_gradient_avx+0x3a>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -30388,18 +30760,18 @@ HIDDEN _sk_gauss_a_to_rgba_avx
.globl _sk_gauss_a_to_rgba_avx
FUNCTION(_sk_gauss_a_to_rgba_avx)
_sk_gauss_a_to_rgba_avx:
- .byte 196,226,125,24,5,42,207,1,0 // vbroadcastss 0x1cf2a(%rip),%ymm0 # 2af30 <_sk_overlay_sse2_8bit+0x56f>
+ .byte 196,226,125,24,5,234,209,1,0 // vbroadcastss 0x1d1ea(%rip),%ymm0 # 2b524 <_sk_overlay_sse2_8bit+0x56f>
.byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
- .byte 196,226,125,24,13,25,207,1,0 // vbroadcastss 0x1cf19(%rip),%ymm1 # 2af2c <_sk_overlay_sse2_8bit+0x56b>
+ .byte 196,226,125,24,13,217,209,1,0 // vbroadcastss 0x1d1d9(%rip),%ymm1 # 2b520 <_sk_overlay_sse2_8bit+0x56b>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,16,207,1,0 // vbroadcastss 0x1cf10(%rip),%ymm1 # 2af34 <_sk_overlay_sse2_8bit+0x573>
+ .byte 196,226,125,24,13,208,209,1,0 // vbroadcastss 0x1d1d0(%rip),%ymm1 # 2b528 <_sk_overlay_sse2_8bit+0x573>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,3,207,1,0 // vbroadcastss 0x1cf03(%rip),%ymm1 # 2af38 <_sk_overlay_sse2_8bit+0x577>
+ .byte 196,226,125,24,13,195,209,1,0 // vbroadcastss 0x1d1c3(%rip),%ymm1 # 2b52c <_sk_overlay_sse2_8bit+0x577>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,246,206,1,0 // vbroadcastss 0x1cef6(%rip),%ymm1 # 2af3c <_sk_overlay_sse2_8bit+0x57b>
+ .byte 196,226,125,24,13,182,209,1,0 // vbroadcastss 0x1d1b6(%rip),%ymm1 # 2b530 <_sk_overlay_sse2_8bit+0x57b>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -30422,12 +30794,12 @@ _sk_gradient_avx:
.byte 76,139,8 // mov (%rax),%r9
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,80 // jb e0c9 <_sk_gradient_avx+0x6f>
+ .byte 114,80 // jb e3fd <_sk_gradient_avx+0x6f>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
- .byte 196,98,125,24,21,118,205,1,0 // vbroadcastss 0x1cd76(%rip),%ymm10 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,24,21,54,208,1,0 // vbroadcastss 0x1d036(%rip),%ymm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,98,125,24,3 // vbroadcastss (%rbx),%ymm8
.byte 197,60,194,192,2 // vcmpleps %ymm0,%ymm8,%ymm8
@@ -30439,7 +30811,7 @@ _sk_gradient_avx:
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,205 // jne e096 <_sk_gradient_avx+0x3c>
+ .byte 117,205 // jne e3ca <_sk_gradient_avx+0x3c>
.byte 196,195,249,22,201,1 // vpextrq $0x1,%xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
.byte 73,193,233,32 // shr $0x20,%r9
@@ -30622,27 +30994,27 @@ _sk_xy_to_unit_angle_avx:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,160,202,1,0 // vbroadcastss 0x1caa0(%rip),%ymm13 # 2af40 <_sk_overlay_sse2_8bit+0x57f>
+ .byte 196,98,125,24,45,96,205,1,0 // vbroadcastss 0x1cd60(%rip),%ymm13 # 2b534 <_sk_overlay_sse2_8bit+0x57f>
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,150,202,1,0 // vbroadcastss 0x1ca96(%rip),%ymm14 # 2af44 <_sk_overlay_sse2_8bit+0x583>
+ .byte 196,98,125,24,53,86,205,1,0 // vbroadcastss 0x1cd56(%rip),%ymm14 # 2b538 <_sk_overlay_sse2_8bit+0x583>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,135,202,1,0 // vbroadcastss 0x1ca87(%rip),%ymm14 # 2af48 <_sk_overlay_sse2_8bit+0x587>
+ .byte 196,98,125,24,53,71,205,1,0 // vbroadcastss 0x1cd47(%rip),%ymm14 # 2b53c <_sk_overlay_sse2_8bit+0x587>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12
- .byte 196,98,125,24,45,120,202,1,0 // vbroadcastss 0x1ca78(%rip),%ymm13 # 2af4c <_sk_overlay_sse2_8bit+0x58b>
+ .byte 196,98,125,24,45,56,205,1,0 // vbroadcastss 0x1cd38(%rip),%ymm13 # 2b540 <_sk_overlay_sse2_8bit+0x58b>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,99,202,1,0 // vbroadcastss 0x1ca63(%rip),%ymm10 # 2af50 <_sk_overlay_sse2_8bit+0x58f>
+ .byte 196,98,125,24,21,35,205,1,0 // vbroadcastss 0x1cd23(%rip),%ymm10 # 2b544 <_sk_overlay_sse2_8bit+0x58f>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,249,200,1,0 // vbroadcastss 0x1c8f9(%rip),%ymm10 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,21,185,203,1,0 // vbroadcastss 0x1cbb9(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,227,200,1,0 // vbroadcastss 0x1c8e3(%rip),%ymm10 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,21,163,203,1,0 // vbroadcastss 0x1cba3(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -30672,7 +31044,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,217,201,1,0 // vbroadcastss 0x1c9d9(%rip),%ymm11 # 2af54 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,29,153,204,1,0 // vbroadcastss 0x1cc99(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -30681,17 +31053,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,173,201,1,0 // vbroadcastss 0x1c9ad(%rip),%ymm9 # 2af58 <_sk_overlay_sse2_8bit+0x597>
+ .byte 196,98,125,24,13,109,204,1,0 // vbroadcastss 0x1cc6d(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,139,201,1,0 // vbroadcastss 0x1c98b(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,75,204,1,0 // vbroadcastss 0x1cc4b(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,28,200,1,0 // vbroadcastss 0x1c81c(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,220,202,1,0 // vbroadcastss 0x1cadc(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -30711,7 +31083,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,43,201,1,0 // vbroadcastss 0x1c92b(%rip),%ymm11 # 2af54 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,29,235,203,1,0 // vbroadcastss 0x1cbeb(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -30720,17 +31092,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,255,200,1,0 // vbroadcastss 0x1c8ff(%rip),%ymm9 # 2af58 <_sk_overlay_sse2_8bit+0x597>
+ .byte 196,98,125,24,13,191,203,1,0 // vbroadcastss 0x1cbbf(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,221,200,1,0 // vbroadcastss 0x1c8dd(%rip),%ymm9 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,157,203,1,0 // vbroadcastss 0x1cb9d(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,110,199,1,0 // vbroadcastss 0x1c76e(%rip),%ymm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,46,202,1,0 // vbroadcastss 0x1ca2e(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -30749,7 +31121,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,67,121,4,201,0 // vpermilps $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,131,200,1,0 // vbroadcastss 0x1c883(%rip),%ymm10 # 2af54 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,21,67,203,1,0 // vbroadcastss 0x1cb43(%rip),%ymm10 # 2b548 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
@@ -30758,7 +31130,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,91,200,1,0 // vbroadcastss 0x1c85b(%rip),%ymm8 # 2af5c <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,5,27,203,1,0 // vbroadcastss 0x1cb1b(%rip),%ymm8 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30799,7 +31171,7 @@ HIDDEN _sk_save_xy_avx
FUNCTION(_sk_save_xy_avx)
_sk_save_xy_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,151,198,1,0 // vbroadcastss 0x1c697(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,87,201,1,0 // vbroadcastss 0x1c957(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -30836,9 +31208,9 @@ HIDDEN _sk_bilinear_nx_avx
FUNCTION(_sk_bilinear_nx_avx)
_sk_bilinear_nx_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,127,199,1,0 // vbroadcastss 0x1c77f(%rip),%ymm0 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,5,63,202,1,0 // vbroadcastss 0x1ca3f(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,22,198,1,0 // vbroadcastss 0x1c616(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,214,200,1,0 // vbroadcastss 0x1c8d6(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30849,7 +31221,7 @@ HIDDEN _sk_bilinear_px_avx
FUNCTION(_sk_bilinear_px_avx)
_sk_bilinear_px_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,246,197,1,0 // vbroadcastss 0x1c5f6(%rip),%ymm0 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,5,182,200,1,0 // vbroadcastss 0x1c8b6(%rip),%ymm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -30861,9 +31233,9 @@ HIDDEN _sk_bilinear_ny_avx
FUNCTION(_sk_bilinear_ny_avx)
_sk_bilinear_ny_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,54,199,1,0 // vbroadcastss 0x1c736(%rip),%ymm1 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,13,246,201,1,0 // vbroadcastss 0x1c9f6(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,204,197,1,0 // vbroadcastss 0x1c5cc(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,140,200,1,0 // vbroadcastss 0x1c88c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30874,7 +31246,7 @@ HIDDEN _sk_bilinear_py_avx
FUNCTION(_sk_bilinear_py_avx)
_sk_bilinear_py_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,172,197,1,0 // vbroadcastss 0x1c5ac(%rip),%ymm1 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,13,108,200,1,0 // vbroadcastss 0x1c86c(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -30886,14 +31258,14 @@ HIDDEN _sk_bicubic_n3x_avx
FUNCTION(_sk_bicubic_n3x_avx)
_sk_bicubic_n3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,239,198,1,0 // vbroadcastss 0x1c6ef(%rip),%ymm0 # 2af64 <_sk_overlay_sse2_8bit+0x5a3>
+ .byte 196,226,125,24,5,175,201,1,0 // vbroadcastss 0x1c9af(%rip),%ymm0 # 2b558 <_sk_overlay_sse2_8bit+0x5a3>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,130,197,1,0 // vbroadcastss 0x1c582(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,66,200,1,0 // vbroadcastss 0x1c842(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,211,198,1,0 // vbroadcastss 0x1c6d3(%rip),%ymm10 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,147,201,1,0 // vbroadcastss 0x1c993(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,209,197,1,0 // vbroadcastss 0x1c5d1(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,21,145,200,1,0 // vbroadcastss 0x1c891(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -30905,19 +31277,19 @@ HIDDEN _sk_bicubic_n1x_avx
FUNCTION(_sk_bicubic_n1x_avx)
_sk_bicubic_n1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,156,198,1,0 // vbroadcastss 0x1c69c(%rip),%ymm0 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,5,92,201,1,0 // vbroadcastss 0x1c95c(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,51,197,1,0 // vbroadcastss 0x1c533(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,243,199,1,0 // vbroadcastss 0x1c7f3(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,145,198,1,0 // vbroadcastss 0x1c691(%rip),%ymm9 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,13,81,201,1,0 // vbroadcastss 0x1c951(%rip),%ymm9 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,127,198,1,0 // vbroadcastss 0x1c67f(%rip),%ymm10 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,21,63,201,1,0 // vbroadcastss 0x1c93f(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,0,197,1,0 // vbroadcastss 0x1c500(%rip),%ymm10 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,21,192,199,1,0 // vbroadcastss 0x1c7c0(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,97,198,1,0 // vbroadcastss 0x1c661(%rip),%ymm9 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,13,33,201,1,0 // vbroadcastss 0x1c921(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30928,17 +31300,17 @@ HIDDEN _sk_bicubic_p1x_avx
FUNCTION(_sk_bicubic_p1x_avx)
_sk_bicubic_p1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,209,196,1,0 // vbroadcastss 0x1c4d1(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,145,199,1,0 // vbroadcastss 0x1c791(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,47,198,1,0 // vbroadcastss 0x1c62f(%rip),%ymm10 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,21,239,200,1,0 // vbroadcastss 0x1c8ef(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,29,198,1,0 // vbroadcastss 0x1c61d(%rip),%ymm11 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,29,221,200,1,0 // vbroadcastss 0x1c8dd(%rip),%ymm11 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,8,198,1,0 // vbroadcastss 0x1c608(%rip),%ymm9 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,13,200,200,1,0 // vbroadcastss 0x1c8c8(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30949,13 +31321,13 @@ HIDDEN _sk_bicubic_p3x_avx
FUNCTION(_sk_bicubic_p3x_avx)
_sk_bicubic_p3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,228,197,1,0 // vbroadcastss 0x1c5e4(%rip),%ymm0 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,226,125,24,5,164,200,1,0 // vbroadcastss 0x1c8a4(%rip),%ymm0 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,201,197,1,0 // vbroadcastss 0x1c5c9(%rip),%ymm10 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,137,200,1,0 // vbroadcastss 0x1c889(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,199,196,1,0 // vbroadcastss 0x1c4c7(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,21,135,199,1,0 // vbroadcastss 0x1c787(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -30967,14 +31339,14 @@ HIDDEN _sk_bicubic_n3y_avx
FUNCTION(_sk_bicubic_n3y_avx)
_sk_bicubic_n3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,150,197,1,0 // vbroadcastss 0x1c596(%rip),%ymm1 # 2af64 <_sk_overlay_sse2_8bit+0x5a3>
+ .byte 196,226,125,24,13,86,200,1,0 // vbroadcastss 0x1c856(%rip),%ymm1 # 2b558 <_sk_overlay_sse2_8bit+0x5a3>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,40,196,1,0 // vbroadcastss 0x1c428(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,232,198,1,0 // vbroadcastss 0x1c6e8(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,121,197,1,0 // vbroadcastss 0x1c579(%rip),%ymm10 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,57,200,1,0 // vbroadcastss 0x1c839(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,119,196,1,0 // vbroadcastss 0x1c477(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,21,55,199,1,0 // vbroadcastss 0x1c737(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -30986,19 +31358,19 @@ HIDDEN _sk_bicubic_n1y_avx
FUNCTION(_sk_bicubic_n1y_avx)
_sk_bicubic_n1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,66,197,1,0 // vbroadcastss 0x1c542(%rip),%ymm1 # 2af60 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,13,2,200,1,0 // vbroadcastss 0x1c802(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,216,195,1,0 // vbroadcastss 0x1c3d8(%rip),%ymm8 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,152,198,1,0 // vbroadcastss 0x1c698(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,54,197,1,0 // vbroadcastss 0x1c536(%rip),%ymm9 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,13,246,199,1,0 // vbroadcastss 0x1c7f6(%rip),%ymm9 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,36,197,1,0 // vbroadcastss 0x1c524(%rip),%ymm10 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,21,228,199,1,0 // vbroadcastss 0x1c7e4(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,165,195,1,0 // vbroadcastss 0x1c3a5(%rip),%ymm10 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,21,101,198,1,0 // vbroadcastss 0x1c665(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,6,197,1,0 // vbroadcastss 0x1c506(%rip),%ymm9 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,13,198,199,1,0 // vbroadcastss 0x1c7c6(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -31009,17 +31381,17 @@ HIDDEN _sk_bicubic_p1y_avx
FUNCTION(_sk_bicubic_p1y_avx)
_sk_bicubic_p1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,118,195,1,0 // vbroadcastss 0x1c376(%rip),%ymm8 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,54,198,1,0 // vbroadcastss 0x1c636(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,211,196,1,0 // vbroadcastss 0x1c4d3(%rip),%ymm10 # 2af70 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,21,147,199,1,0 // vbroadcastss 0x1c793(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,193,196,1,0 // vbroadcastss 0x1c4c1(%rip),%ymm11 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,29,129,199,1,0 // vbroadcastss 0x1c781(%rip),%ymm11 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,172,196,1,0 // vbroadcastss 0x1c4ac(%rip),%ymm9 # 2af74 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,13,108,199,1,0 // vbroadcastss 0x1c76c(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -31030,13 +31402,13 @@ HIDDEN _sk_bicubic_p3y_avx
FUNCTION(_sk_bicubic_p3y_avx)
_sk_bicubic_p3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,136,196,1,0 // vbroadcastss 0x1c488(%rip),%ymm1 # 2af6c <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,226,125,24,13,72,199,1,0 // vbroadcastss 0x1c748(%rip),%ymm1 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,108,196,1,0 // vbroadcastss 0x1c46c(%rip),%ymm10 # 2af68 <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,44,199,1,0 // vbroadcastss 0x1c72c(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,106,195,1,0 // vbroadcastss 0x1c36a(%rip),%ymm10 # 2ae74 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,21,42,198,1,0 // vbroadcastss 0x1c62a(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -31182,7 +31554,7 @@ _sk_clut_3D_avx:
.byte 197,249,127,68,36,224 // vmovdqa %xmm0,-0x20(%rsp)
.byte 72,139,0 // mov (%rax),%rax
.byte 196,193,121,254,194 // vpaddd %xmm10,%xmm0,%xmm0
- .byte 196,98,121,24,29,2,194,1,0 // vbroadcastss 0x1c202(%rip),%xmm11 # 2af7c <_sk_overlay_sse2_8bit+0x5bb>
+ .byte 196,98,121,24,29,194,196,1,0 // vbroadcastss 0x1c4c2(%rip),%xmm11 # 2b570 <_sk_overlay_sse2_8bit+0x5bb>
.byte 196,194,121,64,203 // vpmulld %xmm11,%xmm0,%xmm1
.byte 196,193,249,126,201 // vmovq %xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
@@ -31216,7 +31588,7 @@ _sk_clut_3D_avx:
.byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
.byte 196,227,93,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm3
.byte 197,252,17,92,36,64 // vmovups %ymm3,0x40(%rsp)
- .byte 196,98,121,24,13,205,191,1,0 // vbroadcastss 0x1bfcd(%rip),%xmm9 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,121,24,13,141,194,1,0 // vbroadcastss 0x1c28d(%rip),%xmm9 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 196,193,105,254,249 // vpaddd %xmm9,%xmm2,%xmm7
.byte 196,195,249,22,249,1 // vpextrq $0x1,%xmm7,%r9
.byte 196,193,249,126,250 // vmovq %xmm7,%r10
@@ -31244,7 +31616,7 @@ _sk_clut_3D_avx:
.byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7
.byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5
.byte 196,99,85,24,254,1 // vinsertf128 $0x1,%xmm6,%ymm5,%ymm15
- .byte 196,98,121,24,37,64,191,1,0 // vbroadcastss 0x1bf40(%rip),%xmm12 # 2ae10 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,121,24,37,0,194,1,0 // vbroadcastss 0x1c200(%rip),%xmm12 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,193,105,254,212 // vpaddd %xmm12,%xmm2,%xmm2
.byte 196,195,249,22,209,1 // vpextrq $0x1,%xmm2,%r9
.byte 196,193,249,126,210 // vmovq %xmm2,%r10
@@ -31272,7 +31644,7 @@ _sk_clut_3D_avx:
.byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
.byte 196,227,105,33,213,48 // vinsertps $0x30,%xmm5,%xmm2,%xmm2
.byte 196,227,109,24,225,1 // vinsertf128 $0x1,%xmm1,%ymm2,%ymm4
- .byte 196,226,125,24,13,20,192,1,0 // vbroadcastss 0x1c014(%rip),%ymm1 # 2af78 <_sk_overlay_sse2_8bit+0x5b7>
+ .byte 196,226,125,24,13,212,194,1,0 // vbroadcastss 0x1c2d4(%rip),%ymm1 # 2b56c <_sk_overlay_sse2_8bit+0x5b7>
.byte 197,188,88,209 // vaddps %ymm1,%ymm8,%ymm2
.byte 197,252,17,76,36,32 // vmovups %ymm1,0x20(%rsp)
.byte 197,254,91,210 // vcvttps2dq %ymm2,%ymm2
@@ -32027,7 +32399,7 @@ _sk_clut_4D_avx:
.byte 196,226,25,64,200 // vpmulld %xmm0,%xmm12,%xmm1
.byte 197,249,127,76,36,128 // vmovdqa %xmm1,-0x80(%rsp)
.byte 197,241,254,202 // vpaddd %xmm2,%xmm1,%xmm1
- .byte 196,98,121,24,61,194,176,1,0 // vbroadcastss 0x1b0c2(%rip),%xmm15 # 2af7c <_sk_overlay_sse2_8bit+0x5bb>
+ .byte 196,98,121,24,61,130,179,1,0 // vbroadcastss 0x1b382(%rip),%xmm15 # 2b570 <_sk_overlay_sse2_8bit+0x5bb>
.byte 196,194,113,64,247 // vpmulld %xmm15,%xmm1,%xmm6
.byte 196,193,249,126,241 // vmovq %xmm6,%r9
.byte 69,137,202 // mov %r9d,%r10d
@@ -32065,7 +32437,7 @@ _sk_clut_4D_avx:
.byte 196,163,65,33,60,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
.byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
.byte 196,99,53,24,247,1 // vinsertf128 $0x1,%xmm7,%ymm9,%ymm14
- .byte 196,98,121,24,21,117,174,1,0 // vbroadcastss 0x1ae75(%rip),%xmm10 # 2ae08 <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,121,24,21,53,177,1,0 // vbroadcastss 0x1b135(%rip),%xmm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,97,254,202 // vpaddd %xmm10,%xmm3,%xmm9
.byte 196,67,249,22,201,1 // vpextrq $0x1,%xmm9,%r9
.byte 196,65,249,126,202 // vmovq %xmm9,%r10
@@ -32093,7 +32465,7 @@ _sk_clut_4D_avx:
.byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7
.byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5
.byte 196,99,85,24,220,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm11
- .byte 196,98,121,24,13,232,173,1,0 // vbroadcastss 0x1ade8(%rip),%xmm9 # 2ae10 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,121,24,13,168,176,1,0 // vbroadcastss 0x1b0a8(%rip),%xmm9 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,193,97,254,217 // vpaddd %xmm9,%xmm3,%xmm3
.byte 196,195,249,22,217,1 // vpextrq $0x1,%xmm3,%r9
.byte 196,193,249,126,218 // vmovq %xmm3,%r10
@@ -32121,7 +32493,7 @@ _sk_clut_4D_avx:
.byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
.byte 196,227,89,33,229,48 // vinsertps $0x30,%xmm5,%xmm4,%xmm4
.byte 196,227,93,24,243,1 // vinsertf128 $0x1,%xmm3,%ymm4,%ymm6
- .byte 196,226,125,24,37,188,174,1,0 // vbroadcastss 0x1aebc(%rip),%ymm4 # 2af78 <_sk_overlay_sse2_8bit+0x5b7>
+ .byte 196,226,125,24,37,124,177,1,0 // vbroadcastss 0x1b17c(%rip),%ymm4 # 2b56c <_sk_overlay_sse2_8bit+0x5b7>
.byte 197,148,88,220 // vaddps %ymm4,%ymm13,%ymm3
.byte 197,252,40,252 // vmovaps %ymm4,%ymm7
.byte 197,252,17,124,36,32 // vmovups %ymm7,0x20(%rsp)
@@ -33551,7 +33923,7 @@ _sk_clut_4D_avx:
.byte 197,220,89,210 // vmulps %ymm2,%ymm4,%ymm2
.byte 197,212,88,210 // vaddps %ymm2,%ymm5,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,204,143,1,0 // vbroadcastss 0x18fcc(%rip),%ymm3 # 2ae04 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,140,146,1,0 // vbroadcastss 0x1928c(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,16,164,36,32,2,0,0 // vmovups 0x220(%rsp),%ymm4
.byte 197,252,16,172,36,64,2,0,0 // vmovups 0x240(%rsp),%ymm5
.byte 197,252,16,180,36,96,2,0,0 // vmovups 0x260(%rsp),%ymm6
@@ -33582,7 +33954,7 @@ _sk_start_pipeline_sse41:
.byte 72,137,194 // mov %rax,%rdx
.byte 72,137,77,176 // mov %rcx,-0x50(%rbp)
.byte 73,57,206 // cmp %rcx,%r14
- .byte 115,117 // jae 11f0b <_sk_start_pipeline_sse41+0xa1>
+ .byte 115,117 // jae 1223f <_sk_start_pipeline_sse41+0xa1>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,4 // lea 0x4(%rax),%rax
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
@@ -33592,7 +33964,7 @@ _sk_start_pipeline_sse41:
.byte 73,137,244 // mov %rsi,%r12
.byte 72,57,93,184 // cmp %rbx,-0x48(%rbp)
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
- .byte 119,45 // ja 11ee7 <_sk_start_pipeline_sse41+0x7d>
+ .byte 119,45 // ja 1221b <_sk_start_pipeline_sse41+0x7d>
.byte 76,139,125,208 // mov -0x30(%rbp),%r15
.byte 69,49,192 // xor %r8d,%r8d
.byte 76,137,207 // mov %r9,%rdi
@@ -33606,10 +33978,10 @@ _sk_start_pipeline_sse41:
.byte 73,131,199,8 // add $0x8,%r15
.byte 73,57,223 // cmp %rbx,%r15
.byte 73,137,215 // mov %rdx,%r15
- .byte 118,215 // jbe 11ebe <_sk_start_pipeline_sse41+0x54>
+ .byte 118,215 // jbe 121f2 <_sk_start_pipeline_sse41+0x54>
.byte 73,137,216 // mov %rbx,%r8
.byte 73,41,208 // sub %rdx,%r8
- .byte 116,19 // je 11f02 <_sk_start_pipeline_sse41+0x98>
+ .byte 116,19 // je 12236 <_sk_start_pipeline_sse41+0x98>
.byte 76,137,207 // mov %r9,%rdi
.byte 76,137,230 // mov %r12,%rsi
.byte 76,137,241 // mov %r14,%rcx
@@ -33618,7 +33990,7 @@ _sk_start_pipeline_sse41:
.byte 76,139,77,192 // mov -0x40(%rbp),%r9
.byte 73,255,198 // inc %r14
.byte 76,59,117,176 // cmp -0x50(%rbp),%r14
- .byte 117,165 // jne 11eb0 <_sk_start_pipeline_sse41+0x46>
+ .byte 117,165 // jne 121e4 <_sk_start_pipeline_sse41+0x46>
.byte 72,131,196,40 // add $0x28,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -33641,7 +34013,7 @@ _sk_seed_shader_sse41:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,146,152,1,0 // movaps 0x19892(%rip),%xmm2 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,40,21,94,155,1,0 // movaps 0x19b5e(%rip),%xmm2 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,7 // movups (%rdi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -33650,7 +34022,7 @@ _sk_seed_shader_sse41:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,129,152,1,0 // movaps 0x19881(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,77,155,1,0 // movaps 0x19b4d(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -33670,14 +34042,14 @@ _sk_dither_sse41:
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,79,152,1,0 // movdqa 0x1984f(%rip),%xmm10 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,21,27,155,1,0 // movdqa 0x19b1b(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,59,152,1,0 // movdqa 0x1983b(%rip),%xmm12 # 2b7f0 <_sk_overlay_sse2_8bit+0xe2f>
- .byte 102,68,15,111,45,66,152,1,0 // movdqa 0x19842(%rip),%xmm13 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,37,7,155,1,0 // movdqa 0x19b07(%rip),%xmm12 # 2bdf0 <_sk_overlay_sse2_8bit+0xe3b>
+ .byte 102,68,15,111,45,14,155,1,0 // movdqa 0x19b0e(%rip),%xmm13 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -33693,8 +34065,8 @@ _sk_dither_sse41:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,253,151,1,0 // mulps 0x197fd(%rip),%xmm8 # 2b810 <_sk_overlay_sse2_8bit+0xe4f>
- .byte 68,15,88,5,5,152,1,0 // addps 0x19805(%rip),%xmm8 # 2b820 <_sk_overlay_sse2_8bit+0xe5f>
+ .byte 68,15,89,5,201,154,1,0 // mulps 0x19ac9(%rip),%xmm8 # 2be10 <_sk_overlay_sse2_8bit+0xe5b>
+ .byte 68,15,88,5,209,154,1,0 // addps 0x19ad1(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0xe6b>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -33736,7 +34108,7 @@ HIDDEN _sk_black_color_sse41
FUNCTION(_sk_black_color_sse41)
_sk_black_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,59,151,1,0 // movaps 0x1973b(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,7,154,1,0 // movaps 0x19a07(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -33747,7 +34119,7 @@ HIDDEN _sk_white_color_sse41
FUNCTION(_sk_white_color_sse41)
_sk_white_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,39,151,1,0 // movaps 0x19727(%rip),%xmm0 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,5,243,153,1,0 // movaps 0x199f3(%rip),%xmm0 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -33793,7 +34165,7 @@ HIDDEN _sk_srcatop_sse41
FUNCTION(_sk_srcatop_sse41)
_sk_srcatop_sse41:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,215,150,1,0 // movaps 0x196d7(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,163,153,1,0 // movaps 0x199a3(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -33818,7 +34190,7 @@ FUNCTION(_sk_dstatop_sse41)
_sk_dstatop_sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,138,150,1,0 // movaps 0x1968a(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,86,153,1,0 // movaps 0x19956(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -33865,7 +34237,7 @@ HIDDEN _sk_srcout_sse41
.globl _sk_srcout_sse41
FUNCTION(_sk_srcout_sse41)
_sk_srcout_sse41:
- .byte 68,15,40,5,30,150,1,0 // movaps 0x1961e(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,234,152,1,0 // movaps 0x198ea(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -33878,7 +34250,7 @@ HIDDEN _sk_dstout_sse41
.globl _sk_dstout_sse41
FUNCTION(_sk_dstout_sse41)
_sk_dstout_sse41:
- .byte 68,15,40,5,254,149,1,0 // movaps 0x195fe(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,202,152,1,0 // movaps 0x198ca(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -33895,7 +34267,7 @@ HIDDEN _sk_srcover_sse41
.globl _sk_srcover_sse41
FUNCTION(_sk_srcover_sse41)
_sk_srcover_sse41:
- .byte 68,15,40,5,209,149,1,0 // movaps 0x195d1(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,157,152,1,0 // movaps 0x1989d(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -33915,7 +34287,7 @@ HIDDEN _sk_dstover_sse41
.globl _sk_dstover_sse41
FUNCTION(_sk_dstover_sse41)
_sk_dstover_sse41:
- .byte 68,15,40,5,149,149,1,0 // movaps 0x19595(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,97,152,1,0 // movaps 0x19861(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -33943,7 +34315,7 @@ HIDDEN _sk_multiply_sse41
.globl _sk_multiply_sse41
FUNCTION(_sk_multiply_sse41)
_sk_multiply_sse41:
- .byte 68,15,40,5,89,149,1,0 // movaps 0x19559(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,37,152,1,0 // movaps 0x19825(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -33981,9 +34353,14 @@ HIDDEN _sk_plus__sse41
FUNCTION(_sk_plus__sse41)
_sk_plus__sse41:
.byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 68,15,40,5,166,151,1,0 // movaps 0x197a6(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 15,88,205 // addps %xmm5,%xmm1
+ .byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 15,88,214 // addps %xmm6,%xmm2
+ .byte 65,15,93,208 // minps %xmm8,%xmm2
.byte 15,88,223 // addps %xmm7,%xmm3
+ .byte 65,15,93,216 // minps %xmm8,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34018,7 +34395,7 @@ HIDDEN _sk_xor__sse41
FUNCTION(_sk_xor__sse41)
_sk_xor__sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,126,148,1,0 // movaps 0x1947e(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,50,151,1,0 // movaps 0x19732(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -34066,7 +34443,7 @@ _sk_darken_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,217,147,1,0 // movaps 0x193d9(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,141,150,1,0 // movaps 0x1968d(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -34100,7 +34477,7 @@ _sk_lighten_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,110,147,1,0 // movaps 0x1936e(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,34,150,1,0 // movaps 0x19622(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -34137,7 +34514,7 @@ _sk_difference_sse41:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,248,146,1,0 // movaps 0x192f8(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,172,149,1,0 // movaps 0x195ac(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -34165,7 +34542,7 @@ _sk_exclusion_sse41:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,168,146,1,0 // movaps 0x192a8(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,92,149,1,0 // movaps 0x1955c(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -34177,7 +34554,7 @@ HIDDEN _sk_colorburn_sse41
.globl _sk_colorburn_sse41
FUNCTION(_sk_colorburn_sse41)
_sk_colorburn_sse41:
- .byte 68,15,40,29,143,146,1,0 // movaps 0x1928f(%rip),%xmm11 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,29,67,149,1,0 // movaps 0x19543(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 68,15,92,231 // subps %xmm7,%xmm12
.byte 69,15,40,204 // movaps %xmm12,%xmm9
@@ -34261,7 +34638,7 @@ HIDDEN _sk_colordodge_sse41
FUNCTION(_sk_colordodge_sse41)
_sk_colordodge_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,89,145,1,0 // movaps 0x19159(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,13,148,1,0 // movaps 0x1940d(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -34343,7 +34720,7 @@ _sk_hardlight_sse41:
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,36,144,1,0 // movaps 0x19024(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,216,146,1,0 // movaps 0x192d8(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,40,234 // movaps %xmm10,%xmm5
.byte 15,92,239 // subps %xmm7,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
@@ -34426,7 +34803,7 @@ FUNCTION(_sk_overlay_sse41)
_sk_overlay_sse41:
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,40,240 // movaps %xmm0,%xmm14
- .byte 68,15,40,21,249,142,1,0 // movaps 0x18ef9(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,173,145,1,0 // movaps 0x191ad(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -34511,7 +34888,7 @@ _sk_softlight_sse41:
.byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 65,15,84,193 // andps %xmm9,%xmm0
- .byte 15,40,13,192,141,1,0 // movaps 0x18dc0(%rip),%xmm1 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,13,116,144,1,0 // movaps 0x19074(%rip),%xmm1 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 68,15,40,240 // movaps %xmm0,%xmm14
@@ -34524,10 +34901,10 @@ _sk_softlight_sse41:
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,210 // mulps %xmm2,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,40,45,238,141,1,0 // movaps 0x18dee(%rip),%xmm13 # 2b830 <_sk_overlay_sse2_8bit+0xe6f>
+ .byte 68,15,40,45,162,144,1,0 // movaps 0x190a2(%rip),%xmm13 # 2be30 <_sk_overlay_sse2_8bit+0xe7b>
.byte 69,15,88,245 // addps %xmm13,%xmm14
.byte 68,15,89,242 // mulps %xmm2,%xmm14
- .byte 68,15,40,37,238,141,1,0 // movaps 0x18dee(%rip),%xmm12 # 2b840 <_sk_overlay_sse2_8bit+0xe7f>
+ .byte 68,15,40,37,162,144,1,0 // movaps 0x190a2(%rip),%xmm12 # 2be40 <_sk_overlay_sse2_8bit+0xe8b>
.byte 69,15,89,252 // mulps %xmm12,%xmm15
.byte 69,15,88,254 // addps %xmm14,%xmm15
.byte 15,40,198 // movaps %xmm6,%xmm0
@@ -34713,12 +35090,12 @@ _sk_hue_sse41:
.byte 68,15,84,208 // andps %xmm0,%xmm10
.byte 15,84,200 // andps %xmm0,%xmm1
.byte 68,15,84,232 // andps %xmm0,%xmm13
- .byte 15,40,5,89,139,1,0 // movaps 0x18b59(%rip),%xmm0 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 15,40,5,13,142,1,0 // movaps 0x18e0d(%rip),%xmm0 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 68,15,89,224 // mulps %xmm0,%xmm12
- .byte 15,40,21,94,139,1,0 // movaps 0x18b5e(%rip),%xmm2 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 15,40,21,18,142,1,0 // movaps 0x18e12(%rip),%xmm2 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 15,89,250 // mulps %xmm2,%xmm7
.byte 65,15,88,252 // addps %xmm12,%xmm7
- .byte 68,15,40,53,95,139,1,0 // movaps 0x18b5f(%rip),%xmm14 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
+ .byte 68,15,40,53,19,142,1,0 // movaps 0x18e13(%rip),%xmm14 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
.byte 68,15,40,252 // movaps %xmm4,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,255 // addps %xmm7,%xmm15
@@ -34801,7 +35178,7 @@ _sk_hue_sse41:
.byte 65,15,88,214 // addps %xmm14,%xmm2
.byte 15,40,196 // movaps %xmm4,%xmm0
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,40,13,115,137,1,0 // movaps 0x18973(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,39,140,1,0 // movaps 0x18c27(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,40,225 // movaps %xmm9,%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0
@@ -34895,14 +35272,14 @@ _sk_saturation_sse41:
.byte 68,15,84,215 // andps %xmm7,%xmm10
.byte 68,15,84,223 // andps %xmm7,%xmm11
.byte 68,15,84,199 // andps %xmm7,%xmm8
- .byte 15,40,21,157,136,1,0 // movaps 0x1889d(%rip),%xmm2 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 15,40,21,81,139,1,0 // movaps 0x18b51(%rip),%xmm2 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,218 // mulps %xmm2,%xmm3
- .byte 15,40,13,160,136,1,0 // movaps 0x188a0(%rip),%xmm1 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 15,40,13,84,139,1,0 // movaps 0x18b54(%rip),%xmm1 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,249 // mulps %xmm1,%xmm7
.byte 15,88,251 // addps %xmm3,%xmm7
- .byte 68,15,40,45,159,136,1,0 // movaps 0x1889f(%rip),%xmm13 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
+ .byte 68,15,40,45,83,139,1,0 // movaps 0x18b53(%rip),%xmm13 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 68,15,88,247 // addps %xmm7,%xmm14
.byte 65,15,40,218 // movaps %xmm10,%xmm3
@@ -34983,7 +35360,7 @@ _sk_saturation_sse41:
.byte 65,15,88,253 // addps %xmm13,%xmm7
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11
- .byte 68,15,40,13,181,134,1,0 // movaps 0x186b5(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,105,137,1,0 // movaps 0x18969(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 68,15,92,204 // subps %xmm4,%xmm9
.byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7
@@ -35038,14 +35415,14 @@ _sk_color_sse41:
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 68,15,89,244 // mulps %xmm4,%xmm14
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 68,15,40,13,112,134,1,0 // movaps 0x18670(%rip),%xmm9 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,13,36,137,1,0 // movaps 0x18924(%rip),%xmm9 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 65,15,40,250 // movaps %xmm10,%xmm7
.byte 65,15,89,249 // mulps %xmm9,%xmm7
- .byte 68,15,40,21,112,134,1,0 // movaps 0x18670(%rip),%xmm10 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 68,15,40,21,36,137,1,0 // movaps 0x18924(%rip),%xmm10 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 65,15,40,219 // movaps %xmm11,%xmm3
.byte 65,15,89,218 // mulps %xmm10,%xmm3
.byte 15,88,223 // addps %xmm7,%xmm3
- .byte 68,15,40,29,109,134,1,0 // movaps 0x1866d(%rip),%xmm11 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
+ .byte 68,15,40,29,33,137,1,0 // movaps 0x18921(%rip),%xmm11 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
@@ -35130,7 +35507,7 @@ _sk_color_sse41:
.byte 65,15,88,251 // addps %xmm11,%xmm7
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1
- .byte 68,15,40,13,121,132,1,0 // movaps 0x18479(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,45,135,1,0 // movaps 0x1872d(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 68,15,89,192 // mulps %xmm0,%xmm8
@@ -35182,13 +35559,13 @@ _sk_luminosity_sse41:
.byte 69,15,89,216 // mulps %xmm8,%xmm11
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,89,205 // mulps %xmm5,%xmm9
- .byte 68,15,40,5,65,132,1,0 // movaps 0x18441(%rip),%xmm8 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,5,245,134,1,0 // movaps 0x186f5(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 68,15,40,21,69,132,1,0 // movaps 0x18445(%rip),%xmm10 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 68,15,40,21,249,134,1,0 // movaps 0x186f9(%rip),%xmm10 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 65,15,89,234 // mulps %xmm10,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 68,15,40,37,67,132,1,0 // movaps 0x18443(%rip),%xmm12 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
+ .byte 68,15,40,37,247,134,1,0 // movaps 0x186f7(%rip),%xmm12 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
.byte 68,15,40,242 // movaps %xmm2,%xmm14
.byte 69,15,89,244 // mulps %xmm12,%xmm14
.byte 68,15,88,245 // addps %xmm5,%xmm14
@@ -35273,7 +35650,7 @@ _sk_luminosity_sse41:
.byte 65,15,88,244 // addps %xmm12,%xmm6
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9
- .byte 15,40,5,73,130,1,0 // movaps 0x18249(%rip),%xmm0 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,5,253,132,1,0 // movaps 0x184fd(%rip),%xmm0 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,92,215 // subps %xmm7,%xmm2
.byte 15,89,226 // mulps %xmm2,%xmm4
@@ -35318,23 +35695,23 @@ _sk_srcover_rgba_8888_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,219,0,0,0 // jne 136ef <_sk_srcover_rgba_8888_sse41+0xfb>
+ .byte 15,133,219,0,0,0 // jne 13a3b <_sk_srcover_rgba_8888_sse41+0xfb>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,37,91,130,1,0 // movdqa 0x1825b(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,37,15,133,1,0 // movdqa 0x1850f(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,87,130,1,0 // pshufb 0x18257(%rip),%xmm5 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,45,11,133,1,0 // pshufb 0x1850b(%rip),%xmm5 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,87,130,1,0 // pshufb 0x18257(%rip),%xmm6 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,53,11,133,1,0 // pshufb 0x1850b(%rip),%xmm6 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 68,15,40,5,116,129,1,0 // movaps 0x18174(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,40,132,1,0 // movaps 0x18428(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,72,130,1,0 // movaps 0x18248(%rip),%xmm12 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,37,252,132,1,0 // movaps 0x184fc(%rip),%xmm12 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -35360,7 +35737,7 @@ _sk_srcover_rgba_8888_sse41:
.byte 102,15,114,240,24 // pslld $0x18,%xmm0
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 102,15,235,193 // por %xmm1,%xmm0
- .byte 117,88 // jne 1372d <_sk_srcover_rgba_8888_sse41+0x139>
+ .byte 117,88 // jne 13a79 <_sk_srcover_rgba_8888_sse41+0x139>
.byte 243,65,15,127,4,129 // movdqu %xmm0,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -35371,32 +35748,32 @@ _sk_srcover_rgba_8888_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,91 // je 13757 <_sk_srcover_rgba_8888_sse41+0x163>
+ .byte 116,91 // je 13aa3 <_sk_srcover_rgba_8888_sse41+0x163>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,22 // je 1371c <_sk_srcover_rgba_8888_sse41+0x128>
+ .byte 116,22 // je 13a68 <_sk_srcover_rgba_8888_sse41+0x128>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,10,255,255,255 // jne 1361a <_sk_srcover_rgba_8888_sse41+0x26>
+ .byte 15,133,10,255,255,255 // jne 13966 <_sk_srcover_rgba_8888_sse41+0x26>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,237,254,255,255 // jmpq 1361a <_sk_srcover_rgba_8888_sse41+0x26>
+ .byte 233,237,254,255,255 // jmpq 13966 <_sk_srcover_rgba_8888_sse41+0x26>
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,40 // je 13762 <_sk_srcover_rgba_8888_sse41+0x16e>
+ .byte 116,40 // je 13aae <_sk_srcover_rgba_8888_sse41+0x16e>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 1374f <_sk_srcover_rgba_8888_sse41+0x15b>
+ .byte 116,15 // je 13a9b <_sk_srcover_rgba_8888_sse41+0x15b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,149 // jne 136db <_sk_srcover_rgba_8888_sse41+0xe7>
+ .byte 117,149 // jne 13a27 <_sk_srcover_rgba_8888_sse41+0xe7>
.byte 102,65,15,58,22,68,129,8,2 // pextrd $0x2,%xmm0,0x8(%r9,%rax,4)
.byte 102,65,15,214,4,129 // movq %xmm0,(%r9,%rax,4)
- .byte 235,132 // jmp 136db <_sk_srcover_rgba_8888_sse41+0xe7>
+ .byte 235,132 // jmp 13a27 <_sk_srcover_rgba_8888_sse41+0xe7>
.byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7
- .byte 233,184,254,255,255 // jmpq 1361a <_sk_srcover_rgba_8888_sse41+0x26>
+ .byte 233,184,254,255,255 // jmpq 13966 <_sk_srcover_rgba_8888_sse41+0x26>
.byte 102,65,15,126,4,129 // movd %xmm0,(%r9,%rax,4)
- .byte 233,110,255,255,255 // jmpq 136db <_sk_srcover_rgba_8888_sse41+0xe7>
+ .byte 233,110,255,255,255 // jmpq 13a27 <_sk_srcover_rgba_8888_sse41+0xe7>
HIDDEN _sk_clamp_0_sse41
.globl _sk_clamp_0_sse41
@@ -35414,7 +35791,7 @@ HIDDEN _sk_clamp_1_sse41
.globl _sk_clamp_1_sse41
FUNCTION(_sk_clamp_1_sse41)
_sk_clamp_1_sse41:
- .byte 68,15,40,5,67,128,1,0 // movaps 0x18043(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,247,130,1,0 // movaps 0x182f7(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -35426,7 +35803,7 @@ HIDDEN _sk_clamp_a_sse41
.globl _sk_clamp_a_sse41
FUNCTION(_sk_clamp_a_sse41)
_sk_clamp_a_sse41:
- .byte 15,93,29,40,128,1,0 // minps 0x18028(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,93,29,220,130,1,0 // minps 0x182dc(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -35437,7 +35814,7 @@ HIDDEN _sk_clamp_a_dst_sse41
.globl _sk_clamp_a_dst_sse41
FUNCTION(_sk_clamp_a_dst_sse41)
_sk_clamp_a_dst_sse41:
- .byte 15,93,61,20,128,1,0 // minps 0x18014(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,93,61,200,130,1,0 // minps 0x182c8(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -35472,7 +35849,7 @@ HIDDEN _sk_invert_sse41
.globl _sk_invert_sse41
FUNCTION(_sk_invert_sse41)
_sk_invert_sse41:
- .byte 68,15,40,5,208,127,1,0 // movaps 0x17fd0(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,132,130,1,0 // movaps 0x18284(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -35534,7 +35911,7 @@ HIDDEN _sk_unpremul_sse41
FUNCTION(_sk_unpremul_sse41)
_sk_unpremul_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,90,127,1,0 // movaps 0x17f5a(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,14,130,1,0 // movaps 0x1820e(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -35548,20 +35925,20 @@ HIDDEN _sk_from_srgb_sse41
.globl _sk_from_srgb_sse41
FUNCTION(_sk_from_srgb_sse41)
_sk_from_srgb_sse41:
- .byte 68,15,40,29,37,128,1,0 // movaps 0x18025(%rip),%xmm11 # 2b8c0 <_sk_overlay_sse2_8bit+0xeff>
+ .byte 68,15,40,29,217,130,1,0 // movaps 0x182d9(%rip),%xmm11 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
.byte 68,15,40,208 // movaps %xmm0,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
- .byte 68,15,40,37,157,127,1,0 // movaps 0x17f9d(%rip),%xmm12 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,37,81,130,1,0 // movaps 0x18251(%rip),%xmm12 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,13,128,1,0 // movaps 0x1800d(%rip),%xmm13 # 2b8d0 <_sk_overlay_sse2_8bit+0xf0f>
+ .byte 68,15,40,45,193,130,1,0 // movaps 0x182c1(%rip),%xmm13 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b>
.byte 69,15,88,197 // addps %xmm13,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
- .byte 68,15,40,53,13,128,1,0 // movaps 0x1800d(%rip),%xmm14 # 2b8e0 <_sk_overlay_sse2_8bit+0xf1f>
+ .byte 68,15,40,53,193,130,1,0 // movaps 0x182c1(%rip),%xmm14 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b>
.byte 69,15,88,198 // addps %xmm14,%xmm8
- .byte 68,15,40,61,17,128,1,0 // movaps 0x18011(%rip),%xmm15 # 2b8f0 <_sk_overlay_sse2_8bit+0xf2f>
+ .byte 68,15,40,61,197,130,1,0 // movaps 0x182c5(%rip),%xmm15 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,40,209 // movaps %xmm1,%xmm10
@@ -35598,19 +35975,19 @@ FUNCTION(_sk_from_srgb_dst_sse41)
_sk_from_srgb_dst_sse41:
.byte 68,15,40,204 // movaps %xmm4,%xmm9
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,29,92,127,1,0 // movaps 0x17f5c(%rip),%xmm11 # 2b8c0 <_sk_overlay_sse2_8bit+0xeff>
+ .byte 68,15,40,29,16,130,1,0 // movaps 0x18210(%rip),%xmm11 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 68,15,40,37,213,126,1,0 // movaps 0x17ed5(%rip),%xmm12 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,37,137,129,1,0 // movaps 0x18189(%rip),%xmm12 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 65,15,89,228 // mulps %xmm12,%xmm4
- .byte 68,15,40,45,73,127,1,0 // movaps 0x17f49(%rip),%xmm13 # 2b8d0 <_sk_overlay_sse2_8bit+0xf0f>
+ .byte 68,15,40,45,253,129,1,0 // movaps 0x181fd(%rip),%xmm13 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b>
.byte 65,15,88,229 // addps %xmm13,%xmm4
.byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 68,15,40,53,74,127,1,0 // movaps 0x17f4a(%rip),%xmm14 # 2b8e0 <_sk_overlay_sse2_8bit+0xf1f>
+ .byte 68,15,40,53,254,129,1,0 // movaps 0x181fe(%rip),%xmm14 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b>
.byte 65,15,88,230 // addps %xmm14,%xmm4
- .byte 68,15,40,61,78,127,1,0 // movaps 0x17f4e(%rip),%xmm15 # 2b8f0 <_sk_overlay_sse2_8bit+0xf2f>
+ .byte 68,15,40,61,2,130,1,0 // movaps 0x18202(%rip),%xmm15 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b>
.byte 69,15,194,207,1 // cmpltps %xmm15,%xmm9
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,226 // blendvps %xmm0,%xmm10,%xmm4
@@ -35654,22 +36031,22 @@ _sk_to_srgb_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 68,15,82,192 // rsqrtps %xmm0,%xmm8
- .byte 68,15,40,29,194,126,1,0 // movaps 0x17ec2(%rip),%xmm11 # 2b900 <_sk_overlay_sse2_8bit+0xf3f>
+ .byte 68,15,40,29,118,129,1,0 // movaps 0x18176(%rip),%xmm11 # 2bf00 <_sk_overlay_sse2_8bit+0xf4b>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
- .byte 68,15,40,37,194,126,1,0 // movaps 0x17ec2(%rip),%xmm12 # 2b910 <_sk_overlay_sse2_8bit+0xf4f>
+ .byte 68,15,40,37,118,129,1,0 // movaps 0x18176(%rip),%xmm12 # 2bf10 <_sk_overlay_sse2_8bit+0xf5b>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 69,15,89,252 // mulps %xmm12,%xmm15
- .byte 68,15,40,21,194,126,1,0 // movaps 0x17ec2(%rip),%xmm10 # 2b920 <_sk_overlay_sse2_8bit+0xf5f>
+ .byte 68,15,40,21,118,129,1,0 // movaps 0x18176(%rip),%xmm10 # 2bf20 <_sk_overlay_sse2_8bit+0xf6b>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,248 // mulps %xmm8,%xmm15
- .byte 68,15,40,45,194,126,1,0 // movaps 0x17ec2(%rip),%xmm13 # 2b930 <_sk_overlay_sse2_8bit+0xf6f>
+ .byte 68,15,40,45,118,129,1,0 // movaps 0x18176(%rip),%xmm13 # 2bf30 <_sk_overlay_sse2_8bit+0xf7b>
.byte 69,15,88,253 // addps %xmm13,%xmm15
- .byte 68,15,40,53,198,126,1,0 // movaps 0x17ec6(%rip),%xmm14 # 2b940 <_sk_overlay_sse2_8bit+0xf7f>
+ .byte 68,15,40,53,122,129,1,0 // movaps 0x1817a(%rip),%xmm14 # 2bf40 <_sk_overlay_sse2_8bit+0xf8b>
.byte 69,15,88,198 // addps %xmm14,%xmm8
.byte 69,15,83,192 // rcpps %xmm8,%xmm8
.byte 69,15,89,199 // mulps %xmm15,%xmm8
- .byte 68,15,40,61,194,126,1,0 // movaps 0x17ec2(%rip),%xmm15 # 2b950 <_sk_overlay_sse2_8bit+0xf8f>
+ .byte 68,15,40,61,118,129,1,0 // movaps 0x18176(%rip),%xmm15 # 2bf50 <_sk_overlay_sse2_8bit+0xf9b>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,82,202 // rsqrtps %xmm2,%xmm9
@@ -35714,15 +36091,17 @@ FUNCTION(_sk_rgb_to_hsl_sse41)
_sk_rgb_to_hsl_sse41:
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,40,192 // movaps %xmm0,%xmm8
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 15,95,194 // maxps %xmm2,%xmm0
.byte 69,15,40,216 // movaps %xmm8,%xmm11
- .byte 69,15,95,217 // maxps %xmm9,%xmm11
- .byte 68,15,95,218 // maxps %xmm2,%xmm11
+ .byte 68,15,95,216 // maxps %xmm0,%xmm11
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 15,93,194 // minps %xmm2,%xmm0
.byte 69,15,40,224 // movaps %xmm8,%xmm12
- .byte 69,15,93,225 // minps %xmm9,%xmm12
- .byte 68,15,93,226 // minps %xmm2,%xmm12
+ .byte 68,15,93,224 // minps %xmm0,%xmm12
.byte 65,15,40,203 // movaps %xmm11,%xmm1
.byte 65,15,92,204 // subps %xmm12,%xmm1
- .byte 68,15,40,53,127,124,1,0 // movaps 0x17c7f(%rip),%xmm14 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,53,45,127,1,0 // movaps 0x17f2d(%rip),%xmm14 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,94,241 // divps %xmm1,%xmm14
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10
@@ -35731,27 +36110,27 @@ _sk_rgb_to_hsl_sse41:
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15
- .byte 68,15,84,61,230,125,1,0 // andps 0x17de6(%rip),%xmm15 # 2b960 <_sk_overlay_sse2_8bit+0xf9f>
+ .byte 68,15,84,61,148,128,1,0 // andps 0x18094(%rip),%xmm15 # 2bf60 <_sk_overlay_sse2_8bit+0xfab>
.byte 68,15,88,248 // addps %xmm0,%xmm15
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 68,15,40,45,217,125,1,0 // movaps 0x17dd9(%rip),%xmm13 # 2b970 <_sk_overlay_sse2_8bit+0xfaf>
+ .byte 68,15,40,45,135,128,1,0 // movaps 0x18087(%rip),%xmm13 # 2bf70 <_sk_overlay_sse2_8bit+0xfbb>
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,198 // mulps %xmm14,%xmm8
- .byte 68,15,88,5,213,125,1,0 // addps 0x17dd5(%rip),%xmm8 # 2b980 <_sk_overlay_sse2_8bit+0xfbf>
+ .byte 68,15,88,5,131,128,1,0 // addps 0x18083(%rip),%xmm8 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb>
.byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8
- .byte 68,15,89,5,205,125,1,0 // mulps 0x17dcd(%rip),%xmm8 # 2b990 <_sk_overlay_sse2_8bit+0xfcf>
+ .byte 68,15,89,5,123,128,1,0 // mulps 0x1807b(%rip),%xmm8 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb>
.byte 69,15,40,203 // movaps %xmm11,%xmm9
.byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9
.byte 69,15,84,193 // andps %xmm9,%xmm8
.byte 69,15,92,235 // subps %xmm11,%xmm13
.byte 69,15,88,220 // addps %xmm12,%xmm11
- .byte 15,40,5,225,123,1,0 // movaps 0x17be1(%rip),%xmm0 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,40,5,143,126,1,0 // movaps 0x17e8f(%rip),%xmm0 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,40,211 // movaps %xmm11,%xmm2
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,194,194,1 // cmpltps %xmm2,%xmm0
@@ -35773,7 +36152,7 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp)
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,208 // movaps %xmm0,%xmm10
- .byte 68,15,40,13,151,123,1,0 // movaps 0x17b97(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,13,69,126,1,0 // movaps 0x17e45(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,194,194,2 // cmpleps %xmm2,%xmm0
.byte 15,40,217 // movaps %xmm1,%xmm3
@@ -35786,19 +36165,19 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp)
.byte 69,15,88,192 // addps %xmm8,%xmm8
.byte 68,15,92,197 // subps %xmm5,%xmm8
- .byte 68,15,40,53,66,125,1,0 // movaps 0x17d42(%rip),%xmm14 # 2b9a0 <_sk_overlay_sse2_8bit+0xfdf>
+ .byte 68,15,40,53,240,127,1,0 // movaps 0x17ff0(%rip),%xmm14 # 2bfa0 <_sk_overlay_sse2_8bit+0xfeb>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0
.byte 68,15,92,240 // subps %xmm0,%xmm14
- .byte 68,15,40,29,59,125,1,0 // movaps 0x17d3b(%rip),%xmm11 # 2b9b0 <_sk_overlay_sse2_8bit+0xfef>
+ .byte 68,15,40,29,233,127,1,0 // movaps 0x17fe9(%rip),%xmm11 # 2bfb0 <_sk_overlay_sse2_8bit+0xffb>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 65,15,92,240 // subps %xmm8,%xmm6
- .byte 15,40,61,212,124,1,0 // movaps 0x17cd4(%rip),%xmm7 # 2b960 <_sk_overlay_sse2_8bit+0xf9f>
+ .byte 15,40,61,130,127,1,0 // movaps 0x17f82(%rip),%xmm7 # 2bf60 <_sk_overlay_sse2_8bit+0xfab>
.byte 69,15,40,238 // movaps %xmm14,%xmm13
.byte 68,15,89,239 // mulps %xmm7,%xmm13
- .byte 15,40,29,229,124,1,0 // movaps 0x17ce5(%rip),%xmm3 # 2b980 <_sk_overlay_sse2_8bit+0xfbf>
+ .byte 15,40,29,147,127,1,0 // movaps 0x17f93(%rip),%xmm3 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb>
.byte 68,15,40,227 // movaps %xmm3,%xmm12
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 68,15,89,230 // mulps %xmm6,%xmm12
@@ -35808,7 +36187,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,40,253 // movaps %xmm5,%xmm15
.byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15
- .byte 68,15,40,37,196,124,1,0 // movaps 0x17cc4(%rip),%xmm12 # 2b990 <_sk_overlay_sse2_8bit+0xfcf>
+ .byte 68,15,40,37,114,127,1,0 // movaps 0x17f72(%rip),%xmm12 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb>
.byte 65,15,40,196 // movaps %xmm12,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,89,238 // mulps %xmm6,%xmm13
@@ -35842,7 +36221,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,40,198 // movaps %xmm14,%xmm0
.byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,88,21,92,124,1,0 // addps 0x17c5c(%rip),%xmm10 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,88,21,10,127,1,0 // addps 0x17f0a(%rip),%xmm10 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11
@@ -35897,11 +36276,11 @@ _sk_scale_u8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,52 // jne 13e4b <_sk_scale_u8_sse41+0x4c>
+ .byte 117,52 // jne 1419d <_sk_scale_u8_sse41+0x4c>
.byte 102,71,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm8
- .byte 102,68,15,219,5,89,122,1,0 // pand 0x17a59(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,68,15,219,5,7,125,1,0 // pand 0x17d07(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,157,123,1,0 // mulps 0x17b9d(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,89,5,75,126,1,0 // mulps 0x17e4b(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -35912,12 +36291,12 @@ _sk_scale_u8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,59 // je 13e93 <_sk_scale_u8_sse41+0x94>
+ .byte 116,59 // je 141e5 <_sk_scale_u8_sse41+0x94>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 13e7a <_sk_scale_u8_sse41+0x7b>
+ .byte 116,23 // je 141cc <_sk_scale_u8_sse41+0x7b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,181 // jne 13e1e <_sk_scale_u8_sse41+0x1f>
+ .byte 117,181 // jne 14170 <_sk_scale_u8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -35925,10 +36304,77 @@ _sk_scale_u8_sse41:
.byte 102,68,15,110,200 // movd %eax,%xmm9
.byte 102,69,15,56,49,201 // pmovzxbd %xmm9,%xmm9
.byte 102,69,15,58,14,193,15 // pblendw $0xf,%xmm9,%xmm8
- .byte 235,139 // jmp 13e1e <_sk_scale_u8_sse41+0x1f>
+ .byte 235,139 // jmp 14170 <_sk_scale_u8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,124,255,255,255 // jmpq 13e1e <_sk_scale_u8_sse41+0x1f>
+ .byte 233,124,255,255,255 // jmpq 14170 <_sk_scale_u8_sse41+0x1f>
+
+HIDDEN _sk_scale_565_sse41
+.globl _sk_scale_565_sse41
+FUNCTION(_sk_scale_565_sse41)
+_sk_scale_565_sse41:
+ .byte 102,68,15,111,192 // movdqa %xmm0,%xmm8
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,99,80,8 // movslq 0x8(%rax),%r10
+ .byte 76,99,201 // movslq %ecx,%r9
+ .byte 77,15,175,202 // imul %r10,%r9
+ .byte 77,1,201 // add %r9,%r9
+ .byte 76,3,8 // add (%rax),%r9
+ .byte 76,99,218 // movslq %edx,%r11
+ .byte 77,133,192 // test %r8,%r8
+ .byte 15,133,159,0,0,0 // jne 142b7 <_sk_scale_565_sse41+0xc3>
+ .byte 102,71,15,56,51,28,89 // pmovzxwd (%r9,%r11,2),%xmm11
+ .byte 102,15,111,5,185,125,1,0 // movdqa 0x17db9(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,65,15,219,195 // pand %xmm11,%xmm0
+ .byte 68,15,91,200 // cvtdq2ps %xmm0,%xmm9
+ .byte 68,15,89,13,184,125,1,0 // mulps 0x17db8(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,5,192,125,1,0 // movdqa 0x17dc0(%rip),%xmm0 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,65,15,219,195 // pand %xmm11,%xmm0
+ .byte 68,15,91,208 // cvtdq2ps %xmm0,%xmm10
+ .byte 68,15,89,21,191,125,1,0 // mulps 0x17dbf(%rip),%xmm10 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,68,15,219,29,198,125,1,0 // pand 0x17dc6(%rip),%xmm11 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11
+ .byte 68,15,89,29,202,125,1,0 // mulps 0x17dca(%rip),%xmm11 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 15,194,199,1 // cmpltps %xmm7,%xmm0
+ .byte 69,15,40,226 // movaps %xmm10,%xmm12
+ .byte 69,15,93,227 // minps %xmm11,%xmm12
+ .byte 69,15,40,233 // movaps %xmm9,%xmm13
+ .byte 69,15,93,236 // minps %xmm12,%xmm13
+ .byte 69,15,40,242 // movaps %xmm10,%xmm14
+ .byte 69,15,95,243 // maxps %xmm11,%xmm14
+ .byte 69,15,40,225 // movaps %xmm9,%xmm12
+ .byte 69,15,95,230 // maxps %xmm14,%xmm12
+ .byte 102,69,15,56,20,229 // blendvps %xmm0,%xmm13,%xmm12
+ .byte 69,15,89,200 // mulps %xmm8,%xmm9
+ .byte 68,15,89,209 // mulps %xmm1,%xmm10
+ .byte 68,15,89,218 // mulps %xmm2,%xmm11
+ .byte 68,15,89,227 // mulps %xmm3,%xmm12
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 65,15,40,202 // movaps %xmm10,%xmm1
+ .byte 65,15,40,211 // movaps %xmm11,%xmm2
+ .byte 65,15,40,220 // movaps %xmm12,%xmm3
+ .byte 255,224 // jmpq *%rax
+ .byte 69,137,194 // mov %r8d,%r10d
+ .byte 65,128,226,3 // and $0x3,%r10b
+ .byte 65,128,250,1 // cmp $0x1,%r10b
+ .byte 116,60 // je 14300 <_sk_scale_565_sse41+0x10c>
+ .byte 102,69,15,239,219 // pxor %xmm11,%xmm11
+ .byte 65,128,250,2 // cmp $0x2,%r10b
+ .byte 116,26 // je 142e9 <_sk_scale_565_sse41+0xf5>
+ .byte 65,128,250,3 // cmp $0x3,%r10b
+ .byte 15,133,70,255,255,255 // jne 1421f <_sk_scale_565_sse41+0x2b>
+ .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
+ .byte 102,15,110,192 // movd %eax,%xmm0
+ .byte 102,68,15,112,216,69 // pshufd $0x45,%xmm0,%xmm11
+ .byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
+ .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
+ .byte 102,68,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm11
+ .byte 233,31,255,255,255 // jmpq 1421f <_sk_scale_565_sse41+0x2b>
+ .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
+ .byte 102,68,15,110,216 // movd %eax,%xmm11
+ .byte 233,16,255,255,255 // jmpq 1421f <_sk_scale_565_sse41+0x2b>
HIDDEN _sk_lerp_1_float_sse41
.globl _sk_lerp_1_float_sse41
@@ -35963,11 +36409,11 @@ _sk_lerp_u8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne 13f3a <_sk_lerp_u8_sse41+0x60>
+ .byte 117,72 // jne 143a7 <_sk_lerp_u8_sse41+0x60>
.byte 102,71,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm8
- .byte 102,68,15,219,5,126,121,1,0 // pand 0x1797e(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,68,15,219,5,17,123,1,0 // pand 0x17b11(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,194,122,1,0 // mulps 0x17ac2(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,89,5,85,124,1,0 // mulps 0x17c55(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -35985,12 +36431,12 @@ _sk_lerp_u8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,62 // je 13f85 <_sk_lerp_u8_sse41+0xab>
+ .byte 116,62 // je 143f2 <_sk_lerp_u8_sse41+0xab>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 13f69 <_sk_lerp_u8_sse41+0x8f>
+ .byte 116,23 // je 143d6 <_sk_lerp_u8_sse41+0x8f>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,161 // jne 13ef9 <_sk_lerp_u8_sse41+0x1f>
+ .byte 117,161 // jne 14366 <_sk_lerp_u8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -35998,15 +36444,16 @@ _sk_lerp_u8_sse41:
.byte 102,68,15,110,200 // movd %eax,%xmm9
.byte 102,69,15,56,49,201 // pmovzxbd %xmm9,%xmm9
.byte 102,69,15,58,14,193,15 // pblendw $0xf,%xmm9,%xmm8
- .byte 233,116,255,255,255 // jmpq 13ef9 <_sk_lerp_u8_sse41+0x1f>
+ .byte 233,116,255,255,255 // jmpq 14366 <_sk_lerp_u8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,101,255,255,255 // jmpq 13ef9 <_sk_lerp_u8_sse41+0x1f>
+ .byte 233,101,255,255,255 // jmpq 14366 <_sk_lerp_u8_sse41+0x1f>
HIDDEN _sk_lerp_565_sse41
.globl _sk_lerp_565_sse41
FUNCTION(_sk_lerp_565_sse41)
_sk_lerp_565_sse41:
+ .byte 102,68,15,111,192 // movdqa %xmm0,%xmm8
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,99,80,8 // movslq 0x8(%rax),%r10
.byte 76,99,201 // movslq %ecx,%r9
@@ -36015,59 +36462,62 @@ _sk_lerp_565_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,152,0,0,0 // jne 1404b <_sk_lerp_565_sse41+0xb7>
+ .byte 15,133,165,0,0,0 // jne 144ca <_sk_lerp_565_sse41+0xc9>
.byte 102,71,15,56,51,20,89 // pmovzxwd (%r9,%r11,2),%xmm10
- .byte 102,68,15,111,5,29,122,1,0 // movdqa 0x17a1d(%rip),%xmm8 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
- .byte 102,69,15,219,194 // pand %xmm10,%xmm8
- .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,28,122,1,0 // mulps 0x17a1c(%rip),%xmm8 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,68,15,111,13,35,122,1,0 // movdqa 0x17a23(%rip),%xmm9 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
- .byte 102,69,15,219,202 // pand %xmm10,%xmm9
- .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,34,122,1,0 // mulps 0x17a22(%rip),%xmm9 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,68,15,219,21,41,122,1,0 // pand 0x17a29(%rip),%xmm10 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 102,15,111,5,172,123,1,0 // movdqa 0x17bac(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,65,15,219,194 // pand %xmm10,%xmm0
+ .byte 68,15,91,200 // cvtdq2ps %xmm0,%xmm9
+ .byte 68,15,89,13,171,123,1,0 // mulps 0x17bab(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,5,179,123,1,0 // movdqa 0x17bb3(%rip),%xmm0 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,65,15,219,194 // pand %xmm10,%xmm0
+ .byte 68,15,91,216 // cvtdq2ps %xmm0,%xmm11
+ .byte 68,15,89,29,178,123,1,0 // mulps 0x17bb2(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,68,15,219,21,185,123,1,0 // pand 0x17bb9(%rip),%xmm10 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,45,122,1,0 // mulps 0x17a2d(%rip),%xmm10 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
- .byte 15,92,196 // subps %xmm4,%xmm0
- .byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 68,15,89,21,189,123,1,0 // mulps 0x17bbd(%rip),%xmm10 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 15,194,199,1 // cmpltps %xmm7,%xmm0
+ .byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 15,92,205 // subps %xmm5,%xmm1
- .byte 65,15,89,201 // mulps %xmm9,%xmm1
+ .byte 65,15,89,203 // mulps %xmm11,%xmm1
+ .byte 69,15,93,218 // minps %xmm10,%xmm11
+ .byte 69,15,40,233 // movaps %xmm9,%xmm13
+ .byte 68,15,92,196 // subps %xmm4,%xmm8
+ .byte 69,15,89,193 // mulps %xmm9,%xmm8
+ .byte 69,15,93,203 // minps %xmm11,%xmm9
+ .byte 69,15,95,226 // maxps %xmm10,%xmm12
+ .byte 69,15,95,236 // maxps %xmm12,%xmm13
+ .byte 102,69,15,56,20,233 // blendvps %xmm0,%xmm9,%xmm13
+ .byte 68,15,88,196 // addps %xmm4,%xmm8
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 65,15,89,210 // mulps %xmm10,%xmm2
.byte 15,88,214 // addps %xmm6,%xmm2
.byte 15,92,223 // subps %xmm7,%xmm3
- .byte 68,15,89,195 // mulps %xmm3,%xmm8
- .byte 68,15,88,199 // addps %xmm7,%xmm8
- .byte 68,15,89,203 // mulps %xmm3,%xmm9
- .byte 68,15,88,207 // addps %xmm7,%xmm9
- .byte 65,15,89,218 // mulps %xmm10,%xmm3
+ .byte 65,15,89,221 // mulps %xmm13,%xmm3
.byte 15,88,223 // addps %xmm7,%xmm3
- .byte 68,15,95,203 // maxps %xmm3,%xmm9
- .byte 69,15,95,193 // maxps %xmm9,%xmm8
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 65,15,40,216 // movaps %xmm8,%xmm3
+ .byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,62 // je 14096 <_sk_lerp_565_sse41+0x102>
+ .byte 116,60 // je 14513 <_sk_lerp_565_sse41+0x112>
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,27 // je 1407e <_sk_lerp_565_sse41+0xea>
+ .byte 116,26 // je 144fc <_sk_lerp_565_sse41+0xfb>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,77,255,255,255 // jne 13fba <_sk_lerp_565_sse41+0x26>
+ .byte 15,133,64,255,255,255 // jne 1442c <_sk_lerp_565_sse41+0x2b>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
- .byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 102,69,15,112,208,69 // pshufd $0x45,%xmm8,%xmm10
- .byte 102,71,15,110,4,89 // movd (%r9,%r11,2),%xmm8
- .byte 102,69,15,56,51,192 // pmovzxwd %xmm8,%xmm8
- .byte 102,69,15,58,14,208,15 // pblendw $0xf,%xmm8,%xmm10
- .byte 233,36,255,255,255 // jmpq 13fba <_sk_lerp_565_sse41+0x26>
+ .byte 102,15,110,192 // movd %eax,%xmm0
+ .byte 102,68,15,112,208,69 // pshufd $0x45,%xmm0,%xmm10
+ .byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
+ .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
+ .byte 102,68,15,58,14,208,15 // pblendw $0xf,%xmm0,%xmm10
+ .byte 233,25,255,255,255 // jmpq 1442c <_sk_lerp_565_sse41+0x2b>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,68,15,110,208 // movd %eax,%xmm10
- .byte 233,21,255,255,255 // jmpq 13fba <_sk_lerp_565_sse41+0x26>
+ .byte 233,10,255,255,255 // jmpq 1442c <_sk_lerp_565_sse41+0x2b>
HIDDEN _sk_load_tables_sse41
.globl _sk_load_tables_sse41
@@ -36076,12 +36526,12 @@ _sk_load_tables_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,24,1,0,0 // jne 141cb <_sk_load_tables_sse41+0x126>
+ .byte 15,133,24,1,0,0 // jne 14648 <_sk_load_tables_sse41+0x126>
.byte 243,69,15,111,4,145 // movdqu (%r9,%rdx,4),%xmm8
.byte 65,87 // push %r15
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,15,111,5,186,119,1,0 // movdqa 0x177ba(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,5,61,121,1,0 // movdqa 0x1793d(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -36096,7 +36546,7 @@ _sk_load_tables_sse41:
.byte 102,66,15,58,33,4,179,32 // insertps $0x20,(%rbx,%r14,4),%xmm0
.byte 102,66,15,58,33,4,11,48 // insertps $0x30,(%rbx,%r9,1),%xmm0
.byte 102,65,15,111,200 // movdqa %xmm8,%xmm1
- .byte 102,15,56,0,13,117,119,1,0 // pshufb 0x17775(%rip),%xmm1 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,13,248,120,1,0 // pshufb 0x178f8(%rip),%xmm1 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
.byte 68,15,182,211 // movzbl %bl,%r10d
@@ -36111,7 +36561,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1
.byte 76,139,72,24 // mov 0x18(%rax),%r9
.byte 102,65,15,111,208 // movdqa %xmm8,%xmm2
- .byte 102,15,56,0,21,49,119,1,0 // pshufb 0x17731(%rip),%xmm2 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,21,180,120,1,0 // pshufb 0x178b4(%rip),%xmm2 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 102,72,15,58,22,211,1 // pextrq $0x1,%xmm2,%rbx
.byte 102,72,15,126,208 // movq %xmm2,%rax
.byte 68,15,182,208 // movzbl %al,%r10d
@@ -36126,7 +36576,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3
- .byte 15,89,29,14,120,1,0 // mulps 0x1780e(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,29,145,121,1,0 // mulps 0x17991(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -36135,19 +36585,19 @@ _sk_load_tables_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,52 // je 1420c <_sk_load_tables_sse41+0x167>
+ .byte 116,52 // je 14689 <_sk_load_tables_sse41+0x167>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 141fa <_sk_load_tables_sse41+0x155>
+ .byte 116,23 // je 14677 <_sk_load_tables_sse41+0x155>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,204,254,255,255 // jne 140b9 <_sk_load_tables_sse41+0x14>
+ .byte 15,133,204,254,255,255 // jne 14536 <_sk_load_tables_sse41+0x14>
.byte 102,65,15,110,68,145,8 // movd 0x8(%r9,%rdx,4),%xmm0
.byte 102,68,15,112,192,69 // pshufd $0x45,%xmm0,%xmm8
.byte 243,65,15,126,4,145 // movq (%r9,%rdx,4),%xmm0
.byte 102,68,15,58,14,192,15 // pblendw $0xf,%xmm0,%xmm8
- .byte 233,173,254,255,255 // jmpq 140b9 <_sk_load_tables_sse41+0x14>
+ .byte 233,173,254,255,255 // jmpq 14536 <_sk_load_tables_sse41+0x14>
.byte 102,69,15,110,4,145 // movd (%r9,%rdx,4),%xmm8
- .byte 233,162,254,255,255 // jmpq 140b9 <_sk_load_tables_sse41+0x14>
+ .byte 233,162,254,255,255 // jmpq 14536 <_sk_load_tables_sse41+0x14>
HIDDEN _sk_load_tables_u16_be_sse41
.globl _sk_load_tables_u16_be_sse41
@@ -36157,7 +36607,7 @@ _sk_load_tables_u16_be_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,99,1,0,0 // jne 14390 <_sk_load_tables_u16_be_sse41+0x179>
+ .byte 15,133,99,1,0,0 // jne 1480d <_sk_load_tables_u16_be_sse41+0x179>
.byte 102,67,15,16,4,81 // movupd (%r9,%r10,2),%xmm0
.byte 243,67,15,111,76,81,16 // movdqu 0x10(%r9,%r10,2),%xmm1
.byte 65,87 // push %r15
@@ -36169,7 +36619,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,5,220,119,1,0 // movdqa 0x177dc(%rip),%xmm8 # 2ba40 <_sk_overlay_sse2_8bit+0x107f>
+ .byte 102,68,15,111,5,95,121,1,0 // movdqa 0x1795f(%rip),%xmm8 # 2c040 <_sk_overlay_sse2_8bit+0x108b>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -36187,7 +36637,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,15,58,33,194,32 // insertps $0x20,%xmm2,%xmm0
.byte 243,66,15,16,20,11 // movss (%rbx,%r9,1),%xmm2
.byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0
- .byte 102,15,56,0,13,139,119,1,0 // pshufb 0x1778b(%rip),%xmm1 # 2ba50 <_sk_overlay_sse2_8bit+0x108f>
+ .byte 102,15,56,0,13,14,121,1,0 // pshufb 0x1790e(%rip),%xmm1 # 2c050 <_sk_overlay_sse2_8bit+0x109b>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -36223,7 +36673,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,235,216 // por %xmm8,%xmm3
.byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,217,118,1,0 // mulps 0x176d9(%rip),%xmm3 # 2ba60 <_sk_overlay_sse2_8bit+0x109f>
+ .byte 15,89,29,92,120,1,0 // mulps 0x1785c(%rip),%xmm3 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -36231,16 +36681,16 @@ _sk_load_tables_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,67,15,16,4,81 // movsd (%r9,%r10,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 143a9 <_sk_load_tables_u16_be_sse41+0x192>
+ .byte 117,13 // jne 14826 <_sk_load_tables_u16_be_sse41+0x192>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,145,254,255,255 // jmpq 1423a <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 233,145,254,255,255 // jmpq 146b7 <_sk_load_tables_u16_be_sse41+0x23>
.byte 102,67,15,22,68,81,8 // movhpd 0x8(%r9,%r10,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,124,254,255,255 // jb 1423a <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 15,130,124,254,255,255 // jb 146b7 <_sk_load_tables_u16_be_sse41+0x23>
.byte 243,67,15,126,76,81,16 // movq 0x10(%r9,%r10,2),%xmm1
- .byte 233,112,254,255,255 // jmpq 1423a <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 233,112,254,255,255 // jmpq 146b7 <_sk_load_tables_u16_be_sse41+0x23>
HIDDEN _sk_load_tables_rgb_u16_be_sse41
.globl _sk_load_tables_rgb_u16_be_sse41
@@ -36250,7 +36700,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,83,1,0,0 // jne 1452f <_sk_load_tables_rgb_u16_be_sse41+0x165>
+ .byte 15,133,83,1,0,0 // jne 149ac <_sk_load_tables_rgb_u16_be_sse41+0x165>
.byte 243,67,15,111,20,81 // movdqu (%r9,%r10,2),%xmm2
.byte 243,67,15,111,76,81,8 // movdqu 0x8(%r9,%r10,2),%xmm1
.byte 102,15,115,217,4 // psrldq $0x4,%xmm1
@@ -36265,7 +36715,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
- .byte 102,68,15,111,5,30,118,1,0 // movdqa 0x1761e(%rip),%xmm8 # 2ba40 <_sk_overlay_sse2_8bit+0x107f>
+ .byte 102,68,15,111,5,161,119,1,0 // movdqa 0x177a1(%rip),%xmm8 # 2c040 <_sk_overlay_sse2_8bit+0x108b>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -36283,7 +36733,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,15,58,33,195,32 // insertps $0x20,%xmm3,%xmm0
.byte 243,66,15,16,28,11 // movss (%rbx,%r9,1),%xmm3
.byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0
- .byte 102,15,56,0,13,237,117,1,0 // pshufb 0x175ed(%rip),%xmm1 # 2ba70 <_sk_overlay_sse2_8bit+0x10af>
+ .byte 102,15,56,0,13,112,119,1,0 // pshufb 0x17770(%rip),%xmm1 # 2c070 <_sk_overlay_sse2_8bit+0x10bb>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -36314,7 +36764,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 243,65,15,16,28,25 // movss (%r9,%rbx,1),%xmm3
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,168,114,1,0 // movaps 0x172a8(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,43,116,1,0 // movaps 0x1742b(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 65,95 // pop %r15
@@ -36323,21 +36773,21 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,67,15,196,84,81,4,2 // pinsrw $0x2,0x4(%r9,%r10,2),%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,14 // jne 14555 <_sk_load_tables_rgb_u16_be_sse41+0x18b>
+ .byte 117,14 // jne 149d2 <_sk_load_tables_rgb_u16_be_sse41+0x18b>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
- .byte 233,173,254,255,255 // jmpq 14402 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,173,254,255,255 // jmpq 1487f <_sk_load_tables_rgb_u16_be_sse41+0x38>
.byte 102,71,15,110,76,81,6 // movd 0x6(%r9,%r10,2),%xmm9
.byte 102,71,15,196,76,81,10,2 // pinsrw $0x2,0xa(%r9,%r10,2),%xmm9
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 14586 <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
+ .byte 114,24 // jb 14a03 <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
.byte 102,67,15,110,76,81,12 // movd 0xc(%r9,%r10,2),%xmm1
.byte 102,67,15,196,76,81,16,2 // pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,124,254,255,255 // jmpq 14402 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,124,254,255,255 // jmpq 1487f <_sk_load_tables_rgb_u16_be_sse41+0x38>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,115,254,255,255 // jmpq 14402 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,115,254,255,255 // jmpq 1487f <_sk_load_tables_rgb_u16_be_sse41+0x38>
HIDDEN _sk_byte_tables_sse41
.globl _sk_byte_tables_sse41
@@ -36348,7 +36798,7 @@ _sk_byte_tables_sse41:
.byte 65,84 // push %r12
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,16,115,1,0 // movaps 0x17310(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,147,116,1,0 // movaps 0x17493(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9
@@ -36367,7 +36817,7 @@ _sk_byte_tables_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,209,115,1,0 // movaps 0x173d1(%rip),%xmm9 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,13,84,117,1,0 // movaps 0x17554(%rip),%xmm9 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -36463,7 +36913,7 @@ _sk_byte_tables_rgb_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,57,114,1,0 // movaps 0x17239(%rip),%xmm9 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,13,188,115,1,0 // movaps 0x173bc(%rip),%xmm9 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -36650,31 +37100,31 @@ _sk_parametric_r_sse41:
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8
- .byte 68,15,89,5,33,112,1,0 // mulps 0x17021(%rip),%xmm8 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,21,41,112,1,0 // andps 0x17029(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,21,81,109,1,0 // orps 0x16d51(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,5,41,112,1,0 // addps 0x17029(%rip),%xmm8 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 68,15,40,37,49,112,1,0 // movaps 0x17031(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,5,164,113,1,0 // mulps 0x171a4(%rip),%xmm8 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,21,172,113,1,0 // andps 0x171ac(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,21,212,110,1,0 // orps 0x16ed4(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,5,172,113,1,0 // addps 0x171ac(%rip),%xmm8 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,40,37,180,113,1,0 // movaps 0x171b4(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
- .byte 68,15,88,21,49,112,1,0 // addps 0x17031(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 68,15,40,37,57,112,1,0 // movaps 0x17039(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,21,180,113,1,0 // addps 0x171b4(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 68,15,40,37,188,113,1,0 // movaps 0x171bc(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
.byte 69,15,89,195 // mulps %xmm11,%xmm8
.byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,5,38,112,1,0 // addps 0x17026(%rip),%xmm8 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 68,15,40,21,46,112,1,0 // movaps 0x1702e(%rip),%xmm10 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,5,169,113,1,0 // addps 0x171a9(%rip),%xmm8 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 68,15,40,21,177,113,1,0 // movaps 0x171b1(%rip),%xmm10 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 69,15,92,194 // subps %xmm10,%xmm8
- .byte 68,15,40,21,46,112,1,0 // movaps 0x1702e(%rip),%xmm10 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,21,177,113,1,0 // movaps 0x171b1(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 68,15,40,29,50,112,1,0 // movaps 0x17032(%rip),%xmm11 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 68,15,40,29,181,113,1,0 // movaps 0x171b5(%rip),%xmm11 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,94,218 // divps %xmm10,%xmm11
.byte 69,15,88,216 // addps %xmm8,%xmm11
- .byte 68,15,89,29,50,112,1,0 // mulps 0x17032(%rip),%xmm11 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 68,15,89,29,181,113,1,0 // mulps 0x171b5(%rip),%xmm11 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10
.byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
@@ -36682,7 +37132,7 @@ _sk_parametric_r_sse41:
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,185,108,1,0 // minps 0x16cb9(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,93,5,60,110,1,0 // minps 0x16e3c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -36712,31 +37162,31 @@ _sk_parametric_g_sse41:
.byte 68,15,88,217 // addps %xmm1,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,250,110,1,0 // mulps 0x16efa(%rip),%xmm12 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,29,2,111,1,0 // andps 0x16f02(%rip),%xmm11 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,29,42,108,1,0 // orps 0x16c2a(%rip),%xmm11 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,37,2,111,1,0 // addps 0x16f02(%rip),%xmm12 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 15,40,13,11,111,1,0 // movaps 0x16f0b(%rip),%xmm1 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,37,125,112,1,0 // mulps 0x1707d(%rip),%xmm12 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,29,133,112,1,0 // andps 0x17085(%rip),%xmm11 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,29,173,109,1,0 // orps 0x16dad(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,37,133,112,1,0 // addps 0x17085(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 15,40,13,142,112,1,0 // movaps 0x1708e(%rip),%xmm1 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,88,29,11,111,1,0 // addps 0x16f0b(%rip),%xmm11 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 15,40,13,20,111,1,0 // movaps 0x16f14(%rip),%xmm1 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,29,142,112,1,0 // addps 0x1708e(%rip),%xmm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 15,40,13,151,112,1,0 // movaps 0x17097(%rip),%xmm1 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 65,15,94,203 // divps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,1,111,1,0 // addps 0x16f01(%rip),%xmm12 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 15,40,13,10,111,1,0 // movaps 0x16f0a(%rip),%xmm1 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,37,132,112,1,0 // addps 0x17084(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 15,40,13,141,112,1,0 // movaps 0x1708d(%rip),%xmm1 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,40,21,10,111,1,0 // movaps 0x16f0a(%rip),%xmm10 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,21,141,112,1,0 // movaps 0x1708d(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,13,15,111,1,0 // movaps 0x16f0f(%rip),%xmm1 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 15,40,13,146,112,1,0 // movaps 0x17092(%rip),%xmm1 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 65,15,94,202 // divps %xmm10,%xmm1
.byte 65,15,88,204 // addps %xmm12,%xmm1
- .byte 15,89,13,16,111,1,0 // mulps 0x16f10(%rip),%xmm1 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 15,89,13,147,112,1,0 // mulps 0x17093(%rip),%xmm1 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10
.byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
@@ -36744,7 +37194,7 @@ _sk_parametric_g_sse41:
.byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,200 // maxps %xmm0,%xmm1
- .byte 15,93,13,155,107,1,0 // minps 0x16b9b(%rip),%xmm1 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,93,13,30,109,1,0 // minps 0x16d1e(%rip),%xmm1 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -36774,31 +37224,31 @@ _sk_parametric_b_sse41:
.byte 68,15,88,218 // addps %xmm2,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,220,109,1,0 // mulps 0x16ddc(%rip),%xmm12 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,29,228,109,1,0 // andps 0x16de4(%rip),%xmm11 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,29,12,107,1,0 // orps 0x16b0c(%rip),%xmm11 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,37,228,109,1,0 // addps 0x16de4(%rip),%xmm12 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 15,40,21,237,109,1,0 // movaps 0x16ded(%rip),%xmm2 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,37,95,111,1,0 // mulps 0x16f5f(%rip),%xmm12 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,29,103,111,1,0 // andps 0x16f67(%rip),%xmm11 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,29,143,108,1,0 // orps 0x16c8f(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,37,103,111,1,0 // addps 0x16f67(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 15,40,21,112,111,1,0 // movaps 0x16f70(%rip),%xmm2 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,88,29,237,109,1,0 // addps 0x16ded(%rip),%xmm11 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 15,40,21,246,109,1,0 // movaps 0x16df6(%rip),%xmm2 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,29,112,111,1,0 // addps 0x16f70(%rip),%xmm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 15,40,21,121,111,1,0 // movaps 0x16f79(%rip),%xmm2 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 65,15,94,211 // divps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,227,109,1,0 // addps 0x16de3(%rip),%xmm12 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 15,40,21,236,109,1,0 // movaps 0x16dec(%rip),%xmm2 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,37,102,111,1,0 // addps 0x16f66(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 15,40,21,111,111,1,0 // movaps 0x16f6f(%rip),%xmm2 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,40,21,236,109,1,0 // movaps 0x16dec(%rip),%xmm10 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,21,111,111,1,0 // movaps 0x16f6f(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,21,241,109,1,0 // movaps 0x16df1(%rip),%xmm2 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 15,40,21,116,111,1,0 // movaps 0x16f74(%rip),%xmm2 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 65,15,94,210 // divps %xmm10,%xmm2
.byte 65,15,88,212 // addps %xmm12,%xmm2
- .byte 15,89,21,242,109,1,0 // mulps 0x16df2(%rip),%xmm2 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 15,89,21,117,111,1,0 // mulps 0x16f75(%rip),%xmm2 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10
.byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
@@ -36806,7 +37256,7 @@ _sk_parametric_b_sse41:
.byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,208 // maxps %xmm0,%xmm2
- .byte 15,93,21,125,106,1,0 // minps 0x16a7d(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,93,21,0,108,1,0 // minps 0x16c00(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -36836,31 +37286,31 @@ _sk_parametric_a_sse41:
.byte 68,15,88,219 // addps %xmm3,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,190,108,1,0 // mulps 0x16cbe(%rip),%xmm12 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,29,198,108,1,0 // andps 0x16cc6(%rip),%xmm11 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,29,238,105,1,0 // orps 0x169ee(%rip),%xmm11 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,37,198,108,1,0 // addps 0x16cc6(%rip),%xmm12 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 15,40,29,207,108,1,0 // movaps 0x16ccf(%rip),%xmm3 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,37,65,110,1,0 // mulps 0x16e41(%rip),%xmm12 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,29,73,110,1,0 // andps 0x16e49(%rip),%xmm11 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,29,113,107,1,0 // orps 0x16b71(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,37,73,110,1,0 // addps 0x16e49(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 15,40,29,82,110,1,0 // movaps 0x16e52(%rip),%xmm3 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,88,29,207,108,1,0 // addps 0x16ccf(%rip),%xmm11 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 15,40,29,216,108,1,0 // movaps 0x16cd8(%rip),%xmm3 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,29,82,110,1,0 // addps 0x16e52(%rip),%xmm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 15,40,29,91,110,1,0 // movaps 0x16e5b(%rip),%xmm3 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 65,15,94,219 // divps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,197,108,1,0 // addps 0x16cc5(%rip),%xmm12 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 15,40,29,206,108,1,0 // movaps 0x16cce(%rip),%xmm3 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,37,72,110,1,0 // addps 0x16e48(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 15,40,29,81,110,1,0 // movaps 0x16e51(%rip),%xmm3 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,40,21,206,108,1,0 // movaps 0x16cce(%rip),%xmm10 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,21,81,110,1,0 // movaps 0x16e51(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,29,211,108,1,0 // movaps 0x16cd3(%rip),%xmm3 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 15,40,29,86,110,1,0 // movaps 0x16e56(%rip),%xmm3 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 65,15,94,218 // divps %xmm10,%xmm3
.byte 65,15,88,220 // addps %xmm12,%xmm3
- .byte 15,89,29,212,108,1,0 // mulps 0x16cd4(%rip),%xmm3 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 15,89,29,87,110,1,0 // mulps 0x16e57(%rip),%xmm3 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10
.byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
@@ -36868,7 +37318,7 @@ _sk_parametric_a_sse41:
.byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,216 // maxps %xmm0,%xmm3
- .byte 15,93,29,95,105,1,0 // minps 0x1695f(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,93,29,226,106,1,0 // minps 0x16ae2(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -36885,20 +37335,20 @@ _sk_gamma_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,5,222,107,1,0 // mulps 0x16bde(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,40,53,230,107,1,0 // movaps 0x16be6(%rip),%xmm14 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
+ .byte 15,89,5,97,109,1,0 // mulps 0x16d61(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,40,53,105,109,1,0 // movaps 0x16d69(%rip),%xmm14 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,37,10,105,1,0 // movaps 0x1690a(%rip),%xmm12 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,37,141,106,1,0 // movaps 0x16a8d(%rip),%xmm12 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,86,212 // orps %xmm12,%xmm2
- .byte 68,15,40,21,222,107,1,0 // movaps 0x16bde(%rip),%xmm10 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
+ .byte 68,15,40,21,97,109,1,0 // movaps 0x16d61(%rip),%xmm10 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,29,226,107,1,0 // movaps 0x16be2(%rip),%xmm11 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,40,29,101,109,1,0 // movaps 0x16d65(%rip),%xmm11 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 65,15,89,227 // mulps %xmm11,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 68,15,40,13,224,107,1,0 // movaps 0x16be0(%rip),%xmm9 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
+ .byte 68,15,40,13,99,109,1,0 // movaps 0x16d63(%rip),%xmm9 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 68,15,40,45,228,107,1,0 // movaps 0x16be4(%rip),%xmm13 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,40,45,103,109,1,0 // movaps 0x16d67(%rip),%xmm13 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 65,15,40,229 // movaps %xmm13,%xmm4
.byte 15,94,226 // divps %xmm2,%xmm4
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -36909,21 +37359,21 @@ _sk_gamma_sse41:
.byte 102,15,58,8,208,1 // roundps $0x1,%xmm0,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,53,199,107,1,0 // movaps 0x16bc7(%rip),%xmm6 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
+ .byte 15,40,53,74,109,1,0 // movaps 0x16d4a(%rip),%xmm6 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
.byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,40,61,221,107,1,0 // movaps 0x16bdd(%rip),%xmm7 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 15,40,61,96,109,1,0 // movaps 0x16d60(%rip),%xmm7 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,37,189,107,1,0 // movaps 0x16bbd(%rip),%xmm4 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 15,40,37,64,109,1,0 // movaps 0x16d40(%rip),%xmm4 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,92,194 // subps %xmm2,%xmm0
- .byte 68,15,40,61,207,107,1,0 // movaps 0x16bcf(%rip),%xmm15 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 68,15,40,61,82,109,1,0 // movaps 0x16d52(%rip),%xmm15 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 65,15,40,215 // movaps %xmm15,%xmm2
.byte 15,94,213 // divps %xmm5,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,5,43,107,1,0 // mulps 0x16b2b(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
+ .byte 15,89,5,174,108,1,0 // mulps 0x16cae(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
.byte 65,15,84,206 // andps %xmm14,%xmm1
.byte 65,15,86,204 // orps %xmm12,%xmm1
.byte 65,15,88,194 // addps %xmm10,%xmm0
@@ -36949,8 +37399,8 @@ _sk_gamma_sse41:
.byte 15,94,206 // divps %xmm6,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,5,204,106,1,0 // mulps 0x16acc(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 15,84,29,213,106,1,0 // andps 0x16ad5(%rip),%xmm3 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
+ .byte 15,89,5,79,108,1,0 // mulps 0x16c4f(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 15,84,29,88,108,1,0 // andps 0x16c58(%rip),%xmm3 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
.byte 65,15,86,220 // orps %xmm12,%xmm3
.byte 65,15,88,194 // addps %xmm10,%xmm0
.byte 68,15,89,219 // mulps %xmm3,%xmm11
@@ -36968,7 +37418,7 @@ _sk_gamma_sse41:
.byte 15,92,253 // subps %xmm5,%xmm7
.byte 68,15,94,255 // divps %xmm7,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 15,40,5,29,107,1,0 // movaps 0x16b1d(%rip),%xmm0 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 15,40,5,160,108,1,0 // movaps 0x16ca0(%rip),%xmm0 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 68,15,89,248 // mulps %xmm0,%xmm15
@@ -36988,29 +37438,29 @@ HIDDEN _sk_lab_to_xyz_sse41
FUNCTION(_sk_lab_to_xyz_sse41)
_sk_lab_to_xyz_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,89,5,237,106,1,0 // mulps 0x16aed(%rip),%xmm8 # 2bb30 <_sk_overlay_sse2_8bit+0x116f>
- .byte 68,15,40,13,101,104,1,0 // movaps 0x16865(%rip),%xmm9 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,89,5,112,108,1,0 // mulps 0x16c70(%rip),%xmm8 # 2c130 <_sk_overlay_sse2_8bit+0x117b>
+ .byte 68,15,40,13,232,105,1,0 // movaps 0x169e8(%rip),%xmm9 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 15,40,5,234,106,1,0 // movaps 0x16aea(%rip),%xmm0 # 2bb40 <_sk_overlay_sse2_8bit+0x117f>
+ .byte 15,40,5,109,108,1,0 // movaps 0x16c6d(%rip),%xmm0 # 2c140 <_sk_overlay_sse2_8bit+0x118b>
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,88,5,232,106,1,0 // addps 0x16ae8(%rip),%xmm8 # 2bb50 <_sk_overlay_sse2_8bit+0x118f>
- .byte 68,15,89,5,240,106,1,0 // mulps 0x16af0(%rip),%xmm8 # 2bb60 <_sk_overlay_sse2_8bit+0x119f>
- .byte 15,89,13,249,106,1,0 // mulps 0x16af9(%rip),%xmm1 # 2bb70 <_sk_overlay_sse2_8bit+0x11af>
+ .byte 68,15,88,5,107,108,1,0 // addps 0x16c6b(%rip),%xmm8 # 2c150 <_sk_overlay_sse2_8bit+0x119b>
+ .byte 68,15,89,5,115,108,1,0 // mulps 0x16c73(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x11ab>
+ .byte 15,89,13,124,108,1,0 // mulps 0x16c7c(%rip),%xmm1 # 2c170 <_sk_overlay_sse2_8bit+0x11bb>
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 15,89,21,254,106,1,0 // mulps 0x16afe(%rip),%xmm2 # 2bb80 <_sk_overlay_sse2_8bit+0x11bf>
+ .byte 15,89,21,129,108,1,0 // mulps 0x16c81(%rip),%xmm2 # 2c180 <_sk_overlay_sse2_8bit+0x11cb>
.byte 69,15,40,208 // movaps %xmm8,%xmm10
.byte 68,15,92,210 // subps %xmm2,%xmm10
.byte 68,15,40,217 // movaps %xmm1,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
- .byte 68,15,40,13,242,106,1,0 // movaps 0x16af2(%rip),%xmm9 # 2bb90 <_sk_overlay_sse2_8bit+0x11cf>
+ .byte 68,15,40,13,117,108,1,0 // movaps 0x16c75(%rip),%xmm9 # 2c190 <_sk_overlay_sse2_8bit+0x11db>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 15,40,21,242,106,1,0 // movaps 0x16af2(%rip),%xmm2 # 2bba0 <_sk_overlay_sse2_8bit+0x11df>
+ .byte 15,40,21,117,108,1,0 // movaps 0x16c75(%rip),%xmm2 # 2c1a0 <_sk_overlay_sse2_8bit+0x11eb>
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 68,15,40,37,247,106,1,0 // movaps 0x16af7(%rip),%xmm12 # 2bbb0 <_sk_overlay_sse2_8bit+0x11ef>
+ .byte 68,15,40,37,122,108,1,0 // movaps 0x16c7a(%rip),%xmm12 # 2c1b0 <_sk_overlay_sse2_8bit+0x11fb>
.byte 65,15,89,204 // mulps %xmm12,%xmm1
.byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1
.byte 69,15,40,216 // movaps %xmm8,%xmm11
@@ -37029,8 +37479,8 @@ _sk_lab_to_xyz_sse41:
.byte 65,15,89,212 // mulps %xmm12,%xmm2
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2
- .byte 15,89,13,176,106,1,0 // mulps 0x16ab0(%rip),%xmm1 # 2bbc0 <_sk_overlay_sse2_8bit+0x11ff>
- .byte 15,89,21,185,106,1,0 // mulps 0x16ab9(%rip),%xmm2 # 2bbd0 <_sk_overlay_sse2_8bit+0x120f>
+ .byte 15,89,13,51,108,1,0 // mulps 0x16c33(%rip),%xmm1 # 2c1c0 <_sk_overlay_sse2_8bit+0x120b>
+ .byte 15,89,21,60,108,1,0 // mulps 0x16c3c(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x121b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,40,200 // movaps %xmm8,%xmm1
@@ -37047,11 +37497,11 @@ _sk_load_a8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,39 // jne 15161 <_sk_load_a8_sse41+0x3f>
+ .byte 117,39 // jne 155de <_sk_load_a8_sse41+0x3f>
.byte 102,67,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm0
- .byte 102,15,219,5,55,103,1,0 // pand 0x16737(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,5,186,104,1,0 // pand 0x168ba(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,125,104,1,0 // mulps 0x1687d(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,29,0,106,1,0 // mulps 0x16a00(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -37060,12 +37510,12 @@ _sk_load_a8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 151a3 <_sk_load_a8_sse41+0x81>
+ .byte 116,53 // je 15620 <_sk_load_a8_sse41+0x81>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1518d <_sk_load_a8_sse41+0x6b>
+ .byte 116,21 // je 1560a <_sk_load_a8_sse41+0x6b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 15141 <_sk_load_a8_sse41+0x1f>
+ .byte 117,195 // jne 155be <_sk_load_a8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -37073,10 +37523,10 @@ _sk_load_a8_sse41:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1
.byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0
- .byte 235,158 // jmp 15141 <_sk_load_a8_sse41+0x1f>
+ .byte 235,158 // jmp 155be <_sk_load_a8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,147 // jmp 15141 <_sk_load_a8_sse41+0x1f>
+ .byte 235,147 // jmp 155be <_sk_load_a8_sse41+0x1f>
HIDDEN _sk_load_a8_dst_sse41
.globl _sk_load_a8_dst_sse41
@@ -37089,11 +37539,11 @@ _sk_load_a8_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,39 // jne 151ed <_sk_load_a8_dst_sse41+0x3f>
+ .byte 117,39 // jne 1566a <_sk_load_a8_dst_sse41+0x3f>
.byte 102,67,15,56,49,36,25 // pmovzxbd (%r9,%r11,1),%xmm4
- .byte 102,15,219,37,171,102,1,0 // pand 0x166ab(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,37,46,104,1,0 // pand 0x1682e(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,241,103,1,0 // mulps 0x167f1(%rip),%xmm7 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,61,116,105,1,0 // mulps 0x16974(%rip),%xmm7 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
@@ -37102,12 +37552,12 @@ _sk_load_a8_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 1522f <_sk_load_a8_dst_sse41+0x81>
+ .byte 116,53 // je 156ac <_sk_load_a8_dst_sse41+0x81>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 15219 <_sk_load_a8_dst_sse41+0x6b>
+ .byte 116,21 // je 15696 <_sk_load_a8_dst_sse41+0x6b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 151cd <_sk_load_a8_dst_sse41+0x1f>
+ .byte 117,195 // jne 1564a <_sk_load_a8_dst_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -37115,10 +37565,10 @@ _sk_load_a8_dst_sse41:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,49,237 // pmovzxbd %xmm5,%xmm5
.byte 102,15,58,14,229,15 // pblendw $0xf,%xmm5,%xmm4
- .byte 235,158 // jmp 151cd <_sk_load_a8_dst_sse41+0x1f>
+ .byte 235,158 // jmp 1564a <_sk_load_a8_dst_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,147 // jmp 151cd <_sk_load_a8_dst_sse41+0x1f>
+ .byte 235,147 // jmp 1564a <_sk_load_a8_dst_sse41+0x1f>
HIDDEN _sk_gather_a8_sse41
.globl _sk_gather_a8_sse41
@@ -37147,7 +37597,7 @@ _sk_gather_a8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,38,103,1,0 // mulps 0x16726(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,29,169,104,1,0 // mulps 0x168a9(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -37165,13 +37615,13 @@ _sk_store_a8_sse41:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,219,101,1,0 // movaps 0x165db(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,94,103,1,0 // movaps 0x1675e(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,13 // jne 152fb <_sk_store_a8_sse41+0x41>
+ .byte 117,13 // jne 15778 <_sk_store_a8_sse41+0x41>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 67,137,4,25 // mov %eax,(%r9,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -37180,17 +37630,17 @@ _sk_store_a8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 15337 <_sk_store_a8_sse41+0x7d>
+ .byte 116,41 // je 157b4 <_sk_store_a8_sse41+0x7d>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 15323 <_sk_store_a8_sse41+0x69>
+ .byte 116,15 // je 157a0 <_sk_store_a8_sse41+0x69>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 152f7 <_sk_store_a8_sse41+0x3d>
+ .byte 117,221 // jne 15774 <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,68,25,2,8 // pextrb $0x8,%xmm8,0x2(%r9,%r11,1)
- .byte 102,68,15,56,0,5,179,104,1,0 // pshufb 0x168b3(%rip),%xmm8 # 2bbe0 <_sk_overlay_sse2_8bit+0x121f>
+ .byte 102,68,15,56,0,5,54,106,1,0 // pshufb 0x16a36(%rip),%xmm8 # 2c1e0 <_sk_overlay_sse2_8bit+0x122b>
.byte 102,71,15,58,21,4,25,0 // pextrw $0x0,%xmm8,(%r9,%r11,1)
- .byte 235,192 // jmp 152f7 <_sk_store_a8_sse41+0x3d>
+ .byte 235,192 // jmp 15774 <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,4,25,0 // pextrb $0x0,%xmm8,(%r9,%r11,1)
- .byte 235,182 // jmp 152f7 <_sk_store_a8_sse41+0x3d>
+ .byte 235,182 // jmp 15774 <_sk_store_a8_sse41+0x3d>
HIDDEN _sk_load_g8_sse41
.globl _sk_load_g8_sse41
@@ -37203,25 +37653,25 @@ _sk_load_g8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,42 // jne 15383 <_sk_load_g8_sse41+0x42>
+ .byte 117,42 // jne 15800 <_sk_load_g8_sse41+0x42>
.byte 102,67,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm0
- .byte 102,15,219,5,24,101,1,0 // pand 0x16518(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,5,155,102,1,0 // pand 0x1669b(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,94,102,1,0 // mulps 0x1665e(%rip),%xmm0 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,5,225,103,1,0 // mulps 0x167e1(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,85,100,1,0 // movaps 0x16455(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,216,101,1,0 // movaps 0x165d8(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 153c5 <_sk_load_g8_sse41+0x84>
+ .byte 116,53 // je 15842 <_sk_load_g8_sse41+0x84>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 153af <_sk_load_g8_sse41+0x6e>
+ .byte 116,21 // je 1582c <_sk_load_g8_sse41+0x6e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 15360 <_sk_load_g8_sse41+0x1f>
+ .byte 117,192 // jne 157dd <_sk_load_g8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -37229,10 +37679,10 @@ _sk_load_g8_sse41:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1
.byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0
- .byte 235,155 // jmp 15360 <_sk_load_g8_sse41+0x1f>
+ .byte 235,155 // jmp 157dd <_sk_load_g8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,144 // jmp 15360 <_sk_load_g8_sse41+0x1f>
+ .byte 235,144 // jmp 157dd <_sk_load_g8_sse41+0x1f>
HIDDEN _sk_load_g8_dst_sse41
.globl _sk_load_g8_dst_sse41
@@ -37245,25 +37695,25 @@ _sk_load_g8_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,42 // jne 15412 <_sk_load_g8_dst_sse41+0x42>
+ .byte 117,42 // jne 1588f <_sk_load_g8_dst_sse41+0x42>
.byte 102,67,15,56,49,36,25 // pmovzxbd (%r9,%r11,1),%xmm4
- .byte 102,15,219,37,137,100,1,0 // pand 0x16489(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,37,12,102,1,0 // pand 0x1660c(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,207,101,1,0 // mulps 0x165cf(%rip),%xmm4 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,37,82,103,1,0 // mulps 0x16752(%rip),%xmm4 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,198,99,1,0 // movaps 0x163c6(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,61,73,101,1,0 // movaps 0x16549(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 15454 <_sk_load_g8_dst_sse41+0x84>
+ .byte 116,53 // je 158d1 <_sk_load_g8_dst_sse41+0x84>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1543e <_sk_load_g8_dst_sse41+0x6e>
+ .byte 116,21 // je 158bb <_sk_load_g8_dst_sse41+0x6e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 153ef <_sk_load_g8_dst_sse41+0x1f>
+ .byte 117,192 // jne 1586c <_sk_load_g8_dst_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -37271,10 +37721,10 @@ _sk_load_g8_dst_sse41:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,49,237 // pmovzxbd %xmm5,%xmm5
.byte 102,15,58,14,229,15 // pblendw $0xf,%xmm5,%xmm4
- .byte 235,155 // jmp 153ef <_sk_load_g8_dst_sse41+0x1f>
+ .byte 235,155 // jmp 1586c <_sk_load_g8_dst_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,144 // jmp 153ef <_sk_load_g8_dst_sse41+0x1f>
+ .byte 235,144 // jmp 1586c <_sk_load_g8_dst_sse41+0x1f>
HIDDEN _sk_gather_g8_sse41
.globl _sk_gather_g8_sse41
@@ -37303,9 +37753,9 @@ _sk_gather_g8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,1,101,1,0 // mulps 0x16501(%rip),%xmm0 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,5,132,102,1,0 // mulps 0x16684(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,248,98,1,0 // movaps 0x162f8(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,123,100,1,0 // movaps 0x1647b(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 91 // pop %rbx
@@ -37323,41 +37773,41 @@ _sk_load_565_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,80 // jne 1554c <_sk_load_565_sse41+0x6b>
+ .byte 117,80 // jne 159c9 <_sk_load_565_sse41+0x6b>
.byte 102,67,15,56,51,20,89 // pmovzxwd (%r9,%r11,2),%xmm2
- .byte 102,15,111,5,213,100,1,0 // movdqa 0x164d5(%rip),%xmm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
+ .byte 102,15,111,5,88,102,1,0 // movdqa 0x16658(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,215,100,1,0 // mulps 0x164d7(%rip),%xmm0 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,15,111,13,223,100,1,0 // movdqa 0x164df(%rip),%xmm1 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
+ .byte 15,89,5,90,102,1,0 // mulps 0x1665a(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,13,98,102,1,0 // movdqa 0x16662(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,225,100,1,0 // mulps 0x164e1(%rip),%xmm1 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,15,219,21,233,100,1,0 // pand 0x164e9(%rip),%xmm2 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 15,89,13,100,102,1,0 // mulps 0x16664(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,15,219,21,108,102,1,0 // pand 0x1666c(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,239,100,1,0 // mulps 0x164ef(%rip),%xmm2 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
+ .byte 15,89,21,114,102,1,0 // mulps 0x16672(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,134,98,1,0 // movaps 0x16286(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,9,100,1,0 // movaps 0x16409(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 1558e <_sk_load_565_sse41+0xad>
+ .byte 116,53 // je 15a0b <_sk_load_565_sse41+0xad>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 15578 <_sk_load_565_sse41+0x97>
+ .byte 116,21 // je 159f5 <_sk_load_565_sse41+0x97>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 15503 <_sk_load_565_sse41+0x22>
+ .byte 117,154 // jne 15980 <_sk_load_565_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,15,58,14,208,15 // pblendw $0xf,%xmm0,%xmm2
- .byte 233,117,255,255,255 // jmpq 15503 <_sk_load_565_sse41+0x22>
+ .byte 233,117,255,255,255 // jmpq 15980 <_sk_load_565_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,103,255,255,255 // jmpq 15503 <_sk_load_565_sse41+0x22>
+ .byte 233,103,255,255,255 // jmpq 15980 <_sk_load_565_sse41+0x22>
HIDDEN _sk_load_565_dst_sse41
.globl _sk_load_565_dst_sse41
@@ -37371,41 +37821,41 @@ _sk_load_565_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,80 // jne 15607 <_sk_load_565_dst_sse41+0x6b>
+ .byte 117,80 // jne 15a84 <_sk_load_565_dst_sse41+0x6b>
.byte 102,67,15,56,51,52,89 // pmovzxwd (%r9,%r11,2),%xmm6
- .byte 102,15,111,37,26,100,1,0 // movdqa 0x1641a(%rip),%xmm4 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
+ .byte 102,15,111,37,157,101,1,0 // movdqa 0x1659d(%rip),%xmm4 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,28,100,1,0 // mulps 0x1641c(%rip),%xmm4 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,15,111,45,36,100,1,0 // movdqa 0x16424(%rip),%xmm5 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
+ .byte 15,89,37,159,101,1,0 // mulps 0x1659f(%rip),%xmm4 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,45,167,101,1,0 // movdqa 0x165a7(%rip),%xmm5 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,38,100,1,0 // mulps 0x16426(%rip),%xmm5 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,15,219,53,46,100,1,0 // pand 0x1642e(%rip),%xmm6 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 15,89,45,169,101,1,0 // mulps 0x165a9(%rip),%xmm5 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,15,219,53,177,101,1,0 // pand 0x165b1(%rip),%xmm6 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,52,100,1,0 // mulps 0x16434(%rip),%xmm6 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
+ .byte 15,89,53,183,101,1,0 // mulps 0x165b7(%rip),%xmm6 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,203,97,1,0 // movaps 0x161cb(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,61,78,99,1,0 // movaps 0x1634e(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 15649 <_sk_load_565_dst_sse41+0xad>
+ .byte 116,53 // je 15ac6 <_sk_load_565_dst_sse41+0xad>
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 15633 <_sk_load_565_dst_sse41+0x97>
+ .byte 116,21 // je 15ab0 <_sk_load_565_dst_sse41+0x97>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 155be <_sk_load_565_dst_sse41+0x22>
+ .byte 117,154 // jne 15a3b <_sk_load_565_dst_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,56,51,228 // pmovzxwd %xmm4,%xmm4
.byte 102,15,58,14,244,15 // pblendw $0xf,%xmm4,%xmm6
- .byte 233,117,255,255,255 // jmpq 155be <_sk_load_565_dst_sse41+0x22>
+ .byte 233,117,255,255,255 // jmpq 15a3b <_sk_load_565_dst_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,103,255,255,255 // jmpq 155be <_sk_load_565_dst_sse41+0x22>
+ .byte 233,103,255,255,255 // jmpq 15a3b <_sk_load_565_dst_sse41+0x22>
HIDDEN _sk_gather_565_sse41
.globl _sk_gather_565_sse41
@@ -37433,19 +37883,19 @@ _sk_gather_565_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2
- .byte 102,15,111,5,31,99,1,0 // movdqa 0x1631f(%rip),%xmm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
+ .byte 102,15,111,5,162,100,1,0 // movdqa 0x164a2(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,33,99,1,0 // mulps 0x16321(%rip),%xmm0 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,15,111,13,41,99,1,0 // movdqa 0x16329(%rip),%xmm1 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
+ .byte 15,89,5,164,100,1,0 // mulps 0x164a4(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,13,172,100,1,0 // movdqa 0x164ac(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,43,99,1,0 // mulps 0x1632b(%rip),%xmm1 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,15,219,21,51,99,1,0 // pand 0x16333(%rip),%xmm2 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 15,89,13,174,100,1,0 // mulps 0x164ae(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,15,219,21,182,100,1,0 // pand 0x164b6(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,57,99,1,0 // mulps 0x16339(%rip),%xmm2 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
+ .byte 15,89,21,188,100,1,0 // mulps 0x164bc(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,208,96,1,0 // movaps 0x160d0(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,83,98,1,0 // movaps 0x16253(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -37460,12 +37910,12 @@ _sk_store_565_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,207,100,1,0 // movaps 0x164cf(%rip),%xmm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x122f>
+ .byte 68,15,40,5,82,102,1,0 // movaps 0x16652(%rip),%xmm8 # 2c1f0 <_sk_overlay_sse2_8bit+0x123b>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,196,100,1,0 // movaps 0x164c4(%rip),%xmm10 # 2bc00 <_sk_overlay_sse2_8bit+0x123f>
+ .byte 68,15,40,21,71,102,1,0 // movaps 0x16647(%rip),%xmm10 # 2c200 <_sk_overlay_sse2_8bit+0x124b>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -37475,7 +37925,7 @@ _sk_store_565_sse41:
.byte 102,69,15,86,194 // orpd %xmm10,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 15773 <_sk_store_565_sse41+0x70>
+ .byte 117,10 // jne 15bf0 <_sk_store_565_sse41+0x70>
.byte 242,69,15,17,4,65 // movsd %xmm8,(%r9,%rax,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -37483,17 +37933,17 @@ _sk_store_565_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,35 // je 157a9 <_sk_store_565_sse41+0xa6>
+ .byte 116,35 // je 15c26 <_sk_store_565_sse41+0xa6>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 1579b <_sk_store_565_sse41+0x98>
+ .byte 116,15 // je 15c18 <_sk_store_565_sse41+0x98>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 1576f <_sk_store_565_sse41+0x6c>
+ .byte 117,221 // jne 15bec <_sk_store_565_sse41+0x6c>
.byte 102,69,15,58,21,68,65,4,4 // pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,69,15,126,4,65 // movd %xmm8,(%r9,%rax,2)
- .byte 235,198 // jmp 1576f <_sk_store_565_sse41+0x6c>
+ .byte 235,198 // jmp 15bec <_sk_store_565_sse41+0x6c>
.byte 102,69,15,58,21,4,65,0 // pextrw $0x0,%xmm8,(%r9,%rax,2)
- .byte 235,188 // jmp 1576f <_sk_store_565_sse41+0x6c>
+ .byte 235,188 // jmp 15bec <_sk_store_565_sse41+0x6c>
HIDDEN _sk_load_4444_sse41
.globl _sk_load_4444_sse41
@@ -37507,44 +37957,44 @@ _sk_load_4444_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,95 // jne 1582d <_sk_load_4444_sse41+0x7a>
+ .byte 117,95 // jne 15caa <_sk_load_4444_sse41+0x7a>
.byte 102,67,15,56,51,28,89 // pmovzxwd (%r9,%r11,2),%xmm3
- .byte 102,15,111,5,51,100,1,0 // movdqa 0x16433(%rip),%xmm0 # 2bc10 <_sk_overlay_sse2_8bit+0x124f>
+ .byte 102,15,111,5,182,101,1,0 // movdqa 0x165b6(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,53,100,1,0 // mulps 0x16435(%rip),%xmm0 # 2bc20 <_sk_overlay_sse2_8bit+0x125f>
- .byte 102,15,111,13,61,100,1,0 // movdqa 0x1643d(%rip),%xmm1 # 2bc30 <_sk_overlay_sse2_8bit+0x126f>
+ .byte 15,89,5,184,101,1,0 // mulps 0x165b8(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
+ .byte 102,15,111,13,192,101,1,0 // movdqa 0x165c0(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,63,100,1,0 // mulps 0x1643f(%rip),%xmm1 # 2bc40 <_sk_overlay_sse2_8bit+0x127f>
- .byte 102,15,111,21,71,100,1,0 // movdqa 0x16447(%rip),%xmm2 # 2bc50 <_sk_overlay_sse2_8bit+0x128f>
+ .byte 15,89,13,194,101,1,0 // mulps 0x165c2(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
+ .byte 102,15,111,21,202,101,1,0 // movdqa 0x165ca(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,73,100,1,0 // mulps 0x16449(%rip),%xmm2 # 2bc60 <_sk_overlay_sse2_8bit+0x129f>
- .byte 102,15,219,29,81,100,1,0 // pand 0x16451(%rip),%xmm3 # 2bc70 <_sk_overlay_sse2_8bit+0x12af>
+ .byte 15,89,21,204,101,1,0 // mulps 0x165cc(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
+ .byte 102,15,219,29,212,101,1,0 // pand 0x165d4(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,87,100,1,0 // mulps 0x16457(%rip),%xmm3 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf>
+ .byte 15,89,29,218,101,1,0 // mulps 0x165da(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 1586f <_sk_load_4444_sse41+0xbc>
+ .byte 116,53 // je 15cec <_sk_load_4444_sse41+0xbc>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 15859 <_sk_load_4444_sse41+0xa6>
+ .byte 116,21 // je 15cd6 <_sk_load_4444_sse41+0xa6>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 157d5 <_sk_load_4444_sse41+0x22>
+ .byte 117,139 // jne 15c52 <_sk_load_4444_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,102,255,255,255 // jmpq 157d5 <_sk_load_4444_sse41+0x22>
+ .byte 233,102,255,255,255 // jmpq 15c52 <_sk_load_4444_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 233,88,255,255,255 // jmpq 157d5 <_sk_load_4444_sse41+0x22>
+ .byte 233,88,255,255,255 // jmpq 15c52 <_sk_load_4444_sse41+0x22>
HIDDEN _sk_load_4444_dst_sse41
.globl _sk_load_4444_dst_sse41
@@ -37558,44 +38008,44 @@ _sk_load_4444_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,95 // jne 158f7 <_sk_load_4444_dst_sse41+0x7a>
+ .byte 117,95 // jne 15d74 <_sk_load_4444_dst_sse41+0x7a>
.byte 102,67,15,56,51,60,89 // pmovzxwd (%r9,%r11,2),%xmm7
- .byte 102,15,111,37,105,99,1,0 // movdqa 0x16369(%rip),%xmm4 # 2bc10 <_sk_overlay_sse2_8bit+0x124f>
+ .byte 102,15,111,37,236,100,1,0 // movdqa 0x164ec(%rip),%xmm4 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,107,99,1,0 // mulps 0x1636b(%rip),%xmm4 # 2bc20 <_sk_overlay_sse2_8bit+0x125f>
- .byte 102,15,111,45,115,99,1,0 // movdqa 0x16373(%rip),%xmm5 # 2bc30 <_sk_overlay_sse2_8bit+0x126f>
+ .byte 15,89,37,238,100,1,0 // mulps 0x164ee(%rip),%xmm4 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
+ .byte 102,15,111,45,246,100,1,0 // movdqa 0x164f6(%rip),%xmm5 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,117,99,1,0 // mulps 0x16375(%rip),%xmm5 # 2bc40 <_sk_overlay_sse2_8bit+0x127f>
- .byte 102,15,111,53,125,99,1,0 // movdqa 0x1637d(%rip),%xmm6 # 2bc50 <_sk_overlay_sse2_8bit+0x128f>
+ .byte 15,89,45,248,100,1,0 // mulps 0x164f8(%rip),%xmm5 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
+ .byte 102,15,111,53,0,101,1,0 // movdqa 0x16500(%rip),%xmm6 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,127,99,1,0 // mulps 0x1637f(%rip),%xmm6 # 2bc60 <_sk_overlay_sse2_8bit+0x129f>
- .byte 102,15,219,61,135,99,1,0 // pand 0x16387(%rip),%xmm7 # 2bc70 <_sk_overlay_sse2_8bit+0x12af>
+ .byte 15,89,53,2,101,1,0 // mulps 0x16502(%rip),%xmm6 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
+ .byte 102,15,219,61,10,101,1,0 // pand 0x1650a(%rip),%xmm7 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,141,99,1,0 // mulps 0x1638d(%rip),%xmm7 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf>
+ .byte 15,89,61,16,101,1,0 // mulps 0x16510(%rip),%xmm7 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 15939 <_sk_load_4444_dst_sse41+0xbc>
+ .byte 116,53 // je 15db6 <_sk_load_4444_dst_sse41+0xbc>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 15923 <_sk_load_4444_dst_sse41+0xa6>
+ .byte 116,21 // je 15da0 <_sk_load_4444_dst_sse41+0xa6>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 1589f <_sk_load_4444_dst_sse41+0x22>
+ .byte 117,139 // jne 15d1c <_sk_load_4444_dst_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,56,51,228 // pmovzxwd %xmm4,%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,102,255,255,255 // jmpq 1589f <_sk_load_4444_dst_sse41+0x22>
+ .byte 233,102,255,255,255 // jmpq 15d1c <_sk_load_4444_dst_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,88,255,255,255 // jmpq 1589f <_sk_load_4444_dst_sse41+0x22>
+ .byte 233,88,255,255,255 // jmpq 15d1c <_sk_load_4444_dst_sse41+0x22>
HIDDEN _sk_gather_4444_sse41
.globl _sk_gather_4444_sse41
@@ -37623,21 +38073,21 @@ _sk_gather_4444_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3
- .byte 102,15,111,5,95,98,1,0 // movdqa 0x1625f(%rip),%xmm0 # 2bc10 <_sk_overlay_sse2_8bit+0x124f>
+ .byte 102,15,111,5,226,99,1,0 // movdqa 0x163e2(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,97,98,1,0 // mulps 0x16261(%rip),%xmm0 # 2bc20 <_sk_overlay_sse2_8bit+0x125f>
- .byte 102,15,111,13,105,98,1,0 // movdqa 0x16269(%rip),%xmm1 # 2bc30 <_sk_overlay_sse2_8bit+0x126f>
+ .byte 15,89,5,228,99,1,0 // mulps 0x163e4(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
+ .byte 102,15,111,13,236,99,1,0 // movdqa 0x163ec(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,107,98,1,0 // mulps 0x1626b(%rip),%xmm1 # 2bc40 <_sk_overlay_sse2_8bit+0x127f>
- .byte 102,15,111,21,115,98,1,0 // movdqa 0x16273(%rip),%xmm2 # 2bc50 <_sk_overlay_sse2_8bit+0x128f>
+ .byte 15,89,13,238,99,1,0 // mulps 0x163ee(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
+ .byte 102,15,111,21,246,99,1,0 // movdqa 0x163f6(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,117,98,1,0 // mulps 0x16275(%rip),%xmm2 # 2bc60 <_sk_overlay_sse2_8bit+0x129f>
- .byte 102,15,219,29,125,98,1,0 // pand 0x1627d(%rip),%xmm3 # 2bc70 <_sk_overlay_sse2_8bit+0x12af>
+ .byte 15,89,21,248,99,1,0 // mulps 0x163f8(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
+ .byte 102,15,219,29,0,100,1,0 // pand 0x16400(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,131,98,1,0 // mulps 0x16283(%rip),%xmm3 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf>
+ .byte 15,89,29,6,100,1,0 // mulps 0x16406(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -37653,7 +38103,7 @@ _sk_store_4444_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,112,98,1,0 // movaps 0x16270(%rip),%xmm8 # 2bc90 <_sk_overlay_sse2_8bit+0x12cf>
+ .byte 68,15,40,5,243,99,1,0 // movaps 0x163f3(%rip),%xmm8 # 2c290 <_sk_overlay_sse2_8bit+0x12db>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -37673,7 +38123,7 @@ _sk_store_4444_sse41:
.byte 102,69,15,86,194 // orpd %xmm10,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 15a86 <_sk_store_4444_sse41+0x84>
+ .byte 117,10 // jne 15f03 <_sk_store_4444_sse41+0x84>
.byte 242,69,15,17,4,65 // movsd %xmm8,(%r9,%rax,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -37681,17 +38131,17 @@ _sk_store_4444_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,35 // je 15abc <_sk_store_4444_sse41+0xba>
+ .byte 116,35 // je 15f39 <_sk_store_4444_sse41+0xba>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 15aae <_sk_store_4444_sse41+0xac>
+ .byte 116,15 // je 15f2b <_sk_store_4444_sse41+0xac>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 15a82 <_sk_store_4444_sse41+0x80>
+ .byte 117,221 // jne 15eff <_sk_store_4444_sse41+0x80>
.byte 102,69,15,58,21,68,65,4,4 // pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,69,15,126,4,65 // movd %xmm8,(%r9,%rax,2)
- .byte 235,198 // jmp 15a82 <_sk_store_4444_sse41+0x80>
+ .byte 235,198 // jmp 15eff <_sk_store_4444_sse41+0x80>
.byte 102,69,15,58,21,4,65,0 // pextrw $0x0,%xmm8,(%r9,%rax,2)
- .byte 235,188 // jmp 15a82 <_sk_store_4444_sse41+0x80>
+ .byte 235,188 // jmp 15eff <_sk_store_4444_sse41+0x80>
HIDDEN _sk_load_8888_sse41
.globl _sk_load_8888_sse41
@@ -37705,19 +38155,19 @@ _sk_load_8888_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 15b3b <_sk_load_8888_sse41+0x75>
+ .byte 117,89 // jne 15fb8 <_sk_load_8888_sse41+0x75>
.byte 243,65,15,111,28,129 // movdqu (%r9,%rax,4),%xmm3
- .byte 102,15,111,5,144,93,1,0 // movdqa 0x15d90(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,5,19,95,1,0 // movdqa 0x15f13(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,209,94,1,0 // movaps 0x15ed1(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,84,96,1,0 // movaps 0x16054(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,128,93,1,0 // pshufb 0x15d80(%rip),%xmm1 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,13,3,95,1,0 // pshufb 0x15f03(%rip),%xmm1 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,124,93,1,0 // pshufb 0x15d7c(%rip),%xmm2 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,21,255,94,1,0 // pshufb 0x15eff(%rip),%xmm2 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -37728,19 +38178,19 @@ _sk_load_8888_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 15b75 <_sk_load_8888_sse41+0xaf>
+ .byte 116,45 // je 15ff2 <_sk_load_8888_sse41+0xaf>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 15b64 <_sk_load_8888_sse41+0x9e>
+ .byte 116,18 // je 15fe1 <_sk_load_8888_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 15ae8 <_sk_load_8888_sse41+0x22>
+ .byte 117,144 // jne 15f65 <_sk_load_8888_sse41+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 243,65,15,126,4,129 // movq (%r9,%rax,4),%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,115,255,255,255 // jmpq 15ae8 <_sk_load_8888_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 15f65 <_sk_load_8888_sse41+0x22>
.byte 102,65,15,110,28,129 // movd (%r9,%rax,4),%xmm3
- .byte 233,104,255,255,255 // jmpq 15ae8 <_sk_load_8888_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 15f65 <_sk_load_8888_sse41+0x22>
HIDDEN _sk_load_8888_dst_sse41
.globl _sk_load_8888_dst_sse41
@@ -37754,19 +38204,19 @@ _sk_load_8888_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 15bf5 <_sk_load_8888_dst_sse41+0x75>
+ .byte 117,89 // jne 16072 <_sk_load_8888_dst_sse41+0x75>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
- .byte 102,15,111,37,214,92,1,0 // movdqa 0x15cd6(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,37,89,94,1,0 // movdqa 0x15e59(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,23,94,1,0 // movaps 0x15e17(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,154,95,1,0 // movaps 0x15f9a(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,198,92,1,0 // pshufb 0x15cc6(%rip),%xmm5 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,45,73,94,1,0 // pshufb 0x15e49(%rip),%xmm5 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,194,92,1,0 // pshufb 0x15cc2(%rip),%xmm6 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,53,69,94,1,0 // pshufb 0x15e45(%rip),%xmm6 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -37777,19 +38227,19 @@ _sk_load_8888_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 15c2f <_sk_load_8888_dst_sse41+0xaf>
+ .byte 116,45 // je 160ac <_sk_load_8888_dst_sse41+0xaf>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 15c1e <_sk_load_8888_dst_sse41+0x9e>
+ .byte 116,18 // je 1609b <_sk_load_8888_dst_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 15ba2 <_sk_load_8888_dst_sse41+0x22>
+ .byte 117,144 // jne 1601f <_sk_load_8888_dst_sse41+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,115,255,255,255 // jmpq 15ba2 <_sk_load_8888_dst_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 1601f <_sk_load_8888_dst_sse41+0x22>
.byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7
- .byte 233,104,255,255,255 // jmpq 15ba2 <_sk_load_8888_dst_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 1601f <_sk_load_8888_dst_sse41+0x22>
HIDDEN _sk_gather_8888_sse41
.globl _sk_gather_8888_sse41
@@ -37814,17 +38264,17 @@ _sk_gather_8888_sse41:
.byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3
.byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3
.byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3
- .byte 102,15,111,5,229,91,1,0 // movdqa 0x15be5(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,5,104,93,1,0 // movdqa 0x15d68(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,38,93,1,0 // movaps 0x15d26(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,169,94,1,0 // movaps 0x15ea9(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,213,91,1,0 // pshufb 0x15bd5(%rip),%xmm1 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,13,88,93,1,0 // pshufb 0x15d58(%rip),%xmm1 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,209,91,1,0 // pshufb 0x15bd1(%rip),%xmm2 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,21,84,93,1,0 // pshufb 0x15d54(%rip),%xmm2 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -37845,7 +38295,7 @@ _sk_store_8888_sse41:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,170,91,1,0 // movaps 0x15baa(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,45,93,1,0 // movaps 0x15d2d(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -37864,23 +38314,23 @@ _sk_store_8888_sse41:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 15d66 <_sk_store_8888_sse41+0x7f>
+ .byte 117,10 // jne 161e3 <_sk_store_8888_sse41+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,29 // je 15d90 <_sk_store_8888_sse41+0xa9>
+ .byte 116,29 // je 1620d <_sk_store_8888_sse41+0xa9>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 15d88 <_sk_store_8888_sse41+0xa1>
+ .byte 116,15 // je 16205 <_sk_store_8888_sse41+0xa1>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 15d62 <_sk_store_8888_sse41+0x7b>
+ .byte 117,227 // jne 161df <_sk_store_8888_sse41+0x7b>
.byte 102,69,15,58,22,68,129,8,2 // pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,210 // jmp 15d62 <_sk_store_8888_sse41+0x7b>
+ .byte 235,210 // jmp 161df <_sk_store_8888_sse41+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,202 // jmp 15d62 <_sk_store_8888_sse41+0x7b>
+ .byte 235,202 // jmp 161df <_sk_store_8888_sse41+0x7b>
HIDDEN _sk_load_bgra_sse41
.globl _sk_load_bgra_sse41
@@ -37894,19 +38344,19 @@ _sk_load_bgra_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 15e0d <_sk_load_bgra_sse41+0x75>
+ .byte 117,89 // jne 1628a <_sk_load_bgra_sse41+0x75>
.byte 243,65,15,111,28,129 // movdqu (%r9,%rax,4),%xmm3
- .byte 102,15,111,5,190,90,1,0 // movdqa 0x15abe(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,5,65,92,1,0 // movdqa 0x15c41(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,255,91,1,0 // movaps 0x15bff(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,130,93,1,0 // movaps 0x15d82(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,174,90,1,0 // pshufb 0x15aae(%rip),%xmm0 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,5,49,92,1,0 // pshufb 0x15c31(%rip),%xmm0 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,170,90,1,0 // pshufb 0x15aaa(%rip),%xmm0 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,5,45,92,1,0 // pshufb 0x15c2d(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -37917,19 +38367,19 @@ _sk_load_bgra_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 15e47 <_sk_load_bgra_sse41+0xaf>
+ .byte 116,45 // je 162c4 <_sk_load_bgra_sse41+0xaf>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 15e36 <_sk_load_bgra_sse41+0x9e>
+ .byte 116,18 // je 162b3 <_sk_load_bgra_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 15dba <_sk_load_bgra_sse41+0x22>
+ .byte 117,144 // jne 16237 <_sk_load_bgra_sse41+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 243,65,15,126,4,129 // movq (%r9,%rax,4),%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,115,255,255,255 // jmpq 15dba <_sk_load_bgra_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 16237 <_sk_load_bgra_sse41+0x22>
.byte 102,65,15,110,28,129 // movd (%r9,%rax,4),%xmm3
- .byte 233,104,255,255,255 // jmpq 15dba <_sk_load_bgra_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 16237 <_sk_load_bgra_sse41+0x22>
HIDDEN _sk_load_bgra_dst_sse41
.globl _sk_load_bgra_dst_sse41
@@ -37943,19 +38393,19 @@ _sk_load_bgra_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 15ec7 <_sk_load_bgra_dst_sse41+0x75>
+ .byte 117,89 // jne 16344 <_sk_load_bgra_dst_sse41+0x75>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
- .byte 102,15,111,37,4,90,1,0 // movdqa 0x15a04(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,37,135,91,1,0 // movdqa 0x15b87(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,244 // cvtdq2ps %xmm4,%xmm6
- .byte 68,15,40,5,69,91,1,0 // movaps 0x15b45(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,200,92,1,0 // movaps 0x15cc8(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,244,89,1,0 // pshufb 0x159f4(%rip),%xmm4 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,37,119,91,1,0 // pshufb 0x15b77(%rip),%xmm4 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,236 // cvtdq2ps %xmm4,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,240,89,1,0 // pshufb 0x159f0(%rip),%xmm4 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,37,115,91,1,0 // pshufb 0x15b73(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -37966,19 +38416,19 @@ _sk_load_bgra_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 15f01 <_sk_load_bgra_dst_sse41+0xaf>
+ .byte 116,45 // je 1637e <_sk_load_bgra_dst_sse41+0xaf>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 15ef0 <_sk_load_bgra_dst_sse41+0x9e>
+ .byte 116,18 // je 1636d <_sk_load_bgra_dst_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 15e74 <_sk_load_bgra_dst_sse41+0x22>
+ .byte 117,144 // jne 162f1 <_sk_load_bgra_dst_sse41+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,115,255,255,255 // jmpq 15e74 <_sk_load_bgra_dst_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 162f1 <_sk_load_bgra_dst_sse41+0x22>
.byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7
- .byte 233,104,255,255,255 // jmpq 15e74 <_sk_load_bgra_dst_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 162f1 <_sk_load_bgra_dst_sse41+0x22>
HIDDEN _sk_gather_bgra_sse41
.globl _sk_gather_bgra_sse41
@@ -38003,17 +38453,17 @@ _sk_gather_bgra_sse41:
.byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3
.byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3
.byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3
- .byte 102,15,111,5,19,89,1,0 // movdqa 0x15913(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,5,150,90,1,0 // movdqa 0x15a96(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,84,90,1,0 // movaps 0x15a54(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,215,91,1,0 // movaps 0x15bd7(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,3,89,1,0 // pshufb 0x15903(%rip),%xmm0 # 2b890 <_sk_overlay_sse2_8bit+0xecf>
+ .byte 102,15,56,0,5,134,90,1,0 // pshufb 0x15a86(%rip),%xmm0 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,255,88,1,0 // pshufb 0x158ff(%rip),%xmm0 # 2b8a0 <_sk_overlay_sse2_8bit+0xedf>
+ .byte 102,15,56,0,5,130,90,1,0 // pshufb 0x15a82(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -38034,7 +38484,7 @@ _sk_store_bgra_sse41:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,216,88,1,0 // movaps 0x158d8(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,91,90,1,0 // movaps 0x15a5b(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -38053,23 +38503,23 @@ _sk_store_bgra_sse41:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 16038 <_sk_store_bgra_sse41+0x7f>
+ .byte 117,10 // jne 164b5 <_sk_store_bgra_sse41+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,29 // je 16062 <_sk_store_bgra_sse41+0xa9>
+ .byte 116,29 // je 164df <_sk_store_bgra_sse41+0xa9>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 1605a <_sk_store_bgra_sse41+0xa1>
+ .byte 116,15 // je 164d7 <_sk_store_bgra_sse41+0xa1>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 16034 <_sk_store_bgra_sse41+0x7b>
+ .byte 117,227 // jne 164b1 <_sk_store_bgra_sse41+0x7b>
.byte 102,69,15,58,22,68,129,8,2 // pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,210 // jmp 16034 <_sk_store_bgra_sse41+0x7b>
+ .byte 235,210 // jmp 164b1 <_sk_store_bgra_sse41+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,202 // jmp 16034 <_sk_store_bgra_sse41+0x7b>
+ .byte 235,202 // jmp 164b1 <_sk_store_bgra_sse41+0x7b>
HIDDEN _sk_load_f16_sse41
.globl _sk_load_f16_sse41
@@ -38083,7 +38533,7 @@ _sk_load_f16_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,62,1,0,0 // jne 161c8 <_sk_load_f16_sse41+0x15e>
+ .byte 15,133,62,1,0,0 // jne 16645 <_sk_load_f16_sse41+0x15e>
.byte 102,65,15,16,4,193 // movupd (%r9,%rax,8),%xmm0
.byte 243,65,15,111,76,193,16 // movdqu 0x10(%r9,%rax,8),%xmm1
.byte 102,68,15,40,200 // movapd %xmm0,%xmm9
@@ -38093,18 +38543,18 @@ _sk_load_f16_sse41:
.byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,221,91,1,0 // movdqa 0x15bdd(%rip),%xmm8 # 2bca0 <_sk_overlay_sse2_8bit+0x12df>
+ .byte 102,68,15,111,5,96,93,1,0 // movdqa 0x15d60(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,216,91,1,0 // movdqa 0x15bd8(%rip),%xmm3 # 2bcb0 <_sk_overlay_sse2_8bit+0x12ef>
+ .byte 102,15,111,29,91,93,1,0 // movdqa 0x15d5b(%rip),%xmm3 # 2c2b0 <_sk_overlay_sse2_8bit+0x12fb>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,196,91,1,0 // movdqa 0x15bc4(%rip),%xmm10 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff>
+ .byte 102,68,15,111,21,71,93,1,0 // movdqa 0x15d47(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -38147,16 +38597,16 @@ _sk_load_f16_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,193 // movsd (%r9,%rax,8),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 161e1 <_sk_load_f16_sse41+0x177>
+ .byte 117,13 // jne 1665e <_sk_load_f16_sse41+0x177>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,182,254,255,255 // jmpq 16097 <_sk_load_f16_sse41+0x2d>
+ .byte 233,182,254,255,255 // jmpq 16514 <_sk_load_f16_sse41+0x2d>
.byte 102,65,15,22,68,193,8 // movhpd 0x8(%r9,%rax,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,161,254,255,255 // jb 16097 <_sk_load_f16_sse41+0x2d>
+ .byte 15,130,161,254,255,255 // jb 16514 <_sk_load_f16_sse41+0x2d>
.byte 243,65,15,126,76,193,16 // movq 0x10(%r9,%rax,8),%xmm1
- .byte 233,149,254,255,255 // jmpq 16097 <_sk_load_f16_sse41+0x2d>
+ .byte 233,149,254,255,255 // jmpq 16514 <_sk_load_f16_sse41+0x2d>
HIDDEN _sk_load_f16_dst_sse41
.globl _sk_load_f16_dst_sse41
@@ -38170,7 +38620,7 @@ _sk_load_f16_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,62,1,0,0 // jne 16360 <_sk_load_f16_dst_sse41+0x15e>
+ .byte 15,133,62,1,0,0 // jne 167dd <_sk_load_f16_dst_sse41+0x15e>
.byte 102,65,15,16,36,193 // movupd (%r9,%rax,8),%xmm4
.byte 243,65,15,111,108,193,16 // movdqu 0x10(%r9,%rax,8),%xmm5
.byte 102,68,15,40,204 // movapd %xmm4,%xmm9
@@ -38180,18 +38630,18 @@ _sk_load_f16_dst_sse41:
.byte 102,68,15,97,220 // punpcklwd %xmm4,%xmm11
.byte 102,68,15,105,204 // punpckhwd %xmm4,%xmm9
.byte 102,65,15,56,51,235 // pmovzxwd %xmm11,%xmm5
- .byte 102,68,15,111,5,69,90,1,0 // movdqa 0x15a45(%rip),%xmm8 # 2bca0 <_sk_overlay_sse2_8bit+0x12df>
+ .byte 102,68,15,111,5,200,91,1,0 // movdqa 0x15bc8(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
.byte 102,15,111,245 // movdqa %xmm5,%xmm6
.byte 102,65,15,219,240 // pand %xmm8,%xmm6
.byte 102,15,239,238 // pxor %xmm6,%xmm5
- .byte 102,15,111,61,64,90,1,0 // movdqa 0x15a40(%rip),%xmm7 # 2bcb0 <_sk_overlay_sse2_8bit+0x12ef>
+ .byte 102,15,111,61,195,91,1,0 // movdqa 0x15bc3(%rip),%xmm7 # 2c2b0 <_sk_overlay_sse2_8bit+0x12fb>
.byte 102,15,114,246,16 // pslld $0x10,%xmm6
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,15,56,63,231 // pmaxud %xmm7,%xmm4
.byte 102,15,118,229 // pcmpeqd %xmm5,%xmm4
.byte 102,15,114,245,13 // pslld $0xd,%xmm5
.byte 102,15,235,238 // por %xmm6,%xmm5
- .byte 102,68,15,111,21,44,90,1,0 // movdqa 0x15a2c(%rip),%xmm10 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff>
+ .byte 102,68,15,111,21,175,91,1,0 // movdqa 0x15baf(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,65,15,254,234 // paddd %xmm10,%xmm5
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -38234,16 +38684,16 @@ _sk_load_f16_dst_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,36,193 // movsd (%r9,%rax,8),%xmm4
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 16379 <_sk_load_f16_dst_sse41+0x177>
+ .byte 117,13 // jne 167f6 <_sk_load_f16_dst_sse41+0x177>
.byte 243,15,126,228 // movq %xmm4,%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
- .byte 233,182,254,255,255 // jmpq 1622f <_sk_load_f16_dst_sse41+0x2d>
+ .byte 233,182,254,255,255 // jmpq 166ac <_sk_load_f16_dst_sse41+0x2d>
.byte 102,65,15,22,100,193,8 // movhpd 0x8(%r9,%rax,8),%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,161,254,255,255 // jb 1622f <_sk_load_f16_dst_sse41+0x2d>
+ .byte 15,130,161,254,255,255 // jb 166ac <_sk_load_f16_dst_sse41+0x2d>
.byte 243,65,15,126,108,193,16 // movq 0x10(%r9,%rax,8),%xmm5
- .byte 233,149,254,255,255 // jmpq 1622f <_sk_load_f16_dst_sse41+0x2d>
+ .byte 233,149,254,255,255 // jmpq 166ac <_sk_load_f16_dst_sse41+0x2d>
HIDDEN _sk_gather_f16_sse41
.globl _sk_gather_f16_sse41
@@ -38277,18 +38727,18 @@ _sk_gather_f16_sse41:
.byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11
.byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,127,88,1,0 // movdqa 0x1587f(%rip),%xmm8 # 2bca0 <_sk_overlay_sse2_8bit+0x12df>
+ .byte 102,68,15,111,5,2,90,1,0 // movdqa 0x15a02(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,122,88,1,0 // movdqa 0x1587a(%rip),%xmm3 # 2bcb0 <_sk_overlay_sse2_8bit+0x12ef>
+ .byte 102,15,111,29,253,89,1,0 // movdqa 0x159fd(%rip),%xmm3 # 2c2b0 <_sk_overlay_sse2_8bit+0x12fb>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,102,88,1,0 // movdqa 0x15866(%rip),%xmm10 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff>
+ .byte 102,68,15,111,21,233,89,1,0 // movdqa 0x159e9(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -38342,17 +38792,17 @@ _sk_store_f16_sse41:
.byte 73,193,225,3 // shl $0x3,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,137,87,1,0 // movdqa 0x15789(%rip),%xmm10 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
+ .byte 102,68,15,111,21,12,89,1,0 // movdqa 0x1590c(%rip),%xmm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,68,15,111,216 // movdqa %xmm0,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,235 // pxor %xmm11,%xmm13
- .byte 102,68,15,111,13,124,87,1,0 // movdqa 0x1577c(%rip),%xmm9 # 2bce0 <_sk_overlay_sse2_8bit+0x131f>
+ .byte 102,68,15,111,13,255,88,1,0 // movdqa 0x158ff(%rip),%xmm9 # 2c2e0 <_sk_overlay_sse2_8bit+0x132b>
.byte 102,65,15,114,211,16 // psrld $0x10,%xmm11
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,37,109,87,1,0 // movdqa 0x1576d(%rip),%xmm12 # 2bcf0 <_sk_overlay_sse2_8bit+0x132f>
+ .byte 102,68,15,111,37,240,88,1,0 // movdqa 0x158f0(%rip),%xmm12 # 2c2f0 <_sk_overlay_sse2_8bit+0x133b>
.byte 102,69,15,235,220 // por %xmm12,%xmm11
.byte 102,69,15,254,221 // paddd %xmm13,%xmm11
.byte 102,69,15,223,195 // pandn %xmm11,%xmm8
@@ -38396,7 +38846,7 @@ _sk_store_f16_sse41:
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,69,15,98,203 // punpckldq %xmm11,%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 16679 <_sk_store_f16_sse41+0x152>
+ .byte 117,21 // jne 16af6 <_sk_store_f16_sse41+0x152>
.byte 69,15,17,12,193 // movups %xmm9,(%r9,%rax,8)
.byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8
.byte 243,69,15,127,68,193,16 // movdqu %xmm8,0x10(%r9,%rax,8)
@@ -38404,13 +38854,13 @@ _sk_store_f16_sse41:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,12,193 // movq %xmm9,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 16675 <_sk_store_f16_sse41+0x14e>
+ .byte 116,240 // je 16af2 <_sk_store_f16_sse41+0x14e>
.byte 102,69,15,23,76,193,8 // movhpd %xmm9,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 16675 <_sk_store_f16_sse41+0x14e>
+ .byte 114,227 // jb 16af2 <_sk_store_f16_sse41+0x14e>
.byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8
.byte 102,69,15,214,68,193,16 // movq %xmm8,0x10(%r9,%rax,8)
- .byte 235,213 // jmp 16675 <_sk_store_f16_sse41+0x14e>
+ .byte 235,213 // jmp 16af2 <_sk_store_f16_sse41+0x14e>
HIDDEN _sk_load_u16_be_sse41
.globl _sk_load_u16_be_sse41
@@ -38425,7 +38875,7 @@ _sk_load_u16_be_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,185,0,0,0 // jne 16780 <_sk_load_u16_be_sse41+0xe0>
+ .byte 15,133,185,0,0,0 // jne 16bfd <_sk_load_u16_be_sse41+0xe0>
.byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0
.byte 243,65,15,111,76,65,16 // movdqu 0x10(%r9,%rax,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -38441,7 +38891,7 @@ _sk_load_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,77,83,1,0 // movaps 0x1534d(%rip),%xmm8 # 2ba60 <_sk_overlay_sse2_8bit+0x109f>
+ .byte 68,15,40,5,208,84,1,0 // movaps 0x154d0(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -38469,16 +38919,16 @@ _sk_load_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 16799 <_sk_load_u16_be_sse41+0xf9>
+ .byte 117,13 // jne 16c16 <_sk_load_u16_be_sse41+0xf9>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,59,255,255,255 // jmpq 166d4 <_sk_load_u16_be_sse41+0x34>
+ .byte 233,59,255,255,255 // jmpq 16b51 <_sk_load_u16_be_sse41+0x34>
.byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,38,255,255,255 // jb 166d4 <_sk_load_u16_be_sse41+0x34>
+ .byte 15,130,38,255,255,255 // jb 16b51 <_sk_load_u16_be_sse41+0x34>
.byte 243,65,15,126,76,65,16 // movq 0x10(%r9,%rax,2),%xmm1
- .byte 233,26,255,255,255 // jmpq 166d4 <_sk_load_u16_be_sse41+0x34>
+ .byte 233,26,255,255,255 // jmpq 16b51 <_sk_load_u16_be_sse41+0x34>
HIDDEN _sk_load_rgb_u16_be_sse41
.globl _sk_load_rgb_u16_be_sse41
@@ -38495,7 +38945,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,170,0,0,0 // jne 1688f <_sk_load_rgb_u16_be_sse41+0xd5>
+ .byte 15,133,170,0,0,0 // jne 16d0c <_sk_load_rgb_u16_be_sse41+0xd5>
.byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2
.byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -38515,7 +38965,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,28,82,1,0 // movaps 0x1521c(%rip),%xmm8 # 2ba60 <_sk_overlay_sse2_8bit+0x109f>
+ .byte 68,15,40,5,159,83,1,0 // movaps 0x1539f(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -38532,27 +38982,27 @@ _sk_load_rgb_u16_be_sse41:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,67,79,1,0 // movaps 0x14f43(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,198,80,1,0 // movaps 0x150c6(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2
.byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 168b4 <_sk_load_rgb_u16_be_sse41+0xfa>
+ .byte 117,13 // jne 16d31 <_sk_load_rgb_u16_be_sse41+0xfa>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,85,255,255,255 // jmpq 16809 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,85,255,255,255 // jmpq 16c86 <_sk_load_rgb_u16_be_sse41+0x4f>
.byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0
.byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 168e5 <_sk_load_rgb_u16_be_sse41+0x12b>
+ .byte 114,24 // jb 16d62 <_sk_load_rgb_u16_be_sse41+0x12b>
.byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3
.byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,36,255,255,255 // jmpq 16809 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,36,255,255,255 // jmpq 16c86 <_sk_load_rgb_u16_be_sse41+0x4f>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,27,255,255,255 // jmpq 16809 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,27,255,255,255 // jmpq 16c86 <_sk_load_rgb_u16_be_sse41+0x4f>
HIDDEN _sk_store_u16_be_sse41
.globl _sk_store_u16_be_sse41
@@ -38566,7 +39016,7 @@ _sk_store_u16_be_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 68,15,40,21,236,83,1,0 // movaps 0x153ec(%rip),%xmm10 # 2bd00 <_sk_overlay_sse2_8bit+0x133f>
+ .byte 68,15,40,21,111,85,1,0 // movaps 0x1556f(%rip),%xmm10 # 2c300 <_sk_overlay_sse2_8bit+0x134b>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -38603,7 +39053,7 @@ _sk_store_u16_be_sse41:
.byte 102,69,15,111,208 // movdqa %xmm8,%xmm10
.byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 169e2 <_sk_store_u16_be_sse41+0xf4>
+ .byte 117,21 // jne 16e5f <_sk_store_u16_be_sse41+0xf4>
.byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2)
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2)
@@ -38611,13 +39061,13 @@ _sk_store_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 169de <_sk_store_u16_be_sse41+0xf0>
+ .byte 116,240 // je 16e5b <_sk_store_u16_be_sse41+0xf0>
.byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 169de <_sk_store_u16_be_sse41+0xf0>
+ .byte 114,227 // jb 16e5b <_sk_store_u16_be_sse41+0xf0>
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2)
- .byte 235,213 // jmp 169de <_sk_store_u16_be_sse41+0xf0>
+ .byte 235,213 // jmp 16e5b <_sk_store_u16_be_sse41+0xf0>
HIDDEN _sk_load_f32_sse41
.globl _sk_load_f32_sse41
@@ -38633,7 +39083,7 @@ _sk_load_f32_sse41:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 16a74 <_sk_load_f32_sse41+0x6b>
+ .byte 117,66 // jne 16ef1 <_sk_load_f32_sse41+0x6b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -38653,17 +39103,17 @@ _sk_load_f32_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 16a86 <_sk_load_f32_sse41+0x7d>
+ .byte 117,8 // jne 16f03 <_sk_load_f32_sse41+0x7d>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 235,190 // jmp 16a44 <_sk_load_f32_sse41+0x3b>
+ .byte 235,190 // jmp 16ec1 <_sk_load_f32_sse41+0x3b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 16a9a <_sk_load_f32_sse41+0x91>
+ .byte 114,8 // jb 16f17 <_sk_load_f32_sse41+0x91>
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
- .byte 235,170 // jmp 16a44 <_sk_load_f32_sse41+0x3b>
+ .byte 235,170 // jmp 16ec1 <_sk_load_f32_sse41+0x3b>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,165 // jmp 16a44 <_sk_load_f32_sse41+0x3b>
+ .byte 235,165 // jmp 16ec1 <_sk_load_f32_sse41+0x3b>
HIDDEN _sk_load_f32_dst_sse41
.globl _sk_load_f32_dst_sse41
@@ -38679,7 +39129,7 @@ _sk_load_f32_dst_sse41:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 16b0a <_sk_load_f32_dst_sse41+0x6b>
+ .byte 117,66 // jne 16f87 <_sk_load_f32_dst_sse41+0x6b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -38699,17 +39149,17 @@ _sk_load_f32_dst_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 16b1c <_sk_load_f32_dst_sse41+0x7d>
+ .byte 117,8 // jne 16f99 <_sk_load_f32_dst_sse41+0x7d>
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 235,190 // jmp 16ada <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,190 // jmp 16f57 <_sk_load_f32_dst_sse41+0x3b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 16b30 <_sk_load_f32_dst_sse41+0x91>
+ .byte 114,8 // jb 16fad <_sk_load_f32_dst_sse41+0x91>
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
- .byte 235,170 // jmp 16ada <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,170 // jmp 16f57 <_sk_load_f32_dst_sse41+0x3b>
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,165 // jmp 16ada <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,165 // jmp 16f57 <_sk_load_f32_dst_sse41+0x3b>
HIDDEN _sk_store_f32_sse41
.globl _sk_store_f32_sse41
@@ -38738,7 +39188,7 @@ _sk_store_f32_sse41:
.byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9
.byte 102,69,15,17,36,129 // movupd %xmm12,(%r9,%rax,4)
.byte 77,133,192 // test %r8,%r8
- .byte 117,29 // jne 16bb2 <_sk_store_f32_sse41+0x7d>
+ .byte 117,29 // jne 1702f <_sk_store_f32_sse41+0x7d>
.byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
@@ -38746,12 +39196,12 @@ _sk_store_f32_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,246 // je 16bae <_sk_store_f32_sse41+0x79>
+ .byte 116,246 // je 1702b <_sk_store_f32_sse41+0x79>
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,234 // jb 16bae <_sk_store_f32_sse41+0x79>
+ .byte 114,234 // jb 1702b <_sk_store_f32_sse41+0x79>
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
- .byte 235,225 // jmp 16bae <_sk_store_f32_sse41+0x79>
+ .byte 235,225 // jmp 1702b <_sk_store_f32_sse41+0x79>
HIDDEN _sk_clamp_x_sse41
.globl _sk_clamp_x_sse41
@@ -38841,7 +39291,7 @@ _sk_mirror_x_sse41:
.byte 65,15,92,194 // subps %xmm10,%xmm0
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,38,65,1,0 // mulss 0x14126(%rip),%xmm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 243,68,15,89,13,157,66,1,0 // mulss 0x1429d(%rip),%xmm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -38872,7 +39322,7 @@ _sk_mirror_y_sse41:
.byte 65,15,92,202 // subps %xmm10,%xmm1
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,180,64,1,0 // mulss 0x140b4(%rip),%xmm9 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 243,68,15,89,13,43,66,1,0 // mulss 0x1422b(%rip),%xmm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,201 // mulps %xmm1,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -38897,7 +39347,7 @@ FUNCTION(_sk_clamp_x_1_sse41)
_sk_clamp_x_1_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,47,74,1,0 // minps 0x14a2f(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,93,5,178,75,1,0 // minps 0x14bb2(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -38915,9 +39365,9 @@ HIDDEN _sk_mirror_x_1_sse41
.globl _sk_mirror_x_1_sse41
FUNCTION(_sk_mirror_x_1_sse41)
_sk_mirror_x_1_sse41:
- .byte 68,15,40,5,112,74,1,0 // movaps 0x14a70(%rip),%xmm8 # 2b830 <_sk_overlay_sse2_8bit+0xe6f>
+ .byte 68,15,40,5,243,75,1,0 // movaps 0x14bf3(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0xe7b>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,244,73,1,0 // movaps 0x149f4(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,13,119,75,1,0 // movaps 0x14b77(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
.byte 69,15,88,201 // addps %xmm9,%xmm9
@@ -38934,10 +39384,10 @@ HIDDEN _sk_luminance_to_alpha_sse41
FUNCTION(_sk_luminance_to_alpha_sse41)
_sk_luminance_to_alpha_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,19,79,1,0 // mulps 0x14f13(%rip),%xmm0 # 2bd10 <_sk_overlay_sse2_8bit+0x134f>
- .byte 15,89,13,28,79,1,0 // mulps 0x14f1c(%rip),%xmm1 # 2bd20 <_sk_overlay_sse2_8bit+0x135f>
+ .byte 15,89,5,150,80,1,0 // mulps 0x15096(%rip),%xmm0 # 2c310 <_sk_overlay_sse2_8bit+0x135b>
+ .byte 15,89,13,159,80,1,0 // mulps 0x1509f(%rip),%xmm1 # 2c320 <_sk_overlay_sse2_8bit+0x136b>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,34,79,1,0 // mulps 0x14f22(%rip),%xmm3 # 2bd30 <_sk_overlay_sse2_8bit+0x136f>
+ .byte 15,89,29,165,80,1,0 // mulps 0x150a5(%rip),%xmm3 # 2c330 <_sk_overlay_sse2_8bit+0x137b>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -39250,9 +39700,9 @@ _sk_evenly_spaced_gradient_sse41:
.byte 72,139,24 // mov (%rax),%rbx
.byte 76,139,112,8 // mov 0x8(%rax),%r14
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 172b0 <_sk_evenly_spaced_gradient_sse41+0x1a>
+ .byte 120,7 // js 1772d <_sk_evenly_spaced_gradient_sse41+0x1a>
.byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1
- .byte 235,21 // jmp 172c5 <_sk_evenly_spaced_gradient_sse41+0x2f>
+ .byte 235,21 // jmp 17742 <_sk_evenly_spaced_gradient_sse41+0x2f>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -39342,15 +39792,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse41
.globl _sk_gauss_a_to_rgba_sse41
FUNCTION(_sk_gauss_a_to_rgba_sse41)
_sk_gauss_a_to_rgba_sse41:
- .byte 15,40,5,205,72,1,0 // movaps 0x148cd(%rip),%xmm0 # 2bd40 <_sk_overlay_sse2_8bit+0x137f>
+ .byte 15,40,5,80,74,1,0 // movaps 0x14a50(%rip),%xmm0 # 2c340 <_sk_overlay_sse2_8bit+0x138b>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,211,72,1,0 // addps 0x148d3(%rip),%xmm0 # 2bd50 <_sk_overlay_sse2_8bit+0x138f>
+ .byte 15,88,5,86,74,1,0 // addps 0x14a56(%rip),%xmm0 # 2c350 <_sk_overlay_sse2_8bit+0x139b>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,217,72,1,0 // addps 0x148d9(%rip),%xmm0 # 2bd60 <_sk_overlay_sse2_8bit+0x139f>
+ .byte 15,88,5,92,74,1,0 // addps 0x14a5c(%rip),%xmm0 # 2c360 <_sk_overlay_sse2_8bit+0x13ab>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,223,72,1,0 // addps 0x148df(%rip),%xmm0 # 2bd70 <_sk_overlay_sse2_8bit+0x13af>
+ .byte 15,88,5,98,74,1,0 // addps 0x14a62(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0x13bb>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,229,72,1,0 // addps 0x148e5(%rip),%xmm0 # 2bd80 <_sk_overlay_sse2_8bit+0x13bf>
+ .byte 15,88,5,104,74,1,0 // addps 0x14a68(%rip),%xmm0 # 2c380 <_sk_overlay_sse2_8bit+0x13cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -39368,12 +39818,12 @@ _sk_gradient_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,50 // jb 174ee <_sk_gradient_sse41+0x46>
+ .byte 114,50 // jb 1796b <_sk_gradient_sse41+0x46>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,14,67,1,0 // movaps 0x1430e(%rip),%xmm2 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 15,40,21,145,68,1,0 // movaps 0x14491(%rip),%xmm2 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 243,15,16,27 // movss (%rbx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -39381,7 +39831,7 @@ _sk_gradient_sse41:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,228 // jne 174d2 <_sk_gradient_sse41+0x2a>
+ .byte 117,228 // jne 1794f <_sk_gradient_sse41+0x2a>
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
.byte 73,193,233,32 // shr $0x20,%r9
@@ -39511,26 +39961,26 @@ _sk_xy_to_unit_angle_sse41:
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,237 // mulps %xmm13,%xmm13
- .byte 68,15,40,21,79,70,1,0 // movaps 0x1464f(%rip),%xmm10 # 2bd90 <_sk_overlay_sse2_8bit+0x13cf>
+ .byte 68,15,40,21,210,71,1,0 // movaps 0x147d2(%rip),%xmm10 # 2c390 <_sk_overlay_sse2_8bit+0x13db>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,83,70,1,0 // addps 0x14653(%rip),%xmm10 # 2bda0 <_sk_overlay_sse2_8bit+0x13df>
+ .byte 68,15,88,21,214,71,1,0 // addps 0x147d6(%rip),%xmm10 # 2c3a0 <_sk_overlay_sse2_8bit+0x13eb>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,87,70,1,0 // addps 0x14657(%rip),%xmm10 # 2bdb0 <_sk_overlay_sse2_8bit+0x13ef>
+ .byte 68,15,88,21,218,71,1,0 // addps 0x147da(%rip),%xmm10 # 2c3b0 <_sk_overlay_sse2_8bit+0x13fb>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,91,70,1,0 // addps 0x1465b(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0x13ff>
+ .byte 68,15,88,21,222,71,1,0 // addps 0x147de(%rip),%xmm10 # 2c3c0 <_sk_overlay_sse2_8bit+0x140b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 68,15,40,29,90,70,1,0 // movaps 0x1465a(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0x140f>
+ .byte 68,15,40,29,221,71,1,0 // movaps 0x147dd(%rip),%xmm11 # 2c3d0 <_sk_overlay_sse2_8bit+0x141b>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,40,29,51,64,1,0 // movaps 0x14033(%rip),%xmm11 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,29,182,65,1,0 // movaps 0x141b6(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0
- .byte 68,15,40,13,37,64,1,0 // movaps 0x14025(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,168,65,1,0 // movaps 0x141a8(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10
.byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8
@@ -39564,7 +40014,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,206,69,1,0 // mulps 0x145ce(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f>
+ .byte 68,15,89,13,81,71,1,0 // mulps 0x14751(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -39572,7 +40022,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,185,69,1,0 // mulps 0x145b9(%rip),%xmm10 # 2bdf0 <_sk_overlay_sse2_8bit+0x142f>
+ .byte 68,15,89,21,60,71,1,0 // mulps 0x1473c(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -39581,8 +40031,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,113,68,1,0 // xorps 0x14471(%rip),%xmm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
- .byte 68,15,89,5,89,63,1,0 // mulps 0x13f59(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,87,13,244,69,1,0 // xorps 0x145f4(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 68,15,89,5,220,64,1,0 // mulps 0x140dc(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -39603,7 +40053,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,48,69,1,0 // mulps 0x14530(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f>
+ .byte 68,15,89,13,179,70,1,0 // mulps 0x146b3(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -39611,7 +40061,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,27,69,1,0 // mulps 0x1451b(%rip),%xmm10 # 2bdf0 <_sk_overlay_sse2_8bit+0x142f>
+ .byte 68,15,89,21,158,70,1,0 // mulps 0x1469e(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -39620,8 +40070,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,211,67,1,0 // xorps 0x143d3(%rip),%xmm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
- .byte 68,15,89,5,187,62,1,0 // mulps 0x13ebb(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,87,13,86,69,1,0 // xorps 0x14556(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 68,15,89,5,62,64,1,0 // mulps 0x1403e(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -39639,7 +40089,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,163,68,1,0 // mulps 0x144a3(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f>
+ .byte 68,15,89,13,38,70,1,0 // mulps 0x14626(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -39647,7 +40097,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,111,67,1,0 // xorps 0x1436f(%rip),%xmm0 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
+ .byte 15,87,5,242,68,1,0 // xorps 0x144f2(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39690,7 +40140,7 @@ HIDDEN _sk_save_xy_sse41
FUNCTION(_sk_save_xy_sse41)
_sk_save_xy_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,245,61,1,0 // movaps 0x13df5(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,5,120,63,1,0 // movaps 0x13f78(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -39734,8 +40184,8 @@ _sk_bilinear_nx_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,167,67,1,0 // addps 0x143a7(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,111,61,1,0 // movaps 0x13d6f(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,5,42,69,1,0 // addps 0x1452a(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,242,62,1,0 // movaps 0x13ef2(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -39748,7 +40198,7 @@ _sk_bilinear_px_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,62,61,1,0 // addps 0x13d3e(%rip),%xmm0 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,88,5,193,62,1,0 // addps 0x13ec1(%rip),%xmm0 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39760,8 +40210,8 @@ _sk_bilinear_ny_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,96,67,1,0 // addps 0x14360(%rip),%xmm1 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,40,61,1,0 // movaps 0x13d28(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,13,227,68,1,0 // addps 0x144e3(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,171,62,1,0 // movaps 0x13eab(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -39774,7 +40224,7 @@ _sk_bilinear_py_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,246,60,1,0 // addps 0x13cf6(%rip),%xmm1 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,88,13,121,62,1,0 // addps 0x13e79(%rip),%xmm1 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39786,13 +40236,13 @@ _sk_bicubic_n3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,41,67,1,0 // addps 0x14329(%rip),%xmm0 # 2be10 <_sk_overlay_sse2_8bit+0x144f>
- .byte 68,15,40,13,225,60,1,0 // movaps 0x13ce1(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,5,172,68,1,0 // addps 0x144ac(%rip),%xmm0 # 2c410 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,100,62,1,0 // movaps 0x13e64(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,29,67,1,0 // mulps 0x1431d(%rip),%xmm9 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,13,181,62,1,0 // addps 0x13eb5(%rip),%xmm9 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,13,160,68,1,0 // mulps 0x144a0(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,13,56,64,1,0 // addps 0x14038(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -39805,16 +40255,16 @@ _sk_bicubic_n1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,212,66,1,0 // addps 0x142d4(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,156,60,1,0 // movaps 0x13c9c(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,5,87,68,1,0 // addps 0x14457(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,31,62,1,0 // movaps 0x13e1f(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,240,66,1,0 // movaps 0x142f0(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,5,115,68,1,0 // movaps 0x14473(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,244,66,1,0 // addps 0x142f4(%rip),%xmm8 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,5,119,68,1,0 // addps 0x14477(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,104,60,1,0 // addps 0x13c68(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,88,5,235,61,1,0 // addps 0x13deb(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,236,66,1,0 // addps 0x142ec(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,5,111,68,1,0 // addps 0x1446f(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39824,17 +40274,17 @@ HIDDEN _sk_bicubic_p1x_sse41
FUNCTION(_sk_bicubic_p1x_sse41)
_sk_bicubic_p1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,70,60,1,0 // movaps 0x13c46(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,5,201,61,1,0 // movaps 0x13dc9(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,162,66,1,0 // movaps 0x142a2(%rip),%xmm10 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,21,37,68,1,0 // movaps 0x14425(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,166,66,1,0 // addps 0x142a6(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,21,41,68,1,0 // addps 0x14429(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,162,66,1,0 // addps 0x142a2(%rip),%xmm10 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,21,37,68,1,0 // addps 0x14425(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39846,11 +40296,11 @@ _sk_bicubic_p3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,117,66,1,0 // addps 0x14275(%rip),%xmm0 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 15,88,5,248,67,1,0 // addps 0x143f8(%rip),%xmm0 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,69,66,1,0 // mulps 0x14245(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,5,221,61,1,0 // addps 0x13ddd(%rip),%xmm8 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,5,200,67,1,0 // mulps 0x143c8(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,5,96,63,1,0 // addps 0x13f60(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -39863,13 +40313,13 @@ _sk_bicubic_n3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,11,66,1,0 // addps 0x1420b(%rip),%xmm1 # 2be10 <_sk_overlay_sse2_8bit+0x144f>
- .byte 68,15,40,13,195,59,1,0 // movaps 0x13bc3(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,13,142,67,1,0 // addps 0x1438e(%rip),%xmm1 # 2c410 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,70,61,1,0 // movaps 0x13d46(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,255,65,1,0 // mulps 0x141ff(%rip),%xmm9 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,13,151,61,1,0 // addps 0x13d97(%rip),%xmm9 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,13,130,67,1,0 // mulps 0x14382(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,13,26,63,1,0 // addps 0x13f1a(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -39882,16 +40332,16 @@ _sk_bicubic_n1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,181,65,1,0 // addps 0x141b5(%rip),%xmm1 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,125,59,1,0 // movaps 0x13b7d(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,13,56,67,1,0 // addps 0x14338(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,0,61,1,0 // movaps 0x13d00(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,209,65,1,0 // movaps 0x141d1(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,5,84,67,1,0 // movaps 0x14354(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,213,65,1,0 // addps 0x141d5(%rip),%xmm8 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,5,88,67,1,0 // addps 0x14358(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,73,59,1,0 // addps 0x13b49(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,88,5,204,60,1,0 // addps 0x13ccc(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,205,65,1,0 // addps 0x141cd(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,5,80,67,1,0 // addps 0x14350(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39901,17 +40351,17 @@ HIDDEN _sk_bicubic_p1y_sse41
FUNCTION(_sk_bicubic_p1y_sse41)
_sk_bicubic_p1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,39,59,1,0 // movaps 0x13b27(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,5,170,60,1,0 // movaps 0x13caa(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,130,65,1,0 // movaps 0x14182(%rip),%xmm10 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,21,5,67,1,0 // movaps 0x14305(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,134,65,1,0 // addps 0x14186(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,21,9,67,1,0 // addps 0x14309(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,130,65,1,0 // addps 0x14182(%rip),%xmm10 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,21,5,67,1,0 // addps 0x14305(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39923,11 +40373,11 @@ _sk_bicubic_p3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,84,65,1,0 // addps 0x14154(%rip),%xmm1 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 15,88,13,215,66,1,0 // addps 0x142d7(%rip),%xmm1 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,36,65,1,0 // mulps 0x14124(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,5,188,60,1,0 // addps 0x13cbc(%rip),%xmm8 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,5,167,66,1,0 // mulps 0x142a7(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,5,63,62,1,0 // addps 0x13e3f(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -40074,10 +40524,10 @@ _sk_clut_3D_sse41:
.byte 102,68,15,56,64,227 // pmulld %xmm3,%xmm12
.byte 102,65,15,111,212 // movdqa %xmm12,%xmm2
.byte 102,15,254,209 // paddd %xmm1,%xmm2
- .byte 102,15,111,37,117,63,1,0 // movdqa 0x13f75(%rip),%xmm4 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,37,248,64,1,0 // movdqa 0x140f8(%rip),%xmm4 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,56,64,212 // pmulld %xmm4,%xmm2
.byte 102,68,15,111,220 // movdqa %xmm4,%xmm11
- .byte 102,68,15,111,61,210,56,1,0 // movdqa 0x138d2(%rip),%xmm15 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,61,85,58,1,0 // movdqa 0x13a55(%rip),%xmm15 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,111,226 // movdqa %xmm2,%xmm4
.byte 102,65,15,254,231 // paddd %xmm15,%xmm4
.byte 102,73,15,58,22,225,1 // pextrq $0x1,%xmm4,%r9
@@ -40097,7 +40547,7 @@ _sk_clut_3D_sse41:
.byte 102,65,15,58,22,210,1 // pextrd $0x1,%xmm2,%r10d
.byte 102,65,15,58,22,211,2 // pextrd $0x2,%xmm2,%r11d
.byte 102,65,15,58,22,214,3 // pextrd $0x3,%xmm2,%r14d
- .byte 102,68,15,111,13,132,56,1,0 // movdqa 0x13884(%rip),%xmm9 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,13,7,58,1,0 // movdqa 0x13a07(%rip),%xmm9 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,65,15,254,209 // paddd %xmm9,%xmm2
.byte 102,73,15,58,22,215,1 // pextrq $0x1,%xmm2,%r15
.byte 102,72,15,126,211 // movq %xmm2,%rbx
@@ -40111,7 +40561,7 @@ _sk_clut_3D_sse41:
.byte 73,193,239,32 // shr $0x20,%r15
.byte 243,66,15,16,20,184 // movss (%rax,%r15,4),%xmm2
.byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6
- .byte 15,40,45,153,62,1,0 // movaps 0x13e99(%rip),%xmm5 # 2be60 <_sk_overlay_sse2_8bit+0x149f>
+ .byte 15,40,45,28,64,1,0 // movaps 0x1401c(%rip),%xmm5 # 2c460 <_sk_overlay_sse2_8bit+0x14ab>
.byte 68,15,88,197 // addps %xmm5,%xmm8
.byte 68,15,41,68,36,176 // movaps %xmm8,-0x50(%rsp)
.byte 15,40,215 // movaps %xmm7,%xmm2
@@ -40280,7 +40730,7 @@ _sk_clut_3D_sse41:
.byte 102,68,15,254,232 // paddd %xmm0,%xmm13
.byte 102,65,15,111,212 // movdqa %xmm12,%xmm2
.byte 102,65,15,254,213 // paddd %xmm13,%xmm2
- .byte 102,15,111,45,88,59,1,0 // movdqa 0x13b58(%rip),%xmm5 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,45,219,60,1,0 // movdqa 0x13cdb(%rip),%xmm5 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,56,64,213 // pmulld %xmm5,%xmm2
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,254,207 // paddd %xmm15,%xmm1
@@ -40386,7 +40836,7 @@ _sk_clut_3D_sse41:
.byte 102,69,15,58,22,225,1 // pextrd $0x1,%xmm12,%r9d
.byte 102,69,15,58,22,226,2 // pextrd $0x2,%xmm12,%r10d
.byte 102,69,15,58,22,227,3 // pextrd $0x3,%xmm12,%r11d
- .byte 102,15,111,21,188,50,1,0 // movdqa 0x132bc(%rip),%xmm2 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,111,21,63,52,1,0 // movdqa 0x1343f(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,68,15,254,226 // paddd %xmm2,%xmm12
.byte 102,76,15,58,22,225,1 // pextrq $0x1,%xmm12,%rcx
.byte 102,76,15,126,226 // movq %xmm12,%rdx
@@ -40565,8 +41015,8 @@ _sk_clut_4D_sse41:
.byte 102,65,15,111,197 // movdqa %xmm13,%xmm0
.byte 102,68,15,127,108,36,176 // movdqa %xmm13,-0x50(%rsp)
.byte 102,15,254,193 // paddd %xmm1,%xmm0
- .byte 102,15,56,64,5,37,54,1,0 // pmulld 0x13625(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
- .byte 102,68,15,111,29,140,47,1,0 // movdqa 0x12f8c(%rip),%xmm11 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,56,64,5,168,55,1,0 // pmulld 0x137a8(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,68,15,111,29,15,49,1,0 // movdqa 0x1310f(%rip),%xmm11 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,65,15,254,211 // paddd %xmm11,%xmm2
.byte 102,73,15,58,22,209,1 // pextrq $0x1,%xmm2,%r9
@@ -40586,7 +41036,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,194,1 // pextrd $0x1,%xmm0,%r10d
.byte 102,65,15,58,22,195,2 // pextrd $0x2,%xmm0,%r11d
.byte 102,65,15,58,22,198,3 // pextrd $0x3,%xmm0,%r14d
- .byte 102,68,15,111,5,62,47,1,0 // movdqa 0x12f3e(%rip),%xmm8 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,5,193,48,1,0 // movdqa 0x130c1(%rip),%xmm8 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,65,15,254,192 // paddd %xmm8,%xmm0
.byte 102,73,15,58,22,199,1 // pextrq $0x1,%xmm0,%r15
.byte 102,72,15,126,195 // movq %xmm0,%rbx
@@ -40600,7 +41050,7 @@ _sk_clut_4D_sse41:
.byte 73,193,239,32 // shr $0x20,%r15
.byte 243,66,15,16,4,184 // movss (%rax,%r15,4),%xmm0
.byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5
- .byte 15,40,53,83,53,1,0 // movaps 0x13553(%rip),%xmm6 # 2be60 <_sk_overlay_sse2_8bit+0x149f>
+ .byte 15,40,53,214,54,1,0 // movaps 0x136d6(%rip),%xmm6 # 2c460 <_sk_overlay_sse2_8bit+0x14ab>
.byte 68,15,88,214 // addps %xmm6,%xmm10
.byte 68,15,41,84,36,48 // movaps %xmm10,0x30(%rsp)
.byte 15,88,254 // addps %xmm6,%xmm7
@@ -40613,7 +41063,7 @@ _sk_clut_4D_sse41:
.byte 102,15,254,206 // paddd %xmm6,%xmm1
.byte 102,68,15,111,214 // movdqa %xmm6,%xmm10
.byte 102,68,15,127,84,36,160 // movdqa %xmm10,-0x60(%rsp)
- .byte 102,15,56,64,13,36,53,1,0 // pmulld 0x13524(%rip),%xmm1 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,56,64,13,167,54,1,0 // pmulld 0x136a7(%rip),%xmm1 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,65,15,254,227 // paddd %xmm11,%xmm4
.byte 102,73,15,58,22,231,1 // pextrq $0x1,%xmm4,%r15
@@ -40671,11 +41121,11 @@ _sk_clut_4D_sse41:
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
- .byte 102,15,111,5,248,51,1,0 // movdqa 0x133f8(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,5,123,53,1,0 // movdqa 0x1357b(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,56,64,200 // pmulld %xmm0,%xmm1
.byte 102,68,15,111,200 // movdqa %xmm0,%xmm9
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
- .byte 102,68,15,111,5,81,45,1,0 // movdqa 0x12d51(%rip),%xmm8 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,5,212,46,1,0 // movdqa 0x12ed4(%rip),%xmm8 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,65,15,254,192 // paddd %xmm8,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -40777,7 +41227,7 @@ _sk_clut_4D_sse41:
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,68,15,111,108,36,176 // movdqa -0x50(%rsp),%xmm13
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
- .byte 102,15,111,45,205,49,1,0 // movdqa 0x131cd(%rip),%xmm5 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,45,80,51,1,0 // movdqa 0x13350(%rip),%xmm5 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,56,64,205 // pmulld %xmm5,%xmm1
.byte 102,15,126,201 // movd %xmm1,%ecx
.byte 102,15,58,22,202,1 // pextrd $0x1,%xmm1,%edx
@@ -40789,7 +41239,7 @@ _sk_clut_4D_sse41:
.byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
.byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,111,29,248,42,1,0 // movdqa 0x12af8(%rip),%xmm3 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,29,123,44,1,0 // movdqa 0x12c7b(%rip),%xmm3 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx
.byte 102,72,15,126,210 // movq %xmm2,%rdx
@@ -40837,7 +41287,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,194,1 // pextrd $0x1,%xmm0,%r10d
.byte 102,65,15,58,22,198,2 // pextrd $0x2,%xmm0,%r14d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,15,254,5,38,42,1,0 // paddd 0x12a26(%rip),%xmm0 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,5,169,43,1,0 // paddd 0x12ba9(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
.byte 137,211 // mov %edx,%ebx
@@ -40866,10 +41316,10 @@ _sk_clut_4D_sse41:
.byte 102,15,254,100,36,144 // paddd -0x70(%rsp),%xmm4
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,65,15,254,197 // paddd %xmm13,%xmm0
- .byte 102,68,15,111,45,8,48,1,0 // movdqa 0x13008(%rip),%xmm13 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,68,15,111,45,139,49,1,0 // movdqa 0x1318b(%rip),%xmm13 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,65,15,56,64,197 // pmulld %xmm13,%xmm0
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,111,53,102,41,1,0 // movdqa 0x12966(%rip),%xmm6 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,53,233,42,1,0 // movdqa 0x12ae9(%rip),%xmm6 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,206 // paddd %xmm6,%xmm1
.byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
.byte 102,72,15,126,202 // movq %xmm1,%rdx
@@ -40887,7 +41337,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
.byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,15,111,61,38,41,1,0 // movdqa 0x12926(%rip),%xmm7 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,111,61,169,42,1,0 // movdqa 0x12aa9(%rip),%xmm7 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,254,199 // paddd %xmm7,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -40904,7 +41354,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,254,227 // paddd %xmm11,%xmm4
.byte 102,65,15,56,64,229 // pmulld %xmm13,%xmm4
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
- .byte 102,68,15,111,45,176,40,1,0 // movdqa 0x128b0(%rip),%xmm13 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,45,51,42,1,0 // movdqa 0x12a33(%rip),%xmm13 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,65,15,254,245 // paddd %xmm13,%xmm6
.byte 102,72,15,58,22,241,1 // pextrq $0x1,%xmm6,%rcx
.byte 102,72,15,126,242 // movq %xmm6,%rdx
@@ -40983,7 +41433,7 @@ _sk_clut_4D_sse41:
.byte 102,68,15,111,76,36,176 // movdqa -0x50(%rsp),%xmm9
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,254,194 // paddd %xmm2,%xmm0
- .byte 102,15,111,29,192,45,1,0 // movdqa 0x12dc0(%rip),%xmm3 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,29,67,47,1,0 // movdqa 0x12f43(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,56,64,195 // pmulld %xmm3,%xmm0
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,69,15,111,213 // movdqa %xmm13,%xmm10
@@ -41004,7 +41454,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
.byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,15,111,45,225,38,1,0 // movdqa 0x126e1(%rip),%xmm5 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,111,45,100,40,1,0 // movdqa 0x12864(%rip),%xmm5 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,254,197 // paddd %xmm5,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -41092,7 +41542,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,225,1 // pextrd $0x1,%xmm4,%r9d
.byte 102,65,15,58,22,226,2 // pextrd $0x2,%xmm4,%r10d
.byte 102,65,15,58,22,227,3 // pextrd $0x3,%xmm4,%r11d
- .byte 102,68,15,111,13,29,37,1,0 // movdqa 0x1251d(%rip),%xmm9 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,13,160,38,1,0 // movdqa 0x126a0(%rip),%xmm9 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,65,15,254,225 // paddd %xmm9,%xmm4
.byte 102,72,15,58,22,225,1 // pextrq $0x1,%xmm4,%rcx
.byte 102,72,15,126,226 // movq %xmm4,%rdx
@@ -41174,7 +41624,7 @@ _sk_clut_4D_sse41:
.byte 102,15,254,76,36,176 // paddd -0x50(%rsp),%xmm1
.byte 102,65,15,56,64,205 // pmulld %xmm13,%xmm1
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
- .byte 102,68,15,111,37,86,35,1,0 // movdqa 0x12356(%rip),%xmm12 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,37,217,36,1,0 // movdqa 0x124d9(%rip),%xmm12 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,65,15,254,196 // paddd %xmm12,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -41192,7 +41642,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,201,1 // pextrd $0x1,%xmm1,%r9d
.byte 102,65,15,58,22,202,2 // pextrd $0x2,%xmm1,%r10d
.byte 102,65,15,58,22,203,3 // pextrd $0x3,%xmm1,%r11d
- .byte 102,15,111,29,21,35,1,0 // movdqa 0x12315(%rip),%xmm3 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,111,29,152,36,1,0 // movdqa 0x12498(%rip),%xmm3 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
.byte 102,72,15,126,202 // movq %xmm1,%rdx
@@ -41261,9 +41711,9 @@ _sk_clut_4D_sse41:
.byte 102,68,15,254,116,36,144 // paddd -0x70(%rsp),%xmm14
.byte 102,15,111,68,36,176 // movdqa -0x50(%rsp),%xmm0
.byte 102,65,15,254,198 // paddd %xmm14,%xmm0
- .byte 102,15,56,64,5,22,40,1,0 // pmulld 0x12816(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,56,64,5,153,41,1,0 // pmulld 0x12999(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,5,122,33,1,0 // paddd 0x1217a(%rip),%xmm0 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,254,5,253,34,1,0 // paddd 0x122fd(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
.byte 137,213 // mov %edx,%ebp
@@ -41296,8 +41746,8 @@ _sk_clut_4D_sse41:
.byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0
.byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5
.byte 102,68,15,254,116,36,160 // paddd -0x60(%rsp),%xmm14
- .byte 102,68,15,56,64,53,95,39,1,0 // pmulld 0x1275f(%rip),%xmm14 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
- .byte 102,15,111,5,199,32,1,0 // movdqa 0x120c7(%rip),%xmm0 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,56,64,53,226,40,1,0 // pmulld 0x128e2(%rip),%xmm14 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,5,74,34,1,0 // movdqa 0x1224a(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,65,15,254,198 // paddd %xmm14,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -41378,7 +41828,7 @@ _sk_clut_4D_sse41:
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,215 // addps %xmm7,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,72,31,1,0 // movaps 0x11f48(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,203,32,1,0 // movaps 0x120cb(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 76,137,194 // mov %r8,%rdx
.byte 72,139,76,36,240 // mov -0x10(%rsp),%rcx
.byte 76,139,68,36,248 // mov -0x8(%rsp),%r8
@@ -41415,7 +41865,7 @@ _sk_start_pipeline_sse2:
.byte 72,137,194 // mov %rax,%rdx
.byte 72,137,77,176 // mov %rcx,-0x50(%rbp)
.byte 73,57,206 // cmp %rcx,%r14
- .byte 115,117 // jae 19960 <_sk_start_pipeline_sse2+0xa1>
+ .byte 115,117 // jae 19ddd <_sk_start_pipeline_sse2+0xa1>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,4 // lea 0x4(%rax),%rax
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
@@ -41425,7 +41875,7 @@ _sk_start_pipeline_sse2:
.byte 73,137,244 // mov %rsi,%r12
.byte 72,57,93,184 // cmp %rbx,-0x48(%rbp)
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
- .byte 119,45 // ja 1993c <_sk_start_pipeline_sse2+0x7d>
+ .byte 119,45 // ja 19db9 <_sk_start_pipeline_sse2+0x7d>
.byte 76,139,125,208 // mov -0x30(%rbp),%r15
.byte 69,49,192 // xor %r8d,%r8d
.byte 76,137,207 // mov %r9,%rdi
@@ -41439,10 +41889,10 @@ _sk_start_pipeline_sse2:
.byte 73,131,199,8 // add $0x8,%r15
.byte 73,57,223 // cmp %rbx,%r15
.byte 73,137,215 // mov %rdx,%r15
- .byte 118,215 // jbe 19913 <_sk_start_pipeline_sse2+0x54>
+ .byte 118,215 // jbe 19d90 <_sk_start_pipeline_sse2+0x54>
.byte 73,137,216 // mov %rbx,%r8
.byte 73,41,208 // sub %rdx,%r8
- .byte 116,19 // je 19957 <_sk_start_pipeline_sse2+0x98>
+ .byte 116,19 // je 19dd4 <_sk_start_pipeline_sse2+0x98>
.byte 76,137,207 // mov %r9,%rdi
.byte 76,137,230 // mov %r12,%rsi
.byte 76,137,241 // mov %r14,%rcx
@@ -41451,7 +41901,7 @@ _sk_start_pipeline_sse2:
.byte 76,139,77,192 // mov -0x40(%rbp),%r9
.byte 73,255,198 // inc %r14
.byte 76,59,117,176 // cmp -0x50(%rbp),%r14
- .byte 117,165 // jne 19905 <_sk_start_pipeline_sse2+0x46>
+ .byte 117,165 // jne 19d82 <_sk_start_pipeline_sse2+0x46>
.byte 72,131,196,40 // add $0x28,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -41474,7 +41924,7 @@ _sk_seed_shader_sse2:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,61,30,1,0 // movaps 0x11e3d(%rip),%xmm2 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,40,21,192,31,1,0 // movaps 0x11fc0(%rip),%xmm2 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,7 // movups (%rdi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -41483,7 +41933,7 @@ _sk_seed_shader_sse2:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,44,30,1,0 // movaps 0x11e2c(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,175,31,1,0 // movaps 0x11faf(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -41503,14 +41953,14 @@ _sk_dither_sse2:
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,250,29,1,0 // movdqa 0x11dfa(%rip),%xmm10 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,21,125,31,1,0 // movdqa 0x11f7d(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,230,29,1,0 // movdqa 0x11de6(%rip),%xmm12 # 2b7f0 <_sk_overlay_sse2_8bit+0xe2f>
- .byte 102,68,15,111,45,237,29,1,0 // movdqa 0x11ded(%rip),%xmm13 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,37,105,31,1,0 // movdqa 0x11f69(%rip),%xmm12 # 2bdf0 <_sk_overlay_sse2_8bit+0xe3b>
+ .byte 102,68,15,111,45,112,31,1,0 // movdqa 0x11f70(%rip),%xmm13 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -41526,8 +41976,8 @@ _sk_dither_sse2:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,168,29,1,0 // mulps 0x11da8(%rip),%xmm8 # 2b810 <_sk_overlay_sse2_8bit+0xe4f>
- .byte 68,15,88,5,176,29,1,0 // addps 0x11db0(%rip),%xmm8 # 2b820 <_sk_overlay_sse2_8bit+0xe5f>
+ .byte 68,15,89,5,43,31,1,0 // mulps 0x11f2b(%rip),%xmm8 # 2be10 <_sk_overlay_sse2_8bit+0xe5b>
+ .byte 68,15,88,5,51,31,1,0 // addps 0x11f33(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0xe6b>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -41569,7 +42019,7 @@ HIDDEN _sk_black_color_sse2
FUNCTION(_sk_black_color_sse2)
_sk_black_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,230,28,1,0 // movaps 0x11ce6(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,105,30,1,0 // movaps 0x11e69(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -41580,7 +42030,7 @@ HIDDEN _sk_white_color_sse2
FUNCTION(_sk_white_color_sse2)
_sk_white_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,210,28,1,0 // movaps 0x11cd2(%rip),%xmm0 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,5,85,30,1,0 // movaps 0x11e55(%rip),%xmm0 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -41626,7 +42076,7 @@ HIDDEN _sk_srcatop_sse2
FUNCTION(_sk_srcatop_sse2)
_sk_srcatop_sse2:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,130,28,1,0 // movaps 0x11c82(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,5,30,1,0 // movaps 0x11e05(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -41651,7 +42101,7 @@ FUNCTION(_sk_dstatop_sse2)
_sk_dstatop_sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,53,28,1,0 // movaps 0x11c35(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,184,29,1,0 // movaps 0x11db8(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -41698,7 +42148,7 @@ HIDDEN _sk_srcout_sse2
.globl _sk_srcout_sse2
FUNCTION(_sk_srcout_sse2)
_sk_srcout_sse2:
- .byte 68,15,40,5,201,27,1,0 // movaps 0x11bc9(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,76,29,1,0 // movaps 0x11d4c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -41711,7 +42161,7 @@ HIDDEN _sk_dstout_sse2
.globl _sk_dstout_sse2
FUNCTION(_sk_dstout_sse2)
_sk_dstout_sse2:
- .byte 68,15,40,5,169,27,1,0 // movaps 0x11ba9(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,44,29,1,0 // movaps 0x11d2c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -41728,7 +42178,7 @@ HIDDEN _sk_srcover_sse2
.globl _sk_srcover_sse2
FUNCTION(_sk_srcover_sse2)
_sk_srcover_sse2:
- .byte 68,15,40,5,124,27,1,0 // movaps 0x11b7c(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,255,28,1,0 // movaps 0x11cff(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -41748,7 +42198,7 @@ HIDDEN _sk_dstover_sse2
.globl _sk_dstover_sse2
FUNCTION(_sk_dstover_sse2)
_sk_dstover_sse2:
- .byte 68,15,40,5,64,27,1,0 // movaps 0x11b40(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,195,28,1,0 // movaps 0x11cc3(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -41776,7 +42226,7 @@ HIDDEN _sk_multiply_sse2
.globl _sk_multiply_sse2
FUNCTION(_sk_multiply_sse2)
_sk_multiply_sse2:
- .byte 68,15,40,5,4,27,1,0 // movaps 0x11b04(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,135,28,1,0 // movaps 0x11c87(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -41814,9 +42264,14 @@ HIDDEN _sk_plus__sse2
FUNCTION(_sk_plus__sse2)
_sk_plus__sse2:
.byte 15,88,196 // addps %xmm4,%xmm0
+ .byte 68,15,40,5,8,28,1,0 // movaps 0x11c08(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 15,88,205 // addps %xmm5,%xmm1
+ .byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 15,88,214 // addps %xmm6,%xmm2
+ .byte 65,15,93,208 // minps %xmm8,%xmm2
.byte 15,88,223 // addps %xmm7,%xmm3
+ .byte 65,15,93,216 // minps %xmm8,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41851,7 +42306,7 @@ HIDDEN _sk_xor__sse2
FUNCTION(_sk_xor__sse2)
_sk_xor__sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,41,26,1,0 // movaps 0x11a29(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,148,27,1,0 // movaps 0x11b94(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -41899,7 +42354,7 @@ _sk_darken_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,132,25,1,0 // movaps 0x11984(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,239,26,1,0 // movaps 0x11aef(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -41933,7 +42388,7 @@ _sk_lighten_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,25,25,1,0 // movaps 0x11919(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,132,26,1,0 // movaps 0x11a84(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -41970,7 +42425,7 @@ _sk_difference_sse2:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,163,24,1,0 // movaps 0x118a3(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,14,26,1,0 // movaps 0x11a0e(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -41998,7 +42453,7 @@ _sk_exclusion_sse2:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,83,24,1,0 // movaps 0x11853(%rip),%xmm2 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,21,190,25,1,0 // movaps 0x119be(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -42011,7 +42466,7 @@ HIDDEN _sk_colorburn_sse2
FUNCTION(_sk_colorburn_sse2)
_sk_colorburn_sse2:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,13,54,24,1,0 // movaps 0x11836(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,161,25,1,0 // movaps 0x119a1(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -42106,7 +42561,7 @@ HIDDEN _sk_colordodge_sse2
FUNCTION(_sk_colordodge_sse2)
_sk_colordodge_sse2:
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,222,22,1,0 // movaps 0x116de(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,73,24,1,0 // movaps 0x11849(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -42198,7 +42653,7 @@ _sk_hardlight_sse2:
.byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp)
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 68,15,40,29,135,21,1,0 // movaps 0x11587(%rip),%xmm11 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,29,242,22,1,0 // movaps 0x116f2(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,194 // movaps %xmm10,%xmm8
@@ -42286,7 +42741,7 @@ FUNCTION(_sk_overlay_sse2)
_sk_overlay_sse2:
.byte 68,15,40,193 // movaps %xmm1,%xmm8
.byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 68,15,40,13,69,20,1,0 // movaps 0x11445(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,176,21,1,0 // movaps 0x115b0(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -42377,7 +42832,7 @@ _sk_softlight_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 68,15,94,215 // divps %xmm7,%xmm10
.byte 69,15,84,212 // andps %xmm12,%xmm10
- .byte 68,15,40,13,242,18,1,0 // movaps 0x112f2(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,93,20,1,0 // movaps 0x1145d(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 69,15,92,250 // subps %xmm10,%xmm15
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -42390,10 +42845,10 @@ _sk_softlight_sse2:
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,53,28,19,1,0 // movaps 0x1131c(%rip),%xmm14 # 2b830 <_sk_overlay_sse2_8bit+0xe6f>
+ .byte 68,15,40,53,135,20,1,0 // movaps 0x11487(%rip),%xmm14 # 2be30 <_sk_overlay_sse2_8bit+0xe7b>
.byte 69,15,88,222 // addps %xmm14,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
- .byte 68,15,40,21,28,19,1,0 // movaps 0x1131c(%rip),%xmm10 # 2b840 <_sk_overlay_sse2_8bit+0xe7f>
+ .byte 68,15,40,21,135,20,1,0 // movaps 0x11487(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0xe8b>
.byte 69,15,89,234 // mulps %xmm10,%xmm13
.byte 69,15,88,235 // addps %xmm11,%xmm13
.byte 15,88,228 // addps %xmm4,%xmm4
@@ -42538,7 +42993,7 @@ _sk_hue_sse2:
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 68,15,89,211 // mulps %xmm3,%xmm10
- .byte 68,15,40,5,175,16,1,0 // movaps 0x110af(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,26,18,1,0 // movaps 0x1121a(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 15,40,207 // movaps %xmm7,%xmm1
.byte 68,15,92,217 // subps %xmm1,%xmm11
@@ -42586,12 +43041,12 @@ _sk_hue_sse2:
.byte 69,15,84,206 // andps %xmm14,%xmm9
.byte 69,15,84,214 // andps %xmm14,%xmm10
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,61,108,16,1,0 // movaps 0x1106c(%rip),%xmm15 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,61,215,17,1,0 // movaps 0x111d7(%rip),%xmm15 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 65,15,89,231 // mulps %xmm15,%xmm4
- .byte 15,40,5,113,16,1,0 // movaps 0x11071(%rip),%xmm0 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 15,40,5,220,17,1,0 // movaps 0x111dc(%rip),%xmm0 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
- .byte 68,15,40,53,115,16,1,0 // movaps 0x11073(%rip),%xmm14 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
+ .byte 68,15,40,53,222,17,1,0 // movaps 0x111de(%rip),%xmm14 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
.byte 68,15,40,239 // movaps %xmm7,%xmm13
.byte 69,15,89,238 // mulps %xmm14,%xmm13
.byte 68,15,88,238 // addps %xmm6,%xmm13
@@ -42769,14 +43224,14 @@ _sk_saturation_sse2:
.byte 68,15,84,211 // andps %xmm3,%xmm10
.byte 68,15,84,203 // andps %xmm3,%xmm9
.byte 15,84,195 // andps %xmm3,%xmm0
- .byte 68,15,40,5,197,13,1,0 // movaps 0x10dc5(%rip),%xmm8 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,5,48,15,1,0 // movaps 0x10f30(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 15,40,214 // movaps %xmm6,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
- .byte 15,40,13,199,13,1,0 // movaps 0x10dc7(%rip),%xmm1 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 15,40,13,50,15,1,0 // movaps 0x10f32(%rip),%xmm1 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,217 // mulps %xmm1,%xmm3
.byte 15,88,218 // addps %xmm2,%xmm3
- .byte 68,15,40,37,198,13,1,0 // movaps 0x10dc6(%rip),%xmm12 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
+ .byte 68,15,40,37,49,15,1,0 // movaps 0x10f31(%rip),%xmm12 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
.byte 65,15,40,210 // movaps %xmm10,%xmm2
@@ -42821,7 +43276,7 @@ _sk_saturation_sse2:
.byte 15,40,223 // movaps %xmm7,%xmm3
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,221 // mulps %xmm5,%xmm3
- .byte 68,15,40,5,123,12,1,0 // movaps 0x10c7b(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,230,13,1,0 // movaps 0x10de6(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 15,88,253 // addps %xmm5,%xmm7
@@ -42922,14 +43377,14 @@ _sk_color_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
.byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 68,15,40,45,137,11,1,0 // movaps 0x10b89(%rip),%xmm13 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,45,244,12,1,0 // movaps 0x10cf4(%rip),%xmm13 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 68,15,40,198 // movaps %xmm6,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,40,53,137,11,1,0 // movaps 0x10b89(%rip),%xmm14 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 68,15,40,53,244,12,1,0 // movaps 0x10cf4(%rip),%xmm14 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,29,133,11,1,0 // movaps 0x10b85(%rip),%xmm11 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
+ .byte 68,15,40,29,240,12,1,0 // movaps 0x10cf0(%rip),%xmm11 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
.byte 69,15,89,227 // mulps %xmm11,%xmm12
.byte 68,15,88,224 // addps %xmm0,%xmm12
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -42937,7 +43392,7 @@ _sk_color_sse2:
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 68,15,40,5,193,10,1,0 // movaps 0x10ac1(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,44,12,1,0 // movaps 0x10c2c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
.byte 15,89,252 // mulps %xmm4,%xmm7
@@ -43073,15 +43528,15 @@ _sk_luminosity_sse2:
.byte 68,15,40,205 // movaps %xmm5,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
.byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 68,15,40,37,72,9,1,0 // movaps 0x10948(%rip),%xmm12 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,37,179,10,1,0 // movaps 0x10ab3(%rip),%xmm12 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 68,15,40,199 // movaps %xmm7,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,72,9,1,0 // movaps 0x10948(%rip),%xmm13 # 2b860 <_sk_overlay_sse2_8bit+0xe9f>
+ .byte 68,15,40,45,179,10,1,0 // movaps 0x10ab3(%rip),%xmm13 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
.byte 68,15,40,241 // movaps %xmm1,%xmm14
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 69,15,88,240 // addps %xmm8,%xmm14
- .byte 68,15,40,29,68,9,1,0 // movaps 0x10944(%rip),%xmm11 # 2b870 <_sk_overlay_sse2_8bit+0xeaf>
- .byte 68,15,40,5,156,8,1,0 // movaps 0x1089c(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,29,175,10,1,0 // movaps 0x10aaf(%rip),%xmm11 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
+ .byte 68,15,40,5,7,10,1,0 // movaps 0x10a07(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 68,15,92,248 // subps %xmm0,%xmm15
@@ -43222,10 +43677,10 @@ _sk_srcover_rgba_8888_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,228,0,0,0 // jne 1b21f <_sk_srcover_rgba_8888_sse2+0x104>
+ .byte 15,133,228,0,0,0 // jne 1b6b4 <_sk_srcover_rgba_8888_sse2+0x104>
.byte 243,69,15,111,4,129 // movdqu (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,53,52,7,1,0 // movdqa 0x10734(%rip),%xmm6 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,53,159,8,1,0 // movdqa 0x1089f(%rip),%xmm6 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,224 // movdqa %xmm8,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
@@ -43239,9 +43694,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 15,91,247 // cvtdq2ps %xmm7,%xmm6
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,248 // cvtdq2ps %xmm8,%xmm7
- .byte 68,15,40,5,68,6,1,0 // movaps 0x10644(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,175,7,1,0 // movaps 0x107af(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,24,7,1,0 // movaps 0x10718(%rip),%xmm12 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,37,131,8,1,0 // movaps 0x10883(%rip),%xmm12 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -43267,7 +43722,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,114,240,24 // pslld $0x18,%xmm0
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 102,15,235,193 // por %xmm1,%xmm0
- .byte 117,84 // jne 1b259 <_sk_srcover_rgba_8888_sse2+0x13e>
+ .byte 117,84 // jne 1b6ee <_sk_srcover_rgba_8888_sse2+0x13e>
.byte 243,65,15,127,4,129 // movdqu %xmm0,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -43278,32 +43733,32 @@ _sk_srcover_rgba_8888_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,90 // je 1b286 <_sk_srcover_rgba_8888_sse2+0x16b>
+ .byte 116,90 // je 1b71b <_sk_srcover_rgba_8888_sse2+0x16b>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 1b24e <_sk_srcover_rgba_8888_sse2+0x133>
+ .byte 116,23 // je 1b6e3 <_sk_srcover_rgba_8888_sse2+0x133>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,0,255,255,255 // jne 1b141 <_sk_srcover_rgba_8888_sse2+0x26>
+ .byte 15,133,0,255,255,255 // jne 1b5d6 <_sk_srcover_rgba_8888_sse2+0x26>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
.byte 102,69,15,18,4,129 // movlpd (%r9,%rax,4),%xmm8
- .byte 233,232,254,255,255 // jmpq 1b141 <_sk_srcover_rgba_8888_sse2+0x26>
+ .byte 233,232,254,255,255 // jmpq 1b5d6 <_sk_srcover_rgba_8888_sse2+0x26>
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,43 // je 1b291 <_sk_srcover_rgba_8888_sse2+0x176>
+ .byte 116,43 // je 1b726 <_sk_srcover_rgba_8888_sse2+0x176>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 1b27e <_sk_srcover_rgba_8888_sse2+0x163>
+ .byte 116,18 // je 1b713 <_sk_srcover_rgba_8888_sse2+0x163>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,153 // jne 1b20b <_sk_srcover_rgba_8888_sse2+0xf0>
+ .byte 117,153 // jne 1b6a0 <_sk_srcover_rgba_8888_sse2+0xf0>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,65,15,126,76,129,8 // movd %xmm1,0x8(%r9,%rax,4)
.byte 102,65,15,214,4,129 // movq %xmm0,(%r9,%rax,4)
- .byte 235,133 // jmp 1b20b <_sk_srcover_rgba_8888_sse2+0xf0>
+ .byte 235,133 // jmp 1b6a0 <_sk_srcover_rgba_8888_sse2+0xf0>
.byte 102,69,15,110,4,129 // movd (%r9,%rax,4),%xmm8
- .byte 233,176,254,255,255 // jmpq 1b141 <_sk_srcover_rgba_8888_sse2+0x26>
+ .byte 233,176,254,255,255 // jmpq 1b5d6 <_sk_srcover_rgba_8888_sse2+0x26>
.byte 102,65,15,126,4,129 // movd %xmm0,(%r9,%rax,4)
- .byte 233,111,255,255,255 // jmpq 1b20b <_sk_srcover_rgba_8888_sse2+0xf0>
+ .byte 233,111,255,255,255 // jmpq 1b6a0 <_sk_srcover_rgba_8888_sse2+0xf0>
HIDDEN _sk_clamp_0_sse2
.globl _sk_clamp_0_sse2
@@ -43321,7 +43776,7 @@ HIDDEN _sk_clamp_1_sse2
.globl _sk_clamp_1_sse2
FUNCTION(_sk_clamp_1_sse2)
_sk_clamp_1_sse2:
- .byte 68,15,40,5,20,5,1,0 // movaps 0x10514(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,127,6,1,0 // movaps 0x1067f(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -43333,7 +43788,7 @@ HIDDEN _sk_clamp_a_sse2
.globl _sk_clamp_a_sse2
FUNCTION(_sk_clamp_a_sse2)
_sk_clamp_a_sse2:
- .byte 15,93,29,249,4,1,0 // minps 0x104f9(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,93,29,100,6,1,0 // minps 0x10664(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -43344,7 +43799,7 @@ HIDDEN _sk_clamp_a_dst_sse2
.globl _sk_clamp_a_dst_sse2
FUNCTION(_sk_clamp_a_dst_sse2)
_sk_clamp_a_dst_sse2:
- .byte 15,93,61,229,4,1,0 // minps 0x104e5(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,93,61,80,6,1,0 // minps 0x10650(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -43379,7 +43834,7 @@ HIDDEN _sk_invert_sse2
.globl _sk_invert_sse2
FUNCTION(_sk_invert_sse2)
_sk_invert_sse2:
- .byte 68,15,40,5,161,4,1,0 // movaps 0x104a1(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,5,12,6,1,0 // movaps 0x1060c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -43441,7 +43896,7 @@ HIDDEN _sk_unpremul_sse2
FUNCTION(_sk_unpremul_sse2)
_sk_unpremul_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,43,4,1,0 // movaps 0x1042b(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,150,5,1,0 // movaps 0x10596(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -43455,20 +43910,20 @@ HIDDEN _sk_from_srgb_sse2
.globl _sk_from_srgb_sse2
FUNCTION(_sk_from_srgb_sse2)
_sk_from_srgb_sse2:
- .byte 68,15,40,5,246,4,1,0 // movaps 0x104f6(%rip),%xmm8 # 2b8c0 <_sk_overlay_sse2_8bit+0xeff>
+ .byte 68,15,40,5,97,6,1,0 // movaps 0x10661(%rip),%xmm8 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 68,15,40,232 // movaps %xmm0,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,216 // movaps %xmm0,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,110,4,1,0 // movaps 0x1046e(%rip),%xmm9 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,13,217,5,1,0 // movaps 0x105d9(%rip),%xmm9 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,222,4,1,0 // movaps 0x104de(%rip),%xmm10 # 2b8d0 <_sk_overlay_sse2_8bit+0xf0f>
+ .byte 68,15,40,21,73,6,1,0 // movaps 0x10649(%rip),%xmm10 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,222,4,1,0 // movaps 0x104de(%rip),%xmm11 # 2b8e0 <_sk_overlay_sse2_8bit+0xf1f>
+ .byte 68,15,40,29,73,6,1,0 // movaps 0x10649(%rip),%xmm11 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,226,4,1,0 // movaps 0x104e2(%rip),%xmm12 # 2b8f0 <_sk_overlay_sse2_8bit+0xf2f>
+ .byte 68,15,40,37,77,6,1,0 // movaps 0x1064d(%rip),%xmm12 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b>
.byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0
.byte 68,15,84,232 // andps %xmm0,%xmm13
.byte 65,15,85,198 // andnps %xmm14,%xmm0
@@ -43504,20 +43959,20 @@ HIDDEN _sk_from_srgb_dst_sse2
.globl _sk_from_srgb_dst_sse2
FUNCTION(_sk_from_srgb_dst_sse2)
_sk_from_srgb_dst_sse2:
- .byte 68,15,40,5,51,4,1,0 // movaps 0x10433(%rip),%xmm8 # 2b8c0 <_sk_overlay_sse2_8bit+0xeff>
+ .byte 68,15,40,5,158,5,1,0 // movaps 0x1059e(%rip),%xmm8 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 68,15,40,236 // movaps %xmm4,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,220 // movaps %xmm4,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,171,3,1,0 // movaps 0x103ab(%rip),%xmm9 # 2b850 <_sk_overlay_sse2_8bit+0xe8f>
+ .byte 68,15,40,13,22,5,1,0 // movaps 0x10516(%rip),%xmm9 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
.byte 68,15,40,244 // movaps %xmm4,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,27,4,1,0 // movaps 0x1041b(%rip),%xmm10 # 2b8d0 <_sk_overlay_sse2_8bit+0xf0f>
+ .byte 68,15,40,21,134,5,1,0 // movaps 0x10586(%rip),%xmm10 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,27,4,1,0 // movaps 0x1041b(%rip),%xmm11 # 2b8e0 <_sk_overlay_sse2_8bit+0xf1f>
+ .byte 68,15,40,29,134,5,1,0 // movaps 0x10586(%rip),%xmm11 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,31,4,1,0 // movaps 0x1041f(%rip),%xmm12 # 2b8f0 <_sk_overlay_sse2_8bit+0xf2f>
+ .byte 68,15,40,37,138,5,1,0 // movaps 0x1058a(%rip),%xmm12 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b>
.byte 65,15,194,228,1 // cmpltps %xmm12,%xmm4
.byte 68,15,84,236 // andps %xmm4,%xmm13
.byte 65,15,85,230 // andnps %xmm14,%xmm4
@@ -43554,22 +44009,22 @@ HIDDEN _sk_to_srgb_sse2
FUNCTION(_sk_to_srgb_sse2)
_sk_to_srgb_sse2:
.byte 68,15,82,232 // rsqrtps %xmm0,%xmm13
- .byte 68,15,40,5,172,3,1,0 // movaps 0x103ac(%rip),%xmm8 # 2b900 <_sk_overlay_sse2_8bit+0xf3f>
+ .byte 68,15,40,5,23,5,1,0 // movaps 0x10517(%rip),%xmm8 # 2bf00 <_sk_overlay_sse2_8bit+0xf4b>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,240 // mulps %xmm8,%xmm14
- .byte 68,15,40,13,172,3,1,0 // movaps 0x103ac(%rip),%xmm9 # 2b910 <_sk_overlay_sse2_8bit+0xf4f>
+ .byte 68,15,40,13,23,5,1,0 // movaps 0x10517(%rip),%xmm9 # 2bf10 <_sk_overlay_sse2_8bit+0xf5b>
.byte 69,15,40,253 // movaps %xmm13,%xmm15
.byte 69,15,89,249 // mulps %xmm9,%xmm15
- .byte 68,15,40,21,172,3,1,0 // movaps 0x103ac(%rip),%xmm10 # 2b920 <_sk_overlay_sse2_8bit+0xf5f>
+ .byte 68,15,40,21,23,5,1,0 // movaps 0x10517(%rip),%xmm10 # 2bf20 <_sk_overlay_sse2_8bit+0xf6b>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,253 // mulps %xmm13,%xmm15
- .byte 68,15,40,29,172,3,1,0 // movaps 0x103ac(%rip),%xmm11 # 2b930 <_sk_overlay_sse2_8bit+0xf6f>
+ .byte 68,15,40,29,23,5,1,0 // movaps 0x10517(%rip),%xmm11 # 2bf30 <_sk_overlay_sse2_8bit+0xf7b>
.byte 69,15,88,251 // addps %xmm11,%xmm15
- .byte 68,15,40,37,176,3,1,0 // movaps 0x103b0(%rip),%xmm12 # 2b940 <_sk_overlay_sse2_8bit+0xf7f>
+ .byte 68,15,40,37,27,5,1,0 // movaps 0x1051b(%rip),%xmm12 # 2bf40 <_sk_overlay_sse2_8bit+0xf8b>
.byte 69,15,88,236 // addps %xmm12,%xmm13
.byte 69,15,83,237 // rcpps %xmm13,%xmm13
.byte 69,15,89,239 // mulps %xmm15,%xmm13
- .byte 68,15,40,61,172,3,1,0 // movaps 0x103ac(%rip),%xmm15 # 2b950 <_sk_overlay_sse2_8bit+0xf8f>
+ .byte 68,15,40,61,23,5,1,0 // movaps 0x10517(%rip),%xmm15 # 2bf50 <_sk_overlay_sse2_8bit+0xf9b>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,197 // andnps %xmm13,%xmm0
@@ -43611,15 +44066,17 @@ FUNCTION(_sk_rgb_to_hsl_sse2)
_sk_rgb_to_hsl_sse2:
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,40,192 // movaps %xmm0,%xmm8
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 15,95,194 // maxps %xmm2,%xmm0
.byte 69,15,40,208 // movaps %xmm8,%xmm10
- .byte 69,15,95,209 // maxps %xmm9,%xmm10
- .byte 68,15,95,210 // maxps %xmm2,%xmm10
+ .byte 68,15,95,208 // maxps %xmm0,%xmm10
+ .byte 65,15,40,193 // movaps %xmm9,%xmm0
+ .byte 15,93,194 // minps %xmm2,%xmm0
.byte 69,15,40,216 // movaps %xmm8,%xmm11
- .byte 69,15,93,217 // minps %xmm9,%xmm11
- .byte 68,15,93,218 // minps %xmm2,%xmm11
+ .byte 68,15,93,216 // minps %xmm0,%xmm11
.byte 65,15,40,202 // movaps %xmm10,%xmm1
.byte 65,15,92,203 // subps %xmm11,%xmm1
- .byte 68,15,40,45,117,1,1,0 // movaps 0x10175(%rip),%xmm13 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,45,218,2,1,0 // movaps 0x102da(%rip),%xmm13 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,94,233 // divps %xmm1,%xmm13
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0
@@ -43628,30 +44085,30 @@ _sk_rgb_to_hsl_sse2:
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,40,241 // movaps %xmm9,%xmm14
.byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14
- .byte 68,15,84,53,219,2,1,0 // andps 0x102db(%rip),%xmm14 # 2b960 <_sk_overlay_sse2_8bit+0xf9f>
+ .byte 68,15,84,53,64,4,1,0 // andps 0x10440(%rip),%xmm14 # 2bf60 <_sk_overlay_sse2_8bit+0xfab>
.byte 69,15,88,244 // addps %xmm12,%xmm14
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 68,15,40,37,206,2,1,0 // movaps 0x102ce(%rip),%xmm12 # 2b970 <_sk_overlay_sse2_8bit+0xfaf>
+ .byte 68,15,40,37,51,4,1,0 // movaps 0x10433(%rip),%xmm12 # 2bf70 <_sk_overlay_sse2_8bit+0xfbb>
.byte 65,15,88,212 // addps %xmm12,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,88,5,202,2,1,0 // addps 0x102ca(%rip),%xmm8 # 2b980 <_sk_overlay_sse2_8bit+0xfbf>
+ .byte 68,15,88,5,47,4,1,0 // addps 0x1042f(%rip),%xmm8 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb>
.byte 65,15,84,215 // andps %xmm15,%xmm2
.byte 69,15,85,248 // andnps %xmm8,%xmm15
.byte 68,15,86,250 // orps %xmm2,%xmm15
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,199 // andnps %xmm15,%xmm0
.byte 65,15,86,198 // orps %xmm14,%xmm0
- .byte 15,89,5,187,2,1,0 // mulps 0x102bb(%rip),%xmm0 # 2b990 <_sk_overlay_sse2_8bit+0xfcf>
+ .byte 15,89,5,32,4,1,0 // mulps 0x10420(%rip),%xmm0 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb>
.byte 69,15,40,194 // movaps %xmm10,%xmm8
.byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8
.byte 65,15,84,192 // andps %xmm8,%xmm0
.byte 69,15,92,226 // subps %xmm10,%xmm12
.byte 69,15,88,211 // addps %xmm11,%xmm10
- .byte 68,15,40,13,206,0,1,0 // movaps 0x100ce(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,13,51,2,1,0 // movaps 0x10233(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,40,210 // movaps %xmm10,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9
@@ -43675,7 +44132,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,218 // movaps %xmm2,%xmm11
.byte 15,40,240 // movaps %xmm0,%xmm6
- .byte 68,15,40,13,125,0,1,0 // movaps 0x1007d(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,13,226,1,1,0 // movaps 0x101e2(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
@@ -43692,28 +44149,28 @@ _sk_hsl_to_rgb_sse2:
.byte 69,15,88,211 // addps %xmm11,%xmm10
.byte 69,15,88,219 // addps %xmm11,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 15,40,5,22,2,1,0 // movaps 0x10216(%rip),%xmm0 # 2b9a0 <_sk_overlay_sse2_8bit+0xfdf>
+ .byte 15,40,5,123,3,1,0 // movaps 0x1037b(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xfeb>
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,216 // movaps %xmm0,%xmm3
.byte 15,194,217,1 // cmpltps %xmm1,%xmm3
- .byte 15,84,29,46,0,1,0 // andps 0x1002e(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,84,29,147,1,1,0 // andps 0x10193(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
- .byte 68,15,40,45,0,2,1,0 // movaps 0x10200(%rip),%xmm13 # 2b9b0 <_sk_overlay_sse2_8bit+0xfef>
+ .byte 68,15,40,45,101,3,1,0 // movaps 0x10365(%rip),%xmm13 # 2bfb0 <_sk_overlay_sse2_8bit+0xffb>
.byte 69,15,40,197 // movaps %xmm13,%xmm8
.byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8
.byte 69,15,40,242 // movaps %xmm10,%xmm14
.byte 69,15,92,243 // subps %xmm11,%xmm14
.byte 65,15,40,217 // movaps %xmm9,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
- .byte 15,40,21,192,1,1,0 // movaps 0x101c0(%rip),%xmm2 # 2b990 <_sk_overlay_sse2_8bit+0xfcf>
+ .byte 15,40,21,37,3,1,0 // movaps 0x10325(%rip),%xmm2 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb>
.byte 68,15,40,250 // movaps %xmm2,%xmm15
.byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15
- .byte 15,40,13,128,1,1,0 // movaps 0x10180(%rip),%xmm1 # 2b960 <_sk_overlay_sse2_8bit+0xf9f>
+ .byte 15,40,13,229,2,1,0 // movaps 0x102e5(%rip),%xmm1 # 2bf60 <_sk_overlay_sse2_8bit+0xfab>
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,45,150,1,1,0 // movaps 0x10196(%rip),%xmm5 # 2b980 <_sk_overlay_sse2_8bit+0xfbf>
+ .byte 15,40,45,251,2,1,0 // movaps 0x102fb(%rip),%xmm5 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb>
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,92,224 // subps %xmm0,%xmm4
.byte 65,15,89,230 // mulps %xmm14,%xmm4
@@ -43736,7 +44193,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,139,255,0,0 // andps 0xff8b(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,84,29,240,0,1,0 // andps 0x100f0(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 68,15,40,230 // movaps %xmm6,%xmm12
.byte 68,15,92,224 // subps %xmm0,%xmm12
@@ -43766,12 +44223,12 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 15,85,227 // andnps %xmm3,%xmm4
- .byte 15,88,53,3,1,1,0 // addps 0x10103(%rip),%xmm6 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 15,88,53,104,2,1,0 // addps 0x10268(%rip),%xmm6 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,254,254,0,0 // andps 0xfefe(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,84,29,99,0,1,0 // andps 0x10063(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,89,206 // mulps %xmm6,%xmm1
@@ -43835,13 +44292,13 @@ _sk_scale_u8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,61 // jne 1b9d3 <_sk_scale_u8_sse2+0x55>
+ .byte 117,61 // jne 1be6e <_sk_scale_u8_sse2+0x55>
.byte 102,71,15,110,4,25 // movd (%r9,%r11,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,209,254,0,0 // pand 0xfed1(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,68,15,219,5,54,0,1,0 // pand 0x10036(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,21,0,1,0 // mulps 0x10015(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,89,5,122,1,1,0 // mulps 0x1017a(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -43852,12 +44309,12 @@ _sk_scale_u8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,61 // je 1ba1d <_sk_scale_u8_sse2+0x9f>
+ .byte 116,61 // je 1beb8 <_sk_scale_u8_sse2+0x9f>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 1ba02 <_sk_scale_u8_sse2+0x84>
+ .byte 116,23 // je 1be9d <_sk_scale_u8_sse2+0x84>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,181 // jne 1b9a6 <_sk_scale_u8_sse2+0x28>
+ .byte 117,181 // jne 1be41 <_sk_scale_u8_sse2+0x28>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -43866,10 +44323,79 @@ _sk_scale_u8_sse2:
.byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 242,69,15,16,193 // movsd %xmm9,%xmm8
- .byte 235,137 // jmp 1b9a6 <_sk_scale_u8_sse2+0x28>
+ .byte 235,137 // jmp 1be41 <_sk_scale_u8_sse2+0x28>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,122,255,255,255 // jmpq 1b9a6 <_sk_scale_u8_sse2+0x28>
+ .byte 233,122,255,255,255 // jmpq 1be41 <_sk_scale_u8_sse2+0x28>
+
+HIDDEN _sk_scale_565_sse2
+.globl _sk_scale_565_sse2
+FUNCTION(_sk_scale_565_sse2)
+_sk_scale_565_sse2:
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,99,80,8 // movslq 0x8(%rax),%r10
+ .byte 76,99,201 // movslq %ecx,%r9
+ .byte 77,15,175,202 // imul %r10,%r9
+ .byte 77,1,201 // add %r9,%r9
+ .byte 76,3,8 // add (%rax),%r9
+ .byte 76,99,218 // movslq %edx,%r11
+ .byte 77,133,192 // test %r8,%r8
+ .byte 15,133,173,0,0,0 // jne 1bf93 <_sk_scale_565_sse2+0xcc>
+ .byte 243,71,15,126,20,89 // movq (%r9,%r11,2),%xmm10
+ .byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
+ .byte 102,68,15,111,5,230,0,1,0 // movdqa 0x100e6(%rip),%xmm8 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,69,15,219,194 // pand %xmm10,%xmm8
+ .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
+ .byte 68,15,89,5,229,0,1,0 // mulps 0x100e5(%rip),%xmm8 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,68,15,111,13,236,0,1,0 // movdqa 0x100ec(%rip),%xmm9 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,69,15,219,202 // pand %xmm10,%xmm9
+ .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
+ .byte 68,15,89,13,235,0,1,0 // mulps 0x100eb(%rip),%xmm9 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,68,15,219,21,242,0,1,0 // pand 0x100f2(%rip),%xmm10 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
+ .byte 68,15,89,21,246,0,1,0 // mulps 0x100f6(%rip),%xmm10 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 68,15,40,219 // movaps %xmm3,%xmm11
+ .byte 68,15,194,223,1 // cmpltps %xmm7,%xmm11
+ .byte 69,15,40,225 // movaps %xmm9,%xmm12
+ .byte 69,15,93,226 // minps %xmm10,%xmm12
+ .byte 69,15,40,232 // movaps %xmm8,%xmm13
+ .byte 69,15,93,236 // minps %xmm12,%xmm13
+ .byte 69,15,40,225 // movaps %xmm9,%xmm12
+ .byte 69,15,95,226 // maxps %xmm10,%xmm12
+ .byte 69,15,40,240 // movaps %xmm8,%xmm14
+ .byte 69,15,95,244 // maxps %xmm12,%xmm14
+ .byte 69,15,84,235 // andps %xmm11,%xmm13
+ .byte 69,15,85,222 // andnps %xmm14,%xmm11
+ .byte 69,15,86,221 // orps %xmm13,%xmm11
+ .byte 68,15,89,192 // mulps %xmm0,%xmm8
+ .byte 68,15,89,201 // mulps %xmm1,%xmm9
+ .byte 68,15,89,210 // mulps %xmm2,%xmm10
+ .byte 68,15,89,219 // mulps %xmm3,%xmm11
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 65,15,40,192 // movaps %xmm8,%xmm0
+ .byte 65,15,40,201 // movaps %xmm9,%xmm1
+ .byte 65,15,40,210 // movaps %xmm10,%xmm2
+ .byte 65,15,40,219 // movaps %xmm11,%xmm3
+ .byte 255,224 // jmpq *%rax
+ .byte 69,137,194 // mov %r8d,%r10d
+ .byte 65,128,226,3 // and $0x3,%r10b
+ .byte 65,128,250,1 // cmp $0x1,%r10b
+ .byte 116,59 // je 1bfdb <_sk_scale_565_sse2+0x114>
+ .byte 102,69,15,239,210 // pxor %xmm10,%xmm10
+ .byte 65,128,250,2 // cmp $0x2,%r10b
+ .byte 116,27 // je 1bfc6 <_sk_scale_565_sse2+0xff>
+ .byte 65,128,250,3 // cmp $0x3,%r10b
+ .byte 15,133,60,255,255,255 // jne 1bef1 <_sk_scale_565_sse2+0x2a>
+ .byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
+ .byte 102,68,15,110,192 // movd %eax,%xmm8
+ .byte 102,69,15,112,208,69 // pshufd $0x45,%xmm8,%xmm10
+ .byte 102,71,15,110,4,89 // movd (%r9,%r11,2),%xmm8
+ .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
+ .byte 242,69,15,16,208 // movsd %xmm8,%xmm10
+ .byte 233,22,255,255,255 // jmpq 1bef1 <_sk_scale_565_sse2+0x2a>
+ .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
+ .byte 102,68,15,110,208 // movd %eax,%xmm10
+ .byte 233,7,255,255,255 // jmpq 1bef1 <_sk_scale_565_sse2+0x2a>
HIDDEN _sk_lerp_1_float_sse2
.globl _sk_lerp_1_float_sse2
@@ -43904,13 +44430,13 @@ _sk_lerp_u8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,81 // jne 1bacd <_sk_lerp_u8_sse2+0x69>
+ .byte 117,81 // jne 1c08b <_sk_lerp_u8_sse2+0x69>
.byte 102,71,15,110,4,25 // movd (%r9,%r11,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,235,253,0,0 // pand 0xfdeb(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,68,15,219,5,45,254,0,0 // pand 0xfe2d(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,47,255,0,0 // mulps 0xff2f(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,89,5,113,255,0,0 // mulps 0xff71(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -43928,12 +44454,12 @@ _sk_lerp_u8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,64 // je 1bb1a <_sk_lerp_u8_sse2+0xb6>
+ .byte 116,64 // je 1c0d8 <_sk_lerp_u8_sse2+0xb6>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 1bafc <_sk_lerp_u8_sse2+0x98>
+ .byte 116,23 // je 1c0ba <_sk_lerp_u8_sse2+0x98>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,161 // jne 1ba8c <_sk_lerp_u8_sse2+0x28>
+ .byte 117,161 // jne 1c04a <_sk_lerp_u8_sse2+0x28>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -43942,10 +44468,10 @@ _sk_lerp_u8_sse2:
.byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 242,69,15,16,193 // movsd %xmm9,%xmm8
- .byte 233,114,255,255,255 // jmpq 1ba8c <_sk_lerp_u8_sse2+0x28>
+ .byte 233,114,255,255,255 // jmpq 1c04a <_sk_lerp_u8_sse2+0x28>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,99,255,255,255 // jmpq 1ba8c <_sk_lerp_u8_sse2+0x28>
+ .byte 233,99,255,255,255 // jmpq 1c04a <_sk_lerp_u8_sse2+0x28>
HIDDEN _sk_lerp_565_sse2
.globl _sk_lerp_565_sse2
@@ -43959,60 +44485,64 @@ _sk_lerp_565_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,156,0,0,0 // jne 1bbe4 <_sk_lerp_565_sse2+0xbb>
- .byte 243,71,15,126,12,89 // movq (%r9,%r11,2),%xmm9
- .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
- .byte 102,68,15,111,5,132,254,0,0 // movdqa 0xfe84(%rip),%xmm8 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
- .byte 102,69,15,219,193 // pand %xmm9,%xmm8
- .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,131,254,0,0 // mulps 0xfe83(%rip),%xmm8 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,68,15,111,21,138,254,0,0 // movdqa 0xfe8a(%rip),%xmm10 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
- .byte 102,69,15,219,209 // pand %xmm9,%xmm10
- .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,137,254,0,0 // mulps 0xfe89(%rip),%xmm10 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,68,15,219,13,144,254,0,0 // pand 0xfe90(%rip),%xmm9 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 15,133,173,0,0,0 // jne 1c1b3 <_sk_lerp_565_sse2+0xcc>
+ .byte 243,71,15,126,4,89 // movq (%r9,%r11,2),%xmm8
+ .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
+ .byte 102,68,15,111,13,198,254,0,0 // movdqa 0xfec6(%rip),%xmm9 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,69,15,219,200 // pand %xmm8,%xmm9
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,148,254,0,0 // mulps 0xfe94(%rip),%xmm9 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
+ .byte 68,15,89,13,197,254,0,0 // mulps 0xfec5(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,68,15,111,21,204,254,0,0 // movdqa 0xfecc(%rip),%xmm10 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,69,15,219,208 // pand %xmm8,%xmm10
+ .byte 69,15,91,218 // cvtdq2ps %xmm10,%xmm11
+ .byte 68,15,89,29,203,254,0,0 // mulps 0xfecb(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,68,15,219,5,210,254,0,0 // pand 0xfed2(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
+ .byte 68,15,89,5,214,254,0,0 // mulps 0xfed6(%rip),%xmm8 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 68,15,40,211 // movaps %xmm3,%xmm10
+ .byte 68,15,194,215,1 // cmpltps %xmm7,%xmm10
+ .byte 69,15,40,227 // movaps %xmm11,%xmm12
+ .byte 15,92,205 // subps %xmm5,%xmm1
+ .byte 65,15,89,203 // mulps %xmm11,%xmm1
+ .byte 69,15,93,216 // minps %xmm8,%xmm11
+ .byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 65,15,89,193 // mulps %xmm9,%xmm0
+ .byte 69,15,93,203 // minps %xmm11,%xmm9
+ .byte 69,15,95,224 // maxps %xmm8,%xmm12
+ .byte 69,15,95,236 // maxps %xmm12,%xmm13
+ .byte 69,15,84,202 // andps %xmm10,%xmm9
+ .byte 69,15,85,213 // andnps %xmm13,%xmm10
+ .byte 69,15,86,209 // orps %xmm9,%xmm10
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,92,205 // subps %xmm5,%xmm1
- .byte 65,15,89,202 // mulps %xmm10,%xmm1
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,92,214 // subps %xmm6,%xmm2
- .byte 65,15,89,209 // mulps %xmm9,%xmm2
+ .byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 15,88,214 // addps %xmm6,%xmm2
.byte 15,92,223 // subps %xmm7,%xmm3
- .byte 68,15,89,195 // mulps %xmm3,%xmm8
- .byte 68,15,88,199 // addps %xmm7,%xmm8
- .byte 68,15,89,211 // mulps %xmm3,%xmm10
- .byte 68,15,88,215 // addps %xmm7,%xmm10
- .byte 65,15,89,217 // mulps %xmm9,%xmm3
+ .byte 65,15,89,218 // mulps %xmm10,%xmm3
.byte 15,88,223 // addps %xmm7,%xmm3
- .byte 68,15,95,211 // maxps %xmm3,%xmm10
- .byte 69,15,95,194 // maxps %xmm10,%xmm8
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 65,15,40,216 // movaps %xmm8,%xmm3
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,59 // je 1bc2c <_sk_lerp_565_sse2+0x103>
- .byte 102,69,15,239,201 // pxor %xmm9,%xmm9
+ .byte 116,59 // je 1c1fb <_sk_lerp_565_sse2+0x114>
+ .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,27 // je 1bc17 <_sk_lerp_565_sse2+0xee>
+ .byte 116,27 // je 1c1e6 <_sk_lerp_565_sse2+0xff>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,77,255,255,255 // jne 1bb53 <_sk_lerp_565_sse2+0x2a>
+ .byte 15,133,60,255,255,255 // jne 1c111 <_sk_lerp_565_sse2+0x2a>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 102,69,15,112,200,69 // pshufd $0x45,%xmm8,%xmm9
- .byte 102,71,15,110,4,89 // movd (%r9,%r11,2),%xmm8
- .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 242,69,15,16,200 // movsd %xmm8,%xmm9
- .byte 233,39,255,255,255 // jmpq 1bb53 <_sk_lerp_565_sse2+0x2a>
+ .byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
+ .byte 102,71,15,110,12,89 // movd (%r9,%r11,2),%xmm9
+ .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
+ .byte 242,69,15,16,193 // movsd %xmm9,%xmm8
+ .byte 233,22,255,255,255 // jmpq 1c111 <_sk_lerp_565_sse2+0x2a>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
- .byte 102,68,15,110,200 // movd %eax,%xmm9
- .byte 233,24,255,255,255 // jmpq 1bb53 <_sk_lerp_565_sse2+0x2a>
+ .byte 102,68,15,110,192 // movd %eax,%xmm8
+ .byte 233,7,255,255,255 // jmpq 1c111 <_sk_lerp_565_sse2+0x2a>
HIDDEN _sk_load_tables_sse2
.globl _sk_load_tables_sse2
@@ -44021,12 +44551,12 @@ _sk_load_tables_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,36,1,0,0 // jne 1bd6d <_sk_load_tables_sse2+0x132>
+ .byte 15,133,36,1,0,0 // jne 1c33c <_sk_load_tables_sse2+0x132>
.byte 243,69,15,111,12,145 // movdqu (%r9,%rdx,4),%xmm9
.byte 65,87 // push %r15
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,68,15,111,5,35,252,0,0 // movdqa 0xfc23(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,68,15,111,5,84,252,0,0 // movdqa 0xfc54(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
@@ -44082,7 +44612,7 @@ _sk_load_tables_sse2:
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 102,65,15,114,209,24 // psrld $0x18,%xmm9
.byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3
- .byte 15,89,29,108,252,0,0 // mulps 0xfc6c(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,29,157,252,0,0 // mulps 0xfc9d(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -44091,18 +44621,18 @@ _sk_load_tables_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 1bda7 <_sk_load_tables_sse2+0x16c>
+ .byte 116,45 // je 1c376 <_sk_load_tables_sse2+0x16c>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 1bd9c <_sk_load_tables_sse2+0x161>
+ .byte 116,23 // je 1c36b <_sk_load_tables_sse2+0x161>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,192,254,255,255 // jne 1bc4f <_sk_load_tables_sse2+0x14>
+ .byte 15,133,192,254,255,255 // jne 1c21e <_sk_load_tables_sse2+0x14>
.byte 102,65,15,110,68,145,8 // movd 0x8(%r9,%rdx,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,145 // movlpd (%r9,%rdx,4),%xmm9
- .byte 233,168,254,255,255 // jmpq 1bc4f <_sk_load_tables_sse2+0x14>
+ .byte 233,168,254,255,255 // jmpq 1c21e <_sk_load_tables_sse2+0x14>
.byte 102,69,15,110,12,145 // movd (%r9,%rdx,4),%xmm9
- .byte 233,157,254,255,255 // jmpq 1bc4f <_sk_load_tables_sse2+0x14>
+ .byte 233,157,254,255,255 // jmpq 1c21e <_sk_load_tables_sse2+0x14>
HIDDEN _sk_load_tables_u16_be_sse2
.globl _sk_load_tables_u16_be_sse2
@@ -44112,7 +44642,7 @@ _sk_load_tables_u16_be_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,101,1,0,0 // jne 1bf2d <_sk_load_tables_u16_be_sse2+0x17b>
+ .byte 15,133,101,1,0,0 // jne 1c4fc <_sk_load_tables_u16_be_sse2+0x17b>
.byte 102,67,15,16,4,81 // movupd (%r9,%r10,2),%xmm0
.byte 102,67,15,16,76,81,16 // movupd 0x10(%r9,%r10,2),%xmm1
.byte 65,87 // push %r15
@@ -44124,7 +44654,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,21,65,252,0,0 // movdqa 0xfc41(%rip),%xmm10 # 2ba40 <_sk_overlay_sse2_8bit+0x107f>
+ .byte 102,68,15,111,21,114,252,0,0 // movdqa 0xfc72(%rip),%xmm10 # 2c040 <_sk_overlay_sse2_8bit+0x108b>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -44186,7 +44716,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,235,217 // por %xmm9,%xmm3
.byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,60,251,0,0 // mulps 0xfb3c(%rip),%xmm3 # 2ba60 <_sk_overlay_sse2_8bit+0x109f>
+ .byte 15,89,29,109,251,0,0 // mulps 0xfb6d(%rip),%xmm3 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -44194,17 +44724,17 @@ _sk_load_tables_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,67,15,16,4,81 // movsd (%r9,%r10,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 1bf4a <_sk_load_tables_u16_be_sse2+0x198>
+ .byte 117,17 // jne 1c519 <_sk_load_tables_u16_be_sse2+0x198>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,139,254,255,255 // jmpq 1bdd5 <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 233,139,254,255,255 // jmpq 1c3a4 <_sk_load_tables_u16_be_sse2+0x23>
.byte 102,67,15,22,68,81,8 // movhpd 0x8(%r9,%r10,2),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,118,254,255,255 // jb 1bdd5 <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 15,130,118,254,255,255 // jb 1c3a4 <_sk_load_tables_u16_be_sse2+0x23>
.byte 242,67,15,16,76,81,16 // movsd 0x10(%r9,%r10,2),%xmm1
- .byte 233,106,254,255,255 // jmpq 1bdd5 <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 233,106,254,255,255 // jmpq 1c3a4 <_sk_load_tables_u16_be_sse2+0x23>
HIDDEN _sk_load_tables_rgb_u16_be_sse2
.globl _sk_load_tables_rgb_u16_be_sse2
@@ -44214,7 +44744,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,84,1,0,0 // jne 1c0d1 <_sk_load_tables_rgb_u16_be_sse2+0x166>
+ .byte 15,133,84,1,0,0 // jne 1c6a0 <_sk_load_tables_rgb_u16_be_sse2+0x166>
.byte 243,71,15,111,28,81 // movdqu (%r9,%r10,2),%xmm11
.byte 243,67,15,111,76,81,8 // movdqu 0x8(%r9,%r10,2),%xmm1
.byte 102,15,115,217,4 // psrldq $0x4,%xmm1
@@ -44229,7 +44759,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
.byte 102,65,15,111,195 // movdqa %xmm11,%xmm0
.byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0
- .byte 102,68,15,111,5,123,250,0,0 // movdqa 0xfa7b(%rip),%xmm8 # 2ba40 <_sk_overlay_sse2_8bit+0x107f>
+ .byte 102,68,15,111,5,172,250,0,0 // movdqa 0xfaac(%rip),%xmm8 # 2c040 <_sk_overlay_sse2_8bit+0x108b>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -44285,7 +44815,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,6,247,0,0 // movaps 0xf706(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,55,247,0,0 // movaps 0xf737(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 65,95 // pop %r15
@@ -44294,21 +44824,21 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,71,15,196,92,81,4,2 // pinsrw $0x2,0x4(%r9,%r10,2),%xmm11
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,14 // jne 1c0f7 <_sk_load_tables_rgb_u16_be_sse2+0x18c>
+ .byte 117,14 // jne 1c6c6 <_sk_load_tables_rgb_u16_be_sse2+0x18c>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
- .byte 233,172,254,255,255 // jmpq 1bfa3 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,172,254,255,255 // jmpq 1c572 <_sk_load_tables_rgb_u16_be_sse2+0x38>
.byte 102,71,15,110,84,81,6 // movd 0x6(%r9,%r10,2),%xmm10
.byte 102,71,15,196,84,81,10,2 // pinsrw $0x2,0xa(%r9,%r10,2),%xmm10
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 1c128 <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
+ .byte 114,24 // jb 1c6f7 <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
.byte 102,67,15,110,76,81,12 // movd 0xc(%r9,%r10,2),%xmm1
.byte 102,67,15,196,76,81,16,2 // pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,123,254,255,255 // jmpq 1bfa3 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,123,254,255,255 // jmpq 1c572 <_sk_load_tables_rgb_u16_be_sse2+0x38>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,114,254,255,255 // jmpq 1bfa3 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,114,254,255,255 // jmpq 1c572 <_sk_load_tables_rgb_u16_be_sse2+0x38>
HIDDEN _sk_byte_tables_sse2
.globl _sk_byte_tables_sse2
@@ -44319,7 +44849,7 @@ _sk_byte_tables_sse2:
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,111,247,0,0 // movaps 0xf76f(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,160,247,0,0 // movaps 0xf7a0(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -44347,7 +44877,7 @@ _sk_byte_tables_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,25,248,0,0 // movaps 0xf819(%rip),%xmm10 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,21,74,248,0,0 // movaps 0xf84a(%rip),%xmm10 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -44468,7 +44998,7 @@ _sk_byte_tables_rgb_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,81,246,0,0 // movaps 0xf651(%rip),%xmm10 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,21,130,246,0,0 // movaps 0xf682(%rip),%xmm10 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -44675,15 +45205,15 @@ _sk_parametric_r_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,37,244,0,0 // mulps 0xf425(%rip),%xmm9 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,21,45,244,0,0 // andps 0xf42d(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,21,85,241,0,0 // orps 0xf155(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,13,45,244,0,0 // addps 0xf42d(%rip),%xmm9 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 68,15,40,37,53,244,0,0 // movaps 0xf435(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,13,86,244,0,0 // mulps 0xf456(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,21,94,244,0,0 // andps 0xf45e(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,21,134,241,0,0 // orps 0xf186(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,13,94,244,0,0 // addps 0xf45e(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,40,37,102,244,0,0 // movaps 0xf466(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,53,244,0,0 // addps 0xf435(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 68,15,40,37,61,244,0,0 // movaps 0xf43d(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,21,102,244,0,0 // addps 0xf466(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 68,15,40,37,110,244,0,0 // movaps 0xf46e(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -44691,22 +45221,22 @@ _sk_parametric_r_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,23,241,0,0 // movaps 0xf117(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,72,241,0,0 // movaps 0xf148(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,11,244,0,0 // addps 0xf40b(%rip),%xmm9 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 68,15,40,37,19,244,0,0 // movaps 0xf413(%rip),%xmm12 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,13,60,244,0,0 // addps 0xf43c(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 68,15,40,37,68,244,0,0 // movaps 0xf444(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,19,244,0,0 // movaps 0xf413(%rip),%xmm12 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,37,68,244,0,0 // movaps 0xf444(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,23,244,0,0 // movaps 0xf417(%rip),%xmm13 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 68,15,40,45,72,244,0,0 // movaps 0xf448(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,23,244,0,0 // mulps 0xf417(%rip),%xmm13 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 68,15,89,45,72,244,0,0 // mulps 0xf448(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -44742,15 +45272,15 @@ _sk_parametric_g_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,231,242,0,0 // mulps 0xf2e7(%rip),%xmm9 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,21,239,242,0,0 // andps 0xf2ef(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,21,23,240,0,0 // orps 0xf017(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,13,239,242,0,0 // addps 0xf2ef(%rip),%xmm9 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 68,15,40,37,247,242,0,0 // movaps 0xf2f7(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,13,24,243,0,0 // mulps 0xf318(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,21,32,243,0,0 // andps 0xf320(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,21,72,240,0,0 // orps 0xf048(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,13,32,243,0,0 // addps 0xf320(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,40,37,40,243,0,0 // movaps 0xf328(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,247,242,0,0 // addps 0xf2f7(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 68,15,40,37,255,242,0,0 // movaps 0xf2ff(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,21,40,243,0,0 // addps 0xf328(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 68,15,40,37,48,243,0,0 // movaps 0xf330(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -44758,22 +45288,22 @@ _sk_parametric_g_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,217,239,0,0 // movaps 0xefd9(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,10,240,0,0 // movaps 0xf00a(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,205,242,0,0 // addps 0xf2cd(%rip),%xmm9 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 68,15,40,37,213,242,0,0 // movaps 0xf2d5(%rip),%xmm12 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,13,254,242,0,0 // addps 0xf2fe(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 68,15,40,37,6,243,0,0 // movaps 0xf306(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,213,242,0,0 // movaps 0xf2d5(%rip),%xmm12 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,37,6,243,0,0 // movaps 0xf306(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,217,242,0,0 // movaps 0xf2d9(%rip),%xmm13 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 68,15,40,45,10,243,0,0 // movaps 0xf30a(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,217,242,0,0 // mulps 0xf2d9(%rip),%xmm13 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 68,15,89,45,10,243,0,0 // mulps 0xf30a(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -44809,15 +45339,15 @@ _sk_parametric_b_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,169,241,0,0 // mulps 0xf1a9(%rip),%xmm9 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,21,177,241,0,0 // andps 0xf1b1(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,21,217,238,0,0 // orps 0xeed9(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,13,177,241,0,0 // addps 0xf1b1(%rip),%xmm9 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 68,15,40,37,185,241,0,0 // movaps 0xf1b9(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,13,218,241,0,0 // mulps 0xf1da(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,21,226,241,0,0 // andps 0xf1e2(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,21,10,239,0,0 // orps 0xef0a(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,13,226,241,0,0 // addps 0xf1e2(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,40,37,234,241,0,0 // movaps 0xf1ea(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,185,241,0,0 // addps 0xf1b9(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 68,15,40,37,193,241,0,0 // movaps 0xf1c1(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,21,234,241,0,0 // addps 0xf1ea(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 68,15,40,37,242,241,0,0 // movaps 0xf1f2(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -44825,22 +45355,22 @@ _sk_parametric_b_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,155,238,0,0 // movaps 0xee9b(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,204,238,0,0 // movaps 0xeecc(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,143,241,0,0 // addps 0xf18f(%rip),%xmm9 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 68,15,40,37,151,241,0,0 // movaps 0xf197(%rip),%xmm12 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,13,192,241,0,0 // addps 0xf1c0(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 68,15,40,37,200,241,0,0 // movaps 0xf1c8(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,151,241,0,0 // movaps 0xf197(%rip),%xmm12 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,37,200,241,0,0 // movaps 0xf1c8(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,155,241,0,0 // movaps 0xf19b(%rip),%xmm13 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 68,15,40,45,204,241,0,0 // movaps 0xf1cc(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,155,241,0,0 // mulps 0xf19b(%rip),%xmm13 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 68,15,89,45,204,241,0,0 // mulps 0xf1cc(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -44876,15 +45406,15 @@ _sk_parametric_a_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,107,240,0,0 // mulps 0xf06b(%rip),%xmm9 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 68,15,84,21,115,240,0,0 // andps 0xf073(%rip),%xmm10 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,86,21,155,237,0,0 // orps 0xed9b(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
- .byte 68,15,88,13,115,240,0,0 // addps 0xf073(%rip),%xmm9 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
- .byte 68,15,40,37,123,240,0,0 // movaps 0xf07b(%rip),%xmm12 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,89,13,156,240,0,0 // mulps 0xf09c(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 68,15,84,21,164,240,0,0 // andps 0xf0a4(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,86,21,204,237,0,0 // orps 0xedcc(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,13,164,240,0,0 // addps 0xf0a4(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,40,37,172,240,0,0 // movaps 0xf0ac(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,123,240,0,0 // addps 0xf07b(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
- .byte 68,15,40,37,131,240,0,0 // movaps 0xf083(%rip),%xmm12 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,88,21,172,240,0,0 // addps 0xf0ac(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 68,15,40,37,180,240,0,0 // movaps 0xf0b4(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -44892,22 +45422,22 @@ _sk_parametric_a_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,93,237,0,0 // movaps 0xed5d(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,142,237,0,0 // movaps 0xed8e(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,81,240,0,0 // addps 0xf051(%rip),%xmm9 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
- .byte 68,15,40,37,89,240,0,0 // movaps 0xf059(%rip),%xmm12 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 68,15,88,13,130,240,0,0 // addps 0xf082(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 68,15,40,37,138,240,0,0 // movaps 0xf08a(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,89,240,0,0 // movaps 0xf059(%rip),%xmm12 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 68,15,40,37,138,240,0,0 // movaps 0xf08a(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,93,240,0,0 // movaps 0xf05d(%rip),%xmm13 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 68,15,40,45,142,240,0,0 // movaps 0xf08e(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,93,240,0,0 // mulps 0xf05d(%rip),%xmm13 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 68,15,89,45,142,240,0,0 // mulps 0xf08e(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -44932,19 +45462,19 @@ _sk_gamma_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,5,104,239,0,0 // mulps 0xef68(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 15,84,21,113,239,0,0 // andps 0xef71(%rip),%xmm2 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 68,15,40,53,153,236,0,0 // movaps 0xec99(%rip),%xmm14 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,89,5,153,239,0,0 // mulps 0xef99(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 15,84,21,162,239,0,0 // andps 0xefa2(%rip),%xmm2 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,40,53,202,236,0,0 // movaps 0xecca(%rip),%xmm14 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,86,214 // orps %xmm14,%xmm2
- .byte 68,15,40,37,109,239,0,0 // movaps 0xef6d(%rip),%xmm12 # 2baa0 <_sk_overlay_sse2_8bit+0x10df>
+ .byte 68,15,40,37,158,239,0,0 // movaps 0xef9e(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
.byte 65,15,88,196 // addps %xmm12,%xmm0
- .byte 68,15,40,29,113,239,0,0 // movaps 0xef71(%rip),%xmm11 # 2bab0 <_sk_overlay_sse2_8bit+0x10ef>
+ .byte 68,15,40,29,162,239,0,0 // movaps 0xefa2(%rip),%xmm11 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 65,15,89,227 // mulps %xmm11,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 68,15,40,21,111,239,0,0 // movaps 0xef6f(%rip),%xmm10 # 2bac0 <_sk_overlay_sse2_8bit+0x10ff>
+ .byte 68,15,40,21,160,239,0,0 // movaps 0xefa0(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
.byte 65,15,88,210 // addps %xmm10,%xmm2
- .byte 68,15,40,45,115,239,0,0 // movaps 0xef73(%rip),%xmm13 # 2bad0 <_sk_overlay_sse2_8bit+0x110f>
+ .byte 68,15,40,45,164,239,0,0 // movaps 0xefa4(%rip),%xmm13 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
.byte 65,15,40,229 // movaps %xmm13,%xmm4
.byte 15,94,226 // divps %xmm2,%xmm4
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44956,27 +45486,27 @@ _sk_gamma_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,194,226,1 // cmpltps %xmm2,%xmm4
- .byte 68,15,40,13,67,236,0,0 // movaps 0xec43(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,13,116,236,0,0 // movaps 0xec74(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,84,225 // andps %xmm9,%xmm4
.byte 15,92,212 // subps %xmm4,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,53,63,239,0,0 // movaps 0xef3f(%rip),%xmm6 # 2bae0 <_sk_overlay_sse2_8bit+0x111f>
+ .byte 15,40,53,112,239,0,0 // movaps 0xef70(%rip),%xmm6 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
.byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,40,61,85,239,0,0 // movaps 0xef55(%rip),%xmm7 # 2bb00 <_sk_overlay_sse2_8bit+0x113f>
+ .byte 15,40,61,134,239,0,0 // movaps 0xef86(%rip),%xmm7 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,37,53,239,0,0 // movaps 0xef35(%rip),%xmm4 # 2baf0 <_sk_overlay_sse2_8bit+0x112f>
+ .byte 15,40,37,102,239,0,0 // movaps 0xef66(%rip),%xmm4 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,92,194 // subps %xmm2,%xmm0
- .byte 68,15,40,61,71,239,0,0 // movaps 0xef47(%rip),%xmm15 # 2bb10 <_sk_overlay_sse2_8bit+0x114f>
+ .byte 68,15,40,61,120,239,0,0 // movaps 0xef78(%rip),%xmm15 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
.byte 65,15,40,215 // movaps %xmm15,%xmm2
.byte 15,94,213 // divps %xmm5,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,5,163,238,0,0 // mulps 0xeea3(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 15,84,13,172,238,0,0 // andps 0xeeac(%rip),%xmm1 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
+ .byte 15,89,5,212,238,0,0 // mulps 0xeed4(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 15,84,13,221,238,0,0 // andps 0xeedd(%rip),%xmm1 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
.byte 65,15,86,206 // orps %xmm14,%xmm1
.byte 65,15,88,196 // addps %xmm12,%xmm0
.byte 15,40,233 // movaps %xmm1,%xmm5
@@ -45006,9 +45536,9 @@ _sk_gamma_sse2:
.byte 15,94,206 // divps %xmm6,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,5,50,238,0,0 // mulps 0xee32(%rip),%xmm0 # 2ba80 <_sk_overlay_sse2_8bit+0x10bf>
- .byte 15,84,29,59,238,0,0 // andps 0xee3b(%rip),%xmm3 # 2ba90 <_sk_overlay_sse2_8bit+0x10cf>
- .byte 15,86,29,100,235,0,0 // orps 0xeb64(%rip),%xmm3 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,89,5,99,238,0,0 // mulps 0xee63(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 15,84,29,108,238,0,0 // andps 0xee6c(%rip),%xmm3 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 15,86,29,149,235,0,0 // orps 0xeb95(%rip),%xmm3 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,88,196 // addps %xmm12,%xmm0
.byte 68,15,89,219 // mulps %xmm3,%xmm11
.byte 65,15,92,195 // subps %xmm11,%xmm0
@@ -45030,7 +45560,7 @@ _sk_gamma_sse2:
.byte 15,92,253 // subps %xmm5,%xmm7
.byte 68,15,94,255 // divps %xmm7,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 15,40,5,113,238,0,0 // movaps 0xee71(%rip),%xmm0 # 2bb20 <_sk_overlay_sse2_8bit+0x115f>
+ .byte 15,40,5,162,238,0,0 // movaps 0xeea2(%rip),%xmm0 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 68,15,89,248 // mulps %xmm0,%xmm15
@@ -45049,29 +45579,29 @@ HIDDEN _sk_lab_to_xyz_sse2
.globl _sk_lab_to_xyz_sse2
FUNCTION(_sk_lab_to_xyz_sse2)
_sk_lab_to_xyz_sse2:
- .byte 15,89,5,70,238,0,0 // mulps 0xee46(%rip),%xmm0 # 2bb30 <_sk_overlay_sse2_8bit+0x116f>
- .byte 68,15,40,5,190,235,0,0 // movaps 0xebbe(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 15,89,5,119,238,0,0 // mulps 0xee77(%rip),%xmm0 # 2c130 <_sk_overlay_sse2_8bit+0x117b>
+ .byte 68,15,40,5,239,235,0,0 // movaps 0xebef(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 65,15,89,200 // mulps %xmm8,%xmm1
- .byte 68,15,40,13,66,238,0,0 // movaps 0xee42(%rip),%xmm9 # 2bb40 <_sk_overlay_sse2_8bit+0x117f>
+ .byte 68,15,40,13,115,238,0,0 // movaps 0xee73(%rip),%xmm9 # 2c140 <_sk_overlay_sse2_8bit+0x118b>
.byte 65,15,88,201 // addps %xmm9,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 15,88,5,63,238,0,0 // addps 0xee3f(%rip),%xmm0 # 2bb50 <_sk_overlay_sse2_8bit+0x118f>
- .byte 15,89,5,72,238,0,0 // mulps 0xee48(%rip),%xmm0 # 2bb60 <_sk_overlay_sse2_8bit+0x119f>
- .byte 15,89,13,81,238,0,0 // mulps 0xee51(%rip),%xmm1 # 2bb70 <_sk_overlay_sse2_8bit+0x11af>
+ .byte 15,88,5,112,238,0,0 // addps 0xee70(%rip),%xmm0 # 2c150 <_sk_overlay_sse2_8bit+0x119b>
+ .byte 15,89,5,121,238,0,0 // mulps 0xee79(%rip),%xmm0 # 2c160 <_sk_overlay_sse2_8bit+0x11ab>
+ .byte 15,89,13,130,238,0,0 // mulps 0xee82(%rip),%xmm1 # 2c170 <_sk_overlay_sse2_8bit+0x11bb>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,21,87,238,0,0 // mulps 0xee57(%rip),%xmm2 # 2bb80 <_sk_overlay_sse2_8bit+0x11bf>
+ .byte 15,89,21,136,238,0,0 // mulps 0xee88(%rip),%xmm2 # 2c180 <_sk_overlay_sse2_8bit+0x11cb>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 68,15,92,202 // subps %xmm2,%xmm9
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
.byte 68,15,89,225 // mulps %xmm1,%xmm12
- .byte 15,40,21,76,238,0,0 // movaps 0xee4c(%rip),%xmm2 # 2bb90 <_sk_overlay_sse2_8bit+0x11cf>
+ .byte 15,40,21,125,238,0,0 // movaps 0xee7d(%rip),%xmm2 # 2c190 <_sk_overlay_sse2_8bit+0x11db>
.byte 68,15,40,194 // movaps %xmm2,%xmm8
.byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8
- .byte 68,15,40,21,75,238,0,0 // movaps 0xee4b(%rip),%xmm10 # 2bba0 <_sk_overlay_sse2_8bit+0x11df>
+ .byte 68,15,40,21,124,238,0,0 // movaps 0xee7c(%rip),%xmm10 # 2c1a0 <_sk_overlay_sse2_8bit+0x11eb>
.byte 65,15,88,202 // addps %xmm10,%xmm1
- .byte 68,15,40,29,79,238,0,0 // movaps 0xee4f(%rip),%xmm11 # 2bbb0 <_sk_overlay_sse2_8bit+0x11ef>
+ .byte 68,15,40,29,128,238,0,0 // movaps 0xee80(%rip),%xmm11 # 2c1b0 <_sk_overlay_sse2_8bit+0x11fb>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 69,15,84,224 // andps %xmm8,%xmm12
.byte 68,15,85,193 // andnps %xmm1,%xmm8
@@ -45095,8 +45625,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,84,194 // andps %xmm2,%xmm0
.byte 65,15,85,209 // andnps %xmm9,%xmm2
.byte 15,86,208 // orps %xmm0,%xmm2
- .byte 68,15,89,5,255,237,0,0 // mulps 0xedff(%rip),%xmm8 # 2bbc0 <_sk_overlay_sse2_8bit+0x11ff>
- .byte 15,89,21,8,238,0,0 // mulps 0xee08(%rip),%xmm2 # 2bbd0 <_sk_overlay_sse2_8bit+0x120f>
+ .byte 68,15,89,5,48,238,0,0 // mulps 0xee30(%rip),%xmm8 # 2c1c0 <_sk_overlay_sse2_8bit+0x120b>
+ .byte 15,89,21,57,238,0,0 // mulps 0xee39(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x121b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -45112,13 +45642,13 @@ _sk_load_a8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,46 // jne 1ce16 <_sk_load_a8_sse2+0x46>
+ .byte 117,46 // jne 1d3e5 <_sk_load_a8_sse2+0x46>
.byte 102,67,15,110,4,25 // movd (%r9,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,130,234,0,0 // pand 0xea82(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,5,179,234,0,0 // pand 0xeab3(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,200,235,0,0 // mulps 0xebc8(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,29,249,235,0,0 // mulps 0xebf9(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
@@ -45127,12 +45657,12 @@ _sk_load_a8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 1ce59 <_sk_load_a8_sse2+0x89>
+ .byte 116,54 // je 1d428 <_sk_load_a8_sse2+0x89>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1ce42 <_sk_load_a8_sse2+0x72>
+ .byte 116,21 // je 1d411 <_sk_load_a8_sse2+0x72>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 1cdf6 <_sk_load_a8_sse2+0x26>
+ .byte 117,195 // jne 1d3c5 <_sk_load_a8_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -45141,10 +45671,10 @@ _sk_load_a8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,157 // jmp 1cdf6 <_sk_load_a8_sse2+0x26>
+ .byte 235,157 // jmp 1d3c5 <_sk_load_a8_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,146 // jmp 1cdf6 <_sk_load_a8_sse2+0x26>
+ .byte 235,146 // jmp 1d3c5 <_sk_load_a8_sse2+0x26>
HIDDEN _sk_load_a8_dst_sse2
.globl _sk_load_a8_dst_sse2
@@ -45157,13 +45687,13 @@ _sk_load_a8_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,46 // jne 1ceaa <_sk_load_a8_dst_sse2+0x46>
+ .byte 117,46 // jne 1d479 <_sk_load_a8_dst_sse2+0x46>
.byte 102,67,15,110,36,25 // movd (%r9,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,238,233,0,0 // pand 0xe9ee(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,37,31,234,0,0 // pand 0xea1f(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,52,235,0,0 // mulps 0xeb34(%rip),%xmm7 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,61,101,235,0,0 // mulps 0xeb65(%rip),%xmm7 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
@@ -45172,12 +45702,12 @@ _sk_load_a8_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 1ceed <_sk_load_a8_dst_sse2+0x89>
+ .byte 116,54 // je 1d4bc <_sk_load_a8_dst_sse2+0x89>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1ced6 <_sk_load_a8_dst_sse2+0x72>
+ .byte 116,21 // je 1d4a5 <_sk_load_a8_dst_sse2+0x72>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 1ce8a <_sk_load_a8_dst_sse2+0x26>
+ .byte 117,195 // jne 1d459 <_sk_load_a8_dst_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -45186,10 +45716,10 @@ _sk_load_a8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,157 // jmp 1ce8a <_sk_load_a8_dst_sse2+0x26>
+ .byte 235,157 // jmp 1d459 <_sk_load_a8_dst_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,146 // jmp 1ce8a <_sk_load_a8_dst_sse2+0x26>
+ .byte 235,146 // jmp 1d459 <_sk_load_a8_dst_sse2+0x26>
HIDDEN _sk_gather_a8_sse2
.globl _sk_gather_a8_sse2
@@ -45231,7 +45761,7 @@ _sk_gather_a8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,69,234,0,0 // mulps 0xea45(%rip),%xmm3 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,29,118,234,0,0 // mulps 0xea76(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -45250,7 +45780,7 @@ _sk_store_a8_sse2:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,249,232,0,0 // movaps 0xe8f9(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,42,233,0,0 // movaps 0xe92a(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,65,15,114,240,16 // pslld $0x10,%xmm8
@@ -45258,7 +45788,7 @@ _sk_store_a8_sse2:
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,13 // jne 1cfe8 <_sk_store_a8_sse2+0x4c>
+ .byte 117,13 // jne 1d5b7 <_sk_store_a8_sse2+0x4c>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 67,137,4,25 // mov %eax,(%r9,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -45268,24 +45798,24 @@ _sk_store_a8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,59 // je 1d03a <_sk_store_a8_sse2+0x9e>
+ .byte 116,59 // je 1d609 <_sk_store_a8_sse2+0x9e>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,22 // je 1d01b <_sk_store_a8_sse2+0x7f>
+ .byte 116,22 // je 1d5ea <_sk_store_a8_sse2+0x7f>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,217 // jne 1cfe4 <_sk_store_a8_sse2+0x48>
+ .byte 117,217 // jne 1d5b3 <_sk_store_a8_sse2+0x48>
.byte 102,68,15,127,68,36,232 // movdqa %xmm8,-0x18(%rsp)
.byte 138,68,36,240 // mov -0x10(%rsp),%al
.byte 67,136,68,25,2 // mov %al,0x2(%r9,%r11,1)
- .byte 102,68,15,219,5,92,232,0,0 // pand 0xe85c(%rip),%xmm8 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,68,15,219,5,141,232,0,0 // pand 0xe88d(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,25 // mov %ax,(%r9,%r11,1)
- .byte 235,170 // jmp 1cfe4 <_sk_store_a8_sse2+0x48>
+ .byte 235,170 // jmp 1d5b3 <_sk_store_a8_sse2+0x48>
.byte 102,68,15,127,68,36,216 // movdqa %xmm8,-0x28(%rsp)
.byte 138,68,36,216 // mov -0x28(%rsp),%al
.byte 67,136,4,25 // mov %al,(%r9,%r11,1)
- .byte 235,153 // jmp 1cfe4 <_sk_store_a8_sse2+0x48>
+ .byte 235,153 // jmp 1d5b3 <_sk_store_a8_sse2+0x48>
HIDDEN _sk_load_g8_sse2
.globl _sk_load_g8_sse2
@@ -45298,27 +45828,27 @@ _sk_load_g8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,49 // jne 1d094 <_sk_load_g8_sse2+0x49>
+ .byte 117,49 // jne 1d663 <_sk_load_g8_sse2+0x49>
.byte 102,67,15,110,4,25 // movd (%r9,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,7,232,0,0 // pand 0xe807(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,5,56,232,0,0 // pand 0xe838(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,77,233,0,0 // mulps 0xe94d(%rip),%xmm0 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,5,126,233,0,0 // mulps 0xe97e(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,68,231,0,0 // movaps 0xe744(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,117,231,0,0 // movaps 0xe775(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 1d0d7 <_sk_load_g8_sse2+0x8c>
+ .byte 116,54 // je 1d6a6 <_sk_load_g8_sse2+0x8c>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d0c0 <_sk_load_g8_sse2+0x75>
+ .byte 116,21 // je 1d68f <_sk_load_g8_sse2+0x75>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 1d071 <_sk_load_g8_sse2+0x26>
+ .byte 117,192 // jne 1d640 <_sk_load_g8_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -45327,10 +45857,10 @@ _sk_load_g8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,154 // jmp 1d071 <_sk_load_g8_sse2+0x26>
+ .byte 235,154 // jmp 1d640 <_sk_load_g8_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,143 // jmp 1d071 <_sk_load_g8_sse2+0x26>
+ .byte 235,143 // jmp 1d640 <_sk_load_g8_sse2+0x26>
HIDDEN _sk_load_g8_dst_sse2
.globl _sk_load_g8_dst_sse2
@@ -45343,27 +45873,27 @@ _sk_load_g8_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,49 // jne 1d12b <_sk_load_g8_dst_sse2+0x49>
+ .byte 117,49 // jne 1d6fa <_sk_load_g8_dst_sse2+0x49>
.byte 102,67,15,110,36,25 // movd (%r9,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,112,231,0,0 // pand 0xe770(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,219,37,161,231,0,0 // pand 0xe7a1(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,182,232,0,0 // mulps 0xe8b6(%rip),%xmm4 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,37,231,232,0,0 // mulps 0xe8e7(%rip),%xmm4 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,173,230,0,0 // movaps 0xe6ad(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,61,222,230,0,0 // movaps 0xe6de(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 1d16e <_sk_load_g8_dst_sse2+0x8c>
+ .byte 116,54 // je 1d73d <_sk_load_g8_dst_sse2+0x8c>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d157 <_sk_load_g8_dst_sse2+0x75>
+ .byte 116,21 // je 1d726 <_sk_load_g8_dst_sse2+0x75>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 1d108 <_sk_load_g8_dst_sse2+0x26>
+ .byte 117,192 // jne 1d6d7 <_sk_load_g8_dst_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -45372,10 +45902,10 @@ _sk_load_g8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,154 // jmp 1d108 <_sk_load_g8_dst_sse2+0x26>
+ .byte 235,154 // jmp 1d6d7 <_sk_load_g8_dst_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,143 // jmp 1d108 <_sk_load_g8_dst_sse2+0x26>
+ .byte 235,143 // jmp 1d6d7 <_sk_load_g8_dst_sse2+0x26>
HIDDEN _sk_gather_g8_sse2
.globl _sk_gather_g8_sse2
@@ -45417,9 +45947,9 @@ _sk_gather_g8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,196,231,0,0 // mulps 0xe7c4(%rip),%xmm0 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 15,89,5,245,231,0,0 // mulps 0xe7f5(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,187,229,0,0 // movaps 0xe5bb(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,236,229,0,0 // movaps 0xe5ec(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 91 // pop %rbx
@@ -45438,42 +45968,42 @@ _sk_load_565_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,83 // jne 1d28d <_sk_load_565_sse2+0x6e>
+ .byte 117,83 // jne 1d85c <_sk_load_565_sse2+0x6e>
.byte 243,67,15,126,20,89 // movq (%r9,%r11,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,148,231,0,0 // movdqa 0xe794(%rip),%xmm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
+ .byte 102,15,111,5,197,231,0,0 // movdqa 0xe7c5(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,150,231,0,0 // mulps 0xe796(%rip),%xmm0 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,15,111,13,158,231,0,0 // movdqa 0xe79e(%rip),%xmm1 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
+ .byte 15,89,5,199,231,0,0 // mulps 0xe7c7(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,13,207,231,0,0 // movdqa 0xe7cf(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,160,231,0,0 // mulps 0xe7a0(%rip),%xmm1 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,15,219,21,168,231,0,0 // pand 0xe7a8(%rip),%xmm2 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 15,89,13,209,231,0,0 // mulps 0xe7d1(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,15,219,21,217,231,0,0 // pand 0xe7d9(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,174,231,0,0 // mulps 0xe7ae(%rip),%xmm2 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
+ .byte 15,89,21,223,231,0,0 // mulps 0xe7df(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,69,229,0,0 // movaps 0xe545(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,118,229,0,0 // movaps 0xe576(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 1d2cc <_sk_load_565_sse2+0xad>
+ .byte 116,50 // je 1d89b <_sk_load_565_sse2+0xad>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d2b9 <_sk_load_565_sse2+0x9a>
+ .byte 116,21 // je 1d888 <_sk_load_565_sse2+0x9a>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 1d244 <_sk_load_565_sse2+0x25>
+ .byte 117,154 // jne 1d813 <_sk_load_565_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,208 // movsd %xmm0,%xmm2
- .byte 233,120,255,255,255 // jmpq 1d244 <_sk_load_565_sse2+0x25>
+ .byte 233,120,255,255,255 // jmpq 1d813 <_sk_load_565_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,106,255,255,255 // jmpq 1d244 <_sk_load_565_sse2+0x25>
+ .byte 233,106,255,255,255 // jmpq 1d813 <_sk_load_565_sse2+0x25>
HIDDEN _sk_load_565_dst_sse2
.globl _sk_load_565_dst_sse2
@@ -45487,42 +46017,42 @@ _sk_load_565_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,83 // jne 1d348 <_sk_load_565_dst_sse2+0x6e>
+ .byte 117,83 // jne 1d917 <_sk_load_565_dst_sse2+0x6e>
.byte 243,67,15,126,52,89 // movq (%r9,%r11,2),%xmm6
.byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,37,217,230,0,0 // movdqa 0xe6d9(%rip),%xmm4 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
+ .byte 102,15,111,37,10,231,0,0 // movdqa 0xe70a(%rip),%xmm4 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,219,230,0,0 // mulps 0xe6db(%rip),%xmm4 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,15,111,45,227,230,0,0 // movdqa 0xe6e3(%rip),%xmm5 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
+ .byte 15,89,37,12,231,0,0 // mulps 0xe70c(%rip),%xmm4 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,45,20,231,0,0 // movdqa 0xe714(%rip),%xmm5 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,229,230,0,0 // mulps 0xe6e5(%rip),%xmm5 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,15,219,53,237,230,0,0 // pand 0xe6ed(%rip),%xmm6 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 15,89,45,22,231,0,0 // mulps 0xe716(%rip),%xmm5 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,15,219,53,30,231,0,0 // pand 0xe71e(%rip),%xmm6 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,243,230,0,0 // mulps 0xe6f3(%rip),%xmm6 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
+ .byte 15,89,53,36,231,0,0 // mulps 0xe724(%rip),%xmm6 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,138,228,0,0 // movaps 0xe48a(%rip),%xmm7 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,61,187,228,0,0 // movaps 0xe4bb(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 1d387 <_sk_load_565_dst_sse2+0xad>
+ .byte 116,50 // je 1d956 <_sk_load_565_dst_sse2+0xad>
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d374 <_sk_load_565_dst_sse2+0x9a>
+ .byte 116,21 // je 1d943 <_sk_load_565_dst_sse2+0x9a>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 1d2ff <_sk_load_565_dst_sse2+0x25>
+ .byte 117,154 // jne 1d8ce <_sk_load_565_dst_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,244 // movsd %xmm4,%xmm6
- .byte 233,120,255,255,255 // jmpq 1d2ff <_sk_load_565_dst_sse2+0x25>
+ .byte 233,120,255,255,255 // jmpq 1d8ce <_sk_load_565_dst_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,106,255,255,255 // jmpq 1d2ff <_sk_load_565_dst_sse2+0x25>
+ .byte 233,106,255,255,255 // jmpq 1d8ce <_sk_load_565_dst_sse2+0x25>
HIDDEN _sk_gather_565_sse2
.globl _sk_gather_565_sse2
@@ -45557,19 +46087,19 @@ _sk_gather_565_sse2:
.byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,197,229,0,0 // movdqa 0xe5c5(%rip),%xmm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x101f>
+ .byte 102,15,111,5,246,229,0,0 // movdqa 0xe5f6(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,199,229,0,0 // mulps 0xe5c7(%rip),%xmm0 # 2b9f0 <_sk_overlay_sse2_8bit+0x102f>
- .byte 102,15,111,13,207,229,0,0 // movdqa 0xe5cf(%rip),%xmm1 # 2ba00 <_sk_overlay_sse2_8bit+0x103f>
+ .byte 15,89,5,248,229,0,0 // mulps 0xe5f8(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
+ .byte 102,15,111,13,0,230,0,0 // movdqa 0xe600(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,209,229,0,0 // mulps 0xe5d1(%rip),%xmm1 # 2ba10 <_sk_overlay_sse2_8bit+0x104f>
- .byte 102,15,219,21,217,229,0,0 // pand 0xe5d9(%rip),%xmm2 # 2ba20 <_sk_overlay_sse2_8bit+0x105f>
+ .byte 15,89,13,2,230,0,0 // mulps 0xe602(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
+ .byte 102,15,219,21,10,230,0,0 // pand 0xe60a(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,223,229,0,0 // mulps 0xe5df(%rip),%xmm2 # 2ba30 <_sk_overlay_sse2_8bit+0x106f>
+ .byte 15,89,21,16,230,0,0 // mulps 0xe610(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,118,227,0,0 // movaps 0xe376(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,167,227,0,0 // movaps 0xe3a7(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -45584,12 +46114,12 @@ _sk_store_565_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,117,231,0,0 // movaps 0xe775(%rip),%xmm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x122f>
+ .byte 68,15,40,5,166,231,0,0 // movaps 0xe7a6(%rip),%xmm8 # 2c1f0 <_sk_overlay_sse2_8bit+0x123b>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,106,231,0,0 // movaps 0xe76a(%rip),%xmm10 # 2bc00 <_sk_overlay_sse2_8bit+0x123f>
+ .byte 68,15,40,21,155,231,0,0 // movaps 0xe79b(%rip),%xmm10 # 2c200 <_sk_overlay_sse2_8bit+0x124b>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -45601,7 +46131,7 @@ _sk_store_565_sse2:
.byte 102,65,15,114,224,16 // psrad $0x10,%xmm8
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 1d4d8 <_sk_store_565_sse2+0x7b>
+ .byte 117,10 // jne 1daa7 <_sk_store_565_sse2+0x7b>
.byte 242,71,15,17,4,89 // movsd %xmm8,(%r9,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -45609,19 +46139,19 @@ _sk_store_565_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,38 // je 1d510 <_sk_store_565_sse2+0xb3>
+ .byte 116,38 // je 1dadf <_sk_store_565_sse2+0xb3>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 1d502 <_sk_store_565_sse2+0xa5>
+ .byte 116,18 // je 1dad1 <_sk_store_565_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,222 // jne 1d4d4 <_sk_store_565_sse2+0x77>
+ .byte 117,222 // jne 1daa3 <_sk_store_565_sse2+0x77>
.byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax
.byte 102,67,137,68,89,4 // mov %ax,0x4(%r9,%r11,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,71,15,126,4,89 // movd %xmm8,(%r9,%r11,2)
- .byte 235,196 // jmp 1d4d4 <_sk_store_565_sse2+0x77>
+ .byte 235,196 // jmp 1daa3 <_sk_store_565_sse2+0x77>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,89 // mov %ax,(%r9,%r11,2)
- .byte 235,184 // jmp 1d4d4 <_sk_store_565_sse2+0x77>
+ .byte 235,184 // jmp 1daa3 <_sk_store_565_sse2+0x77>
HIDDEN _sk_load_4444_sse2
.globl _sk_load_4444_sse2
@@ -45635,45 +46165,45 @@ _sk_load_4444_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1d599 <_sk_load_4444_sse2+0x7d>
+ .byte 117,98 // jne 1db68 <_sk_load_4444_sse2+0x7d>
.byte 243,67,15,126,28,89 // movq (%r9,%r11,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,199,230,0,0 // movdqa 0xe6c7(%rip),%xmm0 # 2bc10 <_sk_overlay_sse2_8bit+0x124f>
+ .byte 102,15,111,5,248,230,0,0 // movdqa 0xe6f8(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,201,230,0,0 // mulps 0xe6c9(%rip),%xmm0 # 2bc20 <_sk_overlay_sse2_8bit+0x125f>
- .byte 102,15,111,13,209,230,0,0 // movdqa 0xe6d1(%rip),%xmm1 # 2bc30 <_sk_overlay_sse2_8bit+0x126f>
+ .byte 15,89,5,250,230,0,0 // mulps 0xe6fa(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
+ .byte 102,15,111,13,2,231,0,0 // movdqa 0xe702(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,211,230,0,0 // mulps 0xe6d3(%rip),%xmm1 # 2bc40 <_sk_overlay_sse2_8bit+0x127f>
- .byte 102,15,111,21,219,230,0,0 // movdqa 0xe6db(%rip),%xmm2 # 2bc50 <_sk_overlay_sse2_8bit+0x128f>
+ .byte 15,89,13,4,231,0,0 // mulps 0xe704(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
+ .byte 102,15,111,21,12,231,0,0 // movdqa 0xe70c(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,221,230,0,0 // mulps 0xe6dd(%rip),%xmm2 # 2bc60 <_sk_overlay_sse2_8bit+0x129f>
- .byte 102,15,219,29,229,230,0,0 // pand 0xe6e5(%rip),%xmm3 # 2bc70 <_sk_overlay_sse2_8bit+0x12af>
+ .byte 15,89,21,14,231,0,0 // mulps 0xe70e(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
+ .byte 102,15,219,29,22,231,0,0 // pand 0xe716(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,235,230,0,0 // mulps 0xe6eb(%rip),%xmm3 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf>
+ .byte 15,89,29,28,231,0,0 // mulps 0xe71c(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 1d5d8 <_sk_load_4444_sse2+0xbc>
+ .byte 116,50 // je 1dba7 <_sk_load_4444_sse2+0xbc>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d5c5 <_sk_load_4444_sse2+0xa9>
+ .byte 116,21 // je 1db94 <_sk_load_4444_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 1d541 <_sk_load_4444_sse2+0x25>
+ .byte 117,139 // jne 1db10 <_sk_load_4444_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,216 // movsd %xmm0,%xmm3
- .byte 233,105,255,255,255 // jmpq 1d541 <_sk_load_4444_sse2+0x25>
+ .byte 233,105,255,255,255 // jmpq 1db10 <_sk_load_4444_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 233,91,255,255,255 // jmpq 1d541 <_sk_load_4444_sse2+0x25>
+ .byte 233,91,255,255,255 // jmpq 1db10 <_sk_load_4444_sse2+0x25>
HIDDEN _sk_load_4444_dst_sse2
.globl _sk_load_4444_dst_sse2
@@ -45687,45 +46217,45 @@ _sk_load_4444_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1d663 <_sk_load_4444_dst_sse2+0x7d>
+ .byte 117,98 // jne 1dc32 <_sk_load_4444_dst_sse2+0x7d>
.byte 243,67,15,126,60,89 // movq (%r9,%r11,2),%xmm7
.byte 102,15,97,248 // punpcklwd %xmm0,%xmm7
- .byte 102,15,111,37,253,229,0,0 // movdqa 0xe5fd(%rip),%xmm4 # 2bc10 <_sk_overlay_sse2_8bit+0x124f>
+ .byte 102,15,111,37,46,230,0,0 // movdqa 0xe62e(%rip),%xmm4 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,255,229,0,0 // mulps 0xe5ff(%rip),%xmm4 # 2bc20 <_sk_overlay_sse2_8bit+0x125f>
- .byte 102,15,111,45,7,230,0,0 // movdqa 0xe607(%rip),%xmm5 # 2bc30 <_sk_overlay_sse2_8bit+0x126f>
+ .byte 15,89,37,48,230,0,0 // mulps 0xe630(%rip),%xmm4 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
+ .byte 102,15,111,45,56,230,0,0 // movdqa 0xe638(%rip),%xmm5 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,9,230,0,0 // mulps 0xe609(%rip),%xmm5 # 2bc40 <_sk_overlay_sse2_8bit+0x127f>
- .byte 102,15,111,53,17,230,0,0 // movdqa 0xe611(%rip),%xmm6 # 2bc50 <_sk_overlay_sse2_8bit+0x128f>
+ .byte 15,89,45,58,230,0,0 // mulps 0xe63a(%rip),%xmm5 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
+ .byte 102,15,111,53,66,230,0,0 // movdqa 0xe642(%rip),%xmm6 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,19,230,0,0 // mulps 0xe613(%rip),%xmm6 # 2bc60 <_sk_overlay_sse2_8bit+0x129f>
- .byte 102,15,219,61,27,230,0,0 // pand 0xe61b(%rip),%xmm7 # 2bc70 <_sk_overlay_sse2_8bit+0x12af>
+ .byte 15,89,53,68,230,0,0 // mulps 0xe644(%rip),%xmm6 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
+ .byte 102,15,219,61,76,230,0,0 // pand 0xe64c(%rip),%xmm7 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,33,230,0,0 // mulps 0xe621(%rip),%xmm7 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf>
+ .byte 15,89,61,82,230,0,0 // mulps 0xe652(%rip),%xmm7 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 1d6a2 <_sk_load_4444_dst_sse2+0xbc>
+ .byte 116,50 // je 1dc71 <_sk_load_4444_dst_sse2+0xbc>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d68f <_sk_load_4444_dst_sse2+0xa9>
+ .byte 116,21 // je 1dc5e <_sk_load_4444_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 1d60b <_sk_load_4444_dst_sse2+0x25>
+ .byte 117,139 // jne 1dbda <_sk_load_4444_dst_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,252 // movsd %xmm4,%xmm7
- .byte 233,105,255,255,255 // jmpq 1d60b <_sk_load_4444_dst_sse2+0x25>
+ .byte 233,105,255,255,255 // jmpq 1dbda <_sk_load_4444_dst_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,91,255,255,255 // jmpq 1d60b <_sk_load_4444_dst_sse2+0x25>
+ .byte 233,91,255,255,255 // jmpq 1dbda <_sk_load_4444_dst_sse2+0x25>
HIDDEN _sk_gather_4444_sse2
.globl _sk_gather_4444_sse2
@@ -45760,21 +46290,21 @@ _sk_gather_4444_sse2:
.byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,218,228,0,0 // movdqa 0xe4da(%rip),%xmm0 # 2bc10 <_sk_overlay_sse2_8bit+0x124f>
+ .byte 102,15,111,5,11,229,0,0 // movdqa 0xe50b(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,220,228,0,0 // mulps 0xe4dc(%rip),%xmm0 # 2bc20 <_sk_overlay_sse2_8bit+0x125f>
- .byte 102,15,111,13,228,228,0,0 // movdqa 0xe4e4(%rip),%xmm1 # 2bc30 <_sk_overlay_sse2_8bit+0x126f>
+ .byte 15,89,5,13,229,0,0 // mulps 0xe50d(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
+ .byte 102,15,111,13,21,229,0,0 // movdqa 0xe515(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,230,228,0,0 // mulps 0xe4e6(%rip),%xmm1 # 2bc40 <_sk_overlay_sse2_8bit+0x127f>
- .byte 102,15,111,21,238,228,0,0 // movdqa 0xe4ee(%rip),%xmm2 # 2bc50 <_sk_overlay_sse2_8bit+0x128f>
+ .byte 15,89,13,23,229,0,0 // mulps 0xe517(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
+ .byte 102,15,111,21,31,229,0,0 // movdqa 0xe51f(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,240,228,0,0 // mulps 0xe4f0(%rip),%xmm2 # 2bc60 <_sk_overlay_sse2_8bit+0x129f>
- .byte 102,15,219,29,248,228,0,0 // pand 0xe4f8(%rip),%xmm3 # 2bc70 <_sk_overlay_sse2_8bit+0x12af>
+ .byte 15,89,21,33,229,0,0 // mulps 0xe521(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
+ .byte 102,15,219,29,41,229,0,0 // pand 0xe529(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,254,228,0,0 // mulps 0xe4fe(%rip),%xmm3 # 2bc80 <_sk_overlay_sse2_8bit+0x12bf>
+ .byte 15,89,29,47,229,0,0 // mulps 0xe52f(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -45790,7 +46320,7 @@ _sk_store_4444_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,235,228,0,0 // movaps 0xe4eb(%rip),%xmm8 # 2bc90 <_sk_overlay_sse2_8bit+0x12cf>
+ .byte 68,15,40,5,28,229,0,0 // movaps 0xe51c(%rip),%xmm8 # 2c290 <_sk_overlay_sse2_8bit+0x12db>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -45812,7 +46342,7 @@ _sk_store_4444_sse2:
.byte 102,65,15,114,224,16 // psrad $0x10,%xmm8
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 1d816 <_sk_store_4444_sse2+0x8f>
+ .byte 117,10 // jne 1dde5 <_sk_store_4444_sse2+0x8f>
.byte 242,71,15,17,4,89 // movsd %xmm8,(%r9,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -45820,19 +46350,19 @@ _sk_store_4444_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,38 // je 1d84e <_sk_store_4444_sse2+0xc7>
+ .byte 116,38 // je 1de1d <_sk_store_4444_sse2+0xc7>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 1d840 <_sk_store_4444_sse2+0xb9>
+ .byte 116,18 // je 1de0f <_sk_store_4444_sse2+0xb9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,222 // jne 1d812 <_sk_store_4444_sse2+0x8b>
+ .byte 117,222 // jne 1dde1 <_sk_store_4444_sse2+0x8b>
.byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax
.byte 102,67,137,68,89,4 // mov %ax,0x4(%r9,%r11,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,71,15,126,4,89 // movd %xmm8,(%r9,%r11,2)
- .byte 235,196 // jmp 1d812 <_sk_store_4444_sse2+0x8b>
+ .byte 235,196 // jmp 1dde1 <_sk_store_4444_sse2+0x8b>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,89 // mov %ax,(%r9,%r11,2)
- .byte 235,184 // jmp 1d812 <_sk_store_4444_sse2+0x8b>
+ .byte 235,184 // jmp 1dde1 <_sk_store_4444_sse2+0x8b>
HIDDEN _sk_load_8888_sse2
.globl _sk_load_8888_sse2
@@ -45846,13 +46376,13 @@ _sk_load_8888_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1d8d8 <_sk_load_8888_sse2+0x7e>
+ .byte 117,98 // jne 1dea7 <_sk_load_8888_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,21,252,223,0,0 // movdqa 0xdffc(%rip),%xmm2 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,21,45,224,0,0 // movdqa 0xe02d(%rip),%xmm2 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,56,225,0,0 // movaps 0xe138(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,105,225,0,0 // movaps 0xe169(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -45872,18 +46402,18 @@ _sk_load_8888_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 1d90e <_sk_load_8888_sse2+0xb4>
+ .byte 116,41 // je 1dedd <_sk_load_8888_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1d903 <_sk_load_8888_sse2+0xa9>
+ .byte 116,19 // je 1ded2 <_sk_load_8888_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 1d87c <_sk_load_8888_sse2+0x22>
+ .byte 117,134 // jne 1de4b <_sk_load_8888_sse2+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1d87c <_sk_load_8888_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1de4b <_sk_load_8888_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1d87c <_sk_load_8888_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1de4b <_sk_load_8888_sse2+0x22>
HIDDEN _sk_load_8888_dst_sse2
.globl _sk_load_8888_dst_sse2
@@ -45897,13 +46427,13 @@ _sk_load_8888_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1d997 <_sk_load_8888_dst_sse2+0x7e>
+ .byte 117,98 // jne 1df66 <_sk_load_8888_dst_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,53,61,223,0,0 // movdqa 0xdf3d(%rip),%xmm6 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,53,110,223,0,0 // movdqa 0xdf6e(%rip),%xmm6 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,225 // movdqa %xmm9,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,121,224,0,0 // movaps 0xe079(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,170,224,0,0 // movaps 0xe0aa(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -45923,18 +46453,18 @@ _sk_load_8888_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 1d9cd <_sk_load_8888_dst_sse2+0xb4>
+ .byte 116,41 // je 1df9c <_sk_load_8888_dst_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1d9c2 <_sk_load_8888_dst_sse2+0xa9>
+ .byte 116,19 // je 1df91 <_sk_load_8888_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 1d93b <_sk_load_8888_dst_sse2+0x22>
+ .byte 117,134 // jne 1df0a <_sk_load_8888_dst_sse2+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1d93b <_sk_load_8888_dst_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1df0a <_sk_load_8888_dst_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1d93b <_sk_load_8888_dst_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1df0a <_sk_load_8888_dst_sse2+0x22>
HIDDEN _sk_gather_8888_sse2
.globl _sk_gather_8888_sse2
@@ -45968,11 +46498,11 @@ _sk_gather_8888_sse2:
.byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,21,38,222,0,0 // movdqa 0xde26(%rip),%xmm2 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,21,87,222,0,0 // movdqa 0xde57(%rip),%xmm2 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,98,223,0,0 // movaps 0xdf62(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,147,223,0,0 // movaps 0xdf93(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -46002,7 +46532,7 @@ _sk_store_8888_sse2:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,226,221,0,0 // movaps 0xdde2(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,19,222,0,0 // movaps 0xde13(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -46021,24 +46551,24 @@ _sk_store_8888_sse2:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 1db2e <_sk_store_8888_sse2+0x7f>
+ .byte 117,10 // jne 1e0fd <_sk_store_8888_sse2+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,33 // je 1db5c <_sk_store_8888_sse2+0xad>
+ .byte 116,33 // je 1e12b <_sk_store_8888_sse2+0xad>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1db54 <_sk_store_8888_sse2+0xa5>
+ .byte 116,19 // je 1e123 <_sk_store_8888_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 1db2a <_sk_store_8888_sse2+0x7b>
+ .byte 117,227 // jne 1e0f9 <_sk_store_8888_sse2+0x7b>
.byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
.byte 102,69,15,126,76,129,8 // movd %xmm9,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,206 // jmp 1db2a <_sk_store_8888_sse2+0x7b>
+ .byte 235,206 // jmp 1e0f9 <_sk_store_8888_sse2+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,198 // jmp 1db2a <_sk_store_8888_sse2+0x7b>
+ .byte 235,198 // jmp 1e0f9 <_sk_store_8888_sse2+0x7b>
HIDDEN _sk_load_bgra_sse2
.globl _sk_load_bgra_sse2
@@ -46052,13 +46582,13 @@ _sk_load_bgra_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1dbe2 <_sk_load_bgra_sse2+0x7e>
+ .byte 117,98 // jne 1e1b1 <_sk_load_bgra_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,5,242,220,0,0 // movdqa 0xdcf2(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,5,35,221,0,0 // movdqa 0xdd23(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,46,222,0,0 // movaps 0xde2e(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,95,222,0,0 // movaps 0xde5f(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -46078,18 +46608,18 @@ _sk_load_bgra_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 1dc18 <_sk_load_bgra_sse2+0xb4>
+ .byte 116,41 // je 1e1e7 <_sk_load_bgra_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1dc0d <_sk_load_bgra_sse2+0xa9>
+ .byte 116,19 // je 1e1dc <_sk_load_bgra_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 1db86 <_sk_load_bgra_sse2+0x22>
+ .byte 117,134 // jne 1e155 <_sk_load_bgra_sse2+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1db86 <_sk_load_bgra_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1e155 <_sk_load_bgra_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1db86 <_sk_load_bgra_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1e155 <_sk_load_bgra_sse2+0x22>
HIDDEN _sk_load_bgra_dst_sse2
.globl _sk_load_bgra_dst_sse2
@@ -46103,13 +46633,13 @@ _sk_load_bgra_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1dca1 <_sk_load_bgra_dst_sse2+0x7e>
+ .byte 117,98 // jne 1e270 <_sk_load_bgra_dst_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,37,51,220,0,0 // movdqa 0xdc33(%rip),%xmm4 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,37,100,220,0,0 // movdqa 0xdc64(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,245 // cvtdq2ps %xmm5,%xmm6
- .byte 68,15,40,5,111,221,0,0 // movaps 0xdd6f(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,160,221,0,0 // movaps 0xdda0(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -46129,18 +46659,18 @@ _sk_load_bgra_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 1dcd7 <_sk_load_bgra_dst_sse2+0xb4>
+ .byte 116,41 // je 1e2a6 <_sk_load_bgra_dst_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1dccc <_sk_load_bgra_dst_sse2+0xa9>
+ .byte 116,19 // je 1e29b <_sk_load_bgra_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 1dc45 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 117,134 // jne 1e214 <_sk_load_bgra_dst_sse2+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1dc45 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1e214 <_sk_load_bgra_dst_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1dc45 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1e214 <_sk_load_bgra_dst_sse2+0x22>
HIDDEN _sk_gather_bgra_sse2
.globl _sk_gather_bgra_sse2
@@ -46174,11 +46704,11 @@ _sk_gather_bgra_sse2:
.byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,5,28,219,0,0 // movdqa 0xdb1c(%rip),%xmm0 # 2b880 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 102,15,111,5,77,219,0,0 // movdqa 0xdb4d(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,88,220,0,0 // movaps 0xdc58(%rip),%xmm8 # 2b9d0 <_sk_overlay_sse2_8bit+0x100f>
+ .byte 68,15,40,5,137,220,0,0 // movaps 0xdc89(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -46208,7 +46738,7 @@ _sk_store_bgra_sse2:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,216,218,0,0 // movaps 0xdad8(%rip),%xmm8 # 2b8b0 <_sk_overlay_sse2_8bit+0xeef>
+ .byte 68,15,40,5,9,219,0,0 // movaps 0xdb09(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -46227,24 +46757,24 @@ _sk_store_bgra_sse2:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 1de38 <_sk_store_bgra_sse2+0x7f>
+ .byte 117,10 // jne 1e407 <_sk_store_bgra_sse2+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,33 // je 1de66 <_sk_store_bgra_sse2+0xad>
+ .byte 116,33 // je 1e435 <_sk_store_bgra_sse2+0xad>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1de5e <_sk_store_bgra_sse2+0xa5>
+ .byte 116,19 // je 1e42d <_sk_store_bgra_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 1de34 <_sk_store_bgra_sse2+0x7b>
+ .byte 117,227 // jne 1e403 <_sk_store_bgra_sse2+0x7b>
.byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
.byte 102,69,15,126,76,129,8 // movd %xmm9,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,206 // jmp 1de34 <_sk_store_bgra_sse2+0x7b>
+ .byte 235,206 // jmp 1e403 <_sk_store_bgra_sse2+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,198 // jmp 1de34 <_sk_store_bgra_sse2+0x7b>
+ .byte 235,198 // jmp 1e403 <_sk_store_bgra_sse2+0x7b>
HIDDEN _sk_load_f16_sse2
.globl _sk_load_f16_sse2
@@ -46258,7 +46788,7 @@ _sk_load_f16_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,98,1,0,0 // jne 1dff0 <_sk_load_f16_sse2+0x182>
+ .byte 15,133,98,1,0,0 // jne 1e5bf <_sk_load_f16_sse2+0x182>
.byte 102,65,15,16,4,193 // movupd (%r9,%rax,8),%xmm0
.byte 102,65,15,16,76,193,16 // movupd 0x10(%r9,%rax,8),%xmm1
.byte 102,68,15,40,192 // movapd %xmm0,%xmm8
@@ -46270,7 +46800,7 @@ _sk_load_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,208,221,0,0 // movdqa 0xddd0(%rip),%xmm9 # 2bca0 <_sk_overlay_sse2_8bit+0x12df>
+ .byte 102,68,15,111,13,1,222,0,0 // movdqa 0xde01(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -46278,11 +46808,11 @@ _sk_load_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,197,221,0,0 // movdqa 0xddc5(%rip),%xmm11 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff>
+ .byte 102,68,15,111,29,246,221,0,0 // movdqa 0xddf6(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,199,221,0,0 // movdqa 0xddc7(%rip),%xmm12 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
+ .byte 102,68,15,111,37,248,221,0,0 // movdqa 0xddf8(%rip),%xmm12 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,106,223,0,0 // movdqa 0xdf6a(%rip),%xmm3 # 2be80 <_sk_overlay_sse2_8bit+0x14bf>
+ .byte 102,15,111,29,155,223,0,0 // movdqa 0xdf9b(%rip),%xmm3 # 2c480 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -46330,17 +46860,17 @@ _sk_load_f16_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,193 // movsd (%r9,%rax,8),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 1e00d <_sk_load_f16_sse2+0x19f>
+ .byte 117,17 // jne 1e5dc <_sk_load_f16_sse2+0x19f>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,142,254,255,255 // jmpq 1de9b <_sk_load_f16_sse2+0x2d>
+ .byte 233,142,254,255,255 // jmpq 1e46a <_sk_load_f16_sse2+0x2d>
.byte 102,65,15,22,68,193,8 // movhpd 0x8(%r9,%rax,8),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,121,254,255,255 // jb 1de9b <_sk_load_f16_sse2+0x2d>
+ .byte 15,130,121,254,255,255 // jb 1e46a <_sk_load_f16_sse2+0x2d>
.byte 242,65,15,16,76,193,16 // movsd 0x10(%r9,%rax,8),%xmm1
- .byte 233,109,254,255,255 // jmpq 1de9b <_sk_load_f16_sse2+0x2d>
+ .byte 233,109,254,255,255 // jmpq 1e46a <_sk_load_f16_sse2+0x2d>
HIDDEN _sk_load_f16_dst_sse2
.globl _sk_load_f16_dst_sse2
@@ -46354,7 +46884,7 @@ _sk_load_f16_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,98,1,0,0 // jne 1e1b0 <_sk_load_f16_dst_sse2+0x182>
+ .byte 15,133,98,1,0,0 // jne 1e77f <_sk_load_f16_dst_sse2+0x182>
.byte 102,65,15,16,36,193 // movupd (%r9,%rax,8),%xmm4
.byte 102,65,15,16,108,193,16 // movupd 0x10(%r9,%rax,8),%xmm5
.byte 102,68,15,40,196 // movapd %xmm4,%xmm8
@@ -46366,7 +46896,7 @@ _sk_load_f16_dst_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,238 // movdqa %xmm14,%xmm5
.byte 102,65,15,97,234 // punpcklwd %xmm10,%xmm5
- .byte 102,68,15,111,13,16,220,0,0 // movdqa 0xdc10(%rip),%xmm9 # 2bca0 <_sk_overlay_sse2_8bit+0x12df>
+ .byte 102,68,15,111,13,65,220,0,0 // movdqa 0xdc41(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,65,15,219,225 // pand %xmm9,%xmm4
.byte 102,15,239,236 // pxor %xmm4,%xmm5
@@ -46374,11 +46904,11 @@ _sk_load_f16_dst_sse2:
.byte 102,68,15,111,237 // movdqa %xmm5,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,236 // por %xmm4,%xmm13
- .byte 102,68,15,111,29,5,220,0,0 // movdqa 0xdc05(%rip),%xmm11 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff>
+ .byte 102,68,15,111,29,54,220,0,0 // movdqa 0xdc36(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,7,220,0,0 // movdqa 0xdc07(%rip),%xmm12 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
+ .byte 102,68,15,111,37,56,220,0,0 // movdqa 0xdc38(%rip),%xmm12 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,65,15,239,236 // pxor %xmm12,%xmm5
- .byte 102,15,111,61,170,221,0,0 // movdqa 0xddaa(%rip),%xmm7 # 2be80 <_sk_overlay_sse2_8bit+0x14bf>
+ .byte 102,15,111,61,219,221,0,0 // movdqa 0xdddb(%rip),%xmm7 # 2c480 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,102,229 // pcmpgtd %xmm5,%xmm4
.byte 102,65,15,223,229 // pandn %xmm13,%xmm4
@@ -46426,17 +46956,17 @@ _sk_load_f16_dst_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,36,193 // movsd (%r9,%rax,8),%xmm4
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 1e1cd <_sk_load_f16_dst_sse2+0x19f>
+ .byte 117,17 // jne 1e79c <_sk_load_f16_dst_sse2+0x19f>
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
.byte 102,15,20,229 // unpcklpd %xmm5,%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
- .byte 233,142,254,255,255 // jmpq 1e05b <_sk_load_f16_dst_sse2+0x2d>
+ .byte 233,142,254,255,255 // jmpq 1e62a <_sk_load_f16_dst_sse2+0x2d>
.byte 102,65,15,22,100,193,8 // movhpd 0x8(%r9,%rax,8),%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,121,254,255,255 // jb 1e05b <_sk_load_f16_dst_sse2+0x2d>
+ .byte 15,130,121,254,255,255 // jb 1e62a <_sk_load_f16_dst_sse2+0x2d>
.byte 242,65,15,16,108,193,16 // movsd 0x10(%r9,%rax,8),%xmm5
- .byte 233,109,254,255,255 // jmpq 1e05b <_sk_load_f16_dst_sse2+0x2d>
+ .byte 233,109,254,255,255 // jmpq 1e62a <_sk_load_f16_dst_sse2+0x2d>
HIDDEN _sk_gather_f16_sse2
.globl _sk_gather_f16_sse2
@@ -46478,7 +47008,7 @@ _sk_gather_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,9,218,0,0 // movdqa 0xda09(%rip),%xmm9 # 2bca0 <_sk_overlay_sse2_8bit+0x12df>
+ .byte 102,68,15,111,13,58,218,0,0 // movdqa 0xda3a(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -46486,11 +47016,11 @@ _sk_gather_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,254,217,0,0 // movdqa 0xd9fe(%rip),%xmm11 # 2bcc0 <_sk_overlay_sse2_8bit+0x12ff>
+ .byte 102,68,15,111,29,47,218,0,0 // movdqa 0xda2f(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,0,218,0,0 // movdqa 0xda00(%rip),%xmm12 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
+ .byte 102,68,15,111,37,49,218,0,0 // movdqa 0xda31(%rip),%xmm12 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,163,219,0,0 // movdqa 0xdba3(%rip),%xmm3 # 2be80 <_sk_overlay_sse2_8bit+0x14bf>
+ .byte 102,15,111,29,212,219,0,0 // movdqa 0xdbd4(%rip),%xmm3 # 2c480 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -46549,17 +47079,17 @@ _sk_store_f16_sse2:
.byte 73,193,225,3 // shl $0x3,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,248,216,0,0 // movdqa 0xd8f8(%rip),%xmm10 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
+ .byte 102,68,15,111,21,41,217,0,0 // movdqa 0xd929(%rip),%xmm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,68,15,111,224 // movdqa %xmm0,%xmm12
.byte 102,69,15,219,226 // pand %xmm10,%xmm12
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,236 // pxor %xmm12,%xmm13
- .byte 102,68,15,111,13,235,216,0,0 // movdqa 0xd8eb(%rip),%xmm9 # 2bce0 <_sk_overlay_sse2_8bit+0x131f>
+ .byte 102,68,15,111,13,28,217,0,0 // movdqa 0xd91c(%rip),%xmm9 # 2c2e0 <_sk_overlay_sse2_8bit+0x132b>
.byte 102,65,15,114,212,16 // psrld $0x10,%xmm12
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,29,220,216,0,0 // movdqa 0xd8dc(%rip),%xmm11 # 2bcf0 <_sk_overlay_sse2_8bit+0x132f>
+ .byte 102,68,15,111,29,13,217,0,0 // movdqa 0xd90d(%rip),%xmm11 # 2c2f0 <_sk_overlay_sse2_8bit+0x133b>
.byte 102,69,15,235,227 // por %xmm11,%xmm12
.byte 102,69,15,254,229 // paddd %xmm13,%xmm12
.byte 102,65,15,114,244,16 // pslld $0x10,%xmm12
@@ -46611,7 +47141,7 @@ _sk_store_f16_sse2:
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,69,15,98,204 // punpckldq %xmm12,%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 1e536 <_sk_store_f16_sse2+0x17e>
+ .byte 117,21 // jne 1eb05 <_sk_store_f16_sse2+0x17e>
.byte 69,15,17,12,193 // movups %xmm9,(%r9,%rax,8)
.byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8
.byte 243,69,15,127,68,193,16 // movdqu %xmm8,0x10(%r9,%rax,8)
@@ -46619,13 +47149,13 @@ _sk_store_f16_sse2:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,12,193 // movq %xmm9,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 1e532 <_sk_store_f16_sse2+0x17a>
+ .byte 116,240 // je 1eb01 <_sk_store_f16_sse2+0x17a>
.byte 102,69,15,23,76,193,8 // movhpd %xmm9,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 1e532 <_sk_store_f16_sse2+0x17a>
+ .byte 114,227 // jb 1eb01 <_sk_store_f16_sse2+0x17a>
.byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8
.byte 102,69,15,214,68,193,16 // movq %xmm8,0x10(%r9,%rax,8)
- .byte 235,213 // jmp 1e532 <_sk_store_f16_sse2+0x17a>
+ .byte 235,213 // jmp 1eb01 <_sk_store_f16_sse2+0x17a>
HIDDEN _sk_load_u16_be_sse2
.globl _sk_load_u16_be_sse2
@@ -46640,7 +47170,7 @@ _sk_load_u16_be_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,190,0,0,0 // jne 1e642 <_sk_load_u16_be_sse2+0xe5>
+ .byte 15,133,190,0,0,0 // jne 1ec11 <_sk_load_u16_be_sse2+0xe5>
.byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0
.byte 102,65,15,16,76,65,16 // movupd 0x10(%r9,%rax,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -46657,7 +47187,7 @@ _sk_load_u16_be_sse2:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,5,139,212,0,0 // movaps 0xd48b(%rip),%xmm8 # 2ba60 <_sk_overlay_sse2_8bit+0x109f>
+ .byte 68,15,40,5,188,212,0,0 // movaps 0xd4bc(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -46685,17 +47215,17 @@ _sk_load_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 1e65f <_sk_load_u16_be_sse2+0x102>
+ .byte 117,17 // jne 1ec2e <_sk_load_u16_be_sse2+0x102>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,50,255,255,255 // jmpq 1e591 <_sk_load_u16_be_sse2+0x34>
+ .byte 233,50,255,255,255 // jmpq 1eb60 <_sk_load_u16_be_sse2+0x34>
.byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,29,255,255,255 // jb 1e591 <_sk_load_u16_be_sse2+0x34>
+ .byte 15,130,29,255,255,255 // jb 1eb60 <_sk_load_u16_be_sse2+0x34>
.byte 242,65,15,16,76,65,16 // movsd 0x10(%r9,%rax,2),%xmm1
- .byte 233,17,255,255,255 // jmpq 1e591 <_sk_load_u16_be_sse2+0x34>
+ .byte 233,17,255,255,255 // jmpq 1eb60 <_sk_load_u16_be_sse2+0x34>
HIDDEN _sk_load_rgb_u16_be_sse2
.globl _sk_load_rgb_u16_be_sse2
@@ -46712,7 +47242,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,175,0,0,0 // jne 1e75a <_sk_load_rgb_u16_be_sse2+0xda>
+ .byte 15,133,175,0,0,0 // jne 1ed29 <_sk_load_rgb_u16_be_sse2+0xda>
.byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2
.byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -46733,7 +47263,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,65,15,97,200 // punpcklwd %xmm8,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,13,81,211,0,0 // movaps 0xd351(%rip),%xmm9 # 2ba60 <_sk_overlay_sse2_8bit+0x109f>
+ .byte 68,15,40,13,130,211,0,0 // movaps 0xd382(%rip),%xmm9 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -46750,27 +47280,27 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,120,208,0,0 // movaps 0xd078(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,169,208,0,0 // movaps 0xd0a9(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2
.byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 1e77f <_sk_load_rgb_u16_be_sse2+0xff>
+ .byte 117,13 // jne 1ed4e <_sk_load_rgb_u16_be_sse2+0xff>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,80,255,255,255 // jmpq 1e6cf <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,80,255,255,255 // jmpq 1ec9e <_sk_load_rgb_u16_be_sse2+0x4f>
.byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0
.byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 1e7b0 <_sk_load_rgb_u16_be_sse2+0x130>
+ .byte 114,24 // jb 1ed7f <_sk_load_rgb_u16_be_sse2+0x130>
.byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3
.byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,31,255,255,255 // jmpq 1e6cf <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,31,255,255,255 // jmpq 1ec9e <_sk_load_rgb_u16_be_sse2+0x4f>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,22,255,255,255 // jmpq 1e6cf <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,22,255,255,255 // jmpq 1ec9e <_sk_load_rgb_u16_be_sse2+0x4f>
HIDDEN _sk_store_u16_be_sse2
.globl _sk_store_u16_be_sse2
@@ -46784,7 +47314,7 @@ _sk_store_u16_be_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 68,15,40,21,33,213,0,0 // movaps 0xd521(%rip),%xmm10 # 2bd00 <_sk_overlay_sse2_8bit+0x133f>
+ .byte 68,15,40,21,82,213,0,0 // movaps 0xd552(%rip),%xmm10 # 2c300 <_sk_overlay_sse2_8bit+0x134b>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -46829,7 +47359,7 @@ _sk_store_u16_be_sse2:
.byte 102,69,15,111,208 // movdqa %xmm8,%xmm10
.byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 1e8d9 <_sk_store_u16_be_sse2+0x120>
+ .byte 117,21 // jne 1eea8 <_sk_store_u16_be_sse2+0x120>
.byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2)
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2)
@@ -46837,13 +47367,13 @@ _sk_store_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 1e8d5 <_sk_store_u16_be_sse2+0x11c>
+ .byte 116,240 // je 1eea4 <_sk_store_u16_be_sse2+0x11c>
.byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 1e8d5 <_sk_store_u16_be_sse2+0x11c>
+ .byte 114,227 // jb 1eea4 <_sk_store_u16_be_sse2+0x11c>
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2)
- .byte 235,213 // jmp 1e8d5 <_sk_store_u16_be_sse2+0x11c>
+ .byte 235,213 // jmp 1eea4 <_sk_store_u16_be_sse2+0x11c>
HIDDEN _sk_load_f32_sse2
.globl _sk_load_f32_sse2
@@ -46859,7 +47389,7 @@ _sk_load_f32_sse2:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 1e96b <_sk_load_f32_sse2+0x6b>
+ .byte 117,66 // jne 1ef3a <_sk_load_f32_sse2+0x6b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -46879,17 +47409,17 @@ _sk_load_f32_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 1e97d <_sk_load_f32_sse2+0x7d>
+ .byte 117,8 // jne 1ef4c <_sk_load_f32_sse2+0x7d>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 235,190 // jmp 1e93b <_sk_load_f32_sse2+0x3b>
+ .byte 235,190 // jmp 1ef0a <_sk_load_f32_sse2+0x3b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 1e991 <_sk_load_f32_sse2+0x91>
+ .byte 114,8 // jb 1ef60 <_sk_load_f32_sse2+0x91>
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
- .byte 235,170 // jmp 1e93b <_sk_load_f32_sse2+0x3b>
+ .byte 235,170 // jmp 1ef0a <_sk_load_f32_sse2+0x3b>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,165 // jmp 1e93b <_sk_load_f32_sse2+0x3b>
+ .byte 235,165 // jmp 1ef0a <_sk_load_f32_sse2+0x3b>
HIDDEN _sk_load_f32_dst_sse2
.globl _sk_load_f32_dst_sse2
@@ -46905,7 +47435,7 @@ _sk_load_f32_dst_sse2:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 1ea01 <_sk_load_f32_dst_sse2+0x6b>
+ .byte 117,66 // jne 1efd0 <_sk_load_f32_dst_sse2+0x6b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -46925,17 +47455,17 @@ _sk_load_f32_dst_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 1ea13 <_sk_load_f32_dst_sse2+0x7d>
+ .byte 117,8 // jne 1efe2 <_sk_load_f32_dst_sse2+0x7d>
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 235,190 // jmp 1e9d1 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,190 // jmp 1efa0 <_sk_load_f32_dst_sse2+0x3b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 1ea27 <_sk_load_f32_dst_sse2+0x91>
+ .byte 114,8 // jb 1eff6 <_sk_load_f32_dst_sse2+0x91>
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
- .byte 235,170 // jmp 1e9d1 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,170 // jmp 1efa0 <_sk_load_f32_dst_sse2+0x3b>
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,165 // jmp 1e9d1 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,165 // jmp 1efa0 <_sk_load_f32_dst_sse2+0x3b>
HIDDEN _sk_store_f32_sse2
.globl _sk_store_f32_sse2
@@ -46964,7 +47494,7 @@ _sk_store_f32_sse2:
.byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9
.byte 102,69,15,17,36,129 // movupd %xmm12,(%r9,%rax,4)
.byte 77,133,192 // test %r8,%r8
- .byte 117,29 // jne 1eaa9 <_sk_store_f32_sse2+0x7d>
+ .byte 117,29 // jne 1f078 <_sk_store_f32_sse2+0x7d>
.byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
@@ -46972,12 +47502,12 @@ _sk_store_f32_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,246 // je 1eaa5 <_sk_store_f32_sse2+0x79>
+ .byte 116,246 // je 1f074 <_sk_store_f32_sse2+0x79>
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,234 // jb 1eaa5 <_sk_store_f32_sse2+0x79>
+ .byte 114,234 // jb 1f074 <_sk_store_f32_sse2+0x79>
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
- .byte 235,225 // jmp 1eaa5 <_sk_store_f32_sse2+0x79>
+ .byte 235,225 // jmp 1f074 <_sk_store_f32_sse2+0x79>
HIDDEN _sk_clamp_x_sse2
.globl _sk_clamp_x_sse2
@@ -47023,7 +47553,7 @@ _sk_repeat_x_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,142,204,0,0 // andps 0xcc8e(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,84,21,191,204,0,0 // andps 0xccbf(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -47049,7 +47579,7 @@ _sk_repeat_y_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,52,204,0,0 // andps 0xcc34(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,84,21,101,204,0,0 // andps 0xcc65(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -47075,13 +47605,13 @@ _sk_mirror_x_sse2:
.byte 65,15,92,193 // subps %xmm9,%xmm0
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,9,194,0,0 // mulss 0xc209(%rip),%xmm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 243,68,15,89,29,46,194,0,0 // mulss 0xc22e(%rip),%xmm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,186,203,0,0 // andps 0xcbba(%rip),%xmm11 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,84,29,235,203,0,0 // andps 0xcbeb(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -47110,13 +47640,13 @@ _sk_mirror_y_sse2:
.byte 65,15,92,201 // subps %xmm9,%xmm1
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,132,193,0,0 // mulss 0xc184(%rip),%xmm11 # 2ae00 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 243,68,15,89,29,169,193,0,0 // mulss 0xc1a9(%rip),%xmm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,53,203,0,0 // andps 0xcb35(%rip),%xmm11 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,84,29,102,203,0,0 // andps 0xcb66(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -47139,7 +47669,7 @@ FUNCTION(_sk_clamp_x_1_sse2)
_sk_clamp_x_1_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,236,202,0,0 // minps 0xcaec(%rip),%xmm8 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,93,5,29,203,0,0 // minps 0xcb1d(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -47152,7 +47682,7 @@ _sk_repeat_x_1_sse2:
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,84,13,202,202,0,0 // andps 0xcaca(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,84,13,251,202,0,0 // andps 0xcafb(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47162,14 +47692,14 @@ HIDDEN _sk_mirror_x_1_sse2
.globl _sk_mirror_x_1_sse2
FUNCTION(_sk_mirror_x_1_sse2)
_sk_mirror_x_1_sse2:
- .byte 68,15,40,5,22,203,0,0 // movaps 0xcb16(%rip),%xmm8 # 2b830 <_sk_overlay_sse2_8bit+0xe6f>
+ .byte 68,15,40,5,71,203,0,0 // movaps 0xcb47(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0xe7b>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,154,202,0,0 // movaps 0xca9a(%rip),%xmm9 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,13,203,202,0,0 // movaps 0xcacb(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,84,13,144,202,0,0 // andps 0xca90(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,84,13,193,202,0,0 // andps 0xcac1(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,88,210 // addps %xmm10,%xmm10
@@ -47185,10 +47715,10 @@ HIDDEN _sk_luminance_to_alpha_sse2
FUNCTION(_sk_luminance_to_alpha_sse2)
_sk_luminance_to_alpha_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,166,207,0,0 // mulps 0xcfa6(%rip),%xmm0 # 2bd10 <_sk_overlay_sse2_8bit+0x134f>
- .byte 15,89,13,175,207,0,0 // mulps 0xcfaf(%rip),%xmm1 # 2bd20 <_sk_overlay_sse2_8bit+0x135f>
+ .byte 15,89,5,215,207,0,0 // mulps 0xcfd7(%rip),%xmm0 # 2c310 <_sk_overlay_sse2_8bit+0x135b>
+ .byte 15,89,13,224,207,0,0 // mulps 0xcfe0(%rip),%xmm1 # 2c320 <_sk_overlay_sse2_8bit+0x136b>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,181,207,0,0 // mulps 0xcfb5(%rip),%xmm3 # 2bd30 <_sk_overlay_sse2_8bit+0x136f>
+ .byte 15,89,29,230,207,0,0 // mulps 0xcfe6(%rip),%xmm3 # 2c330 <_sk_overlay_sse2_8bit+0x137b>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -47500,9 +48030,9 @@ _sk_evenly_spaced_gradient_sse2:
.byte 72,139,24 // mov (%rax),%rbx
.byte 76,139,112,8 // mov 0x8(%rax),%r14
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 1f21b <_sk_evenly_spaced_gradient_sse2+0x18>
+ .byte 120,7 // js 1f7ea <_sk_evenly_spaced_gradient_sse2+0x18>
.byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1
- .byte 235,21 // jmp 1f230 <_sk_evenly_spaced_gradient_sse2+0x2d>
+ .byte 235,21 // jmp 1f7ff <_sk_evenly_spaced_gradient_sse2+0x2d>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -47600,15 +48130,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse2
.globl _sk_gauss_a_to_rgba_sse2
FUNCTION(_sk_gauss_a_to_rgba_sse2)
_sk_gauss_a_to_rgba_sse2:
- .byte 15,40,5,132,201,0,0 // movaps 0xc984(%rip),%xmm0 # 2bd40 <_sk_overlay_sse2_8bit+0x137f>
+ .byte 15,40,5,181,201,0,0 // movaps 0xc9b5(%rip),%xmm0 # 2c340 <_sk_overlay_sse2_8bit+0x138b>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,138,201,0,0 // addps 0xc98a(%rip),%xmm0 # 2bd50 <_sk_overlay_sse2_8bit+0x138f>
+ .byte 15,88,5,187,201,0,0 // addps 0xc9bb(%rip),%xmm0 # 2c350 <_sk_overlay_sse2_8bit+0x139b>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,144,201,0,0 // addps 0xc990(%rip),%xmm0 # 2bd60 <_sk_overlay_sse2_8bit+0x139f>
+ .byte 15,88,5,193,201,0,0 // addps 0xc9c1(%rip),%xmm0 # 2c360 <_sk_overlay_sse2_8bit+0x13ab>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,150,201,0,0 // addps 0xc996(%rip),%xmm0 # 2bd70 <_sk_overlay_sse2_8bit+0x13af>
+ .byte 15,88,5,199,201,0,0 // addps 0xc9c7(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0x13bb>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,156,201,0,0 // addps 0xc99c(%rip),%xmm0 # 2bd80 <_sk_overlay_sse2_8bit+0x13bf>
+ .byte 15,88,5,205,201,0,0 // addps 0xc9cd(%rip),%xmm0 # 2c380 <_sk_overlay_sse2_8bit+0x13cb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -47626,12 +48156,12 @@ _sk_gradient_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,50 // jb 1f437 <_sk_gradient_sse2+0x46>
+ .byte 114,50 // jb 1fa06 <_sk_gradient_sse2+0x46>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,197,195,0,0 // movaps 0xc3c5(%rip),%xmm2 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 15,40,21,246,195,0,0 // movaps 0xc3f6(%rip),%xmm2 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 243,15,16,27 // movss (%rbx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -47639,7 +48169,7 @@ _sk_gradient_sse2:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,228 // jne 1f41b <_sk_gradient_sse2+0x2a>
+ .byte 117,228 // jne 1f9ea <_sk_gradient_sse2+0x2a>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,211 // movq %xmm2,%r11
.byte 69,137,217 // mov %r11d,%r9d
@@ -47778,29 +48308,29 @@ _sk_xy_to_unit_angle_sse2:
.byte 69,15,94,220 // divps %xmm12,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
- .byte 68,15,40,45,38,199,0,0 // movaps 0xc726(%rip),%xmm13 # 2bd90 <_sk_overlay_sse2_8bit+0x13cf>
+ .byte 68,15,40,45,87,199,0,0 // movaps 0xc757(%rip),%xmm13 # 2c390 <_sk_overlay_sse2_8bit+0x13db>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,42,199,0,0 // addps 0xc72a(%rip),%xmm13 # 2bda0 <_sk_overlay_sse2_8bit+0x13df>
+ .byte 68,15,88,45,91,199,0,0 // addps 0xc75b(%rip),%xmm13 # 2c3a0 <_sk_overlay_sse2_8bit+0x13eb>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,46,199,0,0 // addps 0xc72e(%rip),%xmm13 # 2bdb0 <_sk_overlay_sse2_8bit+0x13ef>
+ .byte 68,15,88,45,95,199,0,0 // addps 0xc75f(%rip),%xmm13 # 2c3b0 <_sk_overlay_sse2_8bit+0x13fb>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,50,199,0,0 // addps 0xc732(%rip),%xmm13 # 2bdc0 <_sk_overlay_sse2_8bit+0x13ff>
+ .byte 68,15,88,45,99,199,0,0 // addps 0xc763(%rip),%xmm13 # 2c3c0 <_sk_overlay_sse2_8bit+0x140b>
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,40,21,49,199,0,0 // movaps 0xc731(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0x140f>
+ .byte 68,15,40,21,98,199,0,0 // movaps 0xc762(%rip),%xmm10 # 2c3d0 <_sk_overlay_sse2_8bit+0x141b>
.byte 69,15,92,213 // subps %xmm13,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,205 // andnps %xmm13,%xmm9
.byte 69,15,86,202 // orps %xmm10,%xmm9
.byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8
- .byte 68,15,40,21,4,193,0,0 // movaps 0xc104(%rip),%xmm10 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,21,53,193,0,0 // movaps 0xc135(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,84,208 // andps %xmm8,%xmm10
.byte 69,15,85,193 // andnps %xmm9,%xmm8
.byte 69,15,86,194 // orps %xmm10,%xmm8
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9
- .byte 68,15,40,21,243,192,0,0 // movaps 0xc0f3(%rip),%xmm10 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,21,36,193,0,0 // movaps 0xc124(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,208 // subps %xmm8,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,200 // andnps %xmm8,%xmm9
@@ -47835,7 +48365,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,154,198,0,0 // mulps 0xc69a(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f>
+ .byte 68,15,89,13,203,198,0,0 // mulps 0xc6cb(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -47843,7 +48373,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,133,198,0,0 // mulps 0xc685(%rip),%xmm10 # 2bdf0 <_sk_overlay_sse2_8bit+0x142f>
+ .byte 68,15,89,21,182,198,0,0 // mulps 0xc6b6(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -47852,8 +48382,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,61,197,0,0 // xorps 0xc53d(%rip),%xmm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
- .byte 68,15,89,5,37,192,0,0 // mulps 0xc025(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,87,13,110,197,0,0 // xorps 0xc56e(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 68,15,89,5,86,192,0,0 // mulps 0xc056(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -47874,7 +48404,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,252,197,0,0 // mulps 0xc5fc(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f>
+ .byte 68,15,89,13,45,198,0,0 // mulps 0xc62d(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -47882,7 +48412,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,231,197,0,0 // mulps 0xc5e7(%rip),%xmm10 # 2bdf0 <_sk_overlay_sse2_8bit+0x142f>
+ .byte 68,15,89,21,24,198,0,0 // mulps 0xc618(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -47891,8 +48421,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,159,196,0,0 // xorps 0xc49f(%rip),%xmm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
- .byte 68,15,89,5,135,191,0,0 // mulps 0xbf87(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,87,13,208,196,0,0 // xorps 0xc4d0(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 68,15,89,5,184,191,0,0 // mulps 0xbfb8(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -47910,7 +48440,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,111,197,0,0 // mulps 0xc56f(%rip),%xmm9 # 2bde0 <_sk_overlay_sse2_8bit+0x141f>
+ .byte 68,15,89,13,160,197,0,0 // mulps 0xc5a0(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -47918,7 +48448,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,59,196,0,0 // xorps 0xc43b(%rip),%xmm0 # 2bcd0 <_sk_overlay_sse2_8bit+0x130f>
+ .byte 15,87,5,108,196,0,0 // xorps 0xc46c(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -47961,7 +48491,7 @@ HIDDEN _sk_save_xy_sse2
FUNCTION(_sk_save_xy_sse2)
_sk_save_xy_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,193,190,0,0 // movaps 0xbec1(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,5,242,190,0,0 // movaps 0xbef2(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -47969,7 +48499,7 @@ _sk_save_xy_sse2:
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,40,217 // movaps %xmm9,%xmm11
.byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11
- .byte 68,15,40,37,172,190,0,0 // movaps 0xbeac(%rip),%xmm12 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 68,15,40,37,221,190,0,0 // movaps 0xbedd(%rip),%xmm12 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,84,220 // andps %xmm12,%xmm11
.byte 69,15,92,211 // subps %xmm11,%xmm10
.byte 69,15,92,202 // subps %xmm10,%xmm9
@@ -48016,8 +48546,8 @@ _sk_bilinear_nx_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,69,196,0,0 // addps 0xc445(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,13,190,0,0 // movaps 0xbe0d(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,5,118,196,0,0 // addps 0xc476(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,62,190,0,0 // movaps 0xbe3e(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48030,7 +48560,7 @@ _sk_bilinear_px_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,220,189,0,0 // addps 0xbddc(%rip),%xmm0 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,88,5,13,190,0,0 // addps 0xbe0d(%rip),%xmm0 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -48042,8 +48572,8 @@ _sk_bilinear_ny_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,254,195,0,0 // addps 0xc3fe(%rip),%xmm1 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,198,189,0,0 // movaps 0xbdc6(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,13,47,196,0,0 // addps 0xc42f(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,247,189,0,0 // movaps 0xbdf7(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48056,7 +48586,7 @@ _sk_bilinear_py_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,148,189,0,0 // addps 0xbd94(%rip),%xmm1 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 15,88,13,197,189,0,0 // addps 0xbdc5(%rip),%xmm1 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -48068,13 +48598,13 @@ _sk_bicubic_n3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,199,195,0,0 // addps 0xc3c7(%rip),%xmm0 # 2be10 <_sk_overlay_sse2_8bit+0x144f>
- .byte 68,15,40,13,127,189,0,0 // movaps 0xbd7f(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,5,248,195,0,0 // addps 0xc3f8(%rip),%xmm0 # 2c410 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,176,189,0,0 // movaps 0xbdb0(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,187,195,0,0 // mulps 0xc3bb(%rip),%xmm9 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,13,83,191,0,0 // addps 0xbf53(%rip),%xmm9 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,13,236,195,0,0 // mulps 0xc3ec(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,13,132,191,0,0 // addps 0xbf84(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48087,16 +48617,16 @@ _sk_bicubic_n1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,114,195,0,0 // addps 0xc372(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,58,189,0,0 // movaps 0xbd3a(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,5,163,195,0,0 // addps 0xc3a3(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,107,189,0,0 // movaps 0xbd6b(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,142,195,0,0 // movaps 0xc38e(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,5,191,195,0,0 // movaps 0xc3bf(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,146,195,0,0 // addps 0xc392(%rip),%xmm8 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,5,195,195,0,0 // addps 0xc3c3(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,6,189,0,0 // addps 0xbd06(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,88,5,55,189,0,0 // addps 0xbd37(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,138,195,0,0 // addps 0xc38a(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,5,187,195,0,0 // addps 0xc3bb(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -48106,17 +48636,17 @@ HIDDEN _sk_bicubic_p1x_sse2
FUNCTION(_sk_bicubic_p1x_sse2)
_sk_bicubic_p1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,228,188,0,0 // movaps 0xbce4(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,5,21,189,0,0 // movaps 0xbd15(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,64,195,0,0 // movaps 0xc340(%rip),%xmm10 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,21,113,195,0,0 // movaps 0xc371(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,68,195,0,0 // addps 0xc344(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,21,117,195,0,0 // addps 0xc375(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,64,195,0,0 // addps 0xc340(%rip),%xmm10 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,21,113,195,0,0 // addps 0xc371(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -48128,11 +48658,11 @@ _sk_bicubic_p3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,19,195,0,0 // addps 0xc313(%rip),%xmm0 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 15,88,5,68,195,0,0 // addps 0xc344(%rip),%xmm0 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,227,194,0,0 // mulps 0xc2e3(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,5,123,190,0,0 // addps 0xbe7b(%rip),%xmm8 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,5,20,195,0,0 // mulps 0xc314(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,5,172,190,0,0 // addps 0xbeac(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48145,13 +48675,13 @@ _sk_bicubic_n3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,169,194,0,0 // addps 0xc2a9(%rip),%xmm1 # 2be10 <_sk_overlay_sse2_8bit+0x144f>
- .byte 68,15,40,13,97,188,0,0 // movaps 0xbc61(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,13,218,194,0,0 // addps 0xc2da(%rip),%xmm1 # 2c410 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,146,188,0,0 // movaps 0xbc92(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,157,194,0,0 // mulps 0xc29d(%rip),%xmm9 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,13,53,190,0,0 // addps 0xbe35(%rip),%xmm9 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,13,206,194,0,0 // mulps 0xc2ce(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,13,102,190,0,0 // addps 0xbe66(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48164,16 +48694,16 @@ _sk_bicubic_n1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,83,194,0,0 // addps 0xc253(%rip),%xmm1 # 2be00 <_sk_overlay_sse2_8bit+0x143f>
- .byte 68,15,40,13,27,188,0,0 // movaps 0xbc1b(%rip),%xmm9 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,88,13,132,194,0,0 // addps 0xc284(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
+ .byte 68,15,40,13,76,188,0,0 // movaps 0xbc4c(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,111,194,0,0 // movaps 0xc26f(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,5,160,194,0,0 // movaps 0xc2a0(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,115,194,0,0 // addps 0xc273(%rip),%xmm8 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,5,164,194,0,0 // addps 0xc2a4(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,231,187,0,0 // addps 0xbbe7(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,88,5,24,188,0,0 // addps 0xbc18(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,107,194,0,0 // addps 0xc26b(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,5,156,194,0,0 // addps 0xc29c(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -48183,17 +48713,17 @@ HIDDEN _sk_bicubic_p1y_sse2
FUNCTION(_sk_bicubic_p1y_sse2)
_sk_bicubic_p1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,197,187,0,0 // movaps 0xbbc5(%rip),%xmm8 # 2b7c0 <_sk_overlay_sse2_8bit+0xdff>
+ .byte 68,15,40,5,246,187,0,0 // movaps 0xbbf6(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,32,194,0,0 // movaps 0xc220(%rip),%xmm10 # 2be30 <_sk_overlay_sse2_8bit+0x146f>
+ .byte 68,15,40,21,81,194,0,0 // movaps 0xc251(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,36,194,0,0 // addps 0xc224(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 68,15,88,21,85,194,0,0 // addps 0xc255(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,32,194,0,0 // addps 0xc220(%rip),%xmm10 # 2be50 <_sk_overlay_sse2_8bit+0x148f>
+ .byte 68,15,88,21,81,194,0,0 // addps 0xc251(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -48205,11 +48735,11 @@ _sk_bicubic_p3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,242,193,0,0 // addps 0xc1f2(%rip),%xmm1 # 2be40 <_sk_overlay_sse2_8bit+0x147f>
+ .byte 15,88,13,35,194,0,0 // addps 0xc223(%rip),%xmm1 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,194,193,0,0 // mulps 0xc1c2(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0x145f>
- .byte 68,15,88,5,90,189,0,0 // addps 0xbd5a(%rip),%xmm8 # 2b9c0 <_sk_overlay_sse2_8bit+0xfff>
+ .byte 68,15,89,5,243,193,0,0 // mulps 0xc1f3(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,88,5,139,189,0,0 // addps 0xbd8b(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48358,7 +48888,7 @@ _sk_clut_3D_sse2:
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,65,15,111,198 // movdqa %xmm14,%xmm0
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,45,244,191,0,0 // movdqa 0xbff4(%rip),%xmm5 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,45,37,192,0,0 // movdqa 0xc025(%rip),%xmm5 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
.byte 102,15,244,197 // pmuludq %xmm5,%xmm0
.byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
@@ -48381,7 +48911,7 @@ _sk_clut_3D_sse2:
.byte 15,20,241 // unpcklps %xmm1,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,248,184,0,0 // paddd 0xb8f8(%rip),%xmm1 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,254,13,41,185,0,0 // paddd 0xb929(%rip),%xmm1 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,112,233,78 // pshufd $0x4e,%xmm1,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
.byte 102,73,15,126,202 // movq %xmm1,%r10
@@ -48398,7 +48928,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,253 // unpcklps %xmm5,%xmm7
.byte 15,20,249 // unpcklps %xmm1,%xmm7
- .byte 102,15,254,5,206,184,0,0 // paddd 0xb8ce(%rip),%xmm0 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,5,255,184,0,0 // paddd 0xb8ff(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,73,15,126,201 // movq %xmm1,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -48415,7 +48945,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,20,200 // unpcklps %xmm0,%xmm1
- .byte 15,40,45,229,190,0,0 // movaps 0xbee5(%rip),%xmm5 # 2be60 <_sk_overlay_sse2_8bit+0x149f>
+ .byte 15,40,45,22,191,0,0 // movaps 0xbf16(%rip),%xmm5 # 2c460 <_sk_overlay_sse2_8bit+0x14ab>
.byte 15,88,229 // addps %xmm5,%xmm4
.byte 15,41,100,36,192 // movaps %xmm4,-0x40(%rsp)
.byte 68,15,88,213 // addps %xmm5,%xmm10
@@ -48430,7 +48960,7 @@ _sk_clut_3D_sse2:
.byte 102,15,127,68,36,160 // movdqa %xmm0,-0x60(%rsp)
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
- .byte 102,15,111,5,174,190,0,0 // movdqa 0xbeae(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,5,223,190,0,0 // movdqa 0xbedf(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,244,216 // pmuludq %xmm0,%xmm3
.byte 102,15,112,211,232 // pshufd $0xe8,%xmm3,%xmm2
.byte 102,15,244,224 // pmuludq %xmm0,%xmm4
@@ -48452,7 +48982,7 @@ _sk_clut_3D_sse2:
.byte 15,20,227 // unpcklps %xmm3,%xmm4
.byte 15,20,229 // unpcklps %xmm5,%xmm4
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
- .byte 102,15,254,29,183,183,0,0 // paddd 0xb7b7(%rip),%xmm3 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,254,29,232,183,0,0 // paddd 0xb7e8(%rip),%xmm3 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,112,235,78 // pshufd $0x4e,%xmm3,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
.byte 102,73,15,126,218 // movq %xmm3,%r10
@@ -48469,7 +48999,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,4,139 // movss (%rbx,%r9,4),%xmm0
.byte 15,20,216 // unpcklps %xmm0,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
- .byte 102,15,254,21,141,183,0,0 // paddd 0xb78d(%rip),%xmm2 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,21,190,183,0,0 // paddd 0xb7be(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
.byte 102,73,15,126,193 // movq %xmm0,%r9
.byte 102,73,15,126,210 // movq %xmm2,%r10
@@ -48531,7 +49061,7 @@ _sk_clut_3D_sse2:
.byte 68,15,20,193 // unpcklps %xmm1,%xmm8
.byte 68,15,20,199 // unpcklps %xmm7,%xmm8
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,68,15,111,21,88,182,0,0 // movdqa 0xb658(%rip),%xmm10 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,21,137,182,0,0 // movdqa 0xb689(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,112,249,78 // pshufd $0x4e,%xmm1,%xmm7
.byte 102,73,15,126,249 // movq %xmm7,%r9
@@ -48549,7 +49079,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,111,45,41,182,0,0 // movdqa 0xb629(%rip),%xmm5 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,111,45,90,182,0,0 // movdqa 0xb65a(%rip),%xmm5 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,254,197 // paddd %xmm5,%xmm0
.byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
@@ -48607,7 +49137,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 68,15,20,223 // unpcklps %xmm7,%xmm11
.byte 68,15,20,221 // unpcklps %xmm5,%xmm11
- .byte 102,15,111,45,36,181,0,0 // movdqa 0xb524(%rip),%xmm5 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,111,45,85,181,0,0 // movdqa 0xb555(%rip),%xmm5 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,254,245 // paddd %xmm5,%xmm6
.byte 102,15,111,253 // movdqa %xmm5,%xmm7
.byte 102,15,112,238,78 // pshufd $0x4e,%xmm6,%xmm5
@@ -48654,7 +49184,7 @@ _sk_clut_3D_sse2:
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,254,201 // paddd %xmm9,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,5,197,186,0,0 // movdqa 0xbac5(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,5,246,186,0,0 // movdqa 0xbaf6(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,244,200 // pmuludq %xmm0,%xmm1
.byte 102,15,112,217,232 // pshufd $0xe8,%xmm1,%xmm3
.byte 102,15,244,208 // pmuludq %xmm0,%xmm2
@@ -48676,7 +49206,7 @@ _sk_clut_3D_sse2:
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,202 // unpcklps %xmm2,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,111,5,207,179,0,0 // movdqa 0xb3cf(%rip),%xmm0 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,5,0,180,0,0 // movdqa 0xb400(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
@@ -48752,7 +49282,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,4,139 // movss (%rbx,%r9,4),%xmm0
.byte 15,20,240 // unpcklps %xmm0,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
- .byte 102,15,254,29,160,178,0,0 // paddd 0xb2a0(%rip),%xmm3 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,29,209,178,0,0 // paddd 0xb2d1(%rip),%xmm3 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,195,78 // pshufd $0x4e,%xmm3,%xmm0
.byte 102,73,15,126,193 // movq %xmm0,%r9
.byte 102,73,15,126,218 // movq %xmm3,%r10
@@ -48803,7 +49333,7 @@ _sk_clut_3D_sse2:
.byte 68,15,20,201 // unpcklps %xmm1,%xmm9
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,156,177,0,0 // paddd 0xb19c(%rip),%xmm1 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,254,13,205,177,0,0 // paddd 0xb1cd(%rip),%xmm1 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,209 // movq %xmm2,%r9
.byte 102,73,15,126,202 // movq %xmm1,%r10
@@ -48820,7 +49350,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,20,139 // movss (%rbx,%r9,4),%xmm2
.byte 68,15,20,242 // unpcklps %xmm2,%xmm14
.byte 68,15,20,241 // unpcklps %xmm1,%xmm14
- .byte 102,15,254,5,111,177,0,0 // paddd 0xb16f(%rip),%xmm0 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,5,160,177,0,0 // paddd 0xb1a0(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,73,15,126,201 // movq %xmm1,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -48858,7 +49388,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
- .byte 102,15,111,37,162,176,0,0 // movdqa 0xb0a2(%rip),%xmm4 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,37,211,176,0,0 // movdqa 0xb0d3(%rip),%xmm4 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,226 // paddd %xmm2,%xmm4
.byte 102,15,112,204,78 // pshufd $0x4e,%xmm4,%xmm1
.byte 102,73,15,126,201 // movq %xmm1,%r9
@@ -48876,7 +49406,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,254,21,116,176,0,0 // paddd 0xb074(%rip),%xmm2 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,21,165,176,0,0 // paddd 0xb0a5(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
.byte 102,73,15,126,210 // movq %xmm2,%r10
@@ -49029,7 +49559,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,209 // paddd %xmm1,%xmm2
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
.byte 102,15,254,218 // paddd %xmm2,%xmm3
- .byte 102,68,15,111,21,94,180,0,0 // movdqa 0xb45e(%rip),%xmm10 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,68,15,111,21,143,180,0,0 // movdqa 0xb48f(%rip),%xmm10 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,112,235,245 // pshufd $0xf5,%xmm3,%xmm5
.byte 102,65,15,244,218 // pmuludq %xmm10,%xmm3
.byte 102,15,112,227,232 // pshufd $0xe8,%xmm3,%xmm4
@@ -49052,7 +49582,7 @@ _sk_clut_4D_sse2:
.byte 15,20,222 // unpcklps %xmm6,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 102,15,111,236 // movdqa %xmm4,%xmm5
- .byte 102,15,254,45,96,173,0,0 // paddd 0xad60(%rip),%xmm5 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,254,45,145,173,0,0 // paddd 0xad91(%rip),%xmm5 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,112,245,78 // pshufd $0x4e,%xmm5,%xmm6
.byte 102,73,15,126,241 // movq %xmm6,%r9
.byte 102,73,15,126,234 // movq %xmm5,%r10
@@ -49069,7 +49599,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 15,20,247 // unpcklps %xmm7,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
- .byte 102,15,254,37,54,173,0,0 // paddd 0xad36(%rip),%xmm4 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,37,103,173,0,0 // paddd 0xad67(%rip),%xmm4 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
.byte 102,73,15,126,226 // movq %xmm4,%r10
@@ -49086,7 +49616,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 15,20,239 // unpcklps %xmm7,%xmm5
.byte 15,20,236 // unpcklps %xmm4,%xmm5
- .byte 15,40,61,77,179,0,0 // movaps 0xb34d(%rip),%xmm7 # 2be60 <_sk_overlay_sse2_8bit+0x149f>
+ .byte 15,40,61,126,179,0,0 // movaps 0xb37e(%rip),%xmm7 # 2c460 <_sk_overlay_sse2_8bit+0x14ab>
.byte 68,15,88,199 // addps %xmm7,%xmm8
.byte 68,15,41,68,36,176 // movaps %xmm8,-0x50(%rsp)
.byte 68,15,88,207 // addps %xmm7,%xmm9
@@ -49124,7 +49654,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,234 // unpcklps %xmm2,%xmm13
.byte 68,15,20,239 // unpcklps %xmm7,%xmm13
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
- .byte 102,15,254,21,20,172,0,0 // paddd 0xac14(%rip),%xmm2 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,254,21,69,172,0,0 // paddd 0xac45(%rip),%xmm2 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7
.byte 102,73,15,126,249 // movq %xmm7,%r9
.byte 102,73,15,126,210 // movq %xmm2,%r10
@@ -49141,7 +49671,7 @@ _sk_clut_4D_sse2:
.byte 243,70,15,16,12,139 // movss (%rbx,%r9,4),%xmm9
.byte 65,15,20,209 // unpcklps %xmm9,%xmm2
.byte 15,20,215 // unpcklps %xmm7,%xmm2
- .byte 102,15,254,5,233,171,0,0 // paddd 0xabe9(%rip),%xmm0 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,5,26,172,0,0 // paddd 0xac1a(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,248,78 // pshufd $0x4e,%xmm0,%xmm7
.byte 102,73,15,126,249 // movq %xmm7,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -49182,7 +49712,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,217 // movdqa %xmm1,%xmm3
.byte 102,15,254,92,36,160 // paddd -0x60(%rsp),%xmm3
.byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
- .byte 102,68,15,111,53,165,177,0,0 // movdqa 0xb1a5(%rip),%xmm14 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,68,15,111,53,214,177,0,0 // movdqa 0xb1d6(%rip),%xmm14 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,65,15,244,222 // pmuludq %xmm14,%xmm3
.byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
.byte 102,65,15,244,230 // pmuludq %xmm14,%xmm4
@@ -49203,7 +49733,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,228 // unpcklps %xmm4,%xmm12
.byte 68,15,20,229 // unpcklps %xmm5,%xmm12
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
- .byte 102,15,111,61,174,170,0,0 // movdqa 0xaaae(%rip),%xmm7 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,61,223,170,0,0 // movdqa 0xaadf(%rip),%xmm7 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,231 // paddd %xmm7,%xmm4
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
@@ -49221,7 +49751,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,245 // unpcklps %xmm5,%xmm6
.byte 15,20,244 // unpcklps %xmm4,%xmm6
- .byte 102,68,15,111,5,127,170,0,0 // movdqa 0xaa7f(%rip),%xmm8 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,5,176,170,0,0 // movdqa 0xaab0(%rip),%xmm8 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,65,15,254,216 // paddd %xmm8,%xmm3
.byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
@@ -49335,7 +49865,7 @@ _sk_clut_4D_sse2:
.byte 102,68,15,111,108,36,160 // movdqa -0x60(%rsp),%xmm13
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,29,235,174,0,0 // movdqa 0xaeeb(%rip),%xmm3 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,29,28,175,0,0 // movdqa 0xaf1c(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,211 // pmuludq %xmm3,%xmm2
@@ -49357,7 +49887,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 68,15,20,205 // unpcklps %xmm5,%xmm9
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,111,29,242,167,0,0 // movdqa 0xa7f2(%rip),%xmm3 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,29,35,168,0,0 // movdqa 0xa823(%rip),%xmm3 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,234,78 // pshufd $0x4e,%xmm2,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
@@ -49465,7 +49995,7 @@ _sk_clut_4D_sse2:
.byte 102,65,15,111,211 // movdqa %xmm11,%xmm2
.byte 102,65,15,254,213 // paddd %xmm13,%xmm2
.byte 102,15,112,218,245 // pshufd $0xf5,%xmm2,%xmm3
- .byte 102,15,111,5,179,172,0,0 // movdqa 0xacb3(%rip),%xmm0 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,5,228,172,0,0 // movdqa 0xace4(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,244,208 // pmuludq %xmm0,%xmm2
.byte 102,15,112,250,232 // pshufd $0xe8,%xmm2,%xmm7
.byte 102,15,244,216 // pmuludq %xmm0,%xmm3
@@ -49486,7 +50016,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 68,15,20,203 // unpcklps %xmm3,%xmm9
.byte 102,15,111,215 // movdqa %xmm7,%xmm2
- .byte 102,15,111,5,190,165,0,0 // movdqa 0xa5be(%rip),%xmm0 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,5,239,165,0,0 // movdqa 0xa5ef(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
.byte 102,73,15,126,217 // movq %xmm3,%r9
@@ -49504,7 +50034,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,28,139 // movss (%rbx,%r9,4),%xmm3
.byte 15,20,243 // unpcklps %xmm3,%xmm6
.byte 15,20,242 // unpcklps %xmm2,%xmm6
- .byte 102,68,15,111,45,143,165,0,0 // movdqa 0xa58f(%rip),%xmm13 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,45,192,165,0,0 // movdqa 0xa5c0(%rip),%xmm13 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,65,15,254,253 // paddd %xmm13,%xmm7
.byte 102,15,112,215,78 // pshufd $0x4e,%xmm7,%xmm2
.byte 102,73,15,126,209 // movq %xmm2,%r9
@@ -49524,7 +50054,7 @@ _sk_clut_4D_sse2:
.byte 15,20,250 // unpcklps %xmm2,%xmm7
.byte 102,68,15,254,220 // paddd %xmm4,%xmm11
.byte 102,65,15,112,219,245 // pshufd $0xf5,%xmm11,%xmm3
- .byte 102,15,111,37,165,171,0,0 // movdqa 0xaba5(%rip),%xmm4 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,37,214,171,0,0 // movdqa 0xabd6(%rip),%xmm4 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,68,15,244,220 // pmuludq %xmm4,%xmm11
.byte 102,65,15,112,211,232 // pshufd $0xe8,%xmm11,%xmm2
.byte 102,15,244,220 // pmuludq %xmm4,%xmm3
@@ -49625,7 +50155,7 @@ _sk_clut_4D_sse2:
.byte 102,65,15,111,202 // movdqa %xmm10,%xmm1
.byte 102,15,254,200 // paddd %xmm0,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,29,231,169,0,0 // movdqa 0xa9e7(%rip),%xmm3 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,29,24,170,0,0 // movdqa 0xaa18(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,211 // pmuludq %xmm3,%xmm2
@@ -49647,7 +50177,7 @@ _sk_clut_4D_sse2:
.byte 15,20,212 // unpcklps %xmm4,%xmm2
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 102,15,111,217 // movdqa %xmm1,%xmm3
- .byte 102,15,111,61,240,162,0,0 // movdqa 0xa2f0(%rip),%xmm7 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,61,33,163,0,0 // movdqa 0xa321(%rip),%xmm7 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,223 // paddd %xmm7,%xmm3
.byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
@@ -49665,7 +50195,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 15,20,220 // unpcklps %xmm4,%xmm3
- .byte 102,68,15,111,13,193,162,0,0 // movdqa 0xa2c1(%rip),%xmm9 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,68,15,111,13,242,162,0,0 // movdqa 0xa2f2(%rip),%xmm9 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,65,15,254,201 // paddd %xmm9,%xmm1
.byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
@@ -49777,7 +50307,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,246 // unpcklps %xmm6,%xmm14
.byte 68,15,20,243 // unpcklps %xmm3,%xmm14
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
- .byte 102,68,15,111,21,180,160,0,0 // movdqa 0xa0b4(%rip),%xmm10 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,21,229,160,0,0 // movdqa 0xa0e5(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,65,15,254,218 // paddd %xmm10,%xmm3
.byte 102,15,112,243,78 // pshufd $0x4e,%xmm3,%xmm6
.byte 102,73,15,126,241 // movq %xmm6,%r9
@@ -49898,7 +50428,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,116,36,160 // movdqa -0x60(%rsp),%xmm6
.byte 102,15,254,198 // paddd %xmm6,%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,29,46,165,0,0 // movdqa 0xa52e(%rip),%xmm3 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,29,95,165,0,0 // movdqa 0xa55f(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,244,195 // pmuludq %xmm3,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
@@ -49920,7 +50450,7 @@ _sk_clut_4D_sse2:
.byte 15,20,195 // unpcklps %xmm3,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
- .byte 102,68,15,111,5,54,158,0,0 // movdqa 0x9e36(%rip),%xmm8 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,68,15,111,5,103,158,0,0 // movdqa 0x9e67(%rip),%xmm8 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,65,15,254,200 // paddd %xmm8,%xmm1
.byte 102,15,112,217,78 // pshufd $0x4e,%xmm1,%xmm3
.byte 102,73,15,126,217 // movq %xmm3,%r9
@@ -50026,7 +50556,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,124,36,128 // paddd -0x80(%rsp),%xmm7
.byte 102,15,254,247 // paddd %xmm7,%xmm6
.byte 102,15,112,206,245 // pshufd $0xf5,%xmm6,%xmm1
- .byte 102,15,111,21,248,162,0,0 // movdqa 0xa2f8(%rip),%xmm2 # 2be70 <_sk_overlay_sse2_8bit+0x14af>
+ .byte 102,15,111,21,41,163,0,0 // movdqa 0xa329(%rip),%xmm2 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
.byte 102,15,244,242 // pmuludq %xmm2,%xmm6
.byte 102,15,112,198,232 // pshufd $0xe8,%xmm6,%xmm0
.byte 102,15,244,202 // pmuludq %xmm2,%xmm1
@@ -50048,7 +50578,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,201 // unpcklps %xmm1,%xmm9
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,255,155,0,0 // paddd 0x9bff(%rip),%xmm1 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,254,13,48,156,0,0 // paddd 0x9c30(%rip),%xmm1 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,209 // movq %xmm2,%r9
.byte 102,73,15,126,202 // movq %xmm1,%r10
@@ -50104,7 +50634,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
- .byte 102,15,111,53,5,155,0,0 // movdqa 0x9b05(%rip),%xmm6 # 2b7e0 <_sk_overlay_sse2_8bit+0xe1f>
+ .byte 102,15,111,53,54,155,0,0 // movdqa 0x9b36(%rip),%xmm6 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
.byte 102,15,254,242 // paddd %xmm2,%xmm6
.byte 102,15,112,206,78 // pshufd $0x4e,%xmm6,%xmm1
.byte 102,73,15,126,201 // movq %xmm1,%r9
@@ -50122,7 +50652,7 @@ _sk_clut_4D_sse2:
.byte 243,70,15,16,60,139 // movss (%rbx,%r9,4),%xmm15
.byte 65,15,20,207 // unpcklps %xmm15,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,254,21,214,154,0,0 // paddd 0x9ad6(%rip),%xmm2 # 2b800 <_sk_overlay_sse2_8bit+0xe3f>
+ .byte 102,15,254,21,7,155,0,0 // paddd 0x9b07(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
.byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7
.byte 102,73,15,126,249 // movq %xmm7,%r9
.byte 102,73,15,126,210 // movq %xmm2,%r10
@@ -50184,7 +50714,7 @@ _sk_clut_4D_sse2:
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,187,153,0,0 // movaps 0x99bb(%rip),%xmm3 # 2b7d0 <_sk_overlay_sse2_8bit+0xe0f>
+ .byte 15,40,29,236,153,0,0 // movaps 0x99ec(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,40,100,36,112 // movaps 0x70(%rsp),%xmm4
.byte 15,40,172,36,128,0,0,0 // movaps 0x80(%rsp),%xmm5
.byte 15,40,180,36,144,0,0,0 // movaps 0x90(%rsp),%xmm6
@@ -50192,6 +50722,7 @@ _sk_clut_4D_sse2:
.byte 72,129,196,176,0,0,0 // add $0xb0,%rsp
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
+ .byte 144 // nop
HIDDEN _sk_start_pipeline_hsw_8bit
.globl _sk_start_pipeline_hsw_8bit
@@ -50214,7 +50745,7 @@ _sk_start_pipeline_hsw_8bit:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,168 // mov %rcx,-0x58(%rbp)
.byte 73,57,207 // cmp %rcx,%r15
- .byte 115,102 // jae 21ed1 <_sk_start_pipeline_hsw_8bit+0x95>
+ .byte 115,102 // jae 224a1 <_sk_start_pipeline_hsw_8bit+0x95>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,16 // lea 0x10(%rax),%rax
.byte 72,137,69,176 // mov %rax,-0x50(%rbp)
@@ -50224,7 +50755,7 @@ _sk_start_pipeline_hsw_8bit:
.byte 76,137,125,192 // mov %r15,-0x40(%rbp)
.byte 72,199,69,200,0,0,0,0 // movq $0x0,-0x38(%rbp)
.byte 72,57,93,176 // cmp %rbx,-0x50(%rbp)
- .byte 119,30 // ja 21eb3 <_sk_start_pipeline_hsw_8bit+0x77>
+ .byte 119,30 // ja 22483 <_sk_start_pipeline_hsw_8bit+0x77>
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
@@ -50233,17 +50764,17 @@ _sk_start_pipeline_hsw_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 72,131,193,32 // add $0x20,%rcx
.byte 72,57,217 // cmp %rbx,%rcx
- .byte 118,226 // jbe 21e95 <_sk_start_pipeline_hsw_8bit+0x59>
+ .byte 118,226 // jbe 22465 <_sk_start_pipeline_hsw_8bit+0x59>
.byte 72,137,217 // mov %rbx,%rcx
.byte 72,41,193 // sub %rax,%rcx
- .byte 116,13 // je 21ec8 <_sk_start_pipeline_hsw_8bit+0x8c>
+ .byte 116,13 // je 22498 <_sk_start_pipeline_hsw_8bit+0x8c>
.byte 72,137,77,200 // mov %rcx,-0x38(%rbp)
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
.byte 73,255,199 // inc %r15
.byte 76,59,125,168 // cmp -0x58(%rbp),%r15
- .byte 117,170 // jne 21e7b <_sk_start_pipeline_hsw_8bit+0x3f>
+ .byte 117,170 // jne 2244b <_sk_start_pipeline_hsw_8bit+0x3f>
.byte 72,131,196,56 // add $0x38,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -50275,7 +50806,7 @@ HIDDEN _sk_set_rgb_hsw_8bit
FUNCTION(_sk_set_rgb_hsw_8bit)
_sk_set_rgb_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 197,250,16,37,50,143,0,0 // vmovss 0x8f32(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 197,250,16,37,86,143,0,0 // vmovss 0x8f56(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 197,218,89,40 // vmulss (%rax),%xmm4,%xmm5
.byte 196,225,250,44,205 // vcvttss2si %xmm5,%rcx
.byte 197,218,89,104,4 // vmulss 0x4(%rax),%xmm4,%xmm5
@@ -50288,7 +50819,7 @@ _sk_set_rgb_hsw_8bit:
.byte 9,208 // or %edx,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,88,228 // vpbroadcastd %xmm4,%ymm4
- .byte 197,253,111,45,106,148,0,0 // vmovdqa 0x946a(%rip),%ymm5 # 2b3a0 <_sk_overlay_sse2_8bit+0x9df>
+ .byte 197,253,111,45,154,148,0,0 // vmovdqa 0x949a(%rip),%ymm5 # 2b9a0 <_sk_overlay_sse2_8bit+0x9eb>
.byte 197,245,219,205 // vpand %ymm5,%ymm1,%ymm1
.byte 197,253,219,197 // vpand %ymm5,%ymm0,%ymm0
.byte 197,221,235,192 // vpor %ymm0,%ymm4,%ymm0
@@ -50300,10 +50831,10 @@ HIDDEN _sk_premul_hsw_8bit
.globl _sk_premul_hsw_8bit
FUNCTION(_sk_premul_hsw_8bit)
_sk_premul_hsw_8bit:
- .byte 197,253,111,37,110,148,0,0 // vmovdqa 0x946e(%rip),%ymm4 # 2b3c0 <_sk_overlay_sse2_8bit+0x9ff>
+ .byte 197,253,111,37,158,148,0,0 // vmovdqa 0x949e(%rip),%ymm4 # 2b9c0 <_sk_overlay_sse2_8bit+0xa0b>
.byte 196,226,125,0,236 // vpshufb %ymm4,%ymm0,%ymm5
.byte 196,226,117,0,228 // vpshufb %ymm4,%ymm1,%ymm4
- .byte 197,253,111,53,124,148,0,0 // vmovdqa 0x947c(%rip),%ymm6 # 2b3e0 <_sk_overlay_sse2_8bit+0xa1f>
+ .byte 197,253,111,53,172,148,0,0 // vmovdqa 0x94ac(%rip),%ymm6 # 2b9e0 <_sk_overlay_sse2_8bit+0xa2b>
.byte 197,221,235,230 // vpor %ymm6,%ymm4,%ymm4
.byte 197,213,235,238 // vpor %ymm6,%ymm5,%ymm5
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -50343,7 +50874,7 @@ HIDDEN _sk_swap_rb_hsw_8bit
.globl _sk_swap_rb_hsw_8bit
FUNCTION(_sk_swap_rb_hsw_8bit)
_sk_swap_rb_hsw_8bit:
- .byte 197,253,111,37,244,147,0,0 // vmovdqa 0x93f4(%rip),%ymm4 # 2b400 <_sk_overlay_sse2_8bit+0xa3f>
+ .byte 197,253,111,37,36,148,0,0 // vmovdqa 0x9424(%rip),%ymm4 # 2ba00 <_sk_overlay_sse2_8bit+0xa4b>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50372,7 +50903,7 @@ _sk_load_8888_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 2205c <_sk_load_8888_hsw_8bit+0x32>
+ .byte 117,17 // jne 2262c <_sk_load_8888_hsw_8bit+0x32>
.byte 196,161,126,111,76,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm1
.byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50382,14 +50913,14 @@ _sk_load_8888_hsw_8bit:
.byte 197,253,239,192 // vpxor %ymm0,%ymm0,%ymm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,231 // ja 22058 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 119,231 // ja 22628 <_sk_load_8888_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22194 <_sk_load_8888_hsw_8bit+0x16a>
+ .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22764 <_sk_load_8888_hsw_8bit+0x16a>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,110,4,130 // vmovd (%rdx,%r8,4),%xmm0
- .byte 235,203 // jmp 22058 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 235,203 // jmp 22628 <_sk_load_8888_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50397,7 +50928,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,125,2,196,3 // vpblendd $0x3,%ymm4,%ymm0,%ymm0
- .byte 235,162 // jmp 22058 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 235,162 // jmp 22628 <_sk_load_8888_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50410,7 +50941,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,227,125,56,196,1 // vinserti128 $0x1,%xmm4,%ymm0,%ymm0
.byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4
.byte 196,227,93,2,192,240 // vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- .byte 233,83,255,255,255 // jmpq 22058 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 233,83,255,255,255 // jmpq 22628 <_sk_load_8888_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50419,7 +50950,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,227,117,2,200,15 // vpblendd $0xf,%ymm0,%ymm1,%ymm1
.byte 196,161,121,110,68,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm0
.byte 196,227,117,2,200,1 // vpblendd $0x1,%ymm0,%ymm1,%ymm1
- .byte 233,23,255,255,255 // jmpq 22052 <_sk_load_8888_hsw_8bit+0x28>
+ .byte 233,23,255,255,255 // jmpq 22622 <_sk_load_8888_hsw_8bit+0x28>
.byte 196,161,121,110,68,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50433,7 +50964,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0
.byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4
.byte 196,227,93,2,201,240 // vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- .byte 233,199,254,255,255 // jmpq 22058 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 233,199,254,255,255 // jmpq 22628 <_sk_load_8888_hsw_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 241 // icebp
.byte 254 // (bad)
@@ -50486,7 +51017,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 22202 <_sk_load_8888_dst_hsw_8bit+0x32>
+ .byte 117,17 // jne 227d2 <_sk_load_8888_dst_hsw_8bit+0x32>
.byte 196,161,126,111,92,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm3
.byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50496,14 +51027,14 @@ _sk_load_8888_dst_hsw_8bit:
.byte 197,237,239,210 // vpxor %ymm2,%ymm2,%ymm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,231 // ja 221fe <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 119,231 // ja 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,22,1,0,0 // lea 0x116(%rip),%rcx # 22338 <_sk_load_8888_dst_hsw_8bit+0x168>
+ .byte 72,141,13,22,1,0,0 // lea 0x116(%rip),%rcx # 22908 <_sk_load_8888_dst_hsw_8bit+0x168>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,110,20,130 // vmovd (%rdx,%r8,4),%xmm2
- .byte 235,203 // jmp 221fe <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 235,203 // jmp 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50511,7 +51042,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,109,2,212,3 // vpblendd $0x3,%ymm4,%ymm2,%ymm2
- .byte 235,162 // jmp 221fe <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 235,162 // jmp 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50524,7 +51055,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,227,109,56,212,1 // vinserti128 $0x1,%xmm4,%ymm2,%ymm2
.byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4
.byte 196,227,93,2,210,240 // vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- .byte 233,83,255,255,255 // jmpq 221fe <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 233,83,255,255,255 // jmpq 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50533,7 +51064,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,227,101,2,218,15 // vpblendd $0xf,%ymm2,%ymm3,%ymm3
.byte 196,161,121,110,84,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm2
.byte 196,227,101,2,218,1 // vpblendd $0x1,%ymm2,%ymm3,%ymm3
- .byte 233,23,255,255,255 // jmpq 221f8 <_sk_load_8888_dst_hsw_8bit+0x28>
+ .byte 233,23,255,255,255 // jmpq 227c8 <_sk_load_8888_dst_hsw_8bit+0x28>
.byte 196,161,121,110,84,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50547,7 +51078,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2
.byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4
.byte 196,227,93,2,219,240 // vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- .byte 233,199,254,255,255 // jmpq 221fe <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 233,199,254,255,255 // jmpq 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 144 // nop
.byte 243,254 // repz (bad)
.byte 255 // (bad)
@@ -50600,7 +51131,7 @@ _sk_store_8888_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 223a6 <_sk_store_8888_hsw_8bit+0x32>
+ .byte 117,17 // jne 22976 <_sk_store_8888_hsw_8bit+0x32>
.byte 196,161,126,127,4,130 // vmovdqu %ymm0,(%rdx,%r8,4)
.byte 196,161,126,127,76,130,32 // vmovdqu %ymm1,0x20(%rdx,%r8,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50608,17 +51139,17 @@ _sk_store_8888_hsw_8bit:
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,239 // ja 223a2 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 119,239 // ja 22972 <_sk_store_8888_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,178,0,0,0 // lea 0xb2(%rip),%rcx # 22470 <_sk_store_8888_hsw_8bit+0xfc>
+ .byte 72,141,13,178,0,0,0 // lea 0xb2(%rip),%rcx # 22a40 <_sk_store_8888_hsw_8bit+0xfc>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,126,4,130 // vmovd %xmm0,(%rdx,%r8,4)
- .byte 235,211 // jmp 223a2 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 235,211 // jmp 22972 <_sk_store_8888_hsw_8bit+0x2e>
.byte 196,163,121,22,68,130,8,2 // vpextrd $0x2,%xmm0,0x8(%rdx,%r8,4)
.byte 196,161,121,214,4,130 // vmovq %xmm0,(%rdx,%r8,4)
- .byte 235,195 // jmp 223a2 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 235,195 // jmp 22972 <_sk_store_8888_hsw_8bit+0x2e>
.byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4
.byte 196,163,121,22,100,130,24,2 // vpextrd $0x2,%xmm4,0x18(%rdx,%r8,4)
.byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4
@@ -50626,12 +51157,12 @@ _sk_store_8888_hsw_8bit:
.byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4
.byte 196,161,121,126,100,130,16 // vmovd %xmm4,0x10(%rdx,%r8,4)
.byte 196,161,122,127,4,130 // vmovdqu %xmm0,(%rdx,%r8,4)
- .byte 235,146 // jmp 223a2 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 235,146 // jmp 22972 <_sk_store_8888_hsw_8bit+0x2e>
.byte 196,163,121,22,76,130,40,2 // vpextrd $0x2,%xmm1,0x28(%rdx,%r8,4)
.byte 196,163,121,22,76,130,36,1 // vpextrd $0x1,%xmm1,0x24(%rdx,%r8,4)
.byte 196,161,121,126,76,130,32 // vmovd %xmm1,0x20(%rdx,%r8,4)
.byte 196,161,126,127,4,130 // vmovdqu %ymm0,(%rdx,%r8,4)
- .byte 233,112,255,255,255 // jmpq 223a2 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 233,112,255,255,255 // jmpq 22972 <_sk_store_8888_hsw_8bit+0x2e>
.byte 196,227,125,57,204,1 // vextracti128 $0x1,%ymm1,%xmm4
.byte 196,163,121,22,100,130,56,2 // vpextrd $0x2,%xmm4,0x38(%rdx,%r8,4)
.byte 196,227,125,57,204,1 // vextracti128 $0x1,%ymm1,%xmm4
@@ -50640,7 +51171,7 @@ _sk_store_8888_hsw_8bit:
.byte 196,161,121,126,100,130,48 // vmovd %xmm4,0x30(%rdx,%r8,4)
.byte 196,161,126,127,4,130 // vmovdqu %ymm0,(%rdx,%r8,4)
.byte 196,161,122,127,76,130,32 // vmovdqu %xmm1,0x20(%rdx,%r8,4)
- .byte 233,53,255,255,255 // jmpq 223a2 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 233,53,255,255,255 // jmpq 22972 <_sk_store_8888_hsw_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 87 // push %rdi
.byte 255 // (bad)
@@ -50653,7 +51184,7 @@ _sk_store_8888_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 125,255 // jge 22485 <_sk_store_8888_hsw_8bit+0x111>
+ .byte 125,255 // jge 22a55 <_sk_store_8888_hsw_8bit+0x111>
.byte 255 // (bad)
.byte 255,111,255 // ljmp *-0x1(%rdi)
.byte 255 // (bad)
@@ -50664,7 +51195,7 @@ _sk_store_8888_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 235,255 // jmp 2249d <_sk_store_8888_hsw_8bit+0x129>
+ .byte 235,255 // jmp 22a6d <_sk_store_8888_hsw_8bit+0x129>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 222,255 // fdivrp %st,%st(7)
@@ -50690,10 +51221,10 @@ _sk_load_bgra_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 224f0 <_sk_load_bgra_hsw_8bit+0x44>
+ .byte 117,35 // jne 22ac0 <_sk_load_bgra_hsw_8bit+0x44>
.byte 196,161,126,111,76,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm1
.byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0
- .byte 197,253,111,37,62,143,0,0 // vmovdqa 0x8f3e(%rip),%ymm4 # 2b420 <_sk_overlay_sse2_8bit+0xa5f>
+ .byte 197,253,111,37,110,143,0,0 // vmovdqa 0x8f6e(%rip),%ymm4 # 2ba20 <_sk_overlay_sse2_8bit+0xa6b>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50703,14 +51234,14 @@ _sk_load_bgra_hsw_8bit:
.byte 197,253,239,192 // vpxor %ymm0,%ymm0,%ymm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,213 // ja 224da <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 119,213 // ja 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22628 <_sk_load_bgra_hsw_8bit+0x17c>
+ .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22bf8 <_sk_load_bgra_hsw_8bit+0x17c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,110,4,130 // vmovd (%rdx,%r8,4),%xmm0
- .byte 235,185 // jmp 224da <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 235,185 // jmp 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50718,7 +51249,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,125,2,196,3 // vpblendd $0x3,%ymm4,%ymm0,%ymm0
- .byte 235,144 // jmp 224da <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 235,144 // jmp 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50731,7 +51262,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,227,125,56,196,1 // vinserti128 $0x1,%xmm4,%ymm0,%ymm0
.byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4
.byte 196,227,93,2,192,240 // vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- .byte 233,65,255,255,255 // jmpq 224da <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 233,65,255,255,255 // jmpq 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50740,7 +51271,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,227,117,2,200,15 // vpblendd $0xf,%ymm0,%ymm1,%ymm1
.byte 196,161,121,110,68,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm0
.byte 196,227,117,2,200,1 // vpblendd $0x1,%ymm0,%ymm1,%ymm1
- .byte 233,5,255,255,255 // jmpq 224d4 <_sk_load_bgra_hsw_8bit+0x28>
+ .byte 233,5,255,255,255 // jmpq 22aa4 <_sk_load_bgra_hsw_8bit+0x28>
.byte 196,161,121,110,68,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -50754,7 +51285,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0
.byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4
.byte 196,227,93,2,201,240 // vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- .byte 233,181,254,255,255 // jmpq 224da <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 233,181,254,255,255 // jmpq 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 241 // icebp
.byte 254 // (bad)
@@ -50805,10 +51336,10 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 226a8 <_sk_load_bgra_dst_hsw_8bit+0x44>
+ .byte 117,35 // jne 22c78 <_sk_load_bgra_dst_hsw_8bit+0x44>
.byte 196,161,126,111,92,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm3
.byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2
- .byte 197,253,111,37,166,141,0,0 // vmovdqa 0x8da6(%rip),%ymm4 # 2b440 <_sk_overlay_sse2_8bit+0xa7f>
+ .byte 197,253,111,37,214,141,0,0 // vmovdqa 0x8dd6(%rip),%ymm4 # 2ba40 <_sk_overlay_sse2_8bit+0xa8b>
.byte 196,226,109,0,212 // vpshufb %ymm4,%ymm2,%ymm2
.byte 196,226,101,0,220 // vpshufb %ymm4,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50818,14 +51349,14 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 197,237,239,210 // vpxor %ymm2,%ymm2,%ymm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,213 // ja 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 119,213 // ja 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 227e0 <_sk_load_bgra_dst_hsw_8bit+0x17c>
+ .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22db0 <_sk_load_bgra_dst_hsw_8bit+0x17c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,110,20,130 // vmovd (%rdx,%r8,4),%xmm2
- .byte 235,185 // jmp 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 235,185 // jmp 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50833,7 +51364,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,109,2,212,3 // vpblendd $0x3,%ymm4,%ymm2,%ymm2
- .byte 235,144 // jmp 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 235,144 // jmp 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50846,7 +51377,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,227,109,56,212,1 // vinserti128 $0x1,%xmm4,%ymm2,%ymm2
.byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4
.byte 196,227,93,2,210,240 // vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- .byte 233,65,255,255,255 // jmpq 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 233,65,255,255,255 // jmpq 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50855,7 +51386,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,227,101,2,218,15 // vpblendd $0xf,%ymm2,%ymm3,%ymm3
.byte 196,161,121,110,84,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm2
.byte 196,227,101,2,218,1 // vpblendd $0x1,%ymm2,%ymm3,%ymm3
- .byte 233,5,255,255,255 // jmpq 2268c <_sk_load_bgra_dst_hsw_8bit+0x28>
+ .byte 233,5,255,255,255 // jmpq 22c5c <_sk_load_bgra_dst_hsw_8bit+0x28>
.byte 196,161,121,110,84,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -50869,7 +51400,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2
.byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4
.byte 196,227,93,2,219,240 // vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- .byte 233,181,254,255,255 // jmpq 22692 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 233,181,254,255,255 // jmpq 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 241 // icebp
.byte 254 // (bad)
@@ -50919,11 +51450,11 @@ _sk_store_bgra_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
- .byte 197,253,111,37,32,140,0,0 // vmovdqa 0x8c20(%rip),%ymm4 # 2b460 <_sk_overlay_sse2_8bit+0xa9f>
+ .byte 197,253,111,37,80,140,0,0 // vmovdqa 0x8c50(%rip),%ymm4 # 2ba60 <_sk_overlay_sse2_8bit+0xaab>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 22860 <_sk_store_bgra_hsw_8bit+0x44>
+ .byte 117,17 // jne 22e30 <_sk_store_bgra_hsw_8bit+0x44>
.byte 196,161,126,127,36,130 // vmovdqu %ymm4,(%rdx,%r8,4)
.byte 196,161,126,127,108,130,32 // vmovdqu %ymm5,0x20(%rdx,%r8,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50931,17 +51462,17 @@ _sk_store_bgra_hsw_8bit:
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,239 // ja 2285c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 119,239 // ja 22e2c <_sk_store_bgra_hsw_8bit+0x40>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,176,0,0,0 // lea 0xb0(%rip),%rcx # 22928 <_sk_store_bgra_hsw_8bit+0x10c>
+ .byte 72,141,13,176,0,0,0 // lea 0xb0(%rip),%rcx # 22ef8 <_sk_store_bgra_hsw_8bit+0x10c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,126,36,130 // vmovd %xmm4,(%rdx,%r8,4)
- .byte 235,211 // jmp 2285c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 235,211 // jmp 22e2c <_sk_store_bgra_hsw_8bit+0x40>
.byte 196,163,121,22,100,130,8,2 // vpextrd $0x2,%xmm4,0x8(%rdx,%r8,4)
.byte 196,161,121,214,36,130 // vmovq %xmm4,(%rdx,%r8,4)
- .byte 235,195 // jmp 2285c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 235,195 // jmp 22e2c <_sk_store_bgra_hsw_8bit+0x40>
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,163,121,22,108,130,24,2 // vpextrd $0x2,%xmm5,0x18(%rdx,%r8,4)
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
@@ -50949,12 +51480,12 @@ _sk_store_bgra_hsw_8bit:
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,161,121,126,108,130,16 // vmovd %xmm5,0x10(%rdx,%r8,4)
.byte 196,161,122,127,36,130 // vmovdqu %xmm4,(%rdx,%r8,4)
- .byte 235,146 // jmp 2285c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 235,146 // jmp 22e2c <_sk_store_bgra_hsw_8bit+0x40>
.byte 196,163,121,22,108,130,40,2 // vpextrd $0x2,%xmm5,0x28(%rdx,%r8,4)
.byte 196,163,121,22,108,130,36,1 // vpextrd $0x1,%xmm5,0x24(%rdx,%r8,4)
.byte 196,161,121,126,108,130,32 // vmovd %xmm5,0x20(%rdx,%r8,4)
.byte 196,161,126,127,36,130 // vmovdqu %ymm4,(%rdx,%r8,4)
- .byte 233,112,255,255,255 // jmpq 2285c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 233,112,255,255,255 // jmpq 22e2c <_sk_store_bgra_hsw_8bit+0x40>
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
.byte 196,163,121,22,116,130,56,2 // vpextrd $0x2,%xmm6,0x38(%rdx,%r8,4)
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
@@ -50963,7 +51494,7 @@ _sk_store_bgra_hsw_8bit:
.byte 196,161,121,126,116,130,48 // vmovd %xmm6,0x30(%rdx,%r8,4)
.byte 196,161,126,127,36,130 // vmovdqu %ymm4,(%rdx,%r8,4)
.byte 196,161,122,127,108,130,32 // vmovdqu %xmm5,0x20(%rdx,%r8,4)
- .byte 233,53,255,255,255 // jmpq 2285c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 233,53,255,255,255 // jmpq 22e2c <_sk_store_bgra_hsw_8bit+0x40>
.byte 144 // nop
.byte 89 // pop %rcx
.byte 255 // (bad)
@@ -50976,7 +51507,7 @@ _sk_store_bgra_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,255 // jg 2293d <_sk_store_bgra_hsw_8bit+0x121>
+ .byte 127,255 // jg 22f0d <_sk_store_bgra_hsw_8bit+0x121>
.byte 255 // (bad)
.byte 255,113,255 // pushq -0x1(%rcx)
.byte 255 // (bad)
@@ -51014,7 +51545,7 @@ _sk_load_a8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 229a4 <_sk_load_a8_hsw_8bit+0x40>
+ .byte 117,35 // jne 22f74 <_sk_load_a8_hsw_8bit+0x40>
.byte 196,161,122,111,4,2 // vmovdqu (%rdx,%r8,1),%xmm0
.byte 197,249,112,200,78 // vpshufd $0x4e,%xmm0,%xmm1
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
@@ -51027,35 +51558,35 @@ _sk_load_a8_hsw_8bit:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,210 // ja 22987 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 119,210 // ja 22f57 <_sk_load_a8_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 22a80 <_sk_load_a8_hsw_8bit+0x11c>
+ .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 23050 <_sk_load_a8_hsw_8bit+0x11c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,179 // jmp 22987 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 235,179 // jmp 22f57 <_sk_load_a8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,227,121,14,193,1 // vpblendw $0x1,%xmm1,%xmm0,%xmm0
- .byte 235,150 // jmp 22987 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 235,150 // jmp 22f57 <_sk_load_a8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,161,121,110,12,2 // vmovd (%rdx,%r8,1),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,105,255,255,255 // jmpq 22987 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 233,105,255,255,255 // jmpq 22f57 <_sk_load_a8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,60,255,255,255 // jmpq 22987 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 233,60,255,255,255 // jmpq 22f57 <_sk_load_a8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0
@@ -51063,7 +51594,7 @@ _sk_load_a8_hsw_8bit:
.byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1
.byte 196,163,113,34,76,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1
.byte 196,227,113,2,192,8 // vpblendd $0x8,%xmm0,%xmm1,%xmm0
- .byte 233,7,255,255,255 // jmpq 22987 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 233,7,255,255,255 // jmpq 22f57 <_sk_load_a8_hsw_8bit+0x23>
.byte 73,255 // rex.WB (bad)
.byte 255 // (bad)
.byte 255,96,255 // jmpq *-0x1(%rax)
@@ -51073,7 +51604,7 @@ _sk_load_a8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 125,255 // jge 22a95 <_sk_load_a8_hsw_8bit+0x131>
+ .byte 125,255 // jge 23065 <_sk_load_a8_hsw_8bit+0x131>
.byte 255 // (bad)
.byte 255,113,255 // pushq -0x1(%rcx)
.byte 255 // (bad)
@@ -51110,7 +51641,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 22afc <_sk_load_a8_dst_hsw_8bit+0x40>
+ .byte 117,35 // jne 230cc <_sk_load_a8_dst_hsw_8bit+0x40>
.byte 196,161,122,111,20,2 // vmovdqu (%rdx,%r8,1),%xmm2
.byte 197,249,112,218,78 // vpshufd $0x4e,%xmm2,%xmm3
.byte 196,226,125,49,219 // vpmovzxbd %xmm3,%ymm3
@@ -51123,35 +51654,35 @@ _sk_load_a8_dst_hsw_8bit:
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,210 // ja 22adf <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 119,210 // ja 230af <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 22bd8 <_sk_load_a8_dst_hsw_8bit+0x11c>
+ .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 231a8 <_sk_load_a8_dst_hsw_8bit+0x11c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
- .byte 235,179 // jmp 22adf <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 235,179 // jmp 230af <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,216 // vmovd %eax,%xmm3
.byte 196,227,105,14,211,1 // vpblendw $0x1,%xmm3,%xmm2,%xmm2
- .byte 235,150 // jmp 22adf <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 235,150 // jmp 230af <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,161,121,110,28,2 // vmovd (%rdx,%r8,1),%xmm3
.byte 196,227,105,2,211,1 // vpblendd $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,105,255,255,255 // jmpq 22adf <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 233,105,255,255,255 // jmpq 230af <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3
.byte 196,227,97,2,210,12 // vpblendd $0xc,%xmm2,%xmm3,%xmm2
- .byte 233,60,255,255,255 // jmpq 22adf <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 233,60,255,255,255 // jmpq 230af <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2
@@ -51159,7 +51690,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3
.byte 196,163,97,34,92,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3
.byte 196,227,97,2,210,8 // vpblendd $0x8,%xmm2,%xmm3,%xmm2
- .byte 233,7,255,255,255 // jmpq 22adf <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 233,7,255,255,255 // jmpq 230af <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 73,255 // rex.WB (bad)
.byte 255 // (bad)
.byte 255,96,255 // jmpq *-0x1(%rax)
@@ -51169,7 +51700,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 125,255 // jge 22bed <_sk_load_a8_dst_hsw_8bit+0x131>
+ .byte 125,255 // jge 231bd <_sk_load_a8_dst_hsw_8bit+0x131>
.byte 255 // (bad)
.byte 255,113,255 // pushq -0x1(%rcx)
.byte 255 // (bad)
@@ -51205,49 +51736,49 @@ _sk_store_a8_hsw_8bit:
.byte 72,99,87,8 // movslq 0x8(%rdi),%rdx
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
- .byte 197,253,111,37,76,136,0,0 // vmovdqa 0x884c(%rip),%ymm4 # 2b480 <_sk_overlay_sse2_8bit+0xabf>
+ .byte 197,253,111,37,124,136,0,0 // vmovdqa 0x887c(%rip),%ymm4 # 2ba80 <_sk_overlay_sse2_8bit+0xacb>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,227,253,0,237,232 // vpermq $0xe8,%ymm5,%ymm5
- .byte 197,249,111,53,73,146,0,0 // vmovdqa 0x9249(%rip),%xmm6 # 2be90 <_sk_overlay_sse2_8bit+0x14cf>
+ .byte 197,249,111,53,121,146,0,0 // vmovdqa 0x9279(%rip),%xmm6 # 2c490 <_sk_overlay_sse2_8bit+0x14db>
.byte 196,226,81,0,238 // vpshufb %xmm6,%xmm5,%xmm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 196,227,253,0,228,232 // vpermq $0xe8,%ymm4,%ymm4
.byte 196,226,89,0,230 // vpshufb %xmm6,%xmm4,%xmm4
.byte 197,217,108,229 // vpunpcklqdq %xmm5,%xmm4,%xmm4
.byte 77,133,201 // test %r9,%r9
- .byte 117,10 // jne 22c6f <_sk_store_a8_hsw_8bit+0x5b>
+ .byte 117,10 // jne 2323f <_sk_store_a8_hsw_8bit+0x5b>
.byte 196,161,122,127,36,2 // vmovdqu %xmm4,(%rdx,%r8,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,239 // ja 22c6b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 119,239 // ja 2323b <_sk_store_a8_hsw_8bit+0x57>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,137,0,0,0 // lea 0x89(%rip),%rcx # 22d10 <_sk_store_a8_hsw_8bit+0xfc>
+ .byte 72,141,13,137,0,0,0 // lea 0x89(%rip),%rcx # 232e0 <_sk_store_a8_hsw_8bit+0xfc>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,163,121,20,36,2,0 // vpextrb $0x0,%xmm4,(%rdx,%r8,1)
- .byte 235,210 // jmp 22c6b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 235,210 // jmp 2323b <_sk_store_a8_hsw_8bit+0x57>
.byte 196,163,121,20,100,2,2,2 // vpextrb $0x2,%xmm4,0x2(%rdx,%r8,1)
.byte 196,163,121,21,36,2,0 // vpextrw $0x0,%xmm4,(%rdx,%r8,1)
- .byte 235,193 // jmp 22c6b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 235,193 // jmp 2323b <_sk_store_a8_hsw_8bit+0x57>
.byte 196,163,121,20,100,2,6,6 // vpextrb $0x6,%xmm4,0x6(%rdx,%r8,1)
.byte 196,163,121,20,100,2,5,5 // vpextrb $0x5,%xmm4,0x5(%rdx,%r8,1)
.byte 196,163,121,20,100,2,4,4 // vpextrb $0x4,%xmm4,0x4(%rdx,%r8,1)
.byte 196,161,121,126,36,2 // vmovd %xmm4,(%rdx,%r8,1)
- .byte 235,161 // jmp 22c6b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 235,161 // jmp 2323b <_sk_store_a8_hsw_8bit+0x57>
.byte 196,163,121,20,100,2,10,10 // vpextrb $0xa,%xmm4,0xa(%rdx,%r8,1)
.byte 196,163,121,20,100,2,9,9 // vpextrb $0x9,%xmm4,0x9(%rdx,%r8,1)
.byte 196,163,121,20,100,2,8,8 // vpextrb $0x8,%xmm4,0x8(%rdx,%r8,1)
- .byte 235,32 // jmp 22d04 <_sk_store_a8_hsw_8bit+0xf0>
+ .byte 235,32 // jmp 232d4 <_sk_store_a8_hsw_8bit+0xf0>
.byte 196,163,121,20,100,2,14,14 // vpextrb $0xe,%xmm4,0xe(%rdx,%r8,1)
.byte 196,163,121,20,100,2,13,13 // vpextrb $0xd,%xmm4,0xd(%rdx,%r8,1)
.byte 196,163,121,20,100,2,12,12 // vpextrb $0xc,%xmm4,0xc(%rdx,%r8,1)
.byte 196,163,121,22,100,2,8,2 // vpextrd $0x2,%xmm4,0x8(%rdx,%r8,1)
.byte 196,161,121,214,36,2 // vmovq %xmm4,(%rdx,%r8,1)
- .byte 233,92,255,255,255 // jmpq 22c6b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 233,92,255,255,255 // jmpq 2323b <_sk_store_a8_hsw_8bit+0x57>
.byte 144 // nop
.byte 128,255,255 // cmp $0xff,%bh
.byte 255,145,255,255,255,137 // callq *-0x76000001(%rcx)
@@ -51295,15 +51826,15 @@ _sk_load_g8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,61 // jne 22da6 <_sk_load_g8_hsw_8bit+0x5a>
+ .byte 117,61 // jne 23376 <_sk_load_g8_hsw_8bit+0x5a>
.byte 196,161,122,111,4,2 // vmovdqu (%rdx,%r8,1),%xmm0
.byte 196,226,125,49,200 // vpmovzxbd %xmm0,%ymm1
.byte 197,249,112,192,78 // vpshufd $0x4e,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
- .byte 196,226,125,88,37,13,130,0,0 // vpbroadcastd 0x820d(%rip),%ymm4 # 2af94 <_sk_overlay_sse2_8bit+0x5d3>
+ .byte 196,226,125,88,37,49,130,0,0 // vpbroadcastd 0x8231(%rip),%ymm4 # 2b588 <_sk_overlay_sse2_8bit+0x5d3>
.byte 196,226,125,64,236 // vpmulld %ymm4,%ymm0,%ymm5
.byte 196,226,117,64,196 // vpmulld %ymm4,%ymm1,%ymm0
- .byte 196,226,125,88,13,254,129,0,0 // vpbroadcastd 0x81fe(%rip),%ymm1 # 2af98 <_sk_overlay_sse2_8bit+0x5d7>
+ .byte 196,226,125,88,13,34,130,0,0 // vpbroadcastd 0x8222(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x5d7>
.byte 197,253,235,193 // vpor %ymm1,%ymm0,%ymm0
.byte 197,213,235,201 // vpor %ymm1,%ymm5,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -51312,35 +51843,35 @@ _sk_load_g8_hsw_8bit:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,184 // ja 22d6f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 119,184 // ja 2333f <_sk_load_g8_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 22e88 <_sk_load_g8_hsw_8bit+0x13c>
+ .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 23458 <_sk_load_g8_hsw_8bit+0x13c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,153 // jmp 22d6f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 235,153 // jmp 2333f <_sk_load_g8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,227,121,14,193,1 // vpblendw $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,121,255,255,255 // jmpq 22d6f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 233,121,255,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,161,121,110,12,2 // vmovd (%rdx,%r8,1),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,76,255,255,255 // jmpq 22d6f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 233,76,255,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,31,255,255,255 // jmpq 22d6f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 233,31,255,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0
@@ -51348,7 +51879,7 @@ _sk_load_g8_hsw_8bit:
.byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1
.byte 196,163,113,34,76,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1
.byte 196,227,113,2,192,8 // vpblendd $0x8,%xmm0,%xmm1,%xmm0
- .byte 233,234,254,255,255 // jmpq 22d6f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 233,234,254,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23>
.byte 15,31,0 // nopl (%rax)
.byte 67,255 // rex.XB (bad)
.byte 255 // (bad)
@@ -51360,7 +51891,7 @@ _sk_load_g8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 122,255 // jp 22e9d <_sk_load_g8_hsw_8bit+0x151>
+ .byte 122,255 // jp 2346d <_sk_load_g8_hsw_8bit+0x151>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -51396,15 +51927,15 @@ _sk_load_g8_dst_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,61 // jne 22f1e <_sk_load_g8_dst_hsw_8bit+0x5a>
+ .byte 117,61 // jne 234ee <_sk_load_g8_dst_hsw_8bit+0x5a>
.byte 196,161,122,111,20,2 // vmovdqu (%rdx,%r8,1),%xmm2
.byte 196,226,125,49,218 // vpmovzxbd %xmm2,%ymm3
.byte 197,249,112,210,78 // vpshufd $0x4e,%xmm2,%xmm2
.byte 196,226,125,49,210 // vpmovzxbd %xmm2,%ymm2
- .byte 196,226,125,88,37,149,128,0,0 // vpbroadcastd 0x8095(%rip),%ymm4 # 2af94 <_sk_overlay_sse2_8bit+0x5d3>
+ .byte 196,226,125,88,37,185,128,0,0 // vpbroadcastd 0x80b9(%rip),%ymm4 # 2b588 <_sk_overlay_sse2_8bit+0x5d3>
.byte 196,226,109,64,236 // vpmulld %ymm4,%ymm2,%ymm5
.byte 196,226,101,64,212 // vpmulld %ymm4,%ymm3,%ymm2
- .byte 196,226,125,88,29,134,128,0,0 // vpbroadcastd 0x8086(%rip),%ymm3 # 2af98 <_sk_overlay_sse2_8bit+0x5d7>
+ .byte 196,226,125,88,29,170,128,0,0 // vpbroadcastd 0x80aa(%rip),%ymm3 # 2b58c <_sk_overlay_sse2_8bit+0x5d7>
.byte 197,237,235,211 // vpor %ymm3,%ymm2,%ymm2
.byte 197,213,235,219 // vpor %ymm3,%ymm5,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -51413,35 +51944,35 @@ _sk_load_g8_dst_hsw_8bit:
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,184 // ja 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 119,184 // ja 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 23000 <_sk_load_g8_dst_hsw_8bit+0x13c>
+ .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 235d0 <_sk_load_g8_dst_hsw_8bit+0x13c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
- .byte 235,153 // jmp 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 235,153 // jmp 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,216 // vmovd %eax,%xmm3
.byte 196,227,105,14,211,1 // vpblendw $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,121,255,255,255 // jmpq 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 233,121,255,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,161,121,110,28,2 // vmovd (%rdx,%r8,1),%xmm3
.byte 196,227,105,2,211,1 // vpblendd $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,76,255,255,255 // jmpq 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 233,76,255,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3
.byte 196,227,97,2,210,12 // vpblendd $0xc,%xmm2,%xmm3,%xmm2
- .byte 233,31,255,255,255 // jmpq 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 233,31,255,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2
@@ -51449,7 +51980,7 @@ _sk_load_g8_dst_hsw_8bit:
.byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3
.byte 196,163,97,34,92,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3
.byte 196,227,97,2,210,8 // vpblendd $0x8,%xmm2,%xmm3,%xmm2
- .byte 233,234,254,255,255 // jmpq 22ee7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 233,234,254,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 15,31,0 // nopl (%rax)
.byte 67,255 // rex.XB (bad)
.byte 255 // (bad)
@@ -51461,7 +51992,7 @@ _sk_load_g8_dst_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 122,255 // jp 23015 <_sk_load_g8_dst_hsw_8bit+0x151>
+ .byte 122,255 // jp 235e5 <_sk_load_g8_dst_hsw_8bit+0x151>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -51498,10 +52029,10 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,222,0,0,0 // jne 2313f <_sk_srcover_rgba_8888_hsw_8bit+0x103>
+ .byte 15,133,222,0,0,0 // jne 2370f <_sk_srcover_rgba_8888_hsw_8bit+0x103>
.byte 196,33,126,111,76,138,32 // vmovdqu 0x20(%rdx,%r9,4),%ymm9
.byte 196,33,126,111,28,138 // vmovdqu (%rdx,%r9,4),%ymm11
- .byte 197,253,111,53,42,132,0,0 // vmovdqa 0x842a(%rip),%ymm6 # 2b4a0 <_sk_overlay_sse2_8bit+0xadf>
+ .byte 197,253,111,53,90,132,0,0 // vmovdqa 0x845a(%rip),%ymm6 # 2baa0 <_sk_overlay_sse2_8bit+0xaeb>
.byte 196,226,117,0,254 // vpshufb %ymm6,%ymm1,%ymm7
.byte 196,226,125,0,246 // vpshufb %ymm6,%ymm0,%ymm6
.byte 196,66,125,48,195 // vpmovzxbw %xmm11,%ymm8
@@ -51539,7 +52070,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 197,221,252,224 // vpaddb %ymm0,%ymm4,%ymm4
.byte 197,213,252,233 // vpaddb %ymm1,%ymm5,%ymm5
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne 23176 <_sk_srcover_rgba_8888_hsw_8bit+0x13a>
+ .byte 117,72 // jne 23746 <_sk_srcover_rgba_8888_hsw_8bit+0x13a>
.byte 196,161,126,127,36,138 // vmovdqu %ymm4,(%rdx,%r9,4)
.byte 196,161,126,127,108,138,32 // vmovdqu %ymm5,0x20(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -51550,25 +52081,25 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,65,37,239,219 // vpxor %ymm11,%ymm11,%ymm11
.byte 254,200 // dec %al
.byte 60,14 // cmp $0xe,%al
- .byte 15,135,22,255,255,255 // ja 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 15,135,22,255,255,255 // ja 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 15,182,192 // movzbl %al,%eax
- .byte 72,141,13,234,1,0,0 // lea 0x1ea(%rip),%rcx # 2334c <_sk_srcover_rgba_8888_hsw_8bit+0x310>
+ .byte 72,141,13,234,1,0,0 // lea 0x1ea(%rip),%rcx # 2391c <_sk_srcover_rgba_8888_hsw_8bit+0x310>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,33,121,110,28,138 // vmovd (%rdx,%r9,4),%xmm11
- .byte 233,248,254,255,255 // jmpq 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 233,248,254,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 65,128,224,15 // and $0xf,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,14 // cmp $0xe,%r8b
- .byte 119,184 // ja 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 119,184 // ja 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,250,1,0,0 // lea 0x1fa(%rip),%rcx # 23388 <_sk_srcover_rgba_8888_hsw_8bit+0x34c>
+ .byte 72,141,13,250,1,0,0 // lea 0x1fa(%rip),%rcx # 23958 <_sk_srcover_rgba_8888_hsw_8bit+0x34c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,126,36,138 // vmovd %xmm4,(%rdx,%r9,4)
- .byte 235,156 // jmp 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 235,156 // jmp 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 196,161,121,110,100,138,8 // vmovd 0x8(%rdx,%r9,4),%xmm4
.byte 196,226,121,89,236 // vpbroadcastq %xmm4,%xmm5
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
@@ -51576,7 +52107,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,162,121,53,52,138 // vpmovzxdq (%rdx,%r9,4),%xmm6
.byte 197,249,112,246,232 // vpshufd $0xe8,%xmm6,%xmm6
.byte 196,99,37,2,222,3 // vpblendd $0x3,%ymm6,%ymm11,%ymm11
- .byte 233,162,254,255,255 // jmpq 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 233,162,254,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 196,161,121,110,100,138,24 // vmovd 0x18(%rdx,%r9,4),%xmm4
.byte 196,226,125,89,236 // vpbroadcastq %xmm4,%ymm5
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
@@ -51589,7 +52120,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,99,37,56,222,1 // vinserti128 $0x1,%xmm6,%ymm11,%ymm11
.byte 196,161,122,111,52,138 // vmovdqu (%rdx,%r9,4),%xmm6
.byte 196,67,77,2,219,240 // vpblendd $0xf0,%ymm11,%ymm6,%ymm11
- .byte 233,82,254,255,255 // jmpq 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 233,82,254,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 196,161,121,110,100,138,40 // vmovd 0x28(%rdx,%r9,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -51598,7 +52129,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,99,53,2,205,15 // vpblendd $0xf,%ymm5,%ymm9,%ymm9
.byte 196,161,121,110,108,138,32 // vmovd 0x20(%rdx,%r9,4),%xmm5
.byte 196,99,53,2,205,1 // vpblendd $0x1,%ymm5,%ymm9,%ymm9
- .byte 233,22,254,255,255 // jmpq 23068 <_sk_srcover_rgba_8888_hsw_8bit+0x2c>
+ .byte 233,22,254,255,255 // jmpq 23638 <_sk_srcover_rgba_8888_hsw_8bit+0x2c>
.byte 196,161,121,110,100,138,56 // vmovd 0x38(%rdx,%r9,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -51612,10 +52143,10 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,33,126,111,28,138 // vmovdqu (%rdx,%r9,4),%ymm11
.byte 196,161,122,111,116,138,32 // vmovdqu 0x20(%rdx,%r9,4),%xmm6
.byte 196,67,77,2,201,240 // vpblendd $0xf0,%ymm9,%ymm6,%ymm9
- .byte 233,198,253,255,255 // jmpq 2306e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 233,198,253,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 196,163,121,22,100,138,8,2 // vpextrd $0x2,%xmm4,0x8(%rdx,%r9,4)
.byte 196,161,121,214,36,138 // vmovq %xmm4,(%rdx,%r9,4)
- .byte 233,128,254,255,255 // jmpq 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 233,128,254,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,163,121,22,108,138,24,2 // vpextrd $0x2,%xmm5,0x18(%rdx,%r9,4)
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
@@ -51623,12 +52154,12 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,161,121,126,108,138,16 // vmovd %xmm5,0x10(%rdx,%r9,4)
.byte 196,161,122,127,36,138 // vmovdqu %xmm4,(%rdx,%r9,4)
- .byte 233,76,254,255,255 // jmpq 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 233,76,254,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 196,163,121,22,108,138,40,2 // vpextrd $0x2,%xmm5,0x28(%rdx,%r9,4)
.byte 196,163,121,22,108,138,36,1 // vpextrd $0x1,%xmm5,0x24(%rdx,%r9,4)
.byte 196,161,121,126,108,138,32 // vmovd %xmm5,0x20(%rdx,%r9,4)
.byte 196,161,126,127,36,138 // vmovdqu %ymm4,(%rdx,%r9,4)
- .byte 233,42,254,255,255 // jmpq 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 233,42,254,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
.byte 196,163,121,22,116,138,56,2 // vpextrd $0x2,%xmm6,0x38(%rdx,%r9,4)
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
@@ -51637,7 +52168,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,161,121,126,116,138,48 // vmovd %xmm6,0x30(%rdx,%r9,4)
.byte 196,161,126,127,36,138 // vmovdqu %ymm4,(%rdx,%r9,4)
.byte 196,161,122,127,108,138,32 // vmovdqu %xmm5,0x20(%rdx,%r9,4)
- .byte 233,239,253,255,255 // jmpq 2313b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 233,239,253,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 31 // (bad)
.byte 254 // (bad)
.byte 255 // (bad)
@@ -51687,7 +52218,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 126,255 // jle 233a5 <_sk_srcover_rgba_8888_hsw_8bit+0x369>
+ .byte 126,255 // jle 23975 <_sk_srcover_rgba_8888_hsw_8bit+0x369>
.byte 255 // (bad)
.byte 255,119,255 // pushq -0x1(%rdi)
.byte 255 // (bad)
@@ -51709,7 +52240,7 @@ FUNCTION(_sk_scale_1_float_hsw_8bit)
_sk_scale_1_float_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,250,16,32 // vmovss (%rax),%xmm4
- .byte 197,218,89,37,94,122,0,0 // vmulss 0x7a5e(%rip),%xmm4,%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 197,218,89,37,130,122,0,0 // vmulss 0x7a82(%rip),%xmm4,%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 197,250,44,196 // vcvttss2si %xmm4,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,120,228 // vpbroadcastb %xmm4,%ymm4
@@ -51719,7 +52250,7 @@ _sk_scale_1_float_hsw_8bit:
.byte 196,226,125,48,241 // vpmovzxbw %xmm1,%ymm6
.byte 196,227,125,57,201,1 // vextracti128 $0x1,%ymm1,%xmm1
.byte 196,226,125,48,201 // vpmovzxbw %xmm1,%ymm1
- .byte 197,221,219,37,185,128,0,0 // vpand 0x80b9(%rip),%ymm4,%ymm4 # 2b4c0 <_sk_overlay_sse2_8bit+0xaff>
+ .byte 197,221,219,37,233,128,0,0 // vpand 0x80e9(%rip),%ymm4,%ymm4 # 2bac0 <_sk_overlay_sse2_8bit+0xb0b>
.byte 197,221,213,249 // vpmullw %ymm1,%ymm4,%ymm7
.byte 197,93,213,198 // vpmullw %ymm6,%ymm4,%ymm8
.byte 197,93,213,200 // vpmullw %ymm0,%ymm4,%ymm9
@@ -51753,12 +52284,12 @@ _sk_scale_u8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,191,0,0,0 // jne 2353f <_sk_scale_u8_hsw_8bit+0xe0>
+ .byte 15,133,191,0,0,0 // jne 23b0f <_sk_scale_u8_hsw_8bit+0xe0>
.byte 196,161,122,111,36,2 // vmovdqu (%rdx,%r8,1),%xmm4
.byte 196,226,125,49,236 // vpmovzxbd %xmm4,%ymm5
.byte 197,249,112,228,78 // vpshufd $0x4e,%xmm4,%xmm4
.byte 196,226,125,49,228 // vpmovzxbd %xmm4,%ymm4
- .byte 197,253,111,53,67,128,0,0 // vmovdqa 0x8043(%rip),%ymm6 # 2b4e0 <_sk_overlay_sse2_8bit+0xb1f>
+ .byte 197,253,111,53,115,128,0,0 // vmovdqa 0x8073(%rip),%ymm6 # 2bae0 <_sk_overlay_sse2_8bit+0xb2b>
.byte 196,226,93,0,230 // vpshufb %ymm6,%ymm4,%ymm4
.byte 196,226,85,0,238 // vpshufb %ymm6,%ymm5,%ymm5
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -51797,35 +52328,35 @@ _sk_scale_u8_hsw_8bit:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 15,135,50,255,255,255 // ja 23486 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 15,135,50,255,255,255 // ja 23a56 <_sk_scale_u8_hsw_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 23628 <_sk_scale_u8_hsw_8bit+0x1c9>
+ .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 23bf8 <_sk_scale_u8_hsw_8bit+0x1c9>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,16,255,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,16,255,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,227,89,14,229,1 // vpblendw $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,240,254,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,240,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,161,121,110,44,2 // vmovd (%rdx,%r8,1),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,195,254,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,195,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,150,254,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,150,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4
@@ -51833,7 +52364,7 @@ _sk_scale_u8_hsw_8bit:
.byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5
.byte 196,163,81,34,108,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5
.byte 196,227,81,2,228,8 // vpblendd $0x8,%xmm4,%xmm5,%xmm4
- .byte 233,97,254,255,255 // jmpq 23486 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,97,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 64,255 // rex (bad)
.byte 255 // (bad)
@@ -51845,7 +52376,7 @@ _sk_scale_u8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 122,255 // jp 2363d <_sk_scale_u8_hsw_8bit+0x1de>
+ .byte 122,255 // jp 23c0d <_sk_scale_u8_hsw_8bit+0x1de>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -51875,7 +52406,7 @@ FUNCTION(_sk_lerp_1_float_hsw_8bit)
_sk_lerp_1_float_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,250,16,32 // vmovss (%rax),%xmm4
- .byte 197,218,89,37,190,119,0,0 // vmulss 0x77be(%rip),%xmm4,%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 197,218,89,37,226,119,0,0 // vmulss 0x77e2(%rip),%xmm4,%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 197,250,44,196 // vcvttss2si %xmm4,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,120,228 // vpbroadcastb %xmm4,%ymm4
@@ -51885,7 +52416,7 @@ _sk_lerp_1_float_hsw_8bit:
.byte 196,226,125,48,241 // vpmovzxbw %xmm1,%ymm6
.byte 196,227,125,57,201,1 // vextracti128 $0x1,%ymm1,%xmm1
.byte 196,226,125,48,201 // vpmovzxbw %xmm1,%ymm1
- .byte 197,221,219,61,89,126,0,0 // vpand 0x7e59(%rip),%ymm4,%ymm7 # 2b500 <_sk_overlay_sse2_8bit+0xb3f>
+ .byte 197,221,219,61,137,126,0,0 // vpand 0x7e89(%rip),%ymm4,%ymm7 # 2bb00 <_sk_overlay_sse2_8bit+0xb4b>
.byte 197,69,213,193 // vpmullw %ymm1,%ymm7,%ymm8
.byte 197,69,213,206 // vpmullw %ymm6,%ymm7,%ymm9
.byte 197,69,213,208 // vpmullw %ymm0,%ymm7,%ymm10
@@ -51950,12 +52481,12 @@ _sk_lerp_u8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,106,1,0,0 // jne 2391f <_sk_lerp_u8_hsw_8bit+0x18b>
+ .byte 15,133,106,1,0,0 // jne 23eef <_sk_lerp_u8_hsw_8bit+0x18b>
.byte 196,161,122,111,36,2 // vmovdqu (%rdx,%r8,1),%xmm4
.byte 196,226,125,49,236 // vpmovzxbd %xmm4,%ymm5
.byte 197,249,112,228,78 // vpshufd $0x4e,%xmm4,%xmm4
.byte 196,226,125,49,228 // vpmovzxbd %xmm4,%ymm4
- .byte 197,253,111,53,78,125,0,0 // vmovdqa 0x7d4e(%rip),%ymm6 # 2b520 <_sk_overlay_sse2_8bit+0xb5f>
+ .byte 197,253,111,53,126,125,0,0 // vmovdqa 0x7d7e(%rip),%ymm6 # 2bb20 <_sk_overlay_sse2_8bit+0xb6b>
.byte 196,98,93,0,206 // vpshufb %ymm6,%ymm4,%ymm9
.byte 196,98,85,0,222 // vpshufb %ymm6,%ymm5,%ymm11
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -52029,35 +52560,35 @@ _sk_lerp_u8_hsw_8bit:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 15,135,135,254,255,255 // ja 237bb <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 15,135,135,254,255,255 // ja 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 23a08 <_sk_lerp_u8_hsw_8bit+0x274>
+ .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 23fd8 <_sk_lerp_u8_hsw_8bit+0x274>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,101,254,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,101,254,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,227,89,14,229,1 // vpblendw $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,69,254,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,69,254,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,161,121,110,44,2 // vmovd (%rdx,%r8,1),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,24,254,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,24,254,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,235,253,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,235,253,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4
@@ -52065,7 +52596,7 @@ _sk_lerp_u8_hsw_8bit:
.byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5
.byte 196,163,81,34,108,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5
.byte 196,227,81,2,228,8 // vpblendd $0x8,%xmm4,%xmm5,%xmm4
- .byte 233,182,253,255,255 // jmpq 237bb <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,182,253,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 64,255 // rex (bad)
.byte 255 // (bad)
@@ -52077,7 +52608,7 @@ _sk_lerp_u8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 122,255 // jp 23a1d <_sk_lerp_u8_hsw_8bit+0x289>
+ .byte 122,255 // jp 23fed <_sk_lerp_u8_hsw_8bit+0x289>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -52124,7 +52655,7 @@ HIDDEN _sk_black_color_hsw_8bit
FUNCTION(_sk_black_color_hsw_8bit)
_sk_black_color_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,49,117,0,0 // vbroadcastss 0x7531(%rip),%ymm0 # 2af98 <_sk_overlay_sse2_8bit+0x5d7>
+ .byte 196,226,125,24,5,85,117,0,0 // vbroadcastss 0x7555(%rip),%ymm0 # 2b58c <_sk_overlay_sse2_8bit+0x5d7>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 255,224 // jmpq *%rax
@@ -52150,7 +52681,7 @@ HIDDEN _sk_srcatop_hsw_8bit
.globl _sk_srcatop_hsw_8bit
FUNCTION(_sk_srcatop_hsw_8bit)
_sk_srcatop_hsw_8bit:
- .byte 197,125,111,5,179,122,0,0 // vmovdqa 0x7ab3(%rip),%ymm8 # 2b540 <_sk_overlay_sse2_8bit+0xb7f>
+ .byte 197,125,111,5,227,122,0,0 // vmovdqa 0x7ae3(%rip),%ymm8 # 2bb40 <_sk_overlay_sse2_8bit+0xb8b>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,232 // vpshufb %ymm8,%ymm2,%ymm5
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -52227,7 +52758,7 @@ HIDDEN _sk_dstatop_hsw_8bit
.globl _sk_dstatop_hsw_8bit
FUNCTION(_sk_dstatop_hsw_8bit)
_sk_dstatop_hsw_8bit:
- .byte 197,125,111,5,110,121,0,0 // vmovdqa 0x796e(%rip),%ymm8 # 2b560 <_sk_overlay_sse2_8bit+0xb9f>
+ .byte 197,125,111,5,158,121,0,0 // vmovdqa 0x799e(%rip),%ymm8 # 2bb60 <_sk_overlay_sse2_8bit+0xbab>
.byte 196,194,117,0,224 // vpshufb %ymm8,%ymm1,%ymm4
.byte 196,194,125,0,232 // vpshufb %ymm8,%ymm0,%ymm5
.byte 196,98,125,48,210 // vpmovzxbw %xmm2,%ymm10
@@ -52304,7 +52835,7 @@ HIDDEN _sk_srcin_hsw_8bit
.globl _sk_srcin_hsw_8bit
FUNCTION(_sk_srcin_hsw_8bit)
_sk_srcin_hsw_8bit:
- .byte 197,253,111,37,37,120,0,0 // vmovdqa 0x7825(%rip),%ymm4 # 2b580 <_sk_overlay_sse2_8bit+0xbbf>
+ .byte 197,253,111,37,85,120,0,0 // vmovdqa 0x7855(%rip),%ymm4 # 2bb80 <_sk_overlay_sse2_8bit+0xbcb>
.byte 196,226,101,0,236 // vpshufb %ymm4,%ymm3,%ymm5
.byte 196,226,109,0,228 // vpshufb %ymm4,%ymm2,%ymm4
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -52344,7 +52875,7 @@ HIDDEN _sk_dstin_hsw_8bit
.globl _sk_dstin_hsw_8bit
FUNCTION(_sk_dstin_hsw_8bit)
_sk_dstin_hsw_8bit:
- .byte 197,253,111,37,155,119,0,0 // vmovdqa 0x779b(%rip),%ymm4 # 2b5a0 <_sk_overlay_sse2_8bit+0xbdf>
+ .byte 197,253,111,37,203,119,0,0 // vmovdqa 0x77cb(%rip),%ymm4 # 2bba0 <_sk_overlay_sse2_8bit+0xbeb>
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,125,48,226 // vpmovzxbw %xmm2,%ymm4
@@ -52384,7 +52915,7 @@ HIDDEN _sk_srcout_hsw_8bit
.globl _sk_srcout_hsw_8bit
FUNCTION(_sk_srcout_hsw_8bit)
_sk_srcout_hsw_8bit:
- .byte 197,253,111,37,15,119,0,0 // vmovdqa 0x770f(%rip),%ymm4 # 2b5c0 <_sk_overlay_sse2_8bit+0xbff>
+ .byte 197,253,111,37,63,119,0,0 // vmovdqa 0x773f(%rip),%ymm4 # 2bbc0 <_sk_overlay_sse2_8bit+0xc0b>
.byte 196,226,109,0,236 // vpshufb %ymm4,%ymm2,%ymm5
.byte 196,226,101,0,228 // vpshufb %ymm4,%ymm3,%ymm4
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
@@ -52427,7 +52958,7 @@ HIDDEN _sk_dstout_hsw_8bit
.globl _sk_dstout_hsw_8bit
FUNCTION(_sk_dstout_hsw_8bit)
_sk_dstout_hsw_8bit:
- .byte 197,253,111,37,121,118,0,0 // vmovdqa 0x7679(%rip),%ymm4 # 2b5e0 <_sk_overlay_sse2_8bit+0xc1f>
+ .byte 197,253,111,37,169,118,0,0 // vmovdqa 0x76a9(%rip),%ymm4 # 2bbe0 <_sk_overlay_sse2_8bit+0xc2b>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 197,221,118,228 // vpcmpeqd %ymm4,%ymm4,%ymm4
@@ -52470,7 +53001,7 @@ HIDDEN _sk_srcover_hsw_8bit
.globl _sk_srcover_hsw_8bit
FUNCTION(_sk_srcover_hsw_8bit)
_sk_srcover_hsw_8bit:
- .byte 197,253,111,37,225,117,0,0 // vmovdqa 0x75e1(%rip),%ymm4 # 2b600 <_sk_overlay_sse2_8bit+0xc3f>
+ .byte 197,253,111,37,17,118,0,0 // vmovdqa 0x7611(%rip),%ymm4 # 2bc00 <_sk_overlay_sse2_8bit+0xc4b>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 196,98,125,48,202 // vpmovzxbw %xmm2,%ymm9
@@ -52514,7 +53045,7 @@ HIDDEN _sk_dstover_hsw_8bit
.globl _sk_dstover_hsw_8bit
FUNCTION(_sk_dstover_hsw_8bit)
_sk_dstover_hsw_8bit:
- .byte 197,253,111,37,66,117,0,0 // vmovdqa 0x7542(%rip),%ymm4 # 2b620 <_sk_overlay_sse2_8bit+0xc5f>
+ .byte 197,253,111,37,114,117,0,0 // vmovdqa 0x7572(%rip),%ymm4 # 2bc20 <_sk_overlay_sse2_8bit+0xc6b>
.byte 196,226,101,0,236 // vpshufb %ymm4,%ymm3,%ymm5
.byte 196,226,109,0,228 // vpshufb %ymm4,%ymm2,%ymm4
.byte 196,98,125,48,200 // vpmovzxbw %xmm0,%ymm9
@@ -52597,7 +53128,7 @@ FUNCTION(_sk_multiply_hsw_8bit)
_sk_multiply_hsw_8bit:
.byte 197,253,111,243 // vmovdqa %ymm3,%ymm6
.byte 197,253,111,218 // vmovdqa %ymm2,%ymm3
- .byte 197,125,111,13,3,116,0,0 // vmovdqa 0x7403(%rip),%ymm9 # 2b640 <_sk_overlay_sse2_8bit+0xc7f>
+ .byte 197,125,111,13,51,116,0,0 // vmovdqa 0x7433(%rip),%ymm9 # 2bc40 <_sk_overlay_sse2_8bit+0xc8b>
.byte 196,194,101,0,225 // vpshufb %ymm9,%ymm3,%ymm4
.byte 196,194,77,0,233 // vpshufb %ymm9,%ymm6,%ymm5
.byte 196,65,45,118,210 // vpcmpeqd %ymm10,%ymm10,%ymm10
@@ -52741,7 +53272,7 @@ HIDDEN _sk_xor__hsw_8bit
.globl _sk_xor__hsw_8bit
FUNCTION(_sk_xor__hsw_8bit)
_sk_xor__hsw_8bit:
- .byte 197,125,111,13,145,113,0,0 // vmovdqa 0x7191(%rip),%ymm9 # 2b660 <_sk_overlay_sse2_8bit+0xc9f>
+ .byte 197,125,111,13,193,113,0,0 // vmovdqa 0x71c1(%rip),%ymm9 # 2bc60 <_sk_overlay_sse2_8bit+0xcab>
.byte 196,194,109,0,225 // vpshufb %ymm9,%ymm2,%ymm4
.byte 196,194,101,0,249 // vpshufb %ymm9,%ymm3,%ymm7
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -52816,11 +53347,20 @@ _sk_xor__hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_plus__hsw_8bit
+.globl _sk_plus__hsw_8bit
+FUNCTION(_sk_plus__hsw_8bit)
+_sk_plus__hsw_8bit:
+ .byte 197,253,220,194 // vpaddusb %ymm2,%ymm0,%ymm0
+ .byte 197,245,220,203 // vpaddusb %ymm3,%ymm1,%ymm1
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 255,224 // jmpq *%rax
+
HIDDEN _sk_darken_hsw_8bit
.globl _sk_darken_hsw_8bit
FUNCTION(_sk_darken_hsw_8bit)
_sk_darken_hsw_8bit:
- .byte 197,125,111,5,63,112,0,0 // vmovdqa 0x703f(%rip),%ymm8 # 2b680 <_sk_overlay_sse2_8bit+0xcbf>
+ .byte 197,125,111,5,99,112,0,0 // vmovdqa 0x7063(%rip),%ymm8 # 2bc80 <_sk_overlay_sse2_8bit+0xccb>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -52893,7 +53433,7 @@ _sk_darken_hsw_8bit:
.byte 197,253,248,246 // vpsubb %ymm6,%ymm0,%ymm6
.byte 197,245,248,205 // vpsubb %ymm5,%ymm1,%ymm1
.byte 197,253,248,196 // vpsubb %ymm4,%ymm0,%ymm0
- .byte 196,226,125,88,37,236,103,0,0 // vpbroadcastd 0x67ec(%rip),%ymm4 # 2af9c <_sk_overlay_sse2_8bit+0x5db>
+ .byte 196,226,125,88,37,4,104,0,0 // vpbroadcastd 0x6804(%rip),%ymm4 # 2b590 <_sk_overlay_sse2_8bit+0x5db>
.byte 196,227,125,76,198,64 // vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
.byte 196,227,117,76,207,64 // vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -52903,7 +53443,7 @@ HIDDEN _sk_lighten_hsw_8bit
.globl _sk_lighten_hsw_8bit
FUNCTION(_sk_lighten_hsw_8bit)
_sk_lighten_hsw_8bit:
- .byte 197,125,111,5,216,110,0,0 // vmovdqa 0x6ed8(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0xcdf>
+ .byte 197,125,111,5,252,110,0,0 // vmovdqa 0x6efc(%rip),%ymm8 # 2bca0 <_sk_overlay_sse2_8bit+0xceb>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -52976,7 +53516,7 @@ _sk_lighten_hsw_8bit:
.byte 197,253,248,246 // vpsubb %ymm6,%ymm0,%ymm6
.byte 197,245,248,205 // vpsubb %ymm5,%ymm1,%ymm1
.byte 197,253,248,196 // vpsubb %ymm4,%ymm0,%ymm0
- .byte 196,226,125,88,37,101,102,0,0 // vpbroadcastd 0x6665(%rip),%ymm4 # 2af9c <_sk_overlay_sse2_8bit+0x5db>
+ .byte 196,226,125,88,37,125,102,0,0 // vpbroadcastd 0x667d(%rip),%ymm4 # 2b590 <_sk_overlay_sse2_8bit+0x5db>
.byte 196,227,125,76,198,64 // vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
.byte 196,227,117,76,207,64 // vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53016,7 +53556,7 @@ _sk_exclusion_hsw_8bit:
.byte 196,227,77,56,252,1 // vinserti128 $0x1,%xmm4,%ymm6,%ymm7
.byte 196,227,77,70,228,49 // vperm2i128 $0x31,%ymm4,%ymm6,%ymm4
.byte 197,197,103,228 // vpackuswb %ymm4,%ymm7,%ymm4
- .byte 197,253,111,53,218,108,0,0 // vmovdqa 0x6cda(%rip),%ymm6 # 2b6c0 <_sk_overlay_sse2_8bit+0xcff>
+ .byte 197,253,111,53,254,108,0,0 // vmovdqa 0x6cfe(%rip),%ymm6 # 2bcc0 <_sk_overlay_sse2_8bit+0xd0b>
.byte 197,221,219,254 // vpand %ymm6,%ymm4,%ymm7
.byte 197,213,219,246 // vpand %ymm6,%ymm5,%ymm6
.byte 197,237,252,192 // vpaddb %ymm0,%ymm2,%ymm0
@@ -53032,7 +53572,7 @@ HIDDEN _sk_difference_hsw_8bit
.globl _sk_difference_hsw_8bit
FUNCTION(_sk_difference_hsw_8bit)
_sk_difference_hsw_8bit:
- .byte 197,125,111,5,206,108,0,0 // vmovdqa 0x6cce(%rip),%ymm8 # 2b6e0 <_sk_overlay_sse2_8bit+0xd1f>
+ .byte 197,125,111,5,242,108,0,0 // vmovdqa 0x6cf2(%rip),%ymm8 # 2bce0 <_sk_overlay_sse2_8bit+0xd2b>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -53099,7 +53639,7 @@ _sk_difference_hsw_8bit:
.byte 197,197,103,237 // vpackuswb %ymm5,%ymm7,%ymm5
.byte 197,181,218,228 // vpminub %ymm4,%ymm9,%ymm4
.byte 197,165,218,237 // vpminub %ymm5,%ymm11,%ymm5
- .byte 197,253,111,53,152,107,0,0 // vmovdqa 0x6b98(%rip),%ymm6 # 2b700 <_sk_overlay_sse2_8bit+0xd3f>
+ .byte 197,253,111,53,188,107,0,0 // vmovdqa 0x6bbc(%rip),%ymm6 # 2bd00 <_sk_overlay_sse2_8bit+0xd4b>
.byte 197,213,219,254 // vpand %ymm6,%ymm5,%ymm7
.byte 197,221,219,246 // vpand %ymm6,%ymm4,%ymm6
.byte 197,237,252,192 // vpaddb %ymm0,%ymm2,%ymm0
@@ -53125,7 +53665,7 @@ _sk_hardlight_hsw_8bit:
.byte 196,227,125,57,203,1 // vextracti128 $0x1,%ymm1,%xmm3
.byte 196,98,125,48,195 // vpmovzxbw %xmm3,%ymm8
.byte 197,126,127,132,36,192,0,0,0 // vmovdqu %ymm8,0xc0(%rsp)
- .byte 197,253,111,29,77,107,0,0 // vmovdqa 0x6b4d(%rip),%ymm3 # 2b720 <_sk_overlay_sse2_8bit+0xd5f>
+ .byte 197,253,111,29,113,107,0,0 // vmovdqa 0x6b71(%rip),%ymm3 # 2bd20 <_sk_overlay_sse2_8bit+0xd6b>
.byte 196,226,125,0,227 // vpshufb %ymm3,%ymm0,%ymm4
.byte 196,226,117,0,203 // vpshufb %ymm3,%ymm1,%ymm1
.byte 197,125,111,251 // vmovdqa %ymm3,%ymm15
@@ -53154,7 +53694,7 @@ _sk_hardlight_hsw_8bit:
.byte 196,65,125,111,231 // vmovdqa %ymm15,%ymm12
.byte 196,194,93,0,220 // vpshufb %ymm12,%ymm4,%ymm3
.byte 196,226,125,48,211 // vpmovzxbw %xmm3,%ymm2
- .byte 196,226,125,121,5,207,106,0,0 // vpbroadcastw 0x6acf(%rip),%ymm0 # 2b740 <_sk_overlay_sse2_8bit+0xd7f>
+ .byte 196,226,125,121,5,243,106,0,0 // vpbroadcastw 0x6af3(%rip),%ymm0 # 2bd40 <_sk_overlay_sse2_8bit+0xd8b>
.byte 197,109,239,248 // vpxor %ymm0,%ymm2,%ymm15
.byte 197,133,213,207 // vpmullw %ymm7,%ymm15,%ymm1
.byte 197,254,127,140,36,32,1,0,0 // vmovdqu %ymm1,0x120(%rsp)
@@ -53254,7 +53794,7 @@ _sk_hardlight_hsw_8bit:
.byte 197,254,111,116,36,224 // vmovdqu -0x20(%rsp),%ymm6
.byte 197,205,253,52,36 // vpaddw (%rsp),%ymm6,%ymm6
.byte 196,193,53,253,252 // vpaddw %ymm12,%ymm9,%ymm7
- .byte 196,98,125,121,5,199,104,0,0 // vpbroadcastw 0x68c7(%rip),%ymm8 # 2b742 <_sk_overlay_sse2_8bit+0xd81>
+ .byte 196,98,125,121,5,235,104,0,0 // vpbroadcastw 0x68eb(%rip),%ymm8 # 2bd42 <_sk_overlay_sse2_8bit+0xd8d>
.byte 196,193,93,253,224 // vpaddw %ymm8,%ymm4,%ymm4
.byte 197,229,253,220 // vpaddw %ymm4,%ymm3,%ymm3
.byte 196,193,85,253,224 // vpaddw %ymm8,%ymm5,%ymm4
@@ -53263,7 +53803,7 @@ _sk_hardlight_hsw_8bit:
.byte 197,245,253,204 // vpaddw %ymm4,%ymm1,%ymm1
.byte 196,193,69,253,224 // vpaddw %ymm8,%ymm7,%ymm4
.byte 197,253,253,196 // vpaddw %ymm4,%ymm0,%ymm0
- .byte 196,226,125,121,37,156,104,0,0 // vpbroadcastw 0x689c(%rip),%ymm4 # 2b744 <_sk_overlay_sse2_8bit+0xd83>
+ .byte 196,226,125,121,37,192,104,0,0 // vpbroadcastw 0x68c0(%rip),%ymm4 # 2bd44 <_sk_overlay_sse2_8bit+0xd8f>
.byte 197,253,228,196 // vpmulhuw %ymm4,%ymm0,%ymm0
.byte 197,245,228,204 // vpmulhuw %ymm4,%ymm1,%ymm1
.byte 197,237,228,212 // vpmulhuw %ymm4,%ymm2,%ymm2
@@ -53290,7 +53830,7 @@ FUNCTION(_sk_overlay_hsw_8bit)
_sk_overlay_hsw_8bit:
.byte 72,129,236,152,1,0,0 // sub $0x198,%rsp
.byte 197,252,17,140,36,64,1,0,0 // vmovups %ymm1,0x140(%rsp)
- .byte 197,253,111,45,66,104,0,0 // vmovdqa 0x6842(%rip),%ymm5 # 2b760 <_sk_overlay_sse2_8bit+0xd9f>
+ .byte 197,253,111,45,102,104,0,0 // vmovdqa 0x6866(%rip),%ymm5 # 2bd60 <_sk_overlay_sse2_8bit+0xdab>
.byte 197,253,111,226 // vmovdqa %ymm2,%ymm4
.byte 196,227,125,57,225,1 // vextracti128 $0x1,%ymm4,%xmm1
.byte 196,98,125,48,193 // vpmovzxbw %xmm1,%ymm8
@@ -53325,7 +53865,7 @@ _sk_overlay_hsw_8bit:
.byte 197,93,117,251 // vpcmpeqw %ymm3,%ymm4,%ymm15
.byte 197,253,111,216 // vmovdqa %ymm0,%ymm3
.byte 196,226,125,48,227 // vpmovzxbw %xmm3,%ymm4
- .byte 196,226,125,121,5,156,103,0,0 // vpbroadcastw 0x679c(%rip),%ymm0 # 2b780 <_sk_overlay_sse2_8bit+0xdbf>
+ .byte 196,226,125,121,5,192,103,0,0 // vpbroadcastw 0x67c0(%rip),%ymm0 # 2bd80 <_sk_overlay_sse2_8bit+0xdcb>
.byte 197,117,239,232 // vpxor %ymm0,%ymm1,%ymm13
.byte 197,21,213,212 // vpmullw %ymm4,%ymm13,%ymm10
.byte 197,126,127,148,36,192,0,0,0 // vmovdqu %ymm10,0xc0(%rsp)
@@ -53426,7 +53966,7 @@ _sk_overlay_hsw_8bit:
.byte 197,254,111,116,36,192 // vmovdqu -0x40(%rsp),%ymm6
.byte 197,205,253,116,36,224 // vpaddw -0x20(%rsp),%ymm6,%ymm6
.byte 196,193,29,253,253 // vpaddw %ymm13,%ymm12,%ymm7
- .byte 196,98,125,121,5,167,101,0,0 // vpbroadcastw 0x65a7(%rip),%ymm8 # 2b782 <_sk_overlay_sse2_8bit+0xdc1>
+ .byte 196,98,125,121,5,203,101,0,0 // vpbroadcastw 0x65cb(%rip),%ymm8 # 2bd82 <_sk_overlay_sse2_8bit+0xdcd>
.byte 196,193,109,253,208 // vpaddw %ymm8,%ymm2,%ymm2
.byte 197,229,253,210 // vpaddw %ymm2,%ymm3,%ymm2
.byte 196,193,85,253,216 // vpaddw %ymm8,%ymm5,%ymm3
@@ -53435,7 +53975,7 @@ _sk_overlay_hsw_8bit:
.byte 197,245,253,204 // vpaddw %ymm4,%ymm1,%ymm1
.byte 196,193,69,253,224 // vpaddw %ymm8,%ymm7,%ymm4
.byte 197,253,253,196 // vpaddw %ymm4,%ymm0,%ymm0
- .byte 196,226,125,121,37,124,101,0,0 // vpbroadcastw 0x657c(%rip),%ymm4 # 2b784 <_sk_overlay_sse2_8bit+0xdc3>
+ .byte 196,226,125,121,37,160,101,0,0 // vpbroadcastw 0x65a0(%rip),%ymm4 # 2bd84 <_sk_overlay_sse2_8bit+0xdcf>
.byte 197,253,228,196 // vpmulhuw %ymm4,%ymm0,%ymm0
.byte 197,245,228,204 // vpmulhuw %ymm4,%ymm1,%ymm1
.byte 197,229,228,220 // vpmulhuw %ymm4,%ymm3,%ymm3
@@ -53480,7 +54020,7 @@ _sk_start_pipeline_sse41_8bit:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,168 // mov %rcx,-0x58(%rbp)
.byte 73,57,207 // cmp %rcx,%r15
- .byte 115,102 // jae 25301 <_sk_start_pipeline_sse41_8bit+0x95>
+ .byte 115,102 // jae 258dd <_sk_start_pipeline_sse41_8bit+0x95>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,8 // lea 0x8(%rax),%rax
.byte 72,137,69,176 // mov %rax,-0x50(%rbp)
@@ -53490,7 +54030,7 @@ _sk_start_pipeline_sse41_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 76,137,125,192 // mov %r15,-0x40(%rbp)
.byte 72,199,69,200,0,0,0,0 // movq $0x0,-0x38(%rbp)
- .byte 119,30 // ja 252e3 <_sk_start_pipeline_sse41_8bit+0x77>
+ .byte 119,30 // ja 258bf <_sk_start_pipeline_sse41_8bit+0x77>
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
@@ -53499,17 +54039,17 @@ _sk_start_pipeline_sse41_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 72,131,193,16 // add $0x10,%rcx
.byte 72,57,217 // cmp %rbx,%rcx
- .byte 118,226 // jbe 252c5 <_sk_start_pipeline_sse41_8bit+0x59>
+ .byte 118,226 // jbe 258a1 <_sk_start_pipeline_sse41_8bit+0x59>
.byte 72,137,217 // mov %rbx,%rcx
.byte 72,41,193 // sub %rax,%rcx
- .byte 116,13 // je 252f8 <_sk_start_pipeline_sse41_8bit+0x8c>
+ .byte 116,13 // je 258d4 <_sk_start_pipeline_sse41_8bit+0x8c>
.byte 72,137,77,200 // mov %rcx,-0x38(%rbp)
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
.byte 73,255,199 // inc %r15
.byte 76,59,125,168 // cmp -0x58(%rbp),%r15
- .byte 117,170 // jne 252ab <_sk_start_pipeline_sse41_8bit+0x3f>
+ .byte 117,170 // jne 25887 <_sk_start_pipeline_sse41_8bit+0x3f>
.byte 72,131,196,56 // add $0x38,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -53541,7 +54081,7 @@ HIDDEN _sk_set_rgb_sse41_8bit
FUNCTION(_sk_set_rgb_sse41_8bit)
_sk_set_rgb_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,37,1,91,0,0 // movss 0x5b01(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,16,37,25,91,0,0 // movss 0x5b19(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,16,40 // movss (%rax),%xmm5
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 243,72,15,44,205 // cvttss2si %xmm5,%rcx
@@ -53556,7 +54096,7 @@ _sk_set_rgb_sse41_8bit:
.byte 9,208 // or %edx,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
- .byte 102,15,111,45,49,107,0,0 // movdqa 0x6b31(%rip),%xmm5 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,45,85,107,0,0 // movdqa 0x6b55(%rip),%xmm5 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,219,205 // pand %xmm5,%xmm1
.byte 102,15,219,197 // pand %xmm5,%xmm0
.byte 102,15,235,196 // por %xmm4,%xmm0
@@ -53570,12 +54110,12 @@ FUNCTION(_sk_premul_sse41_8bit)
_sk_premul_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,29,107,0,0 // movdqa 0x6b1d(%rip),%xmm0 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,5,65,107,0,0 // movdqa 0x6b41(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,111,253 // movdqa %xmm5,%xmm7
.byte 102,15,56,0,248 // pshufb %xmm0,%xmm7
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,56,0,240 // pshufb %xmm0,%xmm6
- .byte 102,15,111,5,243,106,0,0 // movdqa 0x6af3(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,5,23,107,0,0 // movdqa 0x6b17(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,235,240 // por %xmm0,%xmm6
.byte 102,15,235,248 // por %xmm0,%xmm7
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -53608,7 +54148,7 @@ HIDDEN _sk_swap_rb_sse41_8bit
.globl _sk_swap_rb_sse41_8bit
FUNCTION(_sk_swap_rb_sse41_8bit)
_sk_swap_rb_sse41_8bit:
- .byte 102,15,111,37,144,106,0,0 // movdqa 0x6a90(%rip),%xmm4 # 2bec0 <_sk_overlay_sse2_8bit+0x14ff>
+ .byte 102,15,111,37,180,106,0,0 // movdqa 0x6ab4(%rip),%xmm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53637,7 +54177,7 @@ _sk_load_8888_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 25480 <_sk_load_8888_sse41_8bit+0x32>
+ .byte 117,17 // jne 25a5c <_sk_load_8888_sse41_8bit+0x32>
.byte 243,66,15,111,76,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm1
.byte 243,66,15,111,4,130 // movdqu (%rdx,%r8,4),%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53647,24 +54187,24 @@ _sk_load_8888_sse41_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,231 // ja 2547c <_sk_load_8888_sse41_8bit+0x2e>
+ .byte 119,231 // ja 25a58 <_sk_load_8888_sse41_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,76,0,0,0 // lea 0x4c(%rip),%rcx # 254ec <_sk_load_8888_sse41_8bit+0x9e>
+ .byte 72,141,13,76,0,0,0 // lea 0x4c(%rip),%rcx # 25ac8 <_sk_load_8888_sse41_8bit+0x9e>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,110,4,130 // movd (%rdx,%r8,4),%xmm0
- .byte 235,203 // jmp 2547c <_sk_load_8888_sse41_8bit+0x2e>
+ .byte 235,203 // jmp 25a58 <_sk_load_8888_sse41_8bit+0x2e>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4
.byte 102,15,58,14,196,15 // pblendw $0xf,%xmm4,%xmm0
- .byte 235,177 // jmp 2547c <_sk_load_8888_sse41_8bit+0x2e>
+ .byte 235,177 // jmp 25a58 <_sk_load_8888_sse41_8bit+0x2e>
.byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 102,66,15,58,34,76,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1
.byte 102,66,15,58,34,76,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1
- .byte 235,139 // jmp 25476 <_sk_load_8888_sse41_8bit+0x28>
+ .byte 235,139 // jmp 25a52 <_sk_load_8888_sse41_8bit+0x28>
.byte 144 // nop
.byte 189,255,255,255,209 // mov $0xd1ffffff,%ebp
.byte 255 // (bad)
@@ -53676,7 +54216,7 @@ _sk_load_8888_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 235,255 // jmp 25501 <_sk_load_8888_sse41_8bit+0xb3>
+ .byte 235,255 // jmp 25add <_sk_load_8888_sse41_8bit+0xb3>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 223,255 // (bad)
@@ -53696,7 +54236,7 @@ _sk_load_8888_dst_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 2553a <_sk_load_8888_dst_sse41_8bit+0x32>
+ .byte 117,17 // jne 25b16 <_sk_load_8888_dst_sse41_8bit+0x32>
.byte 243,66,15,111,92,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm3
.byte 243,66,15,111,20,130 // movdqu (%rdx,%r8,4),%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53706,24 +54246,24 @@ _sk_load_8888_dst_sse41_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,231 // ja 25536 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ .byte 119,231 // ja 25b12 <_sk_load_8888_dst_sse41_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 255a8 <_sk_load_8888_dst_sse41_8bit+0xa0>
+ .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 25b84 <_sk_load_8888_dst_sse41_8bit+0xa0>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,110,20,130 // movd (%rdx,%r8,4),%xmm2
- .byte 235,203 // jmp 25536 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ .byte 235,203 // jmp 25b12 <_sk_load_8888_dst_sse41_8bit+0x2e>
.byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4
.byte 102,15,58,14,212,15 // pblendw $0xf,%xmm4,%xmm2
- .byte 235,177 // jmp 25536 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ .byte 235,177 // jmp 25b12 <_sk_load_8888_dst_sse41_8bit+0x2e>
.byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 102,66,15,58,34,92,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3
.byte 102,66,15,58,34,92,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3
- .byte 235,139 // jmp 25530 <_sk_load_8888_dst_sse41_8bit+0x28>
+ .byte 235,139 // jmp 25b0c <_sk_load_8888_dst_sse41_8bit+0x28>
.byte 15,31,0 // nopl (%rax)
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
@@ -53735,7 +54275,7 @@ _sk_load_8888_dst_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,221 // jmpq ffffffffde0255c0 <_sk_overlay_sse2_8bit+0xffffffffddffabff>
+ .byte 233,255,255,255,221 // jmpq ffffffffde025b9c <_sk_overlay_sse2_8bit+0xffffffffddffabe7>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -53753,7 +54293,7 @@ _sk_store_8888_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 255f6 <_sk_store_8888_sse41_8bit+0x32>
+ .byte 117,17 // jne 25bd2 <_sk_store_8888_sse41_8bit+0x32>
.byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4)
.byte 243,66,15,127,76,138,16 // movdqu %xmm1,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53761,22 +54301,22 @@ _sk_store_8888_sse41_8bit:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,239 // ja 255f2 <_sk_store_8888_sse41_8bit+0x2e>
+ .byte 119,239 // ja 25bce <_sk_store_8888_sse41_8bit+0x2e>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,70,0,0,0 // lea 0x46(%rip),%rcx # 25654 <_sk_store_8888_sse41_8bit+0x90>
+ .byte 72,141,13,70,0,0,0 // lea 0x46(%rip),%rcx # 25c30 <_sk_store_8888_sse41_8bit+0x90>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,126,4,138 // movd %xmm0,(%rdx,%r9,4)
- .byte 235,211 // jmp 255f2 <_sk_store_8888_sse41_8bit+0x2e>
+ .byte 235,211 // jmp 25bce <_sk_store_8888_sse41_8bit+0x2e>
.byte 102,66,15,58,22,68,138,8,2 // pextrd $0x2,%xmm0,0x8(%rdx,%r9,4)
.byte 102,66,15,214,4,138 // movq %xmm0,(%rdx,%r9,4)
- .byte 235,194 // jmp 255f2 <_sk_store_8888_sse41_8bit+0x2e>
+ .byte 235,194 // jmp 25bce <_sk_store_8888_sse41_8bit+0x2e>
.byte 102,66,15,58,22,76,138,24,2 // pextrd $0x2,%xmm1,0x18(%rdx,%r9,4)
.byte 102,66,15,58,22,76,138,20,1 // pextrd $0x1,%xmm1,0x14(%rdx,%r9,4)
.byte 102,66,15,126,76,138,16 // movd %xmm1,0x10(%rdx,%r9,4)
.byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4)
- .byte 235,161 // jmp 255f2 <_sk_store_8888_sse41_8bit+0x2e>
+ .byte 235,161 // jmp 25bce <_sk_store_8888_sse41_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 195 // retq
.byte 255 // (bad)
@@ -53815,10 +54355,10 @@ _sk_load_bgra_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 256b4 <_sk_load_bgra_sse41_8bit+0x44>
+ .byte 117,35 // jne 25c90 <_sk_load_bgra_sse41_8bit+0x44>
.byte 243,66,15,111,76,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm1
.byte 243,66,15,111,4,130 // movdqu (%rdx,%r8,4),%xmm0
- .byte 102,15,111,37,26,104,0,0 // movdqa 0x681a(%rip),%xmm4 # 2bec0 <_sk_overlay_sse2_8bit+0x14ff>
+ .byte 102,15,111,37,62,104,0,0 // movdqa 0x683e(%rip),%xmm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53828,24 +54368,24 @@ _sk_load_bgra_sse41_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,213 // ja 2569e <_sk_load_bgra_sse41_8bit+0x2e>
+ .byte 119,213 // ja 25c7a <_sk_load_bgra_sse41_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 25724 <_sk_load_bgra_sse41_8bit+0xb4>
+ .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 25d00 <_sk_load_bgra_sse41_8bit+0xb4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,110,4,130 // movd (%rdx,%r8,4),%xmm0
- .byte 235,185 // jmp 2569e <_sk_load_bgra_sse41_8bit+0x2e>
+ .byte 235,185 // jmp 25c7a <_sk_load_bgra_sse41_8bit+0x2e>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4
.byte 102,15,58,14,196,15 // pblendw $0xf,%xmm4,%xmm0
- .byte 235,159 // jmp 2569e <_sk_load_bgra_sse41_8bit+0x2e>
+ .byte 235,159 // jmp 25c7a <_sk_load_bgra_sse41_8bit+0x2e>
.byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 102,66,15,58,34,76,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1
.byte 102,66,15,58,34,76,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1
- .byte 233,118,255,255,255 // jmpq 25698 <_sk_load_bgra_sse41_8bit+0x28>
+ .byte 233,118,255,255,255 // jmpq 25c74 <_sk_load_bgra_sse41_8bit+0x28>
.byte 102,144 // xchg %ax,%ax
.byte 185,255,255,255,205 // mov $0xcdffffff,%ecx
.byte 255 // (bad)
@@ -53878,10 +54418,10 @@ _sk_load_bgra_dst_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 25784 <_sk_load_bgra_dst_sse41_8bit+0x44>
+ .byte 117,35 // jne 25d60 <_sk_load_bgra_dst_sse41_8bit+0x44>
.byte 243,66,15,111,92,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm3
.byte 243,66,15,111,20,130 // movdqu (%rdx,%r8,4),%xmm2
- .byte 102,15,111,37,74,103,0,0 // movdqa 0x674a(%rip),%xmm4 # 2bec0 <_sk_overlay_sse2_8bit+0x14ff>
+ .byte 102,15,111,37,110,103,0,0 // movdqa 0x676e(%rip),%xmm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,56,0,212 // pshufb %xmm4,%xmm2
.byte 102,15,56,0,220 // pshufb %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53891,24 +54431,24 @@ _sk_load_bgra_dst_sse41_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,213 // ja 2576e <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ .byte 119,213 // ja 25d4a <_sk_load_bgra_dst_sse41_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 257f4 <_sk_load_bgra_dst_sse41_8bit+0xb4>
+ .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 25dd0 <_sk_load_bgra_dst_sse41_8bit+0xb4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,110,20,130 // movd (%rdx,%r8,4),%xmm2
- .byte 235,185 // jmp 2576e <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ .byte 235,185 // jmp 25d4a <_sk_load_bgra_dst_sse41_8bit+0x2e>
.byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4
.byte 102,15,58,14,212,15 // pblendw $0xf,%xmm4,%xmm2
- .byte 235,159 // jmp 2576e <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ .byte 235,159 // jmp 25d4a <_sk_load_bgra_dst_sse41_8bit+0x2e>
.byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 102,66,15,58,34,92,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3
.byte 102,66,15,58,34,92,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3
- .byte 233,118,255,255,255 // jmpq 25768 <_sk_load_bgra_dst_sse41_8bit+0x28>
+ .byte 233,118,255,255,255 // jmpq 25d44 <_sk_load_bgra_dst_sse41_8bit+0x28>
.byte 102,144 // xchg %ax,%ax
.byte 185,255,255,255,205 // mov $0xcdffffff,%ecx
.byte 255 // (bad)
@@ -53940,13 +54480,13 @@ _sk_store_bgra_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
- .byte 102,15,111,53,140,102,0,0 // movdqa 0x668c(%rip),%xmm6 # 2bec0 <_sk_overlay_sse2_8bit+0x14ff>
+ .byte 102,15,111,53,176,102,0,0 // movdqa 0x66b0(%rip),%xmm6 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
.byte 102,15,56,0,238 // pshufb %xmm6,%xmm5
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,56,0,230 // pshufb %xmm6,%xmm4
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 2585c <_sk_store_bgra_sse41_8bit+0x4c>
+ .byte 117,17 // jne 25e38 <_sk_store_bgra_sse41_8bit+0x4c>
.byte 243,66,15,127,36,138 // movdqu %xmm4,(%rdx,%r9,4)
.byte 243,66,15,127,108,138,16 // movdqu %xmm5,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -53954,22 +54494,22 @@ _sk_store_bgra_sse41_8bit:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,239 // ja 25858 <_sk_store_bgra_sse41_8bit+0x48>
+ .byte 119,239 // ja 25e34 <_sk_store_bgra_sse41_8bit+0x48>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,68,0,0,0 // lea 0x44(%rip),%rcx # 258b8 <_sk_store_bgra_sse41_8bit+0xa8>
+ .byte 72,141,13,68,0,0,0 // lea 0x44(%rip),%rcx # 25e94 <_sk_store_bgra_sse41_8bit+0xa8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,126,36,138 // movd %xmm4,(%rdx,%r9,4)
- .byte 235,211 // jmp 25858 <_sk_store_bgra_sse41_8bit+0x48>
+ .byte 235,211 // jmp 25e34 <_sk_store_bgra_sse41_8bit+0x48>
.byte 102,66,15,58,22,100,138,8,2 // pextrd $0x2,%xmm4,0x8(%rdx,%r9,4)
.byte 102,66,15,214,36,138 // movq %xmm4,(%rdx,%r9,4)
- .byte 235,194 // jmp 25858 <_sk_store_bgra_sse41_8bit+0x48>
+ .byte 235,194 // jmp 25e34 <_sk_store_bgra_sse41_8bit+0x48>
.byte 102,66,15,58,22,108,138,24,2 // pextrd $0x2,%xmm5,0x18(%rdx,%r9,4)
.byte 102,66,15,58,22,108,138,20,1 // pextrd $0x1,%xmm5,0x14(%rdx,%r9,4)
.byte 102,66,15,126,108,138,16 // movd %xmm5,0x10(%rdx,%r9,4)
.byte 243,66,15,127,36,138 // movdqu %xmm4,(%rdx,%r9,4)
- .byte 235,161 // jmp 25858 <_sk_store_bgra_sse41_8bit+0x48>
+ .byte 235,161 // jmp 25e34 <_sk_store_bgra_sse41_8bit+0x48>
.byte 144 // nop
.byte 197,255,255 // (bad)
.byte 255,214 // callq *%rsi
@@ -54004,9 +54544,9 @@ _sk_load_a8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,42 // jne 2591b <_sk_load_a8_sse41_8bit+0x47>
+ .byte 117,42 // jne 25ef7 <_sk_load_a8_sse41_8bit+0x47>
.byte 102,66,15,56,48,12,2 // pmovzxbw (%rdx,%r8,1),%xmm1
- .byte 102,15,219,13,144,94,0,0 // pand 0x5e90(%rip),%xmm1 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,13,180,94,0,0 // pand 0x5eb4(%rip),%xmm1 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
@@ -54018,15 +54558,15 @@ _sk_load_a8_sse41_8bit:
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,204 // ja 258f8 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 119,204 // ja 25ed4 <_sk_load_a8_sse41_8bit+0x24>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 259ac <_sk_load_a8_sse41_8bit+0xd8>
+ .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 25f88 <_sk_load_a8_sse41_8bit+0xd8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 235,173 // jmp 258f8 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 235,173 // jmp 25ed4 <_sk_load_a8_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,2 // pinsrw $0x2,%eax,%xmm1
@@ -54034,7 +54574,7 @@ _sk_load_a8_sse41_8bit:
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,3 // pblendw $0x3,%xmm0,%xmm1
- .byte 235,136 // jmp 258f8 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 235,136 // jmp 25ed4 <_sk_load_a8_sse41_8bit+0x24>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,6 // pinsrw $0x6,%eax,%xmm1
@@ -54045,7 +54585,7 @@ _sk_load_a8_sse41_8bit:
.byte 102,66,15,110,4,2 // movd (%rdx,%r8,1),%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,15 // pblendw $0xf,%xmm0,%xmm1
- .byte 233,77,255,255,255 // jmpq 258f8 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 233,77,255,255,255 // jmpq 25ed4 <_sk_load_a8_sse41_8bit+0x24>
.byte 144 // nop
.byte 148 // xchg %eax,%esp
.byte 255 // (bad)
@@ -54054,7 +54594,7 @@ _sk_load_a8_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf0259bc <_sk_overlay_sse2_8bit+0xffffffffdeffaffb>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf025f98 <_sk_overlay_sse2_8bit+0xffffffffdeffafe3>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -54077,9 +54617,9 @@ _sk_load_a8_dst_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,42 // jne 25a0f <_sk_load_a8_dst_sse41_8bit+0x47>
+ .byte 117,42 // jne 25feb <_sk_load_a8_dst_sse41_8bit+0x47>
.byte 102,66,15,56,48,28,2 // pmovzxbw (%rdx,%r8,1),%xmm3
- .byte 102,15,219,29,156,93,0,0 // pand 0x5d9c(%rip),%xmm3 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,29,192,93,0,0 // pand 0x5dc0(%rip),%xmm3 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,211 // pmovzxwd %xmm3,%xmm2
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
@@ -54091,15 +54631,15 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,204 // ja 259ec <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 119,204 // ja 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 25aa0 <_sk_load_a8_dst_sse41_8bit+0xd8>
+ .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 2607c <_sk_load_a8_dst_sse41_8bit+0xd8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 235,173 // jmp 259ec <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 235,173 // jmp 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3
@@ -54107,7 +54647,7 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,3 // pblendw $0x3,%xmm2,%xmm3
- .byte 235,136 // jmp 259ec <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 235,136 // jmp 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,6 // pinsrw $0x6,%eax,%xmm3
@@ -54118,7 +54658,7 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,66,15,110,20,2 // movd (%rdx,%r8,1),%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3
- .byte 233,77,255,255,255 // jmpq 259ec <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 233,77,255,255,255 // jmpq 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24>
.byte 144 // nop
.byte 148 // xchg %eax,%esp
.byte 255 // (bad)
@@ -54127,7 +54667,7 @@ _sk_load_a8_dst_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf025ab0 <_sk_overlay_sse2_8bit+0xffffffffdeffb0ef>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf02608c <_sk_overlay_sse2_8bit+0xffffffffdeffb0d7>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -54149,39 +54689,39 @@ _sk_store_a8_sse41_8bit:
.byte 72,99,87,8 // movslq 0x8(%rdi),%rdx
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
- .byte 102,15,111,45,244,99,0,0 // movdqa 0x63f4(%rip),%xmm5 # 2bed0 <_sk_overlay_sse2_8bit+0x150f>
+ .byte 102,15,111,45,24,100,0,0 // movdqa 0x6418(%rip),%xmm5 # 2c4d0 <_sk_overlay_sse2_8bit+0x151b>
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,56,0,245 // pshufb %xmm5,%xmm6
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,56,0,229 // pshufb %xmm5,%xmm4
.byte 102,15,108,230 // punpcklqdq %xmm6,%xmm4
.byte 77,133,201 // test %r9,%r9
- .byte 117,19 // jne 25b0a <_sk_store_a8_sse41_8bit+0x4e>
- .byte 102,15,56,0,37,144,99,0,0 // pshufb 0x6390(%rip),%xmm4 # 2be90 <_sk_overlay_sse2_8bit+0x14cf>
+ .byte 117,19 // jne 260e6 <_sk_store_a8_sse41_8bit+0x4e>
+ .byte 102,15,56,0,37,180,99,0,0 // pshufb 0x63b4(%rip),%xmm4 # 2c490 <_sk_overlay_sse2_8bit+0x14db>
.byte 102,66,15,214,36,2 // movq %xmm4,(%rdx,%r8,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,239 // ja 25b06 <_sk_store_a8_sse41_8bit+0x4a>
+ .byte 119,239 // ja 260e2 <_sk_store_a8_sse41_8bit+0x4a>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,94,0,0,0 // lea 0x5e(%rip),%rcx # 25b80 <_sk_store_a8_sse41_8bit+0xc4>
+ .byte 72,141,13,94,0,0,0 // lea 0x5e(%rip),%rcx # 2615c <_sk_store_a8_sse41_8bit+0xc4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,58,20,36,2,0 // pextrb $0x0,%xmm4,(%rdx,%r8,1)
- .byte 235,209 // jmp 25b06 <_sk_store_a8_sse41_8bit+0x4a>
+ .byte 235,209 // jmp 260e2 <_sk_store_a8_sse41_8bit+0x4a>
.byte 102,66,15,58,20,100,2,2,4 // pextrb $0x4,%xmm4,0x2(%rdx,%r8,1)
- .byte 102,15,56,0,37,89,92,0,0 // pshufb 0x5c59(%rip),%xmm4 # 2b7a0 <_sk_overlay_sse2_8bit+0xddf>
+ .byte 102,15,56,0,37,125,92,0,0 // pshufb 0x5c7d(%rip),%xmm4 # 2bda0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,66,15,58,21,36,2,0 // pextrw $0x0,%xmm4,(%rdx,%r8,1)
- .byte 235,181 // jmp 25b06 <_sk_store_a8_sse41_8bit+0x4a>
+ .byte 235,181 // jmp 260e2 <_sk_store_a8_sse41_8bit+0x4a>
.byte 102,66,15,58,20,100,2,6,12 // pextrb $0xc,%xmm4,0x6(%rdx,%r8,1)
.byte 102,66,15,58,20,100,2,5,10 // pextrb $0xa,%xmm4,0x5(%rdx,%r8,1)
.byte 102,66,15,58,20,100,2,4,8 // pextrb $0x8,%xmm4,0x4(%rdx,%r8,1)
- .byte 102,15,56,0,37,59,92,0,0 // pshufb 0x5c3b(%rip),%xmm4 # 2b7b0 <_sk_overlay_sse2_8bit+0xdef>
+ .byte 102,15,56,0,37,95,92,0,0 // pshufb 0x5c5f(%rip),%xmm4 # 2bdb0 <_sk_overlay_sse2_8bit+0xdfb>
.byte 102,66,15,126,36,2 // movd %xmm4,(%rdx,%r8,1)
- .byte 235,137 // jmp 25b06 <_sk_store_a8_sse41_8bit+0x4a>
+ .byte 235,137 // jmp 260e2 <_sk_store_a8_sse41_8bit+0x4a>
.byte 15,31,0 // nopl (%rax)
.byte 171 // stos %eax,%es:(%rdi)
.byte 255 // (bad)
@@ -54217,16 +54757,16 @@ _sk_load_g8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,66 // jne 25bfb <_sk_load_g8_sse41_8bit+0x5f>
+ .byte 117,66 // jne 261d7 <_sk_load_g8_sse41_8bit+0x5f>
.byte 102,66,15,56,48,12,2 // pmovzxbw (%rdx,%r8,1),%xmm1
- .byte 102,15,219,13,200,91,0,0 // pand 0x5bc8(%rip),%xmm1 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,13,236,91,0,0 // pand 0x5bec(%rip),%xmm1 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
- .byte 102,15,111,37,3,99,0,0 // movdqa 0x6303(%rip),%xmm4 # 2bee0 <_sk_overlay_sse2_8bit+0x151f>
+ .byte 102,15,111,37,39,99,0,0 // movdqa 0x6327(%rip),%xmm4 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b>
.byte 102,15,56,64,204 // pmulld %xmm4,%xmm1
.byte 102,15,56,64,196 // pmulld %xmm4,%xmm0
- .byte 102,15,111,37,177,98,0,0 // movdqa 0x62b1(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,37,213,98,0,0 // movdqa 0x62d5(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,235,196 // por %xmm4,%xmm0
.byte 102,15,235,204 // por %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -54235,15 +54775,15 @@ _sk_load_g8_sse41_8bit:
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,180 // ja 25bc0 <_sk_load_g8_sse41_8bit+0x24>
+ .byte 119,180 // ja 2619c <_sk_load_g8_sse41_8bit+0x24>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 25c90 <_sk_load_g8_sse41_8bit+0xf4>
+ .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 2626c <_sk_load_g8_sse41_8bit+0xf4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 235,149 // jmp 25bc0 <_sk_load_g8_sse41_8bit+0x24>
+ .byte 235,149 // jmp 2619c <_sk_load_g8_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,2 // pinsrw $0x2,%eax,%xmm1
@@ -54251,7 +54791,7 @@ _sk_load_g8_sse41_8bit:
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,3 // pblendw $0x3,%xmm0,%xmm1
- .byte 233,109,255,255,255 // jmpq 25bc0 <_sk_load_g8_sse41_8bit+0x24>
+ .byte 233,109,255,255,255 // jmpq 2619c <_sk_load_g8_sse41_8bit+0x24>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,6 // pinsrw $0x6,%eax,%xmm1
@@ -54262,7 +54802,7 @@ _sk_load_g8_sse41_8bit:
.byte 102,66,15,110,4,2 // movd (%rdx,%r8,1),%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,15 // pblendw $0xf,%xmm0,%xmm1
- .byte 233,50,255,255,255 // jmpq 25bc0 <_sk_load_g8_sse41_8bit+0x24>
+ .byte 233,50,255,255,255 // jmpq 2619c <_sk_load_g8_sse41_8bit+0x24>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -54271,7 +54811,7 @@ _sk_load_g8_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde025ca0 <_sk_overlay_sse2_8bit+0xffffffffddffb2df>
+ .byte 232,255,255,255,221 // callq ffffffffde02627c <_sk_overlay_sse2_8bit+0xffffffffddffb2c7>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -54294,16 +54834,16 @@ _sk_load_g8_dst_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,66 // jne 25d0b <_sk_load_g8_dst_sse41_8bit+0x5f>
+ .byte 117,66 // jne 262e7 <_sk_load_g8_dst_sse41_8bit+0x5f>
.byte 102,66,15,56,48,28,2 // pmovzxbw (%rdx,%r8,1),%xmm3
- .byte 102,15,219,29,184,90,0,0 // pand 0x5ab8(%rip),%xmm3 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,29,220,90,0,0 // pand 0x5adc(%rip),%xmm3 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,211 // pmovzxwd %xmm3,%xmm2
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
- .byte 102,15,111,37,243,97,0,0 // movdqa 0x61f3(%rip),%xmm4 # 2bee0 <_sk_overlay_sse2_8bit+0x151f>
+ .byte 102,15,111,37,23,98,0,0 // movdqa 0x6217(%rip),%xmm4 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b>
.byte 102,15,56,64,220 // pmulld %xmm4,%xmm3
.byte 102,15,56,64,212 // pmulld %xmm4,%xmm2
- .byte 102,15,111,37,161,97,0,0 // movdqa 0x61a1(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,37,197,97,0,0 // movdqa 0x61c5(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,235,220 // por %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -54312,15 +54852,15 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,180 // ja 25cd0 <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 119,180 // ja 262ac <_sk_load_g8_dst_sse41_8bit+0x24>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 25da0 <_sk_load_g8_dst_sse41_8bit+0xf4>
+ .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 2637c <_sk_load_g8_dst_sse41_8bit+0xf4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 235,149 // jmp 25cd0 <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 235,149 // jmp 262ac <_sk_load_g8_dst_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3
@@ -54328,7 +54868,7 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,3 // pblendw $0x3,%xmm2,%xmm3
- .byte 233,109,255,255,255 // jmpq 25cd0 <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 233,109,255,255,255 // jmpq 262ac <_sk_load_g8_dst_sse41_8bit+0x24>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,6 // pinsrw $0x6,%eax,%xmm3
@@ -54339,7 +54879,7 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,66,15,110,20,2 // movd (%rdx,%r8,1),%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3
- .byte 233,50,255,255,255 // jmpq 25cd0 <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 233,50,255,255,255 // jmpq 262ac <_sk_load_g8_dst_sse41_8bit+0x24>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -54348,7 +54888,7 @@ _sk_load_g8_dst_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde025db0 <_sk_overlay_sse2_8bit+0xffffffffddffb3ef>
+ .byte 232,255,255,255,221 // callq ffffffffde02638c <_sk_overlay_sse2_8bit+0xffffffffddffb3d7>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -54372,11 +54912,11 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,206,0,0,0 // jne 25eaf <_sk_srcover_rgba_8888_sse41_8bit+0xf3>
+ .byte 15,133,206,0,0,0 // jne 2648b <_sk_srcover_rgba_8888_sse41_8bit+0xf3>
.byte 243,70,15,111,68,138,16 // movdqu 0x10(%rdx,%r9,4),%xmm8
.byte 243,70,15,111,12,138 // movdqu (%rdx,%r9,4),%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,37,183,96,0,0 // movdqa 0x60b7(%rip),%xmm4 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,37,219,96,0,0 // movdqa 0x60db(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,56,0,244 // pshufb %xmm4,%xmm6
.byte 102,15,111,248 // movdqa %xmm0,%xmm7
@@ -54410,7 +54950,7 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 102,68,15,248,204 // psubb %xmm4,%xmm9
.byte 102,68,15,252,200 // paddb %xmm0,%xmm9
.byte 102,68,15,252,193 // paddb %xmm1,%xmm8
- .byte 117,72 // jne 25ee6 <_sk_srcover_rgba_8888_sse41_8bit+0x12a>
+ .byte 117,72 // jne 264c2 <_sk_srcover_rgba_8888_sse41_8bit+0x12a>
.byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4)
.byte 243,70,15,127,68,138,16 // movdqu %xmm8,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -54421,43 +54961,43 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 254,200 // dec %al
.byte 60,6 // cmp $0x6,%al
- .byte 15,135,38,255,255,255 // ja 25dee <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ .byte 15,135,38,255,255,255 // ja 263ca <_sk_srcover_rgba_8888_sse41_8bit+0x32>
.byte 15,182,192 // movzbl %al,%eax
- .byte 72,141,13,186,0,0,0 // lea 0xba(%rip),%rcx # 25f8c <_sk_srcover_rgba_8888_sse41_8bit+0x1d0>
+ .byte 72,141,13,186,0,0,0 // lea 0xba(%rip),%rcx # 26568 <_sk_srcover_rgba_8888_sse41_8bit+0x1d0>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,70,15,110,12,138 // movd (%rdx,%r9,4),%xmm9
- .byte 233,8,255,255,255 // jmpq 25dee <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ .byte 233,8,255,255,255 // jmpq 263ca <_sk_srcover_rgba_8888_sse41_8bit+0x32>
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,184 // ja 25eab <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ .byte 119,184 // ja 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,170,0,0,0 // lea 0xaa(%rip),%rcx # 25fa8 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec>
+ .byte 72,141,13,170,0,0,0 // lea 0xaa(%rip),%rcx # 26584 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,70,15,126,12,138 // movd %xmm9,(%rdx,%r9,4)
- .byte 235,156 // jmp 25eab <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ .byte 235,156 // jmp 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
.byte 102,66,15,110,100,138,8 // movd 0x8(%rdx,%r9,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 243,66,15,126,36,138 // movq (%rdx,%r9,4),%xmm4
.byte 102,68,15,58,14,204,15 // pblendw $0xf,%xmm4,%xmm9
- .byte 233,192,254,255,255 // jmpq 25dee <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ .byte 233,192,254,255,255 // jmpq 263ca <_sk_srcover_rgba_8888_sse41_8bit+0x32>
.byte 102,66,15,110,100,138,24 // movd 0x18(%rdx,%r9,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
.byte 102,70,15,58,34,68,138,20,1 // pinsrd $0x1,0x14(%rdx,%r9,4),%xmm8
.byte 102,70,15,58,34,68,138,16,0 // pinsrd $0x0,0x10(%rdx,%r9,4),%xmm8
- .byte 233,150,254,255,255 // jmpq 25de8 <_sk_srcover_rgba_8888_sse41_8bit+0x2c>
+ .byte 233,150,254,255,255 // jmpq 263c4 <_sk_srcover_rgba_8888_sse41_8bit+0x2c>
.byte 102,70,15,58,22,76,138,8,2 // pextrd $0x2,%xmm9,0x8(%rdx,%r9,4)
.byte 102,70,15,214,12,138 // movq %xmm9,(%rdx,%r9,4)
- .byte 233,69,255,255,255 // jmpq 25eab <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ .byte 233,69,255,255,255 // jmpq 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
.byte 102,70,15,58,22,68,138,24,2 // pextrd $0x2,%xmm8,0x18(%rdx,%r9,4)
.byte 102,70,15,58,22,68,138,20,1 // pextrd $0x1,%xmm8,0x14(%rdx,%r9,4)
.byte 102,70,15,126,68,138,16 // movd %xmm8,0x10(%rdx,%r9,4)
.byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4)
- .byte 233,33,255,255,255 // jmpq 25eab <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ .byte 233,33,255,255,255 // jmpq 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
.byte 102,144 // xchg %ax,%ax
.byte 79,255 // rex.WRXB (bad)
.byte 255 // (bad)
@@ -54498,7 +55038,7 @@ _sk_scale_1_float_sse41_8bit:
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,0 // movss (%rax),%xmm0
- .byte 243,15,89,5,86,78,0,0 // mulss 0x4e56(%rip),%xmm0 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,89,5,110,78,0,0 // mulss 0x4e6e(%rip),%xmm0 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,44,192 // cvttss2si %xmm0,%eax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,68,15,56,48,197 // pmovzxbw %xmm5,%xmm8
@@ -54506,7 +55046,7 @@ _sk_scale_1_float_sse41_8bit:
.byte 102,68,15,56,48,204 // pmovzxbw %xmm4,%xmm9
.byte 102,15,104,224 // punpckhbw %xmm0,%xmm4
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 102,15,56,0,53,238,94,0,0 // pshufb 0x5eee(%rip),%xmm6 # 2bef0 <_sk_overlay_sse2_8bit+0x152f>
+ .byte 102,15,56,0,53,18,95,0,0 // pshufb 0x5f12(%rip),%xmm6 # 2c4f0 <_sk_overlay_sse2_8bit+0x153b>
.byte 102,15,111,206 // movdqa %xmm6,%xmm1
.byte 102,65,15,213,201 // pmullw %xmm9,%xmm1
.byte 102,15,111,198 // movdqa %xmm6,%xmm0
@@ -54539,13 +55079,13 @@ _sk_scale_u8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,160,0,0,0 // jne 26113 <_sk_scale_u8_sse41_8bit+0xc1>
+ .byte 15,133,160,0,0,0 // jne 266ef <_sk_scale_u8_sse41_8bit+0xc1>
.byte 102,66,15,56,48,52,2 // pmovzxbw (%rdx,%r8,1),%xmm6
- .byte 102,15,219,53,14,87,0,0 // pand 0x570e(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,53,50,87,0,0 // pand 0x5732(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
- .byte 102,15,56,0,61,108,94,0,0 // pshufb 0x5e6c(%rip),%xmm7 # 2bf00 <_sk_overlay_sse2_8bit+0x153f>
- .byte 102,15,56,0,53,115,94,0,0 // pshufb 0x5e73(%rip),%xmm6 # 2bf10 <_sk_overlay_sse2_8bit+0x154f>
+ .byte 102,15,56,0,61,144,94,0,0 // pshufb 0x5e90(%rip),%xmm7 # 2c500 <_sk_overlay_sse2_8bit+0x154b>
+ .byte 102,15,56,0,53,151,94,0,0 // pshufb 0x5e97(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0x155b>
.byte 102,68,15,56,48,200 // pmovzxbw %xmm0,%xmm9
.byte 102,65,15,104,192 // punpckhbw %xmm8,%xmm0
.byte 102,68,15,56,48,209 // pmovzxbw %xmm1,%xmm10
@@ -54576,15 +55116,15 @@ _sk_scale_u8_sse41_8bit:
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,82,255,255,255 // ja 2607a <_sk_scale_u8_sse41_8bit+0x28>
+ .byte 15,135,82,255,255,255 // ja 26656 <_sk_scale_u8_sse41_8bit+0x28>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,125,0,0,0 // lea 0x7d(%rip),%rcx # 261b0 <_sk_scale_u8_sse41_8bit+0x15e>
+ .byte 72,141,13,125,0,0,0 // lea 0x7d(%rip),%rcx # 2678c <_sk_scale_u8_sse41_8bit+0x15e>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,48,255,255,255 // jmpq 2607a <_sk_scale_u8_sse41_8bit+0x28>
+ .byte 233,48,255,255,255 // jmpq 26656 <_sk_scale_u8_sse41_8bit+0x28>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,15,196,240,2 // pinsrw $0x2,%eax,%xmm6
@@ -54592,7 +55132,7 @@ _sk_scale_u8_sse41_8bit:
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,56,48,228 // pmovzxbw %xmm4,%xmm4
.byte 102,15,58,14,244,3 // pblendw $0x3,%xmm4,%xmm6
- .byte 233,8,255,255,255 // jmpq 2607a <_sk_scale_u8_sse41_8bit+0x28>
+ .byte 233,8,255,255,255 // jmpq 26656 <_sk_scale_u8_sse41_8bit+0x28>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,15,196,240,6 // pinsrw $0x6,%eax,%xmm6
@@ -54603,7 +55143,7 @@ _sk_scale_u8_sse41_8bit:
.byte 102,66,15,110,36,2 // movd (%rdx,%r8,1),%xmm4
.byte 102,15,56,48,228 // pmovzxbw %xmm4,%xmm4
.byte 102,15,58,14,244,15 // pblendw $0xf,%xmm4,%xmm6
- .byte 233,205,254,255,255 // jmpq 2607a <_sk_scale_u8_sse41_8bit+0x28>
+ .byte 233,205,254,255,255 // jmpq 26656 <_sk_scale_u8_sse41_8bit+0x28>
.byte 15,31,0 // nopl (%rax)
.byte 140,255 // mov %?,%edi
.byte 255 // (bad)
@@ -54630,7 +55170,7 @@ FUNCTION(_sk_lerp_1_float_sse41_8bit)
_sk_lerp_1_float_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,32 // movss (%rax),%xmm4
- .byte 243,15,89,37,86,76,0,0 // mulss 0x4c56(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,89,37,110,76,0,0 // mulss 0x4c6e(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,44,196 // cvttss2si %xmm4,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,228 // punpcklbw %xmm4,%xmm4
@@ -54641,7 +55181,7 @@ _sk_lerp_1_float_sse41_8bit:
.byte 102,65,15,104,193 // punpckhbw %xmm9,%xmm0
.byte 102,68,15,56,48,217 // pmovzxbw %xmm1,%xmm11
.byte 102,65,15,104,201 // punpckhbw %xmm9,%xmm1
- .byte 102,15,56,0,61,11,93,0,0 // pshufb 0x5d0b(%rip),%xmm7 # 2bf20 <_sk_overlay_sse2_8bit+0x155f>
+ .byte 102,15,56,0,61,47,93,0,0 // pshufb 0x5d2f(%rip),%xmm7 # 2c520 <_sk_overlay_sse2_8bit+0x156b>
.byte 102,68,15,111,231 // movdqa %xmm7,%xmm12
.byte 102,69,15,213,227 // pmullw %xmm11,%xmm12
.byte 102,68,15,111,239 // movdqa %xmm7,%xmm13
@@ -54702,13 +55242,13 @@ _sk_lerp_u8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,46,1,0,0 // jne 2643d <_sk_lerp_u8_sse41_8bit+0x14f>
+ .byte 15,133,46,1,0,0 // jne 26a19 <_sk_lerp_u8_sse41_8bit+0x14f>
.byte 102,66,15,56,48,60,2 // pmovzxbw (%rdx,%r8,1),%xmm7
- .byte 102,15,219,61,114,84,0,0 // pand 0x5472(%rip),%xmm7 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,61,150,84,0,0 // pand 0x5496(%rip),%xmm7 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,208,91,0,0 // pshufb 0x5bd0(%rip),%xmm6 # 2bf00 <_sk_overlay_sse2_8bit+0x153f>
- .byte 102,15,56,0,61,215,91,0,0 // pshufb 0x5bd7(%rip),%xmm7 # 2bf10 <_sk_overlay_sse2_8bit+0x154f>
+ .byte 102,15,56,0,53,244,91,0,0 // pshufb 0x5bf4(%rip),%xmm6 # 2c500 <_sk_overlay_sse2_8bit+0x154b>
+ .byte 102,15,56,0,61,251,91,0,0 // pshufb 0x5bfb(%rip),%xmm7 # 2c510 <_sk_overlay_sse2_8bit+0x155b>
.byte 102,68,15,56,48,200 // pmovzxbw %xmm0,%xmm9
.byte 102,65,15,104,192 // punpckhbw %xmm8,%xmm0
.byte 102,68,15,56,48,209 // pmovzxbw %xmm1,%xmm10
@@ -54768,15 +55308,15 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,196,254,255,255 // ja 26316 <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 15,135,196,254,255,255 // ja 268f2 <_sk_lerp_u8_sse41_8bit+0x28>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,123,0,0,0 // lea 0x7b(%rip),%rcx # 264d8 <_sk_lerp_u8_sse41_8bit+0x1ea>
+ .byte 72,141,13,123,0,0,0 // lea 0x7b(%rip),%rcx # 26ab4 <_sk_lerp_u8_sse41_8bit+0x1ea>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,162,254,255,255 // jmpq 26316 <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 233,162,254,255,255 // jmpq 268f2 <_sk_lerp_u8_sse41_8bit+0x28>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 102,15,196,248,2 // pinsrw $0x2,%eax,%xmm7
@@ -54784,7 +55324,7 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,48,237 // pmovzxbw %xmm5,%xmm5
.byte 102,15,58,14,253,3 // pblendw $0x3,%xmm5,%xmm7
- .byte 233,122,254,255,255 // jmpq 26316 <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 233,122,254,255,255 // jmpq 268f2 <_sk_lerp_u8_sse41_8bit+0x28>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 102,15,196,248,6 // pinsrw $0x6,%eax,%xmm7
@@ -54795,7 +55335,7 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,66,15,110,44,2 // movd (%rdx,%r8,1),%xmm5
.byte 102,15,56,48,237 // pmovzxbw %xmm5,%xmm5
.byte 102,15,58,14,253,15 // pblendw $0xf,%xmm5,%xmm7
- .byte 233,63,254,255,255 // jmpq 26316 <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 233,63,254,255,255 // jmpq 268f2 <_sk_lerp_u8_sse41_8bit+0x28>
.byte 144 // nop
.byte 142,255 // mov %edi,%?
.byte 255 // (bad)
@@ -54803,7 +55343,7 @@ _sk_lerp_u8_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf0264e8 <_sk_overlay_sse2_8bit+0xffffffffdeffbb27>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf026ac4 <_sk_overlay_sse2_8bit+0xffffffffdeffbb0f>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -54837,7 +55377,7 @@ HIDDEN _sk_black_color_sse41_8bit
FUNCTION(_sk_black_color_sse41_8bit)
_sk_black_color_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,143,89,0,0 // movaps 0x598f(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 15,40,5,179,89,0,0 // movaps 0x59b3(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 255,224 // jmpq *%rax
@@ -54863,7 +55403,7 @@ HIDDEN _sk_srcatop_sse41_8bit
.globl _sk_srcatop_sse41_8bit
FUNCTION(_sk_srcatop_sse41_8bit)
_sk_srcatop_sse41_8bit:
- .byte 102,68,15,111,21,123,89,0,0 // movdqa 0x597b(%rip),%xmm10 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,68,15,111,21,159,89,0,0 // movdqa 0x599f(%rip),%xmm10 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,195 // pmovzxbw %xmm3,%xmm8
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
@@ -54933,7 +55473,7 @@ HIDDEN _sk_dstatop_sse41_8bit
.globl _sk_dstatop_sse41_8bit
FUNCTION(_sk_dstatop_sse41_8bit)
_sk_dstatop_sse41_8bit:
- .byte 102,68,15,111,29,64,88,0,0 // movdqa 0x5840(%rip),%xmm11 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,68,15,111,29,100,88,0,0 // movdqa 0x5864(%rip),%xmm11 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,69,15,56,0,235 // pshufb %xmm11,%xmm13
.byte 102,68,15,111,248 // movdqa %xmm0,%xmm15
@@ -55005,7 +55545,7 @@ FUNCTION(_sk_srcin_sse41_8bit)
_sk_srcin_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,247,86,0,0 // movdqa 0x56f7(%rip),%xmm0 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,5,27,87,0,0 // movdqa 0x571b(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
.byte 102,15,56,0,240 // pshufb %xmm0,%xmm6
.byte 102,15,111,250 // movdqa %xmm2,%xmm7
@@ -55040,7 +55580,7 @@ HIDDEN _sk_dstin_sse41_8bit
.globl _sk_dstin_sse41_8bit
FUNCTION(_sk_dstin_sse41_8bit)
_sk_dstin_sse41_8bit:
- .byte 102,15,111,37,106,86,0,0 // movdqa 0x566a(%rip),%xmm4 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,37,142,86,0,0 // movdqa 0x568e(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
@@ -55079,7 +55619,7 @@ FUNCTION(_sk_srcout_sse41_8bit)
_sk_srcout_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,205,85,0,0 // movdqa 0x55cd(%rip),%xmm0 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,5,241,85,0,0 // movdqa 0x55f1(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,111,250 // movdqa %xmm2,%xmm7
.byte 102,15,56,0,248 // pshufb %xmm0,%xmm7
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -55117,7 +55657,7 @@ HIDDEN _sk_dstout_sse41_8bit
.globl _sk_dstout_sse41_8bit
FUNCTION(_sk_dstout_sse41_8bit)
_sk_dstout_sse41_8bit:
- .byte 102,15,111,37,52,85,0,0 // movdqa 0x5534(%rip),%xmm4 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,37,88,85,0,0 // movdqa 0x5558(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 102,15,118,228 // pcmpeqd %xmm4,%xmm4
@@ -55157,7 +55697,7 @@ HIDDEN _sk_srcover_sse41_8bit
.globl _sk_srcover_sse41_8bit
FUNCTION(_sk_srcover_sse41_8bit)
_sk_srcover_sse41_8bit:
- .byte 102,15,111,53,147,84,0,0 // movdqa 0x5493(%rip),%xmm6 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,53,183,84,0,0 // movdqa 0x54b7(%rip),%xmm6 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,217 // movdqa %xmm1,%xmm11
.byte 102,68,15,56,0,222 // pshufb %xmm6,%xmm11
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
@@ -55198,7 +55738,7 @@ HIDDEN _sk_dstover_sse41_8bit
.globl _sk_dstover_sse41_8bit
FUNCTION(_sk_dstover_sse41_8bit)
_sk_dstover_sse41_8bit:
- .byte 102,68,15,111,5,227,83,0,0 // movdqa 0x53e3(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,68,15,111,5,7,84,0,0 // movdqa 0x5407(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,209 // movdqa %xmm1,%xmm10
.byte 102,68,15,56,48,201 // pmovzxbw %xmm1,%xmm9
.byte 102,15,252,203 // paddb %xmm3,%xmm1
@@ -55277,7 +55817,7 @@ _sk_multiply_sse41_8bit:
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,68,15,111,53,161,82,0,0 // movdqa 0x52a1(%rip),%xmm14 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,68,15,111,53,197,82,0,0 // movdqa 0x52c5(%rip),%xmm14 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,195 // movdqa %xmm3,%xmm8
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
.byte 102,65,15,56,0,238 // pshufb %xmm14,%xmm5
@@ -55406,7 +55946,7 @@ HIDDEN _sk_xor__sse41_8bit
.globl _sk_xor__sse41_8bit
FUNCTION(_sk_xor__sse41_8bit)
_sk_xor__sse41_8bit:
- .byte 102,68,15,111,21,95,80,0,0 // movdqa 0x505f(%rip),%xmm10 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,68,15,111,21,131,80,0,0 // movdqa 0x5083(%rip),%xmm10 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,226 // movdqa %xmm2,%xmm12
.byte 102,68,15,56,48,194 // pmovzxbw %xmm2,%xmm8
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
@@ -55474,12 +56014,21 @@ _sk_xor__sse41_8bit:
.byte 102,15,111,205 // movdqa %xmm5,%xmm1
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_plus__sse41_8bit
+.globl _sk_plus__sse41_8bit
+FUNCTION(_sk_plus__sse41_8bit)
+_sk_plus__sse41_8bit:
+ .byte 102,15,220,194 // paddusb %xmm2,%xmm0
+ .byte 102,15,220,203 // paddusb %xmm3,%xmm1
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 255,224 // jmpq *%rax
+
HIDDEN _sk_darken_sse41_8bit
.globl _sk_darken_sse41_8bit
FUNCTION(_sk_darken_sse41_8bit)
_sk_darken_sse41_8bit:
.byte 102,68,15,111,240 // movdqa %xmm0,%xmm14
- .byte 102,68,15,111,5,18,79,0,0 // movdqa 0x4f12(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,68,15,111,5,42,79,0,0 // movdqa 0x4f2a(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -55546,7 +56095,7 @@ _sk_darken_sse41_8bit:
.byte 102,15,248,231 // psubb %xmm7,%xmm4
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,68,15,248,245 // psubb %xmm5,%xmm14
- .byte 15,40,5,70,78,0,0 // movaps 0x4e46(%rip),%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 15,40,5,94,78,0,0 // movaps 0x4e5e(%rip),%xmm0 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,68,15,56,16,244 // pblendvb %xmm0,%xmm4,%xmm14
.byte 102,65,15,56,16,200 // pblendvb %xmm0,%xmm8,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -55558,7 +56107,7 @@ HIDDEN _sk_lighten_sse41_8bit
FUNCTION(_sk_lighten_sse41_8bit)
_sk_lighten_sse41_8bit:
.byte 102,68,15,111,240 // movdqa %xmm0,%xmm14
- .byte 102,68,15,111,5,163,77,0,0 // movdqa 0x4da3(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,68,15,111,5,187,77,0,0 // movdqa 0x4dbb(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -55625,7 +56174,7 @@ _sk_lighten_sse41_8bit:
.byte 102,15,248,231 // psubb %xmm7,%xmm4
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,68,15,248,245 // psubb %xmm5,%xmm14
- .byte 15,40,5,215,76,0,0 // movaps 0x4cd7(%rip),%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 15,40,5,239,76,0,0 // movaps 0x4cef(%rip),%xmm0 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,68,15,56,16,244 // pblendvb %xmm0,%xmm4,%xmm14
.byte 102,65,15,56,16,200 // pblendvb %xmm0,%xmm8,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -55665,7 +56214,7 @@ _sk_exclusion_sse41_8bit:
.byte 102,15,113,215,8 // psrlw $0x8,%xmm7
.byte 102,15,103,253 // packuswb %xmm5,%xmm7
.byte 102,15,103,230 // packuswb %xmm6,%xmm4
- .byte 102,15,111,45,45,76,0,0 // movdqa 0x4c2d(%rip),%xmm5 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 102,15,111,45,69,76,0,0 // movdqa 0x4c45(%rip),%xmm5 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,15,248,204 // psubb %xmm4,%xmm1
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,15,219,239 // pand %xmm7,%xmm5
@@ -55680,7 +56229,7 @@ HIDDEN _sk_difference_sse41_8bit
FUNCTION(_sk_difference_sse41_8bit)
_sk_difference_sse41_8bit:
.byte 102,68,15,111,193 // movdqa %xmm1,%xmm8
- .byte 102,15,111,13,132,75,0,0 // movdqa 0x4b84(%rip),%xmm1 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,13,156,75,0,0 // movdqa 0x4b9c(%rip),%xmm1 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -55718,7 +56267,7 @@ _sk_difference_sse41_8bit:
.byte 102,15,113,214,8 // psrlw $0x8,%xmm6
.byte 102,15,113,215,8 // psrlw $0x8,%xmm7
.byte 102,15,103,254 // packuswb %xmm6,%xmm7
- .byte 102,15,111,37,201,74,0,0 // movdqa 0x4ac9(%rip),%xmm4 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,37,225,74,0,0 // movdqa 0x4ae1(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 102,15,56,0,236 // pshufb %xmm4,%xmm5
.byte 102,69,15,104,236 // punpckhbw %xmm12,%xmm13
@@ -55743,7 +56292,7 @@ _sk_difference_sse41_8bit:
.byte 102,15,103,241 // packuswb %xmm1,%xmm6
.byte 102,65,15,218,230 // pminub %xmm14,%xmm4
.byte 102,15,218,247 // pminub %xmm7,%xmm6
- .byte 102,15,111,13,204,74,0,0 // movdqa 0x4acc(%rip),%xmm1 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 102,15,111,13,228,74,0,0 // movdqa 0x4ae4(%rip),%xmm1 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,68,15,248,198 // psubb %xmm6,%xmm8
.byte 102,15,219,241 // pand %xmm1,%xmm6
.byte 102,15,219,204 // pand %xmm4,%xmm1
@@ -55772,7 +56321,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,15,127,76,36,128 // movdqa %xmm1,-0x80(%rsp)
.byte 102,69,15,56,48,221 // pmovzxbw %xmm13,%xmm11
.byte 102,68,15,127,92,36,48 // movdqa %xmm11,0x30(%rsp)
- .byte 102,15,111,13,214,73,0,0 // movdqa 0x49d6(%rip),%xmm1 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,13,238,73,0,0 // movdqa 0x49ee(%rip),%xmm1 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,56,0,241 // pshufb %xmm1,%xmm14
.byte 102,68,15,56,0,233 // pshufb %xmm1,%xmm13
.byte 102,69,15,56,48,205 // pmovzxbw %xmm13,%xmm9
@@ -55821,7 +56370,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,65,15,56,58,242 // pminuw %xmm10,%xmm6
.byte 102,15,117,240 // pcmpeqw %xmm0,%xmm6
.byte 102,15,127,116,36,64 // movdqa %xmm6,0x40(%rsp)
- .byte 102,15,111,53,186,65,0,0 // movdqa 0x41ba(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,111,53,210,65,0,0 // movdqa 0x41d2(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,65,15,213,192 // pmullw %xmm8,%xmm0
@@ -55928,7 +56477,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,15,253,116,36,32 // paddw 0x20(%rsp),%xmm6
.byte 102,15,253,124,36,144 // paddw -0x70(%rsp),%xmm7
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
- .byte 102,15,111,5,74,71,0,0 // movdqa 0x474a(%rip),%xmm0 # 2bf40 <_sk_overlay_sse2_8bit+0x157f>
+ .byte 102,15,111,5,98,71,0,0 // movdqa 0x4762(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
.byte 102,68,15,253,219 // paddw %xmm3,%xmm11
.byte 102,15,253,240 // paddw %xmm0,%xmm6
@@ -55937,7 +56486,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,15,253,252 // paddw %xmm4,%xmm7
.byte 102,15,253,232 // paddw %xmm0,%xmm5
.byte 102,15,253,234 // paddw %xmm2,%xmm5
- .byte 102,15,111,5,48,71,0,0 // movdqa 0x4730(%rip),%xmm0 # 2bf50 <_sk_overlay_sse2_8bit+0x158f>
+ .byte 102,15,111,5,72,71,0,0 // movdqa 0x4748(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
@@ -55972,7 +56521,7 @@ _sk_overlay_sse41_8bit:
.byte 102,15,127,76,36,128 // movdqa %xmm1,-0x80(%rsp)
.byte 102,65,15,56,48,206 // pmovzxbw %xmm14,%xmm1
.byte 102,15,127,140,36,144,0,0,0 // movdqa %xmm1,0x90(%rsp)
- .byte 102,15,111,13,249,69,0,0 // movdqa 0x45f9(%rip),%xmm1 # 2beb0 <_sk_overlay_sse2_8bit+0x14ef>
+ .byte 102,15,111,13,17,70,0,0 // movdqa 0x4611(%rip),%xmm1 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,68,15,56,0,249 // pshufb %xmm1,%xmm15
.byte 102,68,15,56,0,241 // pshufb %xmm1,%xmm14
.byte 102,65,15,56,48,238 // pmovzxbw %xmm14,%xmm5
@@ -56024,7 +56573,7 @@ _sk_overlay_sse41_8bit:
.byte 102,65,15,56,58,221 // pminuw %xmm13,%xmm3
.byte 102,15,117,216 // pcmpeqw %xmm0,%xmm3
.byte 102,15,127,92,36,48 // movdqa %xmm3,0x30(%rsp)
- .byte 102,15,111,53,203,61,0,0 // movdqa 0x3dcb(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,111,53,227,61,0,0 // movdqa 0x3de3(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,15,213,196 // pmullw %xmm4,%xmm0
@@ -56133,7 +56682,7 @@ _sk_overlay_sse41_8bit:
.byte 102,15,253,116,36,32 // paddw 0x20(%rsp),%xmm6
.byte 102,68,15,253,4,36 // paddw (%rsp),%xmm8
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
- .byte 102,15,111,5,87,67,0,0 // movdqa 0x4357(%rip),%xmm0 # 2bf40 <_sk_overlay_sse2_8bit+0x157f>
+ .byte 102,15,111,5,111,67,0,0 // movdqa 0x436f(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
.byte 102,69,15,253,217 // paddw %xmm9,%xmm11
.byte 102,15,253,240 // paddw %xmm0,%xmm6
@@ -56142,7 +56691,7 @@ _sk_overlay_sse41_8bit:
.byte 102,68,15,253,195 // paddw %xmm3,%xmm8
.byte 102,15,253,232 // paddw %xmm0,%xmm5
.byte 102,15,253,234 // paddw %xmm2,%xmm5
- .byte 102,15,111,5,59,67,0,0 // movdqa 0x433b(%rip),%xmm0 # 2bf50 <_sk_overlay_sse2_8bit+0x158f>
+ .byte 102,15,111,5,83,67,0,0 // movdqa 0x4353(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
@@ -56184,7 +56733,7 @@ _sk_start_pipeline_sse2_8bit:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,168 // mov %rcx,-0x58(%rbp)
.byte 73,57,207 // cmp %rcx,%r15
- .byte 115,102 // jae 27d01 <_sk_start_pipeline_sse2_8bit+0x95>
+ .byte 115,102 // jae 282e9 <_sk_start_pipeline_sse2_8bit+0x95>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,8 // lea 0x8(%rax),%rax
.byte 72,137,69,176 // mov %rax,-0x50(%rbp)
@@ -56194,7 +56743,7 @@ _sk_start_pipeline_sse2_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 76,137,125,192 // mov %r15,-0x40(%rbp)
.byte 72,199,69,200,0,0,0,0 // movq $0x0,-0x38(%rbp)
- .byte 119,30 // ja 27ce3 <_sk_start_pipeline_sse2_8bit+0x77>
+ .byte 119,30 // ja 282cb <_sk_start_pipeline_sse2_8bit+0x77>
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
@@ -56203,17 +56752,17 @@ _sk_start_pipeline_sse2_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 72,131,193,16 // add $0x10,%rcx
.byte 72,57,217 // cmp %rbx,%rcx
- .byte 118,226 // jbe 27cc5 <_sk_start_pipeline_sse2_8bit+0x59>
+ .byte 118,226 // jbe 282ad <_sk_start_pipeline_sse2_8bit+0x59>
.byte 72,137,217 // mov %rbx,%rcx
.byte 72,41,193 // sub %rax,%rcx
- .byte 116,13 // je 27cf8 <_sk_start_pipeline_sse2_8bit+0x8c>
+ .byte 116,13 // je 282e0 <_sk_start_pipeline_sse2_8bit+0x8c>
.byte 72,137,77,200 // mov %rcx,-0x38(%rbp)
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
.byte 73,255,199 // inc %r15
.byte 76,59,125,168 // cmp -0x58(%rbp),%r15
- .byte 117,170 // jne 27cab <_sk_start_pipeline_sse2_8bit+0x3f>
+ .byte 117,170 // jne 28293 <_sk_start_pipeline_sse2_8bit+0x3f>
.byte 72,131,196,56 // add $0x38,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -56245,7 +56794,7 @@ HIDDEN _sk_set_rgb_sse2_8bit
FUNCTION(_sk_set_rgb_sse2_8bit)
_sk_set_rgb_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,37,1,49,0,0 // movss 0x3101(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,16,37,13,49,0,0 // movss 0x310d(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,16,40 // movss (%rax),%xmm5
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 243,72,15,44,205 // cvttss2si %xmm5,%rcx
@@ -56260,7 +56809,7 @@ _sk_set_rgb_sse2_8bit:
.byte 9,208 // or %edx,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
- .byte 102,15,111,45,49,65,0,0 // movdqa 0x4131(%rip),%xmm5 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,45,73,65,0,0 // movdqa 0x4149(%rip),%xmm5 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,219,205 // pand %xmm5,%xmm1
.byte 102,15,219,197 // pand %xmm5,%xmm0
.byte 102,15,235,196 // por %xmm4,%xmm0
@@ -56285,7 +56834,7 @@ _sk_premul_sse2_8bit:
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 242,15,112,192,95 // pshuflw $0x5f,%xmm0,%xmm0
.byte 243,15,112,248,95 // pshufhw $0x5f,%xmm0,%xmm7
- .byte 102,15,111,5,213,64,0,0 // movdqa 0x40d5(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,5,237,64,0,0 // movdqa 0x40ed(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,235,248 // por %xmm0,%xmm7
.byte 102,15,235,240 // por %xmm0,%xmm6
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -56366,7 +56915,7 @@ _sk_load_8888_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,16 // jne 27eeb <_sk_load_8888_sse2_8bit+0x31>
+ .byte 117,16 // jne 284d3 <_sk_load_8888_sse2_8bit+0x31>
.byte 66,15,16,76,130,16 // movups 0x10(%rdx,%r8,4),%xmm1
.byte 102,66,15,16,4,130 // movupd (%rdx,%r8,4),%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -56376,18 +56925,18 @@ _sk_load_8888_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,231 // ja 27ee7 <_sk_load_8888_sse2_8bit+0x2d>
+ .byte 119,231 // ja 284cf <_sk_load_8888_sse2_8bit+0x2d>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,81,0,0,0 // lea 0x51(%rip),%rcx # 27f5c <_sk_load_8888_sse2_8bit+0xa2>
+ .byte 72,141,13,81,0,0,0 // lea 0x51(%rip),%rcx # 28544 <_sk_load_8888_sse2_8bit+0xa2>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,66,15,16,4,130 // movss (%rdx,%r8,4),%xmm0
- .byte 235,203 // jmp 27ee7 <_sk_load_8888_sse2_8bit+0x2d>
+ .byte 235,203 // jmp 284cf <_sk_load_8888_sse2_8bit+0x2d>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 102,66,15,18,4,130 // movlpd (%rdx,%r8,4),%xmm0
- .byte 235,183 // jmp 27ee7 <_sk_load_8888_sse2_8bit+0x2d>
+ .byte 235,183 // jmp 284cf <_sk_load_8888_sse2_8bit+0x2d>
.byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 243,66,15,16,68,130,20 // movss 0x14(%rdx,%r8,4),%xmm0
@@ -56396,7 +56945,7 @@ _sk_load_8888_sse2_8bit:
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 243,66,15,16,68,130,16 // movss 0x10(%rdx,%r8,4),%xmm0
.byte 243,15,16,200 // movss %xmm0,%xmm1
- .byte 235,134 // jmp 27ee1 <_sk_load_8888_sse2_8bit+0x27>
+ .byte 235,134 // jmp 284c9 <_sk_load_8888_sse2_8bit+0x27>
.byte 144 // nop
.byte 184,255,255,255,204 // mov $0xccffffff,%eax
.byte 255 // (bad)
@@ -56428,7 +56977,7 @@ _sk_load_8888_dst_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,16 // jne 27fa9 <_sk_load_8888_dst_sse2_8bit+0x31>
+ .byte 117,16 // jne 28591 <_sk_load_8888_dst_sse2_8bit+0x31>
.byte 66,15,16,92,130,16 // movups 0x10(%rdx,%r8,4),%xmm3
.byte 102,66,15,16,20,130 // movupd (%rdx,%r8,4),%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -56438,18 +56987,18 @@ _sk_load_8888_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,231 // ja 27fa5 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ .byte 119,231 // ja 2858d <_sk_load_8888_dst_sse2_8bit+0x2d>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,83,0,0,0 // lea 0x53(%rip),%rcx # 2801c <_sk_load_8888_dst_sse2_8bit+0xa4>
+ .byte 72,141,13,83,0,0,0 // lea 0x53(%rip),%rcx # 28604 <_sk_load_8888_dst_sse2_8bit+0xa4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,66,15,16,20,130 // movss (%rdx,%r8,4),%xmm2
- .byte 235,203 // jmp 27fa5 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ .byte 235,203 // jmp 2858d <_sk_load_8888_dst_sse2_8bit+0x2d>
.byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,66,15,18,20,130 // movlpd (%rdx,%r8,4),%xmm2
- .byte 235,183 // jmp 27fa5 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ .byte 235,183 // jmp 2858d <_sk_load_8888_dst_sse2_8bit+0x2d>
.byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 243,66,15,16,84,130,20 // movss 0x14(%rdx,%r8,4),%xmm2
@@ -56458,7 +57007,7 @@ _sk_load_8888_dst_sse2_8bit:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 243,66,15,16,84,130,16 // movss 0x10(%rdx,%r8,4),%xmm2
.byte 243,15,16,218 // movss %xmm2,%xmm3
- .byte 235,134 // jmp 27f9f <_sk_load_8888_dst_sse2_8bit+0x27>
+ .byte 235,134 // jmp 28587 <_sk_load_8888_dst_sse2_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -56493,7 +57042,7 @@ _sk_store_8888_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 2806a <_sk_store_8888_sse2_8bit+0x32>
+ .byte 117,17 // jne 28652 <_sk_store_8888_sse2_8bit+0x32>
.byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4)
.byte 243,66,15,127,76,138,16 // movdqu %xmm1,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -56501,25 +57050,25 @@ _sk_store_8888_sse2_8bit:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,239 // ja 28066 <_sk_store_8888_sse2_8bit+0x2e>
+ .byte 119,239 // ja 2864e <_sk_store_8888_sse2_8bit+0x2e>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 280d0 <_sk_store_8888_sse2_8bit+0x98>
+ .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 286b8 <_sk_store_8888_sse2_8bit+0x98>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,126,4,138 // movd %xmm0,(%rdx,%r9,4)
- .byte 235,211 // jmp 28066 <_sk_store_8888_sse2_8bit+0x2e>
+ .byte 235,211 // jmp 2864e <_sk_store_8888_sse2_8bit+0x2e>
.byte 102,15,112,224,78 // pshufd $0x4e,%xmm0,%xmm4
.byte 102,66,15,126,100,138,8 // movd %xmm4,0x8(%rdx,%r9,4)
.byte 102,66,15,214,4,138 // movq %xmm0,(%rdx,%r9,4)
- .byte 235,191 // jmp 28066 <_sk_store_8888_sse2_8bit+0x2e>
+ .byte 235,191 // jmp 2864e <_sk_store_8888_sse2_8bit+0x2e>
.byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
.byte 102,66,15,126,100,138,24 // movd %xmm4,0x18(%rdx,%r9,4)
.byte 102,15,112,225,229 // pshufd $0xe5,%xmm1,%xmm4
.byte 102,66,15,126,100,138,20 // movd %xmm4,0x14(%rdx,%r9,4)
.byte 102,66,15,126,76,138,16 // movd %xmm1,0x10(%rdx,%r9,4)
.byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4)
- .byte 235,152 // jmp 28066 <_sk_store_8888_sse2_8bit+0x2e>
+ .byte 235,152 // jmp 2864e <_sk_store_8888_sse2_8bit+0x2e>
.byte 102,144 // xchg %ax,%ax
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
@@ -56555,7 +57104,7 @@ _sk_load_bgra_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,92 // jne 28169 <_sk_load_bgra_sse2_8bit+0x7d>
+ .byte 117,92 // jne 28751 <_sk_load_bgra_sse2_8bit+0x7d>
.byte 66,15,16,76,130,16 // movups 0x10(%rdx,%r8,4),%xmm1
.byte 102,66,15,16,4,130 // movupd (%rdx,%r8,4),%xmm0
.byte 102,15,239,228 // pxor %xmm4,%xmm4
@@ -56582,18 +57131,18 @@ _sk_load_bgra_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,155 // ja 28119 <_sk_load_bgra_sse2_8bit+0x2d>
+ .byte 119,155 // ja 28701 <_sk_load_bgra_sse2_8bit+0x2d>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 281e4 <_sk_load_bgra_sse2_8bit+0xf8>
+ .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 287cc <_sk_load_bgra_sse2_8bit+0xf8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,66,15,16,4,130 // movss (%rdx,%r8,4),%xmm0
- .byte 233,124,255,255,255 // jmpq 28119 <_sk_load_bgra_sse2_8bit+0x2d>
+ .byte 233,124,255,255,255 // jmpq 28701 <_sk_load_bgra_sse2_8bit+0x2d>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 102,66,15,18,4,130 // movlpd (%rdx,%r8,4),%xmm0
- .byte 233,101,255,255,255 // jmpq 28119 <_sk_load_bgra_sse2_8bit+0x2d>
+ .byte 233,101,255,255,255 // jmpq 28701 <_sk_load_bgra_sse2_8bit+0x2d>
.byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 243,66,15,16,68,130,20 // movss 0x14(%rdx,%r8,4),%xmm0
@@ -56602,7 +57151,7 @@ _sk_load_bgra_sse2_8bit:
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 243,66,15,16,68,130,16 // movss 0x10(%rdx,%r8,4),%xmm0
.byte 243,15,16,200 // movss %xmm0,%xmm1
- .byte 233,49,255,255,255 // jmpq 28113 <_sk_load_bgra_sse2_8bit+0x27>
+ .byte 233,49,255,255,255 // jmpq 286fb <_sk_load_bgra_sse2_8bit+0x27>
.byte 102,144 // xchg %ax,%ax
.byte 174 // scas %es:(%rdi),%al
.byte 255 // (bad)
@@ -56639,7 +57188,7 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,92 // jne 2827d <_sk_load_bgra_dst_sse2_8bit+0x7d>
+ .byte 117,92 // jne 28865 <_sk_load_bgra_dst_sse2_8bit+0x7d>
.byte 66,15,16,92,130,16 // movups 0x10(%rdx,%r8,4),%xmm3
.byte 102,66,15,16,20,130 // movupd (%rdx,%r8,4),%xmm2
.byte 102,15,239,228 // pxor %xmm4,%xmm4
@@ -56666,18 +57215,18 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,155 // ja 2822d <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ .byte 119,155 // ja 28815 <_sk_load_bgra_dst_sse2_8bit+0x2d>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 282f8 <_sk_load_bgra_dst_sse2_8bit+0xf8>
+ .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 288e0 <_sk_load_bgra_dst_sse2_8bit+0xf8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,66,15,16,20,130 // movss (%rdx,%r8,4),%xmm2
- .byte 233,124,255,255,255 // jmpq 2822d <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ .byte 233,124,255,255,255 // jmpq 28815 <_sk_load_bgra_dst_sse2_8bit+0x2d>
.byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,66,15,18,20,130 // movlpd (%rdx,%r8,4),%xmm2
- .byte 233,101,255,255,255 // jmpq 2822d <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ .byte 233,101,255,255,255 // jmpq 28815 <_sk_load_bgra_dst_sse2_8bit+0x2d>
.byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 243,66,15,16,84,130,20 // movss 0x14(%rdx,%r8,4),%xmm2
@@ -56686,7 +57235,7 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 243,66,15,16,84,130,16 // movss 0x10(%rdx,%r8,4),%xmm2
.byte 243,15,16,218 // movss %xmm2,%xmm3
- .byte 233,49,255,255,255 // jmpq 28227 <_sk_load_bgra_dst_sse2_8bit+0x27>
+ .byte 233,49,255,255,255 // jmpq 2880f <_sk_load_bgra_dst_sse2_8bit+0x27>
.byte 102,144 // xchg %ax,%ax
.byte 174 // scas %es:(%rdi),%al
.byte 255 // (bad)
@@ -56742,7 +57291,7 @@ _sk_store_bgra_sse2_8bit:
.byte 243,15,112,237,198 // pshufhw $0xc6,%xmm5,%xmm5
.byte 102,15,103,238 // packuswb %xmm6,%xmm5
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 2839a <_sk_store_bgra_sse2_8bit+0x86>
+ .byte 117,17 // jne 28982 <_sk_store_bgra_sse2_8bit+0x86>
.byte 243,66,15,127,44,138 // movdqu %xmm5,(%rdx,%r9,4)
.byte 243,66,15,127,100,138,16 // movdqu %xmm4,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -56750,25 +57299,25 @@ _sk_store_bgra_sse2_8bit:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,239 // ja 28396 <_sk_store_bgra_sse2_8bit+0x82>
+ .byte 119,239 // ja 2897e <_sk_store_bgra_sse2_8bit+0x82>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 28400 <_sk_store_bgra_sse2_8bit+0xec>
+ .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 289e8 <_sk_store_bgra_sse2_8bit+0xec>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,126,44,138 // movd %xmm5,(%rdx,%r9,4)
- .byte 235,211 // jmp 28396 <_sk_store_bgra_sse2_8bit+0x82>
+ .byte 235,211 // jmp 2897e <_sk_store_bgra_sse2_8bit+0x82>
.byte 102,15,112,229,78 // pshufd $0x4e,%xmm5,%xmm4
.byte 102,66,15,126,100,138,8 // movd %xmm4,0x8(%rdx,%r9,4)
.byte 102,66,15,214,44,138 // movq %xmm5,(%rdx,%r9,4)
- .byte 235,191 // jmp 28396 <_sk_store_bgra_sse2_8bit+0x82>
+ .byte 235,191 // jmp 2897e <_sk_store_bgra_sse2_8bit+0x82>
.byte 102,15,112,244,78 // pshufd $0x4e,%xmm4,%xmm6
.byte 102,66,15,126,116,138,24 // movd %xmm6,0x18(%rdx,%r9,4)
.byte 102,15,112,244,229 // pshufd $0xe5,%xmm4,%xmm6
.byte 102,66,15,126,116,138,20 // movd %xmm6,0x14(%rdx,%r9,4)
.byte 102,66,15,126,100,138,16 // movd %xmm4,0x10(%rdx,%r9,4)
.byte 243,66,15,127,44,138 // movdqu %xmm5,(%rdx,%r9,4)
- .byte 235,152 // jmp 28396 <_sk_store_bgra_sse2_8bit+0x82>
+ .byte 235,152 // jmp 2897e <_sk_store_bgra_sse2_8bit+0x82>
.byte 102,144 // xchg %ax,%ax
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
@@ -56803,10 +57352,10 @@ _sk_load_a8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,48 // jne 28469 <_sk_load_a8_sse2_8bit+0x4d>
+ .byte 117,48 // jne 28a51 <_sk_load_a8_sse2_8bit+0x4d>
.byte 243,66,15,126,4,2 // movq (%rdx,%r8,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
- .byte 102,15,84,5,69,51,0,0 // andpd 0x3345(%rip),%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,84,5,93,51,0,0 // andpd 0x335d(%rip),%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,40,200 // movapd %xmm0,%xmm1
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
@@ -56819,15 +57368,15 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,201 // ja 28443 <_sk_load_a8_sse2_8bit+0x27>
+ .byte 119,201 // ja 28a2b <_sk_load_a8_sse2_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 284f4 <_sk_load_a8_sse2_8bit+0xd8>
+ .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 28adc <_sk_load_a8_sse2_8bit+0xd8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,170 // jmp 28443 <_sk_load_a8_sse2_8bit+0x27>
+ .byte 235,170 // jmp 28a2b <_sk_load_a8_sse2_8bit+0x27>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0
@@ -56835,7 +57384,7 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 235,136 // jmp 28443 <_sk_load_a8_sse2_8bit+0x27>
+ .byte 235,136 // jmp 28a2b <_sk_load_a8_sse2_8bit+0x27>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,6 // pinsrw $0x6,%eax,%xmm0
@@ -56846,7 +57395,7 @@ _sk_load_a8_sse2_8bit:
.byte 102,66,15,110,12,2 // movd (%rdx,%r8,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 233,80,255,255,255 // jmpq 28443 <_sk_load_a8_sse2_8bit+0x27>
+ .byte 233,80,255,255,255 // jmpq 28a2b <_sk_load_a8_sse2_8bit+0x27>
.byte 144 // nop
.byte 154 // (bad)
.byte 255 // (bad)
@@ -56880,10 +57429,10 @@ _sk_load_a8_dst_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,48 // jne 2855d <_sk_load_a8_dst_sse2_8bit+0x4d>
+ .byte 117,48 // jne 28b45 <_sk_load_a8_dst_sse2_8bit+0x4d>
.byte 243,66,15,126,20,2 // movq (%rdx,%r8,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
- .byte 102,15,84,21,81,50,0,0 // andpd 0x3251(%rip),%xmm2 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,84,21,105,50,0,0 // andpd 0x3269(%rip),%xmm2 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,40,218 // movapd %xmm2,%xmm3
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
@@ -56896,15 +57445,15 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,201 // ja 28537 <_sk_load_a8_dst_sse2_8bit+0x27>
+ .byte 119,201 // ja 28b1f <_sk_load_a8_dst_sse2_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 285e8 <_sk_load_a8_dst_sse2_8bit+0xd8>
+ .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 28bd0 <_sk_load_a8_dst_sse2_8bit+0xd8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 235,170 // jmp 28537 <_sk_load_a8_dst_sse2_8bit+0x27>
+ .byte 235,170 // jmp 28b1f <_sk_load_a8_dst_sse2_8bit+0x27>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,2 // pinsrw $0x2,%eax,%xmm2
@@ -56912,7 +57461,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,110,216 // movd %eax,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 235,136 // jmp 28537 <_sk_load_a8_dst_sse2_8bit+0x27>
+ .byte 235,136 // jmp 28b1f <_sk_load_a8_dst_sse2_8bit+0x27>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,6 // pinsrw $0x6,%eax,%xmm2
@@ -56923,7 +57472,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,66,15,110,28,2 // movd (%rdx,%r8,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,80,255,255,255 // jmpq 28537 <_sk_load_a8_dst_sse2_8bit+0x27>
+ .byte 233,80,255,255,255 // jmpq 28b1f <_sk_load_a8_dst_sse2_8bit+0x27>
.byte 144 // nop
.byte 154 // (bad)
.byte 255 // (bad)
@@ -56966,8 +57515,8 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,114,228,16 // psrad $0x10,%xmm4
.byte 102,15,107,229 // packssdw %xmm5,%xmm4
.byte 77,133,201 // test %r9,%r9
- .byte 117,22 // jne 28661 <_sk_store_a8_sse2_8bit+0x5d>
- .byte 102,15,219,37,61,49,0,0 // pand 0x313d(%rip),%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 117,22 // jne 28c49 <_sk_store_a8_sse2_8bit+0x5d>
+ .byte 102,15,219,37,85,49,0,0 // pand 0x3155(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,66,15,214,36,2 // movq %xmm4,(%rdx,%r8,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -56975,24 +57524,24 @@ _sk_store_a8_sse2_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,239 // ja 2865d <_sk_store_a8_sse2_8bit+0x59>
+ .byte 119,239 // ja 28c45 <_sk_store_a8_sse2_8bit+0x59>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,131,0,0,0 // lea 0x83(%rip),%rcx # 286fc <_sk_store_a8_sse2_8bit+0xf8>
+ .byte 72,141,13,131,0,0,0 // lea 0x83(%rip),%rcx # 28ce4 <_sk_store_a8_sse2_8bit+0xf8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,15,127,100,36,168 // movdqa %xmm4,-0x58(%rsp)
.byte 138,68,36,168 // mov -0x58(%rsp),%al
.byte 66,136,4,2 // mov %al,(%rdx,%r8,1)
- .byte 235,203 // jmp 2865d <_sk_store_a8_sse2_8bit+0x59>
+ .byte 235,203 // jmp 28c45 <_sk_store_a8_sse2_8bit+0x59>
.byte 102,15,127,100,36,184 // movdqa %xmm4,-0x48(%rsp)
.byte 138,68,36,188 // mov -0x44(%rsp),%al
.byte 66,136,68,2,2 // mov %al,0x2(%rdx,%r8,1)
- .byte 102,15,219,37,231,48,0,0 // pand 0x30e7(%rip),%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,37,255,48,0,0 // pand 0x30ff(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,126,224 // movd %xmm4,%eax
.byte 102,66,137,4,2 // mov %ax,(%rdx,%r8,1)
- .byte 235,165 // jmp 2865d <_sk_store_a8_sse2_8bit+0x59>
+ .byte 235,165 // jmp 28c45 <_sk_store_a8_sse2_8bit+0x59>
.byte 102,15,127,100,36,232 // movdqa %xmm4,-0x18(%rsp)
.byte 138,68,36,244 // mov -0xc(%rsp),%al
.byte 66,136,68,2,6 // mov %al,0x6(%rdx,%r8,1)
@@ -57002,17 +57551,17 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,127,100,36,200 // movdqa %xmm4,-0x38(%rsp)
.byte 138,68,36,208 // mov -0x30(%rsp),%al
.byte 66,136,68,2,4 // mov %al,0x4(%rdx,%r8,1)
- .byte 102,15,219,37,163,48,0,0 // pand 0x30a3(%rip),%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,37,187,48,0,0 // pand 0x30bb(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,66,15,126,36,2 // movd %xmm4,(%rdx,%r8,1)
- .byte 233,97,255,255,255 // jmpq 2865d <_sk_store_a8_sse2_8bit+0x59>
+ .byte 233,97,255,255,255 // jmpq 28c45 <_sk_store_a8_sse2_8bit+0x59>
.byte 134,255 // xchg %bh,%bh
.byte 255 // (bad)
.byte 255,165,255,255,255,150 // jmpq *-0x69000001(%rbp)
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,218 // jmpq ffffffffdb02870c <_sk_overlay_sse2_8bit+0xffffffffdaffdd4b>
+ .byte 233,255,255,255,218 // jmpq ffffffffdb028cf4 <_sk_overlay_sse2_8bit+0xffffffffdaffdd3f>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,203 // dec %ebx
@@ -57036,15 +57585,15 @@ _sk_load_g8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,116 // jne 287a9 <_sk_load_g8_sse2_8bit+0x91>
+ .byte 117,116 // jne 28d91 <_sk_load_g8_sse2_8bit+0x91>
.byte 243,66,15,126,4,2 // movq (%rdx,%r8,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
- .byte 102,15,84,5,73,48,0,0 // andpd 0x3049(%rip),%xmm0 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,84,5,97,48,0,0 // andpd 0x3061(%rip),%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,40,224 // movapd %xmm0,%xmm4
.byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
.byte 102,15,105,193 // punpckhwd %xmm1,%xmm0
- .byte 102,15,111,45,129,55,0,0 // movdqa 0x3781(%rip),%xmm5 # 2bee0 <_sk_overlay_sse2_8bit+0x151f>
+ .byte 102,15,111,45,153,55,0,0 // movdqa 0x3799(%rip),%xmm5 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b>
.byte 102,15,112,240,245 // pshufd $0xf5,%xmm0,%xmm6
.byte 102,15,244,197 // pmuludq %xmm5,%xmm0
.byte 102,15,112,200,232 // pshufd $0xe8,%xmm0,%xmm1
@@ -57057,7 +57606,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,244,245 // pmuludq %xmm5,%xmm6
.byte 102,15,112,230,232 // pshufd $0xe8,%xmm6,%xmm4
.byte 102,15,98,196 // punpckldq %xmm4,%xmm0
- .byte 102,15,111,37,3,55,0,0 // movdqa 0x3703(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,37,27,55,0,0 // movdqa 0x371b(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,235,196 // por %xmm4,%xmm0
.byte 102,15,235,204 // por %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -57066,15 +57615,15 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,133 // ja 2873f <_sk_load_g8_sse2_8bit+0x27>
+ .byte 119,133 // ja 28d27 <_sk_load_g8_sse2_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 2883c <_sk_load_g8_sse2_8bit+0x124>
+ .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 28e24 <_sk_load_g8_sse2_8bit+0x124>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 233,99,255,255,255 // jmpq 2873f <_sk_load_g8_sse2_8bit+0x27>
+ .byte 233,99,255,255,255 // jmpq 28d27 <_sk_load_g8_sse2_8bit+0x27>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0
@@ -57082,7 +57631,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 233,62,255,255,255 // jmpq 2873f <_sk_load_g8_sse2_8bit+0x27>
+ .byte 233,62,255,255,255 // jmpq 28d27 <_sk_load_g8_sse2_8bit+0x27>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,6 // pinsrw $0x6,%eax,%xmm0
@@ -57093,7 +57642,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,66,15,110,12,2 // movd (%rdx,%r8,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 233,6,255,255,255 // jmpq 2873f <_sk_load_g8_sse2_8bit+0x27>
+ .byte 233,6,255,255,255 // jmpq 28d27 <_sk_load_g8_sse2_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
@@ -57128,15 +57677,15 @@ _sk_load_g8_dst_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,116 // jne 288e9 <_sk_load_g8_dst_sse2_8bit+0x91>
+ .byte 117,116 // jne 28ed1 <_sk_load_g8_dst_sse2_8bit+0x91>
.byte 243,66,15,126,20,2 // movq (%rdx,%r8,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
- .byte 102,15,84,21,9,47,0,0 // andpd 0x2f09(%rip),%xmm2 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,84,21,33,47,0,0 // andpd 0x2f21(%rip),%xmm2 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,40,226 // movapd %xmm2,%xmm4
.byte 102,15,97,227 // punpcklwd %xmm3,%xmm4
.byte 102,15,105,211 // punpckhwd %xmm3,%xmm2
- .byte 102,15,111,45,65,54,0,0 // movdqa 0x3641(%rip),%xmm5 # 2bee0 <_sk_overlay_sse2_8bit+0x151f>
+ .byte 102,15,111,45,89,54,0,0 // movdqa 0x3659(%rip),%xmm5 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b>
.byte 102,15,112,242,245 // pshufd $0xf5,%xmm2,%xmm6
.byte 102,15,244,213 // pmuludq %xmm5,%xmm2
.byte 102,15,112,218,232 // pshufd $0xe8,%xmm2,%xmm3
@@ -57149,7 +57698,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,244,245 // pmuludq %xmm5,%xmm6
.byte 102,15,112,230,232 // pshufd $0xe8,%xmm6,%xmm4
.byte 102,15,98,212 // punpckldq %xmm4,%xmm2
- .byte 102,15,111,37,195,53,0,0 // movdqa 0x35c3(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 102,15,111,37,219,53,0,0 // movdqa 0x35db(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,235,220 // por %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -57158,15 +57707,15 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,133 // ja 2887f <_sk_load_g8_dst_sse2_8bit+0x27>
+ .byte 119,133 // ja 28e67 <_sk_load_g8_dst_sse2_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 2897c <_sk_load_g8_dst_sse2_8bit+0x124>
+ .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 28f64 <_sk_load_g8_dst_sse2_8bit+0x124>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,99,255,255,255 // jmpq 2887f <_sk_load_g8_dst_sse2_8bit+0x27>
+ .byte 233,99,255,255,255 // jmpq 28e67 <_sk_load_g8_dst_sse2_8bit+0x27>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,2 // pinsrw $0x2,%eax,%xmm2
@@ -57174,7 +57723,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,110,216 // movd %eax,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 233,62,255,255,255 // jmpq 2887f <_sk_load_g8_dst_sse2_8bit+0x27>
+ .byte 233,62,255,255,255 // jmpq 28e67 <_sk_load_g8_dst_sse2_8bit+0x27>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,6 // pinsrw $0x6,%eax,%xmm2
@@ -57185,7 +57734,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,66,15,110,28,2 // movd (%rdx,%r8,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,6,255,255,255 // jmpq 2887f <_sk_load_g8_dst_sse2_8bit+0x27>
+ .byte 233,6,255,255,255 // jmpq 28e67 <_sk_load_g8_dst_sse2_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
@@ -57221,7 +57770,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,253,0,0,0 // jne 28aba <_sk_srcover_rgba_8888_sse2_8bit+0x122>
+ .byte 15,133,253,0,0,0 // jne 290a2 <_sk_srcover_rgba_8888_sse2_8bit+0x122>
.byte 70,15,16,68,138,16 // movups 0x10(%rdx,%r9,4),%xmm8
.byte 102,70,15,16,12,138 // movupd (%rdx,%r9,4),%xmm9
.byte 77,133,192 // test %r8,%r8
@@ -57270,7 +57819,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,68,15,248,207 // psubb %xmm7,%xmm9
.byte 102,68,15,252,200 // paddb %xmm0,%xmm9
.byte 102,68,15,252,193 // paddb %xmm1,%xmm8
- .byte 117,72 // jne 28af1 <_sk_srcover_rgba_8888_sse2_8bit+0x159>
+ .byte 117,72 // jne 290d9 <_sk_srcover_rgba_8888_sse2_8bit+0x159>
.byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4)
.byte 243,70,15,127,68,138,16 // movdqu %xmm8,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -57281,29 +57830,29 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 254,200 // dec %al
.byte 60,6 // cmp $0x6,%al
- .byte 15,135,246,254,255,255 // ja 289c9 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ .byte 15,135,246,254,255,255 // ja 28fb1 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
.byte 15,182,192 // movzbl %al,%eax
- .byte 72,141,13,207,0,0,0 // lea 0xcf(%rip),%rcx # 28bac <_sk_srcover_rgba_8888_sse2_8bit+0x214>
+ .byte 72,141,13,207,0,0,0 // lea 0xcf(%rip),%rcx # 29194 <_sk_srcover_rgba_8888_sse2_8bit+0x214>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,70,15,16,12,138 // movss (%rdx,%r9,4),%xmm9
- .byte 233,216,254,255,255 // jmpq 289c9 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ .byte 233,216,254,255,255 // jmpq 28fb1 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,184 // ja 28ab6 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ .byte 119,184 // ja 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,191,0,0,0 // lea 0xbf(%rip),%rcx # 28bc8 <_sk_srcover_rgba_8888_sse2_8bit+0x230>
+ .byte 72,141,13,191,0,0,0 // lea 0xbf(%rip),%rcx # 291b0 <_sk_srcover_rgba_8888_sse2_8bit+0x230>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,70,15,126,12,138 // movd %xmm9,(%rdx,%r9,4)
- .byte 235,156 // jmp 28ab6 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ .byte 235,156 // jmp 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
.byte 102,66,15,110,100,138,8 // movd 0x8(%rdx,%r9,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,70,15,18,12,138 // movlpd (%rdx,%r9,4),%xmm9
- .byte 233,151,254,255,255 // jmpq 289c9 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ .byte 233,151,254,255,255 // jmpq 28fb1 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
.byte 102,66,15,110,100,138,24 // movd 0x18(%rdx,%r9,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
.byte 243,66,15,16,100,138,20 // movss 0x14(%rdx,%r9,4),%xmm4
@@ -57312,23 +57861,23 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 68,15,40,196 // movaps %xmm4,%xmm8
.byte 243,66,15,16,100,138,16 // movss 0x10(%rdx,%r9,4),%xmm4
.byte 243,68,15,16,196 // movss %xmm4,%xmm8
- .byte 233,94,254,255,255 // jmpq 289c3 <_sk_srcover_rgba_8888_sse2_8bit+0x2b>
+ .byte 233,94,254,255,255 // jmpq 28fab <_sk_srcover_rgba_8888_sse2_8bit+0x2b>
.byte 102,65,15,112,225,78 // pshufd $0x4e,%xmm9,%xmm4
.byte 102,66,15,126,100,138,8 // movd %xmm4,0x8(%rdx,%r9,4)
.byte 102,70,15,214,12,138 // movq %xmm9,(%rdx,%r9,4)
- .byte 233,57,255,255,255 // jmpq 28ab6 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ .byte 233,57,255,255,255 // jmpq 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
.byte 102,65,15,112,224,78 // pshufd $0x4e,%xmm8,%xmm4
.byte 102,66,15,126,100,138,24 // movd %xmm4,0x18(%rdx,%r9,4)
.byte 102,65,15,112,224,229 // pshufd $0xe5,%xmm8,%xmm4
.byte 102,66,15,126,100,138,20 // movd %xmm4,0x14(%rdx,%r9,4)
.byte 102,70,15,126,68,138,16 // movd %xmm8,0x10(%rdx,%r9,4)
.byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4)
- .byte 233,13,255,255,255 // jmpq 28ab6 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ .byte 233,13,255,255,255 // jmpq 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
.byte 15,31,0 // nopl (%rax)
.byte 58,255 // cmp %bh,%bh
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 123,255 // jnp 28bb1 <_sk_srcover_rgba_8888_sse2_8bit+0x219>
+ .byte 123,255 // jnp 29199 <_sk_srcover_rgba_8888_sse2_8bit+0x219>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -57366,7 +57915,7 @@ _sk_scale_1_float_sse2_8bit:
.byte 102,68,15,111,200 // movdqa %xmm0,%xmm9
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,0 // movss (%rax),%xmm0
- .byte 243,15,89,5,52,34,0,0 // mulss 0x2234(%rip),%xmm0 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,89,5,64,34,0,0 // mulss 0x2240(%rip),%xmm0 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,44,192 // cvttss2si %xmm0,%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
@@ -57378,7 +57927,7 @@ _sk_scale_1_float_sse2_8bit:
.byte 102,15,96,246 // punpcklbw %xmm6,%xmm6
.byte 242,15,112,246,0 // pshuflw $0x0,%xmm6,%xmm6
.byte 102,15,112,246,80 // pshufd $0x50,%xmm6,%xmm6
- .byte 102,15,219,53,91,43,0,0 // pand 0x2b5b(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,219,53,115,43,0,0 // pand 0x2b73(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
.byte 102,65,15,213,248 // pmullw %xmm8,%xmm7
.byte 102,15,111,230 // movdqa %xmm6,%xmm4
@@ -57411,10 +57960,10 @@ _sk_scale_u8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,239,0,0,0 // jne 28d95 <_sk_scale_u8_sse2_8bit+0x110>
+ .byte 15,133,239,0,0,0 // jne 2937d <_sk_scale_u8_sse2_8bit+0x110>
.byte 243,66,15,126,36,2 // movq (%rdx,%r8,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
- .byte 102,15,84,37,216,42,0,0 // andpd 0x2ad8(%rip),%xmm4 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,84,37,240,42,0,0 // andpd 0x2af0(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,40,236 // movapd %xmm4,%xmm5
.byte 102,65,15,105,232 // punpckhwd %xmm8,%xmm5
@@ -57467,15 +58016,15 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,6,255,255,255 // ja 28cb0 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 15,135,6,255,255,255 // ja 29298 <_sk_scale_u8_sse2_8bit+0x2b>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 28e2c <_sk_scale_u8_sse2_8bit+0x1a7>
+ .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 29414 <_sk_scale_u8_sse2_8bit+0x1a7>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 233,228,254,255,255 // jmpq 28cb0 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 233,228,254,255,255 // jmpq 29298 <_sk_scale_u8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,196,224,2 // pinsrw $0x2,%eax,%xmm4
@@ -57483,7 +58032,7 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 243,15,16,229 // movss %xmm5,%xmm4
- .byte 233,191,254,255,255 // jmpq 28cb0 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 233,191,254,255,255 // jmpq 29298 <_sk_scale_u8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,196,224,6 // pinsrw $0x6,%eax,%xmm4
@@ -57494,7 +58043,7 @@ _sk_scale_u8_sse2_8bit:
.byte 102,66,15,110,44,2 // movd (%rdx,%r8,1),%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,135,254,255,255 // jmpq 28cb0 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 233,135,254,255,255 // jmpq 29298 <_sk_scale_u8_sse2_8bit+0x2b>
.byte 15,31,0 // nopl (%rax)
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
@@ -57523,7 +58072,7 @@ FUNCTION(_sk_lerp_1_float_sse2_8bit)
_sk_lerp_1_float_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,32 // movss (%rax),%xmm4
- .byte 243,15,89,37,218,31,0,0 // mulss 0x1fda(%rip),%xmm4 # 2ae30 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,89,37,230,31,0,0 // mulss 0x1fe6(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,44,196 // cvttss2si %xmm4,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,228 // punpcklbw %xmm4,%xmm4
@@ -57536,7 +58085,7 @@ _sk_lerp_1_float_sse2_8bit:
.byte 102,68,15,111,217 // movdqa %xmm1,%xmm11
.byte 102,69,15,96,217 // punpcklbw %xmm9,%xmm11
.byte 102,65,15,104,201 // punpckhbw %xmm9,%xmm1
- .byte 102,15,111,53,249,40,0,0 // movdqa 0x28f9(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,111,53,17,41,0,0 // movdqa 0x2911(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,65,15,219,240 // pand %xmm8,%xmm6
.byte 102,15,111,230 // movdqa %xmm6,%xmm4
.byte 102,15,213,225 // pmullw %xmm1,%xmm4
@@ -57601,10 +58150,10 @@ _sk_lerp_u8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,141,1,0,0 // jne 2912c <_sk_lerp_u8_sse2_8bit+0x1ae>
+ .byte 15,133,141,1,0,0 // jne 29714 <_sk_lerp_u8_sse2_8bit+0x1ae>
.byte 243,66,15,126,44,2 // movq (%rdx,%r8,1),%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
- .byte 102,15,84,45,223,39,0,0 // andpd 0x27df(%rip),%xmm5 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,84,45,247,39,0,0 // andpd 0x27f7(%rip),%xmm5 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,40,229 // movapd %xmm5,%xmm4
.byte 102,65,15,105,224 // punpckhwd %xmm8,%xmm4
@@ -57690,15 +58239,15 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,104,254,255,255 // ja 28fa9 <_sk_lerp_u8_sse2_8bit+0x2b>
+ .byte 15,135,104,254,255,255 // ja 29591 <_sk_lerp_u8_sse2_8bit+0x2b>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,116,0,0,0 // lea 0x74(%rip),%rcx # 291c0 <_sk_lerp_u8_sse2_8bit+0x242>
+ .byte 72,141,13,116,0,0,0 // lea 0x74(%rip),%rcx # 297a8 <_sk_lerp_u8_sse2_8bit+0x242>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,232 // movd %eax,%xmm5
- .byte 233,70,254,255,255 // jmpq 28fa9 <_sk_lerp_u8_sse2_8bit+0x2b>
+ .byte 233,70,254,255,255 // jmpq 29591 <_sk_lerp_u8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,196,232,2 // pinsrw $0x2,%eax,%xmm5
@@ -57706,7 +58255,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 243,15,16,236 // movss %xmm4,%xmm5
- .byte 233,33,254,255,255 // jmpq 28fa9 <_sk_lerp_u8_sse2_8bit+0x2b>
+ .byte 233,33,254,255,255 // jmpq 29591 <_sk_lerp_u8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,196,232,6 // pinsrw $0x6,%eax,%xmm5
@@ -57717,7 +58266,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,66,15,110,36,2 // movd (%rdx,%r8,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 242,15,16,236 // movsd %xmm4,%xmm5
- .byte 233,233,253,255,255 // jmpq 28fa9 <_sk_lerp_u8_sse2_8bit+0x2b>
+ .byte 233,233,253,255,255 // jmpq 29591 <_sk_lerp_u8_sse2_8bit+0x2b>
.byte 149 // xchg %eax,%ebp
.byte 255 // (bad)
.byte 255 // (bad)
@@ -57762,7 +58311,7 @@ HIDDEN _sk_black_color_sse2_8bit
FUNCTION(_sk_black_color_sse2_8bit)
_sk_black_color_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,167,44,0,0 // movaps 0x2ca7(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0x14df>
+ .byte 15,40,5,191,44,0,0 // movaps 0x2cbf(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 255,224 // jmpq *%rax
@@ -58559,6 +59108,15 @@ _sk_xor__sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_plus__sse2_8bit
+.globl _sk_plus__sse2_8bit
+FUNCTION(_sk_plus__sse2_8bit)
+_sk_plus__sse2_8bit:
+ .byte 102,15,220,194 // paddusb %xmm2,%xmm0
+ .byte 102,15,220,203 // paddusb %xmm3,%xmm1
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 255,224 // jmpq *%rax
+
HIDDEN _sk_darken_sse2_8bit
.globl _sk_darken_sse2_8bit
FUNCTION(_sk_darken_sse2_8bit)
@@ -58654,7 +59212,7 @@ _sk_darken_sse2_8bit:
.byte 102,65,15,248,234 // psubb %xmm10,%xmm5
.byte 102,15,248,207 // psubb %xmm7,%xmm1
.byte 102,15,248,196 // psubb %xmm4,%xmm0
- .byte 102,15,111,37,66,30,0,0 // movdqa 0x1e42(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 102,15,111,37,78,30,0,0 // movdqa 0x1e4e(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,252 // movdqa %xmm4,%xmm7
.byte 102,15,223,248 // pandn %xmm0,%xmm7
@@ -58762,7 +59320,7 @@ _sk_lighten_sse2_8bit:
.byte 102,65,15,248,234 // psubb %xmm10,%xmm5
.byte 102,15,248,207 // psubb %xmm7,%xmm1
.byte 102,15,248,196 // psubb %xmm4,%xmm0
- .byte 102,15,111,37,86,28,0,0 // movdqa 0x1c56(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 102,15,111,37,98,28,0,0 // movdqa 0x1c62(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,252 // movdqa %xmm4,%xmm7
.byte 102,15,223,248 // pandn %xmm0,%xmm7
@@ -58812,7 +59370,7 @@ _sk_exclusion_sse2_8bit:
.byte 102,15,113,214,8 // psrlw $0x8,%xmm6
.byte 102,15,103,244 // packuswb %xmm4,%xmm6
.byte 102,15,103,239 // packuswb %xmm7,%xmm5
- .byte 102,15,111,37,137,27,0,0 // movdqa 0x1b89(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 102,15,111,37,149,27,0,0 // movdqa 0x1b95(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,15,248,205 // psubb %xmm5,%xmm1
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,219,230 // pand %xmm6,%xmm4
@@ -58911,7 +59469,7 @@ _sk_difference_sse2_8bit:
.byte 102,65,15,103,244 // packuswb %xmm12,%xmm6
.byte 102,65,15,218,226 // pminub %xmm10,%xmm4
.byte 102,65,15,218,243 // pminub %xmm11,%xmm6
- .byte 102,15,111,45,198,25,0,0 // movdqa 0x19c6(%rip),%xmm5 # 2bf30 <_sk_overlay_sse2_8bit+0x156f>
+ .byte 102,15,111,45,210,25,0,0 // movdqa 0x19d2(%rip),%xmm5 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 102,15,219,236 // pand %xmm4,%xmm5
@@ -59008,7 +59566,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,68,15,111,220 // movdqa %xmm4,%xmm11
.byte 102,69,15,217,211 // psubusw %xmm11,%xmm10
.byte 102,68,15,117,213 // pcmpeqw %xmm5,%xmm10
- .byte 102,15,111,45,97,16,0,0 // movdqa 0x1061(%rip),%xmm5 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,111,45,109,16,0,0 // movdqa 0x106d(%rip),%xmm5 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,111,198 // movdqa %xmm6,%xmm0
.byte 102,15,239,197 // pxor %xmm5,%xmm0
.byte 102,65,15,213,198 // pmullw %xmm14,%xmm0
@@ -59112,7 +59670,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,68,15,253,124,36,32 // paddw 0x20(%rsp),%xmm15
.byte 102,68,15,253,76,36,144 // paddw -0x70(%rsp),%xmm9
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
- .byte 102,15,111,5,5,22,0,0 // movdqa 0x1605(%rip),%xmm0 # 2bf40 <_sk_overlay_sse2_8bit+0x157f>
+ .byte 102,15,111,5,17,22,0,0 // movdqa 0x1611(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,15,253,208 // paddw %xmm0,%xmm2
.byte 102,68,15,253,210 // paddw %xmm2,%xmm10
.byte 102,68,15,253,248 // paddw %xmm0,%xmm15
@@ -59121,7 +59679,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,69,15,253,193 // paddw %xmm9,%xmm8
.byte 102,15,253,232 // paddw %xmm0,%xmm5
.byte 102,15,253,233 // paddw %xmm1,%xmm5
- .byte 102,15,111,5,232,21,0,0 // movdqa 0x15e8(%rip),%xmm0 # 2bf50 <_sk_overlay_sse2_8bit+0x158f>
+ .byte 102,15,111,5,244,21,0,0 // movdqa 0x15f4(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b>
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
.byte 102,68,15,228,192 // pmulhuw %xmm0,%xmm8
.byte 102,68,15,228,248 // pmulhuw %xmm0,%xmm15
@@ -59226,7 +59784,7 @@ _sk_overlay_sse2_8bit:
.byte 102,15,217,234 // psubusw %xmm2,%xmm5
.byte 102,15,117,236 // pcmpeqw %xmm4,%xmm5
.byte 102,15,127,108,36,32 // movdqa %xmm5,0x20(%rsp)
- .byte 102,15,111,53,49,12,0,0 // movdqa 0xc31(%rip),%xmm6 # 2b790 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 102,15,111,53,61,12,0,0 // movdqa 0xc3d(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
.byte 102,15,111,194 // movdqa %xmm2,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,65,15,213,199 // pmullw %xmm15,%xmm0
@@ -59334,7 +59892,7 @@ _sk_overlay_sse2_8bit:
.byte 102,68,15,253,92,36,240 // paddw -0x10(%rsp),%xmm11
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
.byte 102,15,253,116,36,144 // paddw -0x70(%rsp),%xmm6
- .byte 102,15,111,5,196,17,0,0 // movdqa 0x11c4(%rip),%xmm0 # 2bf40 <_sk_overlay_sse2_8bit+0x157f>
+ .byte 102,15,111,5,208,17,0,0 // movdqa 0x11d0(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,68,15,253,224 // paddw %xmm0,%xmm12
.byte 102,68,15,253,227 // paddw %xmm3,%xmm12
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
@@ -59343,7 +59901,7 @@ _sk_overlay_sse2_8bit:
.byte 102,15,253,234 // paddw %xmm2,%xmm5
.byte 102,15,253,240 // paddw %xmm0,%xmm6
.byte 102,15,253,241 // paddw %xmm1,%xmm6
- .byte 102,15,111,5,168,17,0,0 // movdqa 0x11a8(%rip),%xmm0 # 2bf50 <_sk_overlay_sse2_8bit+0x158f>
+ .byte 102,15,111,5,180,17,0,0 // movdqa 0x11b4(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
@@ -59377,14 +59935,14 @@ BALIGN4
.byte 252 // cld
.byte 190,0,0,128,191 // mov $0xbf800000,%esi
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2ae64 <.literal4+0x64>
+ .byte 224,64 // loopne 2b458 <.literal4+0x64>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 2ae6d <.literal4+0x6d>
+ .byte 71,225,61 // rex.RXB loope 2b461 <.literal4+0x6d>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2ae77 <.literal4+0x77>
+ .byte 127,67 // jg 2b46b <.literal4+0x77>
.byte 145 // xchg %eax,%ecx
.byte 131,158,61,92,143,50,63 // sbbl $0x3f,0x328f5c3d(%rsi)
.byte 10,215 // or %bh,%dl
@@ -59417,7 +59975,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 2ae8d <.literal4+0x8d>
+ .byte 224,7 // loopne 2b481 <.literal4+0x8d>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -59428,8 +59986,8 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 0,52,255 // add %dh,(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,0 // jg 2aea0 <.literal4+0xa0>
- .byte 119,115 // ja 2af15 <.literal4+0x115>
+ .byte 127,0 // jg 2b494 <.literal4+0xa0>
+ .byte 119,115 // ja 2b509 <.literal4+0x115>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -59452,12 +60010,12 @@ BALIGN4
.byte 190,80,128,3,62 // mov $0x3e038050,%esi
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2af2b <.literal4+0x12b>
+ .byte 118,63 // jbe 2b51f <.literal4+0x12b>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 0,0 // add %al,(%rax)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 2af3a <.literal4+0x13a>
+ .byte 124,66 // jl 2b52e <.literal4+0x13a>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
@@ -59467,9 +60025,9 @@ BALIGN4
.byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 2af5d <.literal4+0x15d>
+ .byte 112,65 // jo 2b551 <.literal4+0x15d>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2af67 <.literal4+0x167>
+ .byte 127,71 // jg 2b55b <.literal4+0x167>
.byte 208 // (bad)
.byte 179,89 // mov $0x59,%bl
.byte 62,89 // ds pop %rcx
@@ -59496,15 +60054,15 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 128,0,0 // addb $0x0,(%rax)
.byte 0,191,0,0,192,191 // add %bh,-0x40400000(%rdi)
- .byte 114,28 // jb 2af86 <.literal4+0x186>
+ .byte 114,28 // jb 2b57a <.literal4+0x186>
.byte 199 // (bad)
.byte 62,0,0 // add %al,%ds:(%rax)
.byte 192,63,85 // sarb $0x55,(%rdi)
.byte 85 // push %rbp
.byte 149 // xchg %eax,%ebp
.byte 191,57,142,99,61 // mov $0x3d638e39,%edi
- .byte 114,249 // jb 2af73 <.literal4+0x173>
- .byte 127,63 // jg 2afbb <_sk_overlay_sse2_8bit+0x5fa>
+ .byte 114,249 // jb 2b567 <.literal4+0x173>
+ .byte 127,63 // jg 2b5af <_sk_overlay_sse2_8bit+0x5fa>
.byte 3,0 // add (%rax),%eax
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,4 // add %al,0x4000000(%rax)
@@ -59540,16 +60098,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02afc8 <_sk_overlay_sse2_8bit+0xa000607>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b5c8 <_sk_overlay_sse2_8bit+0xa000613>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202afd0 <_sk_overlay_sse2_8bit+0x1200060f>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b5d0 <_sk_overlay_sse2_8bit+0x1200061b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02afd8 <_sk_overlay_sse2_8bit+0x1a000617>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b5d8 <_sk_overlay_sse2_8bit+0x1a000623>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302afe0 <_sk_overlay_sse2_8bit+0x300061f>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b5e0 <_sk_overlay_sse2_8bit+0x300062b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -59592,16 +60150,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b028 <_sk_overlay_sse2_8bit+0xa000667>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b628 <_sk_overlay_sse2_8bit+0xa000673>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b030 <_sk_overlay_sse2_8bit+0x1200066f>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b630 <_sk_overlay_sse2_8bit+0x1200067b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b038 <_sk_overlay_sse2_8bit+0x1a000677>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b638 <_sk_overlay_sse2_8bit+0x1a000683>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b040 <_sk_overlay_sse2_8bit+0x300067f>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b640 <_sk_overlay_sse2_8bit+0x300068b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -59644,16 +60202,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b088 <_sk_overlay_sse2_8bit+0xa0006c7>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b688 <_sk_overlay_sse2_8bit+0xa0006d3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b090 <_sk_overlay_sse2_8bit+0x120006cf>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b690 <_sk_overlay_sse2_8bit+0x120006db>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b098 <_sk_overlay_sse2_8bit+0x1a0006d7>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b698 <_sk_overlay_sse2_8bit+0x1a0006e3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b0a0 <_sk_overlay_sse2_8bit+0x30006df>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b6a0 <_sk_overlay_sse2_8bit+0x30006eb>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -59696,16 +60254,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b0e8 <_sk_overlay_sse2_8bit+0xa000727>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b6e8 <_sk_overlay_sse2_8bit+0xa000733>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b0f0 <_sk_overlay_sse2_8bit+0x1200072f>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b6f0 <_sk_overlay_sse2_8bit+0x1200073b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b0f8 <_sk_overlay_sse2_8bit+0x1a000737>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b6f8 <_sk_overlay_sse2_8bit+0x1a000743>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b100 <_sk_overlay_sse2_8bit+0x300073f>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b700 <_sk_overlay_sse2_8bit+0x300074b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -59748,16 +60306,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b148 <_sk_overlay_sse2_8bit+0xa000787>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b748 <_sk_overlay_sse2_8bit+0xa000793>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b150 <_sk_overlay_sse2_8bit+0x1200078f>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b750 <_sk_overlay_sse2_8bit+0x1200079b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b158 <_sk_overlay_sse2_8bit+0x1a000797>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b758 <_sk_overlay_sse2_8bit+0x1a0007a3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b160 <_sk_overlay_sse2_8bit+0x300079f>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b760 <_sk_overlay_sse2_8bit+0x30007ab>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -59800,16 +60358,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b1a8 <_sk_overlay_sse2_8bit+0xa0007e7>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b7a8 <_sk_overlay_sse2_8bit+0xa0007f3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b1b0 <_sk_overlay_sse2_8bit+0x120007ef>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b7b0 <_sk_overlay_sse2_8bit+0x120007fb>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b1b8 <_sk_overlay_sse2_8bit+0x1a0007f7>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b7b8 <_sk_overlay_sse2_8bit+0x1a000803>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b1c0 <_sk_overlay_sse2_8bit+0x30007ff>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b7c0 <_sk_overlay_sse2_8bit+0x300080b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -59852,16 +60410,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b208 <_sk_overlay_sse2_8bit+0xa000847>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b808 <_sk_overlay_sse2_8bit+0xa000853>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b210 <_sk_overlay_sse2_8bit+0x1200084f>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b810 <_sk_overlay_sse2_8bit+0x1200085b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b218 <_sk_overlay_sse2_8bit+0x1a000857>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b818 <_sk_overlay_sse2_8bit+0x1a000863>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b220 <_sk_overlay_sse2_8bit+0x300085f>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b820 <_sk_overlay_sse2_8bit+0x300086b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -59904,16 +60462,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b268 <_sk_overlay_sse2_8bit+0xa0008a7>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b868 <_sk_overlay_sse2_8bit+0xa0008b3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b270 <_sk_overlay_sse2_8bit+0x120008af>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b870 <_sk_overlay_sse2_8bit+0x120008bb>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b278 <_sk_overlay_sse2_8bit+0x1a0008b7>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b878 <_sk_overlay_sse2_8bit+0x1a0008c3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b280 <_sk_overlay_sse2_8bit+0x30008bf>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b880 <_sk_overlay_sse2_8bit+0x30008cb>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -60750,11 +61308,11 @@ BALIGN16
.byte 0,128,191,0,0,128 // add %al,-0x7fffff41(%rax)
.byte 191,0,0,224,64 // mov $0x40e00000,%edi
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2b888 <.literal16+0xf8>
+ .byte 224,64 // loopne 2be88 <.literal16+0xf8>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2b88c <.literal16+0xfc>
+ .byte 224,64 // loopne 2be8c <.literal16+0xfc>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2b890 <.literal16+0x100>
+ .byte 224,64 // loopne 2be90 <.literal16+0x100>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
@@ -60774,13 +61332,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2b8b1 <.literal16+0x121>
+ .byte 71,225,61 // rex.RXB loope 2beb1 <.literal16+0x121>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2b8b5 <.literal16+0x125>
+ .byte 71,225,61 // rex.RXB loope 2beb5 <.literal16+0x125>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2b8b9 <.literal16+0x129>
+ .byte 71,225,61 // rex.RXB loope 2beb9 <.literal16+0x129>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2b8bd <.literal16+0x12d>
+ .byte 71,225,61 // rex.RXB loope 2bebd <.literal16+0x12d>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -60791,10 +61349,10 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b898 <_sk_overlay_sse2_8bit+0xa000ed7>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02be98 <_sk_overlay_sse2_8bit+0xa000ee3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 302b8a0 <_sk_overlay_sse2_8bit+0x3000edf>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 302bea0 <_sk_overlay_sse2_8bit+0x3000eeb>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -60809,11 +61367,11 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2b8fb <.literal16+0x16b>
+ .byte 127,67 // jg 2befb <.literal16+0x16b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2b8ff <.literal16+0x16f>
+ .byte 127,67 // jg 2beff <.literal16+0x16f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2b903 <.literal16+0x173>
+ .byte 127,67 // jg 2bf03 <.literal16+0x173>
.byte 145 // xchg %eax,%ecx
.byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%rsi)
.byte 145 // xchg %eax,%ecx
@@ -60964,13 +61522,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 2ba09 <.literal16+0x279>
+ .byte 224,7 // loopne 2c009 <.literal16+0x279>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2ba0d <.literal16+0x27d>
+ .byte 224,7 // loopne 2c00d <.literal16+0x27d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2ba11 <.literal16+0x281>
+ .byte 224,7 // loopne 2c011 <.literal16+0x281>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2ba15 <.literal16+0x285>
+ .byte 224,7 // loopne 2c015 <.literal16+0x285>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -61030,17 +61588,17 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 2ba94 <.literal16+0x304>
+ .byte 127,0 // jg 2c094 <.literal16+0x304>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2ba98 <.literal16+0x308>
+ .byte 127,0 // jg 2c098 <.literal16+0x308>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2ba9c <.literal16+0x30c>
+ .byte 127,0 // jg 2c09c <.literal16+0x30c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2baa0 <.literal16+0x310>
- .byte 119,115 // ja 2bb15 <.literal16+0x385>
+ .byte 127,0 // jg 2c0a0 <.literal16+0x310>
+ .byte 119,115 // ja 2c115 <.literal16+0x385>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -61051,7 +61609,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 2ba79 <.literal16+0x2e9>
+ .byte 117,191 // jne 2c079 <.literal16+0x2e9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -61063,7 +61621,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a5faba <_sk_overlay_sse2_8bit+0xffffffffe9a350f9>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a600ba <_sk_overlay_sse2_8bit+0xffffffffe9a35105>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -61153,16 +61711,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2bc03 <.literal16+0x473>
+ .byte 118,63 // jbe 2c203 <.literal16+0x473>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2bc07 <.literal16+0x477>
+ .byte 118,63 // jbe 2c207 <.literal16+0x477>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2bc0b <.literal16+0x47b>
+ .byte 118,63 // jbe 2c20b <.literal16+0x47b>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2bc0f <.literal16+0x47f>
+ .byte 118,63 // jbe 2c20f <.literal16+0x47f>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -61183,13 +61741,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 2bc46 <.literal16+0x4b6>
+ .byte 124,66 // jl 2c246 <.literal16+0x4b6>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2bc4a <.literal16+0x4ba>
+ .byte 124,66 // jl 2c24a <.literal16+0x4ba>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2bc4e <.literal16+0x4be>
+ .byte 124,66 // jl 2c24e <.literal16+0x4be>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2bc52 <.literal16+0x4c2>
+ .byte 124,66 // jl 2c252 <.literal16+0x4c2>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -61235,13 +61793,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2bcd5 <.literal16+0x545>
+ .byte 112,65 // jo 2c2d5 <.literal16+0x545>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2bcd9 <.literal16+0x549>
+ .byte 112,65 // jo 2c2d9 <.literal16+0x549>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2bcdd <.literal16+0x54d>
+ .byte 112,65 // jo 2c2dd <.literal16+0x54d>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2bce1 <.literal16+0x551>
+ .byte 112,65 // jo 2c2e1 <.literal16+0x551>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -61280,13 +61838,13 @@ BALIGN16
.byte 64,254 // rex (bad)
.byte 255,0 // incl (%rax)
.byte 255 // (bad)
- .byte 127,71 // jg 2bd4b <.literal16+0x5bb>
+ .byte 127,71 // jg 2c34b <.literal16+0x5bb>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2bd4f <.literal16+0x5bf>
+ .byte 127,71 // jg 2c34f <.literal16+0x5bf>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2bd53 <.literal16+0x5c3>
+ .byte 127,71 // jg 2c353 <.literal16+0x5c3>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2bd57 <.literal16+0x5c7>
+ .byte 127,71 // jg 2c357 <.literal16+0x5c7>
.byte 208 // (bad)
.byte 179,89 // mov $0x59,%bl
.byte 62,208 // ds (bad)
@@ -61316,10 +61874,10 @@ BALIGN16
.byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax
.byte 152 // cwtl
.byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx)
- .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc2ce5a <_sk_overlay_sse2_8bit+0x2dc02499>
+ .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc2d45a <_sk_overlay_sse2_8bit+0x2dc024a5>
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 2bd8c <.literal16+0x5fc>
+ .byte 120,57 // js 2c38c <.literal16+0x5fc>
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
@@ -61384,13 +61942,13 @@ BALIGN16
.byte 192,191,0,0,192,191,0 // sarb $0x0,-0x40400000(%rdi)
.byte 0,192 // add %al,%al
.byte 191,0,0,192,191 // mov $0xbfc00000,%edi
- .byte 114,28 // jb 2be3e <.literal16+0x6ae>
+ .byte 114,28 // jb 2c43e <.literal16+0x6ae>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2be42 <.literal16+0x6b2>
+ .byte 62,114,28 // jb,pt 2c442 <.literal16+0x6b2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2be46 <.literal16+0x6b6>
+ .byte 62,114,28 // jb,pt 2c446 <.literal16+0x6b6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2be4a <.literal16+0x6ba>
+ .byte 62,114,28 // jb,pt 2c44a <.literal16+0x6ba>
.byte 199 // (bad)
.byte 62,85 // ds push %rbp
.byte 85 // push %rbp
@@ -61409,15 +61967,15 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d664c95 <_sk_overlay_sse2_8bit+0x3d63a2d4>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d665295 <_sk_overlay_sse2_8bit+0x3d63a2e0>
.byte 57,142,99,61,114,249 // cmp %ecx,-0x68dc29d(%rsi)
- .byte 127,63 // jg 2bea3 <.literal16+0x713>
- .byte 114,249 // jb 2be5f <.literal16+0x6cf>
- .byte 127,63 // jg 2bea7 <.literal16+0x717>
- .byte 114,249 // jb 2be63 <.literal16+0x6d3>
- .byte 127,63 // jg 2beab <.literal16+0x71b>
- .byte 114,249 // jb 2be67 <.literal16+0x6d7>
- .byte 127,63 // jg 2beaf <.literal16+0x71f>
+ .byte 127,63 // jg 2c4a3 <.literal16+0x713>
+ .byte 114,249 // jb 2c45f <.literal16+0x6cf>
+ .byte 127,63 // jg 2c4a7 <.literal16+0x717>
+ .byte 114,249 // jb 2c463 <.literal16+0x6d3>
+ .byte 127,63 // jg 2c4ab <.literal16+0x71b>
+ .byte 114,249 // jb 2c467 <.literal16+0x6d7>
+ .byte 127,63 // jg 2c4af <.literal16+0x71f>
.byte 3,0 // add (%rax),%eax
.byte 0,0 // add %al,(%rax)
.byte 3,0 // add (%rax),%eax
@@ -61524,14 +62082,14 @@ BALIGN16
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,0 // incl (%rax)
- .byte 127,0 // jg 2bf42 <.literal16+0x7b2>
- .byte 127,0 // jg 2bf44 <.literal16+0x7b4>
- .byte 127,0 // jg 2bf46 <.literal16+0x7b6>
- .byte 127,0 // jg 2bf48 <.literal16+0x7b8>
- .byte 127,0 // jg 2bf4a <.literal16+0x7ba>
- .byte 127,0 // jg 2bf4c <.literal16+0x7bc>
- .byte 127,0 // jg 2bf4e <.literal16+0x7be>
- .byte 127,0 // jg 2bf50 <.literal16+0x7c0>
+ .byte 127,0 // jg 2c542 <.literal16+0x7b2>
+ .byte 127,0 // jg 2c544 <.literal16+0x7b4>
+ .byte 127,0 // jg 2c546 <.literal16+0x7b6>
+ .byte 127,0 // jg 2c548 <.literal16+0x7b8>
+ .byte 127,0 // jg 2c54a <.literal16+0x7ba>
+ .byte 127,0 // jg 2c54c <.literal16+0x7bc>
+ .byte 127,0 // jg 2c54e <.literal16+0x7be>
+ .byte 127,0 // jg 2c550 <.literal16+0x7c0>
.byte 129,128,129,128,129,128,129,128,129,128// addl $0x80818081,-0x7f7e7f7f(%rax)
.byte 129 // .byte 0x81
.byte 128 // .byte 0x80
@@ -61629,7 +62187,7 @@ _sk_seed_shader_sse2:
.byte 102,15,110,2 // movd (%edx),%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,144,230,144,0,0 // movaps 0x90e6(%eax),%xmm2
+ .byte 15,40,144,102,146,0,0 // movaps 0x9266(%eax),%xmm2
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -61644,7 +62202,7 @@ _sk_seed_shader_sse2:
.byte 15,41,82,32 // movaps %xmm2,0x20(%edx)
.byte 15,41,82,16 // movaps %xmm2,0x10(%edx)
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,144,246,144,0,0 // movaps 0x90f6(%eax),%xmm2
+ .byte 15,40,144,118,146,0,0 // movaps 0x9276(%eax),%xmm2
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 86 // push %esi
.byte 82 // push %edx
@@ -61677,16 +62235,16 @@ _sk_dither_sse2:
.byte 102,15,110,96,4 // movd 0x4(%eax),%xmm4
.byte 102,15,112,252,0 // pshufd $0x0,%xmm4,%xmm7
.byte 102,15,239,253 // pxor %xmm5,%xmm7
- .byte 102,15,111,177,137,144,0,0 // movdqa 0x9089(%ecx),%xmm6
+ .byte 102,15,111,177,9,146,0,0 // movdqa 0x9209(%ecx),%xmm6
.byte 102,15,111,207 // movdqa %xmm7,%xmm1
.byte 102,15,219,206 // pand %xmm6,%xmm1
.byte 102,15,219,245 // pand %xmm5,%xmm6
- .byte 102,15,111,129,169,144,0,0 // movdqa 0x90a9(%ecx),%xmm0
+ .byte 102,15,111,129,41,146,0,0 // movdqa 0x9229(%ecx),%xmm0
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,219,224 // pand %xmm0,%xmm4
.byte 102,15,219,197 // pand %xmm5,%xmm0
- .byte 102,15,219,185,153,144,0,0 // pand 0x9099(%ecx),%xmm7
- .byte 102,15,219,169,153,144,0,0 // pand 0x9099(%ecx),%xmm5
+ .byte 102,15,219,185,25,146,0,0 // pand 0x9219(%ecx),%xmm7
+ .byte 102,15,219,169,25,146,0,0 // pand 0x9219(%ecx),%xmm5
.byte 102,15,114,246,4 // pslld $0x4,%xmm6
.byte 102,15,254,192 // paddd %xmm0,%xmm0
.byte 102,15,235,198 // por %xmm6,%xmm0
@@ -61701,8 +62259,8 @@ _sk_dither_sse2:
.byte 102,15,114,215,1 // psrld $0x1,%xmm7
.byte 102,15,235,231 // por %xmm7,%xmm4
.byte 15,91,196 // cvtdq2ps %xmm4,%xmm0
- .byte 15,89,129,185,144,0,0 // mulps 0x90b9(%ecx),%xmm0
- .byte 15,88,129,201,144,0,0 // addps 0x90c9(%ecx),%xmm0
+ .byte 15,89,129,57,146,0,0 // mulps 0x9239(%ecx),%xmm0
+ .byte 15,88,129,73,146,0,0 // addps 0x9249(%ecx),%xmm0
.byte 243,15,16,14 // movss (%esi),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
@@ -61770,7 +62328,7 @@ _sk_black_color_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,152,153,143,0,0 // movaps 0x8f99(%eax),%xmm3
+ .byte 15,40,152,25,145,0,0 // movaps 0x9119(%eax),%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -61793,7 +62351,7 @@ _sk_white_color_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,128,121,143,0,0 // movaps 0x8f79(%eax),%xmm0
+ .byte 15,40,128,249,144,0,0 // movaps 0x90f9(%eax),%xmm0
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -61883,7 +62441,7 @@ _sk_srcatop_sse2:
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,97,64 // movaps 0x40(%ecx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,170,218,142,0,0 // movaps 0x8eda(%edx),%xmm5
+ .byte 15,40,170,90,144,0,0 // movaps 0x905a(%edx),%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
@@ -61922,7 +62480,7 @@ _sk_dstatop_sse2:
.byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
.byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
- .byte 15,40,162,139,142,0,0 // movaps 0x8e8b(%edx),%xmm4
+ .byte 15,40,162,11,144,0,0 // movaps 0x900b(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,198 // addps %xmm6,%xmm0
@@ -62006,7 +62564,7 @@ _sk_srcout_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,218,141,0,0 // movaps 0x8dda(%eax),%xmm4
+ .byte 15,40,160,90,143,0,0 // movaps 0x8f5a(%eax),%xmm4
.byte 15,92,98,64 // subps 0x40(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
@@ -62032,7 +62590,7 @@ _sk_dstout_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,178,141,0,0 // movaps 0x8db2(%eax),%xmm4
+ .byte 15,40,160,50,143,0,0 // movaps 0x8f32(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
.byte 15,40,66,16 // movaps 0x10(%edx),%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -62062,7 +62620,7 @@ _sk_srcover_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,123,141,0,0 // movaps 0x8d7b(%eax),%xmm4
+ .byte 15,40,160,251,142,0,0 // movaps 0x8efb(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
.byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -62096,7 +62654,7 @@ _sk_dstover_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,40,106,64 // movaps 0x40(%edx),%xmm5
- .byte 15,40,160,59,141,0,0 // movaps 0x8d3b(%eax),%xmm4
+ .byte 15,40,160,187,142,0,0 // movaps 0x8ebb(%eax),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,66,16 // addps 0x10(%edx),%xmm0
@@ -62152,7 +62710,7 @@ _sk_multiply_sse2:
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
.byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
- .byte 15,40,129,204,140,0,0 // movaps 0x8ccc(%ecx),%xmm0
+ .byte 15,40,129,76,142,0,0 // movaps 0x8e4c(%ecx),%xmm0
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
@@ -62207,17 +62765,24 @@ _sk_plus__sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 139,77,8 // mov 0x8(%ebp),%ecx
- .byte 15,88,65,16 // addps 0x10(%ecx),%xmm0
- .byte 15,88,73,32 // addps 0x20(%ecx),%xmm1
- .byte 15,88,81,48 // addps 0x30(%ecx),%xmm2
- .byte 15,88,89,64 // addps 0x40(%ecx),%xmm3
- .byte 141,80,4 // lea 0x4(%eax),%edx
+ .byte 232,0,0,0,0 // call 64a <_sk_plus__sse2+0xb>
+ .byte 88 // pop %eax
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,85,8 // mov 0x8(%ebp),%edx
+ .byte 15,88,66,16 // addps 0x10(%edx),%xmm0
+ .byte 15,40,160,182,141,0,0 // movaps 0x8db6(%eax),%xmm4
+ .byte 15,93,196 // minps %xmm4,%xmm0
+ .byte 15,88,74,32 // addps 0x20(%edx),%xmm1
+ .byte 15,93,204 // minps %xmm4,%xmm1
+ .byte 15,88,82,48 // addps 0x30(%edx),%xmm2
+ .byte 15,93,212 // minps %xmm4,%xmm2
+ .byte 15,88,90,64 // addps 0x40(%edx),%xmm3
+ .byte 15,93,220 // minps %xmm4,%xmm3
+ .byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
+ .byte 80 // push %eax
.byte 82 // push %edx
- .byte 81 // push %ecx
- .byte 255,16 // call *(%eax)
+ .byte 255,17 // call *(%ecx)
.byte 131,196,24 // add $0x18,%esp
.byte 93 // pop %ebp
.byte 195 // ret
@@ -62272,12 +62837,12 @@ _sk_xor__sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 232,0,0,0,0 // call 6df <_sk_xor__sse2+0xe>
+ .byte 232,0,0,0,0 // call 6f8 <_sk_xor__sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
- .byte 15,40,154,161,139,0,0 // movaps 0x8ba1(%edx),%xmm3
+ .byte 15,40,154,24,141,0,0 // movaps 0x8d18(%edx),%xmm3
.byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 15,89,198 // mulps %xmm6,%xmm0
@@ -62313,7 +62878,7 @@ _sk_darken_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 747 <_sk_darken_sse2+0xe>
+ .byte 232,0,0,0,0 // call 760 <_sk_darken_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -62339,7 +62904,7 @@ _sk_darken_sse2:
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,95,209 // maxps %xmm1,%xmm2
.byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,138,73,139,0,0 // movaps 0x8b49(%edx),%xmm1
+ .byte 15,40,138,192,140,0,0 // movaps 0x8cc0(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -62362,7 +62927,7 @@ _sk_lighten_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 7c7 <_sk_lighten_sse2+0xe>
+ .byte 232,0,0,0,0 // call 7e0 <_sk_lighten_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -62388,7 +62953,7 @@ _sk_lighten_sse2:
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,93,209 // minps %xmm1,%xmm2
.byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,138,217,138,0,0 // movaps 0x8ad9(%edx),%xmm1
+ .byte 15,40,138,80,140,0,0 // movaps 0x8c50(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -62412,7 +62977,7 @@ _sk_difference_sse2:
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,225 // movaps %xmm1,%xmm4
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 84a <_sk_difference_sse2+0x11>
+ .byte 232,0,0,0,0 // call 863 <_sk_difference_sse2+0x11>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -62441,7 +63006,7 @@ _sk_difference_sse2:
.byte 15,93,214 // minps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,146,102,138,0,0 // movaps 0x8a66(%edx),%xmm2
+ .byte 15,40,146,221,139,0,0 // movaps 0x8bdd(%edx),%xmm2
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -62463,7 +63028,7 @@ _sk_exclusion_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 8d0 <_sk_exclusion_sse2+0xe>
+ .byte 232,0,0,0,0 // call 8e9 <_sk_exclusion_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -62485,7 +63050,7 @@ _sk_exclusion_sse2:
.byte 15,89,202 // mulps %xmm2,%xmm1
.byte 15,88,201 // addps %xmm1,%xmm1
.byte 15,92,233 // subps %xmm1,%xmm5
- .byte 15,40,138,240,137,0,0 // movaps 0x89f0(%edx),%xmm1
+ .byte 15,40,138,103,139,0,0 // movaps 0x8b67(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,73,64 // mulps 0x40(%ecx),%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -62511,7 +63076,7 @@ _sk_colorburn_sse2:
.byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 94f <_sk_colorburn_sse2+0x19>
+ .byte 232,0,0,0,0 // call 968 <_sk_colorburn_sse2+0x19>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
@@ -62526,7 +63091,7 @@ _sk_colorburn_sse2:
.byte 15,93,198 // minps %xmm6,%xmm0
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,92,232 // subps %xmm0,%xmm5
- .byte 15,40,177,129,137,0,0 // movaps 0x8981(%ecx),%xmm6
+ .byte 15,40,177,248,138,0,0 // movaps 0x8af8(%ecx),%xmm6
.byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
@@ -62639,11 +63204,11 @@ _sk_colordodge_sse2:
.byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
.byte 15,41,77,232 // movaps %xmm1,-0x18(%ebp)
- .byte 232,0,0,0,0 // call ad8 <_sk_colordodge_sse2+0x16>
+ .byte 232,0,0,0,0 // call af1 <_sk_colordodge_sse2+0x16>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,16 // movaps 0x10(%eax),%xmm1
- .byte 15,40,145,8,136,0,0 // movaps 0x8808(%ecx),%xmm2
+ .byte 15,40,145,127,137,0,0 // movaps 0x897f(%ecx),%xmm2
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 15,40,250 // movaps %xmm2,%xmm7
@@ -62756,11 +63321,11 @@ _sk_hardlight_sse2:
.byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
.byte 15,41,77,232 // movaps %xmm1,-0x18(%ebp)
- .byte 232,0,0,0,0 // call c39 <_sk_hardlight_sse2+0x16>
+ .byte 232,0,0,0,0 // call c52 <_sk_hardlight_sse2+0x16>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
- .byte 15,40,145,183,134,0,0 // movaps 0x86b7(%ecx),%xmm2
+ .byte 15,40,145,46,136,0,0 // movaps 0x882e(%ecx),%xmm2
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,40,225 // movaps %xmm1,%xmm4
@@ -62866,11 +63431,11 @@ _sk_overlay_sse2:
.byte 15,41,85,152 // movaps %xmm2,-0x68(%ebp)
.byte 15,41,77,168 // movaps %xmm1,-0x58(%ebp)
.byte 15,40,232 // movaps %xmm0,%xmm5
- .byte 232,0,0,0,0 // call d84 <_sk_overlay_sse2+0x1a>
+ .byte 232,0,0,0,0 // call d9d <_sk_overlay_sse2+0x1a>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
- .byte 15,40,161,124,133,0,0 // movaps 0x857c(%ecx),%xmm4
+ .byte 15,40,161,243,134,0,0 // movaps 0x86f3(%ecx),%xmm4
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
@@ -62995,20 +63560,20 @@ _sk_softlight_sse2:
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
.byte 15,88,241 // addps %xmm1,%xmm6
- .byte 232,0,0,0,0 // call f14 <_sk_softlight_sse2+0x52>
+ .byte 232,0,0,0,0 // call f2d <_sk_softlight_sse2+0x52>
.byte 89 // pop %ecx
.byte 15,40,194 // movaps %xmm2,%xmm0
- .byte 15,40,137,12,132,0,0 // movaps 0x840c(%ecx),%xmm1
+ .byte 15,40,137,131,133,0,0 // movaps 0x8583(%ecx),%xmm1
.byte 15,41,141,104,255,255,255 // movaps %xmm1,-0x98(%ebp)
.byte 15,88,193 // addps %xmm1,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,185,252,131,0,0 // movaps 0x83fc(%ecx),%xmm7
+ .byte 15,40,185,115,133,0,0 // movaps 0x8573(%ecx),%xmm7
.byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,92,250 // subps %xmm2,%xmm7
.byte 15,82,242 // rsqrtps %xmm2,%xmm6
.byte 15,83,206 // rcpps %xmm6,%xmm1
.byte 15,92,202 // subps %xmm2,%xmm1
- .byte 15,40,161,28,132,0,0 // movaps 0x841c(%ecx),%xmm4
+ .byte 15,40,161,147,133,0,0 // movaps 0x8593(%ecx),%xmm4
.byte 15,41,101,152 // movaps %xmm4,-0x68(%ebp)
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
@@ -63204,7 +63769,7 @@ _sk_hue_sse2:
.byte 15,93,200 // minps %xmm0,%xmm1
.byte 15,92,225 // subps %xmm1,%xmm4
.byte 15,41,101,168 // movaps %xmm4,-0x58(%ebp)
- .byte 232,0,0,0,0 // call 11d5 <_sk_hue_sse2+0x4f>
+ .byte 232,0,0,0,0 // call 11ee <_sk_hue_sse2+0x4f>
.byte 89 // pop %ecx
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,40,197 // movaps %xmm5,%xmm0
@@ -63214,7 +63779,7 @@ _sk_hue_sse2:
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
- .byte 15,40,169,155,129,0,0 // movaps 0x819b(%ecx),%xmm5
+ .byte 15,40,169,18,131,0,0 // movaps 0x8312(%ecx),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
@@ -63247,17 +63812,17 @@ _sk_hue_sse2:
.byte 15,89,233 // mulps %xmm1,%xmm5
.byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp)
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,153,107,129,0,0 // movaps 0x816b(%ecx),%xmm3
+ .byte 15,40,153,226,130,0,0 // movaps 0x82e2(%ecx),%xmm3
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,117,152 // movaps -0x68(%ebp),%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
.byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,40,153,123,129,0,0 // movaps 0x817b(%ecx),%xmm3
+ .byte 15,40,153,242,130,0,0 // movaps 0x82f2(%ecx),%xmm3
.byte 15,40,109,136 // movaps -0x78(%ebp),%xmm5
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,89,251 // mulps %xmm3,%xmm7
.byte 15,88,249 // addps %xmm1,%xmm7
- .byte 15,40,137,155,129,0,0 // movaps 0x819b(%ecx),%xmm1
+ .byte 15,40,137,18,131,0,0 // movaps 0x8312(%ecx),%xmm1
.byte 15,92,77,184 // subps -0x48(%ebp),%xmm1
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 15,41,117,152 // movaps %xmm6,-0x68(%ebp)
@@ -63267,7 +63832,7 @@ _sk_hue_sse2:
.byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 15,41,117,168 // movaps %xmm6,-0x58(%ebp)
- .byte 15,40,169,139,129,0,0 // movaps 0x818b(%ecx),%xmm5
+ .byte 15,40,169,2,131,0,0 // movaps 0x8302(%ecx),%xmm5
.byte 15,89,205 // mulps %xmm5,%xmm1
.byte 15,88,207 // addps %xmm7,%xmm1
.byte 15,94,212 // divps %xmm4,%xmm2
@@ -63458,19 +64023,19 @@ _sk_saturation_sse2:
.byte 15,89,221 // mulps %xmm5,%xmm3
.byte 15,40,211 // movaps %xmm3,%xmm2
.byte 15,89,253 // mulps %xmm5,%xmm7
- .byte 232,0,0,0,0 // call 1529 <_sk_saturation_sse2+0xb0>
+ .byte 232,0,0,0,0 // call 1542 <_sk_saturation_sse2+0xb0>
.byte 89 // pop %ecx
- .byte 15,40,153,87,126,0,0 // movaps 0x7e57(%ecx),%xmm3
+ .byte 15,40,153,206,127,0,0 // movaps 0x7fce(%ecx),%xmm3
.byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
.byte 15,40,77,184 // movaps -0x48(%ebp),%xmm1
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,40,153,103,126,0,0 // movaps 0x7e67(%ecx),%xmm3
+ .byte 15,40,153,222,127,0,0 // movaps 0x7fde(%ecx),%xmm3
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,238 // movaps %xmm6,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,129,135,126,0,0 // movaps 0x7e87(%ecx),%xmm0
+ .byte 15,40,129,254,127,0,0 // movaps 0x7ffe(%ecx),%xmm0
.byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
.byte 15,92,69,216 // subps -0x28(%ebp),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
@@ -63482,7 +64047,7 @@ _sk_saturation_sse2:
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,41,141,120,255,255,255 // movaps %xmm1,-0x88(%ebp)
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 15,40,129,119,126,0,0 // movaps 0x7e77(%ecx),%xmm0
+ .byte 15,40,129,238,127,0,0 // movaps 0x7fee(%ecx),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,40,109,168 // movaps -0x58(%ebp),%xmm5
@@ -63636,21 +64201,21 @@ _sk_color_sse2:
.byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp)
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp)
- .byte 232,0,0,0,0 // call 1784 <_sk_color_sse2+0x2a>
+ .byte 232,0,0,0,0 // call 179d <_sk_color_sse2+0x2a>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,16 // movaps 0x10(%eax),%xmm2
.byte 15,40,72,32 // movaps 0x20(%eax),%xmm1
- .byte 15,40,177,60,124,0,0 // movaps 0x7c3c(%ecx),%xmm6
+ .byte 15,40,177,179,125,0,0 // movaps 0x7db3(%ecx),%xmm6
.byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,153,76,124,0,0 // movaps 0x7c4c(%ecx),%xmm3
+ .byte 15,40,153,195,125,0,0 // movaps 0x7dc3(%ecx),%xmm3
.byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 15,40,129,108,124,0,0 // movaps 0x7c6c(%ecx),%xmm0
+ .byte 15,40,129,227,125,0,0 // movaps 0x7de3(%ecx),%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
.byte 15,92,69,200 // subps -0x38(%ebp),%xmm0
.byte 15,89,208 // mulps %xmm0,%xmm2
@@ -63660,7 +64225,7 @@ _sk_color_sse2:
.byte 15,40,80,48 // movaps 0x30(%eax),%xmm2
.byte 15,89,194 // mulps %xmm2,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
- .byte 15,40,137,92,124,0,0 // movaps 0x7c5c(%ecx),%xmm1
+ .byte 15,40,137,211,125,0,0 // movaps 0x7dd3(%ecx),%xmm1
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,88,214 // addps %xmm6,%xmm2
.byte 15,40,88,64 // movaps 0x40(%eax),%xmm3
@@ -63816,21 +64381,21 @@ _sk_luminosity_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 129,236,184,0,0,0 // sub $0xb8,%esp
.byte 15,40,242 // movaps %xmm2,%xmm6
- .byte 232,0,0,0,0 // call 19e7 <_sk_luminosity_sse2+0x11>
+ .byte 232,0,0,0,0 // call 1a00 <_sk_luminosity_sse2+0x11>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 15,40,161,25,122,0,0 // movaps 0x7a19(%ecx),%xmm4
+ .byte 15,40,161,144,123,0,0 // movaps 0x7b90(%ecx),%xmm4
.byte 15,41,101,232 // movaps %xmm4,-0x18(%ebp)
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 15,40,161,41,122,0,0 // movaps 0x7a29(%ecx),%xmm4
+ .byte 15,40,161,160,123,0,0 // movaps 0x7ba0(%ecx),%xmm4
.byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,88,234 // addps %xmm2,%xmm5
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
.byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp)
- .byte 15,40,161,73,122,0,0 // movaps 0x7a49(%ecx),%xmm4
+ .byte 15,40,161,192,123,0,0 // movaps 0x7bc0(%ecx),%xmm4
.byte 15,40,252 // movaps %xmm4,%xmm7
.byte 15,92,250 // subps %xmm2,%xmm7
.byte 15,89,199 // mulps %xmm7,%xmm0
@@ -63840,7 +64405,7 @@ _sk_luminosity_sse2:
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,41,189,104,255,255,255 // movaps %xmm7,-0x98(%ebp)
.byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 15,40,137,57,122,0,0 // movaps 0x7a39(%ecx),%xmm1
+ .byte 15,40,137,176,123,0,0 // movaps 0x7bb0(%ecx),%xmm1
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,88,213 // addps %xmm5,%xmm2
.byte 15,40,104,16 // movaps 0x10(%eax),%xmm5
@@ -64002,7 +64567,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 131,236,44 // sub $0x2c,%esp
.byte 102,15,127,85,200 // movdqa %xmm2,-0x38(%ebp)
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
- .byte 232,0,0,0,0 // call 1c52 <_sk_srcover_rgba_8888_sse2+0x17>
+ .byte 232,0,0,0,0 // call 1c6b <_sk_srcover_rgba_8888_sse2+0x17>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -64014,9 +64579,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,133,224,0,0,0 // jne 1d54 <_sk_srcover_rgba_8888_sse2+0x119>
+ .byte 15,133,224,0,0,0 // jne 1d6d <_sk_srcover_rgba_8888_sse2+0x119>
.byte 243,15,111,20,178 // movdqu (%edx,%esi,4),%xmm2
- .byte 102,15,111,167,238,119,0,0 // movdqa 0x77ee(%edi),%xmm4
+ .byte 102,15,111,167,101,121,0,0 // movdqa 0x7965(%edi),%xmm4
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,242 // movdqa %xmm2,%xmm6
@@ -64027,9 +64592,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,219,252 // pand %xmm4,%xmm7
.byte 15,91,229 // cvtdq2ps %xmm5,%xmm4
.byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
- .byte 15,40,175,254,119,0,0 // movaps 0x77fe(%edi),%xmm5
+ .byte 15,40,175,117,121,0,0 // movaps 0x7975(%edi),%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
- .byte 15,40,143,14,120,0,0 // movaps 0x780e(%edi),%xmm1
+ .byte 15,40,143,133,121,0,0 // movaps 0x7985(%edi),%xmm1
.byte 15,89,193 // mulps %xmm1,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,88,224 // addps %xmm0,%xmm4
@@ -64062,7 +64627,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 102,15,235,193 // por %xmm1,%xmm0
.byte 133,219 // test %ebx,%ebx
- .byte 117,95 // jne 1d8f <_sk_srcover_rgba_8888_sse2+0x154>
+ .byte 117,95 // jne 1da8 <_sk_srcover_rgba_8888_sse2+0x154>
.byte 243,15,127,4,178 // movdqu %xmm0,(%edx,%esi,4)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -64083,33 +64648,33 @@ _sk_srcover_rgba_8888_sse2:
.byte 136,69,243 // mov %al,-0xd(%ebp)
.byte 128,101,243,3 // andb $0x3,-0xd(%ebp)
.byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp)
- .byte 116,80 // je 1db3 <_sk_srcover_rgba_8888_sse2+0x178>
+ .byte 116,80 // je 1dcc <_sk_srcover_rgba_8888_sse2+0x178>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp)
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 116,21 // je 1d85 <_sk_srcover_rgba_8888_sse2+0x14a>
+ .byte 116,21 // je 1d9e <_sk_srcover_rgba_8888_sse2+0x14a>
.byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp)
- .byte 15,133,255,254,255,255 // jne 1c79 <_sk_srcover_rgba_8888_sse2+0x3e>
+ .byte 15,133,255,254,255,255 // jne 1c92 <_sk_srcover_rgba_8888_sse2+0x3e>
.byte 102,15,110,84,178,8 // movd 0x8(%edx,%esi,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,15,18,20,178 // movlpd (%edx,%esi,4),%xmm2
- .byte 233,234,254,255,255 // jmp 1c79 <_sk_srcover_rgba_8888_sse2+0x3e>
+ .byte 233,234,254,255,255 // jmp 1c92 <_sk_srcover_rgba_8888_sse2+0x3e>
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,41 // je 1dc0 <_sk_srcover_rgba_8888_sse2+0x185>
+ .byte 116,41 // je 1dd9 <_sk_srcover_rgba_8888_sse2+0x185>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 1dac <_sk_srcover_rgba_8888_sse2+0x171>
+ .byte 116,16 // je 1dc5 <_sk_srcover_rgba_8888_sse2+0x171>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,148 // jne 1d35 <_sk_srcover_rgba_8888_sse2+0xfa>
+ .byte 117,148 // jne 1d4e <_sk_srcover_rgba_8888_sse2+0xfa>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,15,126,76,178,8 // movd %xmm1,0x8(%edx,%esi,4)
.byte 102,15,214,4,178 // movq %xmm0,(%edx,%esi,4)
- .byte 235,130 // jmp 1d35 <_sk_srcover_rgba_8888_sse2+0xfa>
+ .byte 235,130 // jmp 1d4e <_sk_srcover_rgba_8888_sse2+0xfa>
.byte 102,15,110,20,178 // movd (%edx,%esi,4),%xmm2
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 233,185,254,255,255 // jmp 1c79 <_sk_srcover_rgba_8888_sse2+0x3e>
+ .byte 233,185,254,255,255 // jmp 1c92 <_sk_srcover_rgba_8888_sse2+0x3e>
.byte 102,15,126,4,178 // movd %xmm0,(%edx,%esi,4)
- .byte 233,107,255,255,255 // jmp 1d35 <_sk_srcover_rgba_8888_sse2+0xfa>
+ .byte 233,107,255,255,255 // jmp 1d4e <_sk_srcover_rgba_8888_sse2+0xfa>
HIDDEN _sk_clamp_0_sse2
.globl _sk_clamp_0_sse2
@@ -64140,10 +64705,10 @@ _sk_clamp_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 1dfe <_sk_clamp_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 1e17 <_sk_clamp_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,160,114,118,0,0 // movaps 0x7672(%eax),%xmm4
+ .byte 15,40,160,233,119,0,0 // movaps 0x77e9(%eax),%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
.byte 15,93,204 // minps %xmm4,%xmm1
.byte 15,93,212 // minps %xmm4,%xmm2
@@ -64164,10 +64729,10 @@ _sk_clamp_a_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 1e31 <_sk_clamp_a_sse2+0xb>
+ .byte 232,0,0,0,0 // call 1e4a <_sk_clamp_a_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,93,152,79,118,0,0 // minps 0x764f(%eax),%xmm3
+ .byte 15,93,152,198,119,0,0 // minps 0x77c6(%eax),%xmm3
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -64187,12 +64752,12 @@ _sk_clamp_a_dst_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 1e61 <_sk_clamp_a_dst_sse2+0xb>
+ .byte 232,0,0,0,0 // call 1e7a <_sk_clamp_a_dst_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,40,98,64 // movaps 0x40(%edx),%xmm4
- .byte 15,93,160,47,118,0,0 // minps 0x762f(%eax),%xmm4
+ .byte 15,93,160,166,119,0,0 // minps 0x77a6(%eax),%xmm4
.byte 15,41,98,64 // movaps %xmm4,0x40(%edx)
.byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,93,236 // minps %xmm4,%xmm5
@@ -64263,10 +64828,10 @@ _sk_invert_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 1f0c <_sk_invert_sse2+0xb>
+ .byte 232,0,0,0,0 // call 1f25 <_sk_invert_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,160,148,117,0,0 // movaps 0x7594(%eax),%xmm4
+ .byte 15,40,160,11,119,0,0 // movaps 0x770b(%eax),%xmm4
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,92,232 // subps %xmm0,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
@@ -64385,11 +64950,11 @@ _sk_unpremul_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 200a <_sk_unpremul_sse2+0xb>
+ .byte 232,0,0,0,0 // call 2023 <_sk_unpremul_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 15,40,168,166,116,0,0 // movaps 0x74a6(%eax),%xmm5
+ .byte 15,40,168,29,118,0,0 // movaps 0x761d(%eax),%xmm5
.byte 15,94,235 // divps %xmm3,%xmm5
.byte 15,194,227,4 // cmpneqps %xmm3,%xmm4
.byte 15,84,229 // andps %xmm5,%xmm4
@@ -64416,23 +64981,23 @@ _sk_from_srgb_sse2:
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,40,217 // movaps %xmm1,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 2054 <_sk_from_srgb_sse2+0x18>
+ .byte 232,0,0,0,0 // call 206d <_sk_from_srgb_sse2+0x18>
.byte 88 // pop %eax
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,201 // mulps %xmm1,%xmm1
- .byte 15,40,160,124,116,0,0 // movaps 0x747c(%eax),%xmm4
+ .byte 15,40,160,243,117,0,0 // movaps 0x75f3(%eax),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,176,140,116,0,0 // movaps 0x748c(%eax),%xmm6
+ .byte 15,40,176,3,118,0,0 // movaps 0x7603(%eax),%xmm6
.byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,176,108,116,0,0 // movaps 0x746c(%eax),%xmm6
+ .byte 15,40,176,227,117,0,0 // movaps 0x75e3(%eax),%xmm6
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,184,156,116,0,0 // movaps 0x749c(%eax),%xmm7
+ .byte 15,40,184,19,118,0,0 // movaps 0x7613(%eax),%xmm7
.byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,184,172,116,0,0 // movaps 0x74ac(%eax),%xmm7
+ .byte 15,40,184,35,118,0,0 // movaps 0x7623(%eax),%xmm7
.byte 15,194,215,1 // cmpltps %xmm7,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -64486,24 +65051,24 @@ _sk_from_srgb_dst_sse2:
.byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
.byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp)
- .byte 232,0,0,0,0 // call 212f <_sk_from_srgb_dst_sse2+0x1b>
+ .byte 232,0,0,0,0 // call 2148 <_sk_from_srgb_dst_sse2+0x1b>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,16 // movaps 0x10(%eax),%xmm1
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,40,161,241,115,0,0 // movaps 0x73f1(%ecx),%xmm4
+ .byte 15,40,161,104,117,0,0 // movaps 0x7568(%ecx),%xmm4
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,177,1,116,0,0 // movaps 0x7401(%ecx),%xmm6
+ .byte 15,40,177,120,117,0,0 // movaps 0x7578(%ecx),%xmm6
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,169,225,115,0,0 // movaps 0x73e1(%ecx),%xmm5
+ .byte 15,40,169,88,117,0,0 // movaps 0x7558(%ecx),%xmm5
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,40,185,17,116,0,0 // movaps 0x7411(%ecx),%xmm7
+ .byte 15,40,185,136,117,0,0 // movaps 0x7588(%ecx),%xmm7
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,153,33,116,0,0 // movaps 0x7421(%ecx),%xmm3
+ .byte 15,40,153,152,117,0,0 // movaps 0x7598(%ecx),%xmm3
.byte 15,194,203,1 // cmpltps %xmm3,%xmm1
.byte 15,84,209 // andps %xmm1,%xmm2
.byte 15,85,200 // andnps %xmm0,%xmm1
@@ -64562,28 +65127,28 @@ _sk_to_srgb_sse2:
.byte 15,40,250 // movaps %xmm2,%xmm7
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 221a <_sk_to_srgb_sse2+0x18>
+ .byte 232,0,0,0,0 // call 2233 <_sk_to_srgb_sse2+0x18>
.byte 88 // pop %eax
.byte 15,82,218 // rsqrtps %xmm2,%xmm3
- .byte 15,40,160,86,115,0,0 // movaps 0x7356(%eax),%xmm4
+ .byte 15,40,160,205,116,0,0 // movaps 0x74cd(%eax),%xmm4
.byte 15,40,235 // movaps %xmm3,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,40,128,102,115,0,0 // movaps 0x7366(%eax),%xmm0
+ .byte 15,40,128,221,116,0,0 // movaps 0x74dd(%eax),%xmm0
.byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,40,128,118,115,0,0 // movaps 0x7376(%eax),%xmm0
+ .byte 15,40,128,237,116,0,0 // movaps 0x74ed(%eax),%xmm0
.byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,128,134,115,0,0 // movaps 0x7386(%eax),%xmm0
+ .byte 15,40,128,253,116,0,0 // movaps 0x74fd(%eax),%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 15,88,216 // addps %xmm0,%xmm3
.byte 15,83,195 // rcpps %xmm3,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,168,70,115,0,0 // movaps 0x7346(%eax),%xmm5
+ .byte 15,40,168,189,116,0,0 // movaps 0x74bd(%eax),%xmm5
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,40,152,150,115,0,0 // movaps 0x7396(%eax),%xmm3
+ .byte 15,40,152,13,117,0,0 // movaps 0x750d(%eax),%xmm3
.byte 15,194,211,1 // cmpltps %xmm3,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -64640,60 +65205,62 @@ _sk_rgb_to_hsl_sse2:
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 15,40,249 // movaps %xmm1,%xmm7
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 2311 <_sk_rgb_to_hsl_sse2+0x15>
+ .byte 232,0,0,0,0 // call 232a <_sk_rgb_to_hsl_sse2+0x15>
.byte 88 // pop %eax
- .byte 15,40,204 // movaps %xmm4,%xmm1
- .byte 15,95,207 // maxps %xmm7,%xmm1
- .byte 15,95,202 // maxps %xmm2,%xmm1
+ .byte 15,40,199 // movaps %xmm7,%xmm0
+ .byte 15,95,194 // maxps %xmm2,%xmm0
.byte 15,40,220 // movaps %xmm4,%xmm3
- .byte 15,93,223 // minps %xmm7,%xmm3
- .byte 15,93,218 // minps %xmm2,%xmm3
- .byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
- .byte 15,40,193 // movaps %xmm1,%xmm0
- .byte 15,92,195 // subps %xmm3,%xmm0
+ .byte 15,95,216 // maxps %xmm0,%xmm3
+ .byte 15,40,199 // movaps %xmm7,%xmm0
+ .byte 15,93,194 // minps %xmm2,%xmm0
+ .byte 15,40,204 // movaps %xmm4,%xmm1
+ .byte 15,93,200 // minps %xmm0,%xmm1
+ .byte 15,41,77,232 // movaps %xmm1,-0x18(%ebp)
+ .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
- .byte 15,40,152,175,114,0,0 // movaps 0x72af(%eax),%xmm3
- .byte 15,94,216 // divps %xmm0,%xmm3
+ .byte 15,40,136,38,116,0,0 // movaps 0x7426(%eax),%xmm1
+ .byte 15,94,200 // divps %xmm0,%xmm1
.byte 15,40,199 // movaps %xmm7,%xmm0
.byte 15,92,194 // subps %xmm2,%xmm0
- .byte 15,89,195 // mulps %xmm3,%xmm0
+ .byte 15,89,193 // mulps %xmm1,%xmm0
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,194,234,1 // cmpltps %xmm2,%xmm5
- .byte 15,84,168,191,114,0,0 // andps 0x72bf(%eax),%xmm5
+ .byte 15,84,168,54,116,0,0 // andps 0x7436(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,193 // movaps %xmm1,%xmm0
+ .byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,194,196,0 // cmpeqps %xmm4,%xmm0
- .byte 15,40,241 // movaps %xmm1,%xmm6
+ .byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,194,247,0 // cmpeqps %xmm7,%xmm6
.byte 15,92,212 // subps %xmm4,%xmm2
.byte 15,92,231 // subps %xmm7,%xmm4
- .byte 15,89,211 // mulps %xmm3,%xmm2
- .byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,40,152,207,114,0,0 // movaps 0x72cf(%eax),%xmm3
- .byte 15,88,211 // addps %xmm3,%xmm2
- .byte 15,88,160,223,114,0,0 // addps 0x72df(%eax),%xmm4
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 15,89,225 // mulps %xmm1,%xmm4
+ .byte 15,40,136,70,116,0,0 // movaps 0x7446(%eax),%xmm1
+ .byte 15,88,209 // addps %xmm1,%xmm2
+ .byte 15,88,160,86,116,0,0 // addps 0x7456(%eax),%xmm4
.byte 15,84,214 // andps %xmm6,%xmm2
.byte 15,85,244 // andnps %xmm4,%xmm6
.byte 15,86,242 // orps %xmm2,%xmm6
.byte 15,84,232 // andps %xmm0,%xmm5
.byte 15,85,198 // andnps %xmm6,%xmm0
.byte 15,86,197 // orps %xmm5,%xmm0
- .byte 15,40,225 // movaps %xmm1,%xmm4
+ .byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,40,85,232 // movaps -0x18(%ebp),%xmm2
.byte 15,194,226,4 // cmpneqps %xmm2,%xmm4
- .byte 15,92,217 // subps %xmm1,%xmm3
- .byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,40,168,255,114,0,0 // movaps 0x72ff(%eax),%xmm5
- .byte 15,92,218 // subps %xmm2,%xmm3
- .byte 15,40,209 // movaps %xmm1,%xmm2
+ .byte 15,92,203 // subps %xmm3,%xmm1
+ .byte 15,88,218 // addps %xmm2,%xmm3
+ .byte 15,40,168,118,116,0,0 // movaps 0x7476(%eax),%xmm5
+ .byte 15,92,202 // subps %xmm2,%xmm1
+ .byte 15,40,211 // movaps %xmm3,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 15,194,234,1 // cmpltps %xmm2,%xmm5
- .byte 15,84,221 // andps %xmm5,%xmm3
- .byte 15,85,233 // andnps %xmm1,%xmm5
- .byte 15,86,235 // orps %xmm3,%xmm5
+ .byte 15,84,205 // andps %xmm5,%xmm1
+ .byte 15,85,235 // andnps %xmm3,%xmm5
+ .byte 15,86,233 // orps %xmm1,%xmm5
.byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
.byte 15,94,205 // divps %xmm5,%xmm1
- .byte 15,89,128,239,114,0,0 // mulps 0x72ef(%eax),%xmm0
+ .byte 15,89,128,102,116,0,0 // mulps 0x7466(%eax),%xmm0
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,84,204 // andps %xmm4,%xmm1
.byte 139,69,12 // mov 0xc(%ebp),%eax
@@ -64716,9 +65283,9 @@ _sk_hsl_to_rgb_sse2:
.byte 129,236,200,0,0,0 // sub $0xc8,%esp
.byte 15,41,157,56,255,255,255 // movaps %xmm3,-0xc8(%ebp)
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
- .byte 232,0,0,0,0 // call 2406 <_sk_hsl_to_rgb_sse2+0x19>
+ .byte 232,0,0,0,0 // call 2425 <_sk_hsl_to_rgb_sse2+0x19>
.byte 88 // pop %eax
- .byte 15,40,160,26,114,0,0 // movaps 0x721a(%eax),%xmm4
+ .byte 15,40,160,139,115,0,0 // movaps 0x738b(%eax),%xmm4
.byte 15,40,220 // movaps %xmm4,%xmm3
.byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp)
.byte 15,194,218,2 // cmpleps %xmm2,%xmm3
@@ -64731,13 +65298,13 @@ _sk_hsl_to_rgb_sse2:
.byte 15,84,243 // andps %xmm3,%xmm6
.byte 15,85,217 // andnps %xmm1,%xmm3
.byte 15,86,222 // orps %xmm6,%xmm3
- .byte 15,40,168,42,114,0,0 // movaps 0x722a(%eax),%xmm5
+ .byte 15,40,168,155,115,0,0 // movaps 0x739b(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 243,15,91,205 // cvttps2dq %xmm5,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,193,1 // cmpltps %xmm1,%xmm0
- .byte 15,40,176,58,114,0,0 // movaps 0x723a(%eax),%xmm6
+ .byte 15,40,176,171,115,0,0 // movaps 0x73ab(%eax),%xmm6
.byte 15,41,117,136 // movaps %xmm6,-0x78(%ebp)
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,200 // subps %xmm0,%xmm1
@@ -64747,19 +65314,19 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,211 // subps %xmm3,%xmm2
- .byte 15,40,184,74,114,0,0 // movaps 0x724a(%eax),%xmm7
+ .byte 15,40,184,187,115,0,0 // movaps 0x73bb(%eax),%xmm7
.byte 15,41,189,88,255,255,255 // movaps %xmm7,-0xa8(%ebp)
.byte 15,194,253,2 // cmpleps %xmm5,%xmm7
.byte 15,92,218 // subps %xmm2,%xmm3
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 15,40,204 // movaps %xmm4,%xmm1
.byte 15,194,205,2 // cmpleps %xmm5,%xmm1
- .byte 15,40,160,122,114,0,0 // movaps 0x727a(%eax),%xmm4
+ .byte 15,40,160,235,115,0,0 // movaps 0x73eb(%eax),%xmm4
.byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp)
.byte 15,194,229,2 // cmpleps %xmm5,%xmm4
- .byte 15,40,176,90,114,0,0 // movaps 0x725a(%eax),%xmm6
+ .byte 15,40,176,203,115,0,0 // movaps 0x73cb(%eax),%xmm6
.byte 15,89,238 // mulps %xmm6,%xmm5
- .byte 15,40,128,106,114,0,0 // movaps 0x726a(%eax),%xmm0
+ .byte 15,40,128,219,115,0,0 // movaps 0x73db(%eax),%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
@@ -64785,18 +65352,18 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,194,200,1 // cmpltps %xmm0,%xmm1
- .byte 15,84,136,58,114,0,0 // andps 0x723a(%eax),%xmm1
+ .byte 15,84,136,171,115,0,0 // andps 0x73ab(%eax),%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,40,128,74,114,0,0 // movaps 0x724a(%eax),%xmm0
+ .byte 15,40,128,187,115,0,0 // movaps 0x73bb(%eax),%xmm0
.byte 15,194,193,2 // cmpleps %xmm1,%xmm0
- .byte 15,40,152,26,114,0,0 // movaps 0x721a(%eax),%xmm3
+ .byte 15,40,152,139,115,0,0 // movaps 0x738b(%eax),%xmm3
.byte 15,194,217,2 // cmpleps %xmm1,%xmm3
- .byte 15,40,160,122,114,0,0 // movaps 0x727a(%eax),%xmm4
+ .byte 15,40,160,235,115,0,0 // movaps 0x73eb(%eax),%xmm4
.byte 15,194,225,2 // cmpleps %xmm1,%xmm4
.byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,168,106,114,0,0 // movaps 0x726a(%eax),%xmm5
+ .byte 15,40,168,219,115,0,0 // movaps 0x73db(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,89,239 // mulps %xmm7,%xmm5
.byte 15,88,234 // addps %xmm2,%xmm5
@@ -64816,7 +65383,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,125,232 // movaps -0x18(%ebp),%xmm7
.byte 15,85,252 // andnps %xmm4,%xmm7
.byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
- .byte 15,88,152,138,114,0,0 // addps 0x728a(%eax),%xmm3
+ .byte 15,88,152,251,115,0,0 // addps 0x73fb(%eax),%xmm3
.byte 243,15,91,195 // cvttps2dq %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
@@ -64903,7 +65470,7 @@ _sk_scale_u8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 2680 <_sk_scale_u8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 269f <_sk_scale_u8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -64914,13 +65481,13 @@ _sk_scale_u8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,65 // jne 26dc <_sk_scale_u8_sse2+0x6a>
+ .byte 117,65 // jne 26fb <_sk_scale_u8_sse2+0x6a>
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,32,112,0,0 // pand 0x7020(%edx),%xmm4
+ .byte 102,15,219,162,145,113,0,0 // pand 0x7191(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,48,112,0,0 // mulps 0x7030(%edx),%xmm4
+ .byte 15,89,162,161,113,0,0 // mulps 0x71a1(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 15,89,212 // mulps %xmm4,%xmm2
@@ -64939,12 +65506,12 @@ _sk_scale_u8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 2716 <_sk_scale_u8_sse2+0xa4>
+ .byte 116,50 // je 2735 <_sk_scale_u8_sse2+0xa4>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 2700 <_sk_scale_u8_sse2+0x8e>
+ .byte 116,19 // je 271f <_sk_scale_u8_sse2+0x8e>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,182 // jne 26a8 <_sk_scale_u8_sse2+0x36>
+ .byte 117,182 // jne 26c7 <_sk_scale_u8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -64953,10 +65520,100 @@ _sk_scale_u8_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,146 // jmp 26a8 <_sk_scale_u8_sse2+0x36>
+ .byte 235,146 // jmp 26c7 <_sk_scale_u8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 235,136 // jmp 26a8 <_sk_scale_u8_sse2+0x36>
+ .byte 235,136 // jmp 26c7 <_sk_scale_u8_sse2+0x36>
+
+HIDDEN _sk_scale_565_sse2
+.globl _sk_scale_565_sse2
+FUNCTION(_sk_scale_565_sse2)
+_sk_scale_565_sse2:
+ .byte 85 // push %ebp
+ .byte 137,229 // mov %esp,%ebp
+ .byte 83 // push %ebx
+ .byte 87 // push %edi
+ .byte 86 // push %esi
+ .byte 131,236,44 // sub $0x2c,%esp
+ .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
+ .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
+ .byte 102,15,111,200 // movdqa %xmm0,%xmm1
+ .byte 232,0,0,0,0 // call 2759 <_sk_scale_565_sse2+0x1a>
+ .byte 90 // pop %edx
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,77,8 // mov 0x8(%ebp),%ecx
+ .byte 139,56 // mov (%eax),%edi
+ .byte 139,119,4 // mov 0x4(%edi),%esi
+ .byte 15,175,113,4 // imul 0x4(%ecx),%esi
+ .byte 1,246 // add %esi,%esi
+ .byte 3,55 // add (%edi),%esi
+ .byte 139,89,8 // mov 0x8(%ecx),%ebx
+ .byte 133,219 // test %ebx,%ebx
+ .byte 139,57 // mov (%ecx),%edi
+ .byte 15,133,157,0,0,0 // jne 2817 <_sk_scale_565_sse2+0xd8>
+ .byte 243,15,126,52,126 // movq (%esi,%edi,2),%xmm6
+ .byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
+ .byte 102,15,111,162,247,112,0,0 // movdqa 0x70f7(%edx),%xmm4
+ .byte 102,15,219,230 // pand %xmm6,%xmm4
+ .byte 15,91,212 // cvtdq2ps %xmm4,%xmm2
+ .byte 15,89,146,7,113,0,0 // mulps 0x7107(%edx),%xmm2
+ .byte 102,15,111,170,23,113,0,0 // movdqa 0x7117(%edx),%xmm5
+ .byte 102,15,219,238 // pand %xmm6,%xmm5
+ .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
+ .byte 15,89,170,39,113,0,0 // mulps 0x7127(%edx),%xmm5
+ .byte 102,15,219,178,55,113,0,0 // pand 0x7137(%edx),%xmm6
+ .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
+ .byte 15,89,178,71,113,0,0 // mulps 0x7147(%edx),%xmm6
+ .byte 15,40,253 // movaps %xmm5,%xmm7
+ .byte 15,93,254 // minps %xmm6,%xmm7
+ .byte 15,40,226 // movaps %xmm2,%xmm4
+ .byte 15,93,231 // minps %xmm7,%xmm4
+ .byte 15,40,253 // movaps %xmm5,%xmm7
+ .byte 15,95,254 // maxps %xmm6,%xmm7
+ .byte 15,40,194 // movaps %xmm2,%xmm0
+ .byte 15,95,199 // maxps %xmm7,%xmm0
+ .byte 15,40,251 // movaps %xmm3,%xmm7
+ .byte 15,194,121,64,1 // cmpltps 0x40(%ecx),%xmm7
+ .byte 15,84,231 // andps %xmm7,%xmm4
+ .byte 15,85,248 // andnps %xmm0,%xmm7
+ .byte 15,86,252 // orps %xmm4,%xmm7
+ .byte 15,89,209 // mulps %xmm1,%xmm2
+ .byte 15,89,109,216 // mulps -0x28(%ebp),%xmm5
+ .byte 15,89,117,200 // mulps -0x38(%ebp),%xmm6
+ .byte 15,89,251 // mulps %xmm3,%xmm7
+ .byte 141,80,8 // lea 0x8(%eax),%edx
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,194 // movaps %xmm2,%xmm0
+ .byte 15,40,205 // movaps %xmm5,%xmm1
+ .byte 15,40,214 // movaps %xmm6,%xmm2
+ .byte 15,40,223 // movaps %xmm7,%xmm3
+ .byte 82 // push %edx
+ .byte 81 // push %ecx
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,60 // add $0x3c,%esp
+ .byte 94 // pop %esi
+ .byte 95 // pop %edi
+ .byte 91 // pop %ebx
+ .byte 93 // pop %ebp
+ .byte 195 // ret
+ .byte 128,227,3 // and $0x3,%bl
+ .byte 128,251,1 // cmp $0x1,%bl
+ .byte 116,50 // je 2851 <_sk_scale_565_sse2+0x112>
+ .byte 102,15,239,246 // pxor %xmm6,%xmm6
+ .byte 128,251,2 // cmp $0x2,%bl
+ .byte 116,23 // je 283f <_sk_scale_565_sse2+0x100>
+ .byte 128,251,3 // cmp $0x3,%bl
+ .byte 15,133,82,255,255,255 // jne 2783 <_sk_scale_565_sse2+0x44>
+ .byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
+ .byte 102,15,110,227 // movd %ebx,%xmm4
+ .byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
+ .byte 102,15,110,36,126 // movd (%esi,%edi,2),%xmm4
+ .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
+ .byte 242,15,16,244 // movsd %xmm4,%xmm6
+ .byte 233,50,255,255,255 // jmp 2783 <_sk_scale_565_sse2+0x44>
+ .byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
+ .byte 102,15,110,246 // movd %esi,%xmm6
+ .byte 233,37,255,255,255 // jmp 2783 <_sk_scale_565_sse2+0x44>
HIDDEN _sk_lerp_1_float_sse2
.globl _sk_lerp_1_float_sse2
@@ -65005,7 +65662,7 @@ _sk_lerp_u8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 2788 <_sk_lerp_u8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 28c6 <_sk_lerp_u8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -65016,13 +65673,13 @@ _sk_lerp_u8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,102 // jne 2809 <_sk_lerp_u8_sse2+0x8f>
+ .byte 117,102 // jne 2947 <_sk_lerp_u8_sse2+0x8f>
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,56,111,0,0 // pand 0x6f38(%edx),%xmm4
+ .byte 102,15,219,162,234,111,0,0 // pand 0x6fea(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,72,111,0,0 // mulps 0x6f48(%edx),%xmm4
+ .byte 15,89,162,250,111,0,0 // mulps 0x6ffa(%edx),%xmm4
.byte 15,40,105,16 // movaps 0x10(%ecx),%xmm5
.byte 15,40,113,32 // movaps 0x20(%ecx),%xmm6
.byte 15,92,197 // subps %xmm5,%xmm0
@@ -65052,12 +65709,12 @@ _sk_lerp_u8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,53 // je 2846 <_sk_lerp_u8_sse2+0xcc>
+ .byte 116,53 // je 2984 <_sk_lerp_u8_sse2+0xcc>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 282d <_sk_lerp_u8_sse2+0xb3>
+ .byte 116,19 // je 296b <_sk_lerp_u8_sse2+0xb3>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,145 // jne 27b0 <_sk_lerp_u8_sse2+0x36>
+ .byte 117,145 // jne 28ee <_sk_lerp_u8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -65066,10 +65723,10 @@ _sk_lerp_u8_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,106,255,255,255 // jmp 27b0 <_sk_lerp_u8_sse2+0x36>
+ .byte 233,106,255,255,255 // jmp 28ee <_sk_lerp_u8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 233,93,255,255,255 // jmp 27b0 <_sk_lerp_u8_sse2+0x36>
+ .byte 233,93,255,255,255 // jmp 28ee <_sk_lerp_u8_sse2+0x36>
HIDDEN _sk_lerp_565_sse2
.globl _sk_lerp_565_sse2
@@ -65080,8 +65737,12 @@ _sk_lerp_565_sse2:
.byte 83 // push %ebx
.byte 87 // push %edi
.byte 86 // push %esi
- .byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 2861 <_sk_lerp_565_sse2+0xe>
+ .byte 131,236,108 // sub $0x6c,%esp
+ .byte 15,41,93,168 // movaps %xmm3,-0x58(%ebp)
+ .byte 15,41,85,136 // movaps %xmm2,-0x78(%ebp)
+ .byte 15,41,77,152 // movaps %xmm1,-0x68(%ebp)
+ .byte 102,15,127,69,184 // movdqa %xmm0,-0x48(%ebp)
+ .byte 232,0,0,0,0 // call 29b0 <_sk_lerp_565_sse2+0x1f>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -65093,49 +65754,62 @@ _sk_lerp_565_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,163,0,0,0 // jne 2925 <_sk_lerp_565_sse2+0xd2>
- .byte 243,15,126,52,126 // movq (%esi,%edi,2),%xmm6
- .byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,162,127,110,0,0 // movdqa 0x6e7f(%edx),%xmm4
- .byte 102,15,219,230 // pand %xmm6,%xmm4
- .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,143,110,0,0 // mulps 0x6e8f(%edx),%xmm4
- .byte 102,15,111,170,159,110,0,0 // movdqa 0x6e9f(%edx),%xmm5
- .byte 102,15,219,238 // pand %xmm6,%xmm5
- .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,175,110,0,0 // mulps 0x6eaf(%edx),%xmm5
- .byte 102,15,219,178,191,110,0,0 // pand 0x6ebf(%edx),%xmm6
+ .byte 15,133,211,0,0,0 // jne 2aa4 <_sk_lerp_565_sse2+0x113>
+ .byte 243,15,126,44,126 // movq (%esi,%edi,2),%xmm5
+ .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
+ .byte 102,15,111,162,32,111,0,0 // movdqa 0x6f20(%edx),%xmm4
+ .byte 102,15,219,229 // pand %xmm5,%xmm4
+ .byte 15,91,204 // cvtdq2ps %xmm4,%xmm1
+ .byte 15,89,138,48,111,0,0 // mulps 0x6f30(%edx),%xmm1
+ .byte 102,15,111,178,64,111,0,0 // movdqa 0x6f40(%edx),%xmm6
+ .byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,178,207,110,0,0 // mulps 0x6ecf(%edx),%xmm6
- .byte 15,40,121,16 // movaps 0x10(%ecx),%xmm7
- .byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,121,32 // movaps 0x20(%ecx),%xmm7
- .byte 15,92,207 // subps %xmm7,%xmm1
- .byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,88,207 // addps %xmm7,%xmm1
- .byte 15,40,121,48 // movaps 0x30(%ecx),%xmm7
- .byte 15,92,215 // subps %xmm7,%xmm2
- .byte 15,89,214 // mulps %xmm6,%xmm2
- .byte 15,88,215 // addps %xmm7,%xmm2
- .byte 15,40,121,64 // movaps 0x40(%ecx),%xmm7
- .byte 15,92,223 // subps %xmm7,%xmm3
- .byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 15,88,231 // addps %xmm7,%xmm4
- .byte 15,88,239 // addps %xmm7,%xmm5
- .byte 15,88,223 // addps %xmm7,%xmm3
- .byte 15,95,235 // maxps %xmm3,%xmm5
- .byte 15,95,229 // maxps %xmm5,%xmm4
+ .byte 15,89,178,80,111,0,0 // mulps 0x6f50(%edx),%xmm6
+ .byte 102,15,219,170,96,111,0,0 // pand 0x6f60(%edx),%xmm5
+ .byte 15,91,213 // cvtdq2ps %xmm5,%xmm2
+ .byte 15,89,146,112,111,0,0 // mulps 0x6f70(%edx),%xmm2
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
+ .byte 15,40,254 // movaps %xmm6,%xmm7
+ .byte 15,40,65,32 // movaps 0x20(%ecx),%xmm0
+ .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
+ .byte 15,40,101,152 // movaps -0x68(%ebp),%xmm4
+ .byte 15,92,224 // subps %xmm0,%xmm4
+ .byte 15,89,230 // mulps %xmm6,%xmm4
+ .byte 15,93,243 // minps %xmm3,%xmm6
+ .byte 15,40,209 // movaps %xmm1,%xmm2
+ .byte 15,40,65,16 // movaps 0x10(%ecx),%xmm0
+ .byte 15,40,109,184 // movaps -0x48(%ebp),%xmm5
+ .byte 15,92,232 // subps %xmm0,%xmm5
+ .byte 15,89,233 // mulps %xmm1,%xmm5
+ .byte 15,93,206 // minps %xmm6,%xmm1
+ .byte 15,40,113,64 // movaps 0x40(%ecx),%xmm6
+ .byte 15,95,251 // maxps %xmm3,%xmm7
+ .byte 15,95,215 // maxps %xmm7,%xmm2
+ .byte 15,40,93,168 // movaps -0x58(%ebp),%xmm3
+ .byte 15,40,251 // movaps %xmm3,%xmm7
+ .byte 15,194,254,1 // cmpltps %xmm6,%xmm7
+ .byte 15,84,207 // andps %xmm7,%xmm1
+ .byte 15,85,250 // andnps %xmm2,%xmm7
+ .byte 15,86,249 // orps %xmm1,%xmm7
+ .byte 15,88,232 // addps %xmm0,%xmm5
+ .byte 15,88,101,216 // addps -0x28(%ebp),%xmm4
+ .byte 15,40,65,48 // movaps 0x30(%ecx),%xmm0
+ .byte 15,40,85,136 // movaps -0x78(%ebp),%xmm2
+ .byte 15,92,208 // subps %xmm0,%xmm2
+ .byte 15,89,85,200 // mulps -0x38(%ebp),%xmm2
+ .byte 15,88,208 // addps %xmm0,%xmm2
+ .byte 15,92,222 // subps %xmm6,%xmm3
+ .byte 15,89,223 // mulps %xmm7,%xmm3
+ .byte 15,88,222 // addps %xmm6,%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,220 // movaps %xmm4,%xmm3
+ .byte 15,40,197 // movaps %xmm5,%xmm0
+ .byte 15,40,204 // movaps %xmm4,%xmm1
.byte 82 // push %edx
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
- .byte 131,196,28 // add $0x1c,%esp
+ .byte 131,196,124 // add $0x7c,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
.byte 91 // pop %ebx
@@ -65143,22 +65817,22 @@ _sk_lerp_565_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 295f <_sk_lerp_565_sse2+0x10c>
- .byte 102,15,239,246 // pxor %xmm6,%xmm6
+ .byte 116,50 // je 2ade <_sk_lerp_565_sse2+0x14d>
+ .byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,23 // je 294d <_sk_lerp_565_sse2+0xfa>
+ .byte 116,23 // je 2acc <_sk_lerp_565_sse2+0x13b>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,76,255,255,255 // jne 288b <_sk_lerp_565_sse2+0x38>
+ .byte 15,133,28,255,255,255 // jne 29da <_sk_lerp_565_sse2+0x49>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
- .byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
+ .byte 102,15,112,236,69 // pshufd $0x45,%xmm4,%xmm5
.byte 102,15,110,36,126 // movd (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 242,15,16,244 // movsd %xmm4,%xmm6
- .byte 233,44,255,255,255 // jmp 288b <_sk_lerp_565_sse2+0x38>
+ .byte 242,15,16,236 // movsd %xmm4,%xmm5
+ .byte 233,252,254,255,255 // jmp 29da <_sk_lerp_565_sse2+0x49>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
- .byte 102,15,110,246 // movd %esi,%xmm6
- .byte 233,31,255,255,255 // jmp 288b <_sk_lerp_565_sse2+0x38>
+ .byte 102,15,110,238 // movd %esi,%xmm5
+ .byte 233,239,254,255,255 // jmp 29da <_sk_lerp_565_sse2+0x49>
HIDDEN _sk_load_tables_sse2
.globl _sk_load_tables_sse2
@@ -65170,7 +65844,7 @@ _sk_load_tables_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 297a <_sk_load_tables_sse2+0xe>
+ .byte 232,0,0,0,0 // call 2af9 <_sk_load_tables_sse2+0xe>
.byte 90 // pop %edx
.byte 139,117,12 // mov 0xc(%ebp),%esi
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -65179,9 +65853,9 @@ _sk_load_tables_sse2:
.byte 133,192 // test %eax,%eax
.byte 139,54 // mov (%esi),%esi
.byte 139,30 // mov (%esi),%ebx
- .byte 15,133,19,1,0,0 // jne 2aa5 <_sk_load_tables_sse2+0x139>
+ .byte 15,133,19,1,0,0 // jne 2c24 <_sk_load_tables_sse2+0x139>
.byte 243,15,111,28,187 // movdqu (%ebx,%edi,4),%xmm3
- .byte 102,15,111,146,198,109,0,0 // movdqa 0x6dc6(%edx),%xmm2
+ .byte 102,15,111,146,55,110,0,0 // movdqa 0x6e37(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
@@ -65237,7 +65911,7 @@ _sk_load_tables_sse2:
.byte 15,20,215 // unpcklps %xmm7,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,214,109,0,0 // mulps 0x6dd6(%edx),%xmm3
+ .byte 15,89,154,71,110,0,0 // mulps 0x6e47(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,194 // mov %eax,%edx
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -65253,18 +65927,18 @@ _sk_load_tables_sse2:
.byte 195 // ret
.byte 36,3 // and $0x3,%al
.byte 60,1 // cmp $0x1,%al
- .byte 116,37 // je 2ad0 <_sk_load_tables_sse2+0x164>
+ .byte 116,37 // je 2c4f <_sk_load_tables_sse2+0x164>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 60,2 // cmp $0x2,%al
- .byte 116,19 // je 2ac6 <_sk_load_tables_sse2+0x15a>
+ .byte 116,19 // je 2c45 <_sk_load_tables_sse2+0x15a>
.byte 60,3 // cmp $0x3,%al
- .byte 15,133,220,254,255,255 // jne 2997 <_sk_load_tables_sse2+0x2b>
+ .byte 15,133,220,254,255,255 // jne 2b16 <_sk_load_tables_sse2+0x2b>
.byte 102,15,110,68,187,8 // movd 0x8(%ebx,%edi,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,18,28,187 // movlpd (%ebx,%edi,4),%xmm3
- .byte 233,199,254,255,255 // jmp 2997 <_sk_load_tables_sse2+0x2b>
+ .byte 233,199,254,255,255 // jmp 2b16 <_sk_load_tables_sse2+0x2b>
.byte 102,15,110,28,187 // movd (%ebx,%edi,4),%xmm3
- .byte 233,189,254,255,255 // jmp 2997 <_sk_load_tables_sse2+0x2b>
+ .byte 233,189,254,255,255 // jmp 2b16 <_sk_load_tables_sse2+0x2b>
HIDDEN _sk_load_tables_u16_be_sse2
.globl _sk_load_tables_u16_be_sse2
@@ -65276,7 +65950,7 @@ _sk_load_tables_u16_be_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,44 // sub $0x2c,%esp
- .byte 232,0,0,0,0 // call 2ae8 <_sk_load_tables_u16_be_sse2+0xe>
+ .byte 232,0,0,0,0 // call 2c67 <_sk_load_tables_u16_be_sse2+0xe>
.byte 90 // pop %edx
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
@@ -65287,7 +65961,7 @@ _sk_load_tables_u16_be_sse2:
.byte 139,57 // mov (%ecx),%edi
.byte 139,15 // mov (%edi),%ecx
.byte 190,255,0,255,0 // mov $0xff00ff,%esi
- .byte 15,133,166,1,0,0 // jne 2cae <_sk_load_tables_u16_be_sse2+0x1d4>
+ .byte 15,133,166,1,0,0 // jne 2e2d <_sk_load_tables_u16_be_sse2+0x1d4>
.byte 102,15,16,4,89 // movupd (%ecx,%ebx,2),%xmm0
.byte 243,15,111,76,89,16 // movdqu 0x10(%ecx,%ebx,2),%xmm1
.byte 102,15,40,216 // movapd %xmm0,%xmm3
@@ -65384,7 +66058,7 @@ _sk_load_tables_u16_be_sse2:
.byte 243,15,126,93,208 // movq -0x30(%ebp),%xmm3
.byte 102,15,97,223 // punpcklwd %xmm7,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,120,108,0,0 // mulps 0x6c78(%edx),%xmm3
+ .byte 15,89,154,233,108,0,0 // mulps 0x6ce9(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,193 // mov %eax,%ecx
.byte 141,65,8 // lea 0x8(%ecx),%eax
@@ -65401,12 +66075,12 @@ _sk_load_tables_u16_be_sse2:
.byte 242,15,16,4,89 // movsd (%ecx,%ebx,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,248,1 // cmp $0x1,%eax
- .byte 15,132,83,254,255,255 // je 2b13 <_sk_load_tables_u16_be_sse2+0x39>
+ .byte 15,132,83,254,255,255 // je 2c92 <_sk_load_tables_u16_be_sse2+0x39>
.byte 102,15,22,68,89,8 // movhpd 0x8(%ecx,%ebx,2),%xmm0
.byte 131,248,3 // cmp $0x3,%eax
- .byte 15,130,68,254,255,255 // jb 2b13 <_sk_load_tables_u16_be_sse2+0x39>
+ .byte 15,130,68,254,255,255 // jb 2c92 <_sk_load_tables_u16_be_sse2+0x39>
.byte 243,15,126,76,89,16 // movq 0x10(%ecx,%ebx,2),%xmm1
- .byte 233,57,254,255,255 // jmp 2b13 <_sk_load_tables_u16_be_sse2+0x39>
+ .byte 233,57,254,255,255 // jmp 2c92 <_sk_load_tables_u16_be_sse2+0x39>
HIDDEN _sk_load_tables_rgb_u16_be_sse2
.globl _sk_load_tables_rgb_u16_be_sse2
@@ -65418,7 +66092,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,28 // sub $0x1c,%esp
- .byte 232,0,0,0,0 // call 2ce8 <_sk_load_tables_rgb_u16_be_sse2+0xe>
+ .byte 232,0,0,0,0 // call 2e67 <_sk_load_tables_rgb_u16_be_sse2+0xe>
.byte 88 // pop %eax
.byte 137,69,240 // mov %eax,-0x10(%ebp)
.byte 139,69,12 // mov 0xc(%ebp),%eax
@@ -65429,7 +66103,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 139,56 // mov (%eax),%edi
.byte 139,7 // mov (%edi),%eax
.byte 190,255,0,255,0 // mov $0xff00ff,%esi
- .byte 15,133,141,1,0,0 // jne 2e96 <_sk_load_tables_rgb_u16_be_sse2+0x1bc>
+ .byte 15,133,141,1,0,0 // jne 3015 <_sk_load_tables_rgb_u16_be_sse2+0x1bc>
.byte 243,15,111,12,88 // movdqu (%eax,%ebx,2),%xmm1
.byte 243,15,111,92,88,8 // movdqu 0x8(%eax,%ebx,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -65523,7 +66197,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 141,65,8 // lea 0x8(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 139,85,240 // mov -0x10(%ebp),%edx
- .byte 15,40,162,136,106,0,0 // movaps 0x6a88(%edx),%xmm4
+ .byte 15,40,162,249,106,0,0 // movaps 0x6af9(%edx),%xmm4
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,40,220 // movaps %xmm4,%xmm3
.byte 80 // push %eax
@@ -65539,20 +66213,20 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,15,196,76,88,4,2 // pinsrw $0x2,0x4(%eax,%ebx,2),%xmm1
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 131,249,1 // cmp $0x1,%ecx
- .byte 117,13 // jne 2eb8 <_sk_load_tables_rgb_u16_be_sse2+0x1de>
+ .byte 117,13 // jne 3037 <_sk_load_tables_rgb_u16_be_sse2+0x1de>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,115,254,255,255 // jmp 2d2b <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ .byte 233,115,254,255,255 // jmp 2eaa <_sk_load_tables_rgb_u16_be_sse2+0x51>
.byte 102,15,110,68,88,6 // movd 0x6(%eax,%ebx,2),%xmm0
.byte 102,15,196,68,88,10,2 // pinsrw $0x2,0xa(%eax,%ebx,2),%xmm0
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 131,249,3 // cmp $0x3,%ecx
- .byte 114,18 // jb 2ee0 <_sk_load_tables_rgb_u16_be_sse2+0x206>
+ .byte 114,18 // jb 305f <_sk_load_tables_rgb_u16_be_sse2+0x206>
.byte 102,15,110,92,88,12 // movd 0xc(%eax,%ebx,2),%xmm3
.byte 102,15,196,92,88,16,2 // pinsrw $0x2,0x10(%eax,%ebx,2),%xmm3
- .byte 233,75,254,255,255 // jmp 2d2b <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ .byte 233,75,254,255,255 // jmp 2eaa <_sk_load_tables_rgb_u16_be_sse2+0x51>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,66,254,255,255 // jmp 2d2b <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ .byte 233,66,254,255,255 // jmp 2eaa <_sk_load_tables_rgb_u16_be_sse2+0x51>
HIDDEN _sk_byte_tables_sse2
.globl _sk_byte_tables_sse2
@@ -65564,11 +66238,11 @@ _sk_byte_tables_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 2ef7 <_sk_byte_tables_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3076 <_sk_byte_tables_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
- .byte 15,40,162,137,104,0,0 // movaps 0x6889(%edx),%xmm4
+ .byte 15,40,162,250,104,0,0 // movaps 0x68fa(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
@@ -65590,7 +66264,7 @@ _sk_byte_tables_sse2:
.byte 102,15,196,192,0 // pinsrw $0x0,%eax,%xmm0
.byte 139,65,4 // mov 0x4(%ecx),%eax
.byte 102,15,196,195,1 // pinsrw $0x1,%ebx,%xmm0
- .byte 15,40,170,153,104,0,0 // movaps 0x6899(%edx),%xmm5
+ .byte 15,40,170,10,105,0,0 // movaps 0x690a(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -65715,12 +66389,12 @@ _sk_byte_tables_rgb_sse2:
.byte 15,182,60,31 // movzbl (%edi,%ebx,1),%edi
.byte 193,231,8 // shl $0x8,%edi
.byte 9,215 // or %edx,%edi
- .byte 232,0,0,0,0 // call 30f7 <_sk_byte_tables_rgb_sse2+0x65>
+ .byte 232,0,0,0,0 // call 3276 <_sk_byte_tables_rgb_sse2+0x65>
.byte 90 // pop %edx
.byte 102,15,196,199,0 // pinsrw $0x0,%edi,%xmm0
.byte 139,121,4 // mov 0x4(%ecx),%edi
.byte 102,15,196,198,1 // pinsrw $0x1,%esi,%xmm0
- .byte 15,40,170,169,102,0,0 // movaps 0x66a9(%edx),%xmm5
+ .byte 15,40,170,26,103,0,0 // movaps 0x671a(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -65956,7 +66630,7 @@ _sk_parametric_r_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 33c6 <_sk_parametric_r_sse2+0x18>
+ .byte 232,0,0,0,0 // call 3545 <_sk_parametric_r_sse2+0x18>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
@@ -65976,15 +66650,15 @@ _sk_parametric_r_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,234,99,0,0 // mulps 0x63ea(%edx),%xmm5
- .byte 15,84,178,250,99,0,0 // andps 0x63fa(%edx),%xmm6
- .byte 15,86,178,10,100,0,0 // orps 0x640a(%edx),%xmm6
- .byte 15,88,170,26,100,0,0 // addps 0x641a(%edx),%xmm5
- .byte 15,40,186,42,100,0,0 // movaps 0x642a(%edx),%xmm7
+ .byte 15,89,170,91,100,0,0 // mulps 0x645b(%edx),%xmm5
+ .byte 15,84,178,107,100,0,0 // andps 0x646b(%edx),%xmm6
+ .byte 15,86,178,123,100,0,0 // orps 0x647b(%edx),%xmm6
+ .byte 15,88,170,139,100,0,0 // addps 0x648b(%edx),%xmm5
+ .byte 15,40,186,155,100,0,0 // movaps 0x649b(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,58,100,0,0 // addps 0x643a(%edx),%xmm6
- .byte 15,40,186,74,100,0,0 // movaps 0x644a(%edx),%xmm7
+ .byte 15,88,178,171,100,0,0 // addps 0x64ab(%edx),%xmm6
+ .byte 15,40,186,187,100,0,0 // movaps 0x64bb(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -65994,21 +66668,21 @@ _sk_parametric_r_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,90,100,0,0 // movaps 0x645a(%edx),%xmm6
+ .byte 15,40,178,203,100,0,0 // movaps 0x64cb(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,106,100,0,0 // addps 0x646a(%edx),%xmm5
- .byte 15,40,186,122,100,0,0 // movaps 0x647a(%edx),%xmm7
+ .byte 15,88,170,219,100,0,0 // addps 0x64db(%edx),%xmm5
+ .byte 15,40,186,235,100,0,0 // movaps 0x64eb(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,138,100,0,0 // movaps 0x648a(%edx),%xmm7
+ .byte 15,40,186,251,100,0,0 // movaps 0x64fb(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,154,100,0,0 // movaps 0x649a(%edx),%xmm0
+ .byte 15,40,130,11,101,0,0 // movaps 0x650b(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,170,100,0,0 // mulps 0x64aa(%edx),%xmm0
+ .byte 15,89,130,27,101,0,0 // mulps 0x651b(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -66042,7 +66716,7 @@ _sk_parametric_g_sse2:
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 34fd <_sk_parametric_g_sse2+0x15>
+ .byte 232,0,0,0,0 // call 367c <_sk_parametric_g_sse2+0x15>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
@@ -66062,15 +66736,15 @@ _sk_parametric_g_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,131,99,0,0 // mulps 0x6383(%edx),%xmm5
- .byte 15,84,178,147,99,0,0 // andps 0x6393(%edx),%xmm6
- .byte 15,86,178,163,99,0,0 // orps 0x63a3(%edx),%xmm6
- .byte 15,88,170,179,99,0,0 // addps 0x63b3(%edx),%xmm5
- .byte 15,40,186,195,99,0,0 // movaps 0x63c3(%edx),%xmm7
+ .byte 15,89,170,244,99,0,0 // mulps 0x63f4(%edx),%xmm5
+ .byte 15,84,178,4,100,0,0 // andps 0x6404(%edx),%xmm6
+ .byte 15,86,178,20,100,0,0 // orps 0x6414(%edx),%xmm6
+ .byte 15,88,170,36,100,0,0 // addps 0x6424(%edx),%xmm5
+ .byte 15,40,186,52,100,0,0 // movaps 0x6434(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,211,99,0,0 // addps 0x63d3(%edx),%xmm6
- .byte 15,40,186,227,99,0,0 // movaps 0x63e3(%edx),%xmm7
+ .byte 15,88,178,68,100,0,0 // addps 0x6444(%edx),%xmm6
+ .byte 15,40,186,84,100,0,0 // movaps 0x6454(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -66080,21 +66754,21 @@ _sk_parametric_g_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,243,99,0,0 // movaps 0x63f3(%edx),%xmm6
+ .byte 15,40,178,100,100,0,0 // movaps 0x6464(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,3,100,0,0 // addps 0x6403(%edx),%xmm5
- .byte 15,40,186,19,100,0,0 // movaps 0x6413(%edx),%xmm7
+ .byte 15,88,170,116,100,0,0 // addps 0x6474(%edx),%xmm5
+ .byte 15,40,186,132,100,0,0 // movaps 0x6484(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,35,100,0,0 // movaps 0x6423(%edx),%xmm7
+ .byte 15,40,186,148,100,0,0 // movaps 0x6494(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,51,100,0,0 // movaps 0x6433(%edx),%xmm0
+ .byte 15,40,130,164,100,0,0 // movaps 0x64a4(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,67,100,0,0 // mulps 0x6443(%edx),%xmm0
+ .byte 15,89,130,180,100,0,0 // mulps 0x64b4(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -66127,7 +66801,7 @@ _sk_parametric_b_sse2:
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,217 // movaps %xmm1,%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 3631 <_sk_parametric_b_sse2+0x15>
+ .byte 232,0,0,0,0 // call 37b0 <_sk_parametric_b_sse2+0x15>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
@@ -66147,15 +66821,15 @@ _sk_parametric_b_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,31,99,0,0 // mulps 0x631f(%edx),%xmm5
- .byte 15,84,178,47,99,0,0 // andps 0x632f(%edx),%xmm6
- .byte 15,86,178,63,99,0,0 // orps 0x633f(%edx),%xmm6
- .byte 15,88,170,79,99,0,0 // addps 0x634f(%edx),%xmm5
- .byte 15,40,186,95,99,0,0 // movaps 0x635f(%edx),%xmm7
+ .byte 15,89,170,144,99,0,0 // mulps 0x6390(%edx),%xmm5
+ .byte 15,84,178,160,99,0,0 // andps 0x63a0(%edx),%xmm6
+ .byte 15,86,178,176,99,0,0 // orps 0x63b0(%edx),%xmm6
+ .byte 15,88,170,192,99,0,0 // addps 0x63c0(%edx),%xmm5
+ .byte 15,40,186,208,99,0,0 // movaps 0x63d0(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,111,99,0,0 // addps 0x636f(%edx),%xmm6
- .byte 15,40,186,127,99,0,0 // movaps 0x637f(%edx),%xmm7
+ .byte 15,88,178,224,99,0,0 // addps 0x63e0(%edx),%xmm6
+ .byte 15,40,186,240,99,0,0 // movaps 0x63f0(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -66165,21 +66839,21 @@ _sk_parametric_b_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,143,99,0,0 // movaps 0x638f(%edx),%xmm6
+ .byte 15,40,178,0,100,0,0 // movaps 0x6400(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,159,99,0,0 // addps 0x639f(%edx),%xmm5
- .byte 15,40,186,175,99,0,0 // movaps 0x63af(%edx),%xmm7
+ .byte 15,88,170,16,100,0,0 // addps 0x6410(%edx),%xmm5
+ .byte 15,40,186,32,100,0,0 // movaps 0x6420(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,191,99,0,0 // movaps 0x63bf(%edx),%xmm7
+ .byte 15,40,186,48,100,0,0 // movaps 0x6430(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,207,99,0,0 // movaps 0x63cf(%edx),%xmm0
+ .byte 15,40,130,64,100,0,0 // movaps 0x6440(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,223,99,0,0 // mulps 0x63df(%edx),%xmm0
+ .byte 15,89,130,80,100,0,0 // mulps 0x6450(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -66212,7 +66886,7 @@ _sk_parametric_a_sse2:
.byte 15,41,85,232 // movaps %xmm2,-0x18(%ebp)
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 3765 <_sk_parametric_a_sse2+0x15>
+ .byte 232,0,0,0,0 // call 38e4 <_sk_parametric_a_sse2+0x15>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
@@ -66232,15 +66906,15 @@ _sk_parametric_a_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,187,98,0,0 // mulps 0x62bb(%edx),%xmm5
- .byte 15,84,178,203,98,0,0 // andps 0x62cb(%edx),%xmm6
- .byte 15,86,178,219,98,0,0 // orps 0x62db(%edx),%xmm6
- .byte 15,88,170,235,98,0,0 // addps 0x62eb(%edx),%xmm5
- .byte 15,40,186,251,98,0,0 // movaps 0x62fb(%edx),%xmm7
+ .byte 15,89,170,44,99,0,0 // mulps 0x632c(%edx),%xmm5
+ .byte 15,84,178,60,99,0,0 // andps 0x633c(%edx),%xmm6
+ .byte 15,86,178,76,99,0,0 // orps 0x634c(%edx),%xmm6
+ .byte 15,88,170,92,99,0,0 // addps 0x635c(%edx),%xmm5
+ .byte 15,40,186,108,99,0,0 // movaps 0x636c(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,11,99,0,0 // addps 0x630b(%edx),%xmm6
- .byte 15,40,186,27,99,0,0 // movaps 0x631b(%edx),%xmm7
+ .byte 15,88,178,124,99,0,0 // addps 0x637c(%edx),%xmm6
+ .byte 15,40,186,140,99,0,0 // movaps 0x638c(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -66250,21 +66924,21 @@ _sk_parametric_a_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,43,99,0,0 // movaps 0x632b(%edx),%xmm6
+ .byte 15,40,178,156,99,0,0 // movaps 0x639c(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,59,99,0,0 // addps 0x633b(%edx),%xmm5
- .byte 15,40,186,75,99,0,0 // movaps 0x634b(%edx),%xmm7
+ .byte 15,88,170,172,99,0,0 // addps 0x63ac(%edx),%xmm5
+ .byte 15,40,186,188,99,0,0 // movaps 0x63bc(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,91,99,0,0 // movaps 0x635b(%edx),%xmm7
+ .byte 15,40,186,204,99,0,0 // movaps 0x63cc(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,107,99,0,0 // movaps 0x636b(%edx),%xmm0
+ .byte 15,40,130,220,99,0,0 // movaps 0x63dc(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,123,99,0,0 // mulps 0x637b(%edx),%xmm0
+ .byte 15,89,130,236,99,0,0 // mulps 0x63ec(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -66296,18 +66970,18 @@ _sk_gamma_sse2:
.byte 131,236,40 // sub $0x28,%esp
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 15,40,216 // movaps %xmm0,%xmm3
- .byte 232,0,0,0,0 // call 3896 <_sk_gamma_sse2+0x12>
+ .byte 232,0,0,0,0 // call 3a15 <_sk_gamma_sse2+0x12>
.byte 88 // pop %eax
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,128,90,98,0,0 // mulps 0x625a(%eax),%xmm0
- .byte 15,84,152,106,98,0,0 // andps 0x626a(%eax),%xmm3
- .byte 15,86,152,122,98,0,0 // orps 0x627a(%eax),%xmm3
- .byte 15,88,128,138,98,0,0 // addps 0x628a(%eax),%xmm0
+ .byte 15,89,128,203,98,0,0 // mulps 0x62cb(%eax),%xmm0
+ .byte 15,84,152,219,98,0,0 // andps 0x62db(%eax),%xmm3
+ .byte 15,86,152,235,98,0,0 // orps 0x62eb(%eax),%xmm3
+ .byte 15,88,128,251,98,0,0 // addps 0x62fb(%eax),%xmm0
.byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 15,89,160,154,98,0,0 // mulps 0x629a(%eax),%xmm4
+ .byte 15,89,160,11,99,0,0 // mulps 0x630b(%eax),%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,88,152,170,98,0,0 // addps 0x62aa(%eax),%xmm3
- .byte 15,40,160,186,98,0,0 // movaps 0x62ba(%eax),%xmm4
+ .byte 15,88,152,27,99,0,0 // addps 0x631b(%eax),%xmm3
+ .byte 15,40,160,43,99,0,0 // movaps 0x632b(%eax),%xmm4
.byte 15,94,227 // divps %xmm3,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 139,77,12 // mov 0xc(%ebp),%ecx
@@ -66320,30 +66994,30 @@ _sk_gamma_sse2:
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,194,227,1 // cmpltps %xmm3,%xmm4
- .byte 15,84,160,202,98,0,0 // andps 0x62ca(%eax),%xmm4
+ .byte 15,84,160,59,99,0,0 // andps 0x633b(%eax),%xmm4
.byte 15,92,220 // subps %xmm4,%xmm3
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
- .byte 15,88,128,218,98,0,0 // addps 0x62da(%eax),%xmm0
- .byte 15,40,176,250,98,0,0 // movaps 0x62fa(%eax),%xmm6
+ .byte 15,88,128,75,99,0,0 // addps 0x634b(%eax),%xmm0
+ .byte 15,40,176,107,99,0,0 // movaps 0x636b(%eax),%xmm6
.byte 15,92,244 // subps %xmm4,%xmm6
- .byte 15,40,168,234,98,0,0 // movaps 0x62ea(%eax),%xmm5
+ .byte 15,40,168,91,99,0,0 // movaps 0x635b(%eax),%xmm5
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,40,152,10,99,0,0 // movaps 0x630a(%eax),%xmm3
+ .byte 15,40,152,123,99,0,0 // movaps 0x637b(%eax),%xmm3
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,94,230 // divps %xmm6,%xmm4
.byte 15,88,224 // addps %xmm0,%xmm4
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,128,90,98,0,0 // mulps 0x625a(%eax),%xmm0
- .byte 15,84,136,106,98,0,0 // andps 0x626a(%eax),%xmm1
- .byte 15,86,136,122,98,0,0 // orps 0x627a(%eax),%xmm1
- .byte 15,88,128,138,98,0,0 // addps 0x628a(%eax),%xmm0
+ .byte 15,89,128,203,98,0,0 // mulps 0x62cb(%eax),%xmm0
+ .byte 15,84,136,219,98,0,0 // andps 0x62db(%eax),%xmm1
+ .byte 15,86,136,235,98,0,0 // orps 0x62eb(%eax),%xmm1
+ .byte 15,88,128,251,98,0,0 // addps 0x62fb(%eax),%xmm0
.byte 15,40,241 // movaps %xmm1,%xmm6
- .byte 15,89,176,154,98,0,0 // mulps 0x629a(%eax),%xmm6
+ .byte 15,89,176,11,99,0,0 // mulps 0x630b(%eax),%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
- .byte 15,88,136,170,98,0,0 // addps 0x62aa(%eax),%xmm1
- .byte 15,40,176,186,98,0,0 // movaps 0x62ba(%eax),%xmm6
+ .byte 15,88,136,27,99,0,0 // addps 0x631b(%eax),%xmm1
+ .byte 15,40,176,43,99,0,0 // movaps 0x632b(%eax),%xmm6
.byte 15,94,241 // divps %xmm1,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
@@ -66351,12 +67025,12 @@ _sk_gamma_sse2:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,194,241,1 // cmpltps %xmm1,%xmm6
- .byte 15,84,176,202,98,0,0 // andps 0x62ca(%eax),%xmm6
+ .byte 15,84,176,59,99,0,0 // andps 0x633b(%eax),%xmm6
.byte 15,92,206 // subps %xmm6,%xmm1
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,241 // subps %xmm1,%xmm6
- .byte 15,88,128,218,98,0,0 // addps 0x62da(%eax),%xmm0
- .byte 15,40,184,250,98,0,0 // movaps 0x62fa(%eax),%xmm7
+ .byte 15,88,128,75,99,0,0 // addps 0x634b(%eax),%xmm0
+ .byte 15,40,184,107,99,0,0 // movaps 0x636b(%eax),%xmm7
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
@@ -66364,15 +67038,15 @@ _sk_gamma_sse2:
.byte 15,94,207 // divps %xmm7,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,128,90,98,0,0 // mulps 0x625a(%eax),%xmm0
- .byte 15,84,144,106,98,0,0 // andps 0x626a(%eax),%xmm2
- .byte 15,86,144,122,98,0,0 // orps 0x627a(%eax),%xmm2
- .byte 15,88,128,138,98,0,0 // addps 0x628a(%eax),%xmm0
- .byte 15,40,176,154,98,0,0 // movaps 0x629a(%eax),%xmm6
+ .byte 15,89,128,203,98,0,0 // mulps 0x62cb(%eax),%xmm0
+ .byte 15,84,144,219,98,0,0 // andps 0x62db(%eax),%xmm2
+ .byte 15,86,144,235,98,0,0 // orps 0x62eb(%eax),%xmm2
+ .byte 15,88,128,251,98,0,0 // addps 0x62fb(%eax),%xmm0
+ .byte 15,40,176,11,99,0,0 // movaps 0x630b(%eax),%xmm6
.byte 15,89,242 // mulps %xmm2,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
- .byte 15,88,144,170,98,0,0 // addps 0x62aa(%eax),%xmm2
- .byte 15,40,176,186,98,0,0 // movaps 0x62ba(%eax),%xmm6
+ .byte 15,88,144,27,99,0,0 // addps 0x631b(%eax),%xmm2
+ .byte 15,40,176,43,99,0,0 // movaps 0x632b(%eax),%xmm6
.byte 15,94,242 // divps %xmm2,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
.byte 15,89,69,232 // mulps -0x18(%ebp),%xmm0
@@ -66380,18 +67054,18 @@ _sk_gamma_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,194,242,1 // cmpltps %xmm2,%xmm6
- .byte 15,84,176,202,98,0,0 // andps 0x62ca(%eax),%xmm6
+ .byte 15,84,176,59,99,0,0 // andps 0x633b(%eax),%xmm6
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
- .byte 15,88,128,218,98,0,0 // addps 0x62da(%eax),%xmm0
+ .byte 15,88,128,75,99,0,0 // addps 0x634b(%eax),%xmm0
.byte 15,89,238 // mulps %xmm6,%xmm5
.byte 15,92,197 // subps %xmm5,%xmm0
- .byte 15,40,144,250,98,0,0 // movaps 0x62fa(%eax),%xmm2
+ .byte 15,40,144,107,99,0,0 // movaps 0x636b(%eax),%xmm2
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 15,94,218 // divps %xmm2,%xmm3
.byte 15,88,216 // addps %xmm0,%xmm3
- .byte 15,40,128,26,99,0,0 // movaps 0x631a(%eax),%xmm0
+ .byte 15,40,128,139,99,0,0 // movaps 0x638b(%eax),%xmm0
.byte 15,89,224 // mulps %xmm0,%xmm4
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,89,216 // mulps %xmm0,%xmm3
@@ -66418,31 +67092,31 @@ _sk_lab_to_xyz_sse2:
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 3a7e <_sk_lab_to_xyz_sse2+0x15>
+ .byte 232,0,0,0,0 // call 3bfd <_sk_lab_to_xyz_sse2+0x15>
.byte 88 // pop %eax
- .byte 15,89,144,66,97,0,0 // mulps 0x6142(%eax),%xmm2
- .byte 15,40,160,82,97,0,0 // movaps 0x6152(%eax),%xmm4
+ .byte 15,89,144,179,97,0,0 // mulps 0x61b3(%eax),%xmm2
+ .byte 15,40,160,195,97,0,0 // movaps 0x61c3(%eax),%xmm4
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,40,168,98,97,0,0 // movaps 0x6162(%eax),%xmm5
+ .byte 15,40,168,211,97,0,0 // movaps 0x61d3(%eax),%xmm5
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,89,220 // mulps %xmm4,%xmm3
.byte 15,88,221 // addps %xmm5,%xmm3
- .byte 15,88,144,114,97,0,0 // addps 0x6172(%eax),%xmm2
- .byte 15,89,144,130,97,0,0 // mulps 0x6182(%eax),%xmm2
- .byte 15,89,136,146,97,0,0 // mulps 0x6192(%eax),%xmm1
+ .byte 15,88,144,227,97,0,0 // addps 0x61e3(%eax),%xmm2
+ .byte 15,89,144,243,97,0,0 // mulps 0x61f3(%eax),%xmm2
+ .byte 15,89,136,3,98,0,0 // mulps 0x6203(%eax),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,89,152,162,97,0,0 // mulps 0x61a2(%eax),%xmm3
+ .byte 15,89,152,19,98,0,0 // mulps 0x6213(%eax),%xmm3
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,152,178,97,0,0 // movaps 0x61b2(%eax),%xmm3
+ .byte 15,40,152,35,98,0,0 // movaps 0x6223(%eax),%xmm3
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,194,224,1 // cmpltps %xmm0,%xmm4
- .byte 15,40,176,194,97,0,0 // movaps 0x61c2(%eax),%xmm6
+ .byte 15,40,176,51,98,0,0 // movaps 0x6233(%eax),%xmm6
.byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,40,184,210,97,0,0 // movaps 0x61d2(%eax),%xmm7
+ .byte 15,40,184,67,98,0,0 // movaps 0x6243(%eax),%xmm7
.byte 15,89,207 // mulps %xmm7,%xmm1
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,85,225 // andnps %xmm1,%xmm4
@@ -66467,8 +67141,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,85,221 // andnps %xmm5,%xmm3
.byte 15,86,216 // orps %xmm0,%xmm3
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,89,160,226,97,0,0 // mulps 0x61e2(%eax),%xmm4
- .byte 15,89,152,242,97,0,0 // mulps 0x61f2(%eax),%xmm3
+ .byte 15,89,160,83,98,0,0 // mulps 0x6253(%eax),%xmm4
+ .byte 15,89,152,99,98,0,0 // mulps 0x6263(%eax),%xmm3
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
@@ -66491,7 +67165,7 @@ _sk_load_a8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3b6e <_sk_load_a8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3ced <_sk_load_a8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -66502,13 +67176,13 @@ _sk_load_a8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,60 // jne 3bc5 <_sk_load_a8_sse2+0x65>
+ .byte 117,60 // jne 3d44 <_sk_load_a8_sse2+0x65>
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,130,18,97,0,0 // pand 0x6112(%edx),%xmm0
+ .byte 102,15,219,130,131,97,0,0 // pand 0x6183(%edx),%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,154,34,97,0,0 // mulps 0x6122(%edx),%xmm3
+ .byte 15,89,154,147,97,0,0 // mulps 0x6193(%edx),%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -66525,12 +67199,12 @@ _sk_load_a8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 3bff <_sk_load_a8_sse2+0x9f>
+ .byte 116,50 // je 3d7e <_sk_load_a8_sse2+0x9f>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3be9 <_sk_load_a8_sse2+0x89>
+ .byte 116,19 // je 3d68 <_sk_load_a8_sse2+0x89>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,187 // jne 3b96 <_sk_load_a8_sse2+0x36>
+ .byte 117,187 // jne 3d15 <_sk_load_a8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -66539,10 +67213,10 @@ _sk_load_a8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,151 // jmp 3b96 <_sk_load_a8_sse2+0x36>
+ .byte 235,151 // jmp 3d15 <_sk_load_a8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,198 // movd %esi,%xmm0
- .byte 235,141 // jmp 3b96 <_sk_load_a8_sse2+0x36>
+ .byte 235,141 // jmp 3d15 <_sk_load_a8_sse2+0x36>
HIDDEN _sk_load_a8_dst_sse2
.globl _sk_load_a8_dst_sse2
@@ -66567,15 +67241,15 @@ _sk_load_a8_dst_sse2:
.byte 102,15,127,97,32 // movdqa %xmm4,0x20(%ecx)
.byte 102,15,127,97,16 // movdqa %xmm4,0x10(%ecx)
.byte 133,219 // test %ebx,%ebx
- .byte 232,0,0,0,0 // call 3c42 <_sk_load_a8_dst_sse2+0x39>
+ .byte 232,0,0,0,0 // call 3dc1 <_sk_load_a8_dst_sse2+0x39>
.byte 90 // pop %edx
- .byte 117,54 // jne 3c7b <_sk_load_a8_dst_sse2+0x72>
+ .byte 117,54 // jne 3dfa <_sk_load_a8_dst_sse2+0x72>
.byte 102,15,110,36,55 // movd (%edi,%esi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,94,96,0,0 // pand 0x605e(%edx),%xmm4
+ .byte 102,15,219,162,207,96,0,0 // pand 0x60cf(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,110,96,0,0 // mulps 0x606e(%edx),%xmm4
+ .byte 15,89,162,223,96,0,0 // mulps 0x60df(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -66590,11 +67264,11 @@ _sk_load_a8_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 3cb1 <_sk_load_a8_dst_sse2+0xa8>
+ .byte 116,46 // je 3e30 <_sk_load_a8_dst_sse2+0xa8>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3c9b <_sk_load_a8_dst_sse2+0x92>
+ .byte 116,19 // je 3e1a <_sk_load_a8_dst_sse2+0x92>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,197 // jne 3c52 <_sk_load_a8_dst_sse2+0x49>
+ .byte 117,197 // jne 3dd1 <_sk_load_a8_dst_sse2+0x49>
.byte 15,182,92,55,2 // movzbl 0x2(%edi,%esi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -66603,10 +67277,10 @@ _sk_load_a8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,161 // jmp 3c52 <_sk_load_a8_dst_sse2+0x49>
+ .byte 235,161 // jmp 3dd1 <_sk_load_a8_dst_sse2+0x49>
.byte 15,182,52,55 // movzbl (%edi,%esi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 235,151 // jmp 3c52 <_sk_load_a8_dst_sse2+0x49>
+ .byte 235,151 // jmp 3dd1 <_sk_load_a8_dst_sse2+0x49>
HIDDEN _sk_gather_a8_sse2
.globl _sk_gather_a8_sse2
@@ -66647,13 +67321,13 @@ _sk_gather_a8_sse2:
.byte 9,202 // or %ecx,%edx
.byte 102,15,196,194,0 // pinsrw $0x0,%edx,%xmm0
.byte 102,15,196,199,1 // pinsrw $0x1,%edi,%xmm0
- .byte 232,0,0,0,0 // call 3d40 <_sk_gather_a8_sse2+0x85>
+ .byte 232,0,0,0,0 // call 3ebf <_sk_gather_a8_sse2+0x85>
.byte 89 // pop %ecx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,153,128,95,0,0 // mulps 0x5f80(%ecx),%xmm3
+ .byte 15,89,153,241,95,0,0 // mulps 0x5ff1(%ecx),%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -66678,7 +67352,7 @@ _sk_store_a8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
- .byte 232,0,0,0,0 // call 3d84 <_sk_store_a8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3f03 <_sk_store_a8_sse2+0xe>
.byte 94 // pop %esi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -66687,7 +67361,7 @@ _sk_store_a8_sse2:
.byte 15,175,81,4 // imul 0x4(%ecx),%edx
.byte 3,23 // add (%edi),%edx
.byte 139,89,8 // mov 0x8(%ecx),%ebx
- .byte 15,40,166,76,95,0,0 // movaps 0x5f4c(%esi),%xmm4
+ .byte 15,40,166,189,95,0,0 // movaps 0x5fbd(%esi),%xmm4
.byte 15,89,227 // mulps %xmm3,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
.byte 102,15,114,244,16 // pslld $0x10,%xmm4
@@ -66696,7 +67370,7 @@ _sk_store_a8_sse2:
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,26 // jne 3dd9 <_sk_store_a8_sse2+0x63>
+ .byte 117,26 // jne 3f58 <_sk_store_a8_sse2+0x63>
.byte 102,15,126,230 // movd %xmm4,%esi
.byte 137,52,58 // mov %esi,(%edx,%edi,1)
.byte 141,80,8 // lea 0x8(%eax),%edx
@@ -66714,26 +67388,26 @@ _sk_store_a8_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,57 // je 3e22 <_sk_store_a8_sse2+0xac>
+ .byte 116,57 // je 3fa1 <_sk_store_a8_sse2+0xac>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,17 // je 3dff <_sk_store_a8_sse2+0x89>
+ .byte 116,17 // je 3f7e <_sk_store_a8_sse2+0x89>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,211 // jne 3dc6 <_sk_store_a8_sse2+0x50>
+ .byte 117,211 // jne 3f45 <_sk_store_a8_sse2+0x50>
.byte 102,15,127,101,200 // movdqa %xmm4,-0x38(%ebp)
.byte 138,93,208 // mov -0x30(%ebp),%bl
.byte 136,92,58,2 // mov %bl,0x2(%edx,%edi,1)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
- .byte 102,15,219,166,92,95,0,0 // pand 0x5f5c(%esi),%xmm4
+ .byte 102,15,219,166,205,95,0,0 // pand 0x5fcd(%esi),%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,126,230 // movd %xmm4,%esi
.byte 102,137,52,58 // mov %si,(%edx,%edi,1)
- .byte 235,164 // jmp 3dc6 <_sk_store_a8_sse2+0x50>
+ .byte 235,164 // jmp 3f45 <_sk_store_a8_sse2+0x50>
.byte 102,15,127,101,216 // movdqa %xmm4,-0x28(%ebp)
.byte 138,93,216 // mov -0x28(%ebp),%bl
.byte 136,28,58 // mov %bl,(%edx,%edi,1)
- .byte 235,151 // jmp 3dc6 <_sk_store_a8_sse2+0x50>
+ .byte 235,151 // jmp 3f45 <_sk_store_a8_sse2+0x50>
HIDDEN _sk_load_g8_sse2
.globl _sk_load_g8_sse2
@@ -66745,7 +67419,7 @@ _sk_load_g8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3e3d <_sk_load_g8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3fbc <_sk_load_g8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -66756,16 +67430,16 @@ _sk_load_g8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,63 // jne 3e97 <_sk_load_g8_sse2+0x68>
+ .byte 117,63 // jne 4016 <_sk_load_g8_sse2+0x68>
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,130,179,94,0,0 // pand 0x5eb3(%edx),%xmm0
+ .byte 102,15,219,130,36,95,0,0 // pand 0x5f24(%edx),%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,195,94,0,0 // mulps 0x5ec3(%edx),%xmm0
+ .byte 15,89,130,52,95,0,0 // mulps 0x5f34(%edx),%xmm0
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,211,94,0,0 // movaps 0x5ed3(%edx),%xmm3
+ .byte 15,40,154,68,95,0,0 // movaps 0x5f44(%edx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 86 // push %esi
@@ -66779,12 +67453,12 @@ _sk_load_g8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 3ed1 <_sk_load_g8_sse2+0xa2>
+ .byte 116,50 // je 4050 <_sk_load_g8_sse2+0xa2>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3ebb <_sk_load_g8_sse2+0x8c>
+ .byte 116,19 // je 403a <_sk_load_g8_sse2+0x8c>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,184 // jne 3e65 <_sk_load_g8_sse2+0x36>
+ .byte 117,184 // jne 3fe4 <_sk_load_g8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -66793,10 +67467,10 @@ _sk_load_g8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,148 // jmp 3e65 <_sk_load_g8_sse2+0x36>
+ .byte 235,148 // jmp 3fe4 <_sk_load_g8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,198 // movd %esi,%xmm0
- .byte 235,138 // jmp 3e65 <_sk_load_g8_sse2+0x36>
+ .byte 235,138 // jmp 3fe4 <_sk_load_g8_sse2+0x36>
HIDDEN _sk_load_g8_dst_sse2
.globl _sk_load_g8_dst_sse2
@@ -66808,7 +67482,7 @@ _sk_load_g8_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3ee9 <_sk_load_g8_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4068 <_sk_load_g8_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -66819,17 +67493,17 @@ _sk_load_g8_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,73 // jne 3f4d <_sk_load_g8_dst_sse2+0x72>
+ .byte 117,73 // jne 40cc <_sk_load_g8_dst_sse2+0x72>
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,55,94,0,0 // pand 0x5e37(%edx),%xmm4
+ .byte 102,15,219,162,168,94,0,0 // pand 0x5ea8(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,71,94,0,0 // mulps 0x5e47(%edx),%xmm4
+ .byte 15,89,162,184,94,0,0 // mulps 0x5eb8(%edx),%xmm4
.byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
.byte 15,41,97,32 // movaps %xmm4,0x20(%ecx)
.byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
- .byte 15,40,162,87,94,0,0 // movaps 0x5e57(%edx),%xmm4
+ .byte 15,40,162,200,94,0,0 // movaps 0x5ec8(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -66844,12 +67518,12 @@ _sk_load_g8_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 3f87 <_sk_load_g8_dst_sse2+0xac>
+ .byte 116,50 // je 4106 <_sk_load_g8_dst_sse2+0xac>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3f71 <_sk_load_g8_dst_sse2+0x96>
+ .byte 116,19 // je 40f0 <_sk_load_g8_dst_sse2+0x96>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,174 // jne 3f11 <_sk_load_g8_dst_sse2+0x36>
+ .byte 117,174 // jne 4090 <_sk_load_g8_dst_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -66858,10 +67532,10 @@ _sk_load_g8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,138 // jmp 3f11 <_sk_load_g8_dst_sse2+0x36>
+ .byte 235,138 // jmp 4090 <_sk_load_g8_dst_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 235,128 // jmp 3f11 <_sk_load_g8_dst_sse2+0x36>
+ .byte 235,128 // jmp 4090 <_sk_load_g8_dst_sse2+0x36>
HIDDEN _sk_gather_g8_sse2
.globl _sk_gather_g8_sse2
@@ -66901,17 +67575,17 @@ _sk_gather_g8_sse2:
.byte 193,226,8 // shl $0x8,%edx
.byte 9,202 // or %ecx,%edx
.byte 102,15,196,194,0 // pinsrw $0x0,%edx,%xmm0
- .byte 232,0,0,0,0 // call 4011 <_sk_gather_g8_sse2+0x80>
+ .byte 232,0,0,0,0 // call 4190 <_sk_gather_g8_sse2+0x80>
.byte 89 // pop %ecx
.byte 102,15,196,199,1 // pinsrw $0x1,%edi,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,129,63,93,0,0 // mulps 0x5d3f(%ecx),%xmm0
+ .byte 15,89,129,176,93,0,0 // mulps 0x5db0(%ecx),%xmm0
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,153,79,93,0,0 // movaps 0x5d4f(%ecx),%xmm3
+ .byte 15,40,153,192,93,0,0 // movaps 0x5dc0(%ecx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 82 // push %edx
@@ -66933,7 +67607,7 @@ _sk_load_565_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 405c <_sk_load_565_sse2+0xe>
+ .byte 232,0,0,0,0 // call 41db <_sk_load_565_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -66945,23 +67619,23 @@ _sk_load_565_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,97 // jne 40da <_sk_load_565_sse2+0x8c>
+ .byte 117,97 // jne 4259 <_sk_load_565_sse2+0x8c>
.byte 243,15,126,20,126 // movq (%esi,%edi,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,130,20,93,0,0 // movdqa 0x5d14(%edx),%xmm0
+ .byte 102,15,111,130,133,93,0,0 // movdqa 0x5d85(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,36,93,0,0 // mulps 0x5d24(%edx),%xmm0
- .byte 102,15,111,138,52,93,0,0 // movdqa 0x5d34(%edx),%xmm1
+ .byte 15,89,130,149,93,0,0 // mulps 0x5d95(%edx),%xmm0
+ .byte 102,15,111,138,165,93,0,0 // movdqa 0x5da5(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,68,93,0,0 // mulps 0x5d44(%edx),%xmm1
- .byte 102,15,219,146,84,93,0,0 // pand 0x5d54(%edx),%xmm2
+ .byte 15,89,138,181,93,0,0 // mulps 0x5db5(%edx),%xmm1
+ .byte 102,15,219,146,197,93,0,0 // pand 0x5dc5(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,100,93,0,0 // mulps 0x5d64(%edx),%xmm2
+ .byte 15,89,146,213,93,0,0 // mulps 0x5dd5(%edx),%xmm2
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,116,93,0,0 // movaps 0x5d74(%edx),%xmm3
+ .byte 15,40,154,229,93,0,0 // movaps 0x5de5(%edx),%xmm3
.byte 86 // push %esi
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
@@ -66973,22 +67647,22 @@ _sk_load_565_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 4110 <_sk_load_565_sse2+0xc2>
+ .byte 116,46 // je 428f <_sk_load_565_sse2+0xc2>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 40fe <_sk_load_565_sse2+0xb0>
+ .byte 116,19 // je 427d <_sk_load_565_sse2+0xb0>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,146 // jne 4082 <_sk_load_565_sse2+0x34>
+ .byte 117,146 // jne 4201 <_sk_load_565_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,15,110,4,126 // movd (%esi,%edi,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,208 // movsd %xmm0,%xmm2
- .byte 233,114,255,255,255 // jmp 4082 <_sk_load_565_sse2+0x34>
+ .byte 233,114,255,255,255 // jmp 4201 <_sk_load_565_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,214 // movd %esi,%xmm2
- .byte 233,101,255,255,255 // jmp 4082 <_sk_load_565_sse2+0x34>
+ .byte 233,101,255,255,255 // jmp 4201 <_sk_load_565_sse2+0x34>
HIDDEN _sk_load_565_dst_sse2
.globl _sk_load_565_dst_sse2
@@ -67000,7 +67674,7 @@ _sk_load_565_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 412b <_sk_load_565_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 42aa <_sk_load_565_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67012,24 +67686,24 @@ _sk_load_565_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,113 // jne 41b9 <_sk_load_565_dst_sse2+0x9c>
+ .byte 117,113 // jne 4338 <_sk_load_565_dst_sse2+0x9c>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,181,92,0,0 // movdqa 0x5cb5(%edx),%xmm5
+ .byte 102,15,111,170,38,93,0,0 // movdqa 0x5d26(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,197,92,0,0 // mulps 0x5cc5(%edx),%xmm5
+ .byte 15,89,170,54,93,0,0 // mulps 0x5d36(%edx),%xmm5
.byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
- .byte 102,15,111,170,213,92,0,0 // movdqa 0x5cd5(%edx),%xmm5
+ .byte 102,15,111,170,70,93,0,0 // movdqa 0x5d46(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,229,92,0,0 // mulps 0x5ce5(%edx),%xmm5
+ .byte 15,89,170,86,93,0,0 // mulps 0x5d56(%edx),%xmm5
.byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
- .byte 102,15,219,162,245,92,0,0 // pand 0x5cf5(%edx),%xmm4
+ .byte 102,15,219,162,102,93,0,0 // pand 0x5d66(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,5,93,0,0 // mulps 0x5d05(%edx),%xmm4
+ .byte 15,89,162,118,93,0,0 // mulps 0x5d76(%edx),%xmm4
.byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
- .byte 15,40,162,21,93,0,0 // movaps 0x5d15(%edx),%xmm4
+ .byte 15,40,162,134,93,0,0 // movaps 0x5d86(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -67044,22 +67718,22 @@ _sk_load_565_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 41ef <_sk_load_565_dst_sse2+0xd2>
+ .byte 116,46 // je 436e <_sk_load_565_dst_sse2+0xd2>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 41dd <_sk_load_565_dst_sse2+0xc0>
+ .byte 116,19 // je 435c <_sk_load_565_dst_sse2+0xc0>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,130 // jne 4151 <_sk_load_565_dst_sse2+0x34>
+ .byte 117,130 // jne 42d0 <_sk_load_565_dst_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,110,44,126 // movd (%esi,%edi,2),%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,98,255,255,255 // jmp 4151 <_sk_load_565_dst_sse2+0x34>
+ .byte 233,98,255,255,255 // jmp 42d0 <_sk_load_565_dst_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 233,85,255,255,255 // jmp 4151 <_sk_load_565_dst_sse2+0x34>
+ .byte 233,85,255,255,255 // jmp 42d0 <_sk_load_565_dst_sse2+0x34>
HIDDEN _sk_gather_565_sse2
.globl _sk_gather_565_sse2
@@ -67094,25 +67768,25 @@ _sk_gather_565_sse2:
.byte 102,15,196,209,2 // pinsrw $0x2,%ecx,%xmm2
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx
- .byte 232,0,0,0,0 // call 4277 <_sk_gather_565_sse2+0x7b>
+ .byte 232,0,0,0,0 // call 43f6 <_sk_gather_565_sse2+0x7b>
.byte 90 // pop %edx
.byte 102,15,196,209,3 // pinsrw $0x3,%ecx,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,130,217,91,0,0 // movdqa 0x5bd9(%edx),%xmm0
+ .byte 102,15,111,130,74,92,0,0 // movdqa 0x5c4a(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,233,91,0,0 // mulps 0x5be9(%edx),%xmm0
- .byte 102,15,111,138,249,91,0,0 // movdqa 0x5bf9(%edx),%xmm1
+ .byte 15,89,130,90,92,0,0 // mulps 0x5c5a(%edx),%xmm0
+ .byte 102,15,111,138,106,92,0,0 // movdqa 0x5c6a(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,9,92,0,0 // mulps 0x5c09(%edx),%xmm1
- .byte 102,15,219,146,25,92,0,0 // pand 0x5c19(%edx),%xmm2
+ .byte 15,89,138,122,92,0,0 // mulps 0x5c7a(%edx),%xmm1
+ .byte 102,15,219,146,138,92,0,0 // pand 0x5c8a(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,41,92,0,0 // mulps 0x5c29(%edx),%xmm2
+ .byte 15,89,146,154,92,0,0 // mulps 0x5c9a(%edx),%xmm2
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,57,92,0,0 // movaps 0x5c39(%edx),%xmm3
+ .byte 15,40,154,170,92,0,0 // movaps 0x5caa(%edx),%xmm3
.byte 81 // push %ecx
.byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,80,4 // call *0x4(%eax)
@@ -67130,7 +67804,7 @@ _sk_store_565_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 42ea <_sk_store_565_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4469 <_sk_store_565_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67140,8 +67814,8 @@ _sk_store_565_sse2:
.byte 1,210 // add %edx,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,214,91,0,0 // movaps 0x5bd6(%edi),%xmm4
- .byte 15,40,175,230,91,0,0 // movaps 0x5be6(%edi),%xmm5
+ .byte 15,40,167,71,92,0,0 // movaps 0x5c47(%edi),%xmm4
+ .byte 15,40,175,87,92,0,0 // movaps 0x5c57(%edi),%xmm5
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,89,244 // mulps %xmm4,%xmm6
@@ -67161,7 +67835,7 @@ _sk_store_565_sse2:
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,109,236 // movd %xmm5,-0x14(%ebp)
.byte 133,219 // test %ebx,%ebx
- .byte 117,34 // jne 437e <_sk_store_565_sse2+0xa2>
+ .byte 117,34 // jne 44fd <_sk_store_565_sse2+0xa2>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,15,126,235 // movd %xmm5,%ebx
.byte 137,60,114 // mov %edi,(%edx,%esi,2)
@@ -67181,20 +67855,20 @@ _sk_store_565_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,37 // je 43b4 <_sk_store_565_sse2+0xd8>
+ .byte 116,37 // je 4533 <_sk_store_565_sse2+0xd8>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,15 // je 43a3 <_sk_store_565_sse2+0xc7>
+ .byte 116,15 // je 4522 <_sk_store_565_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,210 // jne 436b <_sk_store_565_sse2+0x8f>
+ .byte 117,210 // jne 44ea <_sk_store_565_sse2+0x8f>
.byte 102,15,197,252,4 // pextrw $0x4,%xmm4,%edi
.byte 102,137,124,114,4 // mov %di,0x4(%edx,%esi,2)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
.byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4
.byte 102,15,126,36,114 // movd %xmm4,(%edx,%esi,2)
- .byte 235,183 // jmp 436b <_sk_store_565_sse2+0x8f>
+ .byte 235,183 // jmp 44ea <_sk_store_565_sse2+0x8f>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,137,60,114 // mov %di,(%edx,%esi,2)
- .byte 235,173 // jmp 436b <_sk_store_565_sse2+0x8f>
+ .byte 235,173 // jmp 44ea <_sk_store_565_sse2+0x8f>
HIDDEN _sk_load_4444_sse2
.globl _sk_load_4444_sse2
@@ -67206,7 +67880,7 @@ _sk_load_4444_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 43cc <_sk_load_4444_sse2+0xe>
+ .byte 232,0,0,0,0 // call 454b <_sk_load_4444_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67218,24 +67892,24 @@ _sk_load_4444_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,112 // jne 4459 <_sk_load_4444_sse2+0x9b>
+ .byte 117,112 // jne 45d8 <_sk_load_4444_sse2+0x9b>
.byte 243,15,126,28,126 // movq (%esi,%edi,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,130,20,91,0,0 // movdqa 0x5b14(%edx),%xmm0
+ .byte 102,15,111,130,133,91,0,0 // movdqa 0x5b85(%edx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,36,91,0,0 // mulps 0x5b24(%edx),%xmm0
- .byte 102,15,111,138,52,91,0,0 // movdqa 0x5b34(%edx),%xmm1
+ .byte 15,89,130,149,91,0,0 // mulps 0x5b95(%edx),%xmm0
+ .byte 102,15,111,138,165,91,0,0 // movdqa 0x5ba5(%edx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,68,91,0,0 // mulps 0x5b44(%edx),%xmm1
- .byte 102,15,111,146,84,91,0,0 // movdqa 0x5b54(%edx),%xmm2
+ .byte 15,89,138,181,91,0,0 // mulps 0x5bb5(%edx),%xmm1
+ .byte 102,15,111,146,197,91,0,0 // movdqa 0x5bc5(%edx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,100,91,0,0 // mulps 0x5b64(%edx),%xmm2
- .byte 102,15,219,154,116,91,0,0 // pand 0x5b74(%edx),%xmm3
+ .byte 15,89,146,213,91,0,0 // mulps 0x5bd5(%edx),%xmm2
+ .byte 102,15,219,154,229,91,0,0 // pand 0x5be5(%edx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,132,91,0,0 // mulps 0x5b84(%edx),%xmm3
+ .byte 15,89,154,245,91,0,0 // mulps 0x5bf5(%edx),%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
.byte 82 // push %edx
@@ -67249,22 +67923,22 @@ _sk_load_4444_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 448f <_sk_load_4444_sse2+0xd1>
+ .byte 116,46 // je 460e <_sk_load_4444_sse2+0xd1>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 447d <_sk_load_4444_sse2+0xbf>
+ .byte 116,19 // je 45fc <_sk_load_4444_sse2+0xbf>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,131 // jne 43f2 <_sk_load_4444_sse2+0x34>
+ .byte 117,131 // jne 4571 <_sk_load_4444_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,110,4,126 // movd (%esi,%edi,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,216 // movsd %xmm0,%xmm3
- .byte 233,99,255,255,255 // jmp 43f2 <_sk_load_4444_sse2+0x34>
+ .byte 233,99,255,255,255 // jmp 4571 <_sk_load_4444_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,222 // movd %esi,%xmm3
- .byte 233,86,255,255,255 // jmp 43f2 <_sk_load_4444_sse2+0x34>
+ .byte 233,86,255,255,255 // jmp 4571 <_sk_load_4444_sse2+0x34>
HIDDEN _sk_load_4444_dst_sse2
.globl _sk_load_4444_dst_sse2
@@ -67276,7 +67950,7 @@ _sk_load_4444_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 44aa <_sk_load_4444_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4629 <_sk_load_4444_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67288,27 +67962,27 @@ _sk_load_4444_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,128,0,0,0 // jne 454b <_sk_load_4444_dst_sse2+0xaf>
+ .byte 15,133,128,0,0,0 // jne 46ca <_sk_load_4444_dst_sse2+0xaf>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,182,90,0,0 // movdqa 0x5ab6(%edx),%xmm5
+ .byte 102,15,111,170,39,91,0,0 // movdqa 0x5b27(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,198,90,0,0 // mulps 0x5ac6(%edx),%xmm5
+ .byte 15,89,170,55,91,0,0 // mulps 0x5b37(%edx),%xmm5
.byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
- .byte 102,15,111,170,214,90,0,0 // movdqa 0x5ad6(%edx),%xmm5
+ .byte 102,15,111,170,71,91,0,0 // movdqa 0x5b47(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,230,90,0,0 // mulps 0x5ae6(%edx),%xmm5
+ .byte 15,89,170,87,91,0,0 // mulps 0x5b57(%edx),%xmm5
.byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
- .byte 102,15,111,170,246,90,0,0 // movdqa 0x5af6(%edx),%xmm5
+ .byte 102,15,111,170,103,91,0,0 // movdqa 0x5b67(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,6,91,0,0 // mulps 0x5b06(%edx),%xmm5
+ .byte 15,89,170,119,91,0,0 // mulps 0x5b77(%edx),%xmm5
.byte 15,41,105,48 // movaps %xmm5,0x30(%ecx)
- .byte 102,15,219,162,22,91,0,0 // pand 0x5b16(%edx),%xmm4
+ .byte 102,15,219,162,135,91,0,0 // pand 0x5b87(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,38,91,0,0 // mulps 0x5b26(%edx),%xmm4
+ .byte 15,89,162,151,91,0,0 // mulps 0x5b97(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -67323,22 +67997,22 @@ _sk_load_4444_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 4585 <_sk_load_4444_dst_sse2+0xe9>
+ .byte 116,50 // je 4704 <_sk_load_4444_dst_sse2+0xe9>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,23 // je 4573 <_sk_load_4444_dst_sse2+0xd7>
+ .byte 116,23 // je 46f2 <_sk_load_4444_dst_sse2+0xd7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,111,255,255,255 // jne 44d4 <_sk_load_4444_dst_sse2+0x38>
+ .byte 15,133,111,255,255,255 // jne 4653 <_sk_load_4444_dst_sse2+0x38>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,110,44,126 // movd (%esi,%edi,2),%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,79,255,255,255 // jmp 44d4 <_sk_load_4444_dst_sse2+0x38>
+ .byte 233,79,255,255,255 // jmp 4653 <_sk_load_4444_dst_sse2+0x38>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 233,66,255,255,255 // jmp 44d4 <_sk_load_4444_dst_sse2+0x38>
+ .byte 233,66,255,255,255 // jmp 4653 <_sk_load_4444_dst_sse2+0x38>
HIDDEN _sk_gather_4444_sse2
.globl _sk_gather_4444_sse2
@@ -67374,25 +68048,25 @@ _sk_gather_4444_sse2:
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx
.byte 102,15,196,217,3 // pinsrw $0x3,%ecx,%xmm3
- .byte 232,0,0,0,0 // call 4612 <_sk_gather_4444_sse2+0x80>
+ .byte 232,0,0,0,0 // call 4791 <_sk_gather_4444_sse2+0x80>
.byte 89 // pop %ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,129,206,89,0,0 // movdqa 0x59ce(%ecx),%xmm0
+ .byte 102,15,111,129,63,90,0,0 // movdqa 0x5a3f(%ecx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,129,222,89,0,0 // mulps 0x59de(%ecx),%xmm0
- .byte 102,15,111,137,238,89,0,0 // movdqa 0x59ee(%ecx),%xmm1
+ .byte 15,89,129,79,90,0,0 // mulps 0x5a4f(%ecx),%xmm0
+ .byte 102,15,111,137,95,90,0,0 // movdqa 0x5a5f(%ecx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,137,254,89,0,0 // mulps 0x59fe(%ecx),%xmm1
- .byte 102,15,111,145,14,90,0,0 // movdqa 0x5a0e(%ecx),%xmm2
+ .byte 15,89,137,111,90,0,0 // mulps 0x5a6f(%ecx),%xmm1
+ .byte 102,15,111,145,127,90,0,0 // movdqa 0x5a7f(%ecx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,145,30,90,0,0 // mulps 0x5a1e(%ecx),%xmm2
- .byte 102,15,219,153,46,90,0,0 // pand 0x5a2e(%ecx),%xmm3
+ .byte 15,89,145,143,90,0,0 // mulps 0x5a8f(%ecx),%xmm2
+ .byte 102,15,219,153,159,90,0,0 // pand 0x5a9f(%ecx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,153,62,90,0,0 // mulps 0x5a3e(%ecx),%xmm3
+ .byte 15,89,153,175,90,0,0 // mulps 0x5aaf(%ecx),%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
.byte 81 // push %ecx
@@ -67412,7 +68086,7 @@ _sk_store_4444_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 468f <_sk_store_4444_sse2+0xe>
+ .byte 232,0,0,0,0 // call 480e <_sk_store_4444_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67422,7 +68096,7 @@ _sk_store_4444_sse2:
.byte 1,210 // add %edx,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,209,89,0,0 // movaps 0x59d1(%edi),%xmm4
+ .byte 15,40,167,66,90,0,0 // movaps 0x5a42(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -67448,7 +68122,7 @@ _sk_store_4444_sse2:
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,109,236 // movd %xmm5,-0x14(%ebp)
.byte 133,219 // test %ebx,%ebx
- .byte 117,34 // jne 4732 <_sk_store_4444_sse2+0xb1>
+ .byte 117,34 // jne 48b1 <_sk_store_4444_sse2+0xb1>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,15,126,235 // movd %xmm5,%ebx
.byte 137,60,114 // mov %edi,(%edx,%esi,2)
@@ -67468,20 +68142,20 @@ _sk_store_4444_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,37 // je 4768 <_sk_store_4444_sse2+0xe7>
+ .byte 116,37 // je 48e7 <_sk_store_4444_sse2+0xe7>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,15 // je 4757 <_sk_store_4444_sse2+0xd6>
+ .byte 116,15 // je 48d6 <_sk_store_4444_sse2+0xd6>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,210 // jne 471f <_sk_store_4444_sse2+0x9e>
+ .byte 117,210 // jne 489e <_sk_store_4444_sse2+0x9e>
.byte 102,15,197,252,4 // pextrw $0x4,%xmm4,%edi
.byte 102,137,124,114,4 // mov %di,0x4(%edx,%esi,2)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
.byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4
.byte 102,15,126,36,114 // movd %xmm4,(%edx,%esi,2)
- .byte 235,183 // jmp 471f <_sk_store_4444_sse2+0x9e>
+ .byte 235,183 // jmp 489e <_sk_store_4444_sse2+0x9e>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,137,60,114 // mov %di,(%edx,%esi,2)
- .byte 235,173 // jmp 471f <_sk_store_4444_sse2+0x9e>
+ .byte 235,173 // jmp 489e <_sk_store_4444_sse2+0x9e>
HIDDEN _sk_load_8888_sse2
.globl _sk_load_8888_sse2
@@ -67493,7 +68167,7 @@ _sk_load_8888_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4780 <_sk_load_8888_sse2+0xe>
+ .byte 232,0,0,0,0 // call 48ff <_sk_load_8888_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67505,13 +68179,13 @@ _sk_load_8888_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,102 // jne 4804 <_sk_load_8888_sse2+0x92>
+ .byte 117,102 // jne 4983 <_sk_load_8888_sse2+0x92>
.byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
- .byte 102,15,111,146,240,88,0,0 // movdqa 0x58f0(%edx),%xmm2
+ .byte 102,15,111,146,97,89,0,0 // movdqa 0x5961(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,162,0,89,0,0 // movaps 0x5900(%edx),%xmm4
+ .byte 15,40,162,113,89,0,0 // movaps 0x5971(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -67539,18 +68213,18 @@ _sk_load_8888_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,35 // je 482f <_sk_load_8888_sse2+0xbd>
+ .byte 116,35 // je 49ae <_sk_load_8888_sse2+0xbd>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4825 <_sk_load_8888_sse2+0xb3>
+ .byte 116,16 // je 49a4 <_sk_load_8888_sse2+0xb3>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,137 // jne 47a3 <_sk_load_8888_sse2+0x31>
+ .byte 117,137 // jne 4922 <_sk_load_8888_sse2+0x31>
.byte 102,15,110,68,190,8 // movd 0x8(%esi,%edi,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,18,28,190 // movlpd (%esi,%edi,4),%xmm3
- .byte 233,116,255,255,255 // jmp 47a3 <_sk_load_8888_sse2+0x31>
+ .byte 233,116,255,255,255 // jmp 4922 <_sk_load_8888_sse2+0x31>
.byte 102,15,110,28,190 // movd (%esi,%edi,4),%xmm3
- .byte 233,106,255,255,255 // jmp 47a3 <_sk_load_8888_sse2+0x31>
+ .byte 233,106,255,255,255 // jmp 4922 <_sk_load_8888_sse2+0x31>
HIDDEN _sk_load_8888_dst_sse2
.globl _sk_load_8888_dst_sse2
@@ -67562,7 +68236,7 @@ _sk_load_8888_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4847 <_sk_load_8888_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 49c6 <_sk_load_8888_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67574,13 +68248,13 @@ _sk_load_8888_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,118 // jne 48db <_sk_load_8888_dst_sse2+0xa2>
+ .byte 117,118 // jne 4a5a <_sk_load_8888_dst_sse2+0xa2>
.byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
- .byte 102,15,111,170,73,88,0,0 // movdqa 0x5849(%edx),%xmm5
+ .byte 102,15,111,170,186,88,0,0 // movdqa 0x58ba(%edx),%xmm5
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,186,89,88,0,0 // movaps 0x5859(%edx),%xmm7
+ .byte 15,40,186,202,88,0,0 // movaps 0x58ca(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
.byte 15,41,113,16 // movaps %xmm6,0x10(%ecx)
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
@@ -67612,18 +68286,18 @@ _sk_load_8888_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,39 // je 490a <_sk_load_8888_dst_sse2+0xd1>
+ .byte 116,39 // je 4a89 <_sk_load_8888_dst_sse2+0xd1>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,20 // je 4900 <_sk_load_8888_dst_sse2+0xc7>
+ .byte 116,20 // je 4a7f <_sk_load_8888_dst_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,117,255,255,255 // jne 486a <_sk_load_8888_dst_sse2+0x31>
+ .byte 15,133,117,255,255,255 // jne 49e9 <_sk_load_8888_dst_sse2+0x31>
.byte 102,15,110,100,190,8 // movd 0x8(%esi,%edi,4),%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,18,36,190 // movlpd (%esi,%edi,4),%xmm4
- .byte 233,96,255,255,255 // jmp 486a <_sk_load_8888_dst_sse2+0x31>
+ .byte 233,96,255,255,255 // jmp 49e9 <_sk_load_8888_dst_sse2+0x31>
.byte 102,15,110,36,190 // movd (%esi,%edi,4),%xmm4
- .byte 233,86,255,255,255 // jmp 486a <_sk_load_8888_dst_sse2+0x31>
+ .byte 233,86,255,255,255 // jmp 49e9 <_sk_load_8888_dst_sse2+0x31>
HIDDEN _sk_gather_8888_sse2
.globl _sk_gather_8888_sse2
@@ -67657,16 +68331,16 @@ _sk_gather_8888_sse2:
.byte 102,15,110,28,138 // movd (%edx,%ecx,4),%xmm3
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,110,4,138 // movd (%edx,%ecx,4),%xmm0
- .byte 232,0,0,0,0 // call 498a <_sk_gather_8888_sse2+0x76>
+ .byte 232,0,0,0,0 // call 4b09 <_sk_gather_8888_sse2+0x76>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,145,38,87,0,0 // movdqa 0x5726(%ecx),%xmm2
+ .byte 102,15,111,145,151,87,0,0 // movdqa 0x5797(%ecx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,161,54,87,0,0 // movaps 0x5736(%ecx),%xmm4
+ .byte 15,40,161,167,87,0,0 // movaps 0x57a7(%ecx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -67700,7 +68374,7 @@ _sk_store_8888_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4a05 <_sk_store_8888_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4b84 <_sk_store_8888_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67710,7 +68384,7 @@ _sk_store_8888_sse2:
.byte 193,226,2 // shl $0x2,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,203,86,0,0 // movaps 0x56cb(%edi),%xmm4
+ .byte 15,40,167,60,87,0,0 // movaps 0x573c(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -67730,7 +68404,7 @@ _sk_store_8888_sse2:
.byte 102,15,235,229 // por %xmm5,%xmm4
.byte 102,15,235,230 // por %xmm6,%xmm4
.byte 133,219 // test %ebx,%ebx
- .byte 117,24 // jne 4a82 <_sk_store_8888_sse2+0x8b>
+ .byte 117,24 // jne 4c01 <_sk_store_8888_sse2+0x8b>
.byte 243,15,127,36,178 // movdqu %xmm4,(%edx,%esi,4)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -67745,17 +68419,17 @@ _sk_store_8888_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,28 // je 4aa6 <_sk_store_8888_sse2+0xaf>
+ .byte 116,28 // je 4c25 <_sk_store_8888_sse2+0xaf>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4a9f <_sk_store_8888_sse2+0xa8>
+ .byte 116,16 // je 4c1e <_sk_store_8888_sse2+0xa8>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,219 // jne 4a6f <_sk_store_8888_sse2+0x78>
+ .byte 117,219 // jne 4bee <_sk_store_8888_sse2+0x78>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,15,126,108,178,8 // movd %xmm5,0x8(%edx,%esi,4)
.byte 102,15,214,36,178 // movq %xmm4,(%edx,%esi,4)
- .byte 235,201 // jmp 4a6f <_sk_store_8888_sse2+0x78>
+ .byte 235,201 // jmp 4bee <_sk_store_8888_sse2+0x78>
.byte 102,15,126,36,178 // movd %xmm4,(%edx,%esi,4)
- .byte 235,194 // jmp 4a6f <_sk_store_8888_sse2+0x78>
+ .byte 235,194 // jmp 4bee <_sk_store_8888_sse2+0x78>
HIDDEN _sk_load_bgra_sse2
.globl _sk_load_bgra_sse2
@@ -67767,7 +68441,7 @@ _sk_load_bgra_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4abb <_sk_load_bgra_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4c3a <_sk_load_bgra_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67779,13 +68453,13 @@ _sk_load_bgra_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,102 // jne 4b3f <_sk_load_bgra_sse2+0x92>
+ .byte 117,102 // jne 4cbe <_sk_load_bgra_sse2+0x92>
.byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
- .byte 102,15,111,130,37,86,0,0 // movdqa 0x5625(%edx),%xmm0
+ .byte 102,15,111,130,150,86,0,0 // movdqa 0x5696(%edx),%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,162,53,86,0,0 // movaps 0x5635(%edx),%xmm4
+ .byte 15,40,162,166,86,0,0 // movaps 0x56a6(%edx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -67813,18 +68487,18 @@ _sk_load_bgra_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,35 // je 4b6a <_sk_load_bgra_sse2+0xbd>
+ .byte 116,35 // je 4ce9 <_sk_load_bgra_sse2+0xbd>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4b60 <_sk_load_bgra_sse2+0xb3>
+ .byte 116,16 // je 4cdf <_sk_load_bgra_sse2+0xb3>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,137 // jne 4ade <_sk_load_bgra_sse2+0x31>
+ .byte 117,137 // jne 4c5d <_sk_load_bgra_sse2+0x31>
.byte 102,15,110,68,190,8 // movd 0x8(%esi,%edi,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,18,28,190 // movlpd (%esi,%edi,4),%xmm3
- .byte 233,116,255,255,255 // jmp 4ade <_sk_load_bgra_sse2+0x31>
+ .byte 233,116,255,255,255 // jmp 4c5d <_sk_load_bgra_sse2+0x31>
.byte 102,15,110,28,190 // movd (%esi,%edi,4),%xmm3
- .byte 233,106,255,255,255 // jmp 4ade <_sk_load_bgra_sse2+0x31>
+ .byte 233,106,255,255,255 // jmp 4c5d <_sk_load_bgra_sse2+0x31>
HIDDEN _sk_load_bgra_dst_sse2
.globl _sk_load_bgra_dst_sse2
@@ -67836,7 +68510,7 @@ _sk_load_bgra_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4b82 <_sk_load_bgra_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4d01 <_sk_load_bgra_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67848,13 +68522,13 @@ _sk_load_bgra_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,118 // jne 4c16 <_sk_load_bgra_dst_sse2+0xa2>
+ .byte 117,118 // jne 4d95 <_sk_load_bgra_dst_sse2+0xa2>
.byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
- .byte 102,15,111,170,126,85,0,0 // movdqa 0x557e(%edx),%xmm5
+ .byte 102,15,111,170,239,85,0,0 // movdqa 0x55ef(%edx),%xmm5
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,186,142,85,0,0 // movaps 0x558e(%edx),%xmm7
+ .byte 15,40,186,255,85,0,0 // movaps 0x55ff(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
.byte 15,41,113,48 // movaps %xmm6,0x30(%ecx)
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
@@ -67886,18 +68560,18 @@ _sk_load_bgra_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,39 // je 4c45 <_sk_load_bgra_dst_sse2+0xd1>
+ .byte 116,39 // je 4dc4 <_sk_load_bgra_dst_sse2+0xd1>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,20 // je 4c3b <_sk_load_bgra_dst_sse2+0xc7>
+ .byte 116,20 // je 4dba <_sk_load_bgra_dst_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,117,255,255,255 // jne 4ba5 <_sk_load_bgra_dst_sse2+0x31>
+ .byte 15,133,117,255,255,255 // jne 4d24 <_sk_load_bgra_dst_sse2+0x31>
.byte 102,15,110,100,190,8 // movd 0x8(%esi,%edi,4),%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,18,36,190 // movlpd (%esi,%edi,4),%xmm4
- .byte 233,96,255,255,255 // jmp 4ba5 <_sk_load_bgra_dst_sse2+0x31>
+ .byte 233,96,255,255,255 // jmp 4d24 <_sk_load_bgra_dst_sse2+0x31>
.byte 102,15,110,36,190 // movd (%esi,%edi,4),%xmm4
- .byte 233,86,255,255,255 // jmp 4ba5 <_sk_load_bgra_dst_sse2+0x31>
+ .byte 233,86,255,255,255 // jmp 4d24 <_sk_load_bgra_dst_sse2+0x31>
HIDDEN _sk_gather_bgra_sse2
.globl _sk_gather_bgra_sse2
@@ -67931,16 +68605,16 @@ _sk_gather_bgra_sse2:
.byte 102,15,110,28,138 // movd (%edx,%ecx,4),%xmm3
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,110,4,138 // movd (%edx,%ecx,4),%xmm0
- .byte 232,0,0,0,0 // call 4cc5 <_sk_gather_bgra_sse2+0x76>
+ .byte 232,0,0,0,0 // call 4e44 <_sk_gather_bgra_sse2+0x76>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,129,91,84,0,0 // movdqa 0x545b(%ecx),%xmm0
+ .byte 102,15,111,129,204,84,0,0 // movdqa 0x54cc(%ecx),%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,161,107,84,0,0 // movaps 0x546b(%ecx),%xmm4
+ .byte 15,40,161,220,84,0,0 // movaps 0x54dc(%ecx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -67974,7 +68648,7 @@ _sk_store_bgra_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4d40 <_sk_store_bgra_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4ebf <_sk_store_bgra_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -67984,7 +68658,7 @@ _sk_store_bgra_sse2:
.byte 193,226,2 // shl $0x2,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,0,84,0,0 // movaps 0x5400(%edi),%xmm4
+ .byte 15,40,167,113,84,0,0 // movaps 0x5471(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -68004,7 +68678,7 @@ _sk_store_bgra_sse2:
.byte 102,15,235,229 // por %xmm5,%xmm4
.byte 102,15,235,230 // por %xmm6,%xmm4
.byte 133,219 // test %ebx,%ebx
- .byte 117,24 // jne 4dbd <_sk_store_bgra_sse2+0x8b>
+ .byte 117,24 // jne 4f3c <_sk_store_bgra_sse2+0x8b>
.byte 243,15,127,36,178 // movdqu %xmm4,(%edx,%esi,4)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -68019,17 +68693,17 @@ _sk_store_bgra_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,28 // je 4de1 <_sk_store_bgra_sse2+0xaf>
+ .byte 116,28 // je 4f60 <_sk_store_bgra_sse2+0xaf>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4dda <_sk_store_bgra_sse2+0xa8>
+ .byte 116,16 // je 4f59 <_sk_store_bgra_sse2+0xa8>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,219 // jne 4daa <_sk_store_bgra_sse2+0x78>
+ .byte 117,219 // jne 4f29 <_sk_store_bgra_sse2+0x78>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,15,126,108,178,8 // movd %xmm5,0x8(%edx,%esi,4)
.byte 102,15,214,36,178 // movq %xmm4,(%edx,%esi,4)
- .byte 235,201 // jmp 4daa <_sk_store_bgra_sse2+0x78>
+ .byte 235,201 // jmp 4f29 <_sk_store_bgra_sse2+0x78>
.byte 102,15,126,36,178 // movd %xmm4,(%edx,%esi,4)
- .byte 235,194 // jmp 4daa <_sk_store_bgra_sse2+0x78>
+ .byte 235,194 // jmp 4f29 <_sk_store_bgra_sse2+0x78>
HIDDEN _sk_load_f16_sse2
.globl _sk_load_f16_sse2
@@ -68041,7 +68715,7 @@ _sk_load_f16_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,92 // sub $0x5c,%esp
- .byte 232,0,0,0,0 // call 4df6 <_sk_load_f16_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4f75 <_sk_load_f16_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -68053,7 +68727,7 @@ _sk_load_f16_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,160,1,0,0 // jne 4fb8 <_sk_load_f16_sse2+0x1d0>
+ .byte 15,133,160,1,0,0 // jne 5137 <_sk_load_f16_sse2+0x1d0>
.byte 102,15,16,4,254 // movupd (%esi,%edi,8),%xmm0
.byte 243,15,111,76,254,16 // movdqu 0x10(%esi,%edi,8),%xmm1
.byte 102,15,40,216 // movapd %xmm0,%xmm3
@@ -68081,7 +68755,7 @@ _sk_load_f16_sse2:
.byte 102,15,126,69,232 // movd %xmm0,-0x18(%ebp)
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,111,154,90,83,0,0 // movdqa 0x535a(%edx),%xmm3
+ .byte 102,15,111,154,203,83,0,0 // movdqa 0x53cb(%edx),%xmm3
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,219,227 // pand %xmm3,%xmm4
.byte 102,15,239,204 // pxor %xmm4,%xmm1
@@ -68114,15 +68788,15 @@ _sk_load_f16_sse2:
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
.byte 102,15,235,195 // por %xmm3,%xmm0
- .byte 102,15,111,154,106,83,0,0 // movdqa 0x536a(%edx),%xmm3
+ .byte 102,15,111,154,219,83,0,0 // movdqa 0x53db(%edx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
.byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,154,122,83,0,0 // movdqa 0x537a(%edx),%xmm3
+ .byte 102,15,111,154,235,83,0,0 // movdqa 0x53eb(%edx),%xmm3
.byte 102,15,127,93,184 // movdqa %xmm3,-0x48(%ebp)
.byte 102,15,239,203 // pxor %xmm3,%xmm1
- .byte 102,15,111,154,138,83,0,0 // movdqa 0x538a(%edx),%xmm3
+ .byte 102,15,111,154,251,83,0,0 // movdqa 0x53fb(%edx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,223,226 // pandn %xmm2,%xmm4
@@ -68154,12 +68828,12 @@ _sk_load_f16_sse2:
.byte 242,15,16,4,254 // movsd (%esi,%edi,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,89,254,255,255 // je 4e23 <_sk_load_f16_sse2+0x3b>
+ .byte 15,132,89,254,255,255 // je 4fa2 <_sk_load_f16_sse2+0x3b>
.byte 102,15,22,68,254,8 // movhpd 0x8(%esi,%edi,8),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,74,254,255,255 // jb 4e23 <_sk_load_f16_sse2+0x3b>
+ .byte 15,130,74,254,255,255 // jb 4fa2 <_sk_load_f16_sse2+0x3b>
.byte 243,15,126,76,254,16 // movq 0x10(%esi,%edi,8),%xmm1
- .byte 233,63,254,255,255 // jmp 4e23 <_sk_load_f16_sse2+0x3b>
+ .byte 233,63,254,255,255 // jmp 4fa2 <_sk_load_f16_sse2+0x3b>
HIDDEN _sk_load_f16_dst_sse2
.globl _sk_load_f16_dst_sse2
@@ -68175,7 +68849,7 @@ _sk_load_f16_dst_sse2:
.byte 15,41,149,120,255,255,255 // movaps %xmm2,-0x88(%ebp)
.byte 102,15,127,77,136 // movdqa %xmm1,-0x78(%ebp)
.byte 15,41,69,152 // movaps %xmm0,-0x68(%ebp)
- .byte 232,0,0,0,0 // call 500c <_sk_load_f16_dst_sse2+0x28>
+ .byte 232,0,0,0,0 // call 518b <_sk_load_f16_dst_sse2+0x28>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -68187,7 +68861,7 @@ _sk_load_f16_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,206,1,0,0 // jne 51fc <_sk_load_f16_dst_sse2+0x218>
+ .byte 15,133,206,1,0,0 // jne 537b <_sk_load_f16_dst_sse2+0x218>
.byte 102,15,16,4,254 // movupd (%esi,%edi,8),%xmm0
.byte 243,15,111,76,254,16 // movdqu 0x10(%esi,%edi,8),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -68215,7 +68889,7 @@ _sk_load_f16_dst_sse2:
.byte 102,15,126,85,232 // movd %xmm2,-0x18(%ebp)
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
- .byte 102,15,111,154,132,81,0,0 // movdqa 0x5184(%edx),%xmm3
+ .byte 102,15,111,154,245,81,0,0 // movdqa 0x51f5(%edx),%xmm3
.byte 102,15,111,212 // movdqa %xmm4,%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 102,15,239,226 // pxor %xmm2,%xmm4
@@ -68223,13 +68897,13 @@ _sk_load_f16_dst_sse2:
.byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,15,111,146,164,81,0,0 // movdqa 0x51a4(%edx),%xmm2
+ .byte 102,15,111,146,21,82,0,0 // movdqa 0x5215(%edx),%xmm2
.byte 102,15,127,85,168 // movdqa %xmm2,-0x58(%ebp)
.byte 102,15,239,226 // pxor %xmm2,%xmm4
- .byte 102,15,111,178,180,81,0,0 // movdqa 0x51b4(%edx),%xmm6
+ .byte 102,15,111,178,37,82,0,0 // movdqa 0x5225(%edx),%xmm6
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
.byte 102,15,102,252 // pcmpgtd %xmm4,%xmm7
- .byte 102,15,111,146,148,81,0,0 // movdqa 0x5194(%edx),%xmm2
+ .byte 102,15,111,146,5,82,0,0 // movdqa 0x5205(%edx),%xmm2
.byte 102,15,127,85,184 // movdqa %xmm2,-0x48(%ebp)
.byte 102,15,254,202 // paddd %xmm2,%xmm1
.byte 102,15,223,249 // pandn %xmm1,%xmm7
@@ -68297,12 +68971,12 @@ _sk_load_f16_dst_sse2:
.byte 242,15,16,4,254 // movsd (%esi,%edi,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,43,254,255,255 // je 5039 <_sk_load_f16_dst_sse2+0x55>
+ .byte 15,132,43,254,255,255 // je 51b8 <_sk_load_f16_dst_sse2+0x55>
.byte 102,15,22,68,254,8 // movhpd 0x8(%esi,%edi,8),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,28,254,255,255 // jb 5039 <_sk_load_f16_dst_sse2+0x55>
+ .byte 15,130,28,254,255,255 // jb 51b8 <_sk_load_f16_dst_sse2+0x55>
.byte 243,15,126,76,254,16 // movq 0x10(%esi,%edi,8),%xmm1
- .byte 233,17,254,255,255 // jmp 5039 <_sk_load_f16_dst_sse2+0x55>
+ .byte 233,17,254,255,255 // jmp 51b8 <_sk_load_f16_dst_sse2+0x55>
HIDDEN _sk_gather_f16_sse2
.globl _sk_gather_f16_sse2
@@ -68340,7 +69014,7 @@ _sk_gather_f16_sse2:
.byte 102,15,126,194 // movd %xmm0,%edx
.byte 102,15,110,68,209,4 // movd 0x4(%ecx,%edx,8),%xmm0
.byte 102,15,110,60,209 // movd (%ecx,%edx,8),%xmm7
- .byte 232,0,0,0,0 // call 52b6 <_sk_gather_f16_sse2+0x8e>
+ .byte 232,0,0,0,0 // call 5435 <_sk_gather_f16_sse2+0x8e>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,227 // punpckldq %xmm3,%xmm4
@@ -68373,7 +69047,7 @@ _sk_gather_f16_sse2:
.byte 102,15,126,69,248 // movd %xmm0,-0x8(%ebp)
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,111,153,26,79,0,0 // movdqa 0x4f1a(%ecx),%xmm3
+ .byte 102,15,111,153,139,79,0,0 // movdqa 0x4f8b(%ecx),%xmm3
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,219,227 // pand %xmm3,%xmm4
.byte 102,15,239,204 // pxor %xmm4,%xmm1
@@ -68406,15 +69080,15 @@ _sk_gather_f16_sse2:
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
.byte 102,15,235,195 // por %xmm3,%xmm0
- .byte 102,15,111,153,42,79,0,0 // movdqa 0x4f2a(%ecx),%xmm3
+ .byte 102,15,111,153,155,79,0,0 // movdqa 0x4f9b(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
.byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,153,58,79,0,0 // movdqa 0x4f3a(%ecx),%xmm3
+ .byte 102,15,111,153,171,79,0,0 // movdqa 0x4fab(%ecx),%xmm3
.byte 102,15,127,93,200 // movdqa %xmm3,-0x38(%ebp)
.byte 102,15,239,203 // pxor %xmm3,%xmm1
- .byte 102,15,111,153,74,79,0,0 // movdqa 0x4f4a(%ecx),%xmm3
+ .byte 102,15,111,153,187,79,0,0 // movdqa 0x4fbb(%ecx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,223,226 // pandn %xmm2,%xmm4
@@ -68453,20 +69127,20 @@ _sk_store_f16_sse2:
.byte 131,236,80 // sub $0x50,%esp
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 5479 <_sk_store_f16_sse2+0x15>
+ .byte 232,0,0,0,0 // call 55f8 <_sk_store_f16_sse2+0x15>
.byte 88 // pop %eax
- .byte 102,15,111,176,151,77,0,0 // movdqa 0x4d97(%eax),%xmm6
+ .byte 102,15,111,176,8,78,0,0 // movdqa 0x4e08(%eax),%xmm6
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,15,219,214 // pand %xmm6,%xmm2
.byte 102,15,127,69,200 // movdqa %xmm0,-0x38(%ebp)
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 102,15,239,234 // pxor %xmm2,%xmm5
- .byte 102,15,111,160,167,77,0,0 // movdqa 0x4da7(%eax),%xmm4
+ .byte 102,15,111,160,24,78,0,0 // movdqa 0x4e18(%eax),%xmm4
.byte 102,15,114,210,16 // psrld $0x10,%xmm2
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,15,102,197 // pcmpgtd %xmm5,%xmm0
.byte 102,15,114,213,13 // psrld $0xd,%xmm5
- .byte 102,15,111,184,183,77,0,0 // movdqa 0x4db7(%eax),%xmm7
+ .byte 102,15,111,184,40,78,0,0 // movdqa 0x4e28(%eax),%xmm7
.byte 102,15,254,215 // paddd %xmm7,%xmm2
.byte 102,15,127,125,232 // movdqa %xmm7,-0x18(%ebp)
.byte 102,15,254,213 // paddd %xmm5,%xmm2
@@ -68528,7 +69202,7 @@ _sk_store_f16_sse2:
.byte 3,55 // add (%edi),%esi
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,53 // jne 55eb <_sk_store_f16_sse2+0x187>
+ .byte 117,53 // jne 576a <_sk_store_f16_sse2+0x187>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,98,197 // punpckldq %xmm5,%xmm0
.byte 243,15,127,4,214 // movdqu %xmm0,(%esi,%edx,8)
@@ -68551,13 +69225,13 @@ _sk_store_f16_sse2:
.byte 102,15,98,213 // punpckldq %xmm5,%xmm2
.byte 102,15,214,20,214 // movq %xmm2,(%esi,%edx,8)
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,208 // je 55cd <_sk_store_f16_sse2+0x169>
+ .byte 116,208 // je 574c <_sk_store_f16_sse2+0x169>
.byte 102,15,23,84,214,8 // movhpd %xmm2,0x8(%esi,%edx,8)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,197 // jb 55cd <_sk_store_f16_sse2+0x169>
+ .byte 114,197 // jb 574c <_sk_store_f16_sse2+0x169>
.byte 102,15,106,205 // punpckhdq %xmm5,%xmm1
.byte 102,15,214,76,214,16 // movq %xmm1,0x10(%esi,%edx,8)
- .byte 235,185 // jmp 55cd <_sk_store_f16_sse2+0x169>
+ .byte 235,185 // jmp 574c <_sk_store_f16_sse2+0x169>
HIDDEN _sk_load_u16_be_sse2
.globl _sk_load_u16_be_sse2
@@ -68580,9 +69254,9 @@ _sk_load_u16_be_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 193,230,2 // shl $0x2,%esi
.byte 133,219 // test %ebx,%ebx
- .byte 232,0,0,0,0 // call 563f <_sk_load_u16_be_sse2+0x2b>
+ .byte 232,0,0,0,0 // call 57be <_sk_load_u16_be_sse2+0x2b>
.byte 90 // pop %edx
- .byte 15,133,11,1,0,0 // jne 5751 <_sk_load_u16_be_sse2+0x13d>
+ .byte 15,133,11,1,0,0 // jne 58d0 <_sk_load_u16_be_sse2+0x13d>
.byte 102,15,16,4,119 // movupd (%edi,%esi,2),%xmm0
.byte 243,15,111,76,119,16 // movdqu 0x10(%edi,%esi,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -68603,7 +69277,7 @@ _sk_load_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,162,1,76,0,0 // movaps 0x4c01(%edx),%xmm4
+ .byte 15,40,162,114,76,0,0 // movaps 0x4c72(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,205 // movdqa %xmm5,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -68653,12 +69327,12 @@ _sk_load_u16_be_sse2:
.byte 242,15,16,4,119 // movsd (%edi,%esi,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,238,254,255,255 // je 5651 <_sk_load_u16_be_sse2+0x3d>
+ .byte 15,132,238,254,255,255 // je 57d0 <_sk_load_u16_be_sse2+0x3d>
.byte 102,15,22,68,119,8 // movhpd 0x8(%edi,%esi,2),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,223,254,255,255 // jb 5651 <_sk_load_u16_be_sse2+0x3d>
+ .byte 15,130,223,254,255,255 // jb 57d0 <_sk_load_u16_be_sse2+0x3d>
.byte 243,15,126,76,119,16 // movq 0x10(%edi,%esi,2),%xmm1
- .byte 233,212,254,255,255 // jmp 5651 <_sk_load_u16_be_sse2+0x3d>
+ .byte 233,212,254,255,255 // jmp 57d0 <_sk_load_u16_be_sse2+0x3d>
HIDDEN _sk_load_rgb_u16_be_sse2
.globl _sk_load_rgb_u16_be_sse2
@@ -68680,9 +69354,9 @@ _sk_load_rgb_u16_be_sse2:
.byte 3,50 // add (%edx),%esi
.byte 107,25,3 // imul $0x3,(%ecx),%ebx
.byte 133,255 // test %edi,%edi
- .byte 232,0,0,0,0 // call 57a6 <_sk_load_rgb_u16_be_sse2+0x29>
+ .byte 232,0,0,0,0 // call 5925 <_sk_load_rgb_u16_be_sse2+0x29>
.byte 90 // pop %edx
- .byte 15,133,240,0,0,0 // jne 589d <_sk_load_rgb_u16_be_sse2+0x120>
+ .byte 15,133,240,0,0,0 // jne 5a1c <_sk_load_rgb_u16_be_sse2+0x120>
.byte 243,15,111,20,94 // movdqu (%esi,%ebx,2),%xmm2
.byte 243,15,111,92,94,8 // movdqu 0x8(%esi,%ebx,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -68707,7 +69381,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,170,170,74,0,0 // movaps 0x4aaa(%edx),%xmm5
+ .byte 15,40,170,27,75,0,0 // movaps 0x4b1b(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -68733,7 +69407,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,186,74,0,0 // movaps 0x4aba(%edx),%xmm3
+ .byte 15,40,154,43,75,0,0 // movaps 0x4b2b(%edx),%xmm3
.byte 86 // push %esi
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
@@ -68747,20 +69421,20 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,15,196,84,94,4,2 // pinsrw $0x2,0x4(%esi,%ebx,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,13 // jne 58bf <_sk_load_rgb_u16_be_sse2+0x142>
+ .byte 117,13 // jne 5a3e <_sk_load_rgb_u16_be_sse2+0x142>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,16,255,255,255 // jmp 57cf <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,16,255,255,255 // jmp 594e <_sk_load_rgb_u16_be_sse2+0x52>
.byte 102,15,110,68,94,6 // movd 0x6(%esi,%ebx,2),%xmm0
.byte 102,15,196,68,94,10,2 // pinsrw $0x2,0xa(%esi,%ebx,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,18 // jb 58e7 <_sk_load_rgb_u16_be_sse2+0x16a>
+ .byte 114,18 // jb 5a66 <_sk_load_rgb_u16_be_sse2+0x16a>
.byte 102,15,110,92,94,12 // movd 0xc(%esi,%ebx,2),%xmm3
.byte 102,15,196,92,94,16,2 // pinsrw $0x2,0x10(%esi,%ebx,2),%xmm3
- .byte 233,232,254,255,255 // jmp 57cf <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,232,254,255,255 // jmp 594e <_sk_load_rgb_u16_be_sse2+0x52>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,223,254,255,255 // jmp 57cf <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,223,254,255,255 // jmp 594e <_sk_load_rgb_u16_be_sse2+0x52>
HIDDEN _sk_store_u16_be_sse2
.globl _sk_store_u16_be_sse2
@@ -68772,9 +69446,9 @@ _sk_store_u16_be_sse2:
.byte 86 // push %esi
.byte 131,236,16 // sub $0x10,%esp
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
- .byte 232,0,0,0,0 // call 5901 <_sk_store_u16_be_sse2+0x11>
+ .byte 232,0,0,0,0 // call 5a80 <_sk_store_u16_be_sse2+0x11>
.byte 88 // pop %eax
- .byte 15,40,176,111,73,0,0 // movaps 0x496f(%eax),%xmm6
+ .byte 15,40,176,224,73,0,0 // movaps 0x49e0(%eax),%xmm6
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,89,230 // mulps %xmm6,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
@@ -68827,7 +69501,7 @@ _sk_store_u16_be_sse2:
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 193,226,2 // shl $0x2,%edx
.byte 133,255 // test %edi,%edi
- .byte 117,45 // jne 5a03 <_sk_store_u16_be_sse2+0x113>
+ .byte 117,45 // jne 5b82 <_sk_store_u16_be_sse2+0x113>
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
.byte 102,15,98,221 // punpckldq %xmm5,%xmm3
.byte 243,15,127,28,86 // movdqu %xmm3,(%esi,%edx,2)
@@ -68848,13 +69522,13 @@ _sk_store_u16_be_sse2:
.byte 102,15,98,245 // punpckldq %xmm5,%xmm6
.byte 102,15,214,52,86 // movq %xmm6,(%esi,%edx,2)
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,216 // je 59ed <_sk_store_u16_be_sse2+0xfd>
+ .byte 116,216 // je 5b6c <_sk_store_u16_be_sse2+0xfd>
.byte 102,15,23,116,86,8 // movhpd %xmm6,0x8(%esi,%edx,2)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,205 // jb 59ed <_sk_store_u16_be_sse2+0xfd>
+ .byte 114,205 // jb 5b6c <_sk_store_u16_be_sse2+0xfd>
.byte 102,15,106,229 // punpckhdq %xmm5,%xmm4
.byte 102,15,214,100,86,16 // movq %xmm4,0x10(%esi,%edx,2)
- .byte 235,193 // jmp 59ed <_sk_store_u16_be_sse2+0xfd>
+ .byte 235,193 // jmp 5b6c <_sk_store_u16_be_sse2+0xfd>
HIDDEN _sk_load_f32_sse2
.globl _sk_load_f32_sse2
@@ -68877,7 +69551,7 @@ _sk_load_f32_sse2:
.byte 15,16,36,23 // movups (%edi,%edx,1),%xmm4
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,71 // jne 5aa3 <_sk_load_f32_sse2+0x77>
+ .byte 117,71 // jne 5c22 <_sk_load_f32_sse2+0x77>
.byte 15,16,84,178,16 // movups 0x10(%edx,%esi,4),%xmm2
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
.byte 15,16,68,178,48 // movups 0x30(%edx,%esi,4),%xmm0
@@ -68905,17 +69579,17 @@ _sk_load_f32_sse2:
.byte 195 // ret
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,8 // jne 5ab3 <_sk_load_f32_sse2+0x87>
+ .byte 117,8 // jne 5c32 <_sk_load_f32_sse2+0x87>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,210 // xorps %xmm2,%xmm2
- .byte 235,184 // jmp 5a6b <_sk_load_f32_sse2+0x3f>
+ .byte 235,184 // jmp 5bea <_sk_load_f32_sse2+0x3f>
.byte 15,16,84,178,16 // movups 0x10(%edx,%esi,4),%xmm2
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,7 // jb 5ac4 <_sk_load_f32_sse2+0x98>
+ .byte 114,7 // jb 5c43 <_sk_load_f32_sse2+0x98>
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
- .byte 235,167 // jmp 5a6b <_sk_load_f32_sse2+0x3f>
+ .byte 235,167 // jmp 5bea <_sk_load_f32_sse2+0x3f>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,162 // jmp 5a6b <_sk_load_f32_sse2+0x3f>
+ .byte 235,162 // jmp 5bea <_sk_load_f32_sse2+0x3f>
HIDDEN _sk_load_f32_dst_sse2
.globl _sk_load_f32_dst_sse2
@@ -68941,7 +69615,7 @@ _sk_load_f32_dst_sse2:
.byte 15,16,52,23 // movups (%edi,%edx,1),%xmm6
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,97 // jne 5b65 <_sk_load_f32_dst_sse2+0x9c>
+ .byte 117,97 // jne 5ce4 <_sk_load_f32_dst_sse2+0x9c>
.byte 15,16,124,178,16 // movups 0x10(%edx,%esi,4),%xmm7
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
.byte 15,16,84,178,48 // movups 0x30(%edx,%esi,4),%xmm2
@@ -68975,17 +69649,17 @@ _sk_load_f32_dst_sse2:
.byte 195 // ret
.byte 15,87,210 // xorps %xmm2,%xmm2
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,8 // jne 5b75 <_sk_load_f32_dst_sse2+0xac>
+ .byte 117,8 // jne 5cf4 <_sk_load_f32_dst_sse2+0xac>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,158 // jmp 5b13 <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,158 // jmp 5c92 <_sk_load_f32_dst_sse2+0x4a>
.byte 15,16,124,178,16 // movups 0x10(%edx,%esi,4),%xmm7
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,7 // jb 5b86 <_sk_load_f32_dst_sse2+0xbd>
+ .byte 114,7 // jb 5d05 <_sk_load_f32_dst_sse2+0xbd>
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
- .byte 235,141 // jmp 5b13 <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,141 // jmp 5c92 <_sk_load_f32_dst_sse2+0x4a>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,136 // jmp 5b13 <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,136 // jmp 5c92 <_sk_load_f32_dst_sse2+0x4a>
HIDDEN _sk_store_f32_sse2
.globl _sk_store_f32_sse2
@@ -69023,7 +69697,7 @@ _sk_store_f32_sse2:
.byte 15,40,238 // movaps %xmm6,%xmm5
.byte 102,15,20,239 // unpcklpd %xmm7,%xmm5
.byte 133,255 // test %edi,%edi
- .byte 117,40 // jne 5c11 <_sk_store_f32_sse2+0x86>
+ .byte 117,40 // jne 5d90 <_sk_store_f32_sse2+0x86>
.byte 102,15,21,247 // unpckhpd %xmm7,%xmm6
.byte 15,17,100,178,16 // movups %xmm4,0x10(%edx,%esi,4)
.byte 102,15,17,108,178,32 // movupd %xmm5,0x20(%edx,%esi,4)
@@ -69040,12 +69714,12 @@ _sk_store_f32_sse2:
.byte 93 // pop %ebp
.byte 195 // ret
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,232 // je 5bfe <_sk_store_f32_sse2+0x73>
+ .byte 116,232 // je 5d7d <_sk_store_f32_sse2+0x73>
.byte 15,17,100,178,16 // movups %xmm4,0x10(%edx,%esi,4)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,222 // jb 5bfe <_sk_store_f32_sse2+0x73>
+ .byte 114,222 // jb 5d7d <_sk_store_f32_sse2+0x73>
.byte 102,15,17,108,178,32 // movupd %xmm5,0x20(%edx,%esi,4)
- .byte 235,214 // jmp 5bfe <_sk_store_f32_sse2+0x73>
+ .byte 235,214 // jmp 5d7d <_sk_store_f32_sse2+0x73>
HIDDEN _sk_clamp_x_sse2
.globl _sk_clamp_x_sse2
@@ -69106,7 +69780,7 @@ _sk_repeat_x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5ca5 <_sk_repeat_x_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5e24 <_sk_repeat_x_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -69117,7 +69791,7 @@ _sk_repeat_x_sse2:
.byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,219,69,0,0 // andps 0x45db(%ecx),%xmm6
+ .byte 15,84,177,76,70,0,0 // andps 0x464c(%ecx),%xmm6
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -69144,7 +69818,7 @@ _sk_repeat_y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5d0b <_sk_repeat_y_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5e8a <_sk_repeat_y_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -69155,7 +69829,7 @@ _sk_repeat_y_sse2:
.byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,133,69,0,0 // andps 0x4585(%ecx),%xmm6
+ .byte 15,84,177,246,69,0,0 // andps 0x45f6(%ecx),%xmm6
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -69182,7 +69856,7 @@ _sk_mirror_x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5d71 <_sk_mirror_x_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5ef0 <_sk_mirror_x_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -69191,13 +69865,13 @@ _sk_mirror_x_sse2:
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 243,15,89,177,175,74,0,0 // mulss 0x4aaf(%ecx),%xmm6
+ .byte 243,15,89,177,32,75,0,0 // mulss 0x4b20(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,47,69,0,0 // andps 0x452f(%ecx),%xmm6
+ .byte 15,84,177,160,69,0,0 // andps 0x45a0(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -69228,7 +69902,7 @@ _sk_mirror_y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5df6 <_sk_mirror_y_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5f75 <_sk_mirror_y_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -69237,13 +69911,13 @@ _sk_mirror_y_sse2:
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,204 // subps %xmm4,%xmm1
- .byte 243,15,89,177,46,74,0,0 // mulss 0x4a2e(%ecx),%xmm6
+ .byte 243,15,89,177,159,74,0,0 // mulss 0x4a9f(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,186,68,0,0 // andps 0x44ba(%ecx),%xmm6
+ .byte 15,84,177,43,69,0,0 // andps 0x452b(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -69274,12 +69948,12 @@ _sk_clamp_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5e7b <_sk_clamp_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5ffa <_sk_clamp_x_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,95,224 // maxps %xmm0,%xmm4
- .byte 15,93,160,69,68,0,0 // minps 0x4445(%eax),%xmm4
+ .byte 15,93,160,182,68,0,0 // minps 0x44b6(%eax),%xmm4
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
@@ -69297,14 +69971,14 @@ _sk_repeat_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5eab <_sk_repeat_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 602a <_sk_repeat_x_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 243,15,91,224 // cvttps2dq %xmm0,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,84,168,37,68,0,0 // andps 0x4425(%eax),%xmm5
+ .byte 15,84,168,150,68,0,0 // andps 0x4496(%eax),%xmm5
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 141,65,4 // lea 0x4(%ecx),%eax
@@ -69323,17 +69997,17 @@ _sk_mirror_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5ee6 <_sk_mirror_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 6065 <_sk_mirror_x_1_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 15,40,161,250,67,0,0 // movaps 0x43fa(%ecx),%xmm4
+ .byte 15,40,161,107,68,0,0 // movaps 0x446b(%ecx),%xmm4
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,169,10,68,0,0 // movaps 0x440a(%ecx),%xmm5
+ .byte 15,40,169,123,68,0,0 // movaps 0x447b(%ecx),%xmm5
.byte 15,89,232 // mulps %xmm0,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,194,238,1 // cmpltps %xmm6,%xmm5
- .byte 15,84,169,26,68,0,0 // andps 0x441a(%ecx),%xmm5
+ .byte 15,84,169,139,68,0,0 // andps 0x448b(%ecx),%xmm5
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 15,88,246 // addps %xmm6,%xmm6
@@ -69358,13 +70032,13 @@ _sk_luminance_to_alpha_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 5f44 <_sk_luminance_to_alpha_sse2+0xe>
+ .byte 232,0,0,0,0 // call 60c3 <_sk_luminance_to_alpha_sse2+0xe>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,89,128,204,67,0,0 // mulps 0x43cc(%eax),%xmm0
- .byte 15,89,136,220,67,0,0 // mulps 0x43dc(%eax),%xmm1
+ .byte 15,89,128,61,68,0,0 // mulps 0x443d(%eax),%xmm0
+ .byte 15,89,136,77,68,0,0 // mulps 0x444d(%eax),%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,152,236,67,0,0 // mulps 0x43ec(%eax),%xmm3
+ .byte 15,89,152,93,68,0,0 // mulps 0x445d(%eax),%xmm3
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -69754,7 +70428,7 @@ _sk_evenly_spaced_gradient_sse2:
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
- .byte 232,0,0,0,0 // call 63e1 <_sk_evenly_spaced_gradient_sse2+0x12>
+ .byte 232,0,0,0,0 // call 6560 <_sk_evenly_spaced_gradient_sse2+0x12>
.byte 90 // pop %edx
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,65,4 // lea 0x4(%ecx),%eax
@@ -69765,12 +70439,12 @@ _sk_evenly_spaced_gradient_sse2:
.byte 78 // dec %esi
.byte 102,15,110,206 // movd %esi,%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
- .byte 102,15,111,146,95,63,0,0 // movdqa 0x3f5f(%edx),%xmm2
+ .byte 102,15,111,146,208,63,0,0 // movdqa 0x3fd0(%edx),%xmm2
.byte 102,15,219,209 // pand %xmm1,%xmm2
- .byte 102,15,235,146,111,63,0,0 // por 0x3f6f(%edx),%xmm2
+ .byte 102,15,235,146,224,63,0,0 // por 0x3fe0(%edx),%xmm2
.byte 102,15,114,209,16 // psrld $0x10,%xmm1
- .byte 102,15,235,138,127,63,0,0 // por 0x3f7f(%edx),%xmm1
- .byte 15,88,138,143,63,0,0 // addps 0x3f8f(%edx),%xmm1
+ .byte 102,15,235,138,240,63,0,0 // por 0x3ff0(%edx),%xmm1
+ .byte 15,88,138,0,64,0,0 // addps 0x4000(%edx),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
@@ -69877,18 +70551,18 @@ _sk_gauss_a_to_rgba_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 6597 <_sk_gauss_a_to_rgba_sse2+0xb>
+ .byte 232,0,0,0,0 // call 6716 <_sk_gauss_a_to_rgba_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,128,233,61,0,0 // movaps 0x3de9(%eax),%xmm0
+ .byte 15,40,128,90,62,0,0 // movaps 0x3e5a(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,249,61,0,0 // addps 0x3df9(%eax),%xmm0
+ .byte 15,88,128,106,62,0,0 // addps 0x3e6a(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,9,62,0,0 // addps 0x3e09(%eax),%xmm0
+ .byte 15,88,128,122,62,0,0 // addps 0x3e7a(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,25,62,0,0 // addps 0x3e19(%eax),%xmm0
+ .byte 15,88,128,138,62,0,0 // addps 0x3e8a(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,41,62,0,0 // addps 0x3e29(%eax),%xmm0
+ .byte 15,88,128,154,62,0,0 // addps 0x3e9a(%eax),%xmm0
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,200 // movaps %xmm0,%xmm1
@@ -69911,7 +70585,7 @@ _sk_gradient_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
- .byte 232,0,0,0,0 // call 65f2 <_sk_gradient_sse2+0xe>
+ .byte 232,0,0,0,0 // call 6771 <_sk_gradient_sse2+0xe>
.byte 95 // pop %edi
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
@@ -69920,12 +70594,12 @@ _sk_gradient_sse2:
.byte 139,17 // mov (%ecx),%edx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,250,2 // cmp $0x2,%edx
- .byte 114,43 // jb 6634 <_sk_gradient_sse2+0x50>
+ .byte 114,43 // jb 67b3 <_sk_gradient_sse2+0x50>
.byte 139,113,36 // mov 0x24(%ecx),%esi
.byte 74 // dec %edx
.byte 131,198,4 // add $0x4,%esi
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,151,222,61,0,0 // movaps 0x3dde(%edi),%xmm2
+ .byte 15,40,151,79,62,0,0 // movaps 0x3e4f(%edi),%xmm2
.byte 243,15,16,30 // movss (%esi),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -69933,7 +70607,7 @@ _sk_gradient_sse2:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 131,198,4 // add $0x4,%esi
.byte 74 // dec %edx
- .byte 117,231 // jne 661b <_sk_gradient_sse2+0x37>
+ .byte 117,231 // jne 679a <_sk_gradient_sse2+0x37>
.byte 102,15,126,202 // movd %xmm1,%edx
.byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
.byte 102,15,126,214 // movd %xmm2,%esi
@@ -70085,7 +70759,7 @@ _sk_xy_to_unit_angle_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 682e <_sk_xy_to_unit_angle_sse2+0x18>
+ .byte 232,0,0,0,0 // call 69ad <_sk_xy_to_unit_angle_sse2+0x18>
.byte 88 // pop %eax
.byte 15,87,237 // xorps %xmm5,%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
@@ -70100,30 +70774,30 @@ _sk_xy_to_unit_angle_sse2:
.byte 15,94,247 // divps %xmm7,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,255 // mulps %xmm7,%xmm7
- .byte 15,40,128,178,59,0,0 // movaps 0x3bb2(%eax),%xmm0
+ .byte 15,40,128,35,60,0,0 // movaps 0x3c23(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,194,59,0,0 // addps 0x3bc2(%eax),%xmm0
+ .byte 15,88,128,51,60,0,0 // addps 0x3c33(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,210,59,0,0 // addps 0x3bd2(%eax),%xmm0
+ .byte 15,88,128,67,60,0,0 // addps 0x3c43(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,226,59,0,0 // addps 0x3be2(%eax),%xmm0
+ .byte 15,88,128,83,60,0,0 // addps 0x3c53(%eax),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,40,176,242,59,0,0 // movaps 0x3bf2(%eax),%xmm6
+ .byte 15,40,176,99,60,0,0 // movaps 0x3c63(%eax),%xmm6
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,84,245 // andps %xmm5,%xmm6
.byte 15,85,232 // andnps %xmm0,%xmm5
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,86,238 // orps %xmm6,%xmm5
.byte 15,194,204,1 // cmpltps %xmm4,%xmm1
- .byte 15,40,128,2,60,0,0 // movaps 0x3c02(%eax),%xmm0
+ .byte 15,40,128,115,60,0,0 // movaps 0x3c73(%eax),%xmm0
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,84,193 // andps %xmm1,%xmm0
.byte 15,85,205 // andnps %xmm5,%xmm1
.byte 15,86,200 // orps %xmm0,%xmm1
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,194,196,1 // cmpltps %xmm4,%xmm0
- .byte 15,40,168,18,60,0,0 // movaps 0x3c12(%eax),%xmm5
+ .byte 15,40,168,131,60,0,0 // movaps 0x3c83(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,84,232 // andps %xmm0,%xmm5
.byte 15,85,193 // andnps %xmm1,%xmm0
@@ -70184,15 +70858,15 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 232,0,0,0,0 // call 694b <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
+ .byte 232,0,0,0,0 // call 6aca <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
.byte 90 // pop %edx
.byte 243,15,89,237 // mulss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,162,5,59,0,0 // mulps 0x3b05(%edx),%xmm4
- .byte 15,89,130,21,59,0,0 // mulps 0x3b15(%edx),%xmm0
+ .byte 15,89,162,118,59,0,0 // mulps 0x3b76(%edx),%xmm4
+ .byte 15,89,130,134,59,0,0 // mulps 0x3b86(%edx),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
@@ -70200,11 +70874,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,162,37,59,0,0 // xorps 0x3b25(%edx),%xmm4
+ .byte 15,87,162,150,59,0,0 // xorps 0x3b96(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,170,53,59,0,0 // mulps 0x3b35(%edx),%xmm5
+ .byte 15,89,170,166,59,0,0 // mulps 0x3ba6(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,95,196 // maxps %xmm4,%xmm0
@@ -70235,15 +70909,15 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 232,0,0,0,0 // call 69e9 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
+ .byte 232,0,0,0,0 // call 6b68 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
.byte 90 // pop %edx
.byte 243,15,89,237 // mulss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,162,167,58,0,0 // mulps 0x3aa7(%edx),%xmm4
- .byte 15,89,130,183,58,0,0 // mulps 0x3ab7(%edx),%xmm0
+ .byte 15,89,162,24,59,0,0 // mulps 0x3b18(%edx),%xmm4
+ .byte 15,89,130,40,59,0,0 // mulps 0x3b28(%edx),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
@@ -70251,11 +70925,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,162,199,58,0,0 // xorps 0x3ac7(%edx),%xmm4
+ .byte 15,87,162,56,59,0,0 // xorps 0x3b38(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,170,215,58,0,0 // mulps 0x3ad7(%edx),%xmm5
+ .byte 15,89,170,72,59,0,0 // mulps 0x3b48(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
@@ -70275,7 +70949,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 6a61 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
+ .byte 232,0,0,0,0 // call 6be0 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -70284,7 +70958,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,89,169,111,58,0,0 // mulps 0x3a6f(%ecx),%xmm5
+ .byte 15,89,169,224,58,0,0 // mulps 0x3ae0(%ecx),%xmm5
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
@@ -70292,7 +70966,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,228 // mulss %xmm4,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,129,127,58,0,0 // xorps 0x3a7f(%ecx),%xmm0
+ .byte 15,87,129,240,58,0,0 // xorps 0x3af0(%ecx),%xmm0
.byte 15,94,197 // divps %xmm5,%xmm0
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
@@ -70366,16 +71040,16 @@ _sk_save_xy_sse2:
.byte 131,236,24 // sub $0x18,%esp
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 6b3e <_sk_save_xy_sse2+0x12>
+ .byte 232,0,0,0,0 // call 6cbd <_sk_save_xy_sse2+0x12>
.byte 88 // pop %eax
- .byte 15,40,160,178,57,0,0 // movaps 0x39b2(%eax),%xmm4
+ .byte 15,40,160,35,58,0,0 // movaps 0x3a23(%eax),%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,88,236 // addps %xmm4,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,194,254,1 // cmpltps %xmm6,%xmm7
- .byte 15,40,144,194,57,0,0 // movaps 0x39c2(%eax),%xmm2
+ .byte 15,40,144,51,58,0,0 // movaps 0x3a33(%eax),%xmm2
.byte 15,84,250 // andps %xmm2,%xmm7
.byte 15,92,247 // subps %xmm7,%xmm6
.byte 15,92,238 // subps %xmm6,%xmm5
@@ -70450,15 +71124,15 @@ _sk_bilinear_nx_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6c20 <_sk_bilinear_nx_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6d9f <_sk_bilinear_nx_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,240,56,0,0 // addps 0x38f0(%eax),%xmm0
- .byte 15,40,168,0,57,0,0 // movaps 0x3900(%eax),%xmm5
+ .byte 15,88,128,97,57,0,0 // addps 0x3961(%eax),%xmm0
+ .byte 15,40,168,113,57,0,0 // movaps 0x3971(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -70479,14 +71153,14 @@ _sk_bilinear_px_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6c63 <_sk_bilinear_px_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6de2 <_sk_bilinear_px_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,205,56,0,0 // addps 0x38cd(%eax),%xmm0
+ .byte 15,88,128,62,57,0,0 // addps 0x393e(%eax),%xmm0
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -70506,15 +71180,15 @@ _sk_bilinear_ny_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6c9c <_sk_bilinear_ny_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6e1b <_sk_bilinear_ny_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,164,56,0,0 // addps 0x38a4(%eax),%xmm1
- .byte 15,40,168,180,56,0,0 // movaps 0x38b4(%eax),%xmm5
+ .byte 15,88,136,21,57,0,0 // addps 0x3915(%eax),%xmm1
+ .byte 15,40,168,37,57,0,0 // movaps 0x3925(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -70535,14 +71209,14 @@ _sk_bilinear_py_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6ce0 <_sk_bilinear_py_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6e5f <_sk_bilinear_py_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,128,56,0,0 // addps 0x3880(%eax),%xmm1
+ .byte 15,88,136,241,56,0,0 // addps 0x38f1(%eax),%xmm1
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -70562,20 +71236,20 @@ _sk_bicubic_n3x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6d1a <_sk_bicubic_n3x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6e99 <_sk_bicubic_n3x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,86,56,0,0 // addps 0x3856(%eax),%xmm0
- .byte 15,40,168,102,56,0,0 // movaps 0x3866(%eax),%xmm5
+ .byte 15,88,128,199,56,0,0 // addps 0x38c7(%eax),%xmm0
+ .byte 15,40,168,215,56,0,0 // movaps 0x38d7(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,89,168,118,56,0,0 // mulps 0x3876(%eax),%xmm5
- .byte 15,88,168,134,56,0,0 // addps 0x3886(%eax),%xmm5
+ .byte 15,89,168,231,56,0,0 // mulps 0x38e7(%eax),%xmm5
+ .byte 15,88,168,247,56,0,0 // addps 0x38f7(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -70596,23 +71270,23 @@ _sk_bicubic_n1x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6d74 <_sk_bicubic_n1x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6ef3 <_sk_bicubic_n1x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,60,56,0,0 // addps 0x383c(%eax),%xmm0
- .byte 15,40,168,76,56,0,0 // movaps 0x384c(%eax),%xmm5
+ .byte 15,88,128,173,56,0,0 // addps 0x38ad(%eax),%xmm0
+ .byte 15,40,168,189,56,0,0 // movaps 0x38bd(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,160,92,56,0,0 // movaps 0x385c(%eax),%xmm4
+ .byte 15,40,160,205,56,0,0 // movaps 0x38cd(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,108,56,0,0 // addps 0x386c(%eax),%xmm4
+ .byte 15,88,160,221,56,0,0 // addps 0x38dd(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,124,56,0,0 // addps 0x387c(%eax),%xmm4
+ .byte 15,88,160,237,56,0,0 // addps 0x38ed(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,140,56,0,0 // addps 0x388c(%eax),%xmm4
+ .byte 15,88,160,253,56,0,0 // addps 0x38fd(%eax),%xmm4
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -70632,22 +71306,22 @@ _sk_bicubic_p1x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6ddc <_sk_bicubic_p1x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6f5b <_sk_bicubic_p1x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
- .byte 15,40,160,52,56,0,0 // movaps 0x3834(%eax),%xmm4
+ .byte 15,40,160,165,56,0,0 // movaps 0x38a5(%eax),%xmm4
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,110,64 // movups 0x40(%esi),%xmm5
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,176,68,56,0,0 // movaps 0x3844(%eax),%xmm6
+ .byte 15,40,176,181,56,0,0 // movaps 0x38b5(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,84,56,0,0 // addps 0x3854(%eax),%xmm6
+ .byte 15,88,176,197,56,0,0 // addps 0x38c5(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,100,56,0,0 // addps 0x3864(%eax),%xmm6
+ .byte 15,88,176,213,56,0,0 // addps 0x38d5(%eax),%xmm6
.byte 15,17,182,128,0,0,0 // movups %xmm6,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -70667,18 +71341,18 @@ _sk_bicubic_p3x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6e39 <_sk_bicubic_p3x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6fb8 <_sk_bicubic_p3x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,23,56,0,0 // addps 0x3817(%eax),%xmm0
+ .byte 15,88,128,136,56,0,0 // addps 0x3888(%eax),%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,89,160,39,56,0,0 // mulps 0x3827(%eax),%xmm4
- .byte 15,88,160,55,56,0,0 // addps 0x3837(%eax),%xmm4
+ .byte 15,89,160,152,56,0,0 // mulps 0x3898(%eax),%xmm4
+ .byte 15,88,160,168,56,0,0 // addps 0x38a8(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -70699,20 +71373,20 @@ _sk_bicubic_n3y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6e89 <_sk_bicubic_n3y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 7008 <_sk_bicubic_n3y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,247,55,0,0 // addps 0x37f7(%eax),%xmm1
- .byte 15,40,168,7,56,0,0 // movaps 0x3807(%eax),%xmm5
+ .byte 15,88,136,104,56,0,0 // addps 0x3868(%eax),%xmm1
+ .byte 15,40,168,120,56,0,0 // movaps 0x3878(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,89,168,23,56,0,0 // mulps 0x3817(%eax),%xmm5
- .byte 15,88,168,39,56,0,0 // addps 0x3827(%eax),%xmm5
+ .byte 15,89,168,136,56,0,0 // mulps 0x3888(%eax),%xmm5
+ .byte 15,88,168,152,56,0,0 // addps 0x3898(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -70733,23 +71407,23 @@ _sk_bicubic_n1y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6ee4 <_sk_bicubic_n1y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 7063 <_sk_bicubic_n1y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,220,55,0,0 // addps 0x37dc(%eax),%xmm1
- .byte 15,40,168,236,55,0,0 // movaps 0x37ec(%eax),%xmm5
+ .byte 15,88,136,77,56,0,0 // addps 0x384d(%eax),%xmm1
+ .byte 15,40,168,93,56,0,0 // movaps 0x385d(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,160,252,55,0,0 // movaps 0x37fc(%eax),%xmm4
+ .byte 15,40,160,109,56,0,0 // movaps 0x386d(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,12,56,0,0 // addps 0x380c(%eax),%xmm4
+ .byte 15,88,160,125,56,0,0 // addps 0x387d(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,28,56,0,0 // addps 0x381c(%eax),%xmm4
+ .byte 15,88,160,141,56,0,0 // addps 0x388d(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,44,56,0,0 // addps 0x382c(%eax),%xmm4
+ .byte 15,88,160,157,56,0,0 // addps 0x389d(%eax),%xmm4
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -70769,22 +71443,22 @@ _sk_bicubic_p1y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6f4d <_sk_bicubic_p1y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 70cc <_sk_bicubic_p1y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
- .byte 15,40,160,211,55,0,0 // movaps 0x37d3(%eax),%xmm4
+ .byte 15,40,160,68,56,0,0 // movaps 0x3844(%eax),%xmm4
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,110,96 // movups 0x60(%esi),%xmm5
.byte 15,88,204 // addps %xmm4,%xmm1
- .byte 15,40,176,227,55,0,0 // movaps 0x37e3(%eax),%xmm6
+ .byte 15,40,176,84,56,0,0 // movaps 0x3854(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,243,55,0,0 // addps 0x37f3(%eax),%xmm6
+ .byte 15,88,176,100,56,0,0 // addps 0x3864(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,3,56,0,0 // addps 0x3803(%eax),%xmm6
+ .byte 15,88,176,116,56,0,0 // addps 0x3874(%eax),%xmm6
.byte 15,17,182,160,0,0,0 // movups %xmm6,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -70804,18 +71478,18 @@ _sk_bicubic_p3y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6fab <_sk_bicubic_p3y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 712a <_sk_bicubic_p3y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,181,55,0,0 // addps 0x37b5(%eax),%xmm1
+ .byte 15,88,136,38,56,0,0 // addps 0x3826(%eax),%xmm1
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,89,160,197,55,0,0 // mulps 0x37c5(%eax),%xmm4
- .byte 15,88,160,213,55,0,0 // addps 0x37d5(%eax),%xmm4
+ .byte 15,89,160,54,56,0,0 // mulps 0x3836(%eax),%xmm4
+ .byte 15,88,160,70,56,0,0 // addps 0x3846(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -70960,7 +71634,7 @@ _sk_clut_3D_sse2:
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,98,233 // punpckldq %xmm1,%xmm5
.byte 102,15,127,173,104,255,255,255 // movdqa %xmm5,-0x98(%ebp)
- .byte 232,0,0,0,0 // call 719f <_sk_clut_3D_sse2+0xff>
+ .byte 232,0,0,0,0 // call 731e <_sk_clut_3D_sse2+0xff>
.byte 90 // pop %edx
.byte 243,15,91,196 // cvttps2dq %xmm4,%xmm0
.byte 102,15,127,133,232,254,255,255 // movdqa %xmm0,-0x118(%ebp)
@@ -70969,7 +71643,7 @@ _sk_clut_3D_sse2:
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,111,205 // movdqa %xmm5,%xmm1
.byte 102,15,254,202 // paddd %xmm2,%xmm1
- .byte 102,15,111,130,1,54,0,0 // movdqa 0x3601(%edx),%xmm0
+ .byte 102,15,111,130,114,54,0,0 // movdqa 0x3672(%edx),%xmm0
.byte 102,15,127,133,88,255,255,255 // movdqa %xmm0,-0xa8(%ebp)
.byte 102,15,112,225,245 // pshufd $0xf5,%xmm1,%xmm4
.byte 102,15,244,200 // pmuludq %xmm0,%xmm1
@@ -70993,7 +71667,7 @@ _sk_clut_3D_sse2:
.byte 15,20,196 // unpcklps %xmm4,%xmm0
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
- .byte 102,15,111,130,17,54,0,0 // movdqa 0x3611(%edx),%xmm0
+ .byte 102,15,111,130,130,54,0,0 // movdqa 0x3682(%edx),%xmm0
.byte 102,15,127,133,72,255,255,255 // movdqa %xmm0,-0xb8(%ebp)
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,254,224 // paddd %xmm0,%xmm4
@@ -71011,7 +71685,7 @@ _sk_clut_3D_sse2:
.byte 243,15,16,36,185 // movss (%ecx,%edi,4),%xmm4
.byte 15,20,252 // unpcklps %xmm4,%xmm7
.byte 15,20,248 // unpcklps %xmm0,%xmm7
- .byte 102,15,111,130,33,54,0,0 // movdqa 0x3621(%edx),%xmm0
+ .byte 102,15,111,130,146,54,0,0 // movdqa 0x3692(%edx),%xmm0
.byte 102,15,127,69,216 // movdqa %xmm0,-0x28(%ebp)
.byte 102,15,254,200 // paddd %xmm0,%xmm1
.byte 102,15,112,193,229 // pshufd $0xe5,%xmm1,%xmm0
@@ -71028,7 +71702,7 @@ _sk_clut_3D_sse2:
.byte 243,15,16,4,177 // movss (%ecx,%esi,4),%xmm0
.byte 15,20,232 // unpcklps %xmm0,%xmm5
.byte 15,20,236 // unpcklps %xmm4,%xmm5
- .byte 15,40,130,241,53,0,0 // movaps 0x35f1(%edx),%xmm0
+ .byte 15,40,130,98,54,0,0 // movaps 0x3662(%edx),%xmm0
.byte 15,88,240 // addps %xmm0,%xmm6
.byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp)
.byte 15,40,141,56,255,255,255 // movaps -0xc8(%ebp),%xmm1
@@ -71641,7 +72315,7 @@ _sk_clut_4D_sse2:
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,98,209 // punpckldq %xmm1,%xmm2
.byte 102,15,127,85,168 // movdqa %xmm2,-0x58(%ebp)
- .byte 232,0,0,0,0 // call 7d15 <_sk_clut_4D_sse2+0x179>
+ .byte 232,0,0,0,0 // call 7e94 <_sk_clut_4D_sse2+0x179>
.byte 89 // pop %ecx
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,41,165,120,254,255,255 // movaps %xmm4,-0x188(%ebp)
@@ -71654,7 +72328,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,245 // paddd %xmm5,%xmm6
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,15,254,206 // paddd %xmm6,%xmm1
- .byte 102,15,111,153,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm3
+ .byte 102,15,111,153,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm3
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
@@ -71677,7 +72351,7 @@ _sk_clut_4D_sse2:
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
- .byte 102,15,111,153,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm3
+ .byte 102,15,111,153,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm3
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,234,229 // pshufd $0xe5,%xmm2,%xmm5
@@ -71695,7 +72369,7 @@ _sk_clut_4D_sse2:
.byte 15,20,215 // unpcklps %xmm7,%xmm2
.byte 15,20,213 // unpcklps %xmm5,%xmm2
.byte 15,41,149,136,254,255,255 // movaps %xmm2,-0x178(%ebp)
- .byte 102,15,254,137,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm1
+ .byte 102,15,254,137,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm1
.byte 102,15,112,233,229 // pshufd $0xe5,%xmm1,%xmm5
.byte 102,15,126,232 // movd %xmm5,%eax
.byte 102,15,112,233,78 // pshufd $0x4e,%xmm1,%xmm5
@@ -71711,7 +72385,7 @@ _sk_clut_4D_sse2:
.byte 15,20,207 // unpcklps %xmm7,%xmm1
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,41,141,152,254,255,255 // movaps %xmm1,-0x168(%ebp)
- .byte 15,40,185,187,42,0,0 // movaps 0x2abb(%ecx),%xmm7
+ .byte 15,40,185,44,43,0,0 // movaps 0x2b2c(%ecx),%xmm7
.byte 15,88,231 // addps %xmm7,%xmm4
.byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp)
.byte 15,40,141,232,254,255,255 // movaps -0x118(%ebp),%xmm1
@@ -71732,7 +72406,7 @@ _sk_clut_4D_sse2:
.byte 102,15,127,77,184 // movdqa %xmm1,-0x48(%ebp)
.byte 102,15,254,241 // paddd %xmm1,%xmm6
.byte 102,15,112,254,245 // pshufd $0xf5,%xmm6,%xmm7
- .byte 102,15,111,137,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm1
+ .byte 102,15,111,137,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm1
.byte 102,15,244,241 // pmuludq %xmm1,%xmm6
.byte 102,15,112,198,232 // pshufd $0xe8,%xmm6,%xmm0
.byte 102,15,244,249 // pmuludq %xmm1,%xmm7
@@ -71769,7 +72443,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,44,178 // movss (%edx,%esi,4),%xmm5
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 15,20,217 // unpcklps %xmm1,%xmm3
- .byte 102,15,111,177,235,42,0,0 // movdqa 0x2aeb(%ecx),%xmm6
+ .byte 102,15,111,177,92,43,0,0 // movdqa 0x2b5c(%ecx),%xmm6
.byte 102,15,254,198 // paddd %xmm6,%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
.byte 102,15,126,200 // movd %xmm1,%eax
@@ -71817,7 +72491,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
.byte 102,15,254,77,168 // paddd -0x58(%ebp),%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,129,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm0
+ .byte 102,15,111,129,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm0
.byte 102,15,244,200 // pmuludq %xmm0,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,208 // pmuludq %xmm0,%xmm2
@@ -71839,7 +72513,7 @@ _sk_clut_4D_sse2:
.byte 15,20,195 // unpcklps %xmm3,%xmm0
.byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,111,129,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm0
+ .byte 102,15,111,129,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm0
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3
@@ -71875,7 +72549,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,197 // movdqa %xmm5,%xmm0
.byte 102,15,254,69,184 // paddd -0x48(%ebp),%xmm0
.byte 102,15,112,216,245 // pshufd $0xf5,%xmm0,%xmm3
- .byte 102,15,111,137,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm1
+ .byte 102,15,111,137,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm1
.byte 102,15,244,193 // pmuludq %xmm1,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,217 // pmuludq %xmm1,%xmm3
@@ -71911,7 +72585,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
.byte 15,20,224 // unpcklps %xmm0,%xmm4
.byte 15,20,227 // unpcklps %xmm3,%xmm4
- .byte 102,15,111,153,235,42,0,0 // movdqa 0x2aeb(%ecx),%xmm3
+ .byte 102,15,111,153,92,43,0,0 // movdqa 0x2b5c(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
.byte 102,15,126,192 // movd %xmm0,%eax
@@ -71975,7 +72649,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,197 // movdqa %xmm5,%xmm0
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,145,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm2
+ .byte 102,15,111,145,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm2
.byte 102,15,244,194 // pmuludq %xmm2,%xmm0
.byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
.byte 102,15,244,202 // pmuludq %xmm2,%xmm1
@@ -71997,7 +72671,7 @@ _sk_clut_4D_sse2:
.byte 15,20,214 // unpcklps %xmm6,%xmm2
.byte 15,41,85,136 // movaps %xmm2,-0x78(%ebp)
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,111,145,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm2
+ .byte 102,15,111,145,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm2
.byte 102,15,254,202 // paddd %xmm2,%xmm1
.byte 102,15,112,241,229 // pshufd $0xe5,%xmm1,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
@@ -72030,7 +72704,7 @@ _sk_clut_4D_sse2:
.byte 15,20,206 // unpcklps %xmm6,%xmm1
.byte 102,15,254,109,184 // paddd -0x48(%ebp),%xmm5
.byte 102,15,112,245,245 // pshufd $0xf5,%xmm5,%xmm6
- .byte 102,15,111,129,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm0
+ .byte 102,15,111,129,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm0
.byte 102,15,244,232 // pmuludq %xmm0,%xmm5
.byte 102,15,112,253,232 // pshufd $0xe8,%xmm5,%xmm7
.byte 102,15,244,240 // pmuludq %xmm0,%xmm6
@@ -72066,7 +72740,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
.byte 15,20,234 // unpcklps %xmm2,%xmm5
.byte 15,20,238 // unpcklps %xmm6,%xmm5
- .byte 102,15,111,153,235,42,0,0 // movdqa 0x2aeb(%ecx),%xmm3
+ .byte 102,15,111,153,92,43,0,0 // movdqa 0x2b5c(%ecx),%xmm3
.byte 102,15,254,251 // paddd %xmm3,%xmm7
.byte 102,15,112,215,229 // pshufd $0xe5,%xmm7,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
@@ -72100,7 +72774,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,177,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm6
+ .byte 102,15,111,177,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm6
.byte 102,15,244,198 // pmuludq %xmm6,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,206 // pmuludq %xmm6,%xmm1
@@ -72122,7 +72796,7 @@ _sk_clut_4D_sse2:
.byte 15,20,193 // unpcklps %xmm1,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
- .byte 102,15,254,137,219,42,0,0 // paddd 0x2adb(%ecx),%xmm1
+ .byte 102,15,254,137,76,43,0,0 // paddd 0x2b4c(%ecx),%xmm1
.byte 102,15,112,241,229 // pshufd $0xe5,%xmm1,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -72156,7 +72830,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,212 // movdqa %xmm4,%xmm2
.byte 102,15,254,85,184 // paddd -0x48(%ebp),%xmm2
.byte 102,15,112,194,245 // pshufd $0xf5,%xmm2,%xmm0
- .byte 102,15,111,137,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm1
+ .byte 102,15,111,137,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm1
.byte 102,15,244,209 // pmuludq %xmm1,%xmm2
.byte 102,15,112,226,232 // pshufd $0xe8,%xmm2,%xmm4
.byte 102,15,244,193 // pmuludq %xmm1,%xmm0
@@ -72177,7 +72851,7 @@ _sk_clut_4D_sse2:
.byte 15,20,200 // unpcklps %xmm0,%xmm1
.byte 15,20,206 // unpcklps %xmm6,%xmm1
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
- .byte 102,15,254,129,219,42,0,0 // paddd 0x2adb(%ecx),%xmm0
+ .byte 102,15,254,129,76,43,0,0 // paddd 0x2b4c(%ecx),%xmm0
.byte 102,15,112,240,229 // pshufd $0xe5,%xmm0,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
.byte 102,15,112,240,78 // pshufd $0x4e,%xmm0,%xmm6
@@ -72192,7 +72866,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
.byte 15,20,208 // unpcklps %xmm0,%xmm2
.byte 15,20,214 // unpcklps %xmm6,%xmm2
- .byte 102,15,254,161,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm4
+ .byte 102,15,254,161,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm4
.byte 102,15,112,196,229 // pshufd $0xe5,%xmm4,%xmm0
.byte 102,15,126,192 // movd %xmm0,%eax
.byte 102,15,112,196,78 // pshufd $0x4e,%xmm4,%xmm0
@@ -72260,7 +72934,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,69,168 // movdqa -0x58(%ebp),%xmm0
.byte 102,15,254,193 // paddd %xmm1,%xmm0
.byte 102,15,112,224,245 // pshufd $0xf5,%xmm0,%xmm4
- .byte 102,15,111,145,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm2
+ .byte 102,15,111,145,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm2
.byte 102,15,244,194 // pmuludq %xmm2,%xmm0
.byte 102,15,112,216,232 // pshufd $0xe8,%xmm0,%xmm3
.byte 102,15,244,226 // pmuludq %xmm2,%xmm4
@@ -72283,7 +72957,7 @@ _sk_clut_4D_sse2:
.byte 15,20,196 // unpcklps %xmm4,%xmm0
.byte 15,41,133,120,255,255,255 // movaps %xmm0,-0x88(%ebp)
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
- .byte 102,15,111,145,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm2
+ .byte 102,15,111,145,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm2
.byte 102,15,254,226 // paddd %xmm2,%xmm4
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,232 // movd %xmm5,%eax
@@ -72299,7 +72973,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4
.byte 15,20,236 // unpcklps %xmm4,%xmm5
.byte 15,20,238 // unpcklps %xmm6,%xmm5
- .byte 102,15,254,153,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm3
+ .byte 102,15,254,153,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm3
.byte 102,15,112,227,229 // pshufd $0xe5,%xmm3,%xmm4
.byte 102,15,126,224 // movd %xmm4,%eax
.byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
@@ -72351,7 +73025,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,20,223 // unpcklps %xmm7,%xmm3
- .byte 102,15,254,161,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm4
+ .byte 102,15,254,161,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm4
.byte 102,15,112,212,229 // pshufd $0xe5,%xmm4,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,15,112,212,78 // pshufd $0x4e,%xmm4,%xmm2
@@ -72384,7 +73058,7 @@ _sk_clut_4D_sse2:
.byte 102,15,127,133,56,255,255,255 // movdqa %xmm0,-0xc8(%ebp)
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,208,245 // pshufd $0xf5,%xmm0,%xmm2
- .byte 102,15,111,137,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm1
+ .byte 102,15,111,137,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm1
.byte 102,15,244,193 // pmuludq %xmm1,%xmm0
.byte 102,15,112,240,232 // pshufd $0xe8,%xmm0,%xmm6
.byte 102,15,244,209 // pmuludq %xmm1,%xmm2
@@ -72406,7 +73080,7 @@ _sk_clut_4D_sse2:
.byte 15,20,194 // unpcklps %xmm2,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 102,15,111,214 // movdqa %xmm6,%xmm2
- .byte 102,15,111,153,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm3
+ .byte 102,15,111,153,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,234,229 // pshufd $0xe5,%xmm2,%xmm5
.byte 102,15,126,232 // movd %xmm5,%eax
@@ -72422,7 +73096,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
.byte 15,20,234 // unpcklps %xmm2,%xmm5
.byte 15,20,239 // unpcklps %xmm7,%xmm5
- .byte 102,15,254,177,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm6
+ .byte 102,15,254,177,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm6
.byte 102,15,112,214,229 // pshufd $0xe5,%xmm6,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,15,112,214,78 // pshufd $0x4e,%xmm6,%xmm2
@@ -72475,7 +73149,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
.byte 15,20,216 // unpcklps %xmm0,%xmm3
.byte 15,20,218 // unpcklps %xmm2,%xmm3
- .byte 102,15,254,185,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm7
+ .byte 102,15,254,185,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm7
.byte 102,15,112,199,229 // pshufd $0xe5,%xmm7,%xmm0
.byte 102,15,126,192 // movd %xmm0,%eax
.byte 102,15,112,199,78 // pshufd $0x4e,%xmm7,%xmm0
@@ -72525,7 +73199,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,153,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm3
+ .byte 102,15,111,153,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm3
.byte 102,15,244,195 // pmuludq %xmm3,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
@@ -72547,7 +73221,7 @@ _sk_clut_4D_sse2:
.byte 15,20,193 // unpcklps %xmm1,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
- .byte 102,15,111,177,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm6
+ .byte 102,15,111,177,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm6
.byte 102,15,254,206 // paddd %xmm6,%xmm1
.byte 102,15,112,217,229 // pshufd $0xe5,%xmm1,%xmm3
.byte 102,15,126,216 // movd %xmm3,%eax
@@ -72563,7 +73237,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,203 // unpcklps %xmm3,%xmm1
- .byte 102,15,111,185,235,42,0,0 // movdqa 0x2aeb(%ecx),%xmm7
+ .byte 102,15,111,185,92,43,0,0 // movdqa 0x2b5c(%ecx),%xmm7
.byte 102,15,254,215 // paddd %xmm7,%xmm2
.byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3
.byte 102,15,126,216 // movd %xmm3,%eax
@@ -72582,7 +73256,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,221 // movdqa %xmm5,%xmm3
.byte 102,15,254,93,184 // paddd -0x48(%ebp),%xmm3
.byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
- .byte 102,15,111,129,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm0
+ .byte 102,15,111,129,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm0
.byte 102,15,244,216 // pmuludq %xmm0,%xmm3
.byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
.byte 102,15,244,224 // pmuludq %xmm0,%xmm4
@@ -72651,7 +73325,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,193 // paddd %xmm1,%xmm0
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,145,203,42,0,0 // movdqa 0x2acb(%ecx),%xmm2
+ .byte 102,15,111,145,60,43,0,0 // movdqa 0x2b3c(%ecx),%xmm2
.byte 102,15,244,194 // pmuludq %xmm2,%xmm0
.byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
.byte 102,15,244,202 // pmuludq %xmm2,%xmm1
@@ -72674,7 +73348,7 @@ _sk_clut_4D_sse2:
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,41,93,168 // movaps %xmm3,-0x58(%ebp)
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,137,219,42,0,0 // paddd 0x2adb(%ecx),%xmm1
+ .byte 102,15,254,137,76,43,0,0 // paddd 0x2b4c(%ecx),%xmm1
.byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
@@ -72690,7 +73364,7 @@ _sk_clut_4D_sse2:
.byte 15,20,217 // unpcklps %xmm1,%xmm3
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
- .byte 102,15,254,129,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm0
+ .byte 102,15,254,129,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
.byte 102,15,126,200 // movd %xmm1,%eax
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
@@ -72727,7 +73401,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,60,178 // movss (%edx,%esi,4),%xmm7
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
- .byte 102,15,111,177,219,42,0,0 // movdqa 0x2adb(%ecx),%xmm6
+ .byte 102,15,111,177,76,43,0,0 // movdqa 0x2b4c(%ecx),%xmm6
.byte 102,15,254,242 // paddd %xmm2,%xmm6
.byte 102,15,112,206,229 // pshufd $0xe5,%xmm6,%xmm1
.byte 102,15,126,200 // movd %xmm1,%eax
@@ -72743,7 +73417,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,52,178 // movss (%edx,%esi,4),%xmm6
.byte 15,20,206 // unpcklps %xmm6,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,254,145,235,42,0,0 // paddd 0x2aeb(%ecx),%xmm2
+ .byte 102,15,254,145,92,43,0,0 // paddd 0x2b5c(%ecx),%xmm2
.byte 102,15,112,242,229 // pshufd $0xe5,%xmm2,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
.byte 102,15,112,242,78 // pshufd $0x4e,%xmm2,%xmm6
@@ -72813,7 +73487,7 @@ _sk_clut_4D_sse2:
.byte 139,117,12 // mov 0xc(%ebp),%esi
.byte 141,86,8 // lea 0x8(%esi),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,153,251,42,0,0 // movaps 0x2afb(%ecx),%xmm3
+ .byte 15,40,153,108,43,0,0 // movaps 0x2b6c(%ecx),%xmm3
.byte 82 // push %edx
.byte 80 // push %eax
.byte 255,86,4 // call *0x4(%esi)
@@ -72974,16 +73648,22 @@ BALIGN16
.byte 63 // aas
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
- .byte 0,128,191,0,0,128 // add %al,-0x7fffff41(%eax)
+ .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
+ .byte 63 // aas
+ .byte 0,0 // add %al,(%eax)
+ .byte 128,63,0 // cmpb $0x0,(%edi)
+ .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
.byte 191,0,0,128,191 // mov $0xbf800000,%edi
.byte 0,0 // add %al,(%eax)
- .byte 128,191,0,0,224,64,0 // cmpb $0x0,0x40e00000(%edi)
+ .byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%edi)
.byte 0,224 // add %ah,%al
.byte 64 // inc %eax
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne 937c <.literal16+0x1fc>
+ .byte 224,64 // loopne 9508 <.literal16+0x208>
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne 9380 <.literal16+0x200>
+ .byte 224,64 // loopne 950c <.literal16+0x20c>
+ .byte 0,0 // add %al,(%eax)
+ .byte 224,64 // loopne 9510 <.literal16+0x210>
.byte 154,153,153,62,154,153,153 // lcall $0x9999,$0x9a3e9999
.byte 62,154,153,153,62,154,153,153 // ds lcall $0x9999,$0x9a3e9999
.byte 62,61,10,23,63,61 // ds cmp $0x3d3f170a,%eax
@@ -72994,16 +73674,16 @@ BALIGN16
.byte 63 // aas
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93a1 <.literal16+0x221>
+ .byte 225,61 // loope 9531 <.literal16+0x231>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93a5 <.literal16+0x225>
+ .byte 225,61 // loope 9535 <.literal16+0x235>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93a9 <.literal16+0x229>
+ .byte 225,61 // loope 9539 <.literal16+0x239>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93ad <.literal16+0x22d>
+ .byte 225,61 // loope 953d <.literal16+0x23d>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73020,16 +73700,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 93e1 <.literal16+0x261>
+ .byte 225,61 // loope 9571 <.literal16+0x271>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93e5 <.literal16+0x265>
+ .byte 225,61 // loope 9575 <.literal16+0x275>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93e9 <.literal16+0x269>
+ .byte 225,61 // loope 9579 <.literal16+0x279>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 93ed <.literal16+0x26d>
+ .byte 225,61 // loope 957d <.literal16+0x27d>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73046,16 +73726,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 9421 <.literal16+0x2a1>
+ .byte 225,61 // loope 95b1 <.literal16+0x2b1>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9425 <.literal16+0x2a5>
+ .byte 225,61 // loope 95b5 <.literal16+0x2b5>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9429 <.literal16+0x2a9>
+ .byte 225,61 // loope 95b9 <.literal16+0x2b9>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 942d <.literal16+0x2ad>
+ .byte 225,61 // loope 95bd <.literal16+0x2bd>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73072,16 +73752,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 9461 <.literal16+0x2e1>
+ .byte 225,61 // loope 95f1 <.literal16+0x2f1>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9465 <.literal16+0x2e5>
+ .byte 225,61 // loope 95f5 <.literal16+0x2f5>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 9469 <.literal16+0x2e9>
+ .byte 225,61 // loope 95f9 <.literal16+0x2f9>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 946d <.literal16+0x2ed>
+ .byte 225,61 // loope 95fd <.literal16+0x2fd>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73103,11 +73783,11 @@ BALIGN16
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%eax)
.byte 67 // inc %ebx
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 94ab <.literal16+0x32b>
+ .byte 127,67 // jg 963b <.literal16+0x33b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 94af <.literal16+0x32f>
+ .byte 127,67 // jg 963f <.literal16+0x33f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 94b3 <.literal16+0x333>
+ .byte 127,67 // jg 9643 <.literal16+0x343>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73357,7 +74037,53 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%eax)
.byte 128,59,129 // cmpb $0x81,(%ebx)
- .byte 128,128,59,255,0,0,0 // addb $0x0,0xff3b(%eax)
+ .byte 128,128,59,0,248,0,0 // addb $0x0,0xf8003b(%eax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 8,33 // or %ah,(%ecx)
+ .byte 132,55 // test %dh,(%edi)
+ .byte 8,33 // or %ah,(%ecx)
+ .byte 132,55 // test %dh,(%edi)
+ .byte 8,33 // or %ah,(%ecx)
+ .byte 132,55 // test %dh,(%edi)
+ .byte 8,33 // or %ah,(%ecx)
+ .byte 132,55 // test %dh,(%edi)
+ .byte 224,7 // loopne 9879 <.literal16+0x579>
+ .byte 0,0 // add %al,(%eax)
+ .byte 224,7 // loopne 987d <.literal16+0x57d>
+ .byte 0,0 // add %al,(%eax)
+ .byte 224,7 // loopne 9881 <.literal16+0x581>
+ .byte 0,0 // add %al,(%eax)
+ .byte 224,7 // loopne 9885 <.literal16+0x585>
+ .byte 0,0 // add %al,(%eax)
+ .byte 33,8 // and %ecx,(%eax)
+ .byte 2,58 // add (%edx),%bh
+ .byte 33,8 // and %ecx,(%eax)
+ .byte 2,58 // add (%edx),%bh
+ .byte 33,8 // and %ecx,(%eax)
+ .byte 2,58 // add (%edx),%bh
+ .byte 33,8 // and %ecx,(%eax)
+ .byte 2,58 // add (%edx),%bh
+ .byte 31 // pop %ds
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,31 // add %bl,(%edi)
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,31 // add %bl,(%edi)
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,31 // add %bl,(%edi)
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,8 // add %cl,(%eax)
+ .byte 33,4,61,8,33,4,61 // and %eax,0x3d042108(,%edi,1)
+ .byte 8,33 // or %ah,(%ecx)
+ .byte 4,61 // add $0x3d,%al
+ .byte 8,33 // or %ah,(%ecx)
+ .byte 4,61 // add $0x3d,%al
+ .byte 255,0 // incl (%eax)
+ .byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -73381,13 +74107,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 9709 <.literal16+0x589>
+ .byte 224,7 // loopne 98f9 <.literal16+0x5f9>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 970d <.literal16+0x58d>
+ .byte 224,7 // loopne 98fd <.literal16+0x5fd>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9711 <.literal16+0x591>
+ .byte 224,7 // loopne 9901 <.literal16+0x601>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9715 <.literal16+0x595>
+ .byte 224,7 // loopne 9905 <.literal16+0x605>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -73436,11 +74162,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,127,67 // add %bh,0x43(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 97cb <.literal16+0x64b>
+ .byte 127,67 // jg 99bb <.literal16+0x6bb>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 97cf <.literal16+0x64f>
+ .byte 127,67 // jg 99bf <.literal16+0x6bf>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 97d3 <.literal16+0x653>
+ .byte 127,67 // jg 99c3 <.literal16+0x6c3>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%eax)
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%eax)
@@ -73455,16 +74181,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 97c4 <.literal16+0x644>
+ .byte 127,0 // jg 99b4 <.literal16+0x6b4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 97c8 <.literal16+0x648>
+ .byte 127,0 // jg 99b8 <.literal16+0x6b8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 97cc <.literal16+0x64c>
+ .byte 127,0 // jg 99bc <.literal16+0x6bc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 97d0 <.literal16+0x650>
+ .byte 127,0 // jg 99c0 <.literal16+0x6c0>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -73473,7 +74199,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 9855 <.literal16+0x6d5>
+ .byte 119,115 // ja 9a45 <.literal16+0x745>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -73484,7 +74210,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 97b9 <.literal16+0x639>
+ .byte 117,191 // jne 99a9 <.literal16+0x6a9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -73500,7 +74226,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3d7f6 <_sk_clut_4D_sse2+0xe9a35c5a>
+ .byte 233,220,63,163,233 // jmp e9a3d9e6 <_sk_clut_4D_sse2+0xe9a35ccb>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73555,16 +74281,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 9894 <.literal16+0x714>
+ .byte 127,0 // jg 9a84 <.literal16+0x784>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9898 <.literal16+0x718>
+ .byte 127,0 // jg 9a88 <.literal16+0x788>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 989c <.literal16+0x71c>
+ .byte 127,0 // jg 9a8c <.literal16+0x78c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 98a0 <.literal16+0x720>
+ .byte 127,0 // jg 9a90 <.literal16+0x790>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -73573,7 +74299,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 9925 <.literal16+0x7a5>
+ .byte 119,115 // ja 9b15 <.literal16+0x815>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -73584,7 +74310,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 9889 <.literal16+0x709>
+ .byte 117,191 // jne 9a79 <.literal16+0x779>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -73600,7 +74326,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3d8c6 <_sk_clut_4D_sse2+0xe9a35d2a>
+ .byte 233,220,63,163,233 // jmp e9a3dab6 <_sk_clut_4D_sse2+0xe9a35d9b>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73655,16 +74381,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 9964 <.literal16+0x7e4>
+ .byte 127,0 // jg 9b54 <.literal16+0x854>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9968 <.literal16+0x7e8>
+ .byte 127,0 // jg 9b58 <.literal16+0x858>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 996c <.literal16+0x7ec>
+ .byte 127,0 // jg 9b5c <.literal16+0x85c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9970 <.literal16+0x7f0>
+ .byte 127,0 // jg 9b60 <.literal16+0x860>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -73673,7 +74399,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 99f5 <.literal16+0x875>
+ .byte 119,115 // ja 9be5 <.literal16+0x8e5>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -73684,7 +74410,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 9959 <.literal16+0x7d9>
+ .byte 117,191 // jne 9b49 <.literal16+0x849>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -73700,7 +74426,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3d996 <_sk_clut_4D_sse2+0xe9a35dfa>
+ .byte 233,220,63,163,233 // jmp e9a3db86 <_sk_clut_4D_sse2+0xe9a35e6b>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73755,16 +74481,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 9a34 <.literal16+0x8b4>
+ .byte 127,0 // jg 9c24 <.literal16+0x924>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9a38 <.literal16+0x8b8>
+ .byte 127,0 // jg 9c28 <.literal16+0x928>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9a3c <.literal16+0x8bc>
+ .byte 127,0 // jg 9c2c <.literal16+0x92c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9a40 <.literal16+0x8c0>
+ .byte 127,0 // jg 9c30 <.literal16+0x930>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -73773,7 +74499,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 9ac5 <.literal16+0x945>
+ .byte 119,115 // ja 9cb5 <.literal16+0x9b5>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -73784,7 +74510,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 9a29 <.literal16+0x8a9>
+ .byte 117,191 // jne 9c19 <.literal16+0x919>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -73800,7 +74526,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3da66 <_sk_clut_4D_sse2+0xe9a35eca>
+ .byte 233,220,63,163,233 // jmp e9a3dc56 <_sk_clut_4D_sse2+0xe9a35f3b>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73855,16 +74581,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 9b04 <.literal16+0x984>
+ .byte 127,0 // jg 9cf4 <.literal16+0x9f4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9b08 <.literal16+0x988>
+ .byte 127,0 // jg 9cf8 <.literal16+0x9f8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9b0c <.literal16+0x98c>
+ .byte 127,0 // jg 9cfc <.literal16+0x9fc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 9b10 <.literal16+0x990>
+ .byte 127,0 // jg 9d00 <.literal16+0xa00>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -73873,7 +74599,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 9b95 <.literal16+0xa15>
+ .byte 119,115 // ja 9d85 <.literal16+0xa85>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -73884,7 +74610,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 9af9 <.literal16+0x979>
+ .byte 117,191 // jne 9ce9 <.literal16+0x9e9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -73900,7 +74626,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3db36 <_sk_clut_4D_sse2+0xe9a35f9a>
+ .byte 233,220,63,163,233 // jmp e9a3dd26 <_sk_clut_4D_sse2+0xe9a3600b>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -73951,13 +74677,13 @@ BALIGN16
.byte 200,66,0,0 // enter $0x42,$0x0
.byte 200,66,0,0 // enter $0x42,$0x0
.byte 200,66,0,0 // enter $0x42,$0x0
- .byte 127,67 // jg 9c17 <.literal16+0xa97>
+ .byte 127,67 // jg 9e07 <.literal16+0xb07>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9c1b <.literal16+0xa9b>
+ .byte 127,67 // jg 9e0b <.literal16+0xb0b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9c1f <.literal16+0xa9f>
+ .byte 127,67 // jg 9e0f <.literal16+0xb0f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9c23 <.literal16+0xaa3>
+ .byte 127,67 // jg 9e13 <.literal16+0xb13>
.byte 0,0 // add %al,(%eax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%eax)
@@ -74008,16 +74734,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%ebx)
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 9ca3 <.literal16+0xb23>
+ .byte 118,63 // jbe 9e93 <.literal16+0xb93>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 9ca7 <.literal16+0xb27>
+ .byte 118,63 // jbe 9e97 <.literal16+0xb97>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 9cab <.literal16+0xb2b>
+ .byte 118,63 // jbe 9e9b <.literal16+0xb9b>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 9caf <.literal16+0xb2f>
+ .byte 118,63 // jbe 9e9f <.literal16+0xb9f>
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
@@ -74046,11 +74772,11 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%ebx)
.byte 0,127,67 // add %bh,0x43(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9d1b <.literal16+0xb9b>
+ .byte 127,67 // jg 9f0b <.literal16+0xc0b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9d1f <.literal16+0xb9f>
+ .byte 127,67 // jg 9f0f <.literal16+0xc0f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 9d23 <.literal16+0xba3>
+ .byte 127,67 // jg 9f13 <.literal16+0xc13>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 0,0 // add %al,(%eax)
@@ -74112,13 +74838,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 9d99 <.literal16+0xc19>
+ .byte 224,7 // loopne 9f89 <.literal16+0xc89>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9d9d <.literal16+0xc1d>
+ .byte 224,7 // loopne 9f8d <.literal16+0xc8d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9da1 <.literal16+0xc21>
+ .byte 224,7 // loopne 9f91 <.literal16+0xc91>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9da5 <.literal16+0xc25>
+ .byte 224,7 // loopne 9f95 <.literal16+0xc95>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -74164,13 +74890,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 9e09 <.literal16+0xc89>
+ .byte 224,7 // loopne 9ff9 <.literal16+0xcf9>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9e0d <.literal16+0xc8d>
+ .byte 224,7 // loopne 9ffd <.literal16+0xcfd>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9e11 <.literal16+0xc91>
+ .byte 224,7 // loopne a001 <.literal16+0xd01>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9e15 <.literal16+0xc95>
+ .byte 224,7 // loopne a005 <.literal16+0xd05>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -74216,13 +74942,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 9e79 <.literal16+0xcf9>
+ .byte 224,7 // loopne a069 <.literal16+0xd69>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9e7d <.literal16+0xcfd>
+ .byte 224,7 // loopne a06d <.literal16+0xd6d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9e81 <.literal16+0xd01>
+ .byte 224,7 // loopne a071 <.literal16+0xd71>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 9e85 <.literal16+0xd05>
+ .byte 224,7 // loopne a075 <.literal16+0xd75>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -74264,13 +74990,13 @@ BALIGN16
.byte 248 // clc
.byte 65 // inc %ecx
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 9f16 <.literal16+0xd96>
+ .byte 124,66 // jl a106 <.literal16+0xe06>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 9f1a <.literal16+0xd9a>
+ .byte 124,66 // jl a10a <.literal16+0xe0a>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 9f1e <.literal16+0xd9e>
+ .byte 124,66 // jl a10e <.literal16+0xe0e>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 9f22 <.literal16+0xda2>
+ .byte 124,66 // jl a112 <.literal16+0xe12>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%eax)
.byte 0,240 // add %dh,%al
@@ -74404,13 +75130,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%eax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo a0a5 <.literal16+0xf25>
+ .byte 112,65 // jo a295 <.literal16+0xf95>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo a0a9 <.literal16+0xf29>
+ .byte 112,65 // jo a299 <.literal16+0xf99>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo a0ad <.literal16+0xf2d>
+ .byte 112,65 // jo a29d <.literal16+0xf9d>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo a0b1 <.literal16+0xf31>
+ .byte 112,65 // jo a2a1 <.literal16+0xfa1>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -74441,11 +75167,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a11b <.literal16+0xf9b>
+ .byte 127,67 // jg a30b <.literal16+0x100b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a11f <.literal16+0xf9f>
+ .byte 127,67 // jg a30f <.literal16+0x100f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a123 <.literal16+0xfa3>
+ .byte 127,67 // jg a313 <.literal16+0x1013>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -74476,11 +75202,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a18b <.literal16+0x100b>
+ .byte 127,67 // jg a37b <.literal16+0x107b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a18f <.literal16+0x100f>
+ .byte 127,67 // jg a37f <.literal16+0x107f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg a193 <.literal16+0x1013>
+ .byte 127,67 // jg a383 <.literal16+0x1083>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax)
.byte 0,0 // add %al,(%eax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax)
@@ -74579,13 +75305,13 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 255 // (bad)
- .byte 127,71 // jg a2bb <.literal16+0x113b>
+ .byte 127,71 // jg a4ab <.literal16+0x11ab>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg a2bf <.literal16+0x113f>
+ .byte 127,71 // jg a4af <.literal16+0x11af>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg a2c3 <.literal16+0x1143>
+ .byte 127,71 // jg a4b3 <.literal16+0x11b3>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg a2c7 <.literal16+0x1147>
+ .byte 127,71 // jg a4b7 <.literal16+0x11b7>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -74693,7 +75419,7 @@ BALIGN16
.byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js a3cc <.literal16+0x124c>
+ .byte 120,57 // js a5bc <.literal16+0x12bc>
.byte 64 // inc %eax
.byte 18,120,57 // adc 0x39(%eax),%bh
.byte 64 // inc %eax
@@ -74886,11 +75612,11 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,114 // cmpb $0x72,(%edi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt a5b2 <.literal16+0x1432>
+ .byte 62,114,28 // jb,pt a7a2 <.literal16+0x14a2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a5b6 <.literal16+0x1436>
+ .byte 62,114,28 // jb,pt a7a6 <.literal16+0x14a6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a5ba <.literal16+0x143a>
+ .byte 62,114,28 // jb,pt a7aa <.literal16+0x14aa>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -74969,13 +75695,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%edi)
.byte 0,192 // add %al,%al
.byte 63 // aas
- .byte 114,28 // jb a67e <.literal16+0x14fe>
+ .byte 114,28 // jb a86e <.literal16+0x156e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a682 <.literal16+0x1502>
+ .byte 62,114,28 // jb,pt a872 <.literal16+0x1572>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a686 <.literal16+0x1506>
+ .byte 62,114,28 // jb,pt a876 <.literal16+0x1576>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a68a <.literal16+0x150a>
+ .byte 62,114,28 // jb,pt a87a <.literal16+0x157a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -74996,11 +75722,11 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,114 // cmpb $0x72,(%edi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt a6c2 <.literal16+0x1542>
+ .byte 62,114,28 // jb,pt a8b2 <.literal16+0x15b2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a6c6 <.literal16+0x1546>
+ .byte 62,114,28 // jb,pt a8b6 <.literal16+0x15b6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a6ca <.literal16+0x154a>
+ .byte 62,114,28 // jb,pt a8ba <.literal16+0x15ba>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -75079,13 +75805,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%edi)
.byte 0,192 // add %al,%al
.byte 63 // aas
- .byte 114,28 // jb a78e <.literal16+0x160e>
+ .byte 114,28 // jb a97e <.literal16+0x167e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a792 <.literal16+0x1612>
+ .byte 62,114,28 // jb,pt a982 <.literal16+0x1682>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a796 <.literal16+0x1616>
+ .byte 62,114,28 // jb,pt a986 <.literal16+0x1686>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt a79a <.literal16+0x161a>
+ .byte 62,114,28 // jb,pt a98a <.literal16+0x168a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -75095,14 +75821,14 @@ BALIGN16
.byte 170 // stos %al,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
.byte 190,171,170,170,190 // mov $0xbeaaaaab,%esi
- .byte 114,249 // jb a78b <.literal16+0x160b>
- .byte 127,63 // jg a7d3 <.literal16+0x1653>
- .byte 114,249 // jb a78f <.literal16+0x160f>
- .byte 127,63 // jg a7d7 <.literal16+0x1657>
- .byte 114,249 // jb a793 <.literal16+0x1613>
- .byte 127,63 // jg a7db <.literal16+0x165b>
- .byte 114,249 // jb a797 <.literal16+0x1617>
- .byte 127,63 // jg a7df <.literal16+0x165f>
+ .byte 114,249 // jb a97b <.literal16+0x167b>
+ .byte 127,63 // jg a9c3 <.literal16+0x16c3>
+ .byte 114,249 // jb a97f <.literal16+0x167f>
+ .byte 127,63 // jg a9c7 <.literal16+0x16c7>
+ .byte 114,249 // jb a983 <.literal16+0x1683>
+ .byte 127,63 // jg a9cb <.literal16+0x16cb>
+ .byte 114,249 // jb a987 <.literal16+0x1687>
+ .byte 127,63 // jg a9cf <.literal16+0x16cf>
.byte 3,0 // add (%eax),%eax
.byte 0,0 // add %al,(%eax)
.byte 3,0 // add (%eax),%eax
@@ -75127,14 +75853,14 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 2,0 // add (%eax),%al
.byte 0,0 // add %al,(%eax)
- .byte 114,249 // jb a7cb <.literal16+0x164b>
- .byte 127,63 // jg a813 <.literal16+0x1693>
- .byte 114,249 // jb a7cf <.literal16+0x164f>
- .byte 127,63 // jg a817 <.literal16+0x1697>
- .byte 114,249 // jb a7d3 <.literal16+0x1653>
- .byte 127,63 // jg a81b <.literal16+0x169b>
- .byte 114,249 // jb a7d7 <.literal16+0x1657>
- .byte 127,63 // jg a81f <.literal16+0x169f>
+ .byte 114,249 // jb a9bb <.literal16+0x16bb>
+ .byte 127,63 // jg aa03 <.literal16+0x1703>
+ .byte 114,249 // jb a9bf <.literal16+0x16bf>
+ .byte 127,63 // jg aa07 <.literal16+0x1707>
+ .byte 114,249 // jb a9c3 <.literal16+0x16c3>
+ .byte 127,63 // jg aa0b <.literal16+0x170b>
+ .byte 114,249 // jb a9c7 <.literal16+0x16c7>
+ .byte 127,63 // jg aa0f <.literal16+0x170f>
.byte 3,0 // add (%eax),%eax
.byte 0,0 // add %al,(%eax)
.byte 3,0 // add (%eax),%eax
diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S
index eee638a8c3..f681ed5531 100644
--- a/src/jumper/SkJumper_generated_win.S
+++ b/src/jumper/SkJumper_generated_win.S
@@ -101,7 +101,7 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,249,110,194 ; vmovd %edx,%xmm0
DB 196,226,125,88,192 ; vpbroadcastd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,45,180,2,0 ; vbroadcastss 0x2b42d(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,13,25,186,2,0 ; vbroadcastss 0x2ba19(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0
DB 197,249,110,209 ; vmovd %ecx,%xmm2
@@ -109,7 +109,7 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,13,180,2,0 ; vbroadcastss 0x2b40d(%rip),%ymm2 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,21,249,185,2,0 ; vbroadcastss 0x2b9f9(%rip),%ymm2 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -126,13 +126,13 @@ _sk_dither_hsw LABEL PROC
DB 197,121,110,201 ; vmovd %ecx,%xmm9
DB 196,66,125,88,201 ; vpbroadcastd %xmm9,%ymm9
DB 196,65,53,239,200 ; vpxor %ymm8,%ymm9,%ymm9
- DB 196,98,125,88,21,212,179,2,0 ; vpbroadcastd 0x2b3d4(%rip),%ymm10 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,88,21,192,185,2,0 ; vpbroadcastd 0x2b9c0(%rip),%ymm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,53,219,218 ; vpand %ymm10,%ymm9,%ymm11
DB 196,193,37,114,243,5 ; vpslld $0x5,%ymm11,%ymm11
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,193,45,114,242,4 ; vpslld $0x4,%ymm10,%ymm10
- DB 196,98,125,88,37,185,179,2,0 ; vpbroadcastd 0x2b3b9(%rip),%ymm12 # 2b598 <_sk_overlay_sse2_8bit+0x477>
- DB 196,98,125,88,45,180,179,2,0 ; vpbroadcastd 0x2b3b4(%rip),%ymm13 # 2b59c <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,125,88,37,165,185,2,0 ; vpbroadcastd 0x2b9a5(%rip),%ymm12 # 2bb84 <_sk_overlay_sse2_8bit+0x477>
+ DB 196,98,125,88,45,160,185,2,0 ; vpbroadcastd 0x2b9a0(%rip),%ymm13 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
DB 196,65,53,219,245 ; vpand %ymm13,%ymm9,%ymm14
DB 196,193,13,114,246,2 ; vpslld $0x2,%ymm14,%ymm14
DB 196,65,61,219,237 ; vpand %ymm13,%ymm8,%ymm13
@@ -147,8 +147,8 @@ _sk_dither_hsw LABEL PROC
DB 196,65,61,235,194 ; vpor %ymm10,%ymm8,%ymm8
DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,102,179,2,0 ; vbroadcastss 0x2b366(%rip),%ymm9 # 2b5a0 <_sk_overlay_sse2_8bit+0x47f>
- DB 196,98,125,24,21,97,179,2,0 ; vbroadcastss 0x2b361(%rip),%ymm10 # 2b5a4 <_sk_overlay_sse2_8bit+0x483>
+ DB 196,98,125,24,13,82,185,2,0 ; vbroadcastss 0x2b952(%rip),%ymm9 # 2bb8c <_sk_overlay_sse2_8bit+0x47f>
+ DB 196,98,125,24,21,77,185,2,0 ; vbroadcastss 0x2b94d(%rip),%ymm10 # 2bb90 <_sk_overlay_sse2_8bit+0x483>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 196,98,125,24,0 ; vbroadcastss (%rax),%ymm8
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
@@ -178,7 +178,7 @@ _sk_uniform_color_hsw LABEL PROC
PUBLIC _sk_black_color_hsw
_sk_black_color_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,233,178,2,0 ; vbroadcastss 0x2b2e9(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,213,184,2,0 ; vbroadcastss 0x2b8d5(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
@@ -187,7 +187,7 @@ _sk_black_color_hsw LABEL PROC
PUBLIC _sk_white_color_hsw
_sk_white_color_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,208,178,2,0 ; vbroadcastss 0x2b2d0(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,188,184,2,0 ; vbroadcastss 0x2b8bc(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
@@ -225,7 +225,7 @@ _sk_clear_hsw LABEL PROC
PUBLIC _sk_srcatop_hsw
_sk_srcatop_hsw LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,111,178,2,0 ; vbroadcastss 0x2b26f(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,91,184,2,0 ; vbroadcastss 0x2b85b(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,226,61,184,196 ; vfmadd231ps %ymm4,%ymm8,%ymm0
DB 197,244,89,207 ; vmulps %ymm7,%ymm1,%ymm1
@@ -239,7 +239,7 @@ _sk_srcatop_hsw LABEL PROC
PUBLIC _sk_dstatop_hsw
_sk_dstatop_hsw LABEL PROC
- DB 196,98,125,24,5,62,178,2,0 ; vbroadcastss 0x2b23e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,42,184,2,0 ; vbroadcastss 0x2b82a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,226,101,184,196 ; vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -272,7 +272,7 @@ _sk_dstin_hsw LABEL PROC
PUBLIC _sk_srcout_hsw
_sk_srcout_hsw LABEL PROC
- DB 196,98,125,24,5,225,177,2,0 ; vbroadcastss 0x2b1e1(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,205,183,2,0 ; vbroadcastss 0x2b7cd(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -283,7 +283,7 @@ _sk_srcout_hsw LABEL PROC
PUBLIC _sk_dstout_hsw
_sk_dstout_hsw LABEL PROC
- DB 196,226,125,24,5,192,177,2,0 ; vbroadcastss 0x2b1c0(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,172,183,2,0 ; vbroadcastss 0x2b7ac(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -294,7 +294,7 @@ _sk_dstout_hsw LABEL PROC
PUBLIC _sk_srcover_hsw
_sk_srcover_hsw LABEL PROC
- DB 196,98,125,24,5,159,177,2,0 ; vbroadcastss 0x2b19f(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,139,183,2,0 ; vbroadcastss 0x2b78b(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,194,85,184,200 ; vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -305,7 +305,7 @@ _sk_srcover_hsw LABEL PROC
PUBLIC _sk_dstover_hsw
_sk_dstover_hsw LABEL PROC
- DB 196,98,125,24,5,122,177,2,0 ; vbroadcastss 0x2b17a(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,102,183,2,0 ; vbroadcastss 0x2b766(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
DB 196,226,61,168,205 ; vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -325,7 +325,7 @@ _sk_modulate_hsw LABEL PROC
PUBLIC _sk_multiply_hsw
_sk_multiply_hsw LABEL PROC
- DB 196,98,125,24,5,65,177,2,0 ; vbroadcastss 0x2b141(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,45,183,2,0 ; vbroadcastss 0x2b72d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -346,9 +346,14 @@ _sk_multiply_hsw LABEL PROC
PUBLIC _sk_plus__hsw
_sk_plus__hsw LABEL PROC
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
+ DB 196,98,125,24,5,220,182,2,0 ; vbroadcastss 0x2b6dc(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 197,244,88,205 ; vaddps %ymm5,%ymm1,%ymm1
+ DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 197,236,88,214 ; vaddps %ymm6,%ymm2,%ymm2
+ DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3
+ DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -367,7 +372,7 @@ _sk_screen_hsw LABEL PROC
PUBLIC _sk_xor__hsw
_sk_xor__hsw LABEL PROC
- DB 196,98,125,24,5,184,176,2,0 ; vbroadcastss 0x2b0b8(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,135,182,2,0 ; vbroadcastss 0x2b687(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -399,7 +404,7 @@ _sk_darken_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,60,176,2,0 ; vbroadcastss 0x2b03c(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,11,182,2,0 ; vbroadcastss 0x2b60b(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -422,7 +427,7 @@ _sk_lighten_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,231,175,2,0 ; vbroadcastss 0x2afe7(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,182,181,2,0 ; vbroadcastss 0x2b5b6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -448,7 +453,7 @@ _sk_difference_hsw LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,134,175,2,0 ; vbroadcastss 0x2af86(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,85,181,2,0 ; vbroadcastss 0x2b555(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -468,7 +473,7 @@ _sk_exclusion_hsw LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,64,175,2,0 ; vbroadcastss 0x2af40(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,15,181,2,0 ; vbroadcastss 0x2b50f(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -476,7 +481,7 @@ _sk_exclusion_hsw LABEL PROC
PUBLIC _sk_colorburn_hsw
_sk_colorburn_hsw LABEL PROC
- DB 196,98,125,24,5,42,175,2,0 ; vbroadcastss 0x2af2a(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,249,180,2,0 ; vbroadcastss 0x2b4f9(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -532,7 +537,7 @@ _sk_colorburn_hsw LABEL PROC
PUBLIC _sk_colordodge_hsw
_sk_colordodge_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,58,174,2,0 ; vbroadcastss 0x2ae3a(%rip),%ymm9 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,13,9,180,2,0 ; vbroadcastss 0x2b409(%rip),%ymm9 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -583,7 +588,7 @@ _sk_colordodge_hsw LABEL PROC
PUBLIC _sk_hardlight_hsw
_sk_hardlight_hsw LABEL PROC
- DB 196,98,125,24,5,84,173,2,0 ; vbroadcastss 0x2ad54(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,35,179,2,0 ; vbroadcastss 0x2b323(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -632,7 +637,7 @@ _sk_hardlight_hsw LABEL PROC
PUBLIC _sk_overlay_hsw
_sk_overlay_hsw LABEL PROC
- DB 196,98,125,24,5,136,172,2,0 ; vbroadcastss 0x2ac88(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,87,178,2,0 ; vbroadcastss 0x2b257(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -692,10 +697,10 @@ _sk_softlight_hsw LABEL PROC
DB 196,65,20,88,197 ; vaddps %ymm13,%ymm13,%ymm8
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,66,61,168,192 ; vfmadd213ps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,29,159,171,2,0 ; vbroadcastss 0x2ab9f(%rip),%ymm11 # 2b5a8 <_sk_overlay_sse2_8bit+0x487>
+ DB 196,98,125,24,29,110,177,2,0 ; vbroadcastss 0x2b16e(%rip),%ymm11 # 2bb94 <_sk_overlay_sse2_8bit+0x487>
DB 196,65,20,88,227 ; vaddps %ymm11,%ymm13,%ymm12
DB 196,65,28,89,192 ; vmulps %ymm8,%ymm12,%ymm8
- DB 196,98,125,24,37,144,171,2,0 ; vbroadcastss 0x2ab90(%rip),%ymm12 # 2b5ac <_sk_overlay_sse2_8bit+0x48b>
+ DB 196,98,125,24,37,95,177,2,0 ; vbroadcastss 0x2b15f(%rip),%ymm12 # 2bb98 <_sk_overlay_sse2_8bit+0x48b>
DB 196,66,21,184,196 ; vfmadd231ps %ymm12,%ymm13,%ymm8
DB 196,65,124,82,245 ; vrsqrtps %ymm13,%ymm14
DB 196,65,124,83,246 ; vrcpps %ymm14,%ymm14
@@ -705,7 +710,7 @@ _sk_softlight_hsw LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,63,171,2,0 ; vbroadcastss 0x2ab3f(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,14,177,2,0 ; vbroadcastss 0x2b10e(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,65,60,92,237 ; vsubps %ymm13,%ymm8,%ymm13
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,98,125,168,235 ; vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -818,11 +823,11 @@ _sk_hue_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,82,169,2,0 ; vbroadcastss 0x2a952(%rip),%ymm14 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
- DB 196,98,125,24,61,77,169,2,0 ; vbroadcastss 0x2a94d(%rip),%ymm15 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,53,33,175,2,0 ; vbroadcastss 0x2af21(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,61,28,175,2,0 ; vbroadcastss 0x2af1c(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,62,169,2,0 ; vbroadcastss 0x2a93e(%rip),%ymm0 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,226,125,24,5,13,175,2,0 ; vbroadcastss 0x2af0d(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -877,7 +882,7 @@ _sk_hue_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,255,167,2,0 ; vbroadcastss 0x2a7ff(%rip),%ymm1 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,13,206,173,2,0 ; vbroadcastss 0x2adce(%rip),%ymm1 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -931,11 +936,11 @@ _sk_saturation_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,44,167,2,0 ; vbroadcastss 0x2a72c(%rip),%ymm14 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
- DB 196,98,125,24,61,39,167,2,0 ; vbroadcastss 0x2a727(%rip),%ymm15 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,53,251,172,2,0 ; vbroadcastss 0x2acfb(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,61,246,172,2,0 ; vbroadcastss 0x2acf6(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,24,167,2,0 ; vbroadcastss 0x2a718(%rip),%ymm0 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,226,125,24,5,231,172,2,0 ; vbroadcastss 0x2ace7(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -990,7 +995,7 @@ _sk_saturation_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,217,165,2,0 ; vbroadcastss 0x2a5d9(%rip),%ymm1 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,13,168,171,2,0 ; vbroadcastss 0x2aba8(%rip),%ymm1 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -1018,11 +1023,11 @@ _sk_color_hsw LABEL PROC
DB 197,108,89,199 ; vmulps %ymm7,%ymm2,%ymm8
DB 197,116,89,215 ; vmulps %ymm7,%ymm1,%ymm10
DB 197,52,89,223 ; vmulps %ymm7,%ymm9,%ymm11
- DB 196,98,125,24,45,136,165,2,0 ; vbroadcastss 0x2a588(%rip),%ymm13 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
- DB 196,98,125,24,53,131,165,2,0 ; vbroadcastss 0x2a583(%rip),%ymm14 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,45,87,171,2,0 ; vbroadcastss 0x2ab57(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,53,82,171,2,0 ; vbroadcastss 0x2ab52(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,230 ; vmulps %ymm14,%ymm5,%ymm12
DB 196,66,93,184,229 ; vfmadd231ps %ymm13,%ymm4,%ymm12
- DB 196,98,125,24,61,116,165,2,0 ; vbroadcastss 0x2a574(%rip),%ymm15 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,98,125,24,61,67,171,2,0 ; vbroadcastss 0x2ab43(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 196,66,77,184,231 ; vfmadd231ps %ymm15,%ymm6,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1078,7 +1083,7 @@ _sk_color_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,42,164,2,0 ; vbroadcastss 0x2a42a(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,249,169,2,0 ; vbroadcastss 0x2a9f9(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1106,11 +1111,11 @@ _sk_luminosity_hsw LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,213 ; vmulps %ymm5,%ymm3,%ymm10
DB 197,100,89,222 ; vmulps %ymm6,%ymm3,%ymm11
- DB 196,98,125,24,45,217,163,2,0 ; vbroadcastss 0x2a3d9(%rip),%ymm13 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
- DB 196,98,125,24,53,212,163,2,0 ; vbroadcastss 0x2a3d4(%rip),%ymm14 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,45,168,169,2,0 ; vbroadcastss 0x2a9a8(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,53,163,169,2,0 ; vbroadcastss 0x2a9a3(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,116,89,230 ; vmulps %ymm14,%ymm1,%ymm12
DB 196,66,109,184,229 ; vfmadd231ps %ymm13,%ymm2,%ymm12
- DB 196,98,125,24,61,197,163,2,0 ; vbroadcastss 0x2a3c5(%rip),%ymm15 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,98,125,24,61,148,169,2,0 ; vbroadcastss 0x2a994(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 196,66,53,184,231 ; vfmadd231ps %ymm15,%ymm9,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1166,7 +1171,7 @@ _sk_luminosity_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,123,162,2,0 ; vbroadcastss 0x2a27b(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,74,168,2,0 ; vbroadcastss 0x2a84a(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1195,19 +1200,19 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,180,0,0,0 ; jne 142f <_sk_srcover_rgba_8888_hsw+0xd5>
+ DB 15,133,180,0,0,0 ; jne 144c <_sk_srcover_rgba_8888_hsw+0xd5>
DB 196,193,126,111,60,153 ; vmovdqu (%r9,%rbx,4),%ymm7
- DB 197,197,219,37,183,163,2,0 ; vpand 0x2a3b7(%rip),%ymm7,%ymm4 # 2b740 <_sk_overlay_sse2_8bit+0x61f>
+ DB 197,197,219,37,122,169,2,0 ; vpand 0x2a97a(%rip),%ymm7,%ymm4 # 2bd20 <_sk_overlay_sse2_8bit+0x613>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,69,0,45,202,163,2,0 ; vpshufb 0x2a3ca(%rip),%ymm7,%ymm5 # 2b760 <_sk_overlay_sse2_8bit+0x63f>
+ DB 196,226,69,0,45,141,169,2,0 ; vpshufb 0x2a98d(%rip),%ymm7,%ymm5 # 2bd40 <_sk_overlay_sse2_8bit+0x633>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,69,0,53,221,163,2,0 ; vpshufb 0x2a3dd(%rip),%ymm7,%ymm6 # 2b780 <_sk_overlay_sse2_8bit+0x65f>
+ DB 196,226,69,0,53,160,169,2,0 ; vpshufb 0x2a9a0(%rip),%ymm7,%ymm6 # 2bd60 <_sk_overlay_sse2_8bit+0x653>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,215,161,2,0 ; vbroadcastss 0x2a1d7(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,166,167,2,0 ; vbroadcastss 0x2a7a6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,246,161,2,0 ; vbroadcastss 0x2a1f6(%rip),%ymm9 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,13,197,167,2,0 ; vbroadcastss 0x2a7c5(%rip),%ymm9 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -1227,7 +1232,7 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 196,65,53,235,202 ; vpor %ymm10,%ymm9,%ymm9
DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 1466 <_sk_srcover_rgba_8888_hsw+0x10c>
+ DB 117,66 ; jne 1483 <_sk_srcover_rgba_8888_hsw+0x10c>
DB 196,65,126,127,4,153 ; vmovdqu %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -1237,33 +1242,33 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,58,255,255,255 ; ja 1381 <_sk_srcover_rgba_8888_hsw+0x27>
+ DB 15,135,58,255,255,255 ; ja 139e <_sk_srcover_rgba_8888_hsw+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,254,0,0,0 ; lea 0xfe(%rip),%r11 # 1550 <_sk_srcover_rgba_8888_hsw+0x1f6>
+ DB 76,141,29,253,0,0,0 ; lea 0xfd(%rip),%r11 # 156c <_sk_srcover_rgba_8888_hsw+0x1f5>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,60,153 ; vmovd (%r9,%rbx,4),%xmm7
- DB 233,27,255,255,255 ; jmpq 1381 <_sk_srcover_rgba_8888_hsw+0x27>
+ DB 233,27,255,255,255 ; jmpq 139e <_sk_srcover_rgba_8888_hsw+0x27>
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,180 ; ja 142a <_sk_srcover_rgba_8888_hsw+0xd0>
+ DB 119,180 ; ja 1447 <_sk_srcover_rgba_8888_hsw+0xd0>
DB 65,15,182,194 ; movzbl %r10b,%eax
- DB 76,141,21,235,0,0,0 ; lea 0xeb(%rip),%r10 # 156c <_sk_srcover_rgba_8888_hsw+0x212>
+ DB 76,141,21,234,0,0,0 ; lea 0xea(%rip),%r10 # 1588 <_sk_srcover_rgba_8888_hsw+0x211>
DB 73,99,4,130 ; movslq (%r10,%rax,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,152 ; jmp 142a <_sk_srcover_rgba_8888_hsw+0xd0>
+ DB 235,152 ; jmp 1447 <_sk_srcover_rgba_8888_hsw+0xd0>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
DB 196,227,85,2,252,4 ; vpblendd $0x4,%ymm4,%ymm5,%ymm7
DB 196,193,122,126,36,153 ; vmovq (%r9,%rbx,4),%xmm4
DB 196,227,69,2,252,3 ; vpblendd $0x3,%ymm4,%ymm7,%ymm7
- DB 233,200,254,255,255 ; jmpq 1381 <_sk_srcover_rgba_8888_hsw+0x27>
+ DB 233,200,254,255,255 ; jmpq 139e <_sk_srcover_rgba_8888_hsw+0x27>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -1276,10 +1281,10 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 196,227,69,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm7,%ymm7
DB 196,193,122,111,36,153 ; vmovdqu (%r9,%rbx,4),%xmm4
DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- DB 233,121,254,255,255 ; jmpq 1381 <_sk_srcover_rgba_8888_hsw+0x27>
+ DB 233,121,254,255,255 ; jmpq 139e <_sk_srcover_rgba_8888_hsw+0x27>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 233,15,255,255,255 ; jmpq 142a <_sk_srcover_rgba_8888_hsw+0xd0>
+ DB 233,15,255,255,255 ; jmpq 1447 <_sk_srcover_rgba_8888_hsw+0xd0>
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
@@ -1287,35 +1292,33 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,65,121,126,76,153,16 ; vmovd %xmm9,0x10(%r9,%rbx,4)
DB 196,65,122,127,4,153 ; vmovdqu %xmm8,(%r9,%rbx,4)
- DB 233,219,254,255,255 ; jmpq 142a <_sk_srcover_rgba_8888_hsw+0xd0>
- DB 144 ; nop
- DB 11,255 ; or %edi,%edi
+ DB 233,219,254,255,255 ; jmpq 1447 <_sk_srcover_rgba_8888_hsw+0xd0>
+ DB 12,255 ; or $0xff,%al
DB 255 ; (bad)
- DB 255,88,255 ; lcall *-0x1(%rax)
+ DB 255,89,255 ; lcall *-0x1(%rcx)
DB 255 ; (bad)
- DB 255,66,255 ; incl -0x1(%rdx)
+ DB 255,67,255 ; incl -0x1(%rbx)
DB 255 ; (bad)
- DB 255,167,255,255,255,147 ; jmpq *-0x6c000001(%rdi)
+ DB 255,168,255,255,255,148 ; ljmp *-0x6b000001(%rax)
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,128,255,255,255,106 ; incl 0x6affffff(%rax)
DB 255 ; (bad)
- DB 127,255 ; jg 1565 <_sk_srcover_rgba_8888_hsw+0x20b>
DB 255 ; (bad)
- DB 255,105,255 ; ljmp *-0x1(%rcx)
+ DB 255,31 ; lcall *(%rdi)
DB 255 ; (bad)
- DB 255,30 ; lcall *(%rsi)
DB 255 ; (bad)
+ DB 255,165,255,255,255,157 ; jmpq *-0x62000001(%rbp)
DB 255 ; (bad)
- DB 255,164,255,255,255,156,255 ; jmpq *-0x630001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 216,255 ; fdivr %st(7),%st
+ DB 217,255 ; fcos
DB 255 ; (bad)
- DB 255,203 ; dec %ebx
+ DB 255,204 ; dec %esp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 189,255,255,255,175 ; mov $0xafffffff,%ebp
+ DB 190,255,255,255,176 ; mov $0xb0ffffff,%esi
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -1332,7 +1335,7 @@ _sk_clamp_0_hsw LABEL PROC
PUBLIC _sk_clamp_1_hsw
_sk_clamp_1_hsw LABEL PROC
- DB 196,98,125,24,5,226,159,2,0 ; vbroadcastss 0x29fe2(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,178,165,2,0 ; vbroadcastss 0x2a5b2(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -1342,7 +1345,7 @@ _sk_clamp_1_hsw LABEL PROC
PUBLIC _sk_clamp_a_hsw
_sk_clamp_a_hsw LABEL PROC
- DB 196,98,125,24,5,193,159,2,0 ; vbroadcastss 0x29fc1(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,145,165,2,0 ; vbroadcastss 0x2a591(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -1352,7 +1355,7 @@ _sk_clamp_a_hsw LABEL PROC
PUBLIC _sk_clamp_a_dst_hsw
_sk_clamp_a_dst_hsw LABEL PROC
- DB 196,98,125,24,5,163,159,2,0 ; vbroadcastss 0x29fa3(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,115,165,2,0 ; vbroadcastss 0x2a573(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7
DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4
DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5
@@ -1379,7 +1382,7 @@ _sk_swap_rb_hsw LABEL PROC
PUBLIC _sk_invert_hsw
_sk_invert_hsw LABEL PROC
- DB 196,98,125,24,5,94,159,2,0 ; vbroadcastss 0x29f5e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,46,165,2,0 ; vbroadcastss 0x2a52e(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0
DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
@@ -1425,7 +1428,7 @@ PUBLIC _sk_unpremul_hsw
_sk_unpremul_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,238,158,2,0 ; vbroadcastss 0x29eee(%rip),%ymm10 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,21,190,164,2,0 ; vbroadcastss 0x2a4be(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -1436,16 +1439,16 @@ _sk_unpremul_hsw LABEL PROC
PUBLIC _sk_from_srgb_hsw
_sk_from_srgb_hsw LABEL PROC
- DB 196,98,125,24,5,251,158,2,0 ; vbroadcastss 0x29efb(%rip),%ymm8 # 2b5c0 <_sk_overlay_sse2_8bit+0x49f>
+ DB 196,98,125,24,5,203,164,2,0 ; vbroadcastss 0x2a4cb(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,237,158,2,0 ; vbroadcastss 0x29eed(%rip),%ymm11 # 2b5c4 <_sk_overlay_sse2_8bit+0x4a3>
- DB 196,98,125,24,37,208,158,2,0 ; vbroadcastss 0x29ed0(%rip),%ymm12 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,29,189,164,2,0 ; vbroadcastss 0x2a4bd(%rip),%ymm11 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3>
+ DB 196,98,125,24,37,160,164,2,0 ; vbroadcastss 0x2a4a0(%rip),%ymm12 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,125,168,235 ; vfmadd213ps %ymm11,%ymm0,%ymm13
- DB 196,98,125,24,53,213,158,2,0 ; vbroadcastss 0x29ed5(%rip),%ymm14 # 2b5c8 <_sk_overlay_sse2_8bit+0x4a7>
+ DB 196,98,125,24,53,165,164,2,0 ; vbroadcastss 0x2a4a5(%rip),%ymm14 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,203,158,2,0 ; vbroadcastss 0x29ecb(%rip),%ymm10 # 2b5cc <_sk_overlay_sse2_8bit+0x4ab>
+ DB 196,98,125,24,21,155,164,2,0 ; vbroadcastss 0x2a49b(%rip),%ymm10 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab>
DB 196,193,124,194,194,1 ; vcmpltps %ymm10,%ymm0,%ymm0
DB 196,195,21,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm13,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -1466,16 +1469,16 @@ _sk_from_srgb_hsw LABEL PROC
PUBLIC _sk_from_srgb_dst_hsw
_sk_from_srgb_dst_hsw LABEL PROC
- DB 196,98,125,24,5,99,158,2,0 ; vbroadcastss 0x29e63(%rip),%ymm8 # 2b5c0 <_sk_overlay_sse2_8bit+0x49f>
+ DB 196,98,125,24,5,51,164,2,0 ; vbroadcastss 0x2a433(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f>
DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9
DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10
- DB 196,98,125,24,29,85,158,2,0 ; vbroadcastss 0x29e55(%rip),%ymm11 # 2b5c4 <_sk_overlay_sse2_8bit+0x4a3>
- DB 196,98,125,24,37,56,158,2,0 ; vbroadcastss 0x29e38(%rip),%ymm12 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,29,37,164,2,0 ; vbroadcastss 0x2a425(%rip),%ymm11 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3>
+ DB 196,98,125,24,37,8,164,2,0 ; vbroadcastss 0x2a408(%rip),%ymm12 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,93,168,235 ; vfmadd213ps %ymm11,%ymm4,%ymm13
- DB 196,98,125,24,53,61,158,2,0 ; vbroadcastss 0x29e3d(%rip),%ymm14 # 2b5c8 <_sk_overlay_sse2_8bit+0x4a7>
+ DB 196,98,125,24,53,13,164,2,0 ; vbroadcastss 0x2a40d(%rip),%ymm14 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,51,158,2,0 ; vbroadcastss 0x29e33(%rip),%ymm10 # 2b5cc <_sk_overlay_sse2_8bit+0x4ab>
+ DB 196,98,125,24,21,3,164,2,0 ; vbroadcastss 0x2a403(%rip),%ymm10 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab>
DB 196,193,92,194,226,1 ; vcmpltps %ymm10,%ymm4,%ymm4
DB 196,195,21,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm13,%ymm4
DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9
@@ -1497,19 +1500,19 @@ _sk_from_srgb_dst_hsw LABEL PROC
PUBLIC _sk_to_srgb_hsw
_sk_to_srgb_hsw LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,215,157,2,0 ; vbroadcastss 0x29dd7(%rip),%ymm8 # 2b5d0 <_sk_overlay_sse2_8bit+0x4af>
+ DB 196,98,125,24,5,167,163,2,0 ; vbroadcastss 0x2a3a7(%rip),%ymm8 # 2bbbc <_sk_overlay_sse2_8bit+0x4af>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,205,157,2,0 ; vbroadcastss 0x29dcd(%rip),%ymm11 # 2b5d4 <_sk_overlay_sse2_8bit+0x4b3>
- DB 196,98,125,24,37,200,157,2,0 ; vbroadcastss 0x29dc8(%rip),%ymm12 # 2b5d8 <_sk_overlay_sse2_8bit+0x4b7>
+ DB 196,98,125,24,29,157,163,2,0 ; vbroadcastss 0x2a39d(%rip),%ymm11 # 2bbc0 <_sk_overlay_sse2_8bit+0x4b3>
+ DB 196,98,125,24,37,152,163,2,0 ; vbroadcastss 0x2a398(%rip),%ymm12 # 2bbc4 <_sk_overlay_sse2_8bit+0x4b7>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,53,168,235 ; vfmadd213ps %ymm11,%ymm9,%ymm13
- DB 196,98,125,24,53,185,157,2,0 ; vbroadcastss 0x29db9(%rip),%ymm14 # 2b5dc <_sk_overlay_sse2_8bit+0x4bb>
+ DB 196,98,125,24,53,137,163,2,0 ; vbroadcastss 0x2a389(%rip),%ymm14 # 2bbc8 <_sk_overlay_sse2_8bit+0x4bb>
DB 196,66,53,168,238 ; vfmadd213ps %ymm14,%ymm9,%ymm13
- DB 196,98,125,24,61,175,157,2,0 ; vbroadcastss 0x29daf(%rip),%ymm15 # 2b5e0 <_sk_overlay_sse2_8bit+0x4bf>
+ DB 196,98,125,24,61,127,163,2,0 ; vbroadcastss 0x2a37f(%rip),%ymm15 # 2bbcc <_sk_overlay_sse2_8bit+0x4bf>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,20,89,201 ; vmulps %ymm9,%ymm13,%ymm9
- DB 196,98,125,24,45,155,157,2,0 ; vbroadcastss 0x29d9b(%rip),%ymm13 # 2b5e4 <_sk_overlay_sse2_8bit+0x4c3>
+ DB 196,98,125,24,45,107,163,2,0 ; vbroadcastss 0x2a36b(%rip),%ymm13 # 2bbd0 <_sk_overlay_sse2_8bit+0x4c3>
DB 196,193,124,194,197,1 ; vcmpltps %ymm13,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -1536,31 +1539,31 @@ _sk_to_srgb_hsw LABEL PROC
PUBLIC _sk_rgb_to_hsl_hsw
_sk_rgb_to_hsl_hsw LABEL PROC
- DB 197,124,95,193 ; vmaxps %ymm1,%ymm0,%ymm8
- DB 197,60,95,194 ; vmaxps %ymm2,%ymm8,%ymm8
- DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9
- DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9
+ DB 197,116,95,194 ; vmaxps %ymm2,%ymm1,%ymm8
+ DB 196,65,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm8
+ DB 197,116,93,202 ; vminps %ymm2,%ymm1,%ymm9
+ DB 196,65,124,93,201 ; vminps %ymm9,%ymm0,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,184,156,2,0 ; vbroadcastss 0x29cb8(%rip),%ymm11 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,29,134,162,2,0 ; vbroadcastss 0x2a286(%rip),%ymm11 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 197,116,194,234,1 ; vcmpltps %ymm2,%ymm1,%ymm13
- DB 196,98,125,24,53,249,156,2,0 ; vbroadcastss 0x29cf9(%rip),%ymm14 # 2b5e8 <_sk_overlay_sse2_8bit+0x4c7>
+ DB 196,98,125,24,53,199,162,2,0 ; vbroadcastss 0x2a2c7(%rip),%ymm14 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7>
DB 196,65,4,87,255 ; vxorps %ymm15,%ymm15,%ymm15
DB 196,67,5,74,238,208 ; vblendvps %ymm13,%ymm14,%ymm15,%ymm13
DB 196,66,37,168,229 ; vfmadd213ps %ymm13,%ymm11,%ymm12
DB 197,236,92,208 ; vsubps %ymm0,%ymm2,%ymm2
DB 197,124,92,233 ; vsubps %ymm1,%ymm0,%ymm13
- DB 196,98,125,24,53,224,156,2,0 ; vbroadcastss 0x29ce0(%rip),%ymm14 # 2b5f0 <_sk_overlay_sse2_8bit+0x4cf>
+ DB 196,98,125,24,53,174,162,2,0 ; vbroadcastss 0x2a2ae(%rip),%ymm14 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf>
DB 196,66,37,168,238 ; vfmadd213ps %ymm14,%ymm11,%ymm13
- DB 196,98,125,24,53,206,156,2,0 ; vbroadcastss 0x29cce(%rip),%ymm14 # 2b5ec <_sk_overlay_sse2_8bit+0x4cb>
+ DB 196,98,125,24,53,156,162,2,0 ; vbroadcastss 0x2a29c(%rip),%ymm14 # 2bbd8 <_sk_overlay_sse2_8bit+0x4cb>
DB 196,194,37,168,214 ; vfmadd213ps %ymm14,%ymm11,%ymm2
DB 197,188,194,201,0 ; vcmpeqps %ymm1,%ymm8,%ymm1
DB 196,227,21,74,202,16 ; vblendvps %ymm1,%ymm2,%ymm13,%ymm1
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,195,117,74,196,0 ; vblendvps %ymm0,%ymm12,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,29,69,156,2,0 ; vbroadcastss 0x29c45(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,19,162,2,0 ; vbroadcastss 0x2a213(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,116,89,211 ; vmulps %ymm11,%ymm1,%ymm2
DB 197,36,194,218,1 ; vcmpltps %ymm2,%ymm11,%ymm11
DB 196,65,12,92,224 ; vsubps %ymm8,%ymm14,%ymm12
@@ -1570,7 +1573,7 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,199,128 ; vblendvps %ymm8,%ymm15,%ymm0,%ymm0
DB 196,195,117,74,207,128 ; vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- DB 196,98,125,24,5,116,156,2,0 ; vbroadcastss 0x29c74(%rip),%ymm8 # 2b5f4 <_sk_overlay_sse2_8bit+0x4d3>
+ DB 196,98,125,24,5,66,162,2,0 ; vbroadcastss 0x2a242(%rip),%ymm8 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -1585,30 +1588,30 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 197,252,40,224 ; vmovaps %ymm0,%ymm4
- DB 196,98,125,24,5,203,155,2,0 ; vbroadcastss 0x29bcb(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,153,161,2,0 ; vbroadcastss 0x2a199(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,84,89,210 ; vmulps %ymm2,%ymm5,%ymm10
DB 196,65,84,92,218 ; vsubps %ymm10,%ymm5,%ymm11
DB 196,67,45,74,203,144 ; vblendvps %ymm9,%ymm11,%ymm10,%ymm9
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
- DB 196,98,125,24,13,10,156,2,0 ; vbroadcastss 0x29c0a(%rip),%ymm9 # 2b5ec <_sk_overlay_sse2_8bit+0x4cb>
+ DB 196,98,125,24,13,216,161,2,0 ; vbroadcastss 0x2a1d8(%rip),%ymm9 # 2bbd8 <_sk_overlay_sse2_8bit+0x4cb>
DB 196,66,109,170,202 ; vfmsub213ps %ymm10,%ymm2,%ymm9
- DB 196,98,125,24,29,8,156,2,0 ; vbroadcastss 0x29c08(%rip),%ymm11 # 2b5f8 <_sk_overlay_sse2_8bit+0x4d7>
+ DB 196,98,125,24,29,214,161,2,0 ; vbroadcastss 0x2a1d6(%rip),%ymm11 # 2bbe4 <_sk_overlay_sse2_8bit+0x4d7>
DB 196,65,92,88,219 ; vaddps %ymm11,%ymm4,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,45,218,155,2,0 ; vbroadcastss 0x29bda(%rip),%ymm13 # 2b5e8 <_sk_overlay_sse2_8bit+0x4c7>
+ DB 196,98,125,24,45,168,161,2,0 ; vbroadcastss 0x2a1a8(%rip),%ymm13 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7>
DB 196,193,4,89,197 ; vmulps %ymm13,%ymm15,%ymm0
- DB 196,98,125,24,53,212,155,2,0 ; vbroadcastss 0x29bd4(%rip),%ymm14 # 2b5f0 <_sk_overlay_sse2_8bit+0x4cf>
+ DB 196,98,125,24,53,162,161,2,0 ; vbroadcastss 0x2a1a2(%rip),%ymm14 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf>
DB 197,12,92,224 ; vsubps %ymm0,%ymm14,%ymm12
DB 196,66,37,168,225 ; vfmadd213ps %ymm9,%ymm11,%ymm12
- DB 196,226,125,24,29,206,155,2,0 ; vbroadcastss 0x29bce(%rip),%ymm3 # 2b5fc <_sk_overlay_sse2_8bit+0x4db>
+ DB 196,226,125,24,29,156,161,2,0 ; vbroadcastss 0x2a19c(%rip),%ymm3 # 2bbe8 <_sk_overlay_sse2_8bit+0x4db>
DB 196,193,100,194,255,2 ; vcmpleps %ymm15,%ymm3,%ymm7
DB 196,195,29,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm12,%ymm7
DB 196,65,60,194,231,2 ; vcmpleps %ymm15,%ymm8,%ymm12
DB 196,227,45,74,255,192 ; vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,37,165,155,2,0 ; vbroadcastss 0x29ba5(%rip),%ymm12 # 2b5f4 <_sk_overlay_sse2_8bit+0x4d3>
+ DB 196,98,125,24,37,115,161,2,0 ; vbroadcastss 0x2a173(%rip),%ymm12 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3>
DB 196,65,28,194,255,2 ; vcmpleps %ymm15,%ymm12,%ymm15
DB 196,194,37,168,193 ; vfmadd213ps %ymm9,%ymm11,%ymm0
DB 196,99,125,74,255,240 ; vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -1624,7 +1627,7 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,156,194,192,2 ; vcmpleps %ymm0,%ymm12,%ymm0
DB 196,194,37,168,249 ; vfmadd213ps %ymm9,%ymm11,%ymm7
DB 196,227,69,74,201,0 ; vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- DB 196,226,125,24,5,89,155,2,0 ; vbroadcastss 0x29b59(%rip),%ymm0 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,226,125,24,5,39,161,2,0 ; vbroadcastss 0x2a127(%rip),%ymm0 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
DB 197,220,88,192 ; vaddps %ymm0,%ymm4,%ymm0
DB 196,227,125,8,224,1 ; vroundps $0x1,%ymm0,%ymm4
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
@@ -1673,12 +1676,12 @@ _sk_scale_u8_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,59 ; jne 1b9e <_sk_scale_u8_hsw+0x54>
+ DB 117,59 ; jne 1bbc <_sk_scale_u8_hsw+0x54>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,191,163,2,0 ; vpand 0x2a3bf(%rip),%xmm8,%xmm8 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,57,219,5,129,169,2,0 ; vpand 0x2a981(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,128,154,2,0 ; vbroadcastss 0x29a80(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,78,160,2,0 ; vbroadcastss 0x2a04e(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -1692,15 +1695,15 @@ _sk_scale_u8_hsw LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,182 ; ja 1b69 <_sk_scale_u8_hsw+0x1f>
+ DB 119,182 ; ja 1b87 <_sk_scale_u8_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 1c38 <_sk_scale_u8_hsw+0xee>
+ DB 76,141,29,124,0,0,0 ; lea 0x7c(%rip),%r11 # 1c58 <_sk_scale_u8_hsw+0xf0>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 235,151 ; jmp 1b69 <_sk_scale_u8_hsw+0x1f>
+ DB 235,151 ; jmp 1b87 <_sk_scale_u8_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -1708,7 +1711,7 @@ _sk_scale_u8_hsw LABEL PROC
DB 197,121,110,200 ; vmovd %eax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
- DB 233,110,255,255,255 ; jmpq 1b69 <_sk_scale_u8_hsw+0x1f>
+ DB 233,110,255,255,255 ; jmpq 1b87 <_sk_scale_u8_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -1719,22 +1722,111 @@ _sk_scale_u8_hsw LABEL PROC
DB 196,65,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
- DB 233,50,255,255,255 ; jmpq 1b69 <_sk_scale_u8_hsw+0x1f>
- DB 144 ; nop
- DB 143 ; (bad)
+ DB 233,50,255,255,255 ; jmpq 1b87 <_sk_scale_u8_hsw+0x1f>
+ DB 15,31,0 ; nopl (%rax)
+ DB 141 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,170,255,255,255,154 ; ljmp *-0x65000001(%rdx)
+ DB 255,168,255,255,255,152 ; ljmp *-0x67000001(%rax)
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,231 ; jmpq *%rdi
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf001c48 <_sk_overlay_sse2_8bit+0xffffffffdefd6b27>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,211 ; callq *%rbx
+ DB 220,255 ; fdivr %st,%st(7)
DB 255 ; (bad)
+ DB 255,209 ; callq *%rcx
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,193 ; inc %ecx
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; .byte 0xff
+
+PUBLIC _sk_scale_565_hsw
+_sk_scale_565_hsw LABEL PROC
+ DB 83 ; push %rbx
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,99,80,8 ; movslq 0x8(%rax),%r10
+ DB 76,99,201 ; movslq %ecx,%r9
+ DB 77,15,175,202 ; imul %r10,%r9
+ DB 77,1,201 ; add %r9,%r9
+ DB 76,3,8 ; add (%rax),%r9
+ DB 72,99,218 ; movslq %edx,%rbx
+ DB 77,133,192 ; test %r8,%r8
+ DB 15,133,162,0,0,0 ; jne 1d36 <_sk_scale_565_hsw+0xc2>
+ DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8
+ DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
+ DB 196,98,125,88,13,76,159,2,0 ; vpbroadcastd 0x29f4c(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9
+ DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
+ DB 196,98,125,24,21,61,159,2,0 ; vbroadcastss 0x29f3d(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
+ DB 196,98,125,88,21,51,159,2,0 ; vpbroadcastd 0x29f33(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
+ DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
+ DB 196,98,125,24,29,36,159,2,0 ; vbroadcastss 0x29f24(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
+ DB 196,98,125,88,29,26,159,2,0 ; vpbroadcastd 0x29f1a(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8
+ DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
+ DB 196,98,125,24,29,11,159,2,0 ; vbroadcastss 0x29f0b(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
+ DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
+ DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
+ DB 196,65,52,93,228 ; vminps %ymm12,%ymm9,%ymm12
+ DB 196,65,44,95,232 ; vmaxps %ymm8,%ymm10,%ymm13
+ DB 196,65,52,95,237 ; vmaxps %ymm13,%ymm9,%ymm13
+ DB 196,67,21,74,220,176 ; vblendvps %ymm11,%ymm12,%ymm13,%ymm11
+ DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
+ DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
+ DB 197,188,89,210 ; vmulps %ymm2,%ymm8,%ymm2
+ DB 197,164,89,219 ; vmulps %ymm3,%ymm11,%ymm3
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 91 ; pop %rbx
+ DB 255,224 ; jmpq *%rax
+ DB 69,137,194 ; mov %r8d,%r10d
+ DB 65,128,226,7 ; and $0x7,%r10b
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 65,254,202 ; dec %r10b
+ DB 65,128,250,6 ; cmp $0x6,%r10b
+ DB 15,135,75,255,255,255 ; ja 1c9a <_sk_scale_565_hsw+0x26>
+ DB 69,15,182,210 ; movzbl %r10b,%r10d
+ DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 1dc0 <_sk_scale_565_hsw+0x14c>
+ DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
+ DB 76,1,216 ; add %r11,%rax
+ DB 255,224 ; jmpq *%rax
+ DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
+ DB 197,121,110,192 ; vmovd %eax,%xmm8
+ DB 233,41,255,255,255 ; jmpq 1c9a <_sk_scale_565_hsw+0x26>
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 196,65,57,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm9
+ DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
+ DB 233,11,255,255,255 ; jmpq 1c9a <_sk_scale_565_hsw+0x26>
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 196,65,57,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,57,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,57,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm9
+ DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
+ DB 233,221,254,255,255 ; jmpq 1c9a <_sk_scale_565_hsw+0x26>
+ DB 15,31,0 ; nopl (%rax)
+ DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff
DB 255 ; (bad)
- DB 255,195 ; inc %ebx
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 236 ; in (%dx),%al
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,228 ; jmpq *%rsp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 220,255 ; fdivr %st,%st(7)
+ DB 255 ; (bad)
+ DB 255,207 ; dec %edi
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -1764,12 +1856,12 @@ _sk_lerp_u8_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,79 ; jne 1ceb <_sk_lerp_u8_hsw+0x68>
+ DB 117,79 ; jne 1e73 <_sk_lerp_u8_hsw+0x68>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,134,162,2,0 ; vpand 0x2a286(%rip),%xmm8,%xmm8 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,57,219,5,222,166,2,0 ; vpand 0x2a6de(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,71,153,2,0 ; vbroadcastss 0x29947(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,171,157,2,0 ; vbroadcastss 0x29dab(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -1787,15 +1879,15 @@ _sk_lerp_u8_hsw LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,162 ; ja 1ca2 <_sk_lerp_u8_hsw+0x1f>
+ DB 119,162 ; ja 1e2a <_sk_lerp_u8_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # 1d84 <_sk_lerp_u8_hsw+0x101>
+ DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # 1f0c <_sk_lerp_u8_hsw+0x101>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 235,131 ; jmp 1ca2 <_sk_lerp_u8_hsw+0x1f>
+ DB 235,131 ; jmp 1e2a <_sk_lerp_u8_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -1803,7 +1895,7 @@ _sk_lerp_u8_hsw LABEL PROC
DB 197,121,110,200 ; vmovd %eax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
- DB 233,90,255,255,255 ; jmpq 1ca2 <_sk_lerp_u8_hsw+0x1f>
+ DB 233,90,255,255,255 ; jmpq 1e2a <_sk_lerp_u8_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -1814,7 +1906,7 @@ _sk_lerp_u8_hsw LABEL PROC
DB 196,65,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
- DB 233,30,255,255,255 ; jmpq 1ca2 <_sk_lerp_u8_hsw+0x1f>
+ DB 233,30,255,255,255 ; jmpq 1e2a <_sk_lerp_u8_hsw+0x1f>
DB 144 ; nop
DB 255 ; (bad)
DB 255 ; (bad)
@@ -1847,24 +1939,30 @@ _sk_lerp_565_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,170,0,0,0 ; jne 1e6a <_sk_lerp_565_hsw+0xca>
+ DB 15,133,182,0,0,0 ; jne 1ffe <_sk_lerp_565_hsw+0xd6>
DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
- DB 196,98,125,88,13,52,152,2,0 ; vpbroadcastd 0x29834(%rip),%ymm9 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,98,125,88,13,152,156,2,0 ; vpbroadcastd 0x29c98(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,37,152,2,0 ; vbroadcastss 0x29825(%rip),%ymm10 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,98,125,24,21,137,156,2,0 ; vbroadcastss 0x29c89(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,88,21,27,152,2,0 ; vpbroadcastd 0x2981b(%rip),%ymm10 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,98,125,88,21,127,156,2,0 ; vpbroadcastd 0x29c7f(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,12,152,2,0 ; vbroadcastss 0x2980c(%rip),%ymm11 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,98,125,24,29,112,156,2,0 ; vbroadcastss 0x29c70(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,88,29,2,152,2,0 ; vpbroadcastd 0x29802(%rip),%ymm11 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,98,125,88,29,102,156,2,0 ; vpbroadcastd 0x29c66(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,243,151,2,0 ; vbroadcastss 0x297f3(%rip),%ymm11 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,98,125,24,29,87,156,2,0 ; vbroadcastss 0x29c57(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
+ DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
+ DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
+ DB 196,65,52,93,228 ; vminps %ymm12,%ymm9,%ymm12
+ DB 196,65,44,95,232 ; vmaxps %ymm8,%ymm10,%ymm13
+ DB 196,65,52,95,237 ; vmaxps %ymm13,%ymm9,%ymm13
+ DB 196,67,21,74,220,176 ; vblendvps %ymm11,%ymm12,%ymm13,%ymm11
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,53,168,196 ; vfmadd213ps %ymm4,%ymm9,%ymm0
DB 197,244,92,205 ; vsubps %ymm5,%ymm1,%ymm1
@@ -1872,11 +1970,7 @@ _sk_lerp_565_hsw LABEL PROC
DB 197,236,92,214 ; vsubps %ymm6,%ymm2,%ymm2
DB 196,226,61,168,214 ; vfmadd213ps %ymm6,%ymm8,%ymm2
DB 197,228,92,223 ; vsubps %ymm7,%ymm3,%ymm3
- DB 196,98,101,168,207 ; vfmadd213ps %ymm7,%ymm3,%ymm9
- DB 196,98,101,168,215 ; vfmadd213ps %ymm7,%ymm3,%ymm10
- DB 196,98,101,168,199 ; vfmadd213ps %ymm7,%ymm3,%ymm8
- DB 196,193,44,95,216 ; vmaxps %ymm8,%ymm10,%ymm3
- DB 197,180,95,219 ; vmaxps %ymm3,%ymm9,%ymm3
+ DB 196,226,37,168,223 ; vfmadd213ps %ymm7,%ymm11,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -1885,27 +1979,27 @@ _sk_lerp_565_hsw LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,67,255,255,255 ; ja 1dc6 <_sk_lerp_565_hsw+0x26>
+ DB 15,135,55,255,255,255 ; ja 1f4e <_sk_lerp_565_hsw+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 1ef4 <_sk_lerp_565_hsw+0x154>
+ DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 2088 <_sk_lerp_565_hsw+0x160>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 233,33,255,255,255 ; jmpq 1dc6 <_sk_lerp_565_hsw+0x26>
+ DB 233,21,255,255,255 ; jmpq 1f4e <_sk_lerp_565_hsw+0x26>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,65,57,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm9
DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
- DB 233,3,255,255,255 ; jmpq 1dc6 <_sk_lerp_565_hsw+0x26>
+ DB 233,247,254,255,255 ; jmpq 1f4e <_sk_lerp_565_hsw+0x26>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,65,57,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,57,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,57,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm9
DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
- DB 233,213,254,255,255 ; jmpq 1dc6 <_sk_lerp_565_hsw+0x26>
+ DB 233,201,254,255,255 ; jmpq 1f4e <_sk_lerp_565_hsw+0x26>
DB 15,31,0 ; nopl (%rax)
DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff
DB 255 ; (bad)
@@ -1930,23 +2024,23 @@ _sk_load_tables_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 117,103 ; jne 1f81 <_sk_load_tables_hsw+0x71>
+ DB 117,103 ; jne 2115 <_sk_load_tables_hsw+0x71>
DB 196,193,126,111,28,145 ; vmovdqu (%r9,%rdx,4),%ymm3
- DB 197,229,219,13,120,152,2,0 ; vpand 0x29878(%rip),%ymm3,%ymm1 # 2b7a0 <_sk_overlay_sse2_8bit+0x67f>
+ DB 197,229,219,13,196,156,2,0 ; vpand 0x29cc4(%rip),%ymm3,%ymm1 # 2bd80 <_sk_overlay_sse2_8bit+0x673>
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 76,139,72,8 ; mov 0x8(%rax),%r9
DB 76,139,80,16 ; mov 0x10(%rax),%r10
DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
DB 196,194,109,146,4,137 ; vgatherdps %ymm2,(%r9,%ymm1,4),%ymm0
- DB 196,226,101,0,21,120,152,2,0 ; vpshufb 0x29878(%rip),%ymm3,%ymm2 # 2b7c0 <_sk_overlay_sse2_8bit+0x69f>
+ DB 196,226,101,0,21,196,156,2,0 ; vpshufb 0x29cc4(%rip),%ymm3,%ymm2 # 2bda0 <_sk_overlay_sse2_8bit+0x693>
DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
DB 196,194,53,146,12,146 ; vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1
DB 72,139,64,24 ; mov 0x18(%rax),%rax
- DB 196,98,101,0,13,128,152,2,0 ; vpshufb 0x29880(%rip),%ymm3,%ymm9 # 2b7e0 <_sk_overlay_sse2_8bit+0x6bf>
+ DB 196,98,101,0,13,204,156,2,0 ; vpshufb 0x29ccc(%rip),%ymm3,%ymm9 # 2bdc0 <_sk_overlay_sse2_8bit+0x6b3>
DB 196,162,61,146,20,136 ; vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,140,150,2,0 ; vbroadcastss 0x2968c(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,228,154,2,0 ; vbroadcastss 0x29ae4(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -1955,21 +2049,21 @@ _sk_load_tables_hsw LABEL PROC
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,139 ; ja 1f20 <_sk_load_tables_hsw+0x10>
+ DB 119,139 ; ja 20b4 <_sk_load_tables_hsw+0x10>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,140,0,0,0 ; lea 0x8c(%rip),%r11 # 202c <_sk_load_tables_hsw+0x11c>
+ DB 76,141,29,140,0,0,0 ; lea 0x8c(%rip),%r11 # 21c0 <_sk_load_tables_hsw+0x11c>
DB 79,99,20,147 ; movslq (%r11,%r10,4),%r10
DB 77,1,218 ; add %r11,%r10
DB 65,255,226 ; jmpq *%r10
DB 196,193,121,110,28,145 ; vmovd (%r9,%rdx,4),%xmm3
- DB 233,107,255,255,255 ; jmpq 1f20 <_sk_load_tables_hsw+0x10>
+ DB 233,107,255,255,255 ; jmpq 20b4 <_sk_load_tables_hsw+0x10>
DB 196,193,121,110,68,145,8 ; vmovd 0x8(%r9,%rdx,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
DB 196,227,117,2,216,4 ; vpblendd $0x4,%ymm0,%ymm1,%ymm3
DB 196,193,122,126,4,145 ; vmovq (%r9,%rdx,4),%xmm0
DB 196,227,101,2,216,3 ; vpblendd $0x3,%ymm0,%ymm3,%ymm3
- DB 233,68,255,255,255 ; jmpq 1f20 <_sk_load_tables_hsw+0x10>
+ DB 233,68,255,255,255 ; jmpq 20b4 <_sk_load_tables_hsw+0x10>
DB 196,193,121,110,68,145,24 ; vmovd 0x18(%r9,%rdx,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -1982,9 +2076,9 @@ _sk_load_tables_hsw LABEL PROC
DB 196,227,101,56,216,1 ; vinserti128 $0x1,%xmm0,%ymm3,%ymm3
DB 196,193,122,111,4,145 ; vmovdqu (%r9,%rdx,4),%xmm0
DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- DB 233,245,254,255,255 ; jmpq 1f20 <_sk_load_tables_hsw+0x10>
+ DB 233,245,254,255,255 ; jmpq 20b4 <_sk_load_tables_hsw+0x10>
DB 144 ; nop
- DB 126,255 ; jle 202d <_sk_load_tables_hsw+0x11d>
+ DB 126,255 ; jle 21c1 <_sk_load_tables_hsw+0x11d>
DB 255 ; (bad)
DB 255,159,255,255,255,137 ; lcall *-0x76000001(%rdi)
DB 255 ; (bad)
@@ -2010,7 +2104,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,201,0,0,0 ; jne 2127 <_sk_load_tables_u16_be_hsw+0xdf>
+ DB 15,133,201,0,0,0 ; jne 22bb <_sk_load_tables_u16_be_hsw+0xdf>
DB 196,1,121,16,4,81 ; vmovupd (%r9,%r10,2),%xmm8
DB 196,129,121,16,84,81,16 ; vmovupd 0x10(%r9,%r10,2),%xmm2
DB 196,129,121,16,92,81,32 ; vmovupd 0x20(%r9,%r10,2),%xmm3
@@ -2026,7 +2120,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,108,200 ; vpunpcklqdq %xmm0,%xmm8,%xmm1
DB 197,185,109,208 ; vpunpckhqdq %xmm0,%xmm8,%xmm2
DB 197,49,108,195 ; vpunpcklqdq %xmm3,%xmm9,%xmm8
- DB 197,121,111,21,129,158,2,0 ; vmovdqa 0x29e81(%rip),%xmm10 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,121,111,21,205,162,2,0 ; vmovdqa 0x2a2cd(%rip),%xmm10 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,193,113,219,194 ; vpand %xmm10,%xmm1,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -2048,36 +2142,36 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,235,219 ; vpor %xmm3,%xmm8,%xmm3
DB 196,226,125,51,219 ; vpmovzxwd %xmm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,2,149,2,0 ; vbroadcastss 0x29502(%rip),%ymm8 # 2b620 <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,98,125,24,5,90,153,2,0 ; vbroadcastss 0x2995a(%rip),%ymm8 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 196,1,123,16,4,81 ; vmovsd (%r9,%r10,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 218d <_sk_load_tables_u16_be_hsw+0x145>
+ DB 116,85 ; je 2321 <_sk_load_tables_u16_be_hsw+0x145>
DB 196,1,57,22,68,81,8 ; vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 218d <_sk_load_tables_u16_be_hsw+0x145>
+ DB 114,72 ; jb 2321 <_sk_load_tables_u16_be_hsw+0x145>
DB 196,129,123,16,84,81,16 ; vmovsd 0x10(%r9,%r10,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 219a <_sk_load_tables_u16_be_hsw+0x152>
+ DB 116,72 ; je 232e <_sk_load_tables_u16_be_hsw+0x152>
DB 196,129,105,22,84,81,24 ; vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 219a <_sk_load_tables_u16_be_hsw+0x152>
+ DB 114,59 ; jb 232e <_sk_load_tables_u16_be_hsw+0x152>
DB 196,129,123,16,92,81,32 ; vmovsd 0x20(%r9,%r10,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,9,255,255,255 ; je 2079 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 15,132,9,255,255,255 ; je 220d <_sk_load_tables_u16_be_hsw+0x31>
DB 196,129,97,22,92,81,40 ; vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,248,254,255,255 ; jb 2079 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 15,130,248,254,255,255 ; jb 220d <_sk_load_tables_u16_be_hsw+0x31>
DB 196,1,122,126,76,81,48 ; vmovq 0x30(%r9,%r10,2),%xmm9
- DB 233,236,254,255,255 ; jmpq 2079 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,236,254,255,255 ; jmpq 220d <_sk_load_tables_u16_be_hsw+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,223,254,255,255 ; jmpq 2079 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,223,254,255,255 ; jmpq 220d <_sk_load_tables_u16_be_hsw+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,214,254,255,255 ; jmpq 2079 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,214,254,255,255 ; jmpq 220d <_sk_load_tables_u16_be_hsw+0x31>
PUBLIC _sk_load_tables_rgb_u16_be_hsw
_sk_load_tables_rgb_u16_be_hsw LABEL PROC
@@ -2085,7 +2179,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,193,0,0,0 ; jne 2276 <_sk_load_tables_rgb_u16_be_hsw+0xd3>
+ DB 15,133,193,0,0,0 ; jne 240a <_sk_load_tables_rgb_u16_be_hsw+0xd3>
DB 196,129,122,111,4,81 ; vmovdqu (%r9,%r10,2),%xmm0
DB 196,129,122,111,84,81,12 ; vmovdqu 0xc(%r9,%r10,2),%xmm2
DB 196,129,122,111,76,81,24 ; vmovdqu 0x18(%r9,%r10,2),%xmm1
@@ -2106,7 +2200,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3
DB 197,185,109,210 ; vpunpckhqdq %xmm2,%xmm8,%xmm2
DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8
- DB 197,121,111,13,17,157,2,0 ; vmovdqa 0x29d11(%rip),%xmm9 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,121,111,13,93,161,2,0 ; vmovdqa 0x2a15d(%rip),%xmm9 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
@@ -2123,46 +2217,46 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 196,98,125,51,194 ; vpmovzxwd %xmm2,%ymm8
DB 196,162,101,146,20,128 ; vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,28,147,2,0 ; vbroadcastss 0x2931c(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,116,151,2,0 ; vbroadcastss 0x29774(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0
DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 228f <_sk_load_tables_rgb_u16_be_hsw+0xec>
- DB 233,90,255,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 117,5 ; jne 2423 <_sk_load_tables_rgb_u16_be_hsw+0xec>
+ DB 233,90,255,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
DB 196,129,121,110,76,81,6 ; vmovd 0x6(%r9,%r10,2),%xmm1
DB 196,1,113,196,68,81,10,2 ; vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 22be <_sk_load_tables_rgb_u16_be_hsw+0x11b>
+ DB 114,26 ; jb 2452 <_sk_load_tables_rgb_u16_be_hsw+0x11b>
DB 196,129,121,110,76,81,12 ; vmovd 0xc(%r9,%r10,2),%xmm1
DB 196,129,113,196,84,81,16,2 ; vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 22c3 <_sk_load_tables_rgb_u16_be_hsw+0x120>
- DB 233,43,255,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,38,255,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 117,10 ; jne 2457 <_sk_load_tables_rgb_u16_be_hsw+0x120>
+ DB 233,43,255,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,38,255,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
DB 196,129,121,110,76,81,18 ; vmovd 0x12(%r9,%r10,2),%xmm1
DB 196,1,113,196,76,81,22,2 ; vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 22f2 <_sk_load_tables_rgb_u16_be_hsw+0x14f>
+ DB 114,26 ; jb 2486 <_sk_load_tables_rgb_u16_be_hsw+0x14f>
DB 196,129,121,110,76,81,24 ; vmovd 0x18(%r9,%r10,2),%xmm1
DB 196,129,113,196,76,81,28,2 ; vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 22f7 <_sk_load_tables_rgb_u16_be_hsw+0x154>
- DB 233,247,254,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,242,254,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 117,10 ; jne 248b <_sk_load_tables_rgb_u16_be_hsw+0x154>
+ DB 233,247,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,242,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
DB 196,129,121,110,92,81,30 ; vmovd 0x1e(%r9,%r10,2),%xmm3
DB 196,1,97,196,92,81,34,2 ; vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 2320 <_sk_load_tables_rgb_u16_be_hsw+0x17d>
+ DB 114,20 ; jb 24b4 <_sk_load_tables_rgb_u16_be_hsw+0x17d>
DB 196,129,121,110,92,81,36 ; vmovd 0x24(%r9,%r10,2),%xmm3
DB 196,129,97,196,92,81,40,2 ; vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- DB 233,201,254,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,196,254,255,255 ; jmpq 21e9 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,201,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,196,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
PUBLIC _sk_byte_tables_hsw
_sk_byte_tables_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,140,146,2,0 ; vbroadcastss 0x2928c(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,228,150,2,0 ; vbroadcastss 0x296e4(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,201 ; vmovq %xmm9,%r9
@@ -2284,7 +2378,7 @@ _sk_byte_tables_hsw LABEL PROC
DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,117,144,2,0 ; vbroadcastss 0x29075(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,205,148,2,0 ; vbroadcastss 0x294cd(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2398,7 +2492,7 @@ _sk_byte_tables_rgb_hsw LABEL PROC
DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,93,142,2,0 ; vbroadcastss 0x28e5d(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,181,146,2,0 ; vbroadcastss 0x292b5(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2487,33 +2581,33 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,66,125,168,211 ; vfmadd213ps %ymm11,%ymm0,%ymm10
DB 196,226,125,24,0 ; vbroadcastss (%rax),%ymm0
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,83,141,2,0 ; vbroadcastss 0x28d53(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
- DB 196,98,125,24,45,78,141,2,0 ; vbroadcastss 0x28d4e(%rip),%ymm13 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,171,145,2,0 ; vbroadcastss 0x291ab(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,45,166,145,2,0 ; vbroadcastss 0x291a6(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,164,140,2,0 ; vbroadcastss 0x28ca4(%rip),%ymm13 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,45,252,144,2,0 ; vbroadcastss 0x290fc(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,54,141,2,0 ; vbroadcastss 0x28d36(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,142,145,2,0 ; vbroadcastss 0x2918e(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,44,141,2,0 ; vbroadcastss 0x28d2c(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,132,145,2,0 ; vbroadcastss 0x29184(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,34,141,2,0 ; vbroadcastss 0x28d22(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,122,145,2,0 ; vbroadcastss 0x2917a(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,24,141,2,0 ; vbroadcastss 0x28d18(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,112,145,2,0 ; vbroadcastss 0x29170(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,249,140,2,0 ; vbroadcastss 0x28cf9(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,81,145,2,0 ; vbroadcastss 0x29151(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,239,140,2,0 ; vbroadcastss 0x28cef(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,71,145,2,0 ; vbroadcastss 0x29147(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,45,172,216 ; vfnmadd213ps %ymm0,%ymm10,%ymm11
- DB 196,226,125,24,5,229,140,2,0 ; vbroadcastss 0x28ce5(%rip),%ymm0 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,5,61,145,2,0 ; vbroadcastss 0x2913d(%rip),%ymm0 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,219,140,2,0 ; vbroadcastss 0x28cdb(%rip),%ymm10 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,21,51,145,2,0 ; vbroadcastss 0x29133(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 197,172,94,192 ; vdivps %ymm0,%ymm10,%ymm0
DB 197,164,88,192 ; vaddps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,21,206,140,2,0 ; vbroadcastss 0x28cce(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,38,145,2,0 ; vbroadcastss 0x29126(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2521,7 +2615,7 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,229,139,2,0 ; vbroadcastss 0x28be5(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,61,144,2,0 ; vbroadcastss 0x2903d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2539,33 +2633,33 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,66,117,168,211 ; vfmadd213ps %ymm11,%ymm1,%ymm10
DB 196,226,125,24,8 ; vbroadcastss (%rax),%ymm1
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,45,140,2,0 ; vbroadcastss 0x28c2d(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
- DB 196,98,125,24,45,40,140,2,0 ; vbroadcastss 0x28c28(%rip),%ymm13 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,133,144,2,0 ; vbroadcastss 0x29085(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,45,128,144,2,0 ; vbroadcastss 0x29080(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,126,139,2,0 ; vbroadcastss 0x28b7e(%rip),%ymm13 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,45,214,143,2,0 ; vbroadcastss 0x28fd6(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,16,140,2,0 ; vbroadcastss 0x28c10(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,104,144,2,0 ; vbroadcastss 0x29068(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,6,140,2,0 ; vbroadcastss 0x28c06(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,94,144,2,0 ; vbroadcastss 0x2905e(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,252,139,2,0 ; vbroadcastss 0x28bfc(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,84,144,2,0 ; vbroadcastss 0x29054(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,242,139,2,0 ; vbroadcastss 0x28bf2(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,74,144,2,0 ; vbroadcastss 0x2904a(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,211,139,2,0 ; vbroadcastss 0x28bd3(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,43,144,2,0 ; vbroadcastss 0x2902b(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,201,139,2,0 ; vbroadcastss 0x28bc9(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,33,144,2,0 ; vbroadcastss 0x29021(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,45,172,217 ; vfnmadd213ps %ymm1,%ymm10,%ymm11
- DB 196,226,125,24,13,191,139,2,0 ; vbroadcastss 0x28bbf(%rip),%ymm1 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,13,23,144,2,0 ; vbroadcastss 0x29017(%rip),%ymm1 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,193,116,92,202 ; vsubps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,181,139,2,0 ; vbroadcastss 0x28bb5(%rip),%ymm10 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,21,13,144,2,0 ; vbroadcastss 0x2900d(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1
- DB 196,98,125,24,21,168,139,2,0 ; vbroadcastss 0x28ba8(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,0,144,2,0 ; vbroadcastss 0x29000(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2573,7 +2667,7 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,191,138,2,0 ; vbroadcastss 0x28abf(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,23,143,2,0 ; vbroadcastss 0x28f17(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2591,33 +2685,33 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,66,109,168,211 ; vfmadd213ps %ymm11,%ymm2,%ymm10
DB 196,226,125,24,16 ; vbroadcastss (%rax),%ymm2
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,7,139,2,0 ; vbroadcastss 0x28b07(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
- DB 196,98,125,24,45,2,139,2,0 ; vbroadcastss 0x28b02(%rip),%ymm13 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,95,143,2,0 ; vbroadcastss 0x28f5f(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,45,90,143,2,0 ; vbroadcastss 0x28f5a(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,88,138,2,0 ; vbroadcastss 0x28a58(%rip),%ymm13 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,45,176,142,2,0 ; vbroadcastss 0x28eb0(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,234,138,2,0 ; vbroadcastss 0x28aea(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,66,143,2,0 ; vbroadcastss 0x28f42(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,224,138,2,0 ; vbroadcastss 0x28ae0(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,56,143,2,0 ; vbroadcastss 0x28f38(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,214,138,2,0 ; vbroadcastss 0x28ad6(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,46,143,2,0 ; vbroadcastss 0x28f2e(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,204,138,2,0 ; vbroadcastss 0x28acc(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,36,143,2,0 ; vbroadcastss 0x28f24(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,173,138,2,0 ; vbroadcastss 0x28aad(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,5,143,2,0 ; vbroadcastss 0x28f05(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,163,138,2,0 ; vbroadcastss 0x28aa3(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,251,142,2,0 ; vbroadcastss 0x28efb(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,45,172,218 ; vfnmadd213ps %ymm2,%ymm10,%ymm11
- DB 196,226,125,24,21,153,138,2,0 ; vbroadcastss 0x28a99(%rip),%ymm2 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,21,241,142,2,0 ; vbroadcastss 0x28ef1(%rip),%ymm2 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,193,108,92,210 ; vsubps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,143,138,2,0 ; vbroadcastss 0x28a8f(%rip),%ymm10 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,21,231,142,2,0 ; vbroadcastss 0x28ee7(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 197,172,94,210 ; vdivps %ymm2,%ymm10,%ymm2
DB 197,164,88,210 ; vaddps %ymm2,%ymm11,%ymm2
- DB 196,98,125,24,21,130,138,2,0 ; vbroadcastss 0x28a82(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,218,142,2,0 ; vbroadcastss 0x28eda(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2625,7 +2719,7 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,153,137,2,0 ; vbroadcastss 0x28999(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,241,141,2,0 ; vbroadcastss 0x28df1(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2643,33 +2737,33 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,66,101,168,211 ; vfmadd213ps %ymm11,%ymm3,%ymm10
DB 196,226,125,24,24 ; vbroadcastss (%rax),%ymm3
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,225,137,2,0 ; vbroadcastss 0x289e1(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
- DB 196,98,125,24,45,220,137,2,0 ; vbroadcastss 0x289dc(%rip),%ymm13 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,57,142,2,0 ; vbroadcastss 0x28e39(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,45,52,142,2,0 ; vbroadcastss 0x28e34(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,50,137,2,0 ; vbroadcastss 0x28932(%rip),%ymm13 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,45,138,141,2,0 ; vbroadcastss 0x28d8a(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,196,137,2,0 ; vbroadcastss 0x289c4(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,28,142,2,0 ; vbroadcastss 0x28e1c(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,186,137,2,0 ; vbroadcastss 0x289ba(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,18,142,2,0 ; vbroadcastss 0x28e12(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,176,137,2,0 ; vbroadcastss 0x289b0(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,8,142,2,0 ; vbroadcastss 0x28e08(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,166,137,2,0 ; vbroadcastss 0x289a6(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,254,141,2,0 ; vbroadcastss 0x28dfe(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,135,137,2,0 ; vbroadcastss 0x28987(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,223,141,2,0 ; vbroadcastss 0x28ddf(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,125,137,2,0 ; vbroadcastss 0x2897d(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,213,141,2,0 ; vbroadcastss 0x28dd5(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,45,172,219 ; vfnmadd213ps %ymm3,%ymm10,%ymm11
- DB 196,226,125,24,29,115,137,2,0 ; vbroadcastss 0x28973(%rip),%ymm3 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,29,203,141,2,0 ; vbroadcastss 0x28dcb(%rip),%ymm3 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,193,100,92,218 ; vsubps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,105,137,2,0 ; vbroadcastss 0x28969(%rip),%ymm10 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,21,193,141,2,0 ; vbroadcastss 0x28dc1(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 197,172,94,219 ; vdivps %ymm3,%ymm10,%ymm3
DB 197,164,88,219 ; vaddps %ymm3,%ymm11,%ymm3
- DB 196,98,125,24,21,92,137,2,0 ; vbroadcastss 0x2895c(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,180,141,2,0 ; vbroadcastss 0x28db4(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2677,7 +2771,7 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,115,136,2,0 ; vbroadcastss 0x28873(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,203,140,2,0 ; vbroadcastss 0x28ccb(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2694,35 +2788,35 @@ _sk_gamma_hsw LABEL PROC
DB 197,252,40,241 ; vmovaps %ymm1,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,124,91,208 ; vcvtdq2ps %ymm0,%ymm10
- DB 196,98,125,24,29,192,136,2,0 ; vbroadcastss 0x288c0(%rip),%ymm11 # 2b624 <_sk_overlay_sse2_8bit+0x503>
- DB 196,226,125,24,45,187,136,2,0 ; vbroadcastss 0x288bb(%rip),%ymm5 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,29,24,141,2,0 ; vbroadcastss 0x28d18(%rip),%ymm11 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,226,125,24,45,19,141,2,0 ; vbroadcastss 0x28d13(%rip),%ymm5 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 197,124,84,205 ; vandps %ymm5,%ymm0,%ymm9
- DB 196,226,125,24,37,18,136,2,0 ; vbroadcastss 0x28812(%rip),%ymm4 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,37,106,140,2,0 ; vbroadcastss 0x28c6a(%rip),%ymm4 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,52,86,228 ; vorps %ymm4,%ymm9,%ymm12
- DB 196,98,125,24,45,165,136,2,0 ; vbroadcastss 0x288a5(%rip),%ymm13 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,253,140,2,0 ; vbroadcastss 0x28cfd(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,168,213 ; vfmadd213ps %ymm13,%ymm11,%ymm10
- DB 196,98,125,24,13,155,136,2,0 ; vbroadcastss 0x2889b(%rip),%ymm9 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,13,243,140,2,0 ; vbroadcastss 0x28cf3(%rip),%ymm9 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,29,188,209 ; vfnmadd231ps %ymm9,%ymm12,%ymm10
DB 197,124,91,246 ; vcvtdq2ps %ymm6,%ymm14
DB 196,66,37,168,245 ; vfmadd213ps %ymm13,%ymm11,%ymm14
DB 197,124,91,255 ; vcvtdq2ps %ymm7,%ymm15
DB 196,66,37,168,253 ; vfmadd213ps %ymm13,%ymm11,%ymm15
- DB 196,98,125,24,29,127,136,2,0 ; vbroadcastss 0x2887f(%rip),%ymm11 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,29,215,140,2,0 ; vbroadcastss 0x28cd7(%rip),%ymm11 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,28,88,227 ; vaddps %ymm11,%ymm12,%ymm12
- DB 196,98,125,24,45,117,136,2,0 ; vbroadcastss 0x28875(%rip),%ymm13 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,45,205,140,2,0 ; vbroadcastss 0x28ccd(%rip),%ymm13 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,20,94,228 ; vdivps %ymm12,%ymm13,%ymm12
DB 196,65,44,92,212 ; vsubps %ymm12,%ymm10,%ymm10
DB 196,98,125,24,32 ; vbroadcastss (%rax),%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
DB 196,67,125,8,194,1 ; vroundps $0x1,%ymm10,%ymm8
DB 196,65,44,92,192 ; vsubps %ymm8,%ymm10,%ymm8
- DB 196,226,125,24,21,81,136,2,0 ; vbroadcastss 0x28851(%rip),%ymm2 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,226,125,24,21,169,140,2,0 ; vbroadcastss 0x28ca9(%rip),%ymm2 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 197,44,88,210 ; vaddps %ymm2,%ymm10,%ymm10
- DB 196,226,125,24,29,72,136,2,0 ; vbroadcastss 0x28848(%rip),%ymm3 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,226,125,24,29,160,140,2,0 ; vbroadcastss 0x28ca0(%rip),%ymm3 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,61,188,211 ; vfnmadd231ps %ymm3,%ymm8,%ymm10
- DB 196,226,125,24,13,62,136,2,0 ; vbroadcastss 0x2883e(%rip),%ymm1 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,13,150,140,2,0 ; vbroadcastss 0x28c96(%rip),%ymm1 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,116,92,192 ; vsubps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,5,52,136,2,0 ; vbroadcastss 0x28834(%rip),%ymm0 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,226,125,24,5,140,140,2,0 ; vbroadcastss 0x28c8c(%rip),%ymm0 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,124,94,192 ; vdivps %ymm8,%ymm0,%ymm8
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 197,204,84,245 ; vandps %ymm5,%ymm6,%ymm6
@@ -2753,7 +2847,7 @@ _sk_gamma_hsw LABEL PROC
DB 197,244,92,205 ; vsubps %ymm5,%ymm1,%ymm1
DB 197,252,94,193 ; vdivps %ymm1,%ymm0,%ymm0
DB 197,236,88,192 ; vaddps %ymm0,%ymm2,%ymm0
- DB 196,226,125,24,13,165,135,2,0 ; vbroadcastss 0x287a5(%rip),%ymm1 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,226,125,24,13,253,139,2,0 ; vbroadcastss 0x28bfd(%rip),%ymm1 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 197,188,89,209 ; vmulps %ymm1,%ymm8,%ymm2
DB 197,204,89,217 ; vmulps %ymm1,%ymm6,%ymm3
DB 197,252,89,225 ; vmulps %ymm1,%ymm0,%ymm4
@@ -2771,26 +2865,26 @@ _sk_gamma_hsw LABEL PROC
PUBLIC _sk_lab_to_xyz_hsw
_sk_lab_to_xyz_hsw LABEL PROC
- DB 196,98,125,24,5,93,135,2,0 ; vbroadcastss 0x2875d(%rip),%ymm8 # 2b650 <_sk_overlay_sse2_8bit+0x52f>
- DB 196,98,125,24,13,192,134,2,0 ; vbroadcastss 0x286c0(%rip),%ymm9 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
- DB 196,98,125,24,21,79,135,2,0 ; vbroadcastss 0x2874f(%rip),%ymm10 # 2b654 <_sk_overlay_sse2_8bit+0x533>
+ DB 196,98,125,24,5,181,139,2,0 ; vbroadcastss 0x28bb5(%rip),%ymm8 # 2bc3c <_sk_overlay_sse2_8bit+0x52f>
+ DB 196,98,125,24,13,24,139,2,0 ; vbroadcastss 0x28b18(%rip),%ymm9 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,21,167,139,2,0 ; vbroadcastss 0x28ba7(%rip),%ymm10 # 2bc40 <_sk_overlay_sse2_8bit+0x533>
DB 196,194,53,168,202 ; vfmadd213ps %ymm10,%ymm9,%ymm1
DB 196,194,53,168,210 ; vfmadd213ps %ymm10,%ymm9,%ymm2
- DB 196,98,125,24,13,64,135,2,0 ; vbroadcastss 0x28740(%rip),%ymm9 # 2b658 <_sk_overlay_sse2_8bit+0x537>
+ DB 196,98,125,24,13,152,139,2,0 ; vbroadcastss 0x28b98(%rip),%ymm9 # 2bc44 <_sk_overlay_sse2_8bit+0x537>
DB 196,66,125,184,200 ; vfmadd231ps %ymm8,%ymm0,%ymm9
- DB 196,226,125,24,5,54,135,2,0 ; vbroadcastss 0x28736(%rip),%ymm0 # 2b65c <_sk_overlay_sse2_8bit+0x53b>
+ DB 196,226,125,24,5,142,139,2,0 ; vbroadcastss 0x28b8e(%rip),%ymm0 # 2bc48 <_sk_overlay_sse2_8bit+0x53b>
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
- DB 196,98,125,24,5,45,135,2,0 ; vbroadcastss 0x2872d(%rip),%ymm8 # 2b660 <_sk_overlay_sse2_8bit+0x53f>
+ DB 196,98,125,24,5,133,139,2,0 ; vbroadcastss 0x28b85(%rip),%ymm8 # 2bc4c <_sk_overlay_sse2_8bit+0x53f>
DB 196,98,117,168,192 ; vfmadd213ps %ymm0,%ymm1,%ymm8
- DB 196,98,125,24,13,35,135,2,0 ; vbroadcastss 0x28723(%rip),%ymm9 # 2b664 <_sk_overlay_sse2_8bit+0x543>
+ DB 196,98,125,24,13,123,139,2,0 ; vbroadcastss 0x28b7b(%rip),%ymm9 # 2bc50 <_sk_overlay_sse2_8bit+0x543>
DB 196,98,109,172,200 ; vfnmadd213ps %ymm0,%ymm2,%ymm9
DB 196,193,60,89,200 ; vmulps %ymm8,%ymm8,%ymm1
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
- DB 196,226,125,24,21,16,135,2,0 ; vbroadcastss 0x28710(%rip),%ymm2 # 2b668 <_sk_overlay_sse2_8bit+0x547>
+ DB 196,226,125,24,21,104,139,2,0 ; vbroadcastss 0x28b68(%rip),%ymm2 # 2bc54 <_sk_overlay_sse2_8bit+0x547>
DB 197,108,194,209,1 ; vcmpltps %ymm1,%ymm2,%ymm10
- DB 196,98,125,24,29,6,135,2,0 ; vbroadcastss 0x28706(%rip),%ymm11 # 2b66c <_sk_overlay_sse2_8bit+0x54b>
+ DB 196,98,125,24,29,94,139,2,0 ; vbroadcastss 0x28b5e(%rip),%ymm11 # 2bc58 <_sk_overlay_sse2_8bit+0x54b>
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,37,252,134,2,0 ; vbroadcastss 0x286fc(%rip),%ymm12 # 2b670 <_sk_overlay_sse2_8bit+0x54f>
+ DB 196,98,125,24,37,84,139,2,0 ; vbroadcastss 0x28b54(%rip),%ymm12 # 2bc5c <_sk_overlay_sse2_8bit+0x54f>
DB 196,65,60,89,196 ; vmulps %ymm12,%ymm8,%ymm8
DB 196,99,61,74,193,160 ; vblendvps %ymm10,%ymm1,%ymm8,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -2805,9 +2899,9 @@ _sk_lab_to_xyz_hsw LABEL PROC
DB 196,65,52,88,203 ; vaddps %ymm11,%ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
DB 196,227,53,74,208,32 ; vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- DB 196,226,125,24,5,177,134,2,0 ; vbroadcastss 0x286b1(%rip),%ymm0 # 2b674 <_sk_overlay_sse2_8bit+0x553>
+ DB 196,226,125,24,5,9,139,2,0 ; vbroadcastss 0x28b09(%rip),%ymm0 # 2bc60 <_sk_overlay_sse2_8bit+0x553>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,168,134,2,0 ; vbroadcastss 0x286a8(%rip),%ymm8 # 2b678 <_sk_overlay_sse2_8bit+0x557>
+ DB 196,98,125,24,5,0,139,2,0 ; vbroadcastss 0x28b00(%rip),%ymm8 # 2bc64 <_sk_overlay_sse2_8bit+0x557>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2822,12 +2916,12 @@ _sk_load_a8_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,53 ; jne 3027 <_sk_load_a8_hsw+0x4e>
+ DB 117,53 ; jne 31bb <_sk_load_a8_hsw+0x4e>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,48,143,2,0 ; vpand 0x28f30(%rip),%xmm0,%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,249,219,5,124,147,2,0 ; vpand 0x2937c(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,242,133,2,0 ; vbroadcastss 0x285f2(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,74,138,2,0 ; vbroadcastss 0x28a4a(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -2840,15 +2934,15 @@ _sk_load_a8_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,189 ; ja 2ff8 <_sk_load_a8_hsw+0x1f>
+ DB 119,189 ; ja 318c <_sk_load_a8_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 30c0 <_sk_load_a8_hsw+0xe7>
+ DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3254 <_sk_load_a8_hsw+0xe7>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,158 ; jmp 2ff8 <_sk_load_a8_hsw+0x1f>
+ DB 235,158 ; jmp 318c <_sk_load_a8_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -2856,7 +2950,7 @@ _sk_load_a8_hsw LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,118,255,255,255 ; jmpq 2ff8 <_sk_load_a8_hsw+0x1f>
+ DB 233,118,255,255,255 ; jmpq 318c <_sk_load_a8_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -2867,7 +2961,7 @@ _sk_load_a8_hsw LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,59,255,255,255 ; jmpq 2ff8 <_sk_load_a8_hsw+0x1f>
+ DB 233,59,255,255,255 ; jmpq 318c <_sk_load_a8_hsw+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 143 ; (bad)
DB 255 ; (bad)
@@ -2899,12 +2993,12 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,53 ; jne 312a <_sk_load_a8_dst_hsw+0x4e>
+ DB 117,53 ; jne 32be <_sk_load_a8_dst_hsw+0x4e>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,45,142,2,0 ; vpand 0x28e2d(%rip),%xmm4,%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,217,219,37,121,146,2,0 ; vpand 0x29279(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,239,132,2,0 ; vbroadcastss 0x284ef(%rip),%ymm5 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,45,71,137,2,0 ; vbroadcastss 0x28947(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
@@ -2917,15 +3011,15 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,189 ; ja 30fb <_sk_load_a8_dst_hsw+0x1f>
+ DB 119,189 ; ja 328f <_sk_load_a8_dst_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # 31c0 <_sk_load_a8_dst_hsw+0xe4>
+ DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # 3354 <_sk_load_a8_dst_hsw+0xe4>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,158 ; jmp 30fb <_sk_load_a8_dst_hsw+0x1f>
+ DB 235,158 ; jmp 328f <_sk_load_a8_dst_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -2933,7 +3027,7 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,118,255,255,255 ; jmpq 30fb <_sk_load_a8_dst_hsw+0x1f>
+ DB 233,118,255,255,255 ; jmpq 328f <_sk_load_a8_dst_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -2944,7 +3038,7 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,59,255,255,255 ; jmpq 30fb <_sk_load_a8_dst_hsw+0x1f>
+ DB 233,59,255,255,255 ; jmpq 328f <_sk_load_a8_dst_hsw+0x1f>
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -3003,7 +3097,7 @@ _sk_gather_a8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,114,131,2,0 ; vbroadcastss 0x28372(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,202,135,2,0 ; vbroadcastss 0x287ca(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -3020,14 +3114,14 @@ _sk_store_a8_hsw LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,249,130,2,0 ; vbroadcastss 0x282f9(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,81,135,2,0 ; vbroadcastss 0x28751(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 32ed <_sk_store_a8_hsw+0x47>
+ DB 117,11 ; jne 3481 <_sk_store_a8_hsw+0x47>
DB 196,65,123,17,4,25 ; vmovsd %xmm8,(%r9,%rbx,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3036,25 +3130,25 @@ _sk_store_a8_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 32e8 <_sk_store_a8_hsw+0x42>
+ DB 119,235 ; ja 347c <_sk_store_a8_hsw+0x42>
DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,87,0,0,0 ; lea 0x57(%rip),%r11 # 3364 <_sk_store_a8_hsw+0xbe>
+ DB 76,141,29,87,0,0,0 ; lea 0x57(%rip),%r11 # 34f8 <_sk_store_a8_hsw+0xbe>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,20,4,25,0 ; vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,201 ; jmp 32e8 <_sk_store_a8_hsw+0x42>
+ DB 235,201 ; jmp 347c <_sk_store_a8_hsw+0x42>
DB 196,67,121,20,68,25,2,4 ; vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- DB 196,98,57,0,5,16,140,2,0 ; vpshufb 0x28c10(%rip),%xmm8,%xmm8 # 2bf40 <_sk_overlay_sse2_8bit+0xe1f>
+ DB 196,98,57,0,5,92,144,2,0 ; vpshufb 0x2905c(%rip),%xmm8,%xmm8 # 2c520 <_sk_overlay_sse2_8bit+0xe13>
DB 196,67,121,21,4,25,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,175 ; jmp 32e8 <_sk_store_a8_hsw+0x42>
+ DB 235,175 ; jmp 347c <_sk_store_a8_hsw+0x42>
DB 196,67,121,20,68,25,6,12 ; vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
DB 196,67,121,20,68,25,5,10 ; vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
DB 196,67,121,20,68,25,4,8 ; vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- DB 196,98,57,0,5,246,139,2,0 ; vpshufb 0x28bf6(%rip),%xmm8,%xmm8 # 2bf50 <_sk_overlay_sse2_8bit+0xe2f>
+ DB 196,98,57,0,5,66,144,2,0 ; vpshufb 0x29042(%rip),%xmm8,%xmm8 # 2c530 <_sk_overlay_sse2_8bit+0xe23>
DB 196,65,121,126,4,25 ; vmovd %xmm8,(%r9,%rbx,1)
- DB 235,134 ; jmp 32e8 <_sk_store_a8_hsw+0x42>
+ DB 235,134 ; jmp 347c <_sk_store_a8_hsw+0x42>
DB 102,144 ; xchg %ax,%ax
DB 178,255 ; mov $0xff,%dl
DB 255 ; (bad)
@@ -3086,15 +3180,15 @@ _sk_load_g8_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,58 ; jne 33d3 <_sk_load_g8_hsw+0x53>
+ DB 117,58 ; jne 3567 <_sk_load_g8_hsw+0x53>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,137,139,2,0 ; vpand 0x28b89(%rip),%xmm0,%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,249,219,5,213,143,2,0 ; vpand 0x28fd5(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,75,130,2,0 ; vbroadcastss 0x2824b(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,163,134,2,0 ; vbroadcastss 0x286a3(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,200,129,2,0 ; vbroadcastss 0x281c8(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,32,134,2,0 ; vbroadcastss 0x28620(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -3104,15 +3198,15 @@ _sk_load_g8_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,184 ; ja 339f <_sk_load_g8_hsw+0x1f>
+ DB 119,184 ; ja 3533 <_sk_load_g8_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 346c <_sk_load_g8_hsw+0xec>
+ DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3600 <_sk_load_g8_hsw+0xec>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,153 ; jmp 339f <_sk_load_g8_hsw+0x1f>
+ DB 235,153 ; jmp 3533 <_sk_load_g8_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -3120,7 +3214,7 @@ _sk_load_g8_hsw LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,113,255,255,255 ; jmpq 339f <_sk_load_g8_hsw+0x1f>
+ DB 233,113,255,255,255 ; jmpq 3533 <_sk_load_g8_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -3131,7 +3225,7 @@ _sk_load_g8_hsw LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,54,255,255,255 ; jmpq 339f <_sk_load_g8_hsw+0x1f>
+ DB 233,54,255,255,255 ; jmpq 3533 <_sk_load_g8_hsw+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 143 ; (bad)
DB 255 ; (bad)
@@ -3163,15 +3257,15 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,58 ; jne 34db <_sk_load_g8_dst_hsw+0x53>
+ DB 117,58 ; jne 366f <_sk_load_g8_dst_hsw+0x53>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,129,138,2,0 ; vpand 0x28a81(%rip),%xmm4,%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,217,219,37,205,142,2,0 ; vpand 0x28ecd(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,67,129,2,0 ; vbroadcastss 0x28143(%rip),%ymm5 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,45,155,133,2,0 ; vbroadcastss 0x2859b(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,192,128,2,0 ; vbroadcastss 0x280c0(%rip),%ymm7 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,61,24,133,2,0 ; vbroadcastss 0x28518(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,236 ; vmovaps %ymm4,%ymm5
DB 197,252,40,244 ; vmovaps %ymm4,%ymm6
DB 91 ; pop %rbx
@@ -3181,15 +3275,15 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,184 ; ja 34a7 <_sk_load_g8_dst_hsw+0x1f>
+ DB 119,184 ; ja 363b <_sk_load_g8_dst_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3574 <_sk_load_g8_dst_hsw+0xec>
+ DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3708 <_sk_load_g8_dst_hsw+0xec>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,153 ; jmp 34a7 <_sk_load_g8_dst_hsw+0x1f>
+ DB 235,153 ; jmp 363b <_sk_load_g8_dst_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -3197,7 +3291,7 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,113,255,255,255 ; jmpq 34a7 <_sk_load_g8_dst_hsw+0x1f>
+ DB 233,113,255,255,255 ; jmpq 363b <_sk_load_g8_dst_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -3208,7 +3302,7 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,54,255,255,255 ; jmpq 34a7 <_sk_load_g8_dst_hsw+0x1f>
+ DB 233,54,255,255,255 ; jmpq 363b <_sk_load_g8_dst_hsw+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 143 ; (bad)
DB 255 ; (bad)
@@ -3268,10 +3362,10 @@ _sk_gather_g8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,190,127,2,0 ; vbroadcastss 0x27fbe(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,22,132,2,0 ; vbroadcastss 0x28416(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,59,127,2,0 ; vbroadcastss 0x27f3b(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,147,131,2,0 ; vbroadcastss 0x28393(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -3287,26 +3381,26 @@ _sk_load_565_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,115 ; jne 36ee <_sk_load_565_hsw+0x8f>
+ DB 117,115 ; jne 3882 <_sk_load_565_hsw+0x8f>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,121,127,2,0 ; vpbroadcastd 0x27f79(%rip),%ymm0 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,88,5,209,131,2,0 ; vpbroadcastd 0x283d1(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,108,127,2,0 ; vbroadcastss 0x27f6c(%rip),%ymm1 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,13,196,131,2,0 ; vbroadcastss 0x283c4(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,99,127,2,0 ; vpbroadcastd 0x27f63(%rip),%ymm1 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,88,13,187,131,2,0 ; vpbroadcastd 0x283bb(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,86,127,2,0 ; vbroadcastss 0x27f56(%rip),%ymm3 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,29,174,131,2,0 ; vbroadcastss 0x283ae(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,77,127,2,0 ; vpbroadcastd 0x27f4d(%rip),%ymm3 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,88,29,165,131,2,0 ; vpbroadcastd 0x283a5(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,64,127,2,0 ; vbroadcastss 0x27f40(%rip),%ymm3 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,29,152,131,2,0 ; vbroadcastss 0x28398(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,165,126,2,0 ; vbroadcastss 0x27ea5(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,253,130,2,0 ; vbroadcastss 0x282fd(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -3314,27 +3408,27 @@ _sk_load_565_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,123,255,255,255 ; ja 3681 <_sk_load_565_hsw+0x22>
+ DB 15,135,123,255,255,255 ; ja 3815 <_sk_load_565_hsw+0x22>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 3774 <_sk_load_565_hsw+0x115>
+ DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 3908 <_sk_load_565_hsw+0x115>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,89,255,255,255 ; jmpq 3681 <_sk_load_565_hsw+0x22>
+ DB 233,89,255,255,255 ; jmpq 3815 <_sk_load_565_hsw+0x22>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,60,255,255,255 ; jmpq 3681 <_sk_load_565_hsw+0x22>
+ DB 233,60,255,255,255 ; jmpq 3815 <_sk_load_565_hsw+0x22>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,15,255,255,255 ; jmpq 3681 <_sk_load_565_hsw+0x22>
+ DB 233,15,255,255,255 ; jmpq 3815 <_sk_load_565_hsw+0x22>
DB 102,144 ; xchg %ax,%ax
DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3366,26 +3460,26 @@ _sk_load_565_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,115 ; jne 381f <_sk_load_565_dst_hsw+0x8f>
+ DB 117,115 ; jne 39b3 <_sk_load_565_dst_hsw+0x8f>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 196,226,125,51,244 ; vpmovzxwd %xmm4,%ymm6
- DB 196,226,125,88,37,72,126,2,0 ; vpbroadcastd 0x27e48(%rip),%ymm4 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,88,37,160,130,2,0 ; vpbroadcastd 0x282a0(%rip),%ymm4 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,205,219,228 ; vpand %ymm4,%ymm6,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,59,126,2,0 ; vbroadcastss 0x27e3b(%rip),%ymm5 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,45,147,130,2,0 ; vbroadcastss 0x28293(%rip),%ymm5 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,88,45,50,126,2,0 ; vpbroadcastd 0x27e32(%rip),%ymm5 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,88,45,138,130,2,0 ; vpbroadcastd 0x2828a(%rip),%ymm5 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 197,205,219,237 ; vpand %ymm5,%ymm6,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,61,37,126,2,0 ; vbroadcastss 0x27e25(%rip),%ymm7 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,61,125,130,2,0 ; vbroadcastss 0x2827d(%rip),%ymm7 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5
- DB 196,226,125,88,61,28,126,2,0 ; vpbroadcastd 0x27e1c(%rip),%ymm7 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,88,61,116,130,2,0 ; vpbroadcastd 0x28274(%rip),%ymm7 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,205,219,247 ; vpand %ymm7,%ymm6,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,226,125,24,61,15,126,2,0 ; vbroadcastss 0x27e0f(%rip),%ymm7 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,61,103,130,2,0 ; vbroadcastss 0x28267(%rip),%ymm7 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,116,125,2,0 ; vbroadcastss 0x27d74(%rip),%ymm7 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,61,204,129,2,0 ; vbroadcastss 0x281cc(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -3393,27 +3487,27 @@ _sk_load_565_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,123,255,255,255 ; ja 37b2 <_sk_load_565_dst_hsw+0x22>
+ DB 15,135,123,255,255,255 ; ja 3946 <_sk_load_565_dst_hsw+0x22>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 38a4 <_sk_load_565_dst_hsw+0x114>
+ DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3a38 <_sk_load_565_dst_hsw+0x114>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,89,255,255,255 ; jmpq 37b2 <_sk_load_565_dst_hsw+0x22>
+ DB 233,89,255,255,255 ; jmpq 3946 <_sk_load_565_dst_hsw+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,60,255,255,255 ; jmpq 37b2 <_sk_load_565_dst_hsw+0x22>
+ DB 233,60,255,255,255 ; jmpq 3946 <_sk_load_565_dst_hsw+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,15,255,255,255 ; jmpq 37b2 <_sk_load_565_dst_hsw+0x22>
+ DB 233,15,255,255,255 ; jmpq 3946 <_sk_load_565_dst_hsw+0x22>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3474,23 +3568,23 @@ _sk_gather_565_hsw LABEL PROC
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,151,124,2,0 ; vpbroadcastd 0x27c97(%rip),%ymm0 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,88,5,239,128,2,0 ; vpbroadcastd 0x280ef(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,138,124,2,0 ; vbroadcastss 0x27c8a(%rip),%ymm1 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,13,226,128,2,0 ; vbroadcastss 0x280e2(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,129,124,2,0 ; vpbroadcastd 0x27c81(%rip),%ymm1 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,88,13,217,128,2,0 ; vpbroadcastd 0x280d9(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,116,124,2,0 ; vbroadcastss 0x27c74(%rip),%ymm3 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,29,204,128,2,0 ; vbroadcastss 0x280cc(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,107,124,2,0 ; vpbroadcastd 0x27c6b(%rip),%ymm3 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,88,29,195,128,2,0 ; vpbroadcastd 0x280c3(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,94,124,2,0 ; vbroadcastss 0x27c5e(%rip),%ymm3 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,29,182,128,2,0 ; vbroadcastss 0x280b6(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,195,123,2,0 ; vbroadcastss 0x27bc3(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,27,128,2,0 ; vbroadcastss 0x2801b(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_hsw
@@ -3503,11 +3597,11 @@ _sk_store_565_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,141,124,2,0 ; vbroadcastss 0x27c8d(%rip),%ymm8 # 2b67c <_sk_overlay_sse2_8bit+0x55b>
+ DB 196,98,125,24,5,229,128,2,0 ; vbroadcastss 0x280e5(%rip),%ymm8 # 2bc68 <_sk_overlay_sse2_8bit+0x55b>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,11 ; vpslld $0xb,%ymm9,%ymm9
- DB 196,98,125,24,21,120,124,2,0 ; vbroadcastss 0x27c78(%rip),%ymm10 # 2b680 <_sk_overlay_sse2_8bit+0x55f>
+ DB 196,98,125,24,21,208,128,2,0 ; vbroadcastss 0x280d0(%rip),%ymm10 # 2bc6c <_sk_overlay_sse2_8bit+0x55f>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,45,114,242,5 ; vpslld $0x5,%ymm10,%ymm10
@@ -3518,7 +3612,7 @@ _sk_store_565_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 3a47 <_sk_store_565_hsw+0x78>
+ DB 117,11 ; jne 3bdb <_sk_store_565_hsw+0x78>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3527,22 +3621,22 @@ _sk_store_565_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 3a42 <_sk_store_565_hsw+0x73>
+ DB 119,235 ; ja 3bd6 <_sk_store_565_hsw+0x73>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 3aa4 <_sk_store_565_hsw+0xd5>
+ DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 3c38 <_sk_store_565_hsw+0xd5>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp 3a42 <_sk_store_565_hsw+0x73>
+ DB 235,206 ; jmp 3bd6 <_sk_store_565_hsw+0x73>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp 3a42 <_sk_store_565_hsw+0x73>
+ DB 235,190 ; jmp 3bd6 <_sk_store_565_hsw+0x73>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp 3a42 <_sk_store_565_hsw+0x73>
+ DB 235,158 ; jmp 3bd6 <_sk_store_565_hsw+0x73>
DB 199 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
@@ -3560,7 +3654,7 @@ _sk_store_565_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,224 ; callq ffffffffe1003abc <_sk_overlay_sse2_8bit+0xffffffffe0fd899b>
+ DB 232,255,255,255,224 ; callq ffffffffe1003c50 <_sk_overlay_sse2_8bit+0xffffffffe0fd8543>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -3576,28 +3670,28 @@ _sk_load_4444_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,139,0,0,0 ; jne 3b6b <_sk_load_4444_hsw+0xab>
+ DB 15,133,139,0,0,0 ; jne 3cff <_sk_load_4444_hsw+0xab>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,144,123,2,0 ; vpbroadcastd 0x27b90(%rip),%ymm0 # 2b684 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,88,5,232,127,2,0 ; vpbroadcastd 0x27fe8(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,131,123,2,0 ; vbroadcastss 0x27b83(%rip),%ymm1 # 2b688 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,13,219,127,2,0 ; vbroadcastss 0x27fdb(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,122,123,2,0 ; vpbroadcastd 0x27b7a(%rip),%ymm1 # 2b68c <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,88,13,210,127,2,0 ; vpbroadcastd 0x27fd2(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,109,123,2,0 ; vbroadcastss 0x27b6d(%rip),%ymm2 # 2b690 <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,21,197,127,2,0 ; vbroadcastss 0x27fc5(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,100,123,2,0 ; vpbroadcastd 0x27b64(%rip),%ymm2 # 2b694 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,88,21,188,127,2,0 ; vpbroadcastd 0x27fbc(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,87,123,2,0 ; vbroadcastss 0x27b57(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,175,127,2,0 ; vbroadcastss 0x27faf(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,77,123,2,0 ; vpbroadcastd 0x27b4d(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,88,5,165,127,2,0 ; vpbroadcastd 0x27fa5(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,63,123,2,0 ; vbroadcastss 0x27b3f(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,151,127,2,0 ; vbroadcastss 0x27f97(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3607,27 +3701,27 @@ _sk_load_4444_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,99,255,255,255 ; ja 3ae6 <_sk_load_4444_hsw+0x26>
+ DB 15,135,99,255,255,255 ; ja 3c7a <_sk_load_4444_hsw+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3bf0 <_sk_load_4444_hsw+0x130>
+ DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3d84 <_sk_load_4444_hsw+0x130>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,65,255,255,255 ; jmpq 3ae6 <_sk_load_4444_hsw+0x26>
+ DB 233,65,255,255,255 ; jmpq 3c7a <_sk_load_4444_hsw+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,36,255,255,255 ; jmpq 3ae6 <_sk_load_4444_hsw+0x26>
+ DB 233,36,255,255,255 ; jmpq 3c7a <_sk_load_4444_hsw+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,247,254,255,255 ; jmpq 3ae6 <_sk_load_4444_hsw+0x26>
+ DB 233,247,254,255,255 ; jmpq 3c7a <_sk_load_4444_hsw+0x26>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3660,28 +3754,28 @@ _sk_load_4444_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,139,0,0,0 ; jne 3cb7 <_sk_load_4444_dst_hsw+0xab>
+ DB 15,133,139,0,0,0 ; jne 3e4b <_sk_load_4444_dst_hsw+0xab>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 196,226,125,51,252 ; vpmovzxwd %xmm4,%ymm7
- DB 196,226,125,88,37,68,122,2,0 ; vpbroadcastd 0x27a44(%rip),%ymm4 # 2b684 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,88,37,156,126,2,0 ; vpbroadcastd 0x27e9c(%rip),%ymm4 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
DB 197,197,219,228 ; vpand %ymm4,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,55,122,2,0 ; vbroadcastss 0x27a37(%rip),%ymm5 # 2b688 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,45,143,126,2,0 ; vbroadcastss 0x27e8f(%rip),%ymm5 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,88,45,46,122,2,0 ; vpbroadcastd 0x27a2e(%rip),%ymm5 # 2b68c <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,88,45,134,126,2,0 ; vpbroadcastd 0x27e86(%rip),%ymm5 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
DB 197,197,219,237 ; vpand %ymm5,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,53,33,122,2,0 ; vbroadcastss 0x27a21(%rip),%ymm6 # 2b690 <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,53,121,126,2,0 ; vbroadcastss 0x27e79(%rip),%ymm6 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5
- DB 196,226,125,88,53,24,122,2,0 ; vpbroadcastd 0x27a18(%rip),%ymm6 # 2b694 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,88,53,112,126,2,0 ; vpbroadcastd 0x27e70(%rip),%ymm6 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
DB 197,197,219,246 ; vpand %ymm6,%ymm7,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,98,125,24,5,11,122,2,0 ; vbroadcastss 0x27a0b(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,99,126,2,0 ; vbroadcastss 0x27e63(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
- DB 196,98,125,88,5,1,122,2,0 ; vpbroadcastd 0x27a01(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,88,5,89,126,2,0 ; vpbroadcastd 0x27e59(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,69,219,248 ; vpand %ymm8,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,243,121,2,0 ; vbroadcastss 0x279f3(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,75,126,2,0 ; vbroadcastss 0x27e4b(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3691,27 +3785,27 @@ _sk_load_4444_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,99,255,255,255 ; ja 3c32 <_sk_load_4444_dst_hsw+0x26>
+ DB 15,135,99,255,255,255 ; ja 3dc6 <_sk_load_4444_dst_hsw+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3d3c <_sk_load_4444_dst_hsw+0x130>
+ DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3ed0 <_sk_load_4444_dst_hsw+0x130>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,65,255,255,255 ; jmpq 3c32 <_sk_load_4444_dst_hsw+0x26>
+ DB 233,65,255,255,255 ; jmpq 3dc6 <_sk_load_4444_dst_hsw+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,36,255,255,255 ; jmpq 3c32 <_sk_load_4444_dst_hsw+0x26>
+ DB 233,36,255,255,255 ; jmpq 3dc6 <_sk_load_4444_dst_hsw+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,247,254,255,255 ; jmpq 3c32 <_sk_load_4444_dst_hsw+0x26>
+ DB 233,247,254,255,255 ; jmpq 3dc6 <_sk_load_4444_dst_hsw+0x26>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3772,25 +3866,25 @@ _sk_gather_4444_hsw LABEL PROC
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,123,120,2,0 ; vpbroadcastd 0x2787b(%rip),%ymm0 # 2b684 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,88,5,211,124,2,0 ; vpbroadcastd 0x27cd3(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,110,120,2,0 ; vbroadcastss 0x2786e(%rip),%ymm1 # 2b688 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,13,198,124,2,0 ; vbroadcastss 0x27cc6(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,101,120,2,0 ; vpbroadcastd 0x27865(%rip),%ymm1 # 2b68c <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,88,13,189,124,2,0 ; vpbroadcastd 0x27cbd(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,88,120,2,0 ; vbroadcastss 0x27858(%rip),%ymm2 # 2b690 <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,21,176,124,2,0 ; vbroadcastss 0x27cb0(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,79,120,2,0 ; vpbroadcastd 0x2784f(%rip),%ymm2 # 2b694 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,88,21,167,124,2,0 ; vpbroadcastd 0x27ca7(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,66,120,2,0 ; vbroadcastss 0x27842(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,154,124,2,0 ; vbroadcastss 0x27c9a(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,56,120,2,0 ; vpbroadcastd 0x27838(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,88,5,144,124,2,0 ; vpbroadcastd 0x27c90(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,42,120,2,0 ; vbroadcastss 0x2782a(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,130,124,2,0 ; vbroadcastss 0x27c82(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3805,7 +3899,7 @@ _sk_store_4444_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,5,120,2,0 ; vbroadcastss 0x27805(%rip),%ymm8 # 2b6a4 <_sk_overlay_sse2_8bit+0x583>
+ DB 196,98,125,24,5,93,124,2,0 ; vbroadcastss 0x27c5d(%rip),%ymm8 # 2bc90 <_sk_overlay_sse2_8bit+0x583>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,12 ; vpslld $0xc,%ymm9,%ymm9
@@ -3823,7 +3917,7 @@ _sk_store_4444_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 3f03 <_sk_store_4444_hsw+0x84>
+ DB 117,11 ; jne 4097 <_sk_store_4444_hsw+0x84>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3832,22 +3926,22 @@ _sk_store_4444_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 3efe <_sk_store_4444_hsw+0x7f>
+ DB 119,235 ; ja 4092 <_sk_store_4444_hsw+0x7f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 3f60 <_sk_store_4444_hsw+0xe1>
+ DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 40f4 <_sk_store_4444_hsw+0xe1>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp 3efe <_sk_store_4444_hsw+0x7f>
+ DB 235,206 ; jmp 4092 <_sk_store_4444_hsw+0x7f>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp 3efe <_sk_store_4444_hsw+0x7f>
+ DB 235,190 ; jmp 4092 <_sk_store_4444_hsw+0x7f>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp 3efe <_sk_store_4444_hsw+0x7f>
+ DB 235,158 ; jmp 4092 <_sk_store_4444_hsw+0x7f>
DB 199 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
@@ -3865,7 +3959,7 @@ _sk_store_4444_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,224 ; callq ffffffffe1003f78 <_sk_overlay_sse2_8bit+0xffffffffe0fd8e57>
+ DB 232,255,255,255,224 ; callq ffffffffe100410c <_sk_overlay_sse2_8bit+0xffffffffe0fd89ff>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -3881,16 +3975,16 @@ _sk_load_8888_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 3ff0 <_sk_load_8888_hsw+0x74>
+ DB 117,87 ; jne 4184 <_sk_load_8888_hsw+0x74>
DB 196,193,126,111,28,153 ; vmovdqu (%r9,%rbx,4),%ymm3
- DB 197,229,219,5,89,120,2,0 ; vpand 0x27859(%rip),%ymm3,%ymm0 # 2b800 <_sk_overlay_sse2_8bit+0x6df>
+ DB 197,229,219,5,165,124,2,0 ; vpand 0x27ca5(%rip),%ymm3,%ymm0 # 2bde0 <_sk_overlay_sse2_8bit+0x6d3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,80,118,2,0 ; vbroadcastss 0x27650(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,168,122,2,0 ; vbroadcastss 0x27aa8(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,94,120,2,0 ; vpshufb 0x2785e(%rip),%ymm3,%ymm1 # 2b820 <_sk_overlay_sse2_8bit+0x6ff>
+ DB 196,226,101,0,13,170,124,2,0 ; vpshufb 0x27caa(%rip),%ymm3,%ymm1 # 2be00 <_sk_overlay_sse2_8bit+0x6f3>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,108,120,2,0 ; vpshufb 0x2786c(%rip),%ymm3,%ymm2 # 2b840 <_sk_overlay_sse2_8bit+0x71f>
+ DB 196,226,101,0,21,184,124,2,0 ; vpshufb 0x27cb8(%rip),%ymm3,%ymm2 # 2be20 <_sk_overlay_sse2_8bit+0x713>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -3904,21 +3998,21 @@ _sk_load_8888_hsw LABEL PROC
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,155 ; ja 3f9f <_sk_load_8888_hsw+0x23>
+ DB 119,155 ; ja 4133 <_sk_load_8888_hsw+0x23>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 409c <_sk_load_8888_hsw+0x120>
+ DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4230 <_sk_load_8888_hsw+0x120>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,28,153 ; vmovd (%r9,%rbx,4),%xmm3
- DB 233,124,255,255,255 ; jmpq 3f9f <_sk_load_8888_hsw+0x23>
+ DB 233,124,255,255,255 ; jmpq 4133 <_sk_load_8888_hsw+0x23>
DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
DB 196,227,117,2,216,4 ; vpblendd $0x4,%ymm0,%ymm1,%ymm3
DB 196,193,122,126,4,153 ; vmovq (%r9,%rbx,4),%xmm0
DB 196,227,101,2,216,3 ; vpblendd $0x3,%ymm0,%ymm3,%ymm3
- DB 233,85,255,255,255 ; jmpq 3f9f <_sk_load_8888_hsw+0x23>
+ DB 233,85,255,255,255 ; jmpq 4133 <_sk_load_8888_hsw+0x23>
DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -3931,9 +4025,9 @@ _sk_load_8888_hsw LABEL PROC
DB 196,227,101,56,216,1 ; vinserti128 $0x1,%xmm0,%ymm3,%ymm3
DB 196,193,122,111,4,153 ; vmovdqu (%r9,%rbx,4),%xmm0
DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- DB 233,6,255,255,255 ; jmpq 3f9f <_sk_load_8888_hsw+0x23>
+ DB 233,6,255,255,255 ; jmpq 4133 <_sk_load_8888_hsw+0x23>
DB 15,31,0 ; nopl (%rax)
- DB 124,255 ; jl 409d <_sk_load_8888_hsw+0x121>
+ DB 124,255 ; jl 4231 <_sk_load_8888_hsw+0x121>
DB 255 ; (bad)
DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp)
DB 255 ; (bad)
@@ -3965,16 +4059,16 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 412c <_sk_load_8888_dst_hsw+0x74>
+ DB 117,87 ; jne 42c0 <_sk_load_8888_dst_hsw+0x74>
DB 196,193,126,111,60,153 ; vmovdqu (%r9,%rbx,4),%ymm7
- DB 197,197,219,37,125,119,2,0 ; vpand 0x2777d(%rip),%ymm7,%ymm4 # 2b860 <_sk_overlay_sse2_8bit+0x73f>
+ DB 197,197,219,37,201,123,2,0 ; vpand 0x27bc9(%rip),%ymm7,%ymm4 # 2be40 <_sk_overlay_sse2_8bit+0x733>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,20,117,2,0 ; vbroadcastss 0x27514(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,108,121,2,0 ; vbroadcastss 0x2796c(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
- DB 196,226,69,0,45,130,119,2,0 ; vpshufb 0x27782(%rip),%ymm7,%ymm5 # 2b880 <_sk_overlay_sse2_8bit+0x75f>
+ DB 196,226,69,0,45,206,123,2,0 ; vpshufb 0x27bce(%rip),%ymm7,%ymm5 # 2be60 <_sk_overlay_sse2_8bit+0x753>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
DB 196,193,84,89,232 ; vmulps %ymm8,%ymm5,%ymm5
- DB 196,226,69,0,53,144,119,2,0 ; vpshufb 0x27790(%rip),%ymm7,%ymm6 # 2b8a0 <_sk_overlay_sse2_8bit+0x77f>
+ DB 196,226,69,0,53,220,123,2,0 ; vpshufb 0x27bdc(%rip),%ymm7,%ymm6 # 2be80 <_sk_overlay_sse2_8bit+0x773>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
@@ -3988,21 +4082,21 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,155 ; ja 40db <_sk_load_8888_dst_hsw+0x23>
+ DB 119,155 ; ja 426f <_sk_load_8888_dst_hsw+0x23>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 41d8 <_sk_load_8888_dst_hsw+0x120>
+ DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 436c <_sk_load_8888_dst_hsw+0x120>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,60,153 ; vmovd (%r9,%rbx,4),%xmm7
- DB 233,124,255,255,255 ; jmpq 40db <_sk_load_8888_dst_hsw+0x23>
+ DB 233,124,255,255,255 ; jmpq 426f <_sk_load_8888_dst_hsw+0x23>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
DB 196,227,85,2,252,4 ; vpblendd $0x4,%ymm4,%ymm5,%ymm7
DB 196,193,122,126,36,153 ; vmovq (%r9,%rbx,4),%xmm4
DB 196,227,69,2,252,3 ; vpblendd $0x3,%ymm4,%ymm7,%ymm7
- DB 233,85,255,255,255 ; jmpq 40db <_sk_load_8888_dst_hsw+0x23>
+ DB 233,85,255,255,255 ; jmpq 426f <_sk_load_8888_dst_hsw+0x23>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -4015,9 +4109,9 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 196,227,69,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm7,%ymm7
DB 196,193,122,111,36,153 ; vmovdqu (%r9,%rbx,4),%xmm4
DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- DB 233,6,255,255,255 ; jmpq 40db <_sk_load_8888_dst_hsw+0x23>
+ DB 233,6,255,255,255 ; jmpq 426f <_sk_load_8888_dst_hsw+0x23>
DB 15,31,0 ; nopl (%rax)
- DB 124,255 ; jl 41d9 <_sk_load_8888_dst_hsw+0x121>
+ DB 124,255 ; jl 436d <_sk_load_8888_dst_hsw+0x121>
DB 255 ; (bad)
DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp)
DB 255 ; (bad)
@@ -4049,14 +4143,14 @@ _sk_gather_8888_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- DB 197,229,219,5,158,118,2,0 ; vpand 0x2769e(%rip),%ymm3,%ymm0 # 2b8c0 <_sk_overlay_sse2_8bit+0x79f>
+ DB 197,229,219,5,234,122,2,0 ; vpand 0x27aea(%rip),%ymm3,%ymm0 # 2bea0 <_sk_overlay_sse2_8bit+0x793>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,213,115,2,0 ; vbroadcastss 0x273d5(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,45,120,2,0 ; vbroadcastss 0x2782d(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,163,118,2,0 ; vpshufb 0x276a3(%rip),%ymm3,%ymm1 # 2b8e0 <_sk_overlay_sse2_8bit+0x7bf>
+ DB 196,226,101,0,13,239,122,2,0 ; vpshufb 0x27aef(%rip),%ymm3,%ymm1 # 2bec0 <_sk_overlay_sse2_8bit+0x7b3>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,177,118,2,0 ; vpshufb 0x276b1(%rip),%ymm3,%ymm2 # 2b900 <_sk_overlay_sse2_8bit+0x7df>
+ DB 196,226,101,0,21,253,122,2,0 ; vpshufb 0x27afd(%rip),%ymm3,%ymm2 # 2bee0 <_sk_overlay_sse2_8bit+0x7d3>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4075,7 +4169,7 @@ _sk_store_8888_hsw LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,49,115,2,0 ; vbroadcastss 0x27331(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,137,119,2,0 ; vbroadcastss 0x27789(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -4091,7 +4185,7 @@ _sk_store_8888_hsw LABEL PROC
DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8
DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 42e4 <_sk_store_8888_hsw+0x7a>
+ DB 117,11 ; jne 4478 <_sk_store_8888_hsw+0x7a>
DB 196,65,126,127,4,153 ; vmovdqu %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -4100,17 +4194,17 @@ _sk_store_8888_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 42df <_sk_store_8888_hsw+0x75>
+ DB 119,235 ; ja 4473 <_sk_store_8888_hsw+0x75>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 4354 <_sk_store_8888_hsw+0xea>
+ DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 44e8 <_sk_store_8888_hsw+0xea>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,207 ; jmp 42df <_sk_store_8888_hsw+0x75>
+ DB 235,207 ; jmp 4473 <_sk_store_8888_hsw+0x75>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 235,191 ; jmp 42df <_sk_store_8888_hsw+0x75>
+ DB 235,191 ; jmp 4473 <_sk_store_8888_hsw+0x75>
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
@@ -4118,7 +4212,7 @@ _sk_store_8888_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,65,121,126,76,153,16 ; vmovd %xmm9,0x10(%r9,%rbx,4)
DB 196,65,122,127,4,153 ; vmovdqu %xmm8,(%r9,%rbx,4)
- DB 235,142 ; jmp 42df <_sk_store_8888_hsw+0x75>
+ DB 235,142 ; jmp 4473 <_sk_store_8888_hsw+0x75>
DB 15,31,0 ; nopl (%rax)
DB 180,255 ; mov $0xff,%ah
DB 255 ; (bad)
@@ -4130,7 +4224,7 @@ _sk_store_8888_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,218 ; callq ffffffffdb004368 <_sk_overlay_sse2_8bit+0xffffffffdafd9247>
+ DB 232,255,255,255,218 ; callq ffffffffdb0044fc <_sk_overlay_sse2_8bit+0xffffffffdafd8def>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,204 ; dec %esp
@@ -4149,16 +4243,16 @@ _sk_load_bgra_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 43e4 <_sk_load_bgra_hsw+0x74>
+ DB 117,87 ; jne 4578 <_sk_load_bgra_hsw+0x74>
DB 196,193,126,111,28,153 ; vmovdqu (%r9,%rbx,4),%ymm3
- DB 197,229,219,5,133,117,2,0 ; vpand 0x27585(%rip),%ymm3,%ymm0 # 2b920 <_sk_overlay_sse2_8bit+0x7ff>
+ DB 197,229,219,5,209,121,2,0 ; vpand 0x279d1(%rip),%ymm3,%ymm0 # 2bf00 <_sk_overlay_sse2_8bit+0x7f3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,92,114,2,0 ; vbroadcastss 0x2725c(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,180,118,2,0 ; vbroadcastss 0x276b4(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2
- DB 196,226,101,0,5,138,117,2,0 ; vpshufb 0x2758a(%rip),%ymm3,%ymm0 # 2b940 <_sk_overlay_sse2_8bit+0x81f>
+ DB 196,226,101,0,5,214,121,2,0 ; vpshufb 0x279d6(%rip),%ymm3,%ymm0 # 2bf20 <_sk_overlay_sse2_8bit+0x813>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1
- DB 196,226,101,0,5,152,117,2,0 ; vpshufb 0x27598(%rip),%ymm3,%ymm0 # 2b960 <_sk_overlay_sse2_8bit+0x83f>
+ DB 196,226,101,0,5,228,121,2,0 ; vpshufb 0x279e4(%rip),%ymm3,%ymm0 # 2bf40 <_sk_overlay_sse2_8bit+0x833>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4172,21 +4266,21 @@ _sk_load_bgra_hsw LABEL PROC
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,155 ; ja 4393 <_sk_load_bgra_hsw+0x23>
+ DB 119,155 ; ja 4527 <_sk_load_bgra_hsw+0x23>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4490 <_sk_load_bgra_hsw+0x120>
+ DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4624 <_sk_load_bgra_hsw+0x120>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,28,153 ; vmovd (%r9,%rbx,4),%xmm3
- DB 233,124,255,255,255 ; jmpq 4393 <_sk_load_bgra_hsw+0x23>
+ DB 233,124,255,255,255 ; jmpq 4527 <_sk_load_bgra_hsw+0x23>
DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
DB 196,227,117,2,216,4 ; vpblendd $0x4,%ymm0,%ymm1,%ymm3
DB 196,193,122,126,4,153 ; vmovq (%r9,%rbx,4),%xmm0
DB 196,227,101,2,216,3 ; vpblendd $0x3,%ymm0,%ymm3,%ymm3
- DB 233,85,255,255,255 ; jmpq 4393 <_sk_load_bgra_hsw+0x23>
+ DB 233,85,255,255,255 ; jmpq 4527 <_sk_load_bgra_hsw+0x23>
DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -4199,9 +4293,9 @@ _sk_load_bgra_hsw LABEL PROC
DB 196,227,101,56,216,1 ; vinserti128 $0x1,%xmm0,%ymm3,%ymm3
DB 196,193,122,111,4,153 ; vmovdqu (%r9,%rbx,4),%xmm0
DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- DB 233,6,255,255,255 ; jmpq 4393 <_sk_load_bgra_hsw+0x23>
+ DB 233,6,255,255,255 ; jmpq 4527 <_sk_load_bgra_hsw+0x23>
DB 15,31,0 ; nopl (%rax)
- DB 124,255 ; jl 4491 <_sk_load_bgra_hsw+0x121>
+ DB 124,255 ; jl 4625 <_sk_load_bgra_hsw+0x121>
DB 255 ; (bad)
DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp)
DB 255 ; (bad)
@@ -4233,16 +4327,16 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 4520 <_sk_load_bgra_dst_hsw+0x74>
+ DB 117,87 ; jne 46b4 <_sk_load_bgra_dst_hsw+0x74>
DB 196,193,126,111,60,153 ; vmovdqu (%r9,%rbx,4),%ymm7
- DB 197,197,219,37,169,116,2,0 ; vpand 0x274a9(%rip),%ymm7,%ymm4 # 2b980 <_sk_overlay_sse2_8bit+0x85f>
+ DB 197,197,219,37,245,120,2,0 ; vpand 0x278f5(%rip),%ymm7,%ymm4 # 2bf60 <_sk_overlay_sse2_8bit+0x853>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,32,113,2,0 ; vbroadcastss 0x27120(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,120,117,2,0 ; vbroadcastss 0x27578(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,92,89,240 ; vmulps %ymm8,%ymm4,%ymm6
- DB 196,226,69,0,37,174,116,2,0 ; vpshufb 0x274ae(%rip),%ymm7,%ymm4 # 2b9a0 <_sk_overlay_sse2_8bit+0x87f>
+ DB 196,226,69,0,37,250,120,2,0 ; vpshufb 0x278fa(%rip),%ymm7,%ymm4 # 2bf80 <_sk_overlay_sse2_8bit+0x873>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,92,89,232 ; vmulps %ymm8,%ymm4,%ymm5
- DB 196,226,69,0,37,188,116,2,0 ; vpshufb 0x274bc(%rip),%ymm7,%ymm4 # 2b9c0 <_sk_overlay_sse2_8bit+0x89f>
+ DB 196,226,69,0,37,8,121,2,0 ; vpshufb 0x27908(%rip),%ymm7,%ymm4 # 2bfa0 <_sk_overlay_sse2_8bit+0x893>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
@@ -4256,21 +4350,21 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,155 ; ja 44cf <_sk_load_bgra_dst_hsw+0x23>
+ DB 119,155 ; ja 4663 <_sk_load_bgra_dst_hsw+0x23>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 45cc <_sk_load_bgra_dst_hsw+0x120>
+ DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4760 <_sk_load_bgra_dst_hsw+0x120>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,60,153 ; vmovd (%r9,%rbx,4),%xmm7
- DB 233,124,255,255,255 ; jmpq 44cf <_sk_load_bgra_dst_hsw+0x23>
+ DB 233,124,255,255,255 ; jmpq 4663 <_sk_load_bgra_dst_hsw+0x23>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
DB 196,227,85,2,252,4 ; vpblendd $0x4,%ymm4,%ymm5,%ymm7
DB 196,193,122,126,36,153 ; vmovq (%r9,%rbx,4),%xmm4
DB 196,227,69,2,252,3 ; vpblendd $0x3,%ymm4,%ymm7,%ymm7
- DB 233,85,255,255,255 ; jmpq 44cf <_sk_load_bgra_dst_hsw+0x23>
+ DB 233,85,255,255,255 ; jmpq 4663 <_sk_load_bgra_dst_hsw+0x23>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -4283,9 +4377,9 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 196,227,69,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm7,%ymm7
DB 196,193,122,111,36,153 ; vmovdqu (%r9,%rbx,4),%xmm4
DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- DB 233,6,255,255,255 ; jmpq 44cf <_sk_load_bgra_dst_hsw+0x23>
+ DB 233,6,255,255,255 ; jmpq 4663 <_sk_load_bgra_dst_hsw+0x23>
DB 15,31,0 ; nopl (%rax)
- DB 124,255 ; jl 45cd <_sk_load_bgra_dst_hsw+0x121>
+ DB 124,255 ; jl 4761 <_sk_load_bgra_dst_hsw+0x121>
DB 255 ; (bad)
DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp)
DB 255 ; (bad)
@@ -4317,14 +4411,14 @@ _sk_gather_bgra_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- DB 197,229,219,5,202,115,2,0 ; vpand 0x273ca(%rip),%ymm3,%ymm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x8bf>
+ DB 197,229,219,5,22,120,2,0 ; vpand 0x27816(%rip),%ymm3,%ymm0 # 2bfc0 <_sk_overlay_sse2_8bit+0x8b3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,225,111,2,0 ; vbroadcastss 0x26fe1(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,57,116,2,0 ; vbroadcastss 0x27439(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2
- DB 196,226,101,0,5,207,115,2,0 ; vpshufb 0x273cf(%rip),%ymm3,%ymm0 # 2ba00 <_sk_overlay_sse2_8bit+0x8df>
+ DB 196,226,101,0,5,27,120,2,0 ; vpshufb 0x2781b(%rip),%ymm3,%ymm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x8d3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1
- DB 196,226,101,0,5,221,115,2,0 ; vpshufb 0x273dd(%rip),%ymm3,%ymm0 # 2ba20 <_sk_overlay_sse2_8bit+0x8ff>
+ DB 196,226,101,0,5,41,120,2,0 ; vpshufb 0x27829(%rip),%ymm3,%ymm0 # 2c000 <_sk_overlay_sse2_8bit+0x8f3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4343,7 +4437,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,61,111,2,0 ; vbroadcastss 0x26f3d(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,149,115,2,0 ; vbroadcastss 0x27395(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -4359,7 +4453,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8
DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 46d8 <_sk_store_bgra_hsw+0x7a>
+ DB 117,11 ; jne 486c <_sk_store_bgra_hsw+0x7a>
DB 196,65,126,127,4,153 ; vmovdqu %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -4368,17 +4462,17 @@ _sk_store_bgra_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 46d3 <_sk_store_bgra_hsw+0x75>
+ DB 119,235 ; ja 4867 <_sk_store_bgra_hsw+0x75>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 4748 <_sk_store_bgra_hsw+0xea>
+ DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 48dc <_sk_store_bgra_hsw+0xea>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,207 ; jmp 46d3 <_sk_store_bgra_hsw+0x75>
+ DB 235,207 ; jmp 4867 <_sk_store_bgra_hsw+0x75>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 235,191 ; jmp 46d3 <_sk_store_bgra_hsw+0x75>
+ DB 235,191 ; jmp 4867 <_sk_store_bgra_hsw+0x75>
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
@@ -4386,7 +4480,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,65,121,126,76,153,16 ; vmovd %xmm9,0x10(%r9,%rbx,4)
DB 196,65,122,127,4,153 ; vmovdqu %xmm8,(%r9,%rbx,4)
- DB 235,142 ; jmp 46d3 <_sk_store_bgra_hsw+0x75>
+ DB 235,142 ; jmp 4867 <_sk_store_bgra_hsw+0x75>
DB 15,31,0 ; nopl (%rax)
DB 180,255 ; mov $0xff,%ah
DB 255 ; (bad)
@@ -4398,7 +4492,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,218 ; callq ffffffffdb00475c <_sk_overlay_sse2_8bit+0xffffffffdafd963b>
+ DB 232,255,255,255,218 ; callq ffffffffdb0048f0 <_sk_overlay_sse2_8bit+0xffffffffdafd91e3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,204 ; dec %esp
@@ -4416,7 +4510,7 @@ _sk_load_f16_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,101 ; jne 47e5 <_sk_load_f16_hsw+0x81>
+ DB 117,101 ; jne 4979 <_sk_load_f16_hsw+0x81>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,84,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm2
DB 196,193,121,16,92,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm3
@@ -4442,29 +4536,29 @@ _sk_load_f16_hsw LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 484b <_sk_load_f16_hsw+0xe7>
+ DB 116,85 ; je 49df <_sk_load_f16_hsw+0xe7>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 484b <_sk_load_f16_hsw+0xe7>
+ DB 114,72 ; jb 49df <_sk_load_f16_hsw+0xe7>
DB 196,193,123,16,84,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 4858 <_sk_load_f16_hsw+0xf4>
+ DB 116,72 ; je 49ec <_sk_load_f16_hsw+0xf4>
DB 196,193,105,22,84,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 4858 <_sk_load_f16_hsw+0xf4>
+ DB 114,59 ; jb 49ec <_sk_load_f16_hsw+0xf4>
DB 196,193,123,16,92,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,109,255,255,255 ; je 479b <_sk_load_f16_hsw+0x37>
+ DB 15,132,109,255,255,255 ; je 492f <_sk_load_f16_hsw+0x37>
DB 196,193,97,22,92,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,92,255,255,255 ; jb 479b <_sk_load_f16_hsw+0x37>
+ DB 15,130,92,255,255,255 ; jb 492f <_sk_load_f16_hsw+0x37>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,80,255,255,255 ; jmpq 479b <_sk_load_f16_hsw+0x37>
+ DB 233,80,255,255,255 ; jmpq 492f <_sk_load_f16_hsw+0x37>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,67,255,255,255 ; jmpq 479b <_sk_load_f16_hsw+0x37>
+ DB 233,67,255,255,255 ; jmpq 492f <_sk_load_f16_hsw+0x37>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,58,255,255,255 ; jmpq 479b <_sk_load_f16_hsw+0x37>
+ DB 233,58,255,255,255 ; jmpq 492f <_sk_load_f16_hsw+0x37>
PUBLIC _sk_load_f16_dst_hsw
_sk_load_f16_dst_hsw LABEL PROC
@@ -4476,7 +4570,7 @@ _sk_load_f16_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,101 ; jne 48e2 <_sk_load_f16_dst_hsw+0x81>
+ DB 117,101 ; jne 4a76 <_sk_load_f16_dst_hsw+0x81>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,116,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm6
DB 196,193,121,16,124,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm7
@@ -4502,29 +4596,29 @@ _sk_load_f16_dst_hsw LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 4948 <_sk_load_f16_dst_hsw+0xe7>
+ DB 116,85 ; je 4adc <_sk_load_f16_dst_hsw+0xe7>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 4948 <_sk_load_f16_dst_hsw+0xe7>
+ DB 114,72 ; jb 4adc <_sk_load_f16_dst_hsw+0xe7>
DB 196,193,123,16,116,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm6
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 4955 <_sk_load_f16_dst_hsw+0xf4>
+ DB 116,72 ; je 4ae9 <_sk_load_f16_dst_hsw+0xf4>
DB 196,193,73,22,116,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 4955 <_sk_load_f16_dst_hsw+0xf4>
+ DB 114,59 ; jb 4ae9 <_sk_load_f16_dst_hsw+0xf4>
DB 196,193,123,16,124,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm7
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,109,255,255,255 ; je 4898 <_sk_load_f16_dst_hsw+0x37>
+ DB 15,132,109,255,255,255 ; je 4a2c <_sk_load_f16_dst_hsw+0x37>
DB 196,193,65,22,124,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm7,%xmm7
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,92,255,255,255 ; jb 4898 <_sk_load_f16_dst_hsw+0x37>
+ DB 15,130,92,255,255,255 ; jb 4a2c <_sk_load_f16_dst_hsw+0x37>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,80,255,255,255 ; jmpq 4898 <_sk_load_f16_dst_hsw+0x37>
+ DB 233,80,255,255,255 ; jmpq 4a2c <_sk_load_f16_dst_hsw+0x37>
DB 197,193,87,255 ; vxorpd %xmm7,%xmm7,%xmm7
DB 197,201,87,246 ; vxorpd %xmm6,%xmm6,%xmm6
- DB 233,67,255,255,255 ; jmpq 4898 <_sk_load_f16_dst_hsw+0x37>
+ DB 233,67,255,255,255 ; jmpq 4a2c <_sk_load_f16_dst_hsw+0x37>
DB 197,193,87,255 ; vxorpd %xmm7,%xmm7,%xmm7
- DB 233,58,255,255,255 ; jmpq 4898 <_sk_load_f16_dst_hsw+0x37>
+ DB 233,58,255,255,255 ; jmpq 4a2c <_sk_load_f16_dst_hsw+0x37>
PUBLIC _sk_gather_f16_hsw
_sk_gather_f16_hsw LABEL PROC
@@ -4583,7 +4677,7 @@ _sk_store_f16_hsw LABEL PROC
DB 196,65,57,98,205 ; vpunpckldq %xmm13,%xmm8,%xmm9
DB 196,65,57,106,197 ; vpunpckhdq %xmm13,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,31 ; jne 4a63 <_sk_store_f16_hsw+0x7b>
+ DB 117,31 ; jne 4bf7 <_sk_store_f16_hsw+0x7b>
DB 196,65,120,17,28,193 ; vmovups %xmm11,(%r9,%rax,8)
DB 196,65,120,17,84,193,16 ; vmovups %xmm10,0x10(%r9,%rax,8)
DB 196,65,120,17,76,193,32 ; vmovups %xmm9,0x20(%r9,%rax,8)
@@ -4592,22 +4686,22 @@ _sk_store_f16_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,193 ; vmovq %xmm11,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 4a5f <_sk_store_f16_hsw+0x77>
+ DB 116,240 ; je 4bf3 <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,92,193,8 ; vmovhpd %xmm11,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 4a5f <_sk_store_f16_hsw+0x77>
+ DB 114,227 ; jb 4bf3 <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,84,193,16 ; vmovq %xmm10,0x10(%r9,%rax,8)
- DB 116,218 ; je 4a5f <_sk_store_f16_hsw+0x77>
+ DB 116,218 ; je 4bf3 <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,84,193,24 ; vmovhpd %xmm10,0x18(%r9,%rax,8)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 4a5f <_sk_store_f16_hsw+0x77>
+ DB 114,205 ; jb 4bf3 <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,76,193,32 ; vmovq %xmm9,0x20(%r9,%rax,8)
- DB 116,196 ; je 4a5f <_sk_store_f16_hsw+0x77>
+ DB 116,196 ; je 4bf3 <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,76,193,40 ; vmovhpd %xmm9,0x28(%r9,%rax,8)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,183 ; jb 4a5f <_sk_store_f16_hsw+0x77>
+ DB 114,183 ; jb 4bf3 <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,68,193,48 ; vmovq %xmm8,0x30(%r9,%rax,8)
- DB 235,174 ; jmp 4a5f <_sk_store_f16_hsw+0x77>
+ DB 235,174 ; jmp 4bf3 <_sk_store_f16_hsw+0x77>
PUBLIC _sk_load_u16_be_hsw
_sk_load_u16_be_hsw LABEL PROC
@@ -4620,7 +4714,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,204,0,0,0 ; jne 4ba4 <_sk_load_u16_be_hsw+0xf3>
+ DB 15,133,204,0,0,0 ; jne 4d38 <_sk_load_u16_be_hsw+0xf3>
DB 196,65,121,16,4,65 ; vmovupd (%r9,%rax,2),%xmm8
DB 196,193,121,16,84,65,16 ; vmovupd 0x10(%r9,%rax,2),%xmm2
DB 196,193,121,16,92,65,32 ; vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -4639,7 +4733,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,231,106,2,0 ; vbroadcastss 0x26ae7(%rip),%ymm10 # 2b620 <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,98,125,24,21,63,111,2,0 ; vbroadcastss 0x26f3f(%rip),%ymm10 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -4667,29 +4761,29 @@ _sk_load_u16_be_hsw LABEL PROC
DB 196,65,123,16,4,65 ; vmovsd (%r9,%rax,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 4c0a <_sk_load_u16_be_hsw+0x159>
+ DB 116,85 ; je 4d9e <_sk_load_u16_be_hsw+0x159>
DB 196,65,57,22,68,65,8 ; vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 4c0a <_sk_load_u16_be_hsw+0x159>
+ DB 114,72 ; jb 4d9e <_sk_load_u16_be_hsw+0x159>
DB 196,193,123,16,84,65,16 ; vmovsd 0x10(%r9,%rax,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 4c17 <_sk_load_u16_be_hsw+0x166>
+ DB 116,72 ; je 4dab <_sk_load_u16_be_hsw+0x166>
DB 196,193,105,22,84,65,24 ; vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 4c17 <_sk_load_u16_be_hsw+0x166>
+ DB 114,59 ; jb 4dab <_sk_load_u16_be_hsw+0x166>
DB 196,193,123,16,92,65,32 ; vmovsd 0x20(%r9,%rax,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,6,255,255,255 ; je 4af3 <_sk_load_u16_be_hsw+0x42>
+ DB 15,132,6,255,255,255 ; je 4c87 <_sk_load_u16_be_hsw+0x42>
DB 196,193,97,22,92,65,40 ; vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,245,254,255,255 ; jb 4af3 <_sk_load_u16_be_hsw+0x42>
+ DB 15,130,245,254,255,255 ; jb 4c87 <_sk_load_u16_be_hsw+0x42>
DB 196,65,122,126,76,65,48 ; vmovq 0x30(%r9,%rax,2),%xmm9
- DB 233,233,254,255,255 ; jmpq 4af3 <_sk_load_u16_be_hsw+0x42>
+ DB 233,233,254,255,255 ; jmpq 4c87 <_sk_load_u16_be_hsw+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,220,254,255,255 ; jmpq 4af3 <_sk_load_u16_be_hsw+0x42>
+ DB 233,220,254,255,255 ; jmpq 4c87 <_sk_load_u16_be_hsw+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,211,254,255,255 ; jmpq 4af3 <_sk_load_u16_be_hsw+0x42>
+ DB 233,211,254,255,255 ; jmpq 4c87 <_sk_load_u16_be_hsw+0x42>
PUBLIC _sk_load_rgb_u16_be_hsw
_sk_load_rgb_u16_be_hsw LABEL PROC
@@ -4704,7 +4798,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,204,0,0,0 ; jne 4d17 <_sk_load_rgb_u16_be_hsw+0xf7>
+ DB 15,133,204,0,0,0 ; jne 4eab <_sk_load_rgb_u16_be_hsw+0xf7>
DB 196,193,122,111,4,65 ; vmovdqu (%r9,%rax,2),%xmm0
DB 196,193,122,111,84,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm2
DB 196,193,122,111,76,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -4728,7 +4822,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,91,105,2,0 ; vbroadcastss 0x2695b(%rip),%ymm10 # 2b620 <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,98,125,24,21,179,109,2,0 ; vbroadcastss 0x26db3(%rip),%ymm10 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -4745,41 +4839,41 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,123,104,2,0 ; vbroadcastss 0x2687b(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,211,108,2,0 ; vbroadcastss 0x26cd3(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0
DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 4d30 <_sk_load_rgb_u16_be_hsw+0x110>
- DB 233,79,255,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 117,5 ; jne 4ec4 <_sk_load_rgb_u16_be_hsw+0x110>
+ DB 233,79,255,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
DB 196,193,121,110,76,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm1
DB 196,65,113,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 4d5f <_sk_load_rgb_u16_be_hsw+0x13f>
+ DB 114,26 ; jb 4ef3 <_sk_load_rgb_u16_be_hsw+0x13f>
DB 196,193,121,110,76,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm1
DB 196,193,113,196,84,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 4d64 <_sk_load_rgb_u16_be_hsw+0x144>
- DB 233,32,255,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 233,27,255,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 117,10 ; jne 4ef8 <_sk_load_rgb_u16_be_hsw+0x144>
+ DB 233,32,255,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 233,27,255,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
DB 196,193,121,110,76,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm1
DB 196,65,113,196,76,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 4d93 <_sk_load_rgb_u16_be_hsw+0x173>
+ DB 114,26 ; jb 4f27 <_sk_load_rgb_u16_be_hsw+0x173>
DB 196,193,121,110,76,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm1
DB 196,193,113,196,76,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 4d98 <_sk_load_rgb_u16_be_hsw+0x178>
- DB 233,236,254,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 233,231,254,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 117,10 ; jne 4f2c <_sk_load_rgb_u16_be_hsw+0x178>
+ DB 233,236,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 233,231,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
DB 196,193,121,110,92,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm3
DB 196,65,97,196,92,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 4dc1 <_sk_load_rgb_u16_be_hsw+0x1a1>
+ DB 114,20 ; jb 4f55 <_sk_load_rgb_u16_be_hsw+0x1a1>
DB 196,193,121,110,92,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm3
DB 196,193,97,196,92,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- DB 233,190,254,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 233,185,254,255,255 ; jmpq 4c7f <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 233,190,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 233,185,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
PUBLIC _sk_store_u16_be_hsw
_sk_store_u16_be_hsw LABEL PROC
@@ -4791,7 +4885,7 @@ _sk_store_u16_be_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 196,98,125,24,5,187,104,2,0 ; vbroadcastss 0x268bb(%rip),%ymm8 # 2b6a8 <_sk_overlay_sse2_8bit+0x587>
+ DB 196,98,125,24,5,19,109,2,0 ; vbroadcastss 0x26d13(%rip),%ymm8 # 2bc94 <_sk_overlay_sse2_8bit+0x587>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -4829,7 +4923,7 @@ _sk_store_u16_be_hsw LABEL PROC
DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9
DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,31 ; jne 4ed1 <_sk_store_u16_be_hsw+0x10b>
+ DB 117,31 ; jne 5065 <_sk_store_u16_be_hsw+0x10b>
DB 196,65,120,17,28,65 ; vmovups %xmm11,(%r9,%rax,2)
DB 196,65,120,17,84,65,16 ; vmovups %xmm10,0x10(%r9,%rax,2)
DB 196,65,120,17,76,65,32 ; vmovups %xmm9,0x20(%r9,%rax,2)
@@ -4838,28 +4932,28 @@ _sk_store_u16_be_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,65 ; vmovq %xmm11,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 4ecd <_sk_store_u16_be_hsw+0x107>
+ DB 116,240 ; je 5061 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,92,65,8 ; vmovhpd %xmm11,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 4ecd <_sk_store_u16_be_hsw+0x107>
+ DB 114,227 ; jb 5061 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,84,65,16 ; vmovq %xmm10,0x10(%r9,%rax,2)
- DB 116,218 ; je 4ecd <_sk_store_u16_be_hsw+0x107>
+ DB 116,218 ; je 5061 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,84,65,24 ; vmovhpd %xmm10,0x18(%r9,%rax,2)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 4ecd <_sk_store_u16_be_hsw+0x107>
+ DB 114,205 ; jb 5061 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,76,65,32 ; vmovq %xmm9,0x20(%r9,%rax,2)
- DB 116,196 ; je 4ecd <_sk_store_u16_be_hsw+0x107>
+ DB 116,196 ; je 5061 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,76,65,40 ; vmovhpd %xmm9,0x28(%r9,%rax,2)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,183 ; jb 4ecd <_sk_store_u16_be_hsw+0x107>
+ DB 114,183 ; jb 5061 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,68,65,48 ; vmovq %xmm8,0x30(%r9,%rax,2)
- DB 235,174 ; jmp 4ecd <_sk_store_u16_be_hsw+0x107>
+ DB 235,174 ; jmp 5061 <_sk_store_u16_be_hsw+0x107>
PUBLIC _sk_load_f32_hsw
_sk_load_f32_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja 4fab <_sk_load_f32_hsw+0x8c>
+ DB 15,135,128,0,0,0 ; ja 513f <_sk_load_f32_hsw+0x8c>
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -4867,7 +4961,7 @@ _sk_load_f32_hsw LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,133,0,0,0 ; lea 0x85(%rip),%r11 # 4fd4 <_sk_load_f32_hsw+0xb5>
+ DB 76,141,29,133,0,0,0 ; lea 0x85(%rip),%r11 # 5168 <_sk_load_f32_hsw+0xb5>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
@@ -4913,7 +5007,7 @@ PUBLIC _sk_load_f32_dst_hsw
_sk_load_f32_dst_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja 5080 <_sk_load_f32_dst_hsw+0x8c>
+ DB 15,135,128,0,0,0 ; ja 5214 <_sk_load_f32_dst_hsw+0x8c>
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -4921,7 +5015,7 @@ _sk_load_f32_dst_hsw LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 50a8 <_sk_load_f32_dst_hsw+0xb4>
+ DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 523c <_sk_load_f32_dst_hsw+0xb4>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
@@ -4983,7 +5077,7 @@ _sk_store_f32_hsw LABEL PROC
DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8
DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11
DB 77,133,192 ; test %r8,%r8
- DB 117,55 ; jne 5147 <_sk_store_f32_hsw+0x7f>
+ DB 117,55 ; jne 52db <_sk_store_f32_hsw+0x7f>
DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -4996,22 +5090,22 @@ _sk_store_f32_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,17,20,129 ; vmovupd %xmm10,(%r9,%rax,4)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 5143 <_sk_store_f32_hsw+0x7b>
+ DB 116,240 ; je 52d7 <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,76,129,16 ; vmovupd %xmm9,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 5143 <_sk_store_f32_hsw+0x7b>
+ DB 114,227 ; jb 52d7 <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,68,129,32 ; vmovupd %xmm8,0x20(%r9,%rax,4)
- DB 116,218 ; je 5143 <_sk_store_f32_hsw+0x7b>
+ DB 116,218 ; je 52d7 <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,92,129,48 ; vmovupd %xmm11,0x30(%r9,%rax,4)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 5143 <_sk_store_f32_hsw+0x7b>
+ DB 114,205 ; jb 52d7 <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,84,129,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- DB 116,195 ; je 5143 <_sk_store_f32_hsw+0x7b>
+ DB 116,195 ; je 52d7 <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,76,129,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,181 ; jb 5143 <_sk_store_f32_hsw+0x7b>
+ DB 114,181 ; jb 52d7 <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,68,129,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- DB 235,171 ; jmp 5143 <_sk_store_f32_hsw+0x7b>
+ DB 235,171 ; jmp 52d7 <_sk_store_f32_hsw+0x7b>
PUBLIC _sk_clamp_x_hsw
_sk_clamp_x_hsw LABEL PROC
@@ -5078,7 +5172,7 @@ _sk_mirror_x_hsw LABEL PROC
DB 196,65,124,92,218 ; vsubps %ymm10,%ymm0,%ymm11
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,98,125,24,192 ; vbroadcastss %xmm0,%ymm8
- DB 197,178,89,5,23,99,2,0 ; vmulss 0x26317(%rip),%xmm9,%xmm0 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 197,178,89,5,111,103,2,0 ; vmulss 0x2676f(%rip),%xmm9,%xmm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
DB 196,227,125,8,192,1 ; vroundps $0x1,%ymm0,%ymm0
@@ -5103,7 +5197,7 @@ _sk_mirror_y_hsw LABEL PROC
DB 196,65,116,92,218 ; vsubps %ymm10,%ymm1,%ymm11
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,98,125,24,193 ; vbroadcastss %xmm1,%ymm8
- DB 197,178,89,13,179,98,2,0 ; vmulss 0x262b3(%rip),%xmm9,%xmm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 197,178,89,13,11,103,2,0 ; vmulss 0x2670b(%rip),%xmm9,%xmm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,226,125,24,201 ; vbroadcastss %xmm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
DB 196,227,125,8,201,1 ; vroundps $0x1,%ymm1,%ymm1
@@ -5123,7 +5217,7 @@ PUBLIC _sk_clamp_x_1_hsw
_sk_clamp_x_1_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,104,98,2,0 ; vbroadcastss 0x26268(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,192,102,2,0 ; vbroadcastss 0x266c0(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -5137,9 +5231,9 @@ _sk_repeat_x_1_hsw LABEL PROC
PUBLIC _sk_mirror_x_1_hsw
_sk_mirror_x_1_hsw LABEL PROC
- DB 196,98,125,24,5,95,98,2,0 ; vbroadcastss 0x2625f(%rip),%ymm8 # 2b5a8 <_sk_overlay_sse2_8bit+0x487>
+ DB 196,98,125,24,5,183,102,2,0 ; vbroadcastss 0x266b7(%rip),%ymm8 # 2bb94 <_sk_overlay_sse2_8bit+0x487>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,53,98,2,0 ; vbroadcastss 0x26235(%rip),%ymm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,13,141,102,2,0 ; vbroadcastss 0x2668d(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -5153,11 +5247,11 @@ _sk_mirror_x_1_hsw LABEL PROC
PUBLIC _sk_luminance_to_alpha_hsw
_sk_luminance_to_alpha_hsw LABEL PROC
- DB 196,226,125,24,29,33,99,2,0 ; vbroadcastss 0x26321(%rip),%ymm3 # 2b6ac <_sk_overlay_sse2_8bit+0x58b>
- DB 196,98,125,24,5,28,99,2,0 ; vbroadcastss 0x2631c(%rip),%ymm8 # 2b6b0 <_sk_overlay_sse2_8bit+0x58f>
+ DB 196,226,125,24,29,121,103,2,0 ; vbroadcastss 0x26779(%rip),%ymm3 # 2bc98 <_sk_overlay_sse2_8bit+0x58b>
+ DB 196,98,125,24,5,116,103,2,0 ; vbroadcastss 0x26774(%rip),%ymm8 # 2bc9c <_sk_overlay_sse2_8bit+0x58f>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 196,226,125,184,203 ; vfmadd231ps %ymm3,%ymm0,%ymm1
- DB 196,226,125,24,29,13,99,2,0 ; vbroadcastss 0x2630d(%rip),%ymm3 # 2b6b4 <_sk_overlay_sse2_8bit+0x593>
+ DB 196,226,125,24,29,101,103,2,0 ; vbroadcastss 0x26765(%rip),%ymm3 # 2bca0 <_sk_overlay_sse2_8bit+0x593>
DB 196,226,109,168,217 ; vfmadd213ps %ymm1,%ymm2,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -5341,9 +5435,9 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 76,139,72,8 ; mov 0x8(%rax),%r9
DB 77,137,211 ; mov %r10,%r11
DB 73,255,203 ; dec %r11
- DB 120,7 ; js 56a0 <_sk_evenly_spaced_gradient_hsw+0x19>
+ DB 120,7 ; js 5834 <_sk_evenly_spaced_gradient_hsw+0x19>
DB 196,193,242,42,203 ; vcvtsi2ss %r11,%xmm1,%xmm1
- DB 235,22 ; jmp 56b6 <_sk_evenly_spaced_gradient_hsw+0x2f>
+ DB 235,22 ; jmp 584a <_sk_evenly_spaced_gradient_hsw+0x2f>
DB 76,137,219 ; mov %r11,%rbx
DB 72,209,235 ; shr %rbx
DB 65,131,227,1 ; and $0x1,%r11d
@@ -5354,7 +5448,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 197,244,89,200 ; vmulps %ymm0,%ymm1,%ymm1
DB 197,126,91,217 ; vcvttps2dq %ymm1,%ymm11
DB 73,131,250,8 ; cmp $0x8,%r10
- DB 119,70 ; ja 570f <_sk_evenly_spaced_gradient_hsw+0x88>
+ DB 119,70 ; ja 58a3 <_sk_evenly_spaced_gradient_hsw+0x88>
DB 196,66,37,22,1 ; vpermps (%r9),%ymm11,%ymm8
DB 72,139,88,40 ; mov 0x28(%rax),%rbx
DB 196,98,37,22,11 ; vpermps (%rbx),%ymm11,%ymm9
@@ -5370,7 +5464,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 196,226,37,22,27 ; vpermps (%rbx),%ymm11,%ymm3
DB 72,139,64,64 ; mov 0x40(%rax),%rax
DB 196,98,37,22,40 ; vpermps (%rax),%ymm11,%ymm13
- DB 235,110 ; jmp 577d <_sk_evenly_spaced_gradient_hsw+0xf6>
+ DB 235,110 ; jmp 5911 <_sk_evenly_spaced_gradient_hsw+0xf6>
DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,2,117,146,4,153 ; vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8
@@ -5405,14 +5499,14 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_hsw
_sk_gauss_a_to_rgba_hsw LABEL PROC
- DB 196,226,125,24,5,21,95,2,0 ; vbroadcastss 0x25f15(%rip),%ymm0 # 2b6b8 <_sk_overlay_sse2_8bit+0x597>
- DB 196,226,125,24,13,16,95,2,0 ; vbroadcastss 0x25f10(%rip),%ymm1 # 2b6bc <_sk_overlay_sse2_8bit+0x59b>
+ DB 196,226,125,24,5,109,99,2,0 ; vbroadcastss 0x2636d(%rip),%ymm0 # 2bca4 <_sk_overlay_sse2_8bit+0x597>
+ DB 196,226,125,24,13,104,99,2,0 ; vbroadcastss 0x26368(%rip),%ymm1 # 2bca8 <_sk_overlay_sse2_8bit+0x59b>
DB 196,226,101,168,200 ; vfmadd213ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,6,95,2,0 ; vbroadcastss 0x25f06(%rip),%ymm0 # 2b6c0 <_sk_overlay_sse2_8bit+0x59f>
+ DB 196,226,125,24,5,94,99,2,0 ; vbroadcastss 0x2635e(%rip),%ymm0 # 2bcac <_sk_overlay_sse2_8bit+0x59f>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
- DB 196,226,125,24,13,252,94,2,0 ; vbroadcastss 0x25efc(%rip),%ymm1 # 2b6c4 <_sk_overlay_sse2_8bit+0x5a3>
+ DB 196,226,125,24,13,84,99,2,0 ; vbroadcastss 0x26354(%rip),%ymm1 # 2bcb0 <_sk_overlay_sse2_8bit+0x5a3>
DB 196,226,101,184,200 ; vfmadd231ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,242,94,2,0 ; vbroadcastss 0x25ef2(%rip),%ymm0 # 2b6c8 <_sk_overlay_sse2_8bit+0x5a7>
+ DB 196,226,125,24,5,74,99,2,0 ; vbroadcastss 0x2634a(%rip),%ymm0 # 2bcb4 <_sk_overlay_sse2_8bit+0x5a7>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -5425,11 +5519,11 @@ _sk_gradient_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 73,131,249,1 ; cmp $0x1,%r9
- DB 15,134,180,0,0,0 ; jbe 58ae <_sk_gradient_hsw+0xc3>
+ DB 15,134,180,0,0,0 ; jbe 5a42 <_sk_gradient_hsw+0xc3>
DB 76,139,80,72 ; mov 0x48(%rax),%r10
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 65,187,1,0,0,0 ; mov $0x1,%r11d
- DB 196,226,125,24,21,131,93,2,0 ; vbroadcastss 0x25d83(%rip),%ymm2 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,226,125,24,21,219,97,2,0 ; vbroadcastss 0x261db(%rip),%ymm2 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
DB 196,130,125,24,28,154 ; vbroadcastss (%r10,%r11,4),%ymm3
DB 197,228,194,216,2 ; vcmpleps %ymm0,%ymm3,%ymm3
@@ -5437,10 +5531,10 @@ _sk_gradient_hsw LABEL PROC
DB 196,65,101,254,201 ; vpaddd %ymm9,%ymm3,%ymm9
DB 73,255,195 ; inc %r11
DB 77,57,217 ; cmp %r11,%r9
- DB 117,226 ; jne 5816 <_sk_gradient_hsw+0x2b>
+ DB 117,226 ; jne 59aa <_sk_gradient_hsw+0x2b>
DB 76,139,80,8 ; mov 0x8(%rax),%r10
DB 73,131,249,8 ; cmp $0x8,%r9
- DB 118,121 ; jbe 58b7 <_sk_gradient_hsw+0xcc>
+ DB 118,121 ; jbe 5a4b <_sk_gradient_hsw+0xcc>
DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,2,117,146,4,138 ; vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8
@@ -5464,7 +5558,7 @@ _sk_gradient_hsw LABEL PROC
DB 196,130,21,146,28,137 ; vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3
DB 72,139,64,64 ; mov 0x40(%rax),%rax
DB 196,34,13,146,44,136 ; vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13
- DB 235,77 ; jmp 58fb <_sk_gradient_hsw+0x110>
+ DB 235,77 ; jmp 5a8f <_sk_gradient_hsw+0x110>
DB 76,139,80,8 ; mov 0x8(%rax),%r10
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 196,66,53,22,2 ; vpermps (%r10),%ymm9,%ymm8
@@ -5520,24 +5614,24 @@ _sk_xy_to_unit_angle_hsw LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,54,93,2,0 ; vbroadcastss 0x25d36(%rip),%ymm13 # 2b6cc <_sk_overlay_sse2_8bit+0x5ab>
- DB 196,98,125,24,53,49,93,2,0 ; vbroadcastss 0x25d31(%rip),%ymm14 # 2b6d0 <_sk_overlay_sse2_8bit+0x5af>
+ DB 196,98,125,24,45,142,97,2,0 ; vbroadcastss 0x2618e(%rip),%ymm13 # 2bcb8 <_sk_overlay_sse2_8bit+0x5ab>
+ DB 196,98,125,24,53,137,97,2,0 ; vbroadcastss 0x26189(%rip),%ymm14 # 2bcbc <_sk_overlay_sse2_8bit+0x5af>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
- DB 196,98,125,24,45,39,93,2,0 ; vbroadcastss 0x25d27(%rip),%ymm13 # 2b6d4 <_sk_overlay_sse2_8bit+0x5b3>
+ DB 196,98,125,24,45,127,97,2,0 ; vbroadcastss 0x2617f(%rip),%ymm13 # 2bcc0 <_sk_overlay_sse2_8bit+0x5b3>
DB 196,66,29,184,238 ; vfmadd231ps %ymm14,%ymm12,%ymm13
- DB 196,98,125,24,53,29,93,2,0 ; vbroadcastss 0x25d1d(%rip),%ymm14 # 2b6d8 <_sk_overlay_sse2_8bit+0x5b7>
+ DB 196,98,125,24,53,117,97,2,0 ; vbroadcastss 0x26175(%rip),%ymm14 # 2bcc4 <_sk_overlay_sse2_8bit+0x5b7>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
DB 196,65,36,89,222 ; vmulps %ymm14,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,8,93,2,0 ; vbroadcastss 0x25d08(%rip),%ymm10 # 2b6dc <_sk_overlay_sse2_8bit+0x5bb>
+ DB 196,98,125,24,21,96,97,2,0 ; vbroadcastss 0x26160(%rip),%ymm10 # 2bcc8 <_sk_overlay_sse2_8bit+0x5bb>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,158,91,2,0 ; vbroadcastss 0x25b9e(%rip),%ymm10 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,21,246,95,2,0 ; vbroadcastss 0x25ff6(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,136,91,2,0 ; vbroadcastss 0x25b88(%rip),%ymm10 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,21,224,95,2,0 ; vbroadcastss 0x25fe0(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -5561,23 +5655,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw LABEL PROC
DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10
DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,136,92,2,0 ; vbroadcastss 0x25c88(%rip),%ymm11 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,29,224,96,2,0 ; vbroadcastss 0x260e0(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11
DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,103,92,2,0 ; vbroadcastss 0x25c67(%rip),%ymm9 # 2b6e4 <_sk_overlay_sse2_8bit+0x5c3>
+ DB 196,98,125,24,13,191,96,2,0 ; vbroadcastss 0x260bf(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,74,92,2,0 ; vbroadcastss 0x25c4a(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,162,96,2,0 ; vbroadcastss 0x260a2(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,219,90,2,0 ; vbroadcastss 0x25adb(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,51,95,2,0 ; vbroadcastss 0x25f33(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -5594,23 +5688,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw LABEL PROC
DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10
DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,240,91,2,0 ; vbroadcastss 0x25bf0(%rip),%ymm11 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,29,72,96,2,0 ; vbroadcastss 0x26048(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11
DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,207,91,2,0 ; vbroadcastss 0x25bcf(%rip),%ymm9 # 2b6e4 <_sk_overlay_sse2_8bit+0x5c3>
+ DB 196,98,125,24,13,39,96,2,0 ; vbroadcastss 0x26027(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,178,91,2,0 ; vbroadcastss 0x25bb2(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,10,96,2,0 ; vbroadcastss 0x2600a(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,67,90,2,0 ; vbroadcastss 0x25a43(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,155,94,2,0 ; vbroadcastss 0x25e9b(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -5626,14 +5720,14 @@ _sk_xy_to_2pt_conical_linear_hsw LABEL PROC
DB 197,58,89,72,44 ; vmulss 0x2c(%rax),%xmm8,%xmm9
DB 196,66,125,24,201 ; vbroadcastss %xmm9,%ymm9
DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
- DB 196,98,125,24,21,94,91,2,0 ; vbroadcastss 0x25b5e(%rip),%ymm10 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,21,182,95,2,0 ; vbroadcastss 0x25fb6(%rip),%ymm10 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10
DB 196,98,125,184,208 ; vfmadd231ps %ymm0,%ymm0,%ymm10
DB 196,193,58,89,192 ; vmulss %xmm8,%xmm8,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0
- DB 196,98,125,24,5,65,91,2,0 ; vbroadcastss 0x25b41(%rip),%ymm8 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,5,153,95,2,0 ; vbroadcastss 0x25f99(%rip),%ymm8 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0
DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5667,7 +5761,7 @@ _sk_apply_vector_mask_hsw LABEL PROC
PUBLIC _sk_save_xy_hsw
_sk_save_xy_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,129,89,2,0 ; vbroadcastss 0x25981(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,217,93,2,0 ; vbroadcastss 0x25dd9(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -5697,9 +5791,9 @@ _sk_accumulate_hsw LABEL PROC
PUBLIC _sk_bilinear_nx_hsw
_sk_bilinear_nx_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,113,90,2,0 ; vbroadcastss 0x25a71(%rip),%ymm0 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,5,201,94,2,0 ; vbroadcastss 0x25ec9(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,8,89,2,0 ; vbroadcastss 0x25908(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,96,93,2,0 ; vbroadcastss 0x25d60(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5708,7 +5802,7 @@ _sk_bilinear_nx_hsw LABEL PROC
PUBLIC _sk_bilinear_px_hsw
_sk_bilinear_px_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,232,88,2,0 ; vbroadcastss 0x258e8(%rip),%ymm0 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,5,64,93,2,0 ; vbroadcastss 0x25d40(%rip),%ymm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5718,9 +5812,9 @@ _sk_bilinear_px_hsw LABEL PROC
PUBLIC _sk_bilinear_ny_hsw
_sk_bilinear_ny_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,40,90,2,0 ; vbroadcastss 0x25a28(%rip),%ymm1 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,13,128,94,2,0 ; vbroadcastss 0x25e80(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,190,88,2,0 ; vbroadcastss 0x258be(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,22,93,2,0 ; vbroadcastss 0x25d16(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5729,7 +5823,7 @@ _sk_bilinear_ny_hsw LABEL PROC
PUBLIC _sk_bilinear_py_hsw
_sk_bilinear_py_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,158,88,2,0 ; vbroadcastss 0x2589e(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,13,246,92,2,0 ; vbroadcastss 0x25cf6(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5739,13 +5833,13 @@ _sk_bilinear_py_hsw LABEL PROC
PUBLIC _sk_bicubic_n3x_hsw
_sk_bicubic_n3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,225,89,2,0 ; vbroadcastss 0x259e1(%rip),%ymm0 # 2b6f0 <_sk_overlay_sse2_8bit+0x5cf>
+ DB 196,226,125,24,5,57,94,2,0 ; vbroadcastss 0x25e39(%rip),%ymm0 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,116,88,2,0 ; vbroadcastss 0x25874(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,204,92,2,0 ; vbroadcastss 0x25ccc(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,209,88,2,0 ; vbroadcastss 0x258d1(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
- DB 196,98,125,24,29,188,89,2,0 ; vbroadcastss 0x259bc(%rip),%ymm11 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,41,93,2,0 ; vbroadcastss 0x25d29(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,29,20,94,2,0 ; vbroadcastss 0x25e14(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5755,16 +5849,16 @@ _sk_bicubic_n3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n1x_hsw
_sk_bicubic_n1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,147,89,2,0 ; vbroadcastss 0x25993(%rip),%ymm0 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,5,235,93,2,0 ; vbroadcastss 0x25deb(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,42,88,2,0 ; vbroadcastss 0x2582a(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,130,92,2,0 ; vbroadcastss 0x25c82(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,132,89,2,0 ; vbroadcastss 0x25984(%rip),%ymm9 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
- DB 196,98,125,24,21,127,89,2,0 ; vbroadcastss 0x2597f(%rip),%ymm10 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,13,220,93,2,0 ; vbroadcastss 0x25ddc(%rip),%ymm9 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,21,215,93,2,0 ; vbroadcastss 0x25dd7(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,1,88,2,0 ; vbroadcastss 0x25801(%rip),%ymm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,13,89,92,2,0 ; vbroadcastss 0x25c59(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,103,89,2,0 ; vbroadcastss 0x25967(%rip),%ymm10 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,21,191,93,2,0 ; vbroadcastss 0x25dbf(%rip),%ymm10 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,128,0,0,0 ; vmovups %ymm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5773,14 +5867,14 @@ _sk_bicubic_n1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p1x_hsw
_sk_bicubic_p1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,215,87,2,0 ; vbroadcastss 0x257d7(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,47,92,2,0 ; vbroadcastss 0x25c2f(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,49,89,2,0 ; vbroadcastss 0x25931(%rip),%ymm10 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
- DB 196,98,125,24,29,44,89,2,0 ; vbroadcastss 0x2592c(%rip),%ymm11 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,21,137,93,2,0 ; vbroadcastss 0x25d89(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,29,132,93,2,0 ; vbroadcastss 0x25d84(%rip),%ymm11 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,29,89,2,0 ; vbroadcastss 0x2591d(%rip),%ymm8 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,5,117,93,2,0 ; vbroadcastss 0x25d75(%rip),%ymm8 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5789,12 +5883,12 @@ _sk_bicubic_p1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p3x_hsw
_sk_bicubic_p3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,249,88,2,0 ; vbroadcastss 0x258f9(%rip),%ymm0 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,226,125,24,5,81,93,2,0 ; vbroadcastss 0x25d51(%rip),%ymm0 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,234,87,2,0 ; vbroadcastss 0x257ea(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
- DB 196,98,125,24,29,213,88,2,0 ; vbroadcastss 0x258d5(%rip),%ymm11 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,66,92,2,0 ; vbroadcastss 0x25c42(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,29,45,93,2,0 ; vbroadcastss 0x25d2d(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5804,13 +5898,13 @@ _sk_bicubic_p3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n3y_hsw
_sk_bicubic_n3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,176,88,2,0 ; vbroadcastss 0x258b0(%rip),%ymm1 # 2b6f0 <_sk_overlay_sse2_8bit+0x5cf>
+ DB 196,226,125,24,13,8,93,2,0 ; vbroadcastss 0x25d08(%rip),%ymm1 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,66,87,2,0 ; vbroadcastss 0x25742(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,154,91,2,0 ; vbroadcastss 0x25b9a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,159,87,2,0 ; vbroadcastss 0x2579f(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
- DB 196,98,125,24,29,138,88,2,0 ; vbroadcastss 0x2588a(%rip),%ymm11 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,247,91,2,0 ; vbroadcastss 0x25bf7(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,29,226,92,2,0 ; vbroadcastss 0x25ce2(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5820,16 +5914,16 @@ _sk_bicubic_n3y_hsw LABEL PROC
PUBLIC _sk_bicubic_n1y_hsw
_sk_bicubic_n1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,97,88,2,0 ; vbroadcastss 0x25861(%rip),%ymm1 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,13,185,92,2,0 ; vbroadcastss 0x25cb9(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,247,86,2,0 ; vbroadcastss 0x256f7(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,79,91,2,0 ; vbroadcastss 0x25b4f(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,81,88,2,0 ; vbroadcastss 0x25851(%rip),%ymm9 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
- DB 196,98,125,24,21,76,88,2,0 ; vbroadcastss 0x2584c(%rip),%ymm10 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,13,169,92,2,0 ; vbroadcastss 0x25ca9(%rip),%ymm9 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,21,164,92,2,0 ; vbroadcastss 0x25ca4(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,206,86,2,0 ; vbroadcastss 0x256ce(%rip),%ymm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,13,38,91,2,0 ; vbroadcastss 0x25b26(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,52,88,2,0 ; vbroadcastss 0x25834(%rip),%ymm10 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,21,140,92,2,0 ; vbroadcastss 0x25c8c(%rip),%ymm10 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,160,0,0,0 ; vmovups %ymm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5838,14 +5932,14 @@ _sk_bicubic_n1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p1y_hsw
_sk_bicubic_p1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,164,86,2,0 ; vbroadcastss 0x256a4(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,252,90,2,0 ; vbroadcastss 0x25afc(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,253,87,2,0 ; vbroadcastss 0x257fd(%rip),%ymm10 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
- DB 196,98,125,24,29,248,87,2,0 ; vbroadcastss 0x257f8(%rip),%ymm11 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,21,85,92,2,0 ; vbroadcastss 0x25c55(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,29,80,92,2,0 ; vbroadcastss 0x25c50(%rip),%ymm11 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,233,87,2,0 ; vbroadcastss 0x257e9(%rip),%ymm8 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,5,65,92,2,0 ; vbroadcastss 0x25c41(%rip),%ymm8 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5854,12 +5948,12 @@ _sk_bicubic_p1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p3y_hsw
_sk_bicubic_p3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,197,87,2,0 ; vbroadcastss 0x257c5(%rip),%ymm1 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,226,125,24,13,29,92,2,0 ; vbroadcastss 0x25c1d(%rip),%ymm1 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,181,86,2,0 ; vbroadcastss 0x256b5(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
- DB 196,98,125,24,29,160,87,2,0 ; vbroadcastss 0x257a0(%rip),%ymm11 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,13,91,2,0 ; vbroadcastss 0x25b0d(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,29,248,91,2,0 ; vbroadcastss 0x25bf8(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5989,19 +6083,19 @@ _sk_clut_3D_hsw LABEL PROC
DB 197,254,127,76,36,32 ; vmovdqu %ymm1,0x20(%rsp)
DB 72,139,0 ; mov (%rax),%rax
DB 196,193,117,254,204 ; vpaddd %ymm12,%ymm1,%ymm1
- DB 196,226,125,88,61,115,85,2,0 ; vpbroadcastd 0x25573(%rip),%ymm7 # 2b708 <_sk_overlay_sse2_8bit+0x5e7>
+ DB 196,226,125,88,61,203,89,2,0 ; vpbroadcastd 0x259cb(%rip),%ymm7 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7>
DB 196,226,117,64,207 ; vpmulld %ymm7,%ymm1,%ymm1
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
DB 196,98,77,146,4,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8
- DB 196,98,125,88,21,231,83,2,0 ; vpbroadcastd 0x253e7(%rip),%ymm10 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,88,21,63,88,2,0 ; vpbroadcastd 0x2583f(%rip),%ymm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 196,193,117,254,242 ; vpaddd %ymm10,%ymm1,%ymm6
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
DB 196,226,37,146,28,176 ; vgatherdps %ymm11,(%rax,%ymm6,4),%ymm3
- DB 196,98,125,88,29,214,83,2,0 ; vpbroadcastd 0x253d6(%rip),%ymm11 # 2b59c <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,125,88,29,46,88,2,0 ; vpbroadcastd 0x2582e(%rip),%ymm11 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
DB 196,193,117,254,203 ; vpaddd %ymm11,%ymm1,%ymm1
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
DB 196,226,77,146,36,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm4
- DB 196,98,125,24,45,38,85,2,0 ; vbroadcastss 0x25526(%rip),%ymm13 # 2b704 <_sk_overlay_sse2_8bit+0x5e3>
+ DB 196,98,125,24,45,126,89,2,0 ; vbroadcastss 0x2597e(%rip),%ymm13 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3>
DB 196,193,124,88,245 ; vaddps %ymm13,%ymm0,%ymm6
DB 197,254,91,246 ; vcvttps2dq %ymm6,%ymm6
DB 196,226,77,64,205 ; vpmulld %ymm5,%ymm6,%ymm1
@@ -6219,19 +6313,19 @@ _sk_clut_4D_hsw LABEL PROC
DB 197,126,91,245 ; vcvttps2dq %ymm5,%ymm14
DB 196,98,13,64,233 ; vpmulld %ymm1,%ymm14,%ymm13
DB 197,149,254,198 ; vpaddd %ymm6,%ymm13,%ymm0
- DB 196,98,125,88,21,159,80,2,0 ; vpbroadcastd 0x2509f(%rip),%ymm10 # 2b708 <_sk_overlay_sse2_8bit+0x5e7>
+ DB 196,98,125,88,21,247,84,2,0 ; vpbroadcastd 0x254f7(%rip),%ymm10 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7>
DB 196,194,125,64,194 ; vpmulld %ymm10,%ymm0,%ymm0
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 196,98,61,146,60,128 ; vgatherdps %ymm8,(%rax,%ymm0,4),%ymm15
- DB 196,98,125,88,29,18,79,2,0 ; vpbroadcastd 0x24f12(%rip),%ymm11 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,88,29,106,83,2,0 ; vpbroadcastd 0x2536a(%rip),%ymm11 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,125,254,195 ; vpaddd %ymm11,%ymm0,%ymm8
DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
DB 196,162,53,146,20,128 ; vgatherdps %ymm9,(%rax,%ymm8,4),%ymm2
- DB 196,98,125,88,37,1,79,2,0 ; vpbroadcastd 0x24f01(%rip),%ymm12 # 2b59c <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,125,88,37,89,83,2,0 ; vpbroadcastd 0x25359(%rip),%ymm12 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
DB 196,193,125,254,196 ; vpaddd %ymm12,%ymm0,%ymm0
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 196,226,61,146,60,128 ; vgatherdps %ymm8,(%rax,%ymm0,4),%ymm7
- DB 196,98,125,24,13,80,80,2,0 ; vbroadcastss 0x25050(%rip),%ymm9 # 2b704 <_sk_overlay_sse2_8bit+0x5e3>
+ DB 196,98,125,24,13,168,84,2,0 ; vbroadcastss 0x254a8(%rip),%ymm9 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3>
DB 196,65,84,88,193 ; vaddps %ymm9,%ymm5,%ymm8
DB 196,65,126,91,192 ; vcvttps2dq %ymm8,%ymm8
DB 196,226,61,64,193 ; vpmulld %ymm1,%ymm8,%ymm0
@@ -6556,7 +6650,7 @@ _sk_clut_4D_hsw LABEL PROC
DB 197,196,92,214 ; vsubps %ymm6,%ymm7,%ymm2
DB 196,226,61,168,214 ; vfmadd213ps %ymm6,%ymm8,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,223,71,2,0 ; vbroadcastss 0x247df(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,55,76,2,0 ; vbroadcastss 0x24c37(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,16,164,36,160,3,0,0 ; vmovups 0x3a0(%rsp),%ymm4
DB 197,252,16,172,36,192,3,0,0 ; vmovups 0x3c0(%rsp),%ymm5
DB 197,252,16,180,36,224,3,0,0 ; vmovups 0x3e0(%rsp),%ymm6
@@ -6597,13 +6691,13 @@ _sk_start_pipeline_avx LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,110 ; jae 6ecd <_sk_start_pipeline_avx+0xed>
+ DB 115,110 ; jae 7061 <_sk_start_pipeline_avx+0xed>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,8 ; lea 0x8(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
- DB 119,43 ; ja 6eac <_sk_start_pipeline_avx+0xcc>
+ DB 119,43 ; ja 7040 <_sk_start_pipeline_avx+0xcc>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 69,49,192 ; xor %r8d,%r8d
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
@@ -6615,17 +6709,17 @@ _sk_start_pipeline_avx LABEL PROC
DB 73,131,196,16 ; add $0x10,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,220 ; jbe 6e88 <_sk_start_pipeline_avx+0xa8>
+ DB 118,220 ; jbe 701c <_sk_start_pipeline_avx+0xa8>
DB 77,137,248 ; mov %r15,%r8
DB 73,41,208 ; sub %rdx,%r8
- DB 116,13 ; je 6ec1 <_sk_start_pipeline_avx+0xe1>
+ DB 116,13 ; je 7055 <_sk_start_pipeline_avx+0xe1>
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,164 ; jne 6e71 <_sk_start_pipeline_avx+0x91>
+ DB 117,164 ; jne 7005 <_sk_start_pipeline_avx+0x91>
DB 197,248,40,181,32,255,255,255 ; vmovaps -0xe0(%rbp),%xmm6
DB 197,248,40,189,48,255,255,255 ; vmovaps -0xd0(%rbp),%xmm7
DB 197,120,40,133,64,255,255,255 ; vmovaps -0xc0(%rbp),%xmm8
@@ -6658,7 +6752,7 @@ _sk_seed_shader_avx LABEL PROC
DB 197,249,112,192,0 ; vpshufd $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,71,70,2,0 ; vbroadcastss 0x24647(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,13,159,74,2,0 ; vbroadcastss 0x24a9f(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0
DB 197,249,110,209 ; vmovd %ecx,%xmm2
@@ -6667,7 +6761,7 @@ _sk_seed_shader_avx LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,33,70,2,0 ; vbroadcastss 0x24621(%rip),%ymm2 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,21,121,74,2,0 ; vbroadcastss 0x24a79(%rip),%ymm2 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -6689,7 +6783,7 @@ _sk_dither_avx LABEL PROC
DB 196,65,121,112,201,0 ; vpshufd $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 196,65,52,87,208 ; vxorps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,202,69,2,0 ; vbroadcastss 0x245ca(%rip),%ymm11 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,24,29,34,74,2,0 ; vbroadcastss 0x24a22(%rip),%ymm11 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,44,84,203 ; vandps %ymm11,%ymm10,%ymm9
DB 196,193,25,114,241,5 ; vpslld $0x5,%xmm9,%xmm12
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
@@ -6700,8 +6794,8 @@ _sk_dither_avx LABEL PROC
DB 196,67,125,25,219,1 ; vextractf128 $0x1,%ymm11,%xmm11
DB 196,193,33,114,243,4 ; vpslld $0x4,%xmm11,%xmm11
DB 196,67,29,24,219,1 ; vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- DB 196,98,125,24,37,139,69,2,0 ; vbroadcastss 0x2458b(%rip),%ymm12 # 2b598 <_sk_overlay_sse2_8bit+0x477>
- DB 196,98,125,24,45,134,69,2,0 ; vbroadcastss 0x24586(%rip),%ymm13 # 2b59c <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,125,24,37,227,73,2,0 ; vbroadcastss 0x249e3(%rip),%ymm12 # 2bb84 <_sk_overlay_sse2_8bit+0x477>
+ DB 196,98,125,24,45,222,73,2,0 ; vbroadcastss 0x249de(%rip),%ymm13 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
DB 196,65,44,84,245 ; vandps %ymm13,%ymm10,%ymm14
DB 196,193,1,114,246,2 ; vpslld $0x2,%xmm14,%xmm15
DB 196,67,125,25,246,1 ; vextractf128 $0x1,%ymm14,%xmm14
@@ -6728,9 +6822,9 @@ _sk_dither_avx LABEL PROC
DB 196,65,60,86,193 ; vorps %ymm9,%ymm8,%ymm8
DB 196,65,60,86,194 ; vorps %ymm10,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,241,68,2,0 ; vbroadcastss 0x244f1(%rip),%ymm9 # 2b5a0 <_sk_overlay_sse2_8bit+0x47f>
+ DB 196,98,125,24,13,73,73,2,0 ; vbroadcastss 0x24949(%rip),%ymm9 # 2bb8c <_sk_overlay_sse2_8bit+0x47f>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,231,68,2,0 ; vbroadcastss 0x244e7(%rip),%ymm9 # 2b5a4 <_sk_overlay_sse2_8bit+0x483>
+ DB 196,98,125,24,13,63,73,2,0 ; vbroadcastss 0x2493f(%rip),%ymm9 # 2bb90 <_sk_overlay_sse2_8bit+0x483>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 196,98,125,24,8 ; vbroadcastss (%rax),%ymm9
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
@@ -6760,7 +6854,7 @@ _sk_uniform_color_avx LABEL PROC
PUBLIC _sk_black_color_avx
_sk_black_color_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,111,68,2,0 ; vbroadcastss 0x2446f(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,199,72,2,0 ; vbroadcastss 0x248c7(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
@@ -6769,7 +6863,7 @@ _sk_black_color_avx LABEL PROC
PUBLIC _sk_white_color_avx
_sk_white_color_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,86,68,2,0 ; vbroadcastss 0x24456(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,174,72,2,0 ; vbroadcastss 0x248ae(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
@@ -6807,7 +6901,7 @@ _sk_clear_avx LABEL PROC
PUBLIC _sk_srcatop_avx
_sk_srcatop_avx LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,245,67,2,0 ; vbroadcastss 0x243f5(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,77,72,2,0 ; vbroadcastss 0x2484d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -6826,7 +6920,7 @@ _sk_srcatop_avx LABEL PROC
PUBLIC _sk_dstatop_avx
_sk_dstatop_avx LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
- DB 196,98,125,24,13,179,67,2,0 ; vbroadcastss 0x243b3(%rip),%ymm9 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,13,11,72,2,0 ; vbroadcastss 0x2480b(%rip),%ymm9 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,52,92,207 ; vsubps %ymm7,%ymm9,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0
@@ -6862,7 +6956,7 @@ _sk_dstin_avx LABEL PROC
PUBLIC _sk_srcout_avx
_sk_srcout_avx LABEL PROC
- DB 196,98,125,24,5,78,67,2,0 ; vbroadcastss 0x2434e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,166,71,2,0 ; vbroadcastss 0x247a6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -6873,7 +6967,7 @@ _sk_srcout_avx LABEL PROC
PUBLIC _sk_dstout_avx
_sk_dstout_avx LABEL PROC
- DB 196,226,125,24,5,45,67,2,0 ; vbroadcastss 0x2432d(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,133,71,2,0 ; vbroadcastss 0x24785(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -6884,7 +6978,7 @@ _sk_dstout_avx LABEL PROC
PUBLIC _sk_srcover_avx
_sk_srcover_avx LABEL PROC
- DB 196,98,125,24,5,12,67,2,0 ; vbroadcastss 0x2430c(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,100,71,2,0 ; vbroadcastss 0x24764(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -6899,7 +6993,7 @@ _sk_srcover_avx LABEL PROC
PUBLIC _sk_dstover_avx
_sk_dstover_avx LABEL PROC
- DB 196,98,125,24,5,219,66,2,0 ; vbroadcastss 0x242db(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,51,71,2,0 ; vbroadcastss 0x24733(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
@@ -6923,7 +7017,7 @@ _sk_modulate_avx LABEL PROC
PUBLIC _sk_multiply_avx
_sk_multiply_avx LABEL PROC
- DB 196,98,125,24,5,150,66,2,0 ; vbroadcastss 0x24296(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,238,70,2,0 ; vbroadcastss 0x246ee(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -6952,9 +7046,14 @@ _sk_multiply_avx LABEL PROC
PUBLIC _sk_plus__avx
_sk_plus__avx LABEL PROC
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
+ DB 196,98,125,24,5,125,70,2,0 ; vbroadcastss 0x2467d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 197,244,88,205 ; vaddps %ymm5,%ymm1,%ymm1
+ DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 197,236,88,214 ; vaddps %ymm6,%ymm2,%ymm2
+ DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3
+ DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -6977,7 +7076,7 @@ _sk_screen_avx LABEL PROC
PUBLIC _sk_xor__avx
_sk_xor__avx LABEL PROC
- DB 196,98,125,24,5,225,65,2,0 ; vbroadcastss 0x241e1(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,28,70,2,0 ; vbroadcastss 0x2461c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7012,7 +7111,7 @@ _sk_darken_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,93,65,2,0 ; vbroadcastss 0x2415d(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,152,69,2,0 ; vbroadcastss 0x24598(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7036,7 +7135,7 @@ _sk_lighten_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,5,65,2,0 ; vbroadcastss 0x24105(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,64,69,2,0 ; vbroadcastss 0x24540(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7063,7 +7162,7 @@ _sk_difference_avx LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,161,64,2,0 ; vbroadcastss 0x240a1(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,220,68,2,0 ; vbroadcastss 0x244dc(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7084,7 +7183,7 @@ _sk_exclusion_avx LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,88,64,2,0 ; vbroadcastss 0x24058(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,147,68,2,0 ; vbroadcastss 0x24493(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7093,7 +7192,7 @@ _sk_exclusion_avx LABEL PROC
PUBLIC _sk_colorburn_avx
_sk_colorburn_avx LABEL PROC
- DB 196,98,125,24,5,63,64,2,0 ; vbroadcastss 0x2403f(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,122,68,2,0 ; vbroadcastss 0x2447a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -7153,7 +7252,7 @@ _sk_colorburn_avx LABEL PROC
PUBLIC _sk_colordodge_avx
_sk_colordodge_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,67,63,2,0 ; vbroadcastss 0x23f43(%rip),%ymm9 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,13,126,67,2,0 ; vbroadcastss 0x2437e(%rip),%ymm9 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -7208,7 +7307,7 @@ _sk_colordodge_avx LABEL PROC
PUBLIC _sk_hardlight_avx
_sk_hardlight_avx LABEL PROC
- DB 196,98,125,24,5,78,62,2,0 ; vbroadcastss 0x23e4e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,137,66,2,0 ; vbroadcastss 0x24289(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7261,7 +7360,7 @@ _sk_hardlight_avx LABEL PROC
PUBLIC _sk_overlay_avx
_sk_overlay_avx LABEL PROC
- DB 196,98,125,24,5,115,61,2,0 ; vbroadcastss 0x23d73(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,174,65,2,0 ; vbroadcastss 0x241ae(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7326,10 +7425,10 @@ _sk_softlight_avx LABEL PROC
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,65,60,89,216 ; vmulps %ymm8,%ymm8,%ymm11
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,29,118,60,2,0 ; vbroadcastss 0x23c76(%rip),%ymm11 # 2b5a8 <_sk_overlay_sse2_8bit+0x487>
+ DB 196,98,125,24,29,177,64,2,0 ; vbroadcastss 0x240b1(%rip),%ymm11 # 2bb94 <_sk_overlay_sse2_8bit+0x487>
DB 196,65,28,88,235 ; vaddps %ymm11,%ymm12,%ymm13
DB 196,65,20,89,192 ; vmulps %ymm8,%ymm13,%ymm8
- DB 196,98,125,24,45,103,60,2,0 ; vbroadcastss 0x23c67(%rip),%ymm13 # 2b5ac <_sk_overlay_sse2_8bit+0x48b>
+ DB 196,98,125,24,45,162,64,2,0 ; vbroadcastss 0x240a2(%rip),%ymm13 # 2bb98 <_sk_overlay_sse2_8bit+0x48b>
DB 196,65,28,89,245 ; vmulps %ymm13,%ymm12,%ymm14
DB 196,65,12,88,192 ; vaddps %ymm8,%ymm14,%ymm8
DB 196,65,124,82,244 ; vrsqrtps %ymm12,%ymm14
@@ -7340,7 +7439,7 @@ _sk_softlight_avx LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,17,60,2,0 ; vbroadcastss 0x23c11(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,76,64,2,0 ; vbroadcastss 0x2404c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,65,60,92,228 ; vsubps %ymm12,%ymm8,%ymm12
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
@@ -7467,12 +7566,12 @@ _sk_hue_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,239,57,2,0 ; vbroadcastss 0x239ef(%rip),%ymm14 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,53,42,62,2,0 ; vbroadcastss 0x23e2a(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,229,57,2,0 ; vbroadcastss 0x239e5(%rip),%ymm15 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,61,32,62,2,0 ; vbroadcastss 0x23e20(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,214,57,2,0 ; vbroadcastss 0x239d6(%rip),%ymm0 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,226,125,24,5,17,62,2,0 ; vbroadcastss 0x23e11(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -7533,7 +7632,7 @@ _sk_hue_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,131,56,2,0 ; vbroadcastss 0x23883(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,190,60,2,0 ; vbroadcastss 0x23cbe(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7590,12 +7689,12 @@ _sk_saturation_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,167,55,2,0 ; vbroadcastss 0x237a7(%rip),%ymm14 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,53,226,59,2,0 ; vbroadcastss 0x23be2(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,157,55,2,0 ; vbroadcastss 0x2379d(%rip),%ymm15 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,61,216,59,2,0 ; vbroadcastss 0x23bd8(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,142,55,2,0 ; vbroadcastss 0x2378e(%rip),%ymm0 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,226,125,24,5,201,59,2,0 ; vbroadcastss 0x23bc9(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -7656,7 +7755,7 @@ _sk_saturation_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,59,54,2,0 ; vbroadcastss 0x2363b(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,118,58,2,0 ; vbroadcastss 0x23a76(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7685,12 +7784,12 @@ _sk_color_avx LABEL PROC
DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp)
DB 197,124,89,199 ; vmulps %ymm7,%ymm0,%ymm8
DB 197,116,89,207 ; vmulps %ymm7,%ymm1,%ymm9
- DB 196,98,125,24,45,231,53,2,0 ; vbroadcastss 0x235e7(%rip),%ymm13 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,45,34,58,2,0 ; vbroadcastss 0x23a22(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,92,89,213 ; vmulps %ymm13,%ymm4,%ymm10
- DB 196,98,125,24,53,221,53,2,0 ; vbroadcastss 0x235dd(%rip),%ymm14 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,53,24,58,2,0 ; vbroadcastss 0x23a18(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,222 ; vmulps %ymm14,%ymm5,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,206,53,2,0 ; vbroadcastss 0x235ce(%rip),%ymm15 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,98,125,24,61,9,58,2,0 ; vbroadcastss 0x23a09(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 196,65,76,89,223 ; vmulps %ymm15,%ymm6,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -7753,7 +7852,7 @@ _sk_color_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,105,52,2,0 ; vbroadcastss 0x23469(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,164,56,2,0 ; vbroadcastss 0x238a4(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -7783,12 +7882,12 @@ _sk_luminosity_avx LABEL PROC
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,205 ; vmulps %ymm5,%ymm3,%ymm9
- DB 196,98,125,24,45,17,52,2,0 ; vbroadcastss 0x23411(%rip),%ymm13 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,45,76,56,2,0 ; vbroadcastss 0x2384c(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,108,89,213 ; vmulps %ymm13,%ymm2,%ymm10
- DB 196,98,125,24,53,7,52,2,0 ; vbroadcastss 0x23407(%rip),%ymm14 # 2b5b4 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,53,66,56,2,0 ; vbroadcastss 0x23842(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,116,89,222 ; vmulps %ymm14,%ymm1,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,248,51,2,0 ; vbroadcastss 0x233f8(%rip),%ymm15 # 2b5b8 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,98,125,24,61,51,56,2,0 ; vbroadcastss 0x23833(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
DB 196,65,28,89,223 ; vmulps %ymm15,%ymm12,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -7851,7 +7950,7 @@ _sk_luminosity_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,147,50,2,0 ; vbroadcastss 0x23293(%rip),%ymm0 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,206,54,2,0 ; vbroadcastss 0x236ce(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -7883,9 +7982,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,43,1,0,0 ; jne 8497 <_sk_srcover_rgba_8888_avx+0x14c>
+ DB 15,133,43,1,0,0 ; jne 8648 <_sk_srcover_rgba_8888_avx+0x14c>
DB 196,65,125,16,4,153 ; vmovupd (%r9,%rbx,4),%ymm8
- DB 197,125,40,13,198,54,2,0 ; vmovapd 0x236c6(%rip),%ymm9 # 2ba40 <_sk_overlay_sse2_8bit+0x91f>
+ DB 197,125,40,13,245,58,2,0 ; vmovapd 0x23af5(%rip),%ymm9 # 2c020 <_sk_overlay_sse2_8bit+0x913>
DB 196,193,61,84,225 ; vandpd %ymm9,%ymm8,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,81,114,208,8 ; vpsrld $0x8,%xmm8,%xmm5
@@ -7903,9 +8002,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 197,193,114,215,24 ; vpsrld $0x18,%xmm7,%xmm7
DB 196,227,61,24,255,1 ; vinsertf128 $0x1,%xmm7,%ymm8,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,181,49,2,0 ; vbroadcastss 0x231b5(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,240,53,2,0 ; vbroadcastss 0x235f0(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,212,49,2,0 ; vbroadcastss 0x231d4(%rip),%ymm9 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,13,15,54,2,0 ; vbroadcastss 0x2360f(%rip),%ymm9 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,60,89,212 ; vmulps %ymm4,%ymm8,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
@@ -7938,7 +8037,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,65,53,86,202 ; vorpd %ymm10,%ymm9,%ymm9
DB 196,65,61,86,193 ; vorpd %ymm9,%ymm8,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,67 ; jne 84cf <_sk_srcover_rgba_8888_avx+0x184>
+ DB 117,67 ; jne 8680 <_sk_srcover_rgba_8888_avx+0x184>
DB 196,65,124,17,4,153 ; vmovups %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -7948,33 +8047,33 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,194,254,255,255 ; ja 8372 <_sk_srcover_rgba_8888_avx+0x27>
+ DB 15,135,194,254,255,255 ; ja 8523 <_sk_srcover_rgba_8888_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,5,1,0,0 ; lea 0x105(%rip),%r11 # 85c0 <_sk_srcover_rgba_8888_avx+0x275>
+ DB 76,141,29,4,1,0,0 ; lea 0x104(%rip),%r11 # 8770 <_sk_srcover_rgba_8888_avx+0x274>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,4,153 ; vmovss (%r9,%rbx,4),%xmm8
- DB 233,163,254,255,255 ; jmpq 8372 <_sk_srcover_rgba_8888_avx+0x27>
+ DB 233,163,254,255,255 ; jmpq 8523 <_sk_srcover_rgba_8888_avx+0x27>
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,179 ; ja 8492 <_sk_srcover_rgba_8888_avx+0x147>
+ DB 119,179 ; ja 8643 <_sk_srcover_rgba_8888_avx+0x147>
DB 65,15,182,194 ; movzbl %r10b,%eax
- DB 76,141,21,242,0,0,0 ; lea 0xf2(%rip),%r10 # 85dc <_sk_srcover_rgba_8888_avx+0x291>
+ DB 76,141,21,241,0,0,0 ; lea 0xf1(%rip),%r10 # 878c <_sk_srcover_rgba_8888_avx+0x290>
DB 73,99,4,130 ; movslq (%r10,%rax,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,151 ; jmp 8492 <_sk_srcover_rgba_8888_avx+0x147>
+ DB 235,151 ; jmp 8643 <_sk_srcover_rgba_8888_avx+0x147>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
DB 196,99,85,12,196,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm8
DB 196,193,123,16,36,153 ; vmovsd (%r9,%rbx,4),%xmm4
DB 196,99,61,13,196,1 ; vblendpd $0x1,%ymm4,%ymm8,%ymm8
- DB 233,80,254,255,255 ; jmpq 8372 <_sk_srcover_rgba_8888_avx+0x27>
+ DB 233,80,254,255,255 ; jmpq 8523 <_sk_srcover_rgba_8888_avx+0x27>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -7988,10 +8087,10 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,99,61,24,196,1 ; vinsertf128 $0x1,%xmm4,%ymm8,%ymm8
DB 196,193,121,16,36,153 ; vmovupd (%r9,%rbx,4),%xmm4
DB 196,67,93,13,192,12 ; vblendpd $0xc,%ymm8,%ymm4,%ymm8
- DB 233,251,253,255,255 ; jmpq 8372 <_sk_srcover_rgba_8888_avx+0x27>
+ DB 233,251,253,255,255 ; jmpq 8523 <_sk_srcover_rgba_8888_avx+0x27>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 233,8,255,255,255 ; jmpq 8492 <_sk_srcover_rgba_8888_avx+0x147>
+ DB 233,8,255,255,255 ; jmpq 8643 <_sk_srcover_rgba_8888_avx+0x147>
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -7999,37 +8098,35 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,65,122,17,76,153,16 ; vmovss %xmm9,0x10(%r9,%rbx,4)
DB 196,65,121,17,4,153 ; vmovupd %xmm8,(%r9,%rbx,4)
- DB 233,212,254,255,255 ; jmpq 8492 <_sk_srcover_rgba_8888_avx+0x147>
- DB 102,144 ; xchg %ax,%ax
- DB 4,255 ; add $0xff,%al
+ DB 233,212,254,255,255 ; jmpq 8643 <_sk_srcover_rgba_8888_avx+0x147>
+ DB 144 ; nop
+ DB 5,255,255,255,82 ; add $0x52ffffff,%eax
DB 255 ; (bad)
- DB 255,81,255 ; callq *-0x1(%rcx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 59,255 ; cmp %edi,%edi
+ DB 60,255 ; cmp $0xff,%al
DB 255 ; (bad)
- DB 255,166,255,255,255,146 ; jmpq *-0x6d000001(%rsi)
+ DB 255,167,255,255,255,147 ; jmpq *-0x6c000001(%rdi)
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 126,255 ; jle 85d5 <_sk_srcover_rgba_8888_avx+0x28a>
+ DB 127,255 ; jg 8785 <_sk_srcover_rgba_8888_avx+0x289>
DB 255 ; (bad)
- DB 255,98,255 ; jmpq *-0x1(%rdx)
+ DB 255,99,255 ; jmpq *-0x1(%rbx)
DB 255 ; (bad)
- DB 255,23 ; callq *(%rdi)
+ DB 255,24 ; lcall *(%rax)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,163,255,255,255,155 ; jmpq *-0x64000001(%rbx)
+ DB 255,164,255,255,255,156,255 ; jmpq *-0x630001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,215 ; callq *%rdi
- DB 255 ; (bad)
+ DB 216,255 ; fdivr %st(7),%st
DB 255 ; (bad)
- DB 255,202 ; dec %edx
+ DB 255,203 ; dec %ebx
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 188,255,255,255,174 ; mov $0xaeffffff,%esp
+ DB 189,255,255,255,175 ; mov $0xafffffff,%ebp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -8046,7 +8143,7 @@ _sk_clamp_0_avx LABEL PROC
PUBLIC _sk_clamp_1_avx
_sk_clamp_1_avx LABEL PROC
- DB 196,98,125,24,5,114,47,2,0 ; vbroadcastss 0x22f72(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,174,51,2,0 ; vbroadcastss 0x233ae(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -8056,7 +8153,7 @@ _sk_clamp_1_avx LABEL PROC
PUBLIC _sk_clamp_a_avx
_sk_clamp_a_avx LABEL PROC
- DB 196,98,125,24,5,81,47,2,0 ; vbroadcastss 0x22f51(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,141,51,2,0 ; vbroadcastss 0x2338d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -8066,7 +8163,7 @@ _sk_clamp_a_avx LABEL PROC
PUBLIC _sk_clamp_a_dst_avx
_sk_clamp_a_dst_avx LABEL PROC
- DB 196,98,125,24,5,51,47,2,0 ; vbroadcastss 0x22f33(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,111,51,2,0 ; vbroadcastss 0x2336f(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7
DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4
DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5
@@ -8093,7 +8190,7 @@ _sk_swap_rb_avx LABEL PROC
PUBLIC _sk_invert_avx
_sk_invert_avx LABEL PROC
- DB 196,98,125,24,5,238,46,2,0 ; vbroadcastss 0x22eee(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,42,51,2,0 ; vbroadcastss 0x2332a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0
DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
@@ -8139,7 +8236,7 @@ PUBLIC _sk_unpremul_avx
_sk_unpremul_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,126,46,2,0 ; vbroadcastss 0x22e7e(%rip),%ymm10 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,21,186,50,2,0 ; vbroadcastss 0x232ba(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -8150,17 +8247,17 @@ _sk_unpremul_avx LABEL PROC
PUBLIC _sk_from_srgb_avx
_sk_from_srgb_avx LABEL PROC
- DB 196,98,125,24,5,139,46,2,0 ; vbroadcastss 0x22e8b(%rip),%ymm8 # 2b5c0 <_sk_overlay_sse2_8bit+0x49f>
+ DB 196,98,125,24,5,199,50,2,0 ; vbroadcastss 0x232c7(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,105,46,2,0 ; vbroadcastss 0x22e69(%rip),%ymm11 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,29,165,50,2,0 ; vbroadcastss 0x232a5(%rip),%ymm11 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,124,89,227 ; vmulps %ymm11,%ymm0,%ymm12
- DB 196,98,125,24,45,111,46,2,0 ; vbroadcastss 0x22e6f(%rip),%ymm13 # 2b5c4 <_sk_overlay_sse2_8bit+0x4a3>
+ DB 196,98,125,24,45,171,50,2,0 ; vbroadcastss 0x232ab(%rip),%ymm13 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,96,46,2,0 ; vbroadcastss 0x22e60(%rip),%ymm12 # 2b5c8 <_sk_overlay_sse2_8bit+0x4a7>
+ DB 196,98,125,24,37,156,50,2,0 ; vbroadcastss 0x2329c(%rip),%ymm12 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,86,46,2,0 ; vbroadcastss 0x22e56(%rip),%ymm14 # 2b5cc <_sk_overlay_sse2_8bit+0x4ab>
+ DB 196,98,125,24,53,146,50,2,0 ; vbroadcastss 0x23292(%rip),%ymm14 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab>
DB 196,193,124,194,198,1 ; vcmpltps %ymm14,%ymm0,%ymm0
DB 196,195,45,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm10,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -8184,17 +8281,17 @@ _sk_from_srgb_avx LABEL PROC
PUBLIC _sk_from_srgb_dst_avx
_sk_from_srgb_dst_avx LABEL PROC
- DB 196,98,125,24,5,223,45,2,0 ; vbroadcastss 0x22ddf(%rip),%ymm8 # 2b5c0 <_sk_overlay_sse2_8bit+0x49f>
+ DB 196,98,125,24,5,27,50,2,0 ; vbroadcastss 0x2321b(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f>
DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9
DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10
- DB 196,98,125,24,29,189,45,2,0 ; vbroadcastss 0x22dbd(%rip),%ymm11 # 2b5b0 <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,29,249,49,2,0 ; vbroadcastss 0x231f9(%rip),%ymm11 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,92,89,227 ; vmulps %ymm11,%ymm4,%ymm12
- DB 196,98,125,24,45,195,45,2,0 ; vbroadcastss 0x22dc3(%rip),%ymm13 # 2b5c4 <_sk_overlay_sse2_8bit+0x4a3>
+ DB 196,98,125,24,45,255,49,2,0 ; vbroadcastss 0x231ff(%rip),%ymm13 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,180,45,2,0 ; vbroadcastss 0x22db4(%rip),%ymm12 # 2b5c8 <_sk_overlay_sse2_8bit+0x4a7>
+ DB 196,98,125,24,37,240,49,2,0 ; vbroadcastss 0x231f0(%rip),%ymm12 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,170,45,2,0 ; vbroadcastss 0x22daa(%rip),%ymm14 # 2b5cc <_sk_overlay_sse2_8bit+0x4ab>
+ DB 196,98,125,24,53,230,49,2,0 ; vbroadcastss 0x231e6(%rip),%ymm14 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab>
DB 196,193,92,194,230,1 ; vcmpltps %ymm14,%ymm4,%ymm4
DB 196,195,45,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm10,%ymm4
DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9
@@ -8219,20 +8316,20 @@ _sk_from_srgb_dst_avx LABEL PROC
PUBLIC _sk_to_srgb_avx
_sk_to_srgb_avx LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,63,45,2,0 ; vbroadcastss 0x22d3f(%rip),%ymm8 # 2b5d0 <_sk_overlay_sse2_8bit+0x4af>
+ DB 196,98,125,24,5,123,49,2,0 ; vbroadcastss 0x2317b(%rip),%ymm8 # 2bbbc <_sk_overlay_sse2_8bit+0x4af>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,57,45,2,0 ; vbroadcastss 0x22d39(%rip),%ymm11 # 2b5d8 <_sk_overlay_sse2_8bit+0x4b7>
+ DB 196,98,125,24,29,117,49,2,0 ; vbroadcastss 0x23175(%rip),%ymm11 # 2bbc4 <_sk_overlay_sse2_8bit+0x4b7>
DB 196,65,52,89,227 ; vmulps %ymm11,%ymm9,%ymm12
- DB 196,98,125,24,45,39,45,2,0 ; vbroadcastss 0x22d27(%rip),%ymm13 # 2b5d4 <_sk_overlay_sse2_8bit+0x4b3>
+ DB 196,98,125,24,45,99,49,2,0 ; vbroadcastss 0x23163(%rip),%ymm13 # 2bbc0 <_sk_overlay_sse2_8bit+0x4b3>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,52,89,228 ; vmulps %ymm12,%ymm9,%ymm12
- DB 196,98,125,24,53,28,45,2,0 ; vbroadcastss 0x22d1c(%rip),%ymm14 # 2b5dc <_sk_overlay_sse2_8bit+0x4bb>
+ DB 196,98,125,24,53,88,49,2,0 ; vbroadcastss 0x23158(%rip),%ymm14 # 2bbc8 <_sk_overlay_sse2_8bit+0x4bb>
DB 196,65,28,88,230 ; vaddps %ymm14,%ymm12,%ymm12
- DB 196,98,125,24,61,18,45,2,0 ; vbroadcastss 0x22d12(%rip),%ymm15 # 2b5e0 <_sk_overlay_sse2_8bit+0x4bf>
+ DB 196,98,125,24,61,78,49,2,0 ; vbroadcastss 0x2314e(%rip),%ymm15 # 2bbcc <_sk_overlay_sse2_8bit+0x4bf>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
- DB 196,98,125,24,37,254,44,2,0 ; vbroadcastss 0x22cfe(%rip),%ymm12 # 2b5e4 <_sk_overlay_sse2_8bit+0x4c3>
+ DB 196,98,125,24,37,58,49,2,0 ; vbroadcastss 0x2313a(%rip),%ymm12 # 2bbd0 <_sk_overlay_sse2_8bit+0x4c3>
DB 196,193,124,194,196,1 ; vcmpltps %ymm12,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -8262,12 +8359,12 @@ _sk_to_srgb_avx LABEL PROC
PUBLIC _sk_rgb_to_hsl_avx
_sk_rgb_to_hsl_avx LABEL PROC
- DB 197,124,95,193 ; vmaxps %ymm1,%ymm0,%ymm8
- DB 197,60,95,194 ; vmaxps %ymm2,%ymm8,%ymm8
- DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9
- DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9
+ DB 197,116,95,194 ; vmaxps %ymm2,%ymm1,%ymm8
+ DB 196,65,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm8
+ DB 197,116,93,202 ; vminps %ymm2,%ymm1,%ymm9
+ DB 196,65,124,93,201 ; vminps %ymm9,%ymm0,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,12,44,2,0 ; vbroadcastss 0x22c0c(%rip),%ymm11 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,29,70,48,2,0 ; vbroadcastss 0x23046(%rip),%ymm11 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 196,65,28,89,227 ; vmulps %ymm11,%ymm12,%ymm12
@@ -8277,19 +8374,19 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
DB 196,193,116,89,203 ; vmulps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,57,44,2,0 ; vbroadcastss 0x22c39(%rip),%ymm11 # 2b5f0 <_sk_overlay_sse2_8bit+0x4cf>
+ DB 196,98,125,24,29,115,48,2,0 ; vbroadcastss 0x23073(%rip),%ymm11 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,39,44,2,0 ; vbroadcastss 0x22c27(%rip),%ymm11 # 2b5ec <_sk_overlay_sse2_8bit+0x4cb>
+ DB 196,98,125,24,29,97,48,2,0 ; vbroadcastss 0x23061(%rip),%ymm11 # 2bbd8 <_sk_overlay_sse2_8bit+0x4cb>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,227,117,74,202,224 ; vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,15,44,2,0 ; vbroadcastss 0x22c0f(%rip),%ymm2 # 2b5e8 <_sk_overlay_sse2_8bit+0x4c7>
+ DB 196,226,125,24,21,73,48,2,0 ; vbroadcastss 0x23049(%rip),%ymm2 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7>
DB 196,65,12,87,246 ; vxorps %ymm14,%ymm14,%ymm14
DB 196,227,13,74,210,208 ; vblendvps %ymm13,%ymm2,%ymm14,%ymm2
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
DB 196,227,117,74,194,0 ; vblendvps %ymm0,%ymm2,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,37,138,43,2,0 ; vbroadcastss 0x22b8a(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,196,47,2,0 ; vbroadcastss 0x22fc4(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,116,89,212 ; vmulps %ymm12,%ymm1,%ymm2
DB 197,28,194,226,1 ; vcmpltps %ymm2,%ymm12,%ymm12
DB 196,65,36,92,216 ; vsubps %ymm8,%ymm11,%ymm11
@@ -8299,7 +8396,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,198,128 ; vblendvps %ymm8,%ymm14,%ymm0,%ymm0
DB 196,195,117,74,206,128 ; vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- DB 196,98,125,24,5,185,43,2,0 ; vbroadcastss 0x22bb9(%rip),%ymm8 # 2b5f4 <_sk_overlay_sse2_8bit+0x4d3>
+ DB 196,98,125,24,5,243,47,2,0 ; vbroadcastss 0x22ff3(%rip),%ymm8 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8314,7 +8411,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,225 ; vmovaps %ymm1,%ymm4
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
- DB 196,98,125,24,5,16,43,2,0 ; vbroadcastss 0x22b10(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,74,47,2,0 ; vbroadcastss 0x22f4a(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,92,89,210 ; vmulps %ymm2,%ymm4,%ymm10
DB 196,65,92,92,218 ; vsubps %ymm10,%ymm4,%ymm11
@@ -8322,23 +8419,23 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
DB 197,108,88,202 ; vaddps %ymm2,%ymm2,%ymm9
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,29,82,43,2,0 ; vbroadcastss 0x22b52(%rip),%ymm11 # 2b5f8 <_sk_overlay_sse2_8bit+0x4d7>
+ DB 196,98,125,24,29,140,47,2,0 ; vbroadcastss 0x22f8c(%rip),%ymm11 # 2bbe4 <_sk_overlay_sse2_8bit+0x4d7>
DB 196,65,100,88,219 ; vaddps %ymm11,%ymm3,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,37,36,43,2,0 ; vbroadcastss 0x22b24(%rip),%ymm12 # 2b5e8 <_sk_overlay_sse2_8bit+0x4c7>
+ DB 196,98,125,24,37,94,47,2,0 ; vbroadcastss 0x22f5e(%rip),%ymm12 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7>
DB 196,193,4,89,196 ; vmulps %ymm12,%ymm15,%ymm0
- DB 196,98,125,24,45,30,43,2,0 ; vbroadcastss 0x22b1e(%rip),%ymm13 # 2b5f0 <_sk_overlay_sse2_8bit+0x4cf>
+ DB 196,98,125,24,45,88,47,2,0 ; vbroadcastss 0x22f58(%rip),%ymm13 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf>
DB 197,20,92,240 ; vsubps %ymm0,%ymm13,%ymm14
DB 196,65,36,89,246 ; vmulps %ymm14,%ymm11,%ymm14
DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14
- DB 196,226,125,24,13,19,43,2,0 ; vbroadcastss 0x22b13(%rip),%ymm1 # 2b5fc <_sk_overlay_sse2_8bit+0x4db>
+ DB 196,226,125,24,13,77,47,2,0 ; vbroadcastss 0x22f4d(%rip),%ymm1 # 2bbe8 <_sk_overlay_sse2_8bit+0x4db>
DB 196,193,116,194,255,2 ; vcmpleps %ymm15,%ymm1,%ymm7
DB 196,195,13,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm14,%ymm7
DB 196,65,60,194,247,2 ; vcmpleps %ymm15,%ymm8,%ymm14
DB 196,227,45,74,255,224 ; vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,53,234,42,2,0 ; vbroadcastss 0x22aea(%rip),%ymm14 # 2b5f4 <_sk_overlay_sse2_8bit+0x4d3>
+ DB 196,98,125,24,53,36,47,2,0 ; vbroadcastss 0x22f24(%rip),%ymm14 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3>
DB 196,65,12,194,255,2 ; vcmpleps %ymm15,%ymm14,%ymm15
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -8357,7 +8454,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,164,89,247 ; vmulps %ymm7,%ymm11,%ymm6
DB 197,180,88,246 ; vaddps %ymm6,%ymm9,%ymm6
DB 196,227,77,74,237,0 ; vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- DB 196,226,125,24,5,148,42,2,0 ; vbroadcastss 0x22a94(%rip),%ymm0 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,226,125,24,5,206,46,2,0 ; vbroadcastss 0x22ece(%rip),%ymm0 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
DB 197,228,88,192 ; vaddps %ymm0,%ymm3,%ymm0
DB 196,227,125,8,216,1 ; vroundps $0x1,%ymm0,%ymm3
DB 197,252,92,195 ; vsubps %ymm3,%ymm0,%ymm0
@@ -8408,15 +8505,15 @@ _sk_scale_u8_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,75 ; jne 8c79 <_sk_scale_u8_avx+0x64>
+ DB 117,75 ; jne 8e2b <_sk_scale_u8_avx+0x64>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,244,50,2,0 ; vpand 0x232f4(%rip),%xmm8,%xmm8 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,57,219,5,34,55,2,0 ; vpand 0x23722(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,165,41,2,0 ; vbroadcastss 0x229a5(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,223,45,2,0 ; vbroadcastss 0x22ddf(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -8430,15 +8527,15 @@ _sk_scale_u8_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,166 ; ja 8c34 <_sk_scale_u8_avx+0x1f>
+ DB 119,166 ; ja 8de6 <_sk_scale_u8_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,123,0,0,0 ; lea 0x7b(%rip),%r11 # 8d14 <_sk_scale_u8_avx+0xff>
+ DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # 8ec4 <_sk_scale_u8_avx+0xfd>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 235,135 ; jmp 8c34 <_sk_scale_u8_avx+0x1f>
+ DB 235,135 ; jmp 8de6 <_sk_scale_u8_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -8446,7 +8543,7 @@ _sk_scale_u8_avx LABEL PROC
DB 197,121,110,200 ; vmovd %eax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
- DB 233,94,255,255,255 ; jmpq 8c34 <_sk_scale_u8_avx+0x1f>
+ DB 233,94,255,255,255 ; jmpq 8de6 <_sk_scale_u8_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -8457,21 +8554,114 @@ _sk_scale_u8_avx LABEL PROC
DB 196,65,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- DB 233,34,255,255,255 ; jmpq 8c34 <_sk_scale_u8_avx+0x1f>
- DB 102,144 ; xchg %ax,%ax
- DB 142,255 ; mov %edi,%?
+ DB 233,34,255,255,255 ; jmpq 8de6 <_sk_scale_u8_avx+0x1f>
+ DB 144 ; nop
DB 255 ; (bad)
- DB 255,169,255,255,255,153 ; ljmp *-0x66000001(%rcx)
DB 255 ; (bad)
+ DB 255,171,255,255,255,155 ; ljmp *-0x64000001(%rbx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde008d24 <_sk_overlay_sse2_8bit+0xffffffffddfddc03>
DB 255 ; (bad)
+ DB 234 ; (bad)
DB 255 ; (bad)
- DB 255,210 ; callq *%rdx
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,194 ; inc %edx
+ DB 223,255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,212 ; callq *%rsp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,196 ; inc %esp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; .byte 0xff
+
+PUBLIC _sk_scale_565_avx
+_sk_scale_565_avx LABEL PROC
+ DB 83 ; push %rbx
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,99,80,8 ; movslq 0x8(%rax),%r10
+ DB 76,99,201 ; movslq %ecx,%r9
+ DB 77,15,175,202 ; imul %r10,%r9
+ DB 77,1,201 ; add %r9,%r9
+ DB 76,3,8 ; add (%rax),%r9
+ DB 72,99,218 ; movslq %edx,%rbx
+ DB 77,133,192 ; test %r8,%r8
+ DB 15,133,178,0,0,0 ; jne 8fb2 <_sk_scale_565_avx+0xd2>
+ DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
+ DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
+ DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
+ DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
+ DB 196,98,125,24,13,208,44,2,0 ; vbroadcastss 0x22cd0(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9
+ DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
+ DB 196,98,125,24,21,193,44,2,0 ; vbroadcastss 0x22cc1(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
+ DB 196,98,125,24,21,183,44,2,0 ; vbroadcastss 0x22cb7(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10
+ DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
+ DB 196,98,125,24,29,168,44,2,0 ; vbroadcastss 0x22ca8(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
+ DB 196,98,125,24,29,158,44,2,0 ; vbroadcastss 0x22c9e(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8
+ DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
+ DB 196,98,125,24,29,143,44,2,0 ; vbroadcastss 0x22c8f(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
+ DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
+ DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
+ DB 196,65,52,93,228 ; vminps %ymm12,%ymm9,%ymm12
+ DB 196,65,44,95,232 ; vmaxps %ymm8,%ymm10,%ymm13
+ DB 196,65,52,95,237 ; vmaxps %ymm13,%ymm9,%ymm13
+ DB 196,67,21,74,220,176 ; vblendvps %ymm11,%ymm12,%ymm13,%ymm11
+ DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
+ DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
+ DB 197,188,89,210 ; vmulps %ymm2,%ymm8,%ymm2
+ DB 197,164,89,219 ; vmulps %ymm3,%ymm11,%ymm3
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 91 ; pop %rbx
+ DB 255,224 ; jmpq *%rax
+ DB 69,137,194 ; mov %r8d,%r10d
+ DB 65,128,226,7 ; and $0x7,%r10b
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 65,254,202 ; dec %r10b
+ DB 65,128,250,6 ; cmp $0x6,%r10b
+ DB 15,135,59,255,255,255 ; ja 8f06 <_sk_scale_565_avx+0x26>
+ DB 69,15,182,210 ; movzbl %r10b,%r10d
+ DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 903c <_sk_scale_565_avx+0x15c>
+ DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
+ DB 76,1,216 ; add %r11,%rax
+ DB 255,224 ; jmpq *%rax
+ DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
+ DB 197,121,110,192 ; vmovd %eax,%xmm8
+ DB 233,25,255,255,255 ; jmpq 8f06 <_sk_scale_565_avx+0x26>
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 196,65,57,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm9
+ DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
+ DB 233,251,254,255,255 ; jmpq 8f06 <_sk_scale_565_avx+0x26>
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 196,65,57,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,57,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,57,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
+ DB 196,65,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm9
+ DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
+ DB 233,205,254,255,255 ; jmpq 8f06 <_sk_scale_565_avx+0x26>
+ DB 15,31,0 ; nopl (%rax)
+ DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 236 ; in (%dx),%al
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,228 ; jmpq *%rsp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 220,255 ; fdivr %st,%st(7)
+ DB 255 ; (bad)
+ DB 255,207 ; dec %edi
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -8505,15 +8695,15 @@ _sk_lerp_u8_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,111 ; jne 8df7 <_sk_lerp_u8_avx+0x88>
+ DB 117,111 ; jne 911f <_sk_lerp_u8_avx+0x88>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,154,49,2,0 ; vpand 0x2319a(%rip),%xmm8,%xmm8 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,57,219,5,82,52,2,0 ; vpand 0x23452(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,75,40,2,0 ; vbroadcastss 0x2284b(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,15,43,2,0 ; vbroadcastss 0x22b0f(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
@@ -8535,15 +8725,15 @@ _sk_lerp_u8_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,130 ; ja 8d8e <_sk_lerp_u8_avx+0x1f>
+ DB 119,130 ; ja 90b6 <_sk_lerp_u8_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,125,0,0,0 ; lea 0x7d(%rip),%r11 # 8e94 <_sk_lerp_u8_avx+0x125>
+ DB 76,141,29,125,0,0,0 ; lea 0x7d(%rip),%r11 # 91bc <_sk_lerp_u8_avx+0x125>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 233,96,255,255,255 ; jmpq 8d8e <_sk_lerp_u8_avx+0x1f>
+ DB 233,96,255,255,255 ; jmpq 90b6 <_sk_lerp_u8_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -8551,7 +8741,7 @@ _sk_lerp_u8_avx LABEL PROC
DB 197,121,110,200 ; vmovd %eax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
- DB 233,55,255,255,255 ; jmpq 8d8e <_sk_lerp_u8_avx+0x1f>
+ DB 233,55,255,255,255 ; jmpq 90b6 <_sk_lerp_u8_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -8562,7 +8752,7 @@ _sk_lerp_u8_avx LABEL PROC
DB 196,65,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- DB 233,251,254,255,255 ; jmpq 8d8e <_sk_lerp_u8_avx+0x1f>
+ DB 233,251,254,255,255 ; jmpq 90b6 <_sk_lerp_u8_avx+0x1f>
DB 144 ; nop
DB 140,255 ; mov %?,%edi
DB 255 ; (bad)
@@ -8570,7 +8760,7 @@ _sk_lerp_u8_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf008ea4 <_sk_overlay_sse2_8bit+0xffffffffdefddd83>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf0091cc <_sk_overlay_sse2_8bit+0xffffffffdefddabf>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -8592,27 +8782,33 @@ _sk_lerp_565_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,209,0,0,0 ; jne 8fa1 <_sk_lerp_565_avx+0xf1>
+ DB 15,133,214,0,0,0 ; jne 92ce <_sk_lerp_565_avx+0xf6>
DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- DB 196,98,125,24,13,20,39,2,0 ; vbroadcastss 0x22714(%rip),%ymm9 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,98,125,24,13,216,41,2,0 ; vbroadcastss 0x229d8(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,5,39,2,0 ; vbroadcastss 0x22705(%rip),%ymm10 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,98,125,24,21,201,41,2,0 ; vbroadcastss 0x229c9(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,251,38,2,0 ; vbroadcastss 0x226fb(%rip),%ymm10 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,98,125,24,21,191,41,2,0 ; vbroadcastss 0x229bf(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,236,38,2,0 ; vbroadcastss 0x226ec(%rip),%ymm11 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,98,125,24,29,176,41,2,0 ; vbroadcastss 0x229b0(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,29,226,38,2,0 ; vbroadcastss 0x226e2(%rip),%ymm11 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,98,125,24,29,166,41,2,0 ; vbroadcastss 0x229a6(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,211,38,2,0 ; vbroadcastss 0x226d3(%rip),%ymm11 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,98,125,24,29,151,41,2,0 ; vbroadcastss 0x22997(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
+ DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
+ DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
+ DB 196,65,52,93,228 ; vminps %ymm12,%ymm9,%ymm12
+ DB 196,65,44,95,232 ; vmaxps %ymm8,%ymm10,%ymm13
+ DB 196,65,52,95,237 ; vmaxps %ymm13,%ymm9,%ymm13
+ DB 196,67,21,74,220,176 ; vblendvps %ymm11,%ymm12,%ymm13,%ymm11
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
@@ -8623,14 +8819,8 @@ _sk_lerp_565_avx LABEL PROC
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,236,88,214 ; vaddps %ymm6,%ymm2,%ymm2
DB 197,228,92,223 ; vsubps %ymm7,%ymm3,%ymm3
- DB 196,65,100,89,201 ; vmulps %ymm9,%ymm3,%ymm9
- DB 197,52,88,207 ; vaddps %ymm7,%ymm9,%ymm9
- DB 196,65,100,89,210 ; vmulps %ymm10,%ymm3,%ymm10
- DB 197,44,88,215 ; vaddps %ymm7,%ymm10,%ymm10
- DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
+ DB 196,193,100,89,219 ; vmulps %ymm11,%ymm3,%ymm3
DB 197,228,88,223 ; vaddps %ymm7,%ymm3,%ymm3
- DB 197,172,95,219 ; vmaxps %ymm3,%ymm10,%ymm3
- DB 197,180,95,219 ; vmaxps %ymm3,%ymm9,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -8639,42 +8829,42 @@ _sk_lerp_565_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,28,255,255,255 ; ja 8ed6 <_sk_lerp_565_avx+0x26>
+ DB 15,135,23,255,255,255 ; ja 91fe <_sk_lerp_565_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 9028 <_sk_lerp_565_avx+0x178>
+ DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 9358 <_sk_lerp_565_avx+0x180>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 233,250,254,255,255 ; jmpq 8ed6 <_sk_lerp_565_avx+0x26>
+ DB 233,245,254,255,255 ; jmpq 91fe <_sk_lerp_565_avx+0x26>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,65,57,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm9
DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
- DB 233,220,254,255,255 ; jmpq 8ed6 <_sk_lerp_565_avx+0x26>
+ DB 233,215,254,255,255 ; jmpq 91fe <_sk_lerp_565_avx+0x26>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,65,57,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,57,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,57,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm9
DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- DB 233,174,254,255,255 ; jmpq 8ed6 <_sk_lerp_565_avx+0x26>
- DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
+ DB 233,169,254,255,255 ; jmpq 91fe <_sk_lerp_565_avx+0x26>
+ DB 15,31,0 ; nopl (%rax)
+ DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,193 ; inc %ecx
DB 255 ; (bad)
+ DB 236 ; in (%dx),%al
DB 255 ; (bad)
- DB 255,180,255,255,255,239,255 ; pushq -0x100001(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 255,231 ; jmpq *%rdi
+ DB 255,228 ; jmpq *%rsp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 223,255 ; (bad)
+ DB 220,255 ; fdivr %st,%st(7)
DB 255 ; (bad)
- DB 255,210 ; callq *%rdx
+ DB 255,207 ; dec %edi
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -8686,9 +8876,9 @@ _sk_load_tables_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 15,133,7,2,0,0 ; jne 9262 <_sk_load_tables_avx+0x21e>
+ DB 15,133,7,2,0,0 ; jne 9592 <_sk_load_tables_avx+0x21e>
DB 196,65,125,16,20,145 ; vmovupd (%r9,%rdx,4),%ymm10
- DB 197,125,40,13,247,41,2,0 ; vmovapd 0x229f7(%rip),%ymm9 # 2ba60 <_sk_overlay_sse2_8bit+0x93f>
+ DB 197,125,40,13,167,44,2,0 ; vmovapd 0x22ca7(%rip),%ymm9 # 2c040 <_sk_overlay_sse2_8bit+0x933>
DB 196,193,45,84,201 ; vandpd %ymm9,%ymm10,%ymm1
DB 196,227,125,25,200,1 ; vextractf128 $0x1,%ymm1,%xmm0
DB 196,193,249,126,193 ; vmovq %xmm0,%r9
@@ -8780,7 +8970,7 @@ _sk_load_tables_avx LABEL PROC
DB 196,193,65,114,213,24 ; vpsrld $0x18,%xmm13,%xmm7
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,179,35,2,0 ; vbroadcastss 0x223b3(%rip),%ymm7 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,61,111,38,2,0 ; vbroadcastss 0x2266f(%rip),%ymm7 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7
@@ -8791,21 +8981,21 @@ _sk_load_tables_avx LABEL PROC
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,230,253,255,255 ; ja 9061 <_sk_load_tables_avx+0x1d>
+ DB 15,135,230,253,255,255 ; ja 9391 <_sk_load_tables_avx+0x1d>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,146,0,0,0 ; lea 0x92(%rip),%r11 # 9318 <_sk_load_tables_avx+0x2d4>
+ DB 76,141,29,146,0,0,0 ; lea 0x92(%rip),%r11 # 9648 <_sk_load_tables_avx+0x2d4>
DB 79,99,20,147 ; movslq (%r11,%r10,4),%r10
DB 77,1,218 ; add %r11,%r10
DB 65,255,226 ; jmpq *%r10
DB 196,65,122,16,20,145 ; vmovss (%r9,%rdx,4),%xmm10
- DB 233,198,253,255,255 ; jmpq 9061 <_sk_load_tables_avx+0x1d>
+ DB 233,198,253,255,255 ; jmpq 9391 <_sk_load_tables_avx+0x1d>
DB 196,193,121,110,68,145,8 ; vmovd 0x8(%r9,%rdx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,99,117,12,208,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm10
DB 196,193,123,16,4,145 ; vmovsd (%r9,%rdx,4),%xmm0
DB 196,99,45,13,208,1 ; vblendpd $0x1,%ymm0,%ymm10,%ymm10
- DB 233,159,253,255,255 ; jmpq 9061 <_sk_load_tables_avx+0x1d>
+ DB 233,159,253,255,255 ; jmpq 9391 <_sk_load_tables_avx+0x1d>
DB 196,193,121,110,68,145,24 ; vmovd 0x18(%r9,%rdx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -8819,9 +9009,9 @@ _sk_load_tables_avx LABEL PROC
DB 196,99,45,24,208,1 ; vinsertf128 $0x1,%xmm0,%ymm10,%ymm10
DB 196,193,121,16,4,145 ; vmovupd (%r9,%rdx,4),%xmm0
DB 196,67,125,13,210,12 ; vblendpd $0xc,%ymm10,%ymm0,%ymm10
- DB 233,74,253,255,255 ; jmpq 9061 <_sk_load_tables_avx+0x1d>
+ DB 233,74,253,255,255 ; jmpq 9391 <_sk_load_tables_avx+0x1d>
DB 144 ; nop
- DB 120,255 ; js 9319 <_sk_load_tables_avx+0x2d5>
+ DB 120,255 ; js 9649 <_sk_load_tables_avx+0x2d5>
DB 255 ; (bad)
DB 255,153,255,255,255,131 ; lcall *-0x7c000001(%rcx)
DB 255 ; (bad)
@@ -8850,7 +9040,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
DB 197,252,17,60,36 ; vmovups %ymm7,(%rsp)
- DB 15,133,87,2,0,0 ; jne 95aa <_sk_load_tables_u16_be_avx+0x276>
+ DB 15,133,87,2,0,0 ; jne 98da <_sk_load_tables_u16_be_avx+0x276>
DB 196,1,121,16,4,81 ; vmovupd (%r9,%r10,2),%xmm8
DB 196,129,121,16,84,81,16 ; vmovupd 0x10(%r9,%r10,2),%xmm2
DB 196,129,121,16,92,81,32 ; vmovupd 0x20(%r9,%r10,2),%xmm3
@@ -8865,7 +9055,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 197,113,105,219 ; vpunpckhwd %xmm3,%xmm1,%xmm11
DB 197,177,108,200 ; vpunpcklqdq %xmm0,%xmm9,%xmm1
DB 197,49,109,224 ; vpunpckhqdq %xmm0,%xmm9,%xmm12
- DB 197,121,111,21,144,43,2,0 ; vmovdqa 0x22b90(%rip),%xmm10 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,121,111,21,64,46,2,0 ; vmovdqa 0x22e40(%rip),%xmm10 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,193,113,219,202 ; vpand %xmm10,%xmm1,%xmm1
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,193,113,105,209 ; vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -8963,7 +9153,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,226,121,51,219 ; vpmovzxwd %xmm3,%xmm3
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,135,32,2,0 ; vbroadcastss 0x22087(%rip),%ymm7 # 2b620 <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,226,125,24,61,67,35,2,0 ; vbroadcastss 0x22343(%rip),%ymm7 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7
@@ -8972,29 +9162,29 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,1,123,16,4,81 ; vmovsd (%r9,%r10,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 9610 <_sk_load_tables_u16_be_avx+0x2dc>
+ DB 116,85 ; je 9940 <_sk_load_tables_u16_be_avx+0x2dc>
DB 196,1,57,22,68,81,8 ; vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 9610 <_sk_load_tables_u16_be_avx+0x2dc>
+ DB 114,72 ; jb 9940 <_sk_load_tables_u16_be_avx+0x2dc>
DB 196,129,123,16,84,81,16 ; vmovsd 0x10(%r9,%r10,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 961d <_sk_load_tables_u16_be_avx+0x2e9>
+ DB 116,72 ; je 994d <_sk_load_tables_u16_be_avx+0x2e9>
DB 196,129,105,22,84,81,24 ; vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 961d <_sk_load_tables_u16_be_avx+0x2e9>
+ DB 114,59 ; jb 994d <_sk_load_tables_u16_be_avx+0x2e9>
DB 196,129,123,16,92,81,32 ; vmovsd 0x20(%r9,%r10,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,123,253,255,255 ; je 936e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 15,132,123,253,255,255 ; je 969e <_sk_load_tables_u16_be_avx+0x3a>
DB 196,129,97,22,92,81,40 ; vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,106,253,255,255 ; jb 936e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 15,130,106,253,255,255 ; jb 969e <_sk_load_tables_u16_be_avx+0x3a>
DB 196,1,122,126,76,81,48 ; vmovq 0x30(%r9,%r10,2),%xmm9
- DB 233,94,253,255,255 ; jmpq 936e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,94,253,255,255 ; jmpq 969e <_sk_load_tables_u16_be_avx+0x3a>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,81,253,255,255 ; jmpq 936e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,81,253,255,255 ; jmpq 969e <_sk_load_tables_u16_be_avx+0x3a>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,72,253,255,255 ; jmpq 936e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,72,253,255,255 ; jmpq 969e <_sk_load_tables_u16_be_avx+0x3a>
PUBLIC _sk_load_tables_rgb_u16_be_avx
_sk_load_tables_rgb_u16_be_avx LABEL PROC
@@ -9005,7 +9195,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 197,252,17,124,36,32 ; vmovups %ymm7,0x20(%rsp)
DB 197,252,17,52,36 ; vmovups %ymm6,(%rsp)
- DB 15,133,74,2,0,0 ; jne 9891 <_sk_load_tables_rgb_u16_be_avx+0x26b>
+ DB 15,133,74,2,0,0 ; jne 9bc1 <_sk_load_tables_rgb_u16_be_avx+0x26b>
DB 196,129,122,111,4,81 ; vmovdqu (%r9,%r10,2),%xmm0
DB 196,129,122,111,84,81,12 ; vmovdqu 0xc(%r9,%r10,2),%xmm2
DB 196,129,122,111,76,81,24 ; vmovdqu 0x18(%r9,%r10,2),%xmm1
@@ -9026,7 +9216,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3
DB 197,57,109,218 ; vpunpckhqdq %xmm2,%xmm8,%xmm11
DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8
- DB 197,121,111,13,127,40,2,0 ; vmovdqa 0x2287f(%rip),%xmm9 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,121,111,13,47,43,2,0 ; vmovdqa 0x22b2f(%rip),%xmm9 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 196,193,121,105,202 ; vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -9116,7 +9306,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 196,195,105,33,211,48 ; vinsertps $0x30,%xmm11,%xmm2,%xmm2
DB 196,227,109,24,211,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,16,29,2,0 ; vbroadcastss 0x21d10(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,204,31,2,0 ; vbroadcastss 0x21fcc(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,16,52,36 ; vmovups (%rsp),%ymm6
DB 197,252,16,124,36,32 ; vmovups 0x20(%rsp),%ymm7
DB 72,131,196,88 ; add $0x58,%rsp
@@ -9124,41 +9314,41 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0
DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 98aa <_sk_load_tables_rgb_u16_be_avx+0x284>
- DB 233,209,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 117,5 ; jne 9bda <_sk_load_tables_rgb_u16_be_avx+0x284>
+ DB 233,209,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
DB 196,129,121,110,76,81,6 ; vmovd 0x6(%r9,%r10,2),%xmm1
DB 196,1,113,196,68,81,10,2 ; vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 98d9 <_sk_load_tables_rgb_u16_be_avx+0x2b3>
+ DB 114,26 ; jb 9c09 <_sk_load_tables_rgb_u16_be_avx+0x2b3>
DB 196,129,121,110,76,81,12 ; vmovd 0xc(%r9,%r10,2),%xmm1
DB 196,129,113,196,84,81,16,2 ; vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 98de <_sk_load_tables_rgb_u16_be_avx+0x2b8>
- DB 233,162,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 233,157,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 117,10 ; jne 9c0e <_sk_load_tables_rgb_u16_be_avx+0x2b8>
+ DB 233,162,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 233,157,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
DB 196,129,121,110,76,81,18 ; vmovd 0x12(%r9,%r10,2),%xmm1
DB 196,1,113,196,76,81,22,2 ; vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 990d <_sk_load_tables_rgb_u16_be_avx+0x2e7>
+ DB 114,26 ; jb 9c3d <_sk_load_tables_rgb_u16_be_avx+0x2e7>
DB 196,129,121,110,76,81,24 ; vmovd 0x18(%r9,%r10,2),%xmm1
DB 196,129,113,196,76,81,28,2 ; vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 9912 <_sk_load_tables_rgb_u16_be_avx+0x2ec>
- DB 233,110,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 233,105,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 117,10 ; jne 9c42 <_sk_load_tables_rgb_u16_be_avx+0x2ec>
+ DB 233,110,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 233,105,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
DB 196,129,121,110,92,81,30 ; vmovd 0x1e(%r9,%r10,2),%xmm3
DB 196,1,97,196,92,81,34,2 ; vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 993b <_sk_load_tables_rgb_u16_be_avx+0x315>
+ DB 114,20 ; jb 9c6b <_sk_load_tables_rgb_u16_be_avx+0x315>
DB 196,129,121,110,92,81,36 ; vmovd 0x24(%r9,%r10,2),%xmm3
DB 196,129,97,196,92,81,40,2 ; vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- DB 233,64,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 233,59,253,255,255 ; jmpq 967b <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 233,64,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 233,59,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
PUBLIC _sk_byte_tables_avx
_sk_byte_tables_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,113,28,2,0 ; vbroadcastss 0x21c71(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,45,31,2,0 ; vbroadcastss 0x21f2d(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,201 ; vmovq %xmm9,%r9
@@ -9277,7 +9467,7 @@ _sk_byte_tables_avx LABEL PROC
DB 196,194,121,49,204 ; vpmovzxbd %xmm12,%xmm1
DB 196,194,121,49,213 ; vpmovzxbd %xmm13,%xmm2
DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- DB 196,98,125,24,13,95,26,2,0 ; vbroadcastss 0x21a5f(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,27,29,2,0 ; vbroadcastss 0x21d1b(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -9391,7 +9581,7 @@ _sk_byte_tables_rgb_avx LABEL PROC
DB 196,194,121,49,203 ; vpmovzxbd %xmm11,%xmm1
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,60,24,2,0 ; vbroadcastss 0x2183c(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,248,26,2,0 ; vbroadcastss 0x21af8(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,121,49,202 ; vpmovzxbd %xmm10,%xmm1
DB 196,194,121,49,212 ; vpmovzxbd %xmm12,%xmm2
@@ -9586,36 +9776,36 @@ _sk_parametric_r_avx LABEL PROC
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,216 ; vcvtdq2ps %ymm0,%ymm11
- DB 196,98,125,24,37,5,21,2,0 ; vbroadcastss 0x21505(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,37,193,23,2,0 ; vbroadcastss 0x217c1(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,251,20,2,0 ; vbroadcastss 0x214fb(%rip),%ymm12 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,183,23,2,0 ; vbroadcastss 0x217b7(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,124,84,196 ; vandps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,81,20,2,0 ; vbroadcastss 0x21451(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,13,23,2,0 ; vbroadcastss 0x2170d(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,124,86,196 ; vorps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,227,20,2,0 ; vbroadcastss 0x214e3(%rip),%ymm12 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,37,159,23,2,0 ; vbroadcastss 0x2179f(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,217,20,2,0 ; vbroadcastss 0x214d9(%rip),%ymm12 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,37,149,23,2,0 ; vbroadcastss 0x21795(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,202,20,2,0 ; vbroadcastss 0x214ca(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,134,23,2,0 ; vbroadcastss 0x21786(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,192,20,2,0 ; vbroadcastss 0x214c0(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,124,23,2,0 ; vbroadcastss 0x2177c(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 197,156,94,192 ; vdivps %ymm0,%ymm12,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,164,20,2,0 ; vbroadcastss 0x214a4(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,96,23,2,0 ; vbroadcastss 0x21760(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,154,20,2,0 ; vbroadcastss 0x2149a(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,86,23,2,0 ; vbroadcastss 0x21756(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,139,20,2,0 ; vbroadcastss 0x2148b(%rip),%ymm11 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,98,125,24,29,71,23,2,0 ; vbroadcastss 0x21747(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,129,20,2,0 ; vbroadcastss 0x21481(%rip),%ymm11 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,29,61,23,2,0 ; vbroadcastss 0x2173d(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,114,20,2,0 ; vbroadcastss 0x21472(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,46,23,2,0 ; vbroadcastss 0x2172e(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9623,7 +9813,7 @@ _sk_parametric_r_avx LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,137,19,2,0 ; vbroadcastss 0x21389(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,69,22,2,0 ; vbroadcastss 0x21645(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9643,36 +9833,36 @@ _sk_parametric_g_avx LABEL PROC
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,217 ; vcvtdq2ps %ymm1,%ymm11
- DB 196,98,125,24,37,202,19,2,0 ; vbroadcastss 0x213ca(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,37,134,22,2,0 ; vbroadcastss 0x21686(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,192,19,2,0 ; vbroadcastss 0x213c0(%rip),%ymm12 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,124,22,2,0 ; vbroadcastss 0x2167c(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,116,84,204 ; vandps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,22,19,2,0 ; vbroadcastss 0x21316(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,210,21,2,0 ; vbroadcastss 0x215d2(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,116,86,204 ; vorps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,168,19,2,0 ; vbroadcastss 0x213a8(%rip),%ymm12 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,37,100,22,2,0 ; vbroadcastss 0x21664(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,158,19,2,0 ; vbroadcastss 0x2139e(%rip),%ymm12 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,37,90,22,2,0 ; vbroadcastss 0x2165a(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,65,116,89,228 ; vmulps %ymm12,%ymm1,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,143,19,2,0 ; vbroadcastss 0x2138f(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,75,22,2,0 ; vbroadcastss 0x2164b(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,116,88,204 ; vaddps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,133,19,2,0 ; vbroadcastss 0x21385(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,65,22,2,0 ; vbroadcastss 0x21641(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 197,156,94,201 ; vdivps %ymm1,%ymm12,%ymm1
DB 197,164,92,201 ; vsubps %ymm1,%ymm11,%ymm1
DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,105,19,2,0 ; vbroadcastss 0x21369(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,37,22,2,0 ; vbroadcastss 0x21625(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,95,19,2,0 ; vbroadcastss 0x2135f(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,27,22,2,0 ; vbroadcastss 0x2161b(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,80,19,2,0 ; vbroadcastss 0x21350(%rip),%ymm11 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,98,125,24,29,12,22,2,0 ; vbroadcastss 0x2160c(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,70,19,2,0 ; vbroadcastss 0x21346(%rip),%ymm11 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,29,2,22,2,0 ; vbroadcastss 0x21602(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,55,19,2,0 ; vbroadcastss 0x21337(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,243,21,2,0 ; vbroadcastss 0x215f3(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9680,7 +9870,7 @@ _sk_parametric_g_avx LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,78,18,2,0 ; vbroadcastss 0x2124e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,10,21,2,0 ; vbroadcastss 0x2150a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9700,36 +9890,36 @@ _sk_parametric_b_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,218 ; vcvtdq2ps %ymm2,%ymm11
- DB 196,98,125,24,37,143,18,2,0 ; vbroadcastss 0x2128f(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,37,75,21,2,0 ; vbroadcastss 0x2154b(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,133,18,2,0 ; vbroadcastss 0x21285(%rip),%ymm12 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,65,21,2,0 ; vbroadcastss 0x21541(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,108,84,212 ; vandps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,219,17,2,0 ; vbroadcastss 0x211db(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,151,20,2,0 ; vbroadcastss 0x21497(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,108,86,212 ; vorps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,109,18,2,0 ; vbroadcastss 0x2126d(%rip),%ymm12 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,37,41,21,2,0 ; vbroadcastss 0x21529(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,99,18,2,0 ; vbroadcastss 0x21263(%rip),%ymm12 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,37,31,21,2,0 ; vbroadcastss 0x2151f(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,65,108,89,228 ; vmulps %ymm12,%ymm2,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,84,18,2,0 ; vbroadcastss 0x21254(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,16,21,2,0 ; vbroadcastss 0x21510(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,74,18,2,0 ; vbroadcastss 0x2124a(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,6,21,2,0 ; vbroadcastss 0x21506(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 197,156,94,210 ; vdivps %ymm2,%ymm12,%ymm2
DB 197,164,92,210 ; vsubps %ymm2,%ymm11,%ymm2
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,46,18,2,0 ; vbroadcastss 0x2122e(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,234,20,2,0 ; vbroadcastss 0x214ea(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,36,18,2,0 ; vbroadcastss 0x21224(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,224,20,2,0 ; vbroadcastss 0x214e0(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,108,92,211 ; vsubps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,21,18,2,0 ; vbroadcastss 0x21215(%rip),%ymm11 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,98,125,24,29,209,20,2,0 ; vbroadcastss 0x214d1(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,11,18,2,0 ; vbroadcastss 0x2120b(%rip),%ymm11 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,29,199,20,2,0 ; vbroadcastss 0x214c7(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,108,88,210 ; vaddps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,252,17,2,0 ; vbroadcastss 0x211fc(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,184,20,2,0 ; vbroadcastss 0x214b8(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9737,7 +9927,7 @@ _sk_parametric_b_avx LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,19,17,2,0 ; vbroadcastss 0x21113(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,207,19,2,0 ; vbroadcastss 0x213cf(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9757,36 +9947,36 @@ _sk_parametric_a_avx LABEL PROC
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,219 ; vcvtdq2ps %ymm3,%ymm11
- DB 196,98,125,24,37,84,17,2,0 ; vbroadcastss 0x21154(%rip),%ymm12 # 2b624 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,37,16,20,2,0 ; vbroadcastss 0x21410(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,74,17,2,0 ; vbroadcastss 0x2114a(%rip),%ymm12 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,6,20,2,0 ; vbroadcastss 0x21406(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,100,84,220 ; vandps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,160,16,2,0 ; vbroadcastss 0x210a0(%rip),%ymm12 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,92,19,2,0 ; vbroadcastss 0x2135c(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,100,86,220 ; vorps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,50,17,2,0 ; vbroadcastss 0x21132(%rip),%ymm12 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,37,238,19,2,0 ; vbroadcastss 0x213ee(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,40,17,2,0 ; vbroadcastss 0x21128(%rip),%ymm12 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,37,228,19,2,0 ; vbroadcastss 0x213e4(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,65,100,89,228 ; vmulps %ymm12,%ymm3,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,25,17,2,0 ; vbroadcastss 0x21119(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,213,19,2,0 ; vbroadcastss 0x213d5(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,100,88,220 ; vaddps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,15,17,2,0 ; vbroadcastss 0x2110f(%rip),%ymm12 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,203,19,2,0 ; vbroadcastss 0x213cb(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 197,156,94,219 ; vdivps %ymm3,%ymm12,%ymm3
DB 197,164,92,219 ; vsubps %ymm3,%ymm11,%ymm3
DB 197,172,89,219 ; vmulps %ymm3,%ymm10,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,243,16,2,0 ; vbroadcastss 0x210f3(%rip),%ymm11 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,175,19,2,0 ; vbroadcastss 0x213af(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,233,16,2,0 ; vbroadcastss 0x210e9(%rip),%ymm11 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,165,19,2,0 ; vbroadcastss 0x213a5(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,100,92,219 ; vsubps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,218,16,2,0 ; vbroadcastss 0x210da(%rip),%ymm11 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,98,125,24,29,150,19,2,0 ; vbroadcastss 0x21396(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,208,16,2,0 ; vbroadcastss 0x210d0(%rip),%ymm11 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,29,140,19,2,0 ; vbroadcastss 0x2138c(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,100,88,218 ; vaddps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,193,16,2,0 ; vbroadcastss 0x210c1(%rip),%ymm10 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,125,19,2,0 ; vbroadcastss 0x2137d(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9794,7 +9984,7 @@ _sk_parametric_a_avx LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,216,15,2,0 ; vbroadcastss 0x20fd8(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,148,18,2,0 ; vbroadcastss 0x21294(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9811,34 +10001,34 @@ _sk_gamma_avx LABEL PROC
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,91,200 ; vcvtdq2ps %ymm0,%ymm1
- DB 196,98,125,24,5,33,16,2,0 ; vbroadcastss 0x21021(%rip),%ymm8 # 2b624 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,5,221,18,2,0 ; vbroadcastss 0x212dd(%rip),%ymm8 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,23,16,2,0 ; vbroadcastss 0x21017(%rip),%ymm9 # 2b628 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,13,211,18,2,0 ; vbroadcastss 0x212d3(%rip),%ymm9 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0
- DB 196,226,125,24,37,109,15,2,0 ; vbroadcastss 0x20f6d(%rip),%ymm4 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,37,41,18,2,0 ; vbroadcastss 0x21229(%rip),%ymm4 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,86,196 ; vorps %ymm4,%ymm0,%ymm0
- DB 196,98,125,24,21,0,16,2,0 ; vbroadcastss 0x21000(%rip),%ymm10 # 2b62c <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,21,188,18,2,0 ; vbroadcastss 0x212bc(%rip),%ymm10 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,29,246,15,2,0 ; vbroadcastss 0x20ff6(%rip),%ymm11 # 2b630 <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,178,18,2,0 ; vbroadcastss 0x212b2(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
DB 196,193,124,89,211 ; vmulps %ymm11,%ymm0,%ymm2
DB 197,244,92,202 ; vsubps %ymm2,%ymm1,%ymm1
- DB 196,98,125,24,37,232,15,2,0 ; vbroadcastss 0x20fe8(%rip),%ymm12 # 2b634 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,164,18,2,0 ; vbroadcastss 0x212a4(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,45,222,15,2,0 ; vbroadcastss 0x20fde(%rip),%ymm13 # 2b638 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,45,154,18,2,0 ; vbroadcastss 0x2129a(%rip),%ymm13 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
DB 197,148,94,192 ; vdivps %ymm0,%ymm13,%ymm0
DB 197,244,92,192 ; vsubps %ymm0,%ymm1,%ymm0
DB 196,98,125,24,48 ; vbroadcastss (%rax),%ymm14
DB 196,193,124,89,198 ; vmulps %ymm14,%ymm0,%ymm0
DB 196,227,125,8,200,1 ; vroundps $0x1,%ymm0,%ymm1
DB 197,252,92,241 ; vsubps %ymm1,%ymm0,%ymm6
- DB 196,98,125,24,61,189,15,2,0 ; vbroadcastss 0x20fbd(%rip),%ymm15 # 2b63c <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,61,121,18,2,0 ; vbroadcastss 0x21279(%rip),%ymm15 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,124,88,199 ; vaddps %ymm15,%ymm0,%ymm0
- DB 196,226,125,24,29,179,15,2,0 ; vbroadcastss 0x20fb3(%rip),%ymm3 # 2b640 <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,226,125,24,29,111,18,2,0 ; vbroadcastss 0x2126f(%rip),%ymm3 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
DB 197,204,89,203 ; vmulps %ymm3,%ymm6,%ymm1
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
- DB 196,226,125,24,21,166,15,2,0 ; vbroadcastss 0x20fa6(%rip),%ymm2 # 2b644 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,21,98,18,2,0 ; vbroadcastss 0x21262(%rip),%ymm2 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
DB 197,236,92,198 ; vsubps %ymm6,%ymm2,%ymm0
- DB 196,226,125,24,53,157,15,2,0 ; vbroadcastss 0x20f9d(%rip),%ymm6 # 2b648 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,226,125,24,53,89,18,2,0 ; vbroadcastss 0x21259(%rip),%ymm6 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
DB 197,204,94,192 ; vdivps %ymm0,%ymm6,%ymm0
DB 197,244,88,192 ; vaddps %ymm0,%ymm1,%ymm0
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
@@ -9880,7 +10070,7 @@ _sk_gamma_avx LABEL PROC
DB 197,236,92,212 ; vsubps %ymm4,%ymm2,%ymm2
DB 197,204,94,210 ; vdivps %ymm2,%ymm6,%ymm2
DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,225,14,2,0 ; vbroadcastss 0x20ee1(%rip),%ymm2 # 2b64c <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,226,125,24,21,157,17,2,0 ; vbroadcastss 0x2119d(%rip),%ymm2 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
DB 197,236,89,28,36 ; vmulps (%rsp),%ymm2,%ymm3
DB 197,252,89,226 ; vmulps %ymm2,%ymm0,%ymm4
DB 197,244,89,210 ; vmulps %ymm2,%ymm1,%ymm2
@@ -9898,31 +10088,31 @@ _sk_gamma_avx LABEL PROC
PUBLIC _sk_lab_to_xyz_avx
_sk_lab_to_xyz_avx LABEL PROC
- DB 196,98,125,24,5,148,14,2,0 ; vbroadcastss 0x20e94(%rip),%ymm8 # 2b650 <_sk_overlay_sse2_8bit+0x52f>
+ DB 196,98,125,24,5,80,17,2,0 ; vbroadcastss 0x21150(%rip),%ymm8 # 2bc3c <_sk_overlay_sse2_8bit+0x52f>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,242,13,2,0 ; vbroadcastss 0x20df2(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,174,16,2,0 ; vbroadcastss 0x210ae(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,124,14,2,0 ; vbroadcastss 0x20e7c(%rip),%ymm9 # 2b654 <_sk_overlay_sse2_8bit+0x533>
+ DB 196,98,125,24,13,56,17,2,0 ; vbroadcastss 0x21138(%rip),%ymm9 # 2bc40 <_sk_overlay_sse2_8bit+0x533>
DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 196,193,108,88,209 ; vaddps %ymm9,%ymm2,%ymm2
- DB 196,98,125,24,5,104,14,2,0 ; vbroadcastss 0x20e68(%rip),%ymm8 # 2b658 <_sk_overlay_sse2_8bit+0x537>
+ DB 196,98,125,24,5,36,17,2,0 ; vbroadcastss 0x21124(%rip),%ymm8 # 2bc44 <_sk_overlay_sse2_8bit+0x537>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,94,14,2,0 ; vbroadcastss 0x20e5e(%rip),%ymm8 # 2b65c <_sk_overlay_sse2_8bit+0x53b>
+ DB 196,98,125,24,5,26,17,2,0 ; vbroadcastss 0x2111a(%rip),%ymm8 # 2bc48 <_sk_overlay_sse2_8bit+0x53b>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,84,14,2,0 ; vbroadcastss 0x20e54(%rip),%ymm8 # 2b660 <_sk_overlay_sse2_8bit+0x53f>
+ DB 196,98,125,24,5,16,17,2,0 ; vbroadcastss 0x21110(%rip),%ymm8 # 2bc4c <_sk_overlay_sse2_8bit+0x53f>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 197,252,88,201 ; vaddps %ymm1,%ymm0,%ymm1
- DB 196,98,125,24,5,70,14,2,0 ; vbroadcastss 0x20e46(%rip),%ymm8 # 2b664 <_sk_overlay_sse2_8bit+0x543>
+ DB 196,98,125,24,5,2,17,2,0 ; vbroadcastss 0x21102(%rip),%ymm8 # 2bc50 <_sk_overlay_sse2_8bit+0x543>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,252,92,210 ; vsubps %ymm2,%ymm0,%ymm2
DB 197,116,89,193 ; vmulps %ymm1,%ymm1,%ymm8
DB 196,65,116,89,192 ; vmulps %ymm8,%ymm1,%ymm8
- DB 196,98,125,24,13,47,14,2,0 ; vbroadcastss 0x20e2f(%rip),%ymm9 # 2b668 <_sk_overlay_sse2_8bit+0x547>
+ DB 196,98,125,24,13,235,16,2,0 ; vbroadcastss 0x210eb(%rip),%ymm9 # 2bc54 <_sk_overlay_sse2_8bit+0x547>
DB 196,65,52,194,208,1 ; vcmpltps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,36,14,2,0 ; vbroadcastss 0x20e24(%rip),%ymm11 # 2b66c <_sk_overlay_sse2_8bit+0x54b>
+ DB 196,98,125,24,29,224,16,2,0 ; vbroadcastss 0x210e0(%rip),%ymm11 # 2bc58 <_sk_overlay_sse2_8bit+0x54b>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,37,26,14,2,0 ; vbroadcastss 0x20e1a(%rip),%ymm12 # 2b670 <_sk_overlay_sse2_8bit+0x54f>
+ DB 196,98,125,24,37,214,16,2,0 ; vbroadcastss 0x210d6(%rip),%ymm12 # 2bc5c <_sk_overlay_sse2_8bit+0x54f>
DB 196,193,116,89,204 ; vmulps %ymm12,%ymm1,%ymm1
DB 196,67,117,74,192,160 ; vblendvps %ymm10,%ymm8,%ymm1,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -9937,9 +10127,9 @@ _sk_lab_to_xyz_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,193,108,89,212 ; vmulps %ymm12,%ymm2,%ymm2
DB 196,227,109,74,208,144 ; vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- DB 196,226,125,24,5,208,13,2,0 ; vbroadcastss 0x20dd0(%rip),%ymm0 # 2b674 <_sk_overlay_sse2_8bit+0x553>
+ DB 196,226,125,24,5,140,16,2,0 ; vbroadcastss 0x2108c(%rip),%ymm0 # 2bc60 <_sk_overlay_sse2_8bit+0x553>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,199,13,2,0 ; vbroadcastss 0x20dc7(%rip),%ymm8 # 2b678 <_sk_overlay_sse2_8bit+0x557>
+ DB 196,98,125,24,5,131,16,2,0 ; vbroadcastss 0x21083(%rip),%ymm8 # 2bc64 <_sk_overlay_sse2_8bit+0x557>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9954,15 +10144,15 @@ _sk_load_a8_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,67 ; jne a916 <_sk_load_a8_avx+0x5c>
+ DB 117,67 ; jne ac46 <_sk_load_a8_avx+0x5c>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,79,22,2,0 ; vpand 0x2164f(%rip),%xmm0,%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,249,219,5,255,24,2,0 ; vpand 0x218ff(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,3,13,2,0 ; vbroadcastss 0x20d03(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,191,15,2,0 ; vbroadcastss 0x20fbf(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -9975,15 +10165,15 @@ _sk_load_a8_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,175 ; ja a8d9 <_sk_load_a8_avx+0x1f>
+ DB 119,175 ; ja ac09 <_sk_load_a8_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # a9ac <_sk_load_a8_avx+0xf2>
+ DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # acdc <_sk_load_a8_avx+0xf2>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,144 ; jmp a8d9 <_sk_load_a8_avx+0x1f>
+ DB 235,144 ; jmp ac09 <_sk_load_a8_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -9991,7 +10181,7 @@ _sk_load_a8_avx LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,104,255,255,255 ; jmpq a8d9 <_sk_load_a8_avx+0x1f>
+ DB 233,104,255,255,255 ; jmpq ac09 <_sk_load_a8_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -10002,7 +10192,7 @@ _sk_load_a8_avx LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,45,255,255,255 ; jmpq a8d9 <_sk_load_a8_avx+0x1f>
+ DB 233,45,255,255,255 ; jmpq ac09 <_sk_load_a8_avx+0x1f>
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -10033,15 +10223,15 @@ _sk_load_a8_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,67 ; jne aa24 <_sk_load_a8_dst_avx+0x5c>
+ DB 117,67 ; jne ad54 <_sk_load_a8_dst_avx+0x5c>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,65,21,2,0 ; vpand 0x21541(%rip),%xmm4,%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,217,219,37,241,23,2,0 ; vpand 0x217f1(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,245,11,2,0 ; vbroadcastss 0x20bf5(%rip),%ymm5 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,45,177,14,2,0 ; vbroadcastss 0x20eb1(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
@@ -10054,15 +10244,15 @@ _sk_load_a8_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,175 ; ja a9e7 <_sk_load_a8_dst_avx+0x1f>
+ DB 119,175 ; ja ad17 <_sk_load_a8_dst_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # aabc <_sk_load_a8_dst_avx+0xf4>
+ DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # adec <_sk_load_a8_dst_avx+0xf4>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,144 ; jmp a9e7 <_sk_load_a8_dst_avx+0x1f>
+ DB 235,144 ; jmp ad17 <_sk_load_a8_dst_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -10070,7 +10260,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,104,255,255,255 ; jmpq a9e7 <_sk_load_a8_dst_avx+0x1f>
+ DB 233,104,255,255,255 ; jmpq ad17 <_sk_load_a8_dst_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -10081,7 +10271,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,45,255,255,255 ; jmpq a9e7 <_sk_load_a8_dst_avx+0x1f>
+ DB 233,45,255,255,255 ; jmpq ad17 <_sk_load_a8_dst_avx+0x1f>
DB 102,144 ; xchg %ax,%ax
DB 144 ; nop
DB 255 ; (bad)
@@ -10090,7 +10280,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde00aacc <_sk_overlay_sse2_8bit+0xffffffffddfdf9ab>
+ DB 232,255,255,255,221 ; callq ffffffffde00adfc <_sk_overlay_sse2_8bit+0xffffffffddfdf6ef>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -10143,7 +10333,7 @@ _sk_gather_a8_avx LABEL PROC
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,96,10,2,0 ; vbroadcastss 0x20a60(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,28,13,2,0 ; vbroadcastss 0x20d1c(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -10160,14 +10350,14 @@ _sk_store_a8_avx LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,231,9,2,0 ; vbroadcastss 0x209e7(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,163,12,2,0 ; vbroadcastss 0x20ca3(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne abff <_sk_store_a8_avx+0x47>
+ DB 117,11 ; jne af2f <_sk_store_a8_avx+0x47>
DB 196,65,123,17,4,25 ; vmovsd %xmm8,(%r9,%rbx,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10176,25 +10366,25 @@ _sk_store_a8_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja abfa <_sk_store_a8_avx+0x42>
+ DB 119,235 ; ja af2a <_sk_store_a8_avx+0x42>
DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # ac74 <_sk_store_a8_avx+0xbc>
+ DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # afa4 <_sk_store_a8_avx+0xbc>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,20,4,25,0 ; vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,201 ; jmp abfa <_sk_store_a8_avx+0x42>
+ DB 235,201 ; jmp af2a <_sk_store_a8_avx+0x42>
DB 196,67,121,20,68,25,2,4 ; vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- DB 196,98,57,0,5,254,18,2,0 ; vpshufb 0x212fe(%rip),%xmm8,%xmm8 # 2bf40 <_sk_overlay_sse2_8bit+0xe1f>
+ DB 196,98,57,0,5,174,21,2,0 ; vpshufb 0x215ae(%rip),%xmm8,%xmm8 # 2c520 <_sk_overlay_sse2_8bit+0xe13>
DB 196,67,121,21,4,25,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,175 ; jmp abfa <_sk_store_a8_avx+0x42>
+ DB 235,175 ; jmp af2a <_sk_store_a8_avx+0x42>
DB 196,67,121,20,68,25,6,12 ; vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
DB 196,67,121,20,68,25,5,10 ; vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
DB 196,67,121,20,68,25,4,8 ; vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- DB 196,98,57,0,5,228,18,2,0 ; vpshufb 0x212e4(%rip),%xmm8,%xmm8 # 2bf50 <_sk_overlay_sse2_8bit+0xe2f>
+ DB 196,98,57,0,5,148,21,2,0 ; vpshufb 0x21594(%rip),%xmm8,%xmm8 # 2c530 <_sk_overlay_sse2_8bit+0xe23>
DB 196,65,121,126,4,25 ; vmovd %xmm8,(%r9,%rbx,1)
- DB 235,134 ; jmp abfa <_sk_store_a8_avx+0x42>
+ DB 235,134 ; jmp af2a <_sk_store_a8_avx+0x42>
DB 180,255 ; mov $0xff,%ah
DB 255 ; (bad)
DB 255,197 ; inc %ebp
@@ -10225,18 +10415,18 @@ _sk_load_g8_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne acf1 <_sk_load_g8_avx+0x61>
+ DB 117,72 ; jne b021 <_sk_load_g8_avx+0x61>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,121,18,2,0 ; vpand 0x21279(%rip),%xmm0,%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,249,219,5,41,21,2,0 ; vpand 0x21529(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,45,9,2,0 ; vbroadcastss 0x2092d(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,233,11,2,0 ; vbroadcastss 0x20be9(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,170,8,2,0 ; vbroadcastss 0x208aa(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,102,11,2,0 ; vbroadcastss 0x20b66(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -10246,15 +10436,15 @@ _sk_load_g8_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,170 ; ja acaf <_sk_load_g8_avx+0x1f>
+ DB 119,170 ; ja afdf <_sk_load_g8_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # ad88 <_sk_load_g8_avx+0xf8>
+ DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # b0b8 <_sk_load_g8_avx+0xf8>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,139 ; jmp acaf <_sk_load_g8_avx+0x1f>
+ DB 235,139 ; jmp afdf <_sk_load_g8_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -10262,7 +10452,7 @@ _sk_load_g8_avx LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,99,255,255,255 ; jmpq acaf <_sk_load_g8_avx+0x1f>
+ DB 233,99,255,255,255 ; jmpq afdf <_sk_load_g8_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -10273,7 +10463,7 @@ _sk_load_g8_avx LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,40,255,255,255 ; jmpq acaf <_sk_load_g8_avx+0x1f>
+ DB 233,40,255,255,255 ; jmpq afdf <_sk_load_g8_avx+0x1f>
DB 144 ; nop
DB 145 ; xchg %eax,%ecx
DB 255 ; (bad)
@@ -10282,7 +10472,7 @@ _sk_load_g8_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf00ad98 <_sk_overlay_sse2_8bit+0xffffffffdefdfc77>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf00b0c8 <_sk_overlay_sse2_8bit+0xffffffffdefdf9bb>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -10303,18 +10493,18 @@ _sk_load_g8_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne ae05 <_sk_load_g8_dst_avx+0x61>
+ DB 117,72 ; jne b135 <_sk_load_g8_dst_avx+0x61>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,101,17,2,0 ; vpand 0x21165(%rip),%xmm4,%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 197,217,219,37,21,20,2,0 ; vpand 0x21415(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,25,8,2,0 ; vbroadcastss 0x20819(%rip),%ymm5 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,45,213,10,2,0 ; vbroadcastss 0x20ad5(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,150,7,2,0 ; vbroadcastss 0x20796(%rip),%ymm7 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,61,82,10,2,0 ; vbroadcastss 0x20a52(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,236 ; vmovaps %ymm4,%ymm5
DB 197,252,40,244 ; vmovaps %ymm4,%ymm6
DB 91 ; pop %rbx
@@ -10324,15 +10514,15 @@ _sk_load_g8_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,170 ; ja adc3 <_sk_load_g8_dst_avx+0x1f>
+ DB 119,170 ; ja b0f3 <_sk_load_g8_dst_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # ae9c <_sk_load_g8_dst_avx+0xf8>
+ DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # b1cc <_sk_load_g8_dst_avx+0xf8>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,139 ; jmp adc3 <_sk_load_g8_dst_avx+0x1f>
+ DB 235,139 ; jmp b0f3 <_sk_load_g8_dst_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -10340,7 +10530,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,99,255,255,255 ; jmpq adc3 <_sk_load_g8_dst_avx+0x1f>
+ DB 233,99,255,255,255 ; jmpq b0f3 <_sk_load_g8_dst_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -10351,7 +10541,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,40,255,255,255 ; jmpq adc3 <_sk_load_g8_dst_avx+0x1f>
+ DB 233,40,255,255,255 ; jmpq b0f3 <_sk_load_g8_dst_avx+0x1f>
DB 144 ; nop
DB 145 ; xchg %eax,%ecx
DB 255 ; (bad)
@@ -10360,7 +10550,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf00aeac <_sk_overlay_sse2_8bit+0xffffffffdefdfd8b>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf00b1dc <_sk_overlay_sse2_8bit+0xffffffffdefdfacf>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -10413,10 +10603,10 @@ _sk_gather_g8_avx LABEL PROC
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,128,6,2,0 ; vbroadcastss 0x20680(%rip),%ymm1 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,60,9,2,0 ; vbroadcastss 0x2093c(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,253,5,2,0 ; vbroadcastss 0x205fd(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,185,8,2,0 ; vbroadcastss 0x208b9(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -10432,29 +10622,29 @@ _sk_load_565_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,129,0,0,0 ; jne b03e <_sk_load_565_avx+0xa1>
+ DB 15,133,129,0,0,0 ; jne b36e <_sk_load_565_avx+0xa1>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,41,6,2,0 ; vbroadcastss 0x20629(%rip),%ymm0 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,24,5,229,8,2,0 ; vbroadcastss 0x208e5(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,28,6,2,0 ; vbroadcastss 0x2061c(%rip),%ymm1 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,13,216,8,2,0 ; vbroadcastss 0x208d8(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,19,6,2,0 ; vbroadcastss 0x20613(%rip),%ymm1 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,24,13,207,8,2,0 ; vbroadcastss 0x208cf(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,6,6,2,0 ; vbroadcastss 0x20606(%rip),%ymm3 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,29,194,8,2,0 ; vbroadcastss 0x208c2(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,253,5,2,0 ; vbroadcastss 0x205fd(%rip),%ymm3 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,24,29,185,8,2,0 ; vbroadcastss 0x208b9(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,240,5,2,0 ; vbroadcastss 0x205f0(%rip),%ymm3 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,29,172,8,2,0 ; vbroadcastss 0x208ac(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,85,5,2,0 ; vbroadcastss 0x20555(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,17,8,2,0 ; vbroadcastss 0x20811(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -10462,27 +10652,27 @@ _sk_load_565_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,109,255,255,255 ; ja afc3 <_sk_load_565_avx+0x26>
+ DB 15,135,109,255,255,255 ; ja b2f3 <_sk_load_565_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # b0c4 <_sk_load_565_avx+0x127>
+ DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # b3f4 <_sk_load_565_avx+0x127>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,75,255,255,255 ; jmpq afc3 <_sk_load_565_avx+0x26>
+ DB 233,75,255,255,255 ; jmpq b2f3 <_sk_load_565_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,46,255,255,255 ; jmpq afc3 <_sk_load_565_avx+0x26>
+ DB 233,46,255,255,255 ; jmpq b2f3 <_sk_load_565_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,1,255,255,255 ; jmpq afc3 <_sk_load_565_avx+0x26>
+ DB 233,1,255,255,255 ; jmpq b2f3 <_sk_load_565_avx+0x26>
DB 102,144 ; xchg %ax,%ax
DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -10514,29 +10704,29 @@ _sk_load_565_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,129,0,0,0 ; jne b181 <_sk_load_565_dst_avx+0xa1>
+ DB 15,133,129,0,0,0 ; jne b4b1 <_sk_load_565_dst_avx+0xa1>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,245,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- DB 196,226,125,24,37,230,4,2,0 ; vbroadcastss 0x204e6(%rip),%ymm4 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,24,37,162,7,2,0 ; vbroadcastss 0x207a2(%rip),%ymm4 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,204,84,228 ; vandps %ymm4,%ymm6,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,217,4,2,0 ; vbroadcastss 0x204d9(%rip),%ymm5 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,45,149,7,2,0 ; vbroadcastss 0x20795(%rip),%ymm5 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,24,45,208,4,2,0 ; vbroadcastss 0x204d0(%rip),%ymm5 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,24,45,140,7,2,0 ; vbroadcastss 0x2078c(%rip),%ymm5 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 197,204,84,237 ; vandps %ymm5,%ymm6,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,61,195,4,2,0 ; vbroadcastss 0x204c3(%rip),%ymm7 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,61,127,7,2,0 ; vbroadcastss 0x2077f(%rip),%ymm7 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5
- DB 196,226,125,24,61,186,4,2,0 ; vbroadcastss 0x204ba(%rip),%ymm7 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,24,61,118,7,2,0 ; vbroadcastss 0x20776(%rip),%ymm7 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,204,84,247 ; vandps %ymm7,%ymm6,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,226,125,24,61,173,4,2,0 ; vbroadcastss 0x204ad(%rip),%ymm7 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,61,105,7,2,0 ; vbroadcastss 0x20769(%rip),%ymm7 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,18,4,2,0 ; vbroadcastss 0x20412(%rip),%ymm7 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,61,206,6,2,0 ; vbroadcastss 0x206ce(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -10544,27 +10734,27 @@ _sk_load_565_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,109,255,255,255 ; ja b106 <_sk_load_565_dst_avx+0x26>
+ DB 15,135,109,255,255,255 ; ja b436 <_sk_load_565_dst_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b208 <_sk_load_565_dst_avx+0x128>
+ DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b538 <_sk_load_565_dst_avx+0x128>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,75,255,255,255 ; jmpq b106 <_sk_load_565_dst_avx+0x26>
+ DB 233,75,255,255,255 ; jmpq b436 <_sk_load_565_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,46,255,255,255 ; jmpq b106 <_sk_load_565_dst_avx+0x26>
+ DB 233,46,255,255,255 ; jmpq b436 <_sk_load_565_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,1,255,255,255 ; jmpq b106 <_sk_load_565_dst_avx+0x26>
+ DB 233,1,255,255,255 ; jmpq b436 <_sk_load_565_dst_avx+0x26>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -10634,23 +10824,23 @@ _sk_gather_565_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,18,3,2,0 ; vbroadcastss 0x20312(%rip),%ymm0 # 2b608 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,24,5,206,5,2,0 ; vbroadcastss 0x205ce(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,5,3,2,0 ; vbroadcastss 0x20305(%rip),%ymm1 # 2b60c <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,13,193,5,2,0 ; vbroadcastss 0x205c1(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,252,2,2,0 ; vbroadcastss 0x202fc(%rip),%ymm1 # 2b610 <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,24,13,184,5,2,0 ; vbroadcastss 0x205b8(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,239,2,2,0 ; vbroadcastss 0x202ef(%rip),%ymm3 # 2b614 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,29,171,5,2,0 ; vbroadcastss 0x205ab(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,230,2,2,0 ; vbroadcastss 0x202e6(%rip),%ymm3 # 2b618 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,24,29,162,5,2,0 ; vbroadcastss 0x205a2(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,217,2,2,0 ; vbroadcastss 0x202d9(%rip),%ymm3 # 2b61c <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,29,149,5,2,0 ; vbroadcastss 0x20595(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,62,2,2,0 ; vbroadcastss 0x2023e(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,250,4,2,0 ; vbroadcastss 0x204fa(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_avx
@@ -10663,14 +10853,14 @@ _sk_store_565_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,8,3,2,0 ; vbroadcastss 0x20308(%rip),%ymm8 # 2b67c <_sk_overlay_sse2_8bit+0x55b>
+ DB 196,98,125,24,5,196,5,2,0 ; vbroadcastss 0x205c4(%rip),%ymm8 # 2bc68 <_sk_overlay_sse2_8bit+0x55b>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,11 ; vpslld $0xb,%xmm9,%xmm10
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
DB 196,193,49,114,241,11 ; vpslld $0xb,%xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- DB 196,98,125,24,21,225,2,2,0 ; vbroadcastss 0x202e1(%rip),%ymm10 # 2b680 <_sk_overlay_sse2_8bit+0x55f>
+ DB 196,98,125,24,21,157,5,2,0 ; vbroadcastss 0x2059d(%rip),%ymm10 # 2bc6c <_sk_overlay_sse2_8bit+0x55f>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,33,114,242,5 ; vpslld $0x5,%xmm10,%xmm11
@@ -10684,7 +10874,7 @@ _sk_store_565_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne b3f0 <_sk_store_565_avx+0x9c>
+ DB 117,11 ; jne b720 <_sk_store_565_avx+0x9c>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10693,22 +10883,22 @@ _sk_store_565_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja b3eb <_sk_store_565_avx+0x97>
+ DB 119,235 ; ja b71b <_sk_store_565_avx+0x97>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,69,0,0,0 ; lea 0x45(%rip),%r11 # b450 <_sk_store_565_avx+0xfc>
+ DB 76,141,29,69,0,0,0 ; lea 0x45(%rip),%r11 # b780 <_sk_store_565_avx+0xfc>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp b3eb <_sk_store_565_avx+0x97>
+ DB 235,206 ; jmp b71b <_sk_store_565_avx+0x97>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp b3eb <_sk_store_565_avx+0x97>
+ DB 235,190 ; jmp b71b <_sk_store_565_avx+0x97>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp b3eb <_sk_store_565_avx+0x97>
+ DB 235,158 ; jmp b71b <_sk_store_565_avx+0x97>
DB 15,31,0 ; nopl (%rax)
DB 196 ; (bad)
DB 255 ; (bad)
@@ -10745,31 +10935,31 @@ _sk_load_4444_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,153,0,0,0 ; jne b525 <_sk_load_4444_avx+0xb9>
+ DB 15,133,153,0,0,0 ; jne b855 <_sk_load_4444_avx+0xb9>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,214,1,2,0 ; vbroadcastss 0x201d6(%rip),%ymm0 # 2b684 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,24,5,146,4,2,0 ; vbroadcastss 0x20492(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,201,1,2,0 ; vbroadcastss 0x201c9(%rip),%ymm1 # 2b688 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,13,133,4,2,0 ; vbroadcastss 0x20485(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,192,1,2,0 ; vbroadcastss 0x201c0(%rip),%ymm1 # 2b68c <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,24,13,124,4,2,0 ; vbroadcastss 0x2047c(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,179,1,2,0 ; vbroadcastss 0x201b3(%rip),%ymm2 # 2b690 <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,21,111,4,2,0 ; vbroadcastss 0x2046f(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,170,1,2,0 ; vbroadcastss 0x201aa(%rip),%ymm2 # 2b694 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,24,21,102,4,2,0 ; vbroadcastss 0x20466(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,157,1,2,0 ; vbroadcastss 0x2019d(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,89,4,2,0 ; vbroadcastss 0x20459(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,147,1,2,0 ; vbroadcastss 0x20193(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,24,5,79,4,2,0 ; vbroadcastss 0x2044f(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,133,1,2,0 ; vbroadcastss 0x20185(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,65,4,2,0 ; vbroadcastss 0x20441(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10779,27 +10969,27 @@ _sk_load_4444_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,85,255,255,255 ; ja b492 <_sk_load_4444_avx+0x26>
+ DB 15,135,85,255,255,255 ; ja b7c2 <_sk_load_4444_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b5ac <_sk_load_4444_avx+0x140>
+ DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b8dc <_sk_load_4444_avx+0x140>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,51,255,255,255 ; jmpq b492 <_sk_load_4444_avx+0x26>
+ DB 233,51,255,255,255 ; jmpq b7c2 <_sk_load_4444_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,22,255,255,255 ; jmpq b492 <_sk_load_4444_avx+0x26>
+ DB 233,22,255,255,255 ; jmpq b7c2 <_sk_load_4444_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,233,254,255,255 ; jmpq b492 <_sk_load_4444_avx+0x26>
+ DB 233,233,254,255,255 ; jmpq b7c2 <_sk_load_4444_avx+0x26>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -10834,31 +11024,31 @@ _sk_load_4444_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,153,0,0,0 ; jne b681 <_sk_load_4444_dst_avx+0xb9>
+ DB 15,133,153,0,0,0 ; jne b9b1 <_sk_load_4444_dst_avx+0xb9>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,253,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- DB 196,226,125,24,37,122,0,2,0 ; vbroadcastss 0x2007a(%rip),%ymm4 # 2b684 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,24,37,54,3,2,0 ; vbroadcastss 0x20336(%rip),%ymm4 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
DB 197,196,84,228 ; vandps %ymm4,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,109,0,2,0 ; vbroadcastss 0x2006d(%rip),%ymm5 # 2b688 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,45,41,3,2,0 ; vbroadcastss 0x20329(%rip),%ymm5 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,24,45,100,0,2,0 ; vbroadcastss 0x20064(%rip),%ymm5 # 2b68c <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,24,45,32,3,2,0 ; vbroadcastss 0x20320(%rip),%ymm5 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
DB 197,196,84,237 ; vandps %ymm5,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,53,87,0,2,0 ; vbroadcastss 0x20057(%rip),%ymm6 # 2b690 <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,53,19,3,2,0 ; vbroadcastss 0x20313(%rip),%ymm6 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5
- DB 196,226,125,24,53,78,0,2,0 ; vbroadcastss 0x2004e(%rip),%ymm6 # 2b694 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,24,53,10,3,2,0 ; vbroadcastss 0x2030a(%rip),%ymm6 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
DB 197,196,84,246 ; vandps %ymm6,%ymm7,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,98,125,24,5,65,0,2,0 ; vbroadcastss 0x20041(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,253,2,2,0 ; vbroadcastss 0x202fd(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
- DB 196,98,125,24,5,55,0,2,0 ; vbroadcastss 0x20037(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,24,5,243,2,2,0 ; vbroadcastss 0x202f3(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,68,84,248 ; vandps %ymm8,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,41,0,2,0 ; vbroadcastss 0x20029(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,229,2,2,0 ; vbroadcastss 0x202e5(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10868,27 +11058,27 @@ _sk_load_4444_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,85,255,255,255 ; ja b5ee <_sk_load_4444_dst_avx+0x26>
+ DB 15,135,85,255,255,255 ; ja b91e <_sk_load_4444_dst_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b708 <_sk_load_4444_dst_avx+0x140>
+ DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # ba38 <_sk_load_4444_dst_avx+0x140>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,51,255,255,255 ; jmpq b5ee <_sk_load_4444_dst_avx+0x26>
+ DB 233,51,255,255,255 ; jmpq b91e <_sk_load_4444_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,22,255,255,255 ; jmpq b5ee <_sk_load_4444_dst_avx+0x26>
+ DB 233,22,255,255,255 ; jmpq b91e <_sk_load_4444_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,233,254,255,255 ; jmpq b5ee <_sk_load_4444_dst_avx+0x26>
+ DB 233,233,254,255,255 ; jmpq b91e <_sk_load_4444_dst_avx+0x26>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -10958,25 +11148,25 @@ _sk_gather_4444_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,142,254,1,0 ; vbroadcastss 0x1fe8e(%rip),%ymm0 # 2b684 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,24,5,74,1,2,0 ; vbroadcastss 0x2014a(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,129,254,1,0 ; vbroadcastss 0x1fe81(%rip),%ymm1 # 2b688 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,13,61,1,2,0 ; vbroadcastss 0x2013d(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,120,254,1,0 ; vbroadcastss 0x1fe78(%rip),%ymm1 # 2b68c <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,24,13,52,1,2,0 ; vbroadcastss 0x20134(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,107,254,1,0 ; vbroadcastss 0x1fe6b(%rip),%ymm2 # 2b690 <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,21,39,1,2,0 ; vbroadcastss 0x20127(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,98,254,1,0 ; vbroadcastss 0x1fe62(%rip),%ymm2 # 2b694 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,24,21,30,1,2,0 ; vbroadcastss 0x2011e(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,85,254,1,0 ; vbroadcastss 0x1fe55(%rip),%ymm8 # 2b698 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,17,1,2,0 ; vbroadcastss 0x20111(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,75,254,1,0 ; vbroadcastss 0x1fe4b(%rip),%ymm8 # 2b69c <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,24,5,7,1,2,0 ; vbroadcastss 0x20107(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,61,254,1,0 ; vbroadcastss 0x1fe3d(%rip),%ymm8 # 2b6a0 <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,249,0,2,0 ; vbroadcastss 0x200f9(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10991,7 +11181,7 @@ _sk_store_4444_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,24,254,1,0 ; vbroadcastss 0x1fe18(%rip),%ymm8 # 2b6a4 <_sk_overlay_sse2_8bit+0x583>
+ DB 196,98,125,24,5,212,0,2,0 ; vbroadcastss 0x200d4(%rip),%ymm8 # 2bc90 <_sk_overlay_sse2_8bit+0x583>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,12 ; vpslld $0xc,%xmm9,%xmm10
@@ -11018,7 +11208,7 @@ _sk_store_4444_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne b926 <_sk_store_4444_avx+0xba>
+ DB 117,11 ; jne bc56 <_sk_store_4444_avx+0xba>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -11027,22 +11217,22 @@ _sk_store_4444_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja b921 <_sk_store_4444_avx+0xb5>
+ DB 119,235 ; ja bc51 <_sk_store_4444_avx+0xb5>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,67,0,0,0 ; lea 0x43(%rip),%r11 # b984 <_sk_store_4444_avx+0x118>
+ DB 76,141,29,67,0,0,0 ; lea 0x43(%rip),%r11 # bcb4 <_sk_store_4444_avx+0x118>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp b921 <_sk_store_4444_avx+0xb5>
+ DB 235,206 ; jmp bc51 <_sk_store_4444_avx+0xb5>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp b921 <_sk_store_4444_avx+0xb5>
+ DB 235,190 ; jmp bc51 <_sk_store_4444_avx+0xb5>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp b921 <_sk_store_4444_avx+0xb5>
+ DB 235,158 ; jmp bc51 <_sk_store_4444_avx+0xb5>
DB 144 ; nop
DB 198 ; (bad)
DB 255 ; (bad)
@@ -11079,12 +11269,12 @@ _sk_load_8888_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,136,0,0,0 ; jne ba49 <_sk_load_8888_avx+0xa9>
+ DB 15,133,136,0,0,0 ; jne bd79 <_sk_load_8888_avx+0xa9>
DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9
- DB 197,125,40,21,177,0,2,0 ; vmovapd 0x200b1(%rip),%ymm10 # 2ba80 <_sk_overlay_sse2_8bit+0x95f>
+ DB 197,125,40,21,97,3,2,0 ; vmovapd 0x20361(%rip),%ymm10 # 2c060 <_sk_overlay_sse2_8bit+0x953>
DB 196,193,53,84,194 ; vandpd %ymm10,%ymm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,35,252,1,0 ; vbroadcastss 0x1fc23(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,223,254,1,0 ; vbroadcastss 0x1fedf(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,193,113,114,209,8 ; vpsrld $0x8,%xmm9,%xmm1
DB 196,99,125,25,203,1 ; vextractf128 $0x1,%ymm9,%xmm3
@@ -11112,21 +11302,21 @@ _sk_load_8888_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,101,255,255,255 ; ja b9c7 <_sk_load_8888_avx+0x27>
+ DB 15,135,101,255,255,255 ; ja bcf7 <_sk_load_8888_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # bb00 <_sk_load_8888_avx+0x160>
+ DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # be30 <_sk_load_8888_avx+0x160>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9
- DB 233,70,255,255,255 ; jmpq b9c7 <_sk_load_8888_avx+0x27>
+ DB 233,70,255,255,255 ; jmpq bcf7 <_sk_load_8888_avx+0x27>
DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,99,117,12,200,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm9
DB 196,193,123,16,4,153 ; vmovsd (%r9,%rbx,4),%xmm0
DB 196,99,53,13,200,1 ; vblendpd $0x1,%ymm0,%ymm9,%ymm9
- DB 233,31,255,255,255 ; jmpq b9c7 <_sk_load_8888_avx+0x27>
+ DB 233,31,255,255,255 ; jmpq bcf7 <_sk_load_8888_avx+0x27>
DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -11140,9 +11330,9 @@ _sk_load_8888_avx LABEL PROC
DB 196,99,53,24,200,1 ; vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
DB 196,193,121,16,4,153 ; vmovupd (%r9,%rbx,4),%xmm0
DB 196,67,125,13,201,12 ; vblendpd $0xc,%ymm9,%ymm0,%ymm9
- DB 233,202,254,255,255 ; jmpq b9c7 <_sk_load_8888_avx+0x27>
+ DB 233,202,254,255,255 ; jmpq bcf7 <_sk_load_8888_avx+0x27>
DB 15,31,0 ; nopl (%rax)
- DB 118,255 ; jbe bb01 <_sk_load_8888_avx+0x161>
+ DB 118,255 ; jbe be31 <_sk_load_8888_avx+0x161>
DB 255 ; (bad)
DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi)
DB 255 ; (bad)
@@ -11173,12 +11363,12 @@ _sk_load_8888_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,136,0,0,0 ; jne bbc5 <_sk_load_8888_dst_avx+0xa9>
+ DB 15,133,136,0,0,0 ; jne bef5 <_sk_load_8888_dst_avx+0xa9>
DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9
- DB 197,125,40,21,85,255,1,0 ; vmovapd 0x1ff55(%rip),%ymm10 # 2baa0 <_sk_overlay_sse2_8bit+0x97f>
+ DB 197,125,40,21,5,2,2,0 ; vmovapd 0x20205(%rip),%ymm10 # 2c080 <_sk_overlay_sse2_8bit+0x973>
DB 196,193,53,84,226 ; vandpd %ymm10,%ymm9,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,167,250,1,0 ; vbroadcastss 0x1faa7(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,99,253,1,0 ; vbroadcastss 0x1fd63(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
DB 196,193,81,114,209,8 ; vpsrld $0x8,%xmm9,%xmm5
DB 196,99,125,25,207,1 ; vextractf128 $0x1,%ymm9,%xmm7
@@ -11206,21 +11396,21 @@ _sk_load_8888_dst_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,101,255,255,255 ; ja bb43 <_sk_load_8888_dst_avx+0x27>
+ DB 15,135,101,255,255,255 ; ja be73 <_sk_load_8888_dst_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # bc7c <_sk_load_8888_dst_avx+0x160>
+ DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # bfac <_sk_load_8888_dst_avx+0x160>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9
- DB 233,70,255,255,255 ; jmpq bb43 <_sk_load_8888_dst_avx+0x27>
+ DB 233,70,255,255,255 ; jmpq be73 <_sk_load_8888_dst_avx+0x27>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
DB 196,99,85,12,204,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm9
DB 196,193,123,16,36,153 ; vmovsd (%r9,%rbx,4),%xmm4
DB 196,99,53,13,204,1 ; vblendpd $0x1,%ymm4,%ymm9,%ymm9
- DB 233,31,255,255,255 ; jmpq bb43 <_sk_load_8888_dst_avx+0x27>
+ DB 233,31,255,255,255 ; jmpq be73 <_sk_load_8888_dst_avx+0x27>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -11234,9 +11424,9 @@ _sk_load_8888_dst_avx LABEL PROC
DB 196,99,53,24,204,1 ; vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
DB 196,193,121,16,36,153 ; vmovupd (%r9,%rbx,4),%xmm4
DB 196,67,93,13,201,12 ; vblendpd $0xc,%ymm9,%ymm4,%ymm9
- DB 233,202,254,255,255 ; jmpq bb43 <_sk_load_8888_dst_avx+0x27>
+ DB 233,202,254,255,255 ; jmpq be73 <_sk_load_8888_dst_avx+0x27>
DB 15,31,0 ; nopl (%rax)
- DB 118,255 ; jbe bc7d <_sk_load_8888_dst_avx+0x161>
+ DB 118,255 ; jbe bfad <_sk_load_8888_dst_avx+0x161>
DB 255 ; (bad)
DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi)
DB 255 ; (bad)
@@ -11291,10 +11481,10 @@ _sk_gather_8888_avx LABEL PROC
DB 73,193,234,32 ; shr $0x20,%r10
DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,21,125,253,1,0 ; vmovaps 0x1fd7d(%rip),%ymm10 # 2bac0 <_sk_overlay_sse2_8bit+0x99f>
+ DB 197,124,40,21,45,0,2,0 ; vmovaps 0x2002d(%rip),%ymm10 # 2c0a0 <_sk_overlay_sse2_8bit+0x993>
DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,175,248,1,0 ; vbroadcastss 0x1f8af(%rip),%ymm9 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,107,251,1,0 ; vbroadcastss 0x1fb6b(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1
DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2
@@ -11326,7 +11516,7 @@ _sk_store_8888_avx LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,229,247,1,0 ; vbroadcastss 0x1f7e5(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,161,250,1,0 ; vbroadcastss 0x1faa1(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -11351,7 +11541,7 @@ _sk_store_8888_avx LABEL PROC
DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8
DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne be66 <_sk_store_8888_avx+0xb0>
+ DB 117,11 ; jne c196 <_sk_store_8888_avx+0xb0>
DB 196,65,124,17,4,153 ; vmovups %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -11360,17 +11550,17 @@ _sk_store_8888_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja be61 <_sk_store_8888_avx+0xab>
+ DB 119,235 ; ja c191 <_sk_store_8888_avx+0xab>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # bed4 <_sk_store_8888_avx+0x11e>
+ DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # c204 <_sk_store_8888_avx+0x11e>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,207 ; jmp be61 <_sk_store_8888_avx+0xab>
+ DB 235,207 ; jmp c191 <_sk_store_8888_avx+0xab>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 235,191 ; jmp be61 <_sk_store_8888_avx+0xab>
+ DB 235,191 ; jmp c191 <_sk_store_8888_avx+0xab>
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -11378,7 +11568,7 @@ _sk_store_8888_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,65,122,17,76,153,16 ; vmovss %xmm9,0x10(%r9,%rbx,4)
DB 196,65,121,17,4,153 ; vmovupd %xmm8,(%r9,%rbx,4)
- DB 235,142 ; jmp be61 <_sk_store_8888_avx+0xab>
+ DB 235,142 ; jmp c191 <_sk_store_8888_avx+0xab>
DB 144 ; nop
DB 182,255 ; mov $0xff,%dh
DB 255 ; (bad)
@@ -11412,12 +11602,12 @@ _sk_load_bgra_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,136,0,0,0 ; jne bf99 <_sk_load_bgra_avx+0xa9>
+ DB 15,133,136,0,0,0 ; jne c2c9 <_sk_load_bgra_avx+0xa9>
DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9
- DB 197,125,40,21,193,251,1,0 ; vmovapd 0x1fbc1(%rip),%ymm10 # 2bae0 <_sk_overlay_sse2_8bit+0x9bf>
+ DB 197,125,40,21,113,254,1,0 ; vmovapd 0x1fe71(%rip),%ymm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x9b3>
DB 196,193,53,84,202 ; vandpd %ymm10,%ymm9,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,98,125,24,5,211,246,1,0 ; vbroadcastss 0x1f6d3(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,143,249,1,0 ; vbroadcastss 0x1f98f(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,116,89,208 ; vmulps %ymm8,%ymm1,%ymm2
DB 196,193,113,114,209,8 ; vpsrld $0x8,%xmm9,%xmm1
DB 196,99,125,25,203,1 ; vextractf128 $0x1,%ymm9,%xmm3
@@ -11445,21 +11635,21 @@ _sk_load_bgra_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,101,255,255,255 ; ja bf17 <_sk_load_bgra_avx+0x27>
+ DB 15,135,101,255,255,255 ; ja c247 <_sk_load_bgra_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c050 <_sk_load_bgra_avx+0x160>
+ DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c380 <_sk_load_bgra_avx+0x160>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9
- DB 233,70,255,255,255 ; jmpq bf17 <_sk_load_bgra_avx+0x27>
+ DB 233,70,255,255,255 ; jmpq c247 <_sk_load_bgra_avx+0x27>
DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,99,117,12,200,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm9
DB 196,193,123,16,4,153 ; vmovsd (%r9,%rbx,4),%xmm0
DB 196,99,53,13,200,1 ; vblendpd $0x1,%ymm0,%ymm9,%ymm9
- DB 233,31,255,255,255 ; jmpq bf17 <_sk_load_bgra_avx+0x27>
+ DB 233,31,255,255,255 ; jmpq c247 <_sk_load_bgra_avx+0x27>
DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -11473,9 +11663,9 @@ _sk_load_bgra_avx LABEL PROC
DB 196,99,53,24,200,1 ; vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
DB 196,193,121,16,4,153 ; vmovupd (%r9,%rbx,4),%xmm0
DB 196,67,125,13,201,12 ; vblendpd $0xc,%ymm9,%ymm0,%ymm9
- DB 233,202,254,255,255 ; jmpq bf17 <_sk_load_bgra_avx+0x27>
+ DB 233,202,254,255,255 ; jmpq c247 <_sk_load_bgra_avx+0x27>
DB 15,31,0 ; nopl (%rax)
- DB 118,255 ; jbe c051 <_sk_load_bgra_avx+0x161>
+ DB 118,255 ; jbe c381 <_sk_load_bgra_avx+0x161>
DB 255 ; (bad)
DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi)
DB 255 ; (bad)
@@ -11506,12 +11696,12 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,136,0,0,0 ; jne c115 <_sk_load_bgra_dst_avx+0xa9>
+ DB 15,133,136,0,0,0 ; jne c445 <_sk_load_bgra_dst_avx+0xa9>
DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9
- DB 197,125,40,21,101,250,1,0 ; vmovapd 0x1fa65(%rip),%ymm10 # 2bb00 <_sk_overlay_sse2_8bit+0x9df>
+ DB 197,125,40,21,21,253,1,0 ; vmovapd 0x1fd15(%rip),%ymm10 # 2c0e0 <_sk_overlay_sse2_8bit+0x9d3>
DB 196,193,53,84,234 ; vandpd %ymm10,%ymm9,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,98,125,24,5,87,245,1,0 ; vbroadcastss 0x1f557(%rip),%ymm8 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,19,248,1,0 ; vbroadcastss 0x1f813(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,84,89,240 ; vmulps %ymm8,%ymm5,%ymm6
DB 196,193,81,114,209,8 ; vpsrld $0x8,%xmm9,%xmm5
DB 196,99,125,25,207,1 ; vextractf128 $0x1,%ymm9,%xmm7
@@ -11539,21 +11729,21 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,101,255,255,255 ; ja c093 <_sk_load_bgra_dst_avx+0x27>
+ DB 15,135,101,255,255,255 ; ja c3c3 <_sk_load_bgra_dst_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c1cc <_sk_load_bgra_dst_avx+0x160>
+ DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c4fc <_sk_load_bgra_dst_avx+0x160>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9
- DB 233,70,255,255,255 ; jmpq c093 <_sk_load_bgra_dst_avx+0x27>
+ DB 233,70,255,255,255 ; jmpq c3c3 <_sk_load_bgra_dst_avx+0x27>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
DB 196,99,85,12,204,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm9
DB 196,193,123,16,36,153 ; vmovsd (%r9,%rbx,4),%xmm4
DB 196,99,53,13,204,1 ; vblendpd $0x1,%ymm4,%ymm9,%ymm9
- DB 233,31,255,255,255 ; jmpq c093 <_sk_load_bgra_dst_avx+0x27>
+ DB 233,31,255,255,255 ; jmpq c3c3 <_sk_load_bgra_dst_avx+0x27>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -11567,9 +11757,9 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 196,99,53,24,204,1 ; vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
DB 196,193,121,16,36,153 ; vmovupd (%r9,%rbx,4),%xmm4
DB 196,67,93,13,201,12 ; vblendpd $0xc,%ymm9,%ymm4,%ymm9
- DB 233,202,254,255,255 ; jmpq c093 <_sk_load_bgra_dst_avx+0x27>
+ DB 233,202,254,255,255 ; jmpq c3c3 <_sk_load_bgra_dst_avx+0x27>
DB 15,31,0 ; nopl (%rax)
- DB 118,255 ; jbe c1cd <_sk_load_bgra_dst_avx+0x161>
+ DB 118,255 ; jbe c4fd <_sk_load_bgra_dst_avx+0x161>
DB 255 ; (bad)
DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi)
DB 255 ; (bad)
@@ -11624,10 +11814,10 @@ _sk_gather_bgra_avx LABEL PROC
DB 73,193,234,32 ; shr $0x20,%r10
DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,13,141,248,1,0 ; vmovaps 0x1f88d(%rip),%ymm9 # 2bb20 <_sk_overlay_sse2_8bit+0x9ff>
+ DB 197,124,40,13,61,251,1,0 ; vmovaps 0x1fb3d(%rip),%ymm9 # 2c100 <_sk_overlay_sse2_8bit+0x9f3>
DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,95,243,1,0 ; vbroadcastss 0x1f35f(%rip),%ymm10 # 2b604 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,21,27,246,1,0 ; vbroadcastss 0x1f61b(%rip),%ymm10 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,210 ; vmulps %ymm10,%ymm0,%ymm2
DB 196,193,121,114,208,8 ; vpsrld $0x8,%xmm8,%xmm0
DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1
@@ -11659,7 +11849,7 @@ _sk_store_bgra_avx LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,149,242,1,0 ; vbroadcastss 0x1f295(%rip),%ymm8 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,81,245,1,0 ; vbroadcastss 0x1f551(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -11684,7 +11874,7 @@ _sk_store_bgra_avx LABEL PROC
DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8
DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne c3b6 <_sk_store_bgra_avx+0xb0>
+ DB 117,11 ; jne c6e6 <_sk_store_bgra_avx+0xb0>
DB 196,65,124,17,4,153 ; vmovups %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -11693,17 +11883,17 @@ _sk_store_bgra_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja c3b1 <_sk_store_bgra_avx+0xab>
+ DB 119,235 ; ja c6e1 <_sk_store_bgra_avx+0xab>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # c424 <_sk_store_bgra_avx+0x11e>
+ DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # c754 <_sk_store_bgra_avx+0x11e>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,207 ; jmp c3b1 <_sk_store_bgra_avx+0xab>
+ DB 235,207 ; jmp c6e1 <_sk_store_bgra_avx+0xab>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 235,191 ; jmp c3b1 <_sk_store_bgra_avx+0xab>
+ DB 235,191 ; jmp c6e1 <_sk_store_bgra_avx+0xab>
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -11711,7 +11901,7 @@ _sk_store_bgra_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,65,122,17,76,153,16 ; vmovss %xmm9,0x10(%r9,%rbx,4)
DB 196,65,121,17,4,153 ; vmovupd %xmm8,(%r9,%rbx,4)
- DB 235,142 ; jmp c3b1 <_sk_store_bgra_avx+0xab>
+ DB 235,142 ; jmp c6e1 <_sk_store_bgra_avx+0xab>
DB 144 ; nop
DB 182,255 ; mov $0xff,%dh
DB 255 ; (bad)
@@ -11749,7 +11939,7 @@ _sk_load_f16_avx LABEL PROC
DB 197,252,17,116,36,64 ; vmovups %ymm6,0x40(%rsp)
DB 197,252,17,108,36,32 ; vmovups %ymm5,0x20(%rsp)
DB 197,254,127,36,36 ; vmovdqu %ymm4,(%rsp)
- DB 15,133,147,2,0,0 ; jne c711 <_sk_load_f16_avx+0x2d1>
+ DB 15,133,147,2,0,0 ; jne ca41 <_sk_load_f16_avx+0x2d1>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,84,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm2
DB 196,193,121,16,76,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm1
@@ -11767,13 +11957,13 @@ _sk_load_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,49,242,1,0 ; vbroadcastss 0x1f231(%rip),%ymm12 # 2b70c <_sk_overlay_sse2_8bit+0x5eb>
+ DB 196,98,125,24,37,237,244,1,0 ; vbroadcastss 0x1f4ed(%rip),%ymm12 # 2bcf8 <_sk_overlay_sse2_8bit+0x5eb>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,245,241,1,0 ; vbroadcastss 0x1f1f5(%rip),%xmm11 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,121,24,29,177,244,1,0 ; vbroadcastss 0x1f4b1(%rip),%xmm11 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,15,242,1,0 ; vbroadcastss 0x1f20f(%rip),%xmm13 # 2b710 <_sk_overlay_sse2_8bit+0x5ef>
+ DB 196,98,121,24,45,203,244,1,0 ; vbroadcastss 0x1f4cb(%rip),%xmm13 # 2bcfc <_sk_overlay_sse2_8bit+0x5ef>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -11787,7 +11977,7 @@ _sk_load_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,197,241,1,0 ; vbroadcastss 0x1f1c5(%rip),%xmm3 # 2b714 <_sk_overlay_sse2_8bit+0x5f3>
+ DB 196,226,121,24,29,129,244,1,0 ; vbroadcastss 0x1f481(%rip),%xmm3 # 2bd00 <_sk_overlay_sse2_8bit+0x5f3>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -11880,29 +12070,29 @@ _sk_load_f16_avx LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je c777 <_sk_load_f16_avx+0x337>
+ DB 116,85 ; je caa7 <_sk_load_f16_avx+0x337>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb c777 <_sk_load_f16_avx+0x337>
+ DB 114,72 ; jb caa7 <_sk_load_f16_avx+0x337>
DB 196,193,123,16,84,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je c784 <_sk_load_f16_avx+0x344>
+ DB 116,72 ; je cab4 <_sk_load_f16_avx+0x344>
DB 196,193,105,22,84,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb c784 <_sk_load_f16_avx+0x344>
+ DB 114,59 ; jb cab4 <_sk_load_f16_avx+0x344>
DB 196,193,123,16,76,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,63,253,255,255 ; je c499 <_sk_load_f16_avx+0x59>
+ DB 15,132,63,253,255,255 ; je c7c9 <_sk_load_f16_avx+0x59>
DB 196,193,113,22,76,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm1,%xmm1
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,46,253,255,255 ; jb c499 <_sk_load_f16_avx+0x59>
+ DB 15,130,46,253,255,255 ; jb c7c9 <_sk_load_f16_avx+0x59>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,34,253,255,255 ; jmpq c499 <_sk_load_f16_avx+0x59>
+ DB 233,34,253,255,255 ; jmpq c7c9 <_sk_load_f16_avx+0x59>
DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,21,253,255,255 ; jmpq c499 <_sk_load_f16_avx+0x59>
+ DB 233,21,253,255,255 ; jmpq c7c9 <_sk_load_f16_avx+0x59>
DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1
- DB 233,12,253,255,255 ; jmpq c499 <_sk_load_f16_avx+0x59>
+ DB 233,12,253,255,255 ; jmpq c7c9 <_sk_load_f16_avx+0x59>
PUBLIC _sk_load_f16_dst_avx
_sk_load_f16_dst_avx LABEL PROC
@@ -11919,7 +12109,7 @@ _sk_load_f16_dst_avx LABEL PROC
DB 197,252,17,84,36,64 ; vmovups %ymm2,0x40(%rsp)
DB 197,252,17,76,36,32 ; vmovups %ymm1,0x20(%rsp)
DB 197,254,127,4,36 ; vmovdqu %ymm0,(%rsp)
- DB 15,133,147,2,0,0 ; jne ca5e <_sk_load_f16_dst_avx+0x2d1>
+ DB 15,133,147,2,0,0 ; jne cd8e <_sk_load_f16_dst_avx+0x2d1>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,116,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm6
DB 196,193,121,16,108,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm5
@@ -11937,13 +12127,13 @@ _sk_load_f16_dst_avx LABEL PROC
DB 197,217,105,232 ; vpunpckhwd %xmm0,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- DB 196,98,125,24,37,228,238,1,0 ; vbroadcastss 0x1eee4(%rip),%ymm12 # 2b70c <_sk_overlay_sse2_8bit+0x5eb>
+ DB 196,98,125,24,37,160,241,1,0 ; vbroadcastss 0x1f1a0(%rip),%ymm12 # 2bcf8 <_sk_overlay_sse2_8bit+0x5eb>
DB 196,193,92,84,236 ; vandps %ymm12,%ymm4,%ymm5
DB 197,220,87,229 ; vxorps %ymm5,%ymm4,%ymm4
DB 196,195,125,25,230,1 ; vextractf128 $0x1,%ymm4,%xmm14
- DB 196,98,121,24,29,168,238,1,0 ; vbroadcastss 0x1eea8(%rip),%xmm11 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,121,24,29,100,241,1,0 ; vbroadcastss 0x1f164(%rip),%xmm11 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,8,87,251 ; vxorps %xmm11,%xmm14,%xmm7
- DB 196,98,121,24,45,194,238,1,0 ; vbroadcastss 0x1eec2(%rip),%xmm13 # 2b710 <_sk_overlay_sse2_8bit+0x5ef>
+ DB 196,98,121,24,45,126,241,1,0 ; vbroadcastss 0x1f17e(%rip),%xmm13 # 2bcfc <_sk_overlay_sse2_8bit+0x5ef>
DB 197,145,102,255 ; vpcmpgtd %xmm7,%xmm13,%xmm7
DB 196,65,88,87,211 ; vxorps %xmm11,%xmm4,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -11957,7 +12147,7 @@ _sk_load_f16_dst_avx LABEL PROC
DB 196,227,93,24,231,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
DB 197,220,86,229 ; vorps %ymm5,%ymm4,%ymm4
DB 196,227,125,25,229,1 ; vextractf128 $0x1,%ymm4,%xmm5
- DB 196,226,121,24,61,120,238,1,0 ; vbroadcastss 0x1ee78(%rip),%xmm7 # 2b714 <_sk_overlay_sse2_8bit+0x5f3>
+ DB 196,226,121,24,61,52,241,1,0 ; vbroadcastss 0x1f134(%rip),%xmm7 # 2bd00 <_sk_overlay_sse2_8bit+0x5f3>
DB 197,209,254,239 ; vpaddd %xmm7,%xmm5,%xmm5
DB 197,217,254,231 ; vpaddd %xmm7,%xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -12050,29 +12240,29 @@ _sk_load_f16_dst_avx LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je cac4 <_sk_load_f16_dst_avx+0x337>
+ DB 116,85 ; je cdf4 <_sk_load_f16_dst_avx+0x337>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb cac4 <_sk_load_f16_dst_avx+0x337>
+ DB 114,72 ; jb cdf4 <_sk_load_f16_dst_avx+0x337>
DB 196,193,123,16,116,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm6
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je cad1 <_sk_load_f16_dst_avx+0x344>
+ DB 116,72 ; je ce01 <_sk_load_f16_dst_avx+0x344>
DB 196,193,73,22,116,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb cad1 <_sk_load_f16_dst_avx+0x344>
+ DB 114,59 ; jb ce01 <_sk_load_f16_dst_avx+0x344>
DB 196,193,123,16,108,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm5
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,63,253,255,255 ; je c7e6 <_sk_load_f16_dst_avx+0x59>
+ DB 15,132,63,253,255,255 ; je cb16 <_sk_load_f16_dst_avx+0x59>
DB 196,193,81,22,108,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm5,%xmm5
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,46,253,255,255 ; jb c7e6 <_sk_load_f16_dst_avx+0x59>
+ DB 15,130,46,253,255,255 ; jb cb16 <_sk_load_f16_dst_avx+0x59>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,34,253,255,255 ; jmpq c7e6 <_sk_load_f16_dst_avx+0x59>
+ DB 233,34,253,255,255 ; jmpq cb16 <_sk_load_f16_dst_avx+0x59>
DB 197,209,87,237 ; vxorpd %xmm5,%xmm5,%xmm5
DB 197,201,87,246 ; vxorpd %xmm6,%xmm6,%xmm6
- DB 233,21,253,255,255 ; jmpq c7e6 <_sk_load_f16_dst_avx+0x59>
+ DB 233,21,253,255,255 ; jmpq cb16 <_sk_load_f16_dst_avx+0x59>
DB 197,209,87,237 ; vxorpd %xmm5,%xmm5,%xmm5
- DB 233,12,253,255,255 ; jmpq c7e6 <_sk_load_f16_dst_avx+0x59>
+ DB 233,12,253,255,255 ; jmpq cb16 <_sk_load_f16_dst_avx+0x59>
PUBLIC _sk_gather_f16_avx
_sk_gather_f16_avx LABEL PROC
@@ -12131,13 +12321,13 @@ _sk_gather_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,38,235,1,0 ; vbroadcastss 0x1eb26(%rip),%ymm12 # 2b70c <_sk_overlay_sse2_8bit+0x5eb>
+ DB 196,98,125,24,37,226,237,1,0 ; vbroadcastss 0x1ede2(%rip),%ymm12 # 2bcf8 <_sk_overlay_sse2_8bit+0x5eb>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,234,234,1,0 ; vbroadcastss 0x1eaea(%rip),%xmm11 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,121,24,29,166,237,1,0 ; vbroadcastss 0x1eda6(%rip),%xmm11 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,4,235,1,0 ; vbroadcastss 0x1eb04(%rip),%xmm13 # 2b710 <_sk_overlay_sse2_8bit+0x5ef>
+ DB 196,98,121,24,45,192,237,1,0 ; vbroadcastss 0x1edc0(%rip),%xmm13 # 2bcfc <_sk_overlay_sse2_8bit+0x5ef>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -12151,7 +12341,7 @@ _sk_gather_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,186,234,1,0 ; vbroadcastss 0x1eaba(%rip),%xmm3 # 2b714 <_sk_overlay_sse2_8bit+0x5f3>
+ DB 196,226,121,24,29,118,237,1,0 ; vbroadcastss 0x1ed76(%rip),%xmm3 # 2bd00 <_sk_overlay_sse2_8bit+0x5f3>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -12249,12 +12439,12 @@ _sk_store_f16_avx LABEL PROC
DB 197,252,17,180,36,128,0,0,0 ; vmovups %ymm6,0x80(%rsp)
DB 197,252,17,108,36,96 ; vmovups %ymm5,0x60(%rsp)
DB 197,252,17,100,36,64 ; vmovups %ymm4,0x40(%rsp)
- DB 196,98,125,24,13,158,232,1,0 ; vbroadcastss 0x1e89e(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,90,235,1,0 ; vbroadcastss 0x1eb5a(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,124,84,209 ; vandps %ymm9,%ymm0,%ymm10
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
DB 196,65,124,87,218 ; vxorps %ymm10,%ymm0,%ymm11
DB 196,67,125,25,220,1 ; vextractf128 $0x1,%ymm11,%xmm12
- DB 196,98,121,24,5,176,232,1,0 ; vbroadcastss 0x1e8b0(%rip),%xmm8 # 2b718 <_sk_overlay_sse2_8bit+0x5f7>
+ DB 196,98,121,24,5,108,235,1,0 ; vbroadcastss 0x1eb6c(%rip),%xmm8 # 2bd04 <_sk_overlay_sse2_8bit+0x5f7>
DB 196,65,57,102,236 ; vpcmpgtd %xmm12,%xmm8,%xmm13
DB 196,65,57,102,243 ; vpcmpgtd %xmm11,%xmm8,%xmm14
DB 196,67,13,24,237,1 ; vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -12264,7 +12454,7 @@ _sk_store_f16_avx LABEL PROC
DB 196,67,13,24,242,1 ; vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
DB 196,193,33,114,211,13 ; vpsrld $0xd,%xmm11,%xmm11
DB 196,193,25,114,212,13 ; vpsrld $0xd,%xmm12,%xmm12
- DB 196,98,125,24,21,119,232,1,0 ; vbroadcastss 0x1e877(%rip),%ymm10 # 2b71c <_sk_overlay_sse2_8bit+0x5fb>
+ DB 196,98,125,24,21,51,235,1,0 ; vbroadcastss 0x1eb33(%rip),%ymm10 # 2bd08 <_sk_overlay_sse2_8bit+0x5fb>
DB 196,65,12,86,242 ; vorps %ymm10,%ymm14,%ymm14
DB 196,67,125,25,247,1 ; vextractf128 $0x1,%ymm14,%xmm15
DB 196,65,1,254,228 ; vpaddd %xmm12,%xmm15,%xmm12
@@ -12351,7 +12541,7 @@ _sk_store_f16_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,79 ; jne d0a2 <_sk_store_f16_avx+0x286>
+ DB 117,79 ; jne d3d2 <_sk_store_f16_avx+0x286>
DB 196,65,120,17,28,193 ; vmovups %xmm11,(%r9,%rax,8)
DB 196,65,120,17,84,193,16 ; vmovups %xmm10,0x10(%r9,%rax,8)
DB 196,65,120,17,76,193,32 ; vmovups %xmm9,0x20(%r9,%rax,8)
@@ -12367,22 +12557,22 @@ _sk_store_f16_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,193 ; vmovq %xmm11,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,192 ; je d06e <_sk_store_f16_avx+0x252>
+ DB 116,192 ; je d39e <_sk_store_f16_avx+0x252>
DB 196,65,121,23,92,193,8 ; vmovhpd %xmm11,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,179 ; jb d06e <_sk_store_f16_avx+0x252>
+ DB 114,179 ; jb d39e <_sk_store_f16_avx+0x252>
DB 196,65,121,214,84,193,16 ; vmovq %xmm10,0x10(%r9,%rax,8)
- DB 116,170 ; je d06e <_sk_store_f16_avx+0x252>
+ DB 116,170 ; je d39e <_sk_store_f16_avx+0x252>
DB 196,65,121,23,84,193,24 ; vmovhpd %xmm10,0x18(%r9,%rax,8)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,157 ; jb d06e <_sk_store_f16_avx+0x252>
+ DB 114,157 ; jb d39e <_sk_store_f16_avx+0x252>
DB 196,65,121,214,76,193,32 ; vmovq %xmm9,0x20(%r9,%rax,8)
- DB 116,148 ; je d06e <_sk_store_f16_avx+0x252>
+ DB 116,148 ; je d39e <_sk_store_f16_avx+0x252>
DB 196,65,121,23,76,193,40 ; vmovhpd %xmm9,0x28(%r9,%rax,8)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,135 ; jb d06e <_sk_store_f16_avx+0x252>
+ DB 114,135 ; jb d39e <_sk_store_f16_avx+0x252>
DB 196,65,121,214,68,193,48 ; vmovq %xmm8,0x30(%r9,%rax,8)
- DB 233,123,255,255,255 ; jmpq d06e <_sk_store_f16_avx+0x252>
+ DB 233,123,255,255,255 ; jmpq d39e <_sk_store_f16_avx+0x252>
PUBLIC _sk_load_u16_be_avx
_sk_load_u16_be_avx LABEL PROC
@@ -12395,7 +12585,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,253,0,0,0 ; jne d217 <_sk_load_u16_be_avx+0x124>
+ DB 15,133,253,0,0,0 ; jne d547 <_sk_load_u16_be_avx+0x124>
DB 196,65,121,16,4,65 ; vmovupd (%r9,%rax,2),%xmm8
DB 196,193,121,16,84,65,16 ; vmovupd 0x10(%r9,%rax,2),%xmm2
DB 196,193,121,16,92,65,32 ; vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -12417,7 +12607,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,149,228,1,0 ; vbroadcastss 0x1e495(%rip),%ymm11 # 2b620 <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,98,125,24,29,81,231,1,0 ; vbroadcastss 0x1e751(%rip),%ymm11 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,177,109,202 ; vpunpckhqdq %xmm2,%xmm9,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -12451,29 +12641,29 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,65,123,16,4,65 ; vmovsd (%r9,%rax,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je d27d <_sk_load_u16_be_avx+0x18a>
+ DB 116,85 ; je d5ad <_sk_load_u16_be_avx+0x18a>
DB 196,65,57,22,68,65,8 ; vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb d27d <_sk_load_u16_be_avx+0x18a>
+ DB 114,72 ; jb d5ad <_sk_load_u16_be_avx+0x18a>
DB 196,193,123,16,84,65,16 ; vmovsd 0x10(%r9,%rax,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je d28a <_sk_load_u16_be_avx+0x197>
+ DB 116,72 ; je d5ba <_sk_load_u16_be_avx+0x197>
DB 196,193,105,22,84,65,24 ; vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb d28a <_sk_load_u16_be_avx+0x197>
+ DB 114,59 ; jb d5ba <_sk_load_u16_be_avx+0x197>
DB 196,193,123,16,92,65,32 ; vmovsd 0x20(%r9,%rax,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,213,254,255,255 ; je d135 <_sk_load_u16_be_avx+0x42>
+ DB 15,132,213,254,255,255 ; je d465 <_sk_load_u16_be_avx+0x42>
DB 196,193,97,22,92,65,40 ; vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,196,254,255,255 ; jb d135 <_sk_load_u16_be_avx+0x42>
+ DB 15,130,196,254,255,255 ; jb d465 <_sk_load_u16_be_avx+0x42>
DB 196,65,122,126,76,65,48 ; vmovq 0x30(%r9,%rax,2),%xmm9
- DB 233,184,254,255,255 ; jmpq d135 <_sk_load_u16_be_avx+0x42>
+ DB 233,184,254,255,255 ; jmpq d465 <_sk_load_u16_be_avx+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,171,254,255,255 ; jmpq d135 <_sk_load_u16_be_avx+0x42>
+ DB 233,171,254,255,255 ; jmpq d465 <_sk_load_u16_be_avx+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,162,254,255,255 ; jmpq d135 <_sk_load_u16_be_avx+0x42>
+ DB 233,162,254,255,255 ; jmpq d465 <_sk_load_u16_be_avx+0x42>
PUBLIC _sk_load_rgb_u16_be_avx
_sk_load_rgb_u16_be_avx LABEL PROC
@@ -12488,7 +12678,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,243,0,0,0 ; jne d3b1 <_sk_load_rgb_u16_be_avx+0x11e>
+ DB 15,133,243,0,0,0 ; jne d6e1 <_sk_load_rgb_u16_be_avx+0x11e>
DB 196,193,122,111,4,65 ; vmovdqu (%r9,%rax,2),%xmm0
DB 196,193,122,111,84,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm2
DB 196,193,122,111,76,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -12515,7 +12705,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,216,226,1,0 ; vbroadcastss 0x1e2d8(%rip),%ymm11 # 2b620 <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,98,125,24,29,148,229,1,0 ; vbroadcastss 0x1e594(%rip),%ymm11 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -12536,41 +12726,41 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,225,225,1,0 ; vbroadcastss 0x1e1e1(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,157,228,1,0 ; vbroadcastss 0x1e49d(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0
DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne d3ca <_sk_load_rgb_u16_be_avx+0x137>
- DB 233,40,255,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 117,5 ; jne d6fa <_sk_load_rgb_u16_be_avx+0x137>
+ DB 233,40,255,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
DB 196,193,121,110,76,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm1
DB 196,65,113,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb d3f9 <_sk_load_rgb_u16_be_avx+0x166>
+ DB 114,26 ; jb d729 <_sk_load_rgb_u16_be_avx+0x166>
DB 196,193,121,110,76,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm1
DB 196,193,113,196,84,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne d3fe <_sk_load_rgb_u16_be_avx+0x16b>
- DB 233,249,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 233,244,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 117,10 ; jne d72e <_sk_load_rgb_u16_be_avx+0x16b>
+ DB 233,249,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 233,244,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
DB 196,193,121,110,76,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm1
DB 196,65,113,196,76,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb d42d <_sk_load_rgb_u16_be_avx+0x19a>
+ DB 114,26 ; jb d75d <_sk_load_rgb_u16_be_avx+0x19a>
DB 196,193,121,110,76,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm1
DB 196,193,113,196,76,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne d432 <_sk_load_rgb_u16_be_avx+0x19f>
- DB 233,197,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 233,192,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 117,10 ; jne d762 <_sk_load_rgb_u16_be_avx+0x19f>
+ DB 233,197,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 233,192,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
DB 196,193,121,110,92,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm3
DB 196,65,97,196,92,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb d45b <_sk_load_rgb_u16_be_avx+0x1c8>
+ DB 114,20 ; jb d78b <_sk_load_rgb_u16_be_avx+0x1c8>
DB 196,193,121,110,92,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm3
DB 196,193,97,196,92,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- DB 233,151,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 233,146,254,255,255 ; jmpq d2f2 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 233,151,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 233,146,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
PUBLIC _sk_store_u16_be_avx
_sk_store_u16_be_avx LABEL PROC
@@ -12582,7 +12772,7 @@ _sk_store_u16_be_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 196,98,125,24,5,33,226,1,0 ; vbroadcastss 0x1e221(%rip),%ymm8 # 2b6a8 <_sk_overlay_sse2_8bit+0x587>
+ DB 196,98,125,24,5,221,228,1,0 ; vbroadcastss 0x1e4dd(%rip),%ymm8 # 2bc94 <_sk_overlay_sse2_8bit+0x587>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -12620,7 +12810,7 @@ _sk_store_u16_be_avx LABEL PROC
DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9
DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,31 ; jne d56b <_sk_store_u16_be_avx+0x10b>
+ DB 117,31 ; jne d89b <_sk_store_u16_be_avx+0x10b>
DB 196,65,120,17,28,65 ; vmovups %xmm11,(%r9,%rax,2)
DB 196,65,120,17,84,65,16 ; vmovups %xmm10,0x10(%r9,%rax,2)
DB 196,65,120,17,76,65,32 ; vmovups %xmm9,0x20(%r9,%rax,2)
@@ -12629,28 +12819,28 @@ _sk_store_u16_be_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,65 ; vmovq %xmm11,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je d567 <_sk_store_u16_be_avx+0x107>
+ DB 116,240 ; je d897 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,92,65,8 ; vmovhpd %xmm11,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb d567 <_sk_store_u16_be_avx+0x107>
+ DB 114,227 ; jb d897 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,84,65,16 ; vmovq %xmm10,0x10(%r9,%rax,2)
- DB 116,218 ; je d567 <_sk_store_u16_be_avx+0x107>
+ DB 116,218 ; je d897 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,84,65,24 ; vmovhpd %xmm10,0x18(%r9,%rax,2)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb d567 <_sk_store_u16_be_avx+0x107>
+ DB 114,205 ; jb d897 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,76,65,32 ; vmovq %xmm9,0x20(%r9,%rax,2)
- DB 116,196 ; je d567 <_sk_store_u16_be_avx+0x107>
+ DB 116,196 ; je d897 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,76,65,40 ; vmovhpd %xmm9,0x28(%r9,%rax,2)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,183 ; jb d567 <_sk_store_u16_be_avx+0x107>
+ DB 114,183 ; jb d897 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,68,65,48 ; vmovq %xmm8,0x30(%r9,%rax,2)
- DB 235,174 ; jmp d567 <_sk_store_u16_be_avx+0x107>
+ DB 235,174 ; jmp d897 <_sk_store_u16_be_avx+0x107>
PUBLIC _sk_load_f32_avx
_sk_load_f32_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja d645 <_sk_load_f32_avx+0x8c>
+ DB 15,135,128,0,0,0 ; ja d975 <_sk_load_f32_avx+0x8c>
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -12658,7 +12848,7 @@ _sk_load_f32_avx LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,135,0,0,0 ; lea 0x87(%rip),%r11 # d670 <_sk_load_f32_avx+0xb7>
+ DB 76,141,29,135,0,0,0 ; lea 0x87(%rip),%r11 # d9a0 <_sk_load_f32_avx+0xb7>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
@@ -12707,7 +12897,7 @@ PUBLIC _sk_load_f32_dst_avx
_sk_load_f32_dst_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja d71c <_sk_load_f32_dst_avx+0x8c>
+ DB 15,135,128,0,0,0 ; ja da4c <_sk_load_f32_dst_avx+0x8c>
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -12715,7 +12905,7 @@ _sk_load_f32_dst_avx LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # d744 <_sk_load_f32_dst_avx+0xb4>
+ DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # da74 <_sk_load_f32_dst_avx+0xb4>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
@@ -12777,7 +12967,7 @@ _sk_store_f32_avx LABEL PROC
DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8
DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11
DB 77,133,192 ; test %r8,%r8
- DB 117,55 ; jne d7e3 <_sk_store_f32_avx+0x7f>
+ DB 117,55 ; jne db13 <_sk_store_f32_avx+0x7f>
DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -12790,22 +12980,22 @@ _sk_store_f32_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,17,20,129 ; vmovupd %xmm10,(%r9,%rax,4)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je d7df <_sk_store_f32_avx+0x7b>
+ DB 116,240 ; je db0f <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,76,129,16 ; vmovupd %xmm9,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb d7df <_sk_store_f32_avx+0x7b>
+ DB 114,227 ; jb db0f <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,68,129,32 ; vmovupd %xmm8,0x20(%r9,%rax,4)
- DB 116,218 ; je d7df <_sk_store_f32_avx+0x7b>
+ DB 116,218 ; je db0f <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,92,129,48 ; vmovupd %xmm11,0x30(%r9,%rax,4)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb d7df <_sk_store_f32_avx+0x7b>
+ DB 114,205 ; jb db0f <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,84,129,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- DB 116,195 ; je d7df <_sk_store_f32_avx+0x7b>
+ DB 116,195 ; je db0f <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,76,129,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,181 ; jb d7df <_sk_store_f32_avx+0x7b>
+ DB 114,181 ; jb db0f <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,68,129,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- DB 235,171 ; jmp d7df <_sk_store_f32_avx+0x7b>
+ DB 235,171 ; jmp db0f <_sk_store_f32_avx+0x7b>
PUBLIC _sk_clamp_x_avx
_sk_clamp_x_avx LABEL PROC
@@ -12888,7 +13078,7 @@ _sk_mirror_x_avx LABEL PROC
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,99,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- DB 197,178,89,5,35,220,1,0 ; vmulss 0x1dc23(%rip),%xmm9,%xmm0 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 197,178,89,5,223,222,1,0 ; vmulss 0x1dedf(%rip),%xmm9,%xmm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
@@ -12920,7 +13110,7 @@ _sk_mirror_y_avx LABEL PROC
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,99,117,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- DB 197,178,89,13,150,219,1,0 ; vmulss 0x1db96(%rip),%xmm9,%xmm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 197,178,89,13,82,222,1,0 ; vmulss 0x1de52(%rip),%xmm9,%xmm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
@@ -12945,7 +13135,7 @@ PUBLIC _sk_clamp_x_1_avx
_sk_clamp_x_1_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,48,219,1,0 ; vbroadcastss 0x1db30(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,236,221,1,0 ; vbroadcastss 0x1ddec(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -12959,9 +13149,9 @@ _sk_repeat_x_1_avx LABEL PROC
PUBLIC _sk_mirror_x_1_avx
_sk_mirror_x_1_avx LABEL PROC
- DB 196,98,125,24,5,39,219,1,0 ; vbroadcastss 0x1db27(%rip),%ymm8 # 2b5a8 <_sk_overlay_sse2_8bit+0x487>
+ DB 196,98,125,24,5,227,221,1,0 ; vbroadcastss 0x1dde3(%rip),%ymm8 # 2bb94 <_sk_overlay_sse2_8bit+0x487>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,253,218,1,0 ; vbroadcastss 0x1dafd(%rip),%ymm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,13,185,221,1,0 ; vbroadcastss 0x1ddb9(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -12975,12 +13165,12 @@ _sk_mirror_x_1_avx LABEL PROC
PUBLIC _sk_luminance_to_alpha_avx
_sk_luminance_to_alpha_avx LABEL PROC
- DB 196,226,125,24,29,233,219,1,0 ; vbroadcastss 0x1dbe9(%rip),%ymm3 # 2b6ac <_sk_overlay_sse2_8bit+0x58b>
+ DB 196,226,125,24,29,165,222,1,0 ; vbroadcastss 0x1dea5(%rip),%ymm3 # 2bc98 <_sk_overlay_sse2_8bit+0x58b>
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,29,224,219,1,0 ; vbroadcastss 0x1dbe0(%rip),%ymm3 # 2b6b0 <_sk_overlay_sse2_8bit+0x58f>
+ DB 196,226,125,24,29,156,222,1,0 ; vbroadcastss 0x1de9c(%rip),%ymm3 # 2bc9c <_sk_overlay_sse2_8bit+0x58f>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,211,219,1,0 ; vbroadcastss 0x1dbd3(%rip),%ymm1 # 2b6b4 <_sk_overlay_sse2_8bit+0x593>
+ DB 196,226,125,24,13,143,222,1,0 ; vbroadcastss 0x1de8f(%rip),%ymm1 # 2bca0 <_sk_overlay_sse2_8bit+0x593>
DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1
DB 197,252,88,217 ; vaddps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13213,9 +13403,9 @@ _sk_evenly_spaced_gradient_avx LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 72,139,104,8 ; mov 0x8(%rax),%rbp
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js de88 <_sk_evenly_spaced_gradient_avx+0x28>
+ DB 120,7 ; js e1b8 <_sk_evenly_spaced_gradient_avx+0x28>
DB 196,225,242,42,203 ; vcvtsi2ss %rbx,%xmm1,%xmm1
- DB 235,21 ; jmp de9d <_sk_evenly_spaced_gradient_avx+0x3d>
+ DB 235,21 ; jmp e1cd <_sk_evenly_spaced_gradient_avx+0x3d>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -13372,18 +13562,18 @@ _sk_evenly_spaced_gradient_avx LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_avx
_sk_gauss_a_to_rgba_avx LABEL PROC
- DB 196,226,125,24,5,184,212,1,0 ; vbroadcastss 0x1d4b8(%rip),%ymm0 # 2b6bc <_sk_overlay_sse2_8bit+0x59b>
+ DB 196,226,125,24,5,116,215,1,0 ; vbroadcastss 0x1d774(%rip),%ymm0 # 2bca8 <_sk_overlay_sse2_8bit+0x59b>
DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
- DB 196,226,125,24,13,167,212,1,0 ; vbroadcastss 0x1d4a7(%rip),%ymm1 # 2b6b8 <_sk_overlay_sse2_8bit+0x597>
+ DB 196,226,125,24,13,99,215,1,0 ; vbroadcastss 0x1d763(%rip),%ymm1 # 2bca4 <_sk_overlay_sse2_8bit+0x597>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,158,212,1,0 ; vbroadcastss 0x1d49e(%rip),%ymm1 # 2b6c0 <_sk_overlay_sse2_8bit+0x59f>
+ DB 196,226,125,24,13,90,215,1,0 ; vbroadcastss 0x1d75a(%rip),%ymm1 # 2bcac <_sk_overlay_sse2_8bit+0x59f>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,145,212,1,0 ; vbroadcastss 0x1d491(%rip),%ymm1 # 2b6c4 <_sk_overlay_sse2_8bit+0x5a3>
+ DB 196,226,125,24,13,77,215,1,0 ; vbroadcastss 0x1d74d(%rip),%ymm1 # 2bcb0 <_sk_overlay_sse2_8bit+0x5a3>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,132,212,1,0 ; vbroadcastss 0x1d484(%rip),%ymm1 # 2b6c8 <_sk_overlay_sse2_8bit+0x5a7>
+ DB 196,226,125,24,13,64,215,1,0 ; vbroadcastss 0x1d740(%rip),%ymm1 # 2bcb4 <_sk_overlay_sse2_8bit+0x5a7>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -13405,12 +13595,12 @@ _sk_gradient_avx LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,80 ; jb e2ca <_sk_gradient_avx+0x72>
+ DB 114,80 ; jb e5fa <_sk_gradient_avx+0x72>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
- DB 196,98,125,24,21,1,211,1,0 ; vbroadcastss 0x1d301(%rip),%ymm10 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,24,21,189,213,1,0 ; vbroadcastss 0x1d5bd(%rip),%ymm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,98,125,24,3 ; vbroadcastss (%rbx),%ymm8
DB 197,60,194,192,2 ; vcmpleps %ymm0,%ymm8,%ymm8
@@ -13422,7 +13612,7 @@ _sk_gradient_avx LABEL PROC
DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,205 ; jne e297 <_sk_gradient_avx+0x3f>
+ DB 117,205 ; jne e5c7 <_sk_gradient_avx+0x3f>
DB 196,195,249,22,201,1 ; vpextrq $0x1,%xmm1,%r9
DB 69,137,202 ; mov %r9d,%r10d
DB 73,193,233,32 ; shr $0x20,%r9
@@ -13602,27 +13792,27 @@ _sk_xy_to_unit_angle_avx LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,40,208,1,0 ; vbroadcastss 0x1d028(%rip),%ymm13 # 2b6cc <_sk_overlay_sse2_8bit+0x5ab>
+ DB 196,98,125,24,45,228,210,1,0 ; vbroadcastss 0x1d2e4(%rip),%ymm13 # 2bcb8 <_sk_overlay_sse2_8bit+0x5ab>
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,30,208,1,0 ; vbroadcastss 0x1d01e(%rip),%ymm14 # 2b6d0 <_sk_overlay_sse2_8bit+0x5af>
+ DB 196,98,125,24,53,218,210,1,0 ; vbroadcastss 0x1d2da(%rip),%ymm14 # 2bcbc <_sk_overlay_sse2_8bit+0x5af>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,15,208,1,0 ; vbroadcastss 0x1d00f(%rip),%ymm14 # 2b6d4 <_sk_overlay_sse2_8bit+0x5b3>
+ DB 196,98,125,24,53,203,210,1,0 ; vbroadcastss 0x1d2cb(%rip),%ymm14 # 2bcc0 <_sk_overlay_sse2_8bit+0x5b3>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,229 ; vmulps %ymm13,%ymm12,%ymm12
- DB 196,98,125,24,45,0,208,1,0 ; vbroadcastss 0x1d000(%rip),%ymm13 # 2b6d8 <_sk_overlay_sse2_8bit+0x5b7>
+ DB 196,98,125,24,45,188,210,1,0 ; vbroadcastss 0x1d2bc(%rip),%ymm13 # 2bcc4 <_sk_overlay_sse2_8bit+0x5b7>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,235,207,1,0 ; vbroadcastss 0x1cfeb(%rip),%ymm10 # 2b6dc <_sk_overlay_sse2_8bit+0x5bb>
+ DB 196,98,125,24,21,167,210,1,0 ; vbroadcastss 0x1d2a7(%rip),%ymm10 # 2bcc8 <_sk_overlay_sse2_8bit+0x5bb>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,129,206,1,0 ; vbroadcastss 0x1ce81(%rip),%ymm10 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,21,61,209,1,0 ; vbroadcastss 0x1d13d(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,107,206,1,0 ; vbroadcastss 0x1ce6b(%rip),%ymm10 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,21,39,209,1,0 ; vbroadcastss 0x1d127(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -13648,7 +13838,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC
DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10
DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,97,207,1,0 ; vbroadcastss 0x1cf61(%rip),%ymm11 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,29,29,210,1,0 ; vbroadcastss 0x1d21d(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
@@ -13657,17 +13847,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,53,207,1,0 ; vbroadcastss 0x1cf35(%rip),%ymm9 # 2b6e4 <_sk_overlay_sse2_8bit+0x5c3>
+ DB 196,98,125,24,13,241,209,1,0 ; vbroadcastss 0x1d1f1(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,19,207,1,0 ; vbroadcastss 0x1cf13(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,207,209,1,0 ; vbroadcastss 0x1d1cf(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,164,205,1,0 ; vbroadcastss 0x1cda4(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,96,208,1,0 ; vbroadcastss 0x1d060(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -13685,7 +13875,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC
DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10
DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,179,206,1,0 ; vbroadcastss 0x1ceb3(%rip),%ymm11 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,29,111,209,1,0 ; vbroadcastss 0x1d16f(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
@@ -13694,17 +13884,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,135,206,1,0 ; vbroadcastss 0x1ce87(%rip),%ymm9 # 2b6e4 <_sk_overlay_sse2_8bit+0x5c3>
+ DB 196,98,125,24,13,67,209,1,0 ; vbroadcastss 0x1d143(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,101,206,1,0 ; vbroadcastss 0x1ce65(%rip),%ymm9 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,33,209,1,0 ; vbroadcastss 0x1d121(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,246,204,1,0 ; vbroadcastss 0x1ccf6(%rip),%ymm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,178,207,1,0 ; vbroadcastss 0x1cfb2(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -13721,7 +13911,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC
DB 196,67,121,4,201,0 ; vpermilps $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
- DB 196,98,125,24,21,11,206,1,0 ; vbroadcastss 0x1ce0b(%rip),%ymm10 # 2b6e0 <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,21,199,208,1,0 ; vbroadcastss 0x1d0c7(%rip),%ymm10 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10
@@ -13730,7 +13920,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0
- DB 196,98,125,24,5,227,205,1,0 ; vbroadcastss 0x1cde3(%rip),%ymm8 # 2b6e8 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,5,159,208,1,0 ; vbroadcastss 0x1d09f(%rip),%ymm8 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0
DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13765,7 +13955,7 @@ _sk_apply_vector_mask_avx LABEL PROC
PUBLIC _sk_save_xy_avx
_sk_save_xy_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,31,204,1,0 ; vbroadcastss 0x1cc1f(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,219,206,1,0 ; vbroadcastss 0x1cedb(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -13798,9 +13988,9 @@ _sk_accumulate_avx LABEL PROC
PUBLIC _sk_bilinear_nx_avx
_sk_bilinear_nx_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,7,205,1,0 ; vbroadcastss 0x1cd07(%rip),%ymm0 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,5,195,207,1,0 ; vbroadcastss 0x1cfc3(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,158,203,1,0 ; vbroadcastss 0x1cb9e(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,90,206,1,0 ; vbroadcastss 0x1ce5a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13809,7 +13999,7 @@ _sk_bilinear_nx_avx LABEL PROC
PUBLIC _sk_bilinear_px_avx
_sk_bilinear_px_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,126,203,1,0 ; vbroadcastss 0x1cb7e(%rip),%ymm0 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,5,58,206,1,0 ; vbroadcastss 0x1ce3a(%rip),%ymm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -13819,9 +14009,9 @@ _sk_bilinear_px_avx LABEL PROC
PUBLIC _sk_bilinear_ny_avx
_sk_bilinear_ny_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,190,204,1,0 ; vbroadcastss 0x1ccbe(%rip),%ymm1 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,13,122,207,1,0 ; vbroadcastss 0x1cf7a(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,84,203,1,0 ; vbroadcastss 0x1cb54(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,16,206,1,0 ; vbroadcastss 0x1ce10(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13830,7 +14020,7 @@ _sk_bilinear_ny_avx LABEL PROC
PUBLIC _sk_bilinear_py_avx
_sk_bilinear_py_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,52,203,1,0 ; vbroadcastss 0x1cb34(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,13,240,205,1,0 ; vbroadcastss 0x1cdf0(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -13840,14 +14030,14 @@ _sk_bilinear_py_avx LABEL PROC
PUBLIC _sk_bicubic_n3x_avx
_sk_bicubic_n3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,119,204,1,0 ; vbroadcastss 0x1cc77(%rip),%ymm0 # 2b6f0 <_sk_overlay_sse2_8bit+0x5cf>
+ DB 196,226,125,24,5,51,207,1,0 ; vbroadcastss 0x1cf33(%rip),%ymm0 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,10,203,1,0 ; vbroadcastss 0x1cb0a(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,198,205,1,0 ; vbroadcastss 0x1cdc6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,91,204,1,0 ; vbroadcastss 0x1cc5b(%rip),%ymm10 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,23,207,1,0 ; vbroadcastss 0x1cf17(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,89,203,1,0 ; vbroadcastss 0x1cb59(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,21,21,206,1,0 ; vbroadcastss 0x1ce15(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -13857,19 +14047,19 @@ _sk_bicubic_n3x_avx LABEL PROC
PUBLIC _sk_bicubic_n1x_avx
_sk_bicubic_n1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,36,204,1,0 ; vbroadcastss 0x1cc24(%rip),%ymm0 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,5,224,206,1,0 ; vbroadcastss 0x1cee0(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,187,202,1,0 ; vbroadcastss 0x1cabb(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,119,205,1,0 ; vbroadcastss 0x1cd77(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,25,204,1,0 ; vbroadcastss 0x1cc19(%rip),%ymm9 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,13,213,206,1,0 ; vbroadcastss 0x1ced5(%rip),%ymm9 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,7,204,1,0 ; vbroadcastss 0x1cc07(%rip),%ymm10 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,21,195,206,1,0 ; vbroadcastss 0x1cec3(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,136,202,1,0 ; vbroadcastss 0x1ca88(%rip),%ymm10 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,21,68,205,1,0 ; vbroadcastss 0x1cd44(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,233,203,1,0 ; vbroadcastss 0x1cbe9(%rip),%ymm9 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,13,165,206,1,0 ; vbroadcastss 0x1cea5(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13878,17 +14068,17 @@ _sk_bicubic_n1x_avx LABEL PROC
PUBLIC _sk_bicubic_p1x_avx
_sk_bicubic_p1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,89,202,1,0 ; vbroadcastss 0x1ca59(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,21,205,1,0 ; vbroadcastss 0x1cd15(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,183,203,1,0 ; vbroadcastss 0x1cbb7(%rip),%ymm10 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,21,115,206,1,0 ; vbroadcastss 0x1ce73(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,165,203,1,0 ; vbroadcastss 0x1cba5(%rip),%ymm11 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,29,97,206,1,0 ; vbroadcastss 0x1ce61(%rip),%ymm11 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,144,203,1,0 ; vbroadcastss 0x1cb90(%rip),%ymm9 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,13,76,206,1,0 ; vbroadcastss 0x1ce4c(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13897,13 +14087,13 @@ _sk_bicubic_p1x_avx LABEL PROC
PUBLIC _sk_bicubic_p3x_avx
_sk_bicubic_p3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,108,203,1,0 ; vbroadcastss 0x1cb6c(%rip),%ymm0 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,226,125,24,5,40,206,1,0 ; vbroadcastss 0x1ce28(%rip),%ymm0 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,81,203,1,0 ; vbroadcastss 0x1cb51(%rip),%ymm10 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,13,206,1,0 ; vbroadcastss 0x1ce0d(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,79,202,1,0 ; vbroadcastss 0x1ca4f(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,21,11,205,1,0 ; vbroadcastss 0x1cd0b(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -13913,14 +14103,14 @@ _sk_bicubic_p3x_avx LABEL PROC
PUBLIC _sk_bicubic_n3y_avx
_sk_bicubic_n3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,30,203,1,0 ; vbroadcastss 0x1cb1e(%rip),%ymm1 # 2b6f0 <_sk_overlay_sse2_8bit+0x5cf>
+ DB 196,226,125,24,13,218,205,1,0 ; vbroadcastss 0x1cdda(%rip),%ymm1 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,176,201,1,0 ; vbroadcastss 0x1c9b0(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,108,204,1,0 ; vbroadcastss 0x1cc6c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,1,203,1,0 ; vbroadcastss 0x1cb01(%rip),%ymm10 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,189,205,1,0 ; vbroadcastss 0x1cdbd(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,255,201,1,0 ; vbroadcastss 0x1c9ff(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,21,187,204,1,0 ; vbroadcastss 0x1ccbb(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -13930,19 +14120,19 @@ _sk_bicubic_n3y_avx LABEL PROC
PUBLIC _sk_bicubic_n1y_avx
_sk_bicubic_n1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,202,202,1,0 ; vbroadcastss 0x1caca(%rip),%ymm1 # 2b6ec <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,13,134,205,1,0 ; vbroadcastss 0x1cd86(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,96,201,1,0 ; vbroadcastss 0x1c960(%rip),%ymm8 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,28,204,1,0 ; vbroadcastss 0x1cc1c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,190,202,1,0 ; vbroadcastss 0x1cabe(%rip),%ymm9 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,13,122,205,1,0 ; vbroadcastss 0x1cd7a(%rip),%ymm9 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,172,202,1,0 ; vbroadcastss 0x1caac(%rip),%ymm10 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,21,104,205,1,0 ; vbroadcastss 0x1cd68(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,45,201,1,0 ; vbroadcastss 0x1c92d(%rip),%ymm10 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,21,233,203,1,0 ; vbroadcastss 0x1cbe9(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,142,202,1,0 ; vbroadcastss 0x1ca8e(%rip),%ymm9 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,13,74,205,1,0 ; vbroadcastss 0x1cd4a(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13951,17 +14141,17 @@ _sk_bicubic_n1y_avx LABEL PROC
PUBLIC _sk_bicubic_p1y_avx
_sk_bicubic_p1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,254,200,1,0 ; vbroadcastss 0x1c8fe(%rip),%ymm8 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,186,203,1,0 ; vbroadcastss 0x1cbba(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,91,202,1,0 ; vbroadcastss 0x1ca5b(%rip),%ymm10 # 2b6fc <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,21,23,205,1,0 ; vbroadcastss 0x1cd17(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,73,202,1,0 ; vbroadcastss 0x1ca49(%rip),%ymm11 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,29,5,205,1,0 ; vbroadcastss 0x1cd05(%rip),%ymm11 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,52,202,1,0 ; vbroadcastss 0x1ca34(%rip),%ymm9 # 2b700 <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,13,240,204,1,0 ; vbroadcastss 0x1ccf0(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13970,13 +14160,13 @@ _sk_bicubic_p1y_avx LABEL PROC
PUBLIC _sk_bicubic_p3y_avx
_sk_bicubic_p3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,16,202,1,0 ; vbroadcastss 0x1ca10(%rip),%ymm1 # 2b6f8 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,226,125,24,13,204,204,1,0 ; vbroadcastss 0x1cccc(%rip),%ymm1 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,244,201,1,0 ; vbroadcastss 0x1c9f4(%rip),%ymm10 # 2b6f4 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,176,204,1,0 ; vbroadcastss 0x1ccb0(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,242,200,1,0 ; vbroadcastss 0x1c8f2(%rip),%ymm10 # 2b600 <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,21,174,203,1,0 ; vbroadcastss 0x1cbae(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -14112,7 +14302,7 @@ _sk_clut_3D_avx LABEL PROC
DB 197,249,127,68,36,96 ; vmovdqa %xmm0,0x60(%rsp)
DB 72,139,0 ; mov (%rax),%rax
DB 196,193,121,254,194 ; vpaddd %xmm10,%xmm0,%xmm0
- DB 196,98,121,24,29,155,199,1,0 ; vbroadcastss 0x1c79b(%rip),%xmm11 # 2b708 <_sk_overlay_sse2_8bit+0x5e7>
+ DB 196,98,121,24,29,87,202,1,0 ; vbroadcastss 0x1ca57(%rip),%xmm11 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7>
DB 196,194,121,64,203 ; vpmulld %xmm11,%xmm0,%xmm1
DB 196,193,249,126,201 ; vmovq %xmm1,%r9
DB 69,137,202 ; mov %r9d,%r10d
@@ -14146,7 +14336,7 @@ _sk_clut_3D_avx LABEL PROC
DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
DB 196,227,93,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm3
DB 197,252,17,156,36,192,0,0,0 ; vmovups %ymm3,0xc0(%rsp)
- DB 196,98,121,24,13,100,197,1,0 ; vbroadcastss 0x1c564(%rip),%xmm9 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,121,24,13,32,200,1,0 ; vbroadcastss 0x1c820(%rip),%xmm9 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 196,193,105,254,249 ; vpaddd %xmm9,%xmm2,%xmm7
DB 196,195,249,22,249,1 ; vpextrq $0x1,%xmm7,%r9
DB 196,193,249,126,250 ; vmovq %xmm7,%r10
@@ -14174,7 +14364,7 @@ _sk_clut_3D_avx LABEL PROC
DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7
DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5
DB 196,99,85,24,254,1 ; vinsertf128 $0x1,%xmm6,%ymm5,%ymm15
- DB 196,98,121,24,37,215,196,1,0 ; vbroadcastss 0x1c4d7(%rip),%xmm12 # 2b59c <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,121,24,37,147,199,1,0 ; vbroadcastss 0x1c793(%rip),%xmm12 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
DB 196,193,105,254,212 ; vpaddd %xmm12,%xmm2,%xmm2
DB 196,195,249,22,209,1 ; vpextrq $0x1,%xmm2,%r9
DB 196,193,249,126,210 ; vmovq %xmm2,%r10
@@ -14202,7 +14392,7 @@ _sk_clut_3D_avx LABEL PROC
DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
DB 196,227,105,33,213,48 ; vinsertps $0x30,%xmm5,%xmm2,%xmm2
DB 196,227,109,24,225,1 ; vinsertf128 $0x1,%xmm1,%ymm2,%ymm4
- DB 196,226,125,24,13,171,197,1,0 ; vbroadcastss 0x1c5ab(%rip),%ymm1 # 2b704 <_sk_overlay_sse2_8bit+0x5e3>
+ DB 196,226,125,24,13,103,200,1,0 ; vbroadcastss 0x1c867(%rip),%ymm1 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3>
DB 197,188,88,209 ; vaddps %ymm1,%ymm8,%ymm2
DB 197,252,17,140,36,160,0,0,0 ; vmovups %ymm1,0xa0(%rsp)
DB 197,254,91,210 ; vcvttps2dq %ymm2,%ymm2
@@ -14955,7 +15145,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,226,25,64,200 ; vpmulld %xmm0,%xmm12,%xmm1
DB 197,249,127,12,36 ; vmovdqa %xmm1,(%rsp)
DB 197,241,254,202 ; vpaddd %xmm2,%xmm1,%xmm1
- DB 196,98,121,24,61,46,182,1,0 ; vbroadcastss 0x1b62e(%rip),%xmm15 # 2b708 <_sk_overlay_sse2_8bit+0x5e7>
+ DB 196,98,121,24,61,234,184,1,0 ; vbroadcastss 0x1b8ea(%rip),%xmm15 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7>
DB 196,194,113,64,247 ; vpmulld %xmm15,%xmm1,%xmm6
DB 196,193,249,126,241 ; vmovq %xmm6,%r9
DB 69,137,202 ; mov %r9d,%r10d
@@ -14993,7 +15183,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,163,65,33,60,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
DB 196,99,53,24,247,1 ; vinsertf128 $0x1,%xmm7,%ymm9,%ymm14
- DB 196,98,121,24,21,222,179,1,0 ; vbroadcastss 0x1b3de(%rip),%xmm10 # 2b594 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,121,24,21,154,182,1,0 ; vbroadcastss 0x1b69a(%rip),%xmm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,97,254,202 ; vpaddd %xmm10,%xmm3,%xmm9
DB 196,67,249,22,201,1 ; vpextrq $0x1,%xmm9,%r9
DB 196,65,249,126,202 ; vmovq %xmm9,%r10
@@ -15021,7 +15211,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7
DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5
DB 196,99,85,24,220,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm11
- DB 196,98,121,24,13,81,179,1,0 ; vbroadcastss 0x1b351(%rip),%xmm9 # 2b59c <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,121,24,13,13,182,1,0 ; vbroadcastss 0x1b60d(%rip),%xmm9 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
DB 196,193,97,254,217 ; vpaddd %xmm9,%xmm3,%xmm3
DB 196,195,249,22,217,1 ; vpextrq $0x1,%xmm3,%r9
DB 196,193,249,126,218 ; vmovq %xmm3,%r10
@@ -15049,7 +15239,7 @@ _sk_clut_4D_avx LABEL PROC
DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
DB 196,227,89,33,229,48 ; vinsertps $0x30,%xmm5,%xmm4,%xmm4
DB 196,227,93,24,243,1 ; vinsertf128 $0x1,%xmm3,%ymm4,%ymm6
- DB 196,226,125,24,37,37,180,1,0 ; vbroadcastss 0x1b425(%rip),%ymm4 # 2b704 <_sk_overlay_sse2_8bit+0x5e3>
+ DB 196,226,125,24,37,225,182,1,0 ; vbroadcastss 0x1b6e1(%rip),%ymm4 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3>
DB 197,148,88,220 ; vaddps %ymm4,%ymm13,%ymm3
DB 197,252,40,252 ; vmovaps %ymm4,%ymm7
DB 197,252,17,188,36,160,0,0,0 ; vmovups %ymm7,0xa0(%rsp)
@@ -16479,7 +16669,7 @@ _sk_clut_4D_avx LABEL PROC
DB 197,220,89,210 ; vmulps %ymm2,%ymm4,%ymm2
DB 197,212,88,210 ; vaddps %ymm2,%ymm5,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,236,148,1,0 ; vbroadcastss 0x194ec(%rip),%ymm3 # 2b590 <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,168,151,1,0 ; vbroadcastss 0x197a8(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,16,164,36,160,2,0,0 ; vmovups 0x2a0(%rsp),%ymm4
DB 197,252,16,172,36,192,2,0,0 ; vmovups 0x2c0(%rsp),%ymm5
DB 197,252,16,180,36,224,2,0,0 ; vmovups 0x2e0(%rsp),%ymm6
@@ -16521,13 +16711,13 @@ _sk_start_pipeline_sse41 LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,110 ; jae 121c1 <_sk_start_pipeline_sse41+0xeb>
+ DB 115,110 ; jae 124f1 <_sk_start_pipeline_sse41+0xeb>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,4 ; lea 0x4(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
- DB 119,43 ; ja 121a0 <_sk_start_pipeline_sse41+0xca>
+ DB 119,43 ; ja 124d0 <_sk_start_pipeline_sse41+0xca>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 69,49,192 ; xor %r8d,%r8d
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
@@ -16539,17 +16729,17 @@ _sk_start_pipeline_sse41 LABEL PROC
DB 73,131,196,8 ; add $0x8,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,220 ; jbe 1217c <_sk_start_pipeline_sse41+0xa6>
+ DB 118,220 ; jbe 124ac <_sk_start_pipeline_sse41+0xa6>
DB 77,137,248 ; mov %r15,%r8
DB 73,41,208 ; sub %rdx,%r8
- DB 116,13 ; je 121b5 <_sk_start_pipeline_sse41+0xdf>
+ DB 116,13 ; je 124e5 <_sk_start_pipeline_sse41+0xdf>
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,164 ; jne 12165 <_sk_start_pipeline_sse41+0x8f>
+ DB 117,164 ; jne 12495 <_sk_start_pipeline_sse41+0x8f>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -16580,7 +16770,7 @@ _sk_seed_shader_sse41 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,21,53,157,1,0 ; movaps 0x19d35(%rip),%xmm2 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,40,21,229,159,1,0 ; movaps 0x19fe5(%rip),%xmm2 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,7 ; movups (%rdi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -16589,7 +16779,7 @@ _sk_seed_shader_sse41 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,36,157,1,0 ; movaps 0x19d24(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,212,159,1,0 ; movaps 0x19fd4(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -16607,14 +16797,14 @@ _sk_dither_sse41 LABEL PROC
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,242,156,1,0 ; movdqa 0x19cf2(%rip),%xmm10 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,21,162,159,1,0 ; movdqa 0x19fa2(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,222,156,1,0 ; movdqa 0x19cde(%rip),%xmm12 # 2bf90 <_sk_overlay_sse2_8bit+0xe6f>
- DB 102,68,15,111,45,229,156,1,0 ; movdqa 0x19ce5(%rip),%xmm13 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,37,142,159,1,0 ; movdqa 0x19f8e(%rip),%xmm12 # 2c570 <_sk_overlay_sse2_8bit+0xe63>
+ DB 102,68,15,111,45,149,159,1,0 ; movdqa 0x19f95(%rip),%xmm13 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -16630,8 +16820,8 @@ _sk_dither_sse41 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,160,156,1,0 ; mulps 0x19ca0(%rip),%xmm8 # 2bfb0 <_sk_overlay_sse2_8bit+0xe8f>
- DB 68,15,88,5,168,156,1,0 ; addps 0x19ca8(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0xe9f>
+ DB 68,15,89,5,80,159,1,0 ; mulps 0x19f50(%rip),%xmm8 # 2c590 <_sk_overlay_sse2_8bit+0xe83>
+ DB 68,15,88,5,88,159,1,0 ; addps 0x19f58(%rip),%xmm8 # 2c5a0 <_sk_overlay_sse2_8bit+0xe93>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -16669,7 +16859,7 @@ _sk_uniform_color_sse41 LABEL PROC
PUBLIC _sk_black_color_sse41
_sk_black_color_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,222,155,1,0 ; movaps 0x19bde(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,142,158,1,0 ; movaps 0x19e8e(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -16678,7 +16868,7 @@ _sk_black_color_sse41 LABEL PROC
PUBLIC _sk_white_color_sse41
_sk_white_color_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,202,155,1,0 ; movaps 0x19bca(%rip),%xmm0 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,5,122,158,1,0 ; movaps 0x19e7a(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -16716,7 +16906,7 @@ _sk_clear_sse41 LABEL PROC
PUBLIC _sk_srcatop_sse41
_sk_srcatop_sse41 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,122,155,1,0 ; movaps 0x19b7a(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,42,158,1,0 ; movaps 0x19e2a(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -16739,7 +16929,7 @@ PUBLIC _sk_dstatop_sse41
_sk_dstatop_sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,45,155,1,0 ; movaps 0x19b2d(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,221,157,1,0 ; movaps 0x19ddd(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -16780,7 +16970,7 @@ _sk_dstin_sse41 LABEL PROC
PUBLIC _sk_srcout_sse41
_sk_srcout_sse41 LABEL PROC
- DB 68,15,40,5,193,154,1,0 ; movaps 0x19ac1(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,113,157,1,0 ; movaps 0x19d71(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -16791,7 +16981,7 @@ _sk_srcout_sse41 LABEL PROC
PUBLIC _sk_dstout_sse41
_sk_dstout_sse41 LABEL PROC
- DB 68,15,40,5,161,154,1,0 ; movaps 0x19aa1(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,81,157,1,0 ; movaps 0x19d51(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -16806,7 +16996,7 @@ _sk_dstout_sse41 LABEL PROC
PUBLIC _sk_srcover_sse41
_sk_srcover_sse41 LABEL PROC
- DB 68,15,40,5,116,154,1,0 ; movaps 0x19a74(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,36,157,1,0 ; movaps 0x19d24(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -16824,7 +17014,7 @@ _sk_srcover_sse41 LABEL PROC
PUBLIC _sk_dstover_sse41
_sk_dstover_sse41 LABEL PROC
- DB 68,15,40,5,56,154,1,0 ; movaps 0x19a38(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,232,156,1,0 ; movaps 0x19ce8(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -16848,7 +17038,7 @@ _sk_modulate_sse41 LABEL PROC
PUBLIC _sk_multiply_sse41
_sk_multiply_sse41 LABEL PROC
- DB 68,15,40,5,252,153,1,0 ; movaps 0x199fc(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,172,156,1,0 ; movaps 0x19cac(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -16884,9 +17074,14 @@ _sk_multiply_sse41 LABEL PROC
PUBLIC _sk_plus__sse41
_sk_plus__sse41 LABEL PROC
DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 68,15,40,5,45,156,1,0 ; movaps 0x19c2d(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 15,88,205 ; addps %xmm5,%xmm1
+ DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 15,88,214 ; addps %xmm6,%xmm2
+ DB 65,15,93,208 ; minps %xmm8,%xmm2
DB 15,88,223 ; addps %xmm7,%xmm3
+ DB 65,15,93,216 ; minps %xmm8,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -16917,7 +17112,7 @@ _sk_screen_sse41 LABEL PROC
PUBLIC _sk_xor__sse41
_sk_xor__sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,33,153,1,0 ; movaps 0x19921(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,185,155,1,0 ; movaps 0x19bb9(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -16963,7 +17158,7 @@ _sk_darken_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,124,152,1,0 ; movaps 0x1987c(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,20,155,1,0 ; movaps 0x19b14(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -16995,7 +17190,7 @@ _sk_lighten_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,17,152,1,0 ; movaps 0x19811(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,169,154,1,0 ; movaps 0x19aa9(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17030,7 +17225,7 @@ _sk_difference_sse41 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,155,151,1,0 ; movaps 0x1979b(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,51,154,1,0 ; movaps 0x19a33(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17056,7 +17251,7 @@ _sk_exclusion_sse41 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,75,151,1,0 ; movaps 0x1974b(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,227,153,1,0 ; movaps 0x199e3(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17066,7 +17261,7 @@ _sk_exclusion_sse41 LABEL PROC
PUBLIC _sk_colorburn_sse41
_sk_colorburn_sse41 LABEL PROC
- DB 68,15,40,29,50,151,1,0 ; movaps 0x19732(%rip),%xmm11 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,29,202,153,1,0 ; movaps 0x199ca(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 68,15,92,231 ; subps %xmm7,%xmm12
DB 69,15,40,204 ; movaps %xmm12,%xmm9
@@ -17148,7 +17343,7 @@ _sk_colorburn_sse41 LABEL PROC
PUBLIC _sk_colordodge_sse41
_sk_colordodge_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,252,149,1,0 ; movaps 0x195fc(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,148,152,1,0 ; movaps 0x19894(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -17229,7 +17424,7 @@ _sk_hardlight_sse41 LABEL PROC
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,196,148,1,0 ; movaps 0x194c4(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,92,151,1,0 ; movaps 0x1975c(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,234 ; movaps %xmm10,%xmm5
DB 15,92,239 ; subps %xmm7,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
@@ -17311,7 +17506,7 @@ PUBLIC _sk_overlay_sse41
_sk_overlay_sse41 LABEL PROC
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,40,240 ; movaps %xmm0,%xmm14
- DB 68,15,40,21,150,147,1,0 ; movaps 0x19396(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,46,150,1,0 ; movaps 0x1962e(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 65,15,40,195 ; movaps %xmm11,%xmm0
@@ -17395,7 +17590,7 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 65,15,84,193 ; andps %xmm9,%xmm0
- DB 15,40,13,89,146,1,0 ; movaps 0x19259(%rip),%xmm1 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,13,241,148,1,0 ; movaps 0x194f1(%rip),%xmm1 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 68,15,40,240 ; movaps %xmm0,%xmm14
@@ -17408,10 +17603,10 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,210 ; mulps %xmm2,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,40,45,135,146,1,0 ; movaps 0x19287(%rip),%xmm13 # 2bfd0 <_sk_overlay_sse2_8bit+0xeaf>
+ DB 68,15,40,45,31,149,1,0 ; movaps 0x1951f(%rip),%xmm13 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3>
DB 69,15,88,245 ; addps %xmm13,%xmm14
DB 68,15,89,242 ; mulps %xmm2,%xmm14
- DB 68,15,40,37,135,146,1,0 ; movaps 0x19287(%rip),%xmm12 # 2bfe0 <_sk_overlay_sse2_8bit+0xebf>
+ DB 68,15,40,37,31,149,1,0 ; movaps 0x1951f(%rip),%xmm12 # 2c5c0 <_sk_overlay_sse2_8bit+0xeb3>
DB 69,15,89,252 ; mulps %xmm12,%xmm15
DB 69,15,88,254 ; addps %xmm14,%xmm15
DB 15,40,198 ; movaps %xmm6,%xmm0
@@ -17597,12 +17792,12 @@ _sk_hue_sse41 LABEL PROC
DB 68,15,84,208 ; andps %xmm0,%xmm10
DB 15,84,200 ; andps %xmm0,%xmm1
DB 68,15,84,232 ; andps %xmm0,%xmm13
- DB 15,40,5,237,143,1,0 ; movaps 0x18fed(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 15,40,5,133,146,1,0 ; movaps 0x19285(%rip),%xmm0 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,89,224 ; mulps %xmm0,%xmm12
- DB 15,40,21,242,143,1,0 ; movaps 0x18ff2(%rip),%xmm2 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 15,40,21,138,146,1,0 ; movaps 0x1928a(%rip),%xmm2 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 15,89,250 ; mulps %xmm2,%xmm7
DB 65,15,88,252 ; addps %xmm12,%xmm7
- DB 68,15,40,53,243,143,1,0 ; movaps 0x18ff3(%rip),%xmm14 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
+ DB 68,15,40,53,139,146,1,0 ; movaps 0x1928b(%rip),%xmm14 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
DB 68,15,40,252 ; movaps %xmm4,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,255 ; addps %xmm7,%xmm15
@@ -17685,7 +17880,7 @@ _sk_hue_sse41 LABEL PROC
DB 65,15,88,214 ; addps %xmm14,%xmm2
DB 15,40,196 ; movaps %xmm4,%xmm0
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,40,13,8,142,1,0 ; movaps 0x18e08(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,160,144,1,0 ; movaps 0x190a0(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,225 ; movaps %xmm9,%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,40,68,36,48 ; movaps 0x30(%rsp),%xmm0
@@ -17779,14 +17974,14 @@ _sk_saturation_sse41 LABEL PROC
DB 68,15,84,215 ; andps %xmm7,%xmm10
DB 68,15,84,223 ; andps %xmm7,%xmm11
DB 68,15,84,199 ; andps %xmm7,%xmm8
- DB 15,40,21,43,141,1,0 ; movaps 0x18d2b(%rip),%xmm2 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 15,40,21,195,143,1,0 ; movaps 0x18fc3(%rip),%xmm2 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,218 ; mulps %xmm2,%xmm3
- DB 15,40,13,46,141,1,0 ; movaps 0x18d2e(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 15,40,13,198,143,1,0 ; movaps 0x18fc6(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,249 ; mulps %xmm1,%xmm7
DB 15,88,251 ; addps %xmm3,%xmm7
- DB 68,15,40,45,45,141,1,0 ; movaps 0x18d2d(%rip),%xmm13 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
+ DB 68,15,40,45,197,143,1,0 ; movaps 0x18fc5(%rip),%xmm13 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 68,15,88,247 ; addps %xmm7,%xmm14
DB 65,15,40,218 ; movaps %xmm10,%xmm3
@@ -17867,7 +18062,7 @@ _sk_saturation_sse41 LABEL PROC
DB 65,15,88,253 ; addps %xmm13,%xmm7
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 102,68,15,56,20,223 ; blendvps %xmm0,%xmm7,%xmm11
- DB 68,15,40,13,67,139,1,0 ; movaps 0x18b43(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,219,141,1,0 ; movaps 0x18ddb(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 68,15,92,204 ; subps %xmm4,%xmm9
DB 15,40,60,36 ; movaps (%rsp),%xmm7
@@ -17922,14 +18117,14 @@ _sk_color_sse41 LABEL PROC
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 68,15,89,244 ; mulps %xmm4,%xmm14
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 68,15,40,13,248,138,1,0 ; movaps 0x18af8(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,13,144,141,1,0 ; movaps 0x18d90(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 65,15,40,250 ; movaps %xmm10,%xmm7
DB 65,15,89,249 ; mulps %xmm9,%xmm7
- DB 68,15,40,21,248,138,1,0 ; movaps 0x18af8(%rip),%xmm10 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 68,15,40,21,144,141,1,0 ; movaps 0x18d90(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 65,15,40,219 ; movaps %xmm11,%xmm3
DB 65,15,89,218 ; mulps %xmm10,%xmm3
DB 15,88,223 ; addps %xmm7,%xmm3
- DB 68,15,40,29,245,138,1,0 ; movaps 0x18af5(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
+ DB 68,15,40,29,141,141,1,0 ; movaps 0x18d8d(%rip),%xmm11 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
@@ -18014,7 +18209,7 @@ _sk_color_sse41 LABEL PROC
DB 65,15,88,251 ; addps %xmm11,%xmm7
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,15,56,20,207 ; blendvps %xmm0,%xmm7,%xmm1
- DB 68,15,40,13,1,137,1,0 ; movaps 0x18901(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,153,139,1,0 ; movaps 0x18b99(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
DB 68,15,89,192 ; mulps %xmm0,%xmm8
@@ -18066,13 +18261,13 @@ _sk_luminosity_sse41 LABEL PROC
DB 69,15,89,216 ; mulps %xmm8,%xmm11
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,89,205 ; mulps %xmm5,%xmm9
- DB 68,15,40,5,195,136,1,0 ; movaps 0x188c3(%rip),%xmm8 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,5,91,139,1,0 ; movaps 0x18b5b(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 68,15,40,21,199,136,1,0 ; movaps 0x188c7(%rip),%xmm10 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 68,15,40,21,95,139,1,0 ; movaps 0x18b5f(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 65,15,89,234 ; mulps %xmm10,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 68,15,40,37,197,136,1,0 ; movaps 0x188c5(%rip),%xmm12 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
+ DB 68,15,40,37,93,139,1,0 ; movaps 0x18b5d(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
DB 68,15,40,242 ; movaps %xmm2,%xmm14
DB 69,15,89,244 ; mulps %xmm12,%xmm14
DB 68,15,88,245 ; addps %xmm5,%xmm14
@@ -18157,7 +18352,7 @@ _sk_luminosity_sse41 LABEL PROC
DB 65,15,88,244 ; addps %xmm12,%xmm6
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 102,68,15,56,20,206 ; blendvps %xmm0,%xmm6,%xmm9
- DB 15,40,5,203,134,1,0 ; movaps 0x186cb(%rip),%xmm0 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,5,99,137,1,0 ; movaps 0x18963(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,92,215 ; subps %xmm7,%xmm2
DB 15,89,226 ; mulps %xmm2,%xmm4
@@ -18201,23 +18396,23 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,219,0,0,0 ; jne 13a10 <_sk_srcover_rgba_8888_sse41+0xfb>
+ DB 15,133,219,0,0,0 ; jne 13d58 <_sk_srcover_rgba_8888_sse41+0xfb>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,37,218,134,1,0 ; movdqa 0x186da(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,37,114,137,1,0 ; movdqa 0x18972(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,214,134,1,0 ; pshufb 0x186d6(%rip),%xmm5 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,45,110,137,1,0 ; pshufb 0x1896e(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,214,134,1,0 ; pshufb 0x186d6(%rip),%xmm6 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,53,110,137,1,0 ; pshufb 0x1896e(%rip),%xmm6 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 68,15,40,5,243,133,1,0 ; movaps 0x185f3(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,139,136,1,0 ; movaps 0x1888b(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,199,134,1,0 ; movaps 0x186c7(%rip),%xmm12 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,37,95,137,1,0 ; movaps 0x1895f(%rip),%xmm12 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -18243,7 +18438,7 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 102,15,114,240,24 ; pslld $0x18,%xmm0
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 102,15,235,193 ; por %xmm1,%xmm0
- DB 117,88 ; jne 13a4e <_sk_srcover_rgba_8888_sse41+0x139>
+ DB 117,88 ; jne 13d96 <_sk_srcover_rgba_8888_sse41+0x139>
DB 243,65,15,127,4,129 ; movdqu %xmm0,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -18254,32 +18449,32 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,91 ; je 13a78 <_sk_srcover_rgba_8888_sse41+0x163>
+ DB 116,91 ; je 13dc0 <_sk_srcover_rgba_8888_sse41+0x163>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,22 ; je 13a3d <_sk_srcover_rgba_8888_sse41+0x128>
+ DB 116,22 ; je 13d85 <_sk_srcover_rgba_8888_sse41+0x128>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,10,255,255,255 ; jne 1393b <_sk_srcover_rgba_8888_sse41+0x26>
+ DB 15,133,10,255,255,255 ; jne 13c83 <_sk_srcover_rgba_8888_sse41+0x26>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 243,65,15,126,36,129 ; movq (%r9,%rax,4),%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,237,254,255,255 ; jmpq 1393b <_sk_srcover_rgba_8888_sse41+0x26>
+ DB 233,237,254,255,255 ; jmpq 13c83 <_sk_srcover_rgba_8888_sse41+0x26>
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,40 ; je 13a83 <_sk_srcover_rgba_8888_sse41+0x16e>
+ DB 116,40 ; je 13dcb <_sk_srcover_rgba_8888_sse41+0x16e>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 13a70 <_sk_srcover_rgba_8888_sse41+0x15b>
+ DB 116,15 ; je 13db8 <_sk_srcover_rgba_8888_sse41+0x15b>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,149 ; jne 139fc <_sk_srcover_rgba_8888_sse41+0xe7>
+ DB 117,149 ; jne 13d44 <_sk_srcover_rgba_8888_sse41+0xe7>
DB 102,65,15,58,22,68,129,8,2 ; pextrd $0x2,%xmm0,0x8(%r9,%rax,4)
DB 102,65,15,214,4,129 ; movq %xmm0,(%r9,%rax,4)
- DB 235,132 ; jmp 139fc <_sk_srcover_rgba_8888_sse41+0xe7>
+ DB 235,132 ; jmp 13d44 <_sk_srcover_rgba_8888_sse41+0xe7>
DB 102,65,15,110,60,129 ; movd (%r9,%rax,4),%xmm7
- DB 233,184,254,255,255 ; jmpq 1393b <_sk_srcover_rgba_8888_sse41+0x26>
+ DB 233,184,254,255,255 ; jmpq 13c83 <_sk_srcover_rgba_8888_sse41+0x26>
DB 102,65,15,126,4,129 ; movd %xmm0,(%r9,%rax,4)
- DB 233,110,255,255,255 ; jmpq 139fc <_sk_srcover_rgba_8888_sse41+0xe7>
+ DB 233,110,255,255,255 ; jmpq 13d44 <_sk_srcover_rgba_8888_sse41+0xe7>
PUBLIC _sk_clamp_0_sse41
_sk_clamp_0_sse41 LABEL PROC
@@ -18293,7 +18488,7 @@ _sk_clamp_0_sse41 LABEL PROC
PUBLIC _sk_clamp_1_sse41
_sk_clamp_1_sse41 LABEL PROC
- DB 68,15,40,5,194,132,1,0 ; movaps 0x184c2(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,90,135,1,0 ; movaps 0x1875a(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -18303,7 +18498,7 @@ _sk_clamp_1_sse41 LABEL PROC
PUBLIC _sk_clamp_a_sse41
_sk_clamp_a_sse41 LABEL PROC
- DB 15,93,29,167,132,1,0 ; minps 0x184a7(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,93,29,63,135,1,0 ; minps 0x1873f(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -18312,7 +18507,7 @@ _sk_clamp_a_sse41 LABEL PROC
PUBLIC _sk_clamp_a_dst_sse41
_sk_clamp_a_dst_sse41 LABEL PROC
- DB 15,93,61,147,132,1,0 ; minps 0x18493(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,93,61,43,135,1,0 ; minps 0x1872b(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,93,239 ; minps %xmm7,%xmm5
DB 15,93,247 ; minps %xmm7,%xmm6
@@ -18341,7 +18536,7 @@ _sk_swap_rb_sse41 LABEL PROC
PUBLIC _sk_invert_sse41
_sk_invert_sse41 LABEL PROC
- DB 68,15,40,5,79,132,1,0 ; movaps 0x1844f(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,231,134,1,0 ; movaps 0x186e7(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,200 ; subps %xmm0,%xmm9
DB 69,15,40,208 ; movaps %xmm8,%xmm10
@@ -18393,7 +18588,7 @@ _sk_premul_dst_sse41 LABEL PROC
PUBLIC _sk_unpremul_sse41
_sk_unpremul_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,217,131,1,0 ; movaps 0x183d9(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,113,134,1,0 ; movaps 0x18671(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -18405,20 +18600,20 @@ _sk_unpremul_sse41 LABEL PROC
PUBLIC _sk_from_srgb_sse41
_sk_from_srgb_sse41 LABEL PROC
- DB 68,15,40,29,164,132,1,0 ; movaps 0x184a4(%rip),%xmm11 # 2c060 <_sk_overlay_sse2_8bit+0xf3f>
+ DB 68,15,40,29,60,135,1,0 ; movaps 0x1873c(%rip),%xmm11 # 2c640 <_sk_overlay_sse2_8bit+0xf33>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
DB 68,15,40,208 ; movaps %xmm0,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
- DB 68,15,40,37,28,132,1,0 ; movaps 0x1841c(%rip),%xmm12 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,37,180,134,1,0 ; movaps 0x186b4(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,140,132,1,0 ; movaps 0x1848c(%rip),%xmm13 # 2c070 <_sk_overlay_sse2_8bit+0xf4f>
+ DB 68,15,40,45,36,135,1,0 ; movaps 0x18724(%rip),%xmm13 # 2c650 <_sk_overlay_sse2_8bit+0xf43>
DB 69,15,88,197 ; addps %xmm13,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
- DB 68,15,40,53,140,132,1,0 ; movaps 0x1848c(%rip),%xmm14 # 2c080 <_sk_overlay_sse2_8bit+0xf5f>
+ DB 68,15,40,53,36,135,1,0 ; movaps 0x18724(%rip),%xmm14 # 2c660 <_sk_overlay_sse2_8bit+0xf53>
DB 69,15,88,198 ; addps %xmm14,%xmm8
- DB 68,15,40,61,144,132,1,0 ; movaps 0x18490(%rip),%xmm15 # 2c090 <_sk_overlay_sse2_8bit+0xf6f>
+ DB 68,15,40,61,40,135,1,0 ; movaps 0x18728(%rip),%xmm15 # 2c670 <_sk_overlay_sse2_8bit+0xf63>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,40,209 ; movaps %xmm1,%xmm10
@@ -18453,19 +18648,19 @@ PUBLIC _sk_from_srgb_dst_sse41
_sk_from_srgb_dst_sse41 LABEL PROC
DB 68,15,40,204 ; movaps %xmm4,%xmm9
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,29,219,131,1,0 ; movaps 0x183db(%rip),%xmm11 # 2c060 <_sk_overlay_sse2_8bit+0xf3f>
+ DB 68,15,40,29,115,134,1,0 ; movaps 0x18673(%rip),%xmm11 # 2c640 <_sk_overlay_sse2_8bit+0xf33>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
- DB 68,15,40,37,84,131,1,0 ; movaps 0x18354(%rip),%xmm12 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,37,236,133,1,0 ; movaps 0x185ec(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 65,15,89,228 ; mulps %xmm12,%xmm4
- DB 68,15,40,45,200,131,1,0 ; movaps 0x183c8(%rip),%xmm13 # 2c070 <_sk_overlay_sse2_8bit+0xf4f>
+ DB 68,15,40,45,96,134,1,0 ; movaps 0x18660(%rip),%xmm13 # 2c650 <_sk_overlay_sse2_8bit+0xf43>
DB 65,15,88,229 ; addps %xmm13,%xmm4
DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 68,15,40,53,201,131,1,0 ; movaps 0x183c9(%rip),%xmm14 # 2c080 <_sk_overlay_sse2_8bit+0xf5f>
+ DB 68,15,40,53,97,134,1,0 ; movaps 0x18661(%rip),%xmm14 # 2c660 <_sk_overlay_sse2_8bit+0xf53>
DB 65,15,88,230 ; addps %xmm14,%xmm4
- DB 68,15,40,61,205,131,1,0 ; movaps 0x183cd(%rip),%xmm15 # 2c090 <_sk_overlay_sse2_8bit+0xf6f>
+ DB 68,15,40,61,101,134,1,0 ; movaps 0x18665(%rip),%xmm15 # 2c670 <_sk_overlay_sse2_8bit+0xf63>
DB 69,15,194,207,1 ; cmpltps %xmm15,%xmm9
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,226 ; blendvps %xmm0,%xmm10,%xmm4
@@ -18508,22 +18703,22 @@ _sk_to_srgb_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 68,15,82,192 ; rsqrtps %xmm0,%xmm8
- DB 68,15,40,29,62,131,1,0 ; movaps 0x1833e(%rip),%xmm11 # 2c0a0 <_sk_overlay_sse2_8bit+0xf7f>
+ DB 68,15,40,29,214,133,1,0 ; movaps 0x185d6(%rip),%xmm11 # 2c680 <_sk_overlay_sse2_8bit+0xf73>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
- DB 68,15,40,37,62,131,1,0 ; movaps 0x1833e(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0xf8f>
+ DB 68,15,40,37,214,133,1,0 ; movaps 0x185d6(%rip),%xmm12 # 2c690 <_sk_overlay_sse2_8bit+0xf83>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 69,15,89,252 ; mulps %xmm12,%xmm15
- DB 68,15,40,21,62,131,1,0 ; movaps 0x1833e(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0xf9f>
+ DB 68,15,40,21,214,133,1,0 ; movaps 0x185d6(%rip),%xmm10 # 2c6a0 <_sk_overlay_sse2_8bit+0xf93>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,248 ; mulps %xmm8,%xmm15
- DB 68,15,40,45,62,131,1,0 ; movaps 0x1833e(%rip),%xmm13 # 2c0d0 <_sk_overlay_sse2_8bit+0xfaf>
+ DB 68,15,40,45,214,133,1,0 ; movaps 0x185d6(%rip),%xmm13 # 2c6b0 <_sk_overlay_sse2_8bit+0xfa3>
DB 69,15,88,253 ; addps %xmm13,%xmm15
- DB 68,15,40,53,66,131,1,0 ; movaps 0x18342(%rip),%xmm14 # 2c0e0 <_sk_overlay_sse2_8bit+0xfbf>
+ DB 68,15,40,53,218,133,1,0 ; movaps 0x185da(%rip),%xmm14 # 2c6c0 <_sk_overlay_sse2_8bit+0xfb3>
DB 69,15,88,198 ; addps %xmm14,%xmm8
DB 69,15,83,192 ; rcpps %xmm8,%xmm8
DB 69,15,89,199 ; mulps %xmm15,%xmm8
- DB 68,15,40,61,62,131,1,0 ; movaps 0x1833e(%rip),%xmm15 # 2c0f0 <_sk_overlay_sse2_8bit+0xfcf>
+ DB 68,15,40,61,214,133,1,0 ; movaps 0x185d6(%rip),%xmm15 # 2c6d0 <_sk_overlay_sse2_8bit+0xfc3>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,82,202 ; rsqrtps %xmm2,%xmm9
@@ -18567,15 +18762,17 @@ PUBLIC _sk_rgb_to_hsl_sse41
_sk_rgb_to_hsl_sse41 LABEL PROC
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,40,192 ; movaps %xmm0,%xmm8
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 15,95,194 ; maxps %xmm2,%xmm0
DB 69,15,40,216 ; movaps %xmm8,%xmm11
- DB 69,15,95,217 ; maxps %xmm9,%xmm11
- DB 68,15,95,218 ; maxps %xmm2,%xmm11
+ DB 68,15,95,216 ; maxps %xmm0,%xmm11
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 15,93,194 ; minps %xmm2,%xmm0
DB 69,15,40,224 ; movaps %xmm8,%xmm12
- DB 69,15,93,225 ; minps %xmm9,%xmm12
- DB 68,15,93,226 ; minps %xmm2,%xmm12
+ DB 68,15,93,224 ; minps %xmm0,%xmm12
DB 65,15,40,203 ; movaps %xmm11,%xmm1
DB 65,15,92,204 ; subps %xmm12,%xmm1
- DB 68,15,40,53,248,128,1,0 ; movaps 0x180f8(%rip),%xmm14 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,53,138,131,1,0 ; movaps 0x1838a(%rip),%xmm14 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,94,241 ; divps %xmm1,%xmm14
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 69,15,194,208,0 ; cmpeqps %xmm8,%xmm10
@@ -18584,27 +18781,27 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 68,15,194,250,1 ; cmpltps %xmm2,%xmm15
- DB 68,15,84,61,95,130,1,0 ; andps 0x1825f(%rip),%xmm15 # 2c100 <_sk_overlay_sse2_8bit+0xfdf>
+ DB 68,15,84,61,241,132,1,0 ; andps 0x184f1(%rip),%xmm15 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3>
DB 68,15,88,248 ; addps %xmm0,%xmm15
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,193,0 ; cmpeqps %xmm9,%xmm0
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 68,15,40,45,82,130,1,0 ; movaps 0x18252(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0xfef>
+ DB 68,15,40,45,228,132,1,0 ; movaps 0x184e4(%rip),%xmm13 # 2c6f0 <_sk_overlay_sse2_8bit+0xfe3>
DB 65,15,88,213 ; addps %xmm13,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,198 ; mulps %xmm14,%xmm8
- DB 68,15,88,5,78,130,1,0 ; addps 0x1824e(%rip),%xmm8 # 2c120 <_sk_overlay_sse2_8bit+0xfff>
+ DB 68,15,88,5,224,132,1,0 ; addps 0x184e0(%rip),%xmm8 # 2c700 <_sk_overlay_sse2_8bit+0xff3>
DB 102,68,15,56,20,194 ; blendvps %xmm0,%xmm2,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,69,15,56,20,199 ; blendvps %xmm0,%xmm15,%xmm8
- DB 68,15,89,5,70,130,1,0 ; mulps 0x18246(%rip),%xmm8 # 2c130 <_sk_overlay_sse2_8bit+0x100f>
+ DB 68,15,89,5,216,132,1,0 ; mulps 0x184d8(%rip),%xmm8 # 2c710 <_sk_overlay_sse2_8bit+0x1003>
DB 69,15,40,203 ; movaps %xmm11,%xmm9
DB 69,15,194,204,4 ; cmpneqps %xmm12,%xmm9
DB 69,15,84,193 ; andps %xmm9,%xmm8
DB 69,15,92,235 ; subps %xmm11,%xmm13
DB 69,15,88,220 ; addps %xmm12,%xmm11
- DB 15,40,5,90,128,1,0 ; movaps 0x1805a(%rip),%xmm0 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,40,5,236,130,1,0 ; movaps 0x182ec(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,40,211 ; movaps %xmm11,%xmm2
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,194,194,1 ; cmpltps %xmm2,%xmm0
@@ -18625,7 +18822,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,100,36,32 ; movaps %xmm4,0x20(%rsp)
DB 15,41,92,36,16 ; movaps %xmm3,0x10(%rsp)
DB 68,15,40,208 ; movaps %xmm0,%xmm10
- DB 68,15,40,13,12,128,1,0 ; movaps 0x1800c(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,13,158,130,1,0 ; movaps 0x1829e(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,194,194,2 ; cmpleps %xmm2,%xmm0
DB 15,40,217 ; movaps %xmm1,%xmm3
@@ -18638,19 +18835,19 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,20,36 ; movaps %xmm2,(%rsp)
DB 69,15,88,192 ; addps %xmm8,%xmm8
DB 68,15,92,197 ; subps %xmm5,%xmm8
- DB 68,15,40,53,184,129,1,0 ; movaps 0x181b8(%rip),%xmm14 # 2c140 <_sk_overlay_sse2_8bit+0x101f>
+ DB 68,15,40,53,74,132,1,0 ; movaps 0x1844a(%rip),%xmm14 # 2c720 <_sk_overlay_sse2_8bit+0x1013>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 102,65,15,58,8,198,1 ; roundps $0x1,%xmm14,%xmm0
DB 68,15,92,240 ; subps %xmm0,%xmm14
- DB 68,15,40,29,177,129,1,0 ; movaps 0x181b1(%rip),%xmm11 # 2c150 <_sk_overlay_sse2_8bit+0x102f>
+ DB 68,15,40,29,67,132,1,0 ; movaps 0x18443(%rip),%xmm11 # 2c730 <_sk_overlay_sse2_8bit+0x1023>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 65,15,92,240 ; subps %xmm8,%xmm6
- DB 15,40,61,74,129,1,0 ; movaps 0x1814a(%rip),%xmm7 # 2c100 <_sk_overlay_sse2_8bit+0xfdf>
+ DB 15,40,61,220,131,1,0 ; movaps 0x183dc(%rip),%xmm7 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3>
DB 69,15,40,238 ; movaps %xmm14,%xmm13
DB 68,15,89,239 ; mulps %xmm7,%xmm13
- DB 15,40,29,91,129,1,0 ; movaps 0x1815b(%rip),%xmm3 # 2c120 <_sk_overlay_sse2_8bit+0xfff>
+ DB 15,40,29,237,131,1,0 ; movaps 0x183ed(%rip),%xmm3 # 2c700 <_sk_overlay_sse2_8bit+0xff3>
DB 68,15,40,227 ; movaps %xmm3,%xmm12
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 68,15,89,230 ; mulps %xmm6,%xmm12
@@ -18660,7 +18857,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,40,253 ; movaps %xmm5,%xmm15
DB 102,69,15,56,20,252 ; blendvps %xmm0,%xmm12,%xmm15
- DB 68,15,40,37,58,129,1,0 ; movaps 0x1813a(%rip),%xmm12 # 2c130 <_sk_overlay_sse2_8bit+0x100f>
+ DB 68,15,40,37,204,131,1,0 ; movaps 0x183cc(%rip),%xmm12 # 2c710 <_sk_overlay_sse2_8bit+0x1003>
DB 65,15,40,196 ; movaps %xmm12,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,89,238 ; mulps %xmm6,%xmm13
@@ -18694,7 +18891,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,40,198 ; movaps %xmm14,%xmm0
DB 15,40,20,36 ; movaps (%rsp),%xmm2
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,88,21,211,128,1,0 ; addps 0x180d3(%rip),%xmm10 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,88,21,101,131,1,0 ; addps 0x18365(%rip),%xmm10 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 102,65,15,58,8,194,1 ; roundps $0x1,%xmm10,%xmm0
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 69,15,194,218,2 ; cmpleps %xmm10,%xmm11
@@ -18746,11 +18943,11 @@ _sk_scale_u8_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,52 ; jne 14178 <_sk_scale_u8_sse41+0x4c>
+ DB 117,52 ; jne 144c6 <_sk_scale_u8_sse41+0x4c>
DB 102,71,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm8
- DB 102,68,15,219,5,204,126,1,0 ; pand 0x17ecc(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,68,15,219,5,94,129,1,0 ; pand 0x1815e(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,16,128,1,0 ; mulps 0x18010(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,89,5,162,130,1,0 ; mulps 0x182a2(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -18761,12 +18958,12 @@ _sk_scale_u8_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,59 ; je 141c0 <_sk_scale_u8_sse41+0x94>
+ DB 116,59 ; je 1450e <_sk_scale_u8_sse41+0x94>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 141a7 <_sk_scale_u8_sse41+0x7b>
+ DB 116,23 ; je 144f5 <_sk_scale_u8_sse41+0x7b>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,181 ; jne 1414b <_sk_scale_u8_sse41+0x1f>
+ DB 117,181 ; jne 14499 <_sk_scale_u8_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -18774,10 +18971,75 @@ _sk_scale_u8_sse41 LABEL PROC
DB 102,68,15,110,200 ; movd %eax,%xmm9
DB 102,69,15,56,49,201 ; pmovzxbd %xmm9,%xmm9
DB 102,69,15,58,14,193,15 ; pblendw $0xf,%xmm9,%xmm8
- DB 235,139 ; jmp 1414b <_sk_scale_u8_sse41+0x1f>
+ DB 235,139 ; jmp 14499 <_sk_scale_u8_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,124,255,255,255 ; jmpq 1414b <_sk_scale_u8_sse41+0x1f>
+ DB 233,124,255,255,255 ; jmpq 14499 <_sk_scale_u8_sse41+0x1f>
+
+PUBLIC _sk_scale_565_sse41
+_sk_scale_565_sse41 LABEL PROC
+ DB 102,68,15,111,192 ; movdqa %xmm0,%xmm8
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,99,80,8 ; movslq 0x8(%rax),%r10
+ DB 76,99,201 ; movslq %ecx,%r9
+ DB 77,15,175,202 ; imul %r10,%r9
+ DB 77,1,201 ; add %r9,%r9
+ DB 76,3,8 ; add (%rax),%r9
+ DB 76,99,218 ; movslq %edx,%r11
+ DB 77,133,192 ; test %r8,%r8
+ DB 15,133,159,0,0,0 ; jne 145e0 <_sk_scale_565_sse41+0xc3>
+ DB 102,71,15,56,51,28,89 ; pmovzxwd (%r9,%r11,2),%xmm11
+ DB 102,15,111,5,16,130,1,0 ; movdqa 0x18210(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,65,15,219,195 ; pand %xmm11,%xmm0
+ DB 68,15,91,200 ; cvtdq2ps %xmm0,%xmm9
+ DB 68,15,89,13,15,130,1,0 ; mulps 0x1820f(%rip),%xmm9 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,5,23,130,1,0 ; movdqa 0x18217(%rip),%xmm0 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 102,65,15,219,195 ; pand %xmm11,%xmm0
+ DB 68,15,91,208 ; cvtdq2ps %xmm0,%xmm10
+ DB 68,15,89,21,22,130,1,0 ; mulps 0x18216(%rip),%xmm10 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,68,15,219,29,29,130,1,0 ; pand 0x1821d(%rip),%xmm11 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 69,15,91,219 ; cvtdq2ps %xmm11,%xmm11
+ DB 68,15,89,29,33,130,1,0 ; mulps 0x18221(%rip),%xmm11 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
+ DB 69,15,40,226 ; movaps %xmm10,%xmm12
+ DB 69,15,93,227 ; minps %xmm11,%xmm12
+ DB 69,15,40,233 ; movaps %xmm9,%xmm13
+ DB 69,15,93,236 ; minps %xmm12,%xmm13
+ DB 69,15,40,242 ; movaps %xmm10,%xmm14
+ DB 69,15,95,243 ; maxps %xmm11,%xmm14
+ DB 69,15,40,225 ; movaps %xmm9,%xmm12
+ DB 69,15,95,230 ; maxps %xmm14,%xmm12
+ DB 102,69,15,56,20,229 ; blendvps %xmm0,%xmm13,%xmm12
+ DB 69,15,89,200 ; mulps %xmm8,%xmm9
+ DB 68,15,89,209 ; mulps %xmm1,%xmm10
+ DB 68,15,89,218 ; mulps %xmm2,%xmm11
+ DB 68,15,89,227 ; mulps %xmm3,%xmm12
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 65,15,40,202 ; movaps %xmm10,%xmm1
+ DB 65,15,40,211 ; movaps %xmm11,%xmm2
+ DB 65,15,40,220 ; movaps %xmm12,%xmm3
+ DB 255,224 ; jmpq *%rax
+ DB 69,137,194 ; mov %r8d,%r10d
+ DB 65,128,226,3 ; and $0x3,%r10b
+ DB 65,128,250,1 ; cmp $0x1,%r10b
+ DB 116,60 ; je 14629 <_sk_scale_565_sse41+0x10c>
+ DB 102,69,15,239,219 ; pxor %xmm11,%xmm11
+ DB 65,128,250,2 ; cmp $0x2,%r10b
+ DB 116,26 ; je 14612 <_sk_scale_565_sse41+0xf5>
+ DB 65,128,250,3 ; cmp $0x3,%r10b
+ DB 15,133,70,255,255,255 ; jne 14548 <_sk_scale_565_sse41+0x2b>
+ DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
+ DB 102,15,110,192 ; movd %eax,%xmm0
+ DB 102,68,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm11
+ DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
+ DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
+ DB 102,68,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm11
+ DB 233,31,255,255,255 ; jmpq 14548 <_sk_scale_565_sse41+0x2b>
+ DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
+ DB 102,68,15,110,216 ; movd %eax,%xmm11
+ DB 233,16,255,255,255 ; jmpq 14548 <_sk_scale_565_sse41+0x2b>
PUBLIC _sk_lerp_1_float_sse41
_sk_lerp_1_float_sse41 LABEL PROC
@@ -18808,11 +19070,11 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne 14267 <_sk_lerp_u8_sse41+0x60>
+ DB 117,72 ; jne 146d0 <_sk_lerp_u8_sse41+0x60>
DB 102,71,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm8
- DB 102,68,15,219,5,241,125,1,0 ; pand 0x17df1(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,68,15,219,5,104,127,1,0 ; pand 0x17f68(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,53,127,1,0 ; mulps 0x17f35(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,89,5,172,128,1,0 ; mulps 0x180ac(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -18830,12 +19092,12 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,62 ; je 142b2 <_sk_lerp_u8_sse41+0xab>
+ DB 116,62 ; je 1471b <_sk_lerp_u8_sse41+0xab>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 14296 <_sk_lerp_u8_sse41+0x8f>
+ DB 116,23 ; je 146ff <_sk_lerp_u8_sse41+0x8f>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,161 ; jne 14226 <_sk_lerp_u8_sse41+0x1f>
+ DB 117,161 ; jne 1468f <_sk_lerp_u8_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -18843,13 +19105,14 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 102,68,15,110,200 ; movd %eax,%xmm9
DB 102,69,15,56,49,201 ; pmovzxbd %xmm9,%xmm9
DB 102,69,15,58,14,193,15 ; pblendw $0xf,%xmm9,%xmm8
- DB 233,116,255,255,255 ; jmpq 14226 <_sk_lerp_u8_sse41+0x1f>
+ DB 233,116,255,255,255 ; jmpq 1468f <_sk_lerp_u8_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,101,255,255,255 ; jmpq 14226 <_sk_lerp_u8_sse41+0x1f>
+ DB 233,101,255,255,255 ; jmpq 1468f <_sk_lerp_u8_sse41+0x1f>
PUBLIC _sk_lerp_565_sse41
_sk_lerp_565_sse41 LABEL PROC
+ DB 102,68,15,111,192 ; movdqa %xmm0,%xmm8
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,99,80,8 ; movslq 0x8(%rax),%r10
DB 76,99,201 ; movslq %ecx,%r9
@@ -18858,71 +19121,74 @@ _sk_lerp_565_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,152,0,0,0 ; jne 14378 <_sk_lerp_565_sse41+0xb7>
+ DB 15,133,165,0,0,0 ; jne 147f3 <_sk_lerp_565_sse41+0xc9>
DB 102,71,15,56,51,20,89 ; pmovzxwd (%r9,%r11,2),%xmm10
- DB 102,68,15,111,5,144,126,1,0 ; movdqa 0x17e90(%rip),%xmm8 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
- DB 102,69,15,219,194 ; pand %xmm10,%xmm8
- DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,143,126,1,0 ; mulps 0x17e8f(%rip),%xmm8 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,68,15,111,13,150,126,1,0 ; movdqa 0x17e96(%rip),%xmm9 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
- DB 102,69,15,219,202 ; pand %xmm10,%xmm9
- DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,149,126,1,0 ; mulps 0x17e95(%rip),%xmm9 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,68,15,219,21,156,126,1,0 ; pand 0x17e9c(%rip),%xmm10 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 102,15,111,5,3,128,1,0 ; movdqa 0x18003(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,65,15,219,194 ; pand %xmm10,%xmm0
+ DB 68,15,91,200 ; cvtdq2ps %xmm0,%xmm9
+ DB 68,15,89,13,2,128,1,0 ; mulps 0x18002(%rip),%xmm9 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,5,10,128,1,0 ; movdqa 0x1800a(%rip),%xmm0 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 102,65,15,219,194 ; pand %xmm10,%xmm0
+ DB 68,15,91,216 ; cvtdq2ps %xmm0,%xmm11
+ DB 68,15,89,29,9,128,1,0 ; mulps 0x18009(%rip),%xmm11 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,68,15,219,21,16,128,1,0 ; pand 0x18010(%rip),%xmm10 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,160,126,1,0 ; mulps 0x17ea0(%rip),%xmm10 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
- DB 15,92,196 ; subps %xmm4,%xmm0
- DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 68,15,89,21,20,128,1,0 ; mulps 0x18014(%rip),%xmm10 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
+ DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 15,92,205 ; subps %xmm5,%xmm1
- DB 65,15,89,201 ; mulps %xmm9,%xmm1
+ DB 65,15,89,203 ; mulps %xmm11,%xmm1
+ DB 69,15,93,218 ; minps %xmm10,%xmm11
+ DB 69,15,40,233 ; movaps %xmm9,%xmm13
+ DB 68,15,92,196 ; subps %xmm4,%xmm8
+ DB 69,15,89,193 ; mulps %xmm9,%xmm8
+ DB 69,15,93,203 ; minps %xmm11,%xmm9
+ DB 69,15,95,226 ; maxps %xmm10,%xmm12
+ DB 69,15,95,236 ; maxps %xmm12,%xmm13
+ DB 102,69,15,56,20,233 ; blendvps %xmm0,%xmm9,%xmm13
+ DB 68,15,88,196 ; addps %xmm4,%xmm8
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,92,214 ; subps %xmm6,%xmm2
DB 65,15,89,210 ; mulps %xmm10,%xmm2
DB 15,88,214 ; addps %xmm6,%xmm2
DB 15,92,223 ; subps %xmm7,%xmm3
- DB 68,15,89,195 ; mulps %xmm3,%xmm8
- DB 68,15,88,199 ; addps %xmm7,%xmm8
- DB 68,15,89,203 ; mulps %xmm3,%xmm9
- DB 68,15,88,207 ; addps %xmm7,%xmm9
- DB 65,15,89,218 ; mulps %xmm10,%xmm3
+ DB 65,15,89,221 ; mulps %xmm13,%xmm3
DB 15,88,223 ; addps %xmm7,%xmm3
- DB 68,15,95,203 ; maxps %xmm3,%xmm9
- DB 69,15,95,193 ; maxps %xmm9,%xmm8
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 65,15,40,216 ; movaps %xmm8,%xmm3
+ DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,62 ; je 143c3 <_sk_lerp_565_sse41+0x102>
+ DB 116,60 ; je 1483c <_sk_lerp_565_sse41+0x112>
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,27 ; je 143ab <_sk_lerp_565_sse41+0xea>
+ DB 116,26 ; je 14825 <_sk_lerp_565_sse41+0xfb>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,77,255,255,255 ; jne 142e7 <_sk_lerp_565_sse41+0x26>
+ DB 15,133,64,255,255,255 ; jne 14755 <_sk_lerp_565_sse41+0x2b>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
- DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 102,69,15,112,208,69 ; pshufd $0x45,%xmm8,%xmm10
- DB 102,71,15,110,4,89 ; movd (%r9,%r11,2),%xmm8
- DB 102,69,15,56,51,192 ; pmovzxwd %xmm8,%xmm8
- DB 102,69,15,58,14,208,15 ; pblendw $0xf,%xmm8,%xmm10
- DB 233,36,255,255,255 ; jmpq 142e7 <_sk_lerp_565_sse41+0x26>
+ DB 102,15,110,192 ; movd %eax,%xmm0
+ DB 102,68,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm10
+ DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
+ DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
+ DB 102,68,15,58,14,208,15 ; pblendw $0xf,%xmm0,%xmm10
+ DB 233,25,255,255,255 ; jmpq 14755 <_sk_lerp_565_sse41+0x2b>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,68,15,110,208 ; movd %eax,%xmm10
- DB 233,21,255,255,255 ; jmpq 142e7 <_sk_lerp_565_sse41+0x26>
+ DB 233,10,255,255,255 ; jmpq 14755 <_sk_lerp_565_sse41+0x2b>
PUBLIC _sk_load_tables_sse41
_sk_load_tables_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 15,133,24,1,0,0 ; jne 144f8 <_sk_load_tables_sse41+0x126>
+ DB 15,133,24,1,0,0 ; jne 14971 <_sk_load_tables_sse41+0x126>
DB 243,69,15,111,4,145 ; movdqu (%r9,%rdx,4),%xmm8
DB 65,87 ; push %r15
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,15,111,5,45,124,1,0 ; movdqa 0x17c2d(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,5,148,125,1,0 ; movdqa 0x17d94(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -18937,7 +19203,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,66,15,58,33,4,179,32 ; insertps $0x20,(%rbx,%r14,4),%xmm0
DB 102,66,15,58,33,4,11,48 ; insertps $0x30,(%rbx,%r9,1),%xmm0
DB 102,65,15,111,200 ; movdqa %xmm8,%xmm1
- DB 102,15,56,0,13,232,123,1,0 ; pshufb 0x17be8(%rip),%xmm1 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,13,79,125,1,0 ; pshufb 0x17d4f(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
DB 68,15,182,211 ; movzbl %bl,%r10d
@@ -18952,7 +19218,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1
DB 76,139,72,24 ; mov 0x18(%rax),%r9
DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2
- DB 102,15,56,0,21,164,123,1,0 ; pshufb 0x17ba4(%rip),%xmm2 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,21,11,125,1,0 ; pshufb 0x17d0b(%rip),%xmm2 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 102,72,15,58,22,211,1 ; pextrq $0x1,%xmm2,%rbx
DB 102,72,15,126,208 ; movq %xmm2,%rax
DB 68,15,182,208 ; movzbl %al,%r10d
@@ -18967,7 +19233,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,216 ; cvtdq2ps %xmm8,%xmm3
- DB 15,89,29,129,124,1,0 ; mulps 0x17c81(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,29,232,125,1,0 ; mulps 0x17de8(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -18976,19 +19242,19 @@ _sk_load_tables_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,52 ; je 14539 <_sk_load_tables_sse41+0x167>
+ DB 116,52 ; je 149b2 <_sk_load_tables_sse41+0x167>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 14527 <_sk_load_tables_sse41+0x155>
+ DB 116,23 ; je 149a0 <_sk_load_tables_sse41+0x155>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,204,254,255,255 ; jne 143e6 <_sk_load_tables_sse41+0x14>
+ DB 15,133,204,254,255,255 ; jne 1485f <_sk_load_tables_sse41+0x14>
DB 102,65,15,110,68,145,8 ; movd 0x8(%r9,%rdx,4),%xmm0
DB 102,68,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm8
DB 243,65,15,126,4,145 ; movq (%r9,%rdx,4),%xmm0
DB 102,68,15,58,14,192,15 ; pblendw $0xf,%xmm0,%xmm8
- DB 233,173,254,255,255 ; jmpq 143e6 <_sk_load_tables_sse41+0x14>
+ DB 233,173,254,255,255 ; jmpq 1485f <_sk_load_tables_sse41+0x14>
DB 102,69,15,110,4,145 ; movd (%r9,%rdx,4),%xmm8
- DB 233,162,254,255,255 ; jmpq 143e6 <_sk_load_tables_sse41+0x14>
+ DB 233,162,254,255,255 ; jmpq 1485f <_sk_load_tables_sse41+0x14>
PUBLIC _sk_load_tables_u16_be_sse41
_sk_load_tables_u16_be_sse41 LABEL PROC
@@ -18996,7 +19262,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,99,1,0,0 ; jne 146bd <_sk_load_tables_u16_be_sse41+0x179>
+ DB 15,133,99,1,0,0 ; jne 14b36 <_sk_load_tables_u16_be_sse41+0x179>
DB 102,67,15,16,4,81 ; movupd (%r9,%r10,2),%xmm0
DB 243,67,15,111,76,81,16 ; movdqu 0x10(%r9,%r10,2),%xmm1
DB 65,87 ; push %r15
@@ -19008,7 +19274,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,5,79,124,1,0 ; movdqa 0x17c4f(%rip),%xmm8 # 2c1e0 <_sk_overlay_sse2_8bit+0x10bf>
+ DB 102,68,15,111,5,182,125,1,0 ; movdqa 0x17db6(%rip),%xmm8 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -19026,7 +19292,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,15,58,33,194,32 ; insertps $0x20,%xmm2,%xmm0
DB 243,66,15,16,20,11 ; movss (%rbx,%r9,1),%xmm2
DB 102,15,58,33,194,48 ; insertps $0x30,%xmm2,%xmm0
- DB 102,15,56,0,13,254,123,1,0 ; pshufb 0x17bfe(%rip),%xmm1 # 2c1f0 <_sk_overlay_sse2_8bit+0x10cf>
+ DB 102,15,56,0,13,101,125,1,0 ; pshufb 0x17d65(%rip),%xmm1 # 2c7d0 <_sk_overlay_sse2_8bit+0x10c3>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -19062,7 +19328,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,235,216 ; por %xmm8,%xmm3
DB 102,15,56,51,219 ; pmovzxwd %xmm3,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,76,123,1,0 ; mulps 0x17b4c(%rip),%xmm3 # 2c200 <_sk_overlay_sse2_8bit+0x10df>
+ DB 15,89,29,179,124,1,0 ; mulps 0x17cb3(%rip),%xmm3 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -19070,16 +19336,16 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,67,15,16,4,81 ; movsd (%r9,%r10,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 146d6 <_sk_load_tables_u16_be_sse41+0x192>
+ DB 117,13 ; jne 14b4f <_sk_load_tables_u16_be_sse41+0x192>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,145,254,255,255 ; jmpq 14567 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 233,145,254,255,255 ; jmpq 149e0 <_sk_load_tables_u16_be_sse41+0x23>
DB 102,67,15,22,68,81,8 ; movhpd 0x8(%r9,%r10,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,124,254,255,255 ; jb 14567 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 15,130,124,254,255,255 ; jb 149e0 <_sk_load_tables_u16_be_sse41+0x23>
DB 243,67,15,126,76,81,16 ; movq 0x10(%r9,%r10,2),%xmm1
- DB 233,112,254,255,255 ; jmpq 14567 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 233,112,254,255,255 ; jmpq 149e0 <_sk_load_tables_u16_be_sse41+0x23>
PUBLIC _sk_load_tables_rgb_u16_be_sse41
_sk_load_tables_rgb_u16_be_sse41 LABEL PROC
@@ -19087,7 +19353,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,83,1,0,0 ; jne 1485c <_sk_load_tables_rgb_u16_be_sse41+0x165>
+ DB 15,133,83,1,0,0 ; jne 14cd5 <_sk_load_tables_rgb_u16_be_sse41+0x165>
DB 243,67,15,111,20,81 ; movdqu (%r9,%r10,2),%xmm2
DB 243,67,15,111,76,81,8 ; movdqu 0x8(%r9,%r10,2),%xmm1
DB 102,15,115,217,4 ; psrldq $0x4,%xmm1
@@ -19102,7 +19368,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
- DB 102,68,15,111,5,145,122,1,0 ; movdqa 0x17a91(%rip),%xmm8 # 2c1e0 <_sk_overlay_sse2_8bit+0x10bf>
+ DB 102,68,15,111,5,248,123,1,0 ; movdqa 0x17bf8(%rip),%xmm8 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -19120,7 +19386,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,15,58,33,195,32 ; insertps $0x20,%xmm3,%xmm0
DB 243,66,15,16,28,11 ; movss (%rbx,%r9,1),%xmm3
DB 102,15,58,33,195,48 ; insertps $0x30,%xmm3,%xmm0
- DB 102,15,56,0,13,96,122,1,0 ; pshufb 0x17a60(%rip),%xmm1 # 2c210 <_sk_overlay_sse2_8bit+0x10ef>
+ DB 102,15,56,0,13,199,123,1,0 ; pshufb 0x17bc7(%rip),%xmm1 # 2c7f0 <_sk_overlay_sse2_8bit+0x10e3>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -19151,7 +19417,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 243,65,15,16,28,25 ; movss (%r9,%rbx,1),%xmm3
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,27,119,1,0 ; movaps 0x1771b(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,130,120,1,0 ; movaps 0x17882(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 65,95 ; pop %r15
@@ -19160,21 +19426,21 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,67,15,196,84,81,4,2 ; pinsrw $0x2,0x4(%r9,%r10,2),%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,14 ; jne 14882 <_sk_load_tables_rgb_u16_be_sse41+0x18b>
+ DB 117,14 ; jne 14cfb <_sk_load_tables_rgb_u16_be_sse41+0x18b>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
- DB 233,173,254,255,255 ; jmpq 1472f <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,173,254,255,255 ; jmpq 14ba8 <_sk_load_tables_rgb_u16_be_sse41+0x38>
DB 102,71,15,110,76,81,6 ; movd 0x6(%r9,%r10,2),%xmm9
DB 102,71,15,196,76,81,10,2 ; pinsrw $0x2,0xa(%r9,%r10,2),%xmm9
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 148b3 <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
+ DB 114,24 ; jb 14d2c <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
DB 102,67,15,110,76,81,12 ; movd 0xc(%r9,%r10,2),%xmm1
DB 102,67,15,196,76,81,16,2 ; pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,124,254,255,255 ; jmpq 1472f <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,124,254,255,255 ; jmpq 14ba8 <_sk_load_tables_rgb_u16_be_sse41+0x38>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,115,254,255,255 ; jmpq 1472f <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,115,254,255,255 ; jmpq 14ba8 <_sk_load_tables_rgb_u16_be_sse41+0x38>
PUBLIC _sk_byte_tables_sse41
_sk_byte_tables_sse41 LABEL PROC
@@ -19183,7 +19449,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 65,84 ; push %r12
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,131,119,1,0 ; movaps 0x17783(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,234,120,1,0 ; movaps 0x178ea(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9
@@ -19202,7 +19468,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,68,120,1,0 ; movaps 0x17844(%rip),%xmm9 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,13,171,121,1,0 ; movaps 0x179ab(%rip),%xmm9 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -19296,7 +19562,7 @@ _sk_byte_tables_rgb_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,172,118,1,0 ; movaps 0x176ac(%rip),%xmm9 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,13,19,120,1,0 ; movaps 0x17813(%rip),%xmm9 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -19473,31 +19739,31 @@ _sk_parametric_r_sse41 LABEL PROC
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,194 ; cvtdq2ps %xmm10,%xmm8
- DB 68,15,89,5,148,116,1,0 ; mulps 0x17494(%rip),%xmm8 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,21,156,116,1,0 ; andps 0x1749c(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,21,196,113,1,0 ; orps 0x171c4(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,5,156,116,1,0 ; addps 0x1749c(%rip),%xmm8 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 68,15,40,37,164,116,1,0 ; movaps 0x174a4(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,5,251,117,1,0 ; mulps 0x175fb(%rip),%xmm8 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,3,118,1,0 ; andps 0x17603(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,43,115,1,0 ; orps 0x1732b(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,5,3,118,1,0 ; addps 0x17603(%rip),%xmm8 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,11,118,1,0 ; movaps 0x1760b(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
- DB 68,15,88,21,164,116,1,0 ; addps 0x174a4(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 68,15,40,37,172,116,1,0 ; movaps 0x174ac(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,21,11,118,1,0 ; addps 0x1760b(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,19,118,1,0 ; movaps 0x17613(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
DB 69,15,89,195 ; mulps %xmm11,%xmm8
DB 102,69,15,58,8,208,1 ; roundps $0x1,%xmm8,%xmm10
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,5,153,116,1,0 ; addps 0x17499(%rip),%xmm8 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 68,15,40,21,161,116,1,0 ; movaps 0x174a1(%rip),%xmm10 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,5,0,118,1,0 ; addps 0x17600(%rip),%xmm8 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,21,8,118,1,0 ; movaps 0x17608(%rip),%xmm10 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 69,15,92,194 ; subps %xmm10,%xmm8
- DB 68,15,40,21,161,116,1,0 ; movaps 0x174a1(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,21,8,118,1,0 ; movaps 0x17608(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 68,15,40,29,165,116,1,0 ; movaps 0x174a5(%rip),%xmm11 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 68,15,40,29,12,118,1,0 ; movaps 0x1760c(%rip),%xmm11 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,218 ; divps %xmm10,%xmm11
DB 69,15,88,216 ; addps %xmm8,%xmm11
- DB 68,15,89,29,165,116,1,0 ; mulps 0x174a5(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 68,15,89,29,12,118,1,0 ; mulps 0x1760c(%rip),%xmm11 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,211 ; cvtps2dq %xmm11,%xmm10
DB 243,68,15,16,64,20 ; movss 0x14(%rax),%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
@@ -19505,7 +19771,7 @@ _sk_parametric_r_sse41 LABEL PROC
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,44,113,1,0 ; minps 0x1712c(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,93,5,147,114,1,0 ; minps 0x17293(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19533,31 +19799,31 @@ _sk_parametric_g_sse41 LABEL PROC
DB 68,15,88,217 ; addps %xmm1,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,109,115,1,0 ; mulps 0x1736d(%rip),%xmm12 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,29,117,115,1,0 ; andps 0x17375(%rip),%xmm11 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,29,157,112,1,0 ; orps 0x1709d(%rip),%xmm11 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,37,117,115,1,0 ; addps 0x17375(%rip),%xmm12 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 15,40,13,126,115,1,0 ; movaps 0x1737e(%rip),%xmm1 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,37,212,116,1,0 ; mulps 0x174d4(%rip),%xmm12 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,29,220,116,1,0 ; andps 0x174dc(%rip),%xmm11 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,29,4,114,1,0 ; orps 0x17204(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,37,220,116,1,0 ; addps 0x174dc(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 15,40,13,229,116,1,0 ; movaps 0x174e5(%rip),%xmm1 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,88,29,126,115,1,0 ; addps 0x1737e(%rip),%xmm11 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 15,40,13,135,115,1,0 ; movaps 0x17387(%rip),%xmm1 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,29,229,116,1,0 ; addps 0x174e5(%rip),%xmm11 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 15,40,13,238,116,1,0 ; movaps 0x174ee(%rip),%xmm1 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,94,203 ; divps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,116,115,1,0 ; addps 0x17374(%rip),%xmm12 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 15,40,13,125,115,1,0 ; movaps 0x1737d(%rip),%xmm1 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,37,219,116,1,0 ; addps 0x174db(%rip),%xmm12 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 15,40,13,228,116,1,0 ; movaps 0x174e4(%rip),%xmm1 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,40,21,125,115,1,0 ; movaps 0x1737d(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,21,228,116,1,0 ; movaps 0x174e4(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,13,130,115,1,0 ; movaps 0x17382(%rip),%xmm1 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 15,40,13,233,116,1,0 ; movaps 0x174e9(%rip),%xmm1 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,94,202 ; divps %xmm10,%xmm1
DB 65,15,88,204 ; addps %xmm12,%xmm1
- DB 15,89,13,131,115,1,0 ; mulps 0x17383(%rip),%xmm1 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 15,89,13,234,116,1,0 ; mulps 0x174ea(%rip),%xmm1 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,68,15,91,209 ; cvtps2dq %xmm1,%xmm10
DB 243,15,16,72,20 ; movss 0x14(%rax),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
@@ -19565,7 +19831,7 @@ _sk_parametric_g_sse41 LABEL PROC
DB 102,65,15,56,20,201 ; blendvps %xmm0,%xmm9,%xmm1
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,200 ; maxps %xmm0,%xmm1
- DB 15,93,13,14,112,1,0 ; minps 0x1700e(%rip),%xmm1 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,93,13,117,113,1,0 ; minps 0x17175(%rip),%xmm1 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19593,31 +19859,31 @@ _sk_parametric_b_sse41 LABEL PROC
DB 68,15,88,218 ; addps %xmm2,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,79,114,1,0 ; mulps 0x1724f(%rip),%xmm12 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,29,87,114,1,0 ; andps 0x17257(%rip),%xmm11 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,29,127,111,1,0 ; orps 0x16f7f(%rip),%xmm11 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,37,87,114,1,0 ; addps 0x17257(%rip),%xmm12 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 15,40,21,96,114,1,0 ; movaps 0x17260(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,37,182,115,1,0 ; mulps 0x173b6(%rip),%xmm12 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,29,190,115,1,0 ; andps 0x173be(%rip),%xmm11 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,29,230,112,1,0 ; orps 0x170e6(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,37,190,115,1,0 ; addps 0x173be(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 15,40,21,199,115,1,0 ; movaps 0x173c7(%rip),%xmm2 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,88,29,96,114,1,0 ; addps 0x17260(%rip),%xmm11 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 15,40,21,105,114,1,0 ; movaps 0x17269(%rip),%xmm2 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,29,199,115,1,0 ; addps 0x173c7(%rip),%xmm11 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 15,40,21,208,115,1,0 ; movaps 0x173d0(%rip),%xmm2 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,94,211 ; divps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,86,114,1,0 ; addps 0x17256(%rip),%xmm12 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 15,40,21,95,114,1,0 ; movaps 0x1725f(%rip),%xmm2 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,37,189,115,1,0 ; addps 0x173bd(%rip),%xmm12 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 15,40,21,198,115,1,0 ; movaps 0x173c6(%rip),%xmm2 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,40,21,95,114,1,0 ; movaps 0x1725f(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,21,198,115,1,0 ; movaps 0x173c6(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,21,100,114,1,0 ; movaps 0x17264(%rip),%xmm2 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 15,40,21,203,115,1,0 ; movaps 0x173cb(%rip),%xmm2 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,94,210 ; divps %xmm10,%xmm2
DB 65,15,88,212 ; addps %xmm12,%xmm2
- DB 15,89,21,101,114,1,0 ; mulps 0x17265(%rip),%xmm2 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 15,89,21,204,115,1,0 ; mulps 0x173cc(%rip),%xmm2 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,68,15,91,210 ; cvtps2dq %xmm2,%xmm10
DB 243,15,16,80,20 ; movss 0x14(%rax),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
@@ -19625,7 +19891,7 @@ _sk_parametric_b_sse41 LABEL PROC
DB 102,65,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm2
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,208 ; maxps %xmm0,%xmm2
- DB 15,93,21,240,110,1,0 ; minps 0x16ef0(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,93,21,87,112,1,0 ; minps 0x17057(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19653,31 +19919,31 @@ _sk_parametric_a_sse41 LABEL PROC
DB 68,15,88,219 ; addps %xmm3,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,49,113,1,0 ; mulps 0x17131(%rip),%xmm12 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,29,57,113,1,0 ; andps 0x17139(%rip),%xmm11 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,29,97,110,1,0 ; orps 0x16e61(%rip),%xmm11 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,37,57,113,1,0 ; addps 0x17139(%rip),%xmm12 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 15,40,29,66,113,1,0 ; movaps 0x17142(%rip),%xmm3 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,37,152,114,1,0 ; mulps 0x17298(%rip),%xmm12 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,29,160,114,1,0 ; andps 0x172a0(%rip),%xmm11 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,29,200,111,1,0 ; orps 0x16fc8(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,37,160,114,1,0 ; addps 0x172a0(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 15,40,29,169,114,1,0 ; movaps 0x172a9(%rip),%xmm3 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,88,29,66,113,1,0 ; addps 0x17142(%rip),%xmm11 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 15,40,29,75,113,1,0 ; movaps 0x1714b(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,29,169,114,1,0 ; addps 0x172a9(%rip),%xmm11 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 15,40,29,178,114,1,0 ; movaps 0x172b2(%rip),%xmm3 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,94,219 ; divps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,56,113,1,0 ; addps 0x17138(%rip),%xmm12 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 15,40,29,65,113,1,0 ; movaps 0x17141(%rip),%xmm3 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,37,159,114,1,0 ; addps 0x1729f(%rip),%xmm12 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 15,40,29,168,114,1,0 ; movaps 0x172a8(%rip),%xmm3 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,40,21,65,113,1,0 ; movaps 0x17141(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,21,168,114,1,0 ; movaps 0x172a8(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,29,70,113,1,0 ; movaps 0x17146(%rip),%xmm3 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 15,40,29,173,114,1,0 ; movaps 0x172ad(%rip),%xmm3 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,94,218 ; divps %xmm10,%xmm3
DB 65,15,88,220 ; addps %xmm12,%xmm3
- DB 15,89,29,71,113,1,0 ; mulps 0x17147(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 15,89,29,174,114,1,0 ; mulps 0x172ae(%rip),%xmm3 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,68,15,91,211 ; cvtps2dq %xmm3,%xmm10
DB 243,15,16,88,20 ; movss 0x14(%rax),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
@@ -19685,7 +19951,7 @@ _sk_parametric_a_sse41 LABEL PROC
DB 102,65,15,56,20,217 ; blendvps %xmm0,%xmm9,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,216 ; maxps %xmm0,%xmm3
- DB 15,93,29,210,109,1,0 ; minps 0x16dd2(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,93,29,57,111,1,0 ; minps 0x16f39(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19701,20 +19967,20 @@ _sk_gamma_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,5,78,112,1,0 ; mulps 0x1704e(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,40,53,86,112,1,0 ; movaps 0x17056(%rip),%xmm14 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
+ DB 15,89,5,181,113,1,0 ; mulps 0x171b5(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,40,53,189,113,1,0 ; movaps 0x171bd(%rip),%xmm14 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
DB 65,15,84,214 ; andps %xmm14,%xmm2
- DB 68,15,40,37,122,109,1,0 ; movaps 0x16d7a(%rip),%xmm12 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,37,225,110,1,0 ; movaps 0x16ee1(%rip),%xmm12 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,86,212 ; orps %xmm12,%xmm2
- DB 68,15,40,21,78,112,1,0 ; movaps 0x1704e(%rip),%xmm10 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
+ DB 68,15,40,21,181,113,1,0 ; movaps 0x171b5(%rip),%xmm10 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,29,82,112,1,0 ; movaps 0x17052(%rip),%xmm11 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,40,29,185,113,1,0 ; movaps 0x171b9(%rip),%xmm11 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 65,15,89,227 ; mulps %xmm11,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 68,15,40,13,80,112,1,0 ; movaps 0x17050(%rip),%xmm9 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
+ DB 68,15,40,13,183,113,1,0 ; movaps 0x171b7(%rip),%xmm9 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 68,15,40,45,84,112,1,0 ; movaps 0x17054(%rip),%xmm13 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,40,45,187,113,1,0 ; movaps 0x171bb(%rip),%xmm13 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,40,229 ; movaps %xmm13,%xmm4
DB 15,94,226 ; divps %xmm2,%xmm4
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -19725,21 +19991,21 @@ _sk_gamma_sse41 LABEL PROC
DB 102,15,58,8,208,1 ; roundps $0x1,%xmm0,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,53,55,112,1,0 ; movaps 0x17037(%rip),%xmm6 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
+ DB 15,40,53,158,113,1,0 ; movaps 0x1719e(%rip),%xmm6 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,40,61,77,112,1,0 ; movaps 0x1704d(%rip),%xmm7 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 15,40,61,180,113,1,0 ; movaps 0x171b4(%rip),%xmm7 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,37,45,112,1,0 ; movaps 0x1702d(%rip),%xmm4 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 15,40,37,148,113,1,0 ; movaps 0x17194(%rip),%xmm4 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,92,194 ; subps %xmm2,%xmm0
- DB 68,15,40,61,63,112,1,0 ; movaps 0x1703f(%rip),%xmm15 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 68,15,40,61,166,113,1,0 ; movaps 0x171a6(%rip),%xmm15 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,40,215 ; movaps %xmm15,%xmm2
DB 15,94,213 ; divps %xmm5,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,5,155,111,1,0 ; mulps 0x16f9b(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
+ DB 15,89,5,2,113,1,0 ; mulps 0x17102(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
DB 65,15,84,206 ; andps %xmm14,%xmm1
DB 65,15,86,204 ; orps %xmm12,%xmm1
DB 65,15,88,194 ; addps %xmm10,%xmm0
@@ -19765,8 +20031,8 @@ _sk_gamma_sse41 LABEL PROC
DB 15,94,206 ; divps %xmm6,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,5,60,111,1,0 ; mulps 0x16f3c(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 15,84,29,69,111,1,0 ; andps 0x16f45(%rip),%xmm3 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
+ DB 15,89,5,163,112,1,0 ; mulps 0x170a3(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 15,84,29,172,112,1,0 ; andps 0x170ac(%rip),%xmm3 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
DB 65,15,86,220 ; orps %xmm12,%xmm3
DB 65,15,88,194 ; addps %xmm10,%xmm0
DB 68,15,89,219 ; mulps %xmm3,%xmm11
@@ -19784,7 +20050,7 @@ _sk_gamma_sse41 LABEL PROC
DB 15,92,253 ; subps %xmm5,%xmm7
DB 68,15,94,255 ; divps %xmm7,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 15,40,5,141,111,1,0 ; movaps 0x16f8d(%rip),%xmm0 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 15,40,5,244,112,1,0 ; movaps 0x170f4(%rip),%xmm0 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 68,15,89,248 ; mulps %xmm0,%xmm15
@@ -19803,29 +20069,29 @@ _sk_gamma_sse41 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse41
_sk_lab_to_xyz_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,89,5,90,111,1,0 ; mulps 0x16f5a(%rip),%xmm8 # 2c2d0 <_sk_overlay_sse2_8bit+0x11af>
- DB 68,15,40,13,210,108,1,0 ; movaps 0x16cd2(%rip),%xmm9 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,89,5,193,112,1,0 ; mulps 0x170c1(%rip),%xmm8 # 2c8b0 <_sk_overlay_sse2_8bit+0x11a3>
+ DB 68,15,40,13,57,110,1,0 ; movaps 0x16e39(%rip),%xmm9 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 15,40,5,87,111,1,0 ; movaps 0x16f57(%rip),%xmm0 # 2c2e0 <_sk_overlay_sse2_8bit+0x11bf>
+ DB 15,40,5,190,112,1,0 ; movaps 0x170be(%rip),%xmm0 # 2c8c0 <_sk_overlay_sse2_8bit+0x11b3>
DB 15,88,200 ; addps %xmm0,%xmm1
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,88,5,85,111,1,0 ; addps 0x16f55(%rip),%xmm8 # 2c2f0 <_sk_overlay_sse2_8bit+0x11cf>
- DB 68,15,89,5,93,111,1,0 ; mulps 0x16f5d(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0x11df>
- DB 15,89,13,102,111,1,0 ; mulps 0x16f66(%rip),%xmm1 # 2c310 <_sk_overlay_sse2_8bit+0x11ef>
+ DB 68,15,88,5,188,112,1,0 ; addps 0x170bc(%rip),%xmm8 # 2c8d0 <_sk_overlay_sse2_8bit+0x11c3>
+ DB 68,15,89,5,196,112,1,0 ; mulps 0x170c4(%rip),%xmm8 # 2c8e0 <_sk_overlay_sse2_8bit+0x11d3>
+ DB 15,89,13,205,112,1,0 ; mulps 0x170cd(%rip),%xmm1 # 2c8f0 <_sk_overlay_sse2_8bit+0x11e3>
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 15,89,21,107,111,1,0 ; mulps 0x16f6b(%rip),%xmm2 # 2c320 <_sk_overlay_sse2_8bit+0x11ff>
+ DB 15,89,21,210,112,1,0 ; mulps 0x170d2(%rip),%xmm2 # 2c900 <_sk_overlay_sse2_8bit+0x11f3>
DB 69,15,40,208 ; movaps %xmm8,%xmm10
DB 68,15,92,210 ; subps %xmm2,%xmm10
DB 68,15,40,217 ; movaps %xmm1,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
- DB 68,15,40,13,95,111,1,0 ; movaps 0x16f5f(%rip),%xmm9 # 2c330 <_sk_overlay_sse2_8bit+0x120f>
+ DB 68,15,40,13,198,112,1,0 ; movaps 0x170c6(%rip),%xmm9 # 2c910 <_sk_overlay_sse2_8bit+0x1203>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 15,40,21,95,111,1,0 ; movaps 0x16f5f(%rip),%xmm2 # 2c340 <_sk_overlay_sse2_8bit+0x121f>
+ DB 15,40,21,198,112,1,0 ; movaps 0x170c6(%rip),%xmm2 # 2c920 <_sk_overlay_sse2_8bit+0x1213>
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 68,15,40,37,100,111,1,0 ; movaps 0x16f64(%rip),%xmm12 # 2c350 <_sk_overlay_sse2_8bit+0x122f>
+ DB 68,15,40,37,203,112,1,0 ; movaps 0x170cb(%rip),%xmm12 # 2c930 <_sk_overlay_sse2_8bit+0x1223>
DB 65,15,89,204 ; mulps %xmm12,%xmm1
DB 102,65,15,56,20,203 ; blendvps %xmm0,%xmm11,%xmm1
DB 69,15,40,216 ; movaps %xmm8,%xmm11
@@ -19844,8 +20110,8 @@ _sk_lab_to_xyz_sse41 LABEL PROC
DB 65,15,89,212 ; mulps %xmm12,%xmm2
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm2
- DB 15,89,13,29,111,1,0 ; mulps 0x16f1d(%rip),%xmm1 # 2c360 <_sk_overlay_sse2_8bit+0x123f>
- DB 15,89,21,38,111,1,0 ; mulps 0x16f26(%rip),%xmm2 # 2c370 <_sk_overlay_sse2_8bit+0x124f>
+ DB 15,89,13,132,112,1,0 ; mulps 0x17084(%rip),%xmm1 # 2c940 <_sk_overlay_sse2_8bit+0x1233>
+ DB 15,89,21,141,112,1,0 ; mulps 0x1708d(%rip),%xmm2 # 2c950 <_sk_overlay_sse2_8bit+0x1243>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,40,200 ; movaps %xmm8,%xmm1
@@ -19860,11 +20126,11 @@ _sk_load_a8_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,39 ; jne 15494 <_sk_load_a8_sse41+0x3f>
+ DB 117,39 ; jne 1590d <_sk_load_a8_sse41+0x3f>
DB 102,67,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm0
- DB 102,15,219,5,164,107,1,0 ; pand 0x16ba4(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,5,11,109,1,0 ; pand 0x16d0b(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,234,108,1,0 ; mulps 0x16cea(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,29,81,110,1,0 ; mulps 0x16e51(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -19873,12 +20139,12 @@ _sk_load_a8_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 154d6 <_sk_load_a8_sse41+0x81>
+ DB 116,53 ; je 1594f <_sk_load_a8_sse41+0x81>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 154c0 <_sk_load_a8_sse41+0x6b>
+ DB 116,21 ; je 15939 <_sk_load_a8_sse41+0x6b>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 15474 <_sk_load_a8_sse41+0x1f>
+ DB 117,195 ; jne 158ed <_sk_load_a8_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -19886,10 +20152,10 @@ _sk_load_a8_sse41 LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1
DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0
- DB 235,158 ; jmp 15474 <_sk_load_a8_sse41+0x1f>
+ DB 235,158 ; jmp 158ed <_sk_load_a8_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,147 ; jmp 15474 <_sk_load_a8_sse41+0x1f>
+ DB 235,147 ; jmp 158ed <_sk_load_a8_sse41+0x1f>
PUBLIC _sk_load_a8_dst_sse41
_sk_load_a8_dst_sse41 LABEL PROC
@@ -19900,11 +20166,11 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,39 ; jne 15520 <_sk_load_a8_dst_sse41+0x3f>
+ DB 117,39 ; jne 15999 <_sk_load_a8_dst_sse41+0x3f>
DB 102,67,15,56,49,36,25 ; pmovzxbd (%r9,%r11,1),%xmm4
- DB 102,15,219,37,24,107,1,0 ; pand 0x16b18(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,37,127,108,1,0 ; pand 0x16c7f(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
- DB 15,89,61,94,108,1,0 ; mulps 0x16c5e(%rip),%xmm7 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,61,197,109,1,0 ; mulps 0x16dc5(%rip),%xmm7 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
@@ -19913,12 +20179,12 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 15562 <_sk_load_a8_dst_sse41+0x81>
+ DB 116,53 ; je 159db <_sk_load_a8_dst_sse41+0x81>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1554c <_sk_load_a8_dst_sse41+0x6b>
+ DB 116,21 ; je 159c5 <_sk_load_a8_dst_sse41+0x6b>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 15500 <_sk_load_a8_dst_sse41+0x1f>
+ DB 117,195 ; jne 15979 <_sk_load_a8_dst_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -19926,10 +20192,10 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,49,237 ; pmovzxbd %xmm5,%xmm5
DB 102,15,58,14,229,15 ; pblendw $0xf,%xmm5,%xmm4
- DB 235,158 ; jmp 15500 <_sk_load_a8_dst_sse41+0x1f>
+ DB 235,158 ; jmp 15979 <_sk_load_a8_dst_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,147 ; jmp 15500 <_sk_load_a8_dst_sse41+0x1f>
+ DB 235,147 ; jmp 15979 <_sk_load_a8_dst_sse41+0x1f>
PUBLIC _sk_gather_a8_sse41
_sk_gather_a8_sse41 LABEL PROC
@@ -19956,7 +20222,7 @@ _sk_gather_a8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,147,107,1,0 ; mulps 0x16b93(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,29,250,108,1,0 ; mulps 0x16cfa(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -19973,13 +20239,13 @@ _sk_store_a8_sse41 LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,68,106,1,0 ; movaps 0x16a44(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,171,107,1,0 ; movaps 0x16bab(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 15636 <_sk_store_a8_sse41+0x49>
+ DB 117,17 ; jne 15aaf <_sk_store_a8_sse41+0x49>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 67,137,4,25 ; mov %eax,(%r9,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -19989,17 +20255,17 @@ _sk_store_a8_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 15672 <_sk_store_a8_sse41+0x85>
+ DB 116,41 ; je 15aeb <_sk_store_a8_sse41+0x85>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 1565e <_sk_store_a8_sse41+0x71>
+ DB 116,15 ; je 15ad7 <_sk_store_a8_sse41+0x71>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,217 ; jne 1562e <_sk_store_a8_sse41+0x41>
+ DB 117,217 ; jne 15aa7 <_sk_store_a8_sse41+0x41>
DB 102,71,15,58,20,68,25,2,8 ; pextrb $0x8,%xmm8,0x2(%r9,%r11,1)
- DB 102,68,15,56,0,5,24,109,1,0 ; pshufb 0x16d18(%rip),%xmm8 # 2c380 <_sk_overlay_sse2_8bit+0x125f>
+ DB 102,68,15,56,0,5,127,110,1,0 ; pshufb 0x16e7f(%rip),%xmm8 # 2c960 <_sk_overlay_sse2_8bit+0x1253>
DB 102,71,15,58,21,4,25,0 ; pextrw $0x0,%xmm8,(%r9,%r11,1)
- DB 235,188 ; jmp 1562e <_sk_store_a8_sse41+0x41>
+ DB 235,188 ; jmp 15aa7 <_sk_store_a8_sse41+0x41>
DB 102,71,15,58,20,4,25,0 ; pextrb $0x0,%xmm8,(%r9,%r11,1)
- DB 235,178 ; jmp 1562e <_sk_store_a8_sse41+0x41>
+ DB 235,178 ; jmp 15aa7 <_sk_store_a8_sse41+0x41>
PUBLIC _sk_load_g8_sse41
_sk_load_g8_sse41 LABEL PROC
@@ -20010,25 +20276,25 @@ _sk_load_g8_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,42 ; jne 156be <_sk_load_g8_sse41+0x42>
+ DB 117,42 ; jne 15b37 <_sk_load_g8_sse41+0x42>
DB 102,67,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm0
- DB 102,15,219,5,125,105,1,0 ; pand 0x1697d(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,5,228,106,1,0 ; pand 0x16ae4(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,195,106,1,0 ; mulps 0x16ac3(%rip),%xmm0 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,5,42,108,1,0 ; mulps 0x16c2a(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,186,104,1,0 ; movaps 0x168ba(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,33,106,1,0 ; movaps 0x16a21(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 15700 <_sk_load_g8_sse41+0x84>
+ DB 116,53 ; je 15b79 <_sk_load_g8_sse41+0x84>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 156ea <_sk_load_g8_sse41+0x6e>
+ DB 116,21 ; je 15b63 <_sk_load_g8_sse41+0x6e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 1569b <_sk_load_g8_sse41+0x1f>
+ DB 117,192 ; jne 15b14 <_sk_load_g8_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -20036,10 +20302,10 @@ _sk_load_g8_sse41 LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1
DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0
- DB 235,155 ; jmp 1569b <_sk_load_g8_sse41+0x1f>
+ DB 235,155 ; jmp 15b14 <_sk_load_g8_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,144 ; jmp 1569b <_sk_load_g8_sse41+0x1f>
+ DB 235,144 ; jmp 15b14 <_sk_load_g8_sse41+0x1f>
PUBLIC _sk_load_g8_dst_sse41
_sk_load_g8_dst_sse41 LABEL PROC
@@ -20050,25 +20316,25 @@ _sk_load_g8_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,42 ; jne 1574d <_sk_load_g8_dst_sse41+0x42>
+ DB 117,42 ; jne 15bc6 <_sk_load_g8_dst_sse41+0x42>
DB 102,67,15,56,49,36,25 ; pmovzxbd (%r9,%r11,1),%xmm4
- DB 102,15,219,37,238,104,1,0 ; pand 0x168ee(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,37,85,106,1,0 ; pand 0x16a55(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,52,106,1,0 ; mulps 0x16a34(%rip),%xmm4 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,37,155,107,1,0 ; mulps 0x16b9b(%rip),%xmm4 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,43,104,1,0 ; movaps 0x1682b(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,61,146,105,1,0 ; movaps 0x16992(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 1578f <_sk_load_g8_dst_sse41+0x84>
+ DB 116,53 ; je 15c08 <_sk_load_g8_dst_sse41+0x84>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 15779 <_sk_load_g8_dst_sse41+0x6e>
+ DB 116,21 ; je 15bf2 <_sk_load_g8_dst_sse41+0x6e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 1572a <_sk_load_g8_dst_sse41+0x1f>
+ DB 117,192 ; jne 15ba3 <_sk_load_g8_dst_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -20076,10 +20342,10 @@ _sk_load_g8_dst_sse41 LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,49,237 ; pmovzxbd %xmm5,%xmm5
DB 102,15,58,14,229,15 ; pblendw $0xf,%xmm5,%xmm4
- DB 235,155 ; jmp 1572a <_sk_load_g8_dst_sse41+0x1f>
+ DB 235,155 ; jmp 15ba3 <_sk_load_g8_dst_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,144 ; jmp 1572a <_sk_load_g8_dst_sse41+0x1f>
+ DB 235,144 ; jmp 15ba3 <_sk_load_g8_dst_sse41+0x1f>
PUBLIC _sk_gather_g8_sse41
_sk_gather_g8_sse41 LABEL PROC
@@ -20106,9 +20372,9 @@ _sk_gather_g8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,102,105,1,0 ; mulps 0x16966(%rip),%xmm0 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,5,205,106,1,0 ; mulps 0x16acd(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,93,103,1,0 ; movaps 0x1675d(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,196,104,1,0 ; movaps 0x168c4(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 91 ; pop %rbx
@@ -20124,41 +20390,41 @@ _sk_load_565_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,80 ; jne 15887 <_sk_load_565_sse41+0x6b>
+ DB 117,80 ; jne 15d00 <_sk_load_565_sse41+0x6b>
DB 102,67,15,56,51,20,89 ; pmovzxwd (%r9,%r11,2),%xmm2
- DB 102,15,111,5,58,105,1,0 ; movdqa 0x1693a(%rip),%xmm0 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
+ DB 102,15,111,5,161,106,1,0 ; movdqa 0x16aa1(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,60,105,1,0 ; mulps 0x1693c(%rip),%xmm0 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,15,111,13,68,105,1,0 ; movdqa 0x16944(%rip),%xmm1 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
+ DB 15,89,5,163,106,1,0 ; mulps 0x16aa3(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,13,171,106,1,0 ; movdqa 0x16aab(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,70,105,1,0 ; mulps 0x16946(%rip),%xmm1 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,15,219,21,78,105,1,0 ; pand 0x1694e(%rip),%xmm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 15,89,13,173,106,1,0 ; mulps 0x16aad(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,21,181,106,1,0 ; pand 0x16ab5(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,84,105,1,0 ; mulps 0x16954(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
+ DB 15,89,21,187,106,1,0 ; mulps 0x16abb(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,235,102,1,0 ; movaps 0x166eb(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,82,104,1,0 ; movaps 0x16852(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 158c9 <_sk_load_565_sse41+0xad>
+ DB 116,53 ; je 15d42 <_sk_load_565_sse41+0xad>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 158b3 <_sk_load_565_sse41+0x97>
+ DB 116,21 ; je 15d2c <_sk_load_565_sse41+0x97>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 1583e <_sk_load_565_sse41+0x22>
+ DB 117,154 ; jne 15cb7 <_sk_load_565_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 102,15,58,14,208,15 ; pblendw $0xf,%xmm0,%xmm2
- DB 233,117,255,255,255 ; jmpq 1583e <_sk_load_565_sse41+0x22>
+ DB 233,117,255,255,255 ; jmpq 15cb7 <_sk_load_565_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,103,255,255,255 ; jmpq 1583e <_sk_load_565_sse41+0x22>
+ DB 233,103,255,255,255 ; jmpq 15cb7 <_sk_load_565_sse41+0x22>
PUBLIC _sk_load_565_dst_sse41
_sk_load_565_dst_sse41 LABEL PROC
@@ -20170,41 +20436,41 @@ _sk_load_565_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,80 ; jne 15942 <_sk_load_565_dst_sse41+0x6b>
+ DB 117,80 ; jne 15dbb <_sk_load_565_dst_sse41+0x6b>
DB 102,67,15,56,51,52,89 ; pmovzxwd (%r9,%r11,2),%xmm6
- DB 102,15,111,37,127,104,1,0 ; movdqa 0x1687f(%rip),%xmm4 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
+ DB 102,15,111,37,230,105,1,0 ; movdqa 0x169e6(%rip),%xmm4 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,129,104,1,0 ; mulps 0x16881(%rip),%xmm4 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,15,111,45,137,104,1,0 ; movdqa 0x16889(%rip),%xmm5 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
+ DB 15,89,37,232,105,1,0 ; mulps 0x169e8(%rip),%xmm4 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,45,240,105,1,0 ; movdqa 0x169f0(%rip),%xmm5 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,139,104,1,0 ; mulps 0x1688b(%rip),%xmm5 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,15,219,53,147,104,1,0 ; pand 0x16893(%rip),%xmm6 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 15,89,45,242,105,1,0 ; mulps 0x169f2(%rip),%xmm5 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,53,250,105,1,0 ; pand 0x169fa(%rip),%xmm6 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,153,104,1,0 ; mulps 0x16899(%rip),%xmm6 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
+ DB 15,89,53,0,106,1,0 ; mulps 0x16a00(%rip),%xmm6 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,48,102,1,0 ; movaps 0x16630(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,61,151,103,1,0 ; movaps 0x16797(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 15984 <_sk_load_565_dst_sse41+0xad>
+ DB 116,53 ; je 15dfd <_sk_load_565_dst_sse41+0xad>
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1596e <_sk_load_565_dst_sse41+0x97>
+ DB 116,21 ; je 15de7 <_sk_load_565_dst_sse41+0x97>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 158f9 <_sk_load_565_dst_sse41+0x22>
+ DB 117,154 ; jne 15d72 <_sk_load_565_dst_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,56,51,228 ; pmovzxwd %xmm4,%xmm4
DB 102,15,58,14,244,15 ; pblendw $0xf,%xmm4,%xmm6
- DB 233,117,255,255,255 ; jmpq 158f9 <_sk_load_565_dst_sse41+0x22>
+ DB 233,117,255,255,255 ; jmpq 15d72 <_sk_load_565_dst_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,103,255,255,255 ; jmpq 158f9 <_sk_load_565_dst_sse41+0x22>
+ DB 233,103,255,255,255 ; jmpq 15d72 <_sk_load_565_dst_sse41+0x22>
PUBLIC _sk_gather_565_sse41
_sk_gather_565_sse41 LABEL PROC
@@ -20230,19 +20496,19 @@ _sk_gather_565_sse41 LABEL PROC
DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,208 ; pmovzxwd %xmm0,%xmm2
- DB 102,15,111,5,132,103,1,0 ; movdqa 0x16784(%rip),%xmm0 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
+ DB 102,15,111,5,235,104,1,0 ; movdqa 0x168eb(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,134,103,1,0 ; mulps 0x16786(%rip),%xmm0 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,15,111,13,142,103,1,0 ; movdqa 0x1678e(%rip),%xmm1 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
+ DB 15,89,5,237,104,1,0 ; mulps 0x168ed(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,13,245,104,1,0 ; movdqa 0x168f5(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,144,103,1,0 ; mulps 0x16790(%rip),%xmm1 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,15,219,21,152,103,1,0 ; pand 0x16798(%rip),%xmm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 15,89,13,247,104,1,0 ; mulps 0x168f7(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,21,255,104,1,0 ; pand 0x168ff(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,158,103,1,0 ; mulps 0x1679e(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
+ DB 15,89,21,5,105,1,0 ; mulps 0x16905(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,53,101,1,0 ; movaps 0x16535(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,156,102,1,0 ; movaps 0x1669c(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -20255,12 +20521,12 @@ _sk_store_565_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,52,105,1,0 ; movaps 0x16934(%rip),%xmm8 # 2c390 <_sk_overlay_sse2_8bit+0x126f>
+ DB 68,15,40,5,155,106,1,0 ; movaps 0x16a9b(%rip),%xmm8 # 2c970 <_sk_overlay_sse2_8bit+0x1263>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,41,105,1,0 ; movaps 0x16929(%rip),%xmm10 # 2c3a0 <_sk_overlay_sse2_8bit+0x127f>
+ DB 68,15,40,21,144,106,1,0 ; movaps 0x16a90(%rip),%xmm10 # 2c980 <_sk_overlay_sse2_8bit+0x1273>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -20270,7 +20536,7 @@ _sk_store_565_sse41 LABEL PROC
DB 102,69,15,86,194 ; orpd %xmm10,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 15aae <_sk_store_565_sse41+0x70>
+ DB 117,10 ; jne 15f27 <_sk_store_565_sse41+0x70>
DB 242,69,15,17,4,65 ; movsd %xmm8,(%r9,%rax,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20278,17 +20544,17 @@ _sk_store_565_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,35 ; je 15ae4 <_sk_store_565_sse41+0xa6>
+ DB 116,35 ; je 15f5d <_sk_store_565_sse41+0xa6>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 15ad6 <_sk_store_565_sse41+0x98>
+ DB 116,15 ; je 15f4f <_sk_store_565_sse41+0x98>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,221 ; jne 15aaa <_sk_store_565_sse41+0x6c>
+ DB 117,221 ; jne 15f23 <_sk_store_565_sse41+0x6c>
DB 102,69,15,58,21,68,65,4,4 ; pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,69,15,126,4,65 ; movd %xmm8,(%r9,%rax,2)
- DB 235,198 ; jmp 15aaa <_sk_store_565_sse41+0x6c>
+ DB 235,198 ; jmp 15f23 <_sk_store_565_sse41+0x6c>
DB 102,69,15,58,21,4,65,0 ; pextrw $0x0,%xmm8,(%r9,%rax,2)
- DB 235,188 ; jmp 15aaa <_sk_store_565_sse41+0x6c>
+ DB 235,188 ; jmp 15f23 <_sk_store_565_sse41+0x6c>
PUBLIC _sk_load_4444_sse41
_sk_load_4444_sse41 LABEL PROC
@@ -20300,44 +20566,44 @@ _sk_load_4444_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,95 ; jne 15b68 <_sk_load_4444_sse41+0x7a>
+ DB 117,95 ; jne 15fe1 <_sk_load_4444_sse41+0x7a>
DB 102,67,15,56,51,28,89 ; pmovzxwd (%r9,%r11,2),%xmm3
- DB 102,15,111,5,152,104,1,0 ; movdqa 0x16898(%rip),%xmm0 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f>
+ DB 102,15,111,5,255,105,1,0 ; movdqa 0x169ff(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,154,104,1,0 ; mulps 0x1689a(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f>
- DB 102,15,111,13,162,104,1,0 ; movdqa 0x168a2(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af>
+ DB 15,89,5,1,106,1,0 ; mulps 0x16a01(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,13,9,106,1,0 ; movdqa 0x16a09(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,164,104,1,0 ; mulps 0x168a4(%rip),%xmm1 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf>
- DB 102,15,111,21,172,104,1,0 ; movdqa 0x168ac(%rip),%xmm2 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf>
+ DB 15,89,13,11,106,1,0 ; mulps 0x16a0b(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,21,19,106,1,0 ; movdqa 0x16a13(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,174,104,1,0 ; mulps 0x168ae(%rip),%xmm2 # 2c400 <_sk_overlay_sse2_8bit+0x12df>
- DB 102,15,219,29,182,104,1,0 ; pand 0x168b6(%rip),%xmm3 # 2c410 <_sk_overlay_sse2_8bit+0x12ef>
+ DB 15,89,21,21,106,1,0 ; mulps 0x16a15(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,29,29,106,1,0 ; pand 0x16a1d(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,188,104,1,0 ; mulps 0x168bc(%rip),%xmm3 # 2c420 <_sk_overlay_sse2_8bit+0x12ff>
+ DB 15,89,29,35,106,1,0 ; mulps 0x16a23(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 15baa <_sk_load_4444_sse41+0xbc>
+ DB 116,53 ; je 16023 <_sk_load_4444_sse41+0xbc>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 15b94 <_sk_load_4444_sse41+0xa6>
+ DB 116,21 ; je 1600d <_sk_load_4444_sse41+0xa6>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 15b10 <_sk_load_4444_sse41+0x22>
+ DB 117,139 ; jne 15f89 <_sk_load_4444_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,102,255,255,255 ; jmpq 15b10 <_sk_load_4444_sse41+0x22>
+ DB 233,102,255,255,255 ; jmpq 15f89 <_sk_load_4444_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 233,88,255,255,255 ; jmpq 15b10 <_sk_load_4444_sse41+0x22>
+ DB 233,88,255,255,255 ; jmpq 15f89 <_sk_load_4444_sse41+0x22>
PUBLIC _sk_load_4444_dst_sse41
_sk_load_4444_dst_sse41 LABEL PROC
@@ -20349,44 +20615,44 @@ _sk_load_4444_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,95 ; jne 15c32 <_sk_load_4444_dst_sse41+0x7a>
+ DB 117,95 ; jne 160ab <_sk_load_4444_dst_sse41+0x7a>
DB 102,67,15,56,51,60,89 ; pmovzxwd (%r9,%r11,2),%xmm7
- DB 102,15,111,37,206,103,1,0 ; movdqa 0x167ce(%rip),%xmm4 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f>
+ DB 102,15,111,37,53,105,1,0 ; movdqa 0x16935(%rip),%xmm4 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,208,103,1,0 ; mulps 0x167d0(%rip),%xmm4 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f>
- DB 102,15,111,45,216,103,1,0 ; movdqa 0x167d8(%rip),%xmm5 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af>
+ DB 15,89,37,55,105,1,0 ; mulps 0x16937(%rip),%xmm4 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,45,63,105,1,0 ; movdqa 0x1693f(%rip),%xmm5 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,239 ; pand %xmm7,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,218,103,1,0 ; mulps 0x167da(%rip),%xmm5 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf>
- DB 102,15,111,53,226,103,1,0 ; movdqa 0x167e2(%rip),%xmm6 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf>
+ DB 15,89,45,65,105,1,0 ; mulps 0x16941(%rip),%xmm5 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,53,73,105,1,0 ; movdqa 0x16949(%rip),%xmm6 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,228,103,1,0 ; mulps 0x167e4(%rip),%xmm6 # 2c400 <_sk_overlay_sse2_8bit+0x12df>
- DB 102,15,219,61,236,103,1,0 ; pand 0x167ec(%rip),%xmm7 # 2c410 <_sk_overlay_sse2_8bit+0x12ef>
+ DB 15,89,53,75,105,1,0 ; mulps 0x1694b(%rip),%xmm6 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,61,83,105,1,0 ; pand 0x16953(%rip),%xmm7 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,61,242,103,1,0 ; mulps 0x167f2(%rip),%xmm7 # 2c420 <_sk_overlay_sse2_8bit+0x12ff>
+ DB 15,89,61,89,105,1,0 ; mulps 0x16959(%rip),%xmm7 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 15c74 <_sk_load_4444_dst_sse41+0xbc>
+ DB 116,53 ; je 160ed <_sk_load_4444_dst_sse41+0xbc>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 15c5e <_sk_load_4444_dst_sse41+0xa6>
+ DB 116,21 ; je 160d7 <_sk_load_4444_dst_sse41+0xa6>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 15bda <_sk_load_4444_dst_sse41+0x22>
+ DB 117,139 ; jne 16053 <_sk_load_4444_dst_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,56,51,228 ; pmovzxwd %xmm4,%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,102,255,255,255 ; jmpq 15bda <_sk_load_4444_dst_sse41+0x22>
+ DB 233,102,255,255,255 ; jmpq 16053 <_sk_load_4444_dst_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,88,255,255,255 ; jmpq 15bda <_sk_load_4444_dst_sse41+0x22>
+ DB 233,88,255,255,255 ; jmpq 16053 <_sk_load_4444_dst_sse41+0x22>
PUBLIC _sk_gather_4444_sse41
_sk_gather_4444_sse41 LABEL PROC
@@ -20412,21 +20678,21 @@ _sk_gather_4444_sse41 LABEL PROC
DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,216 ; pmovzxwd %xmm0,%xmm3
- DB 102,15,111,5,196,102,1,0 ; movdqa 0x166c4(%rip),%xmm0 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f>
+ DB 102,15,111,5,43,104,1,0 ; movdqa 0x1682b(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,198,102,1,0 ; mulps 0x166c6(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f>
- DB 102,15,111,13,206,102,1,0 ; movdqa 0x166ce(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af>
+ DB 15,89,5,45,104,1,0 ; mulps 0x1682d(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,13,53,104,1,0 ; movdqa 0x16835(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,208,102,1,0 ; mulps 0x166d0(%rip),%xmm1 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf>
- DB 102,15,111,21,216,102,1,0 ; movdqa 0x166d8(%rip),%xmm2 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf>
+ DB 15,89,13,55,104,1,0 ; mulps 0x16837(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,21,63,104,1,0 ; movdqa 0x1683f(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,218,102,1,0 ; mulps 0x166da(%rip),%xmm2 # 2c400 <_sk_overlay_sse2_8bit+0x12df>
- DB 102,15,219,29,226,102,1,0 ; pand 0x166e2(%rip),%xmm3 # 2c410 <_sk_overlay_sse2_8bit+0x12ef>
+ DB 15,89,21,65,104,1,0 ; mulps 0x16841(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,29,73,104,1,0 ; pand 0x16849(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,232,102,1,0 ; mulps 0x166e8(%rip),%xmm3 # 2c420 <_sk_overlay_sse2_8bit+0x12ff>
+ DB 15,89,29,79,104,1,0 ; mulps 0x1684f(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -20440,7 +20706,7 @@ _sk_store_4444_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,213,102,1,0 ; movaps 0x166d5(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x130f>
+ DB 68,15,40,5,60,104,1,0 ; movaps 0x1683c(%rip),%xmm8 # 2ca10 <_sk_overlay_sse2_8bit+0x1303>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -20460,7 +20726,7 @@ _sk_store_4444_sse41 LABEL PROC
DB 102,69,15,86,194 ; orpd %xmm10,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 15dc1 <_sk_store_4444_sse41+0x84>
+ DB 117,10 ; jne 1623a <_sk_store_4444_sse41+0x84>
DB 242,69,15,17,4,65 ; movsd %xmm8,(%r9,%rax,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20468,17 +20734,17 @@ _sk_store_4444_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,35 ; je 15df7 <_sk_store_4444_sse41+0xba>
+ DB 116,35 ; je 16270 <_sk_store_4444_sse41+0xba>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 15de9 <_sk_store_4444_sse41+0xac>
+ DB 116,15 ; je 16262 <_sk_store_4444_sse41+0xac>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,221 ; jne 15dbd <_sk_store_4444_sse41+0x80>
+ DB 117,221 ; jne 16236 <_sk_store_4444_sse41+0x80>
DB 102,69,15,58,21,68,65,4,4 ; pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,69,15,126,4,65 ; movd %xmm8,(%r9,%rax,2)
- DB 235,198 ; jmp 15dbd <_sk_store_4444_sse41+0x80>
+ DB 235,198 ; jmp 16236 <_sk_store_4444_sse41+0x80>
DB 102,69,15,58,21,4,65,0 ; pextrw $0x0,%xmm8,(%r9,%rax,2)
- DB 235,188 ; jmp 15dbd <_sk_store_4444_sse41+0x80>
+ DB 235,188 ; jmp 16236 <_sk_store_4444_sse41+0x80>
PUBLIC _sk_load_8888_sse41
_sk_load_8888_sse41 LABEL PROC
@@ -20490,19 +20756,19 @@ _sk_load_8888_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 15e76 <_sk_load_8888_sse41+0x75>
+ DB 117,89 ; jne 162ef <_sk_load_8888_sse41+0x75>
DB 243,65,15,111,28,129 ; movdqu (%r9,%rax,4),%xmm3
- DB 102,15,111,5,245,97,1,0 ; movdqa 0x161f5(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,5,92,99,1,0 ; movdqa 0x1635c(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,54,99,1,0 ; movaps 0x16336(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,157,100,1,0 ; movaps 0x1649d(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,229,97,1,0 ; pshufb 0x161e5(%rip),%xmm1 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,13,76,99,1,0 ; pshufb 0x1634c(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,225,97,1,0 ; pshufb 0x161e1(%rip),%xmm2 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,21,72,99,1,0 ; pshufb 0x16348(%rip),%xmm2 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -20513,19 +20779,19 @@ _sk_load_8888_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 15eb0 <_sk_load_8888_sse41+0xaf>
+ DB 116,45 ; je 16329 <_sk_load_8888_sse41+0xaf>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 15e9f <_sk_load_8888_sse41+0x9e>
+ DB 116,18 ; je 16318 <_sk_load_8888_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 15e23 <_sk_load_8888_sse41+0x22>
+ DB 117,144 ; jne 1629c <_sk_load_8888_sse41+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 243,65,15,126,4,129 ; movq (%r9,%rax,4),%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,115,255,255,255 ; jmpq 15e23 <_sk_load_8888_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 1629c <_sk_load_8888_sse41+0x22>
DB 102,65,15,110,28,129 ; movd (%r9,%rax,4),%xmm3
- DB 233,104,255,255,255 ; jmpq 15e23 <_sk_load_8888_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 1629c <_sk_load_8888_sse41+0x22>
PUBLIC _sk_load_8888_dst_sse41
_sk_load_8888_dst_sse41 LABEL PROC
@@ -20537,19 +20803,19 @@ _sk_load_8888_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 15f30 <_sk_load_8888_dst_sse41+0x75>
+ DB 117,89 ; jne 163a9 <_sk_load_8888_dst_sse41+0x75>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
- DB 102,15,111,37,59,97,1,0 ; movdqa 0x1613b(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,37,162,98,1,0 ; movdqa 0x162a2(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 68,15,40,5,124,98,1,0 ; movaps 0x1627c(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,227,99,1,0 ; movaps 0x163e3(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,43,97,1,0 ; pshufb 0x1612b(%rip),%xmm5 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,45,146,98,1,0 ; pshufb 0x16292(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 65,15,89,232 ; mulps %xmm8,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,39,97,1,0 ; pshufb 0x16127(%rip),%xmm6 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,53,142,98,1,0 ; pshufb 0x1628e(%rip),%xmm6 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
@@ -20560,19 +20826,19 @@ _sk_load_8888_dst_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 15f6a <_sk_load_8888_dst_sse41+0xaf>
+ DB 116,45 ; je 163e3 <_sk_load_8888_dst_sse41+0xaf>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 15f59 <_sk_load_8888_dst_sse41+0x9e>
+ DB 116,18 ; je 163d2 <_sk_load_8888_dst_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 15edd <_sk_load_8888_dst_sse41+0x22>
+ DB 117,144 ; jne 16356 <_sk_load_8888_dst_sse41+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 243,65,15,126,36,129 ; movq (%r9,%rax,4),%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,115,255,255,255 ; jmpq 15edd <_sk_load_8888_dst_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 16356 <_sk_load_8888_dst_sse41+0x22>
DB 102,65,15,110,60,129 ; movd (%r9,%rax,4),%xmm7
- DB 233,104,255,255,255 ; jmpq 15edd <_sk_load_8888_dst_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 16356 <_sk_load_8888_dst_sse41+0x22>
PUBLIC _sk_gather_8888_sse41
_sk_gather_8888_sse41 LABEL PROC
@@ -20595,17 +20861,17 @@ _sk_gather_8888_sse41 LABEL PROC
DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3
DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3
DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3
- DB 102,15,111,5,74,96,1,0 ; movdqa 0x1604a(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,5,177,97,1,0 ; movdqa 0x161b1(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,139,97,1,0 ; movaps 0x1618b(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,242,98,1,0 ; movaps 0x162f2(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,58,96,1,0 ; pshufb 0x1603a(%rip),%xmm1 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,13,161,97,1,0 ; pshufb 0x161a1(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,54,96,1,0 ; pshufb 0x16036(%rip),%xmm2 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,21,157,97,1,0 ; pshufb 0x1619d(%rip),%xmm2 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -20624,7 +20890,7 @@ _sk_store_8888_sse41 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,15,96,1,0 ; movaps 0x1600f(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,118,97,1,0 ; movaps 0x16176(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -20643,23 +20909,23 @@ _sk_store_8888_sse41 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 160a1 <_sk_store_8888_sse41+0x7f>
+ DB 117,10 ; jne 1651a <_sk_store_8888_sse41+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,29 ; je 160cb <_sk_store_8888_sse41+0xa9>
+ DB 116,29 ; je 16544 <_sk_store_8888_sse41+0xa9>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 160c3 <_sk_store_8888_sse41+0xa1>
+ DB 116,15 ; je 1653c <_sk_store_8888_sse41+0xa1>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 1609d <_sk_store_8888_sse41+0x7b>
+ DB 117,227 ; jne 16516 <_sk_store_8888_sse41+0x7b>
DB 102,69,15,58,22,68,129,8,2 ; pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,210 ; jmp 1609d <_sk_store_8888_sse41+0x7b>
+ DB 235,210 ; jmp 16516 <_sk_store_8888_sse41+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,202 ; jmp 1609d <_sk_store_8888_sse41+0x7b>
+ DB 235,202 ; jmp 16516 <_sk_store_8888_sse41+0x7b>
PUBLIC _sk_load_bgra_sse41
_sk_load_bgra_sse41 LABEL PROC
@@ -20671,19 +20937,19 @@ _sk_load_bgra_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 16148 <_sk_load_bgra_sse41+0x75>
+ DB 117,89 ; jne 165c1 <_sk_load_bgra_sse41+0x75>
DB 243,65,15,111,28,129 ; movdqu (%r9,%rax,4),%xmm3
- DB 102,15,111,5,35,95,1,0 ; movdqa 0x15f23(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,5,138,96,1,0 ; movdqa 0x1608a(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2
- DB 68,15,40,5,100,96,1,0 ; movaps 0x16064(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,203,97,1,0 ; movaps 0x161cb(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,19,95,1,0 ; pshufb 0x15f13(%rip),%xmm0 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,5,122,96,1,0 ; pshufb 0x1607a(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,15,95,1,0 ; pshufb 0x15f0f(%rip),%xmm0 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,5,118,96,1,0 ; pshufb 0x16076(%rip),%xmm0 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -20694,19 +20960,19 @@ _sk_load_bgra_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 16182 <_sk_load_bgra_sse41+0xaf>
+ DB 116,45 ; je 165fb <_sk_load_bgra_sse41+0xaf>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 16171 <_sk_load_bgra_sse41+0x9e>
+ DB 116,18 ; je 165ea <_sk_load_bgra_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 160f5 <_sk_load_bgra_sse41+0x22>
+ DB 117,144 ; jne 1656e <_sk_load_bgra_sse41+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 243,65,15,126,4,129 ; movq (%r9,%rax,4),%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,115,255,255,255 ; jmpq 160f5 <_sk_load_bgra_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 1656e <_sk_load_bgra_sse41+0x22>
DB 102,65,15,110,28,129 ; movd (%r9,%rax,4),%xmm3
- DB 233,104,255,255,255 ; jmpq 160f5 <_sk_load_bgra_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 1656e <_sk_load_bgra_sse41+0x22>
PUBLIC _sk_load_bgra_dst_sse41
_sk_load_bgra_dst_sse41 LABEL PROC
@@ -20718,19 +20984,19 @@ _sk_load_bgra_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 16202 <_sk_load_bgra_dst_sse41+0x75>
+ DB 117,89 ; jne 1667b <_sk_load_bgra_dst_sse41+0x75>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
- DB 102,15,111,37,105,94,1,0 ; movdqa 0x15e69(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,37,208,95,1,0 ; movdqa 0x15fd0(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,244 ; cvtdq2ps %xmm4,%xmm6
- DB 68,15,40,5,170,95,1,0 ; movaps 0x15faa(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,17,97,1,0 ; movaps 0x16111(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,56,0,37,89,94,1,0 ; pshufb 0x15e59(%rip),%xmm4 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,37,192,95,1,0 ; pshufb 0x15fc0(%rip),%xmm4 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,236 ; cvtdq2ps %xmm4,%xmm5
DB 65,15,89,232 ; mulps %xmm8,%xmm5
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,56,0,37,85,94,1,0 ; pshufb 0x15e55(%rip),%xmm4 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,37,188,95,1,0 ; pshufb 0x15fbc(%rip),%xmm4 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
@@ -20741,19 +21007,19 @@ _sk_load_bgra_dst_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 1623c <_sk_load_bgra_dst_sse41+0xaf>
+ DB 116,45 ; je 166b5 <_sk_load_bgra_dst_sse41+0xaf>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 1622b <_sk_load_bgra_dst_sse41+0x9e>
+ DB 116,18 ; je 166a4 <_sk_load_bgra_dst_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 161af <_sk_load_bgra_dst_sse41+0x22>
+ DB 117,144 ; jne 16628 <_sk_load_bgra_dst_sse41+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 243,65,15,126,36,129 ; movq (%r9,%rax,4),%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,115,255,255,255 ; jmpq 161af <_sk_load_bgra_dst_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 16628 <_sk_load_bgra_dst_sse41+0x22>
DB 102,65,15,110,60,129 ; movd (%r9,%rax,4),%xmm7
- DB 233,104,255,255,255 ; jmpq 161af <_sk_load_bgra_dst_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 16628 <_sk_load_bgra_dst_sse41+0x22>
PUBLIC _sk_gather_bgra_sse41
_sk_gather_bgra_sse41 LABEL PROC
@@ -20776,17 +21042,17 @@ _sk_gather_bgra_sse41 LABEL PROC
DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3
DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3
DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3
- DB 102,15,111,5,120,93,1,0 ; movdqa 0x15d78(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,5,223,94,1,0 ; movdqa 0x15edf(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2
- DB 68,15,40,5,185,94,1,0 ; movaps 0x15eb9(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,32,96,1,0 ; movaps 0x16020(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,104,93,1,0 ; pshufb 0x15d68(%rip),%xmm0 # 2c030 <_sk_overlay_sse2_8bit+0xf0f>
+ DB 102,15,56,0,5,207,94,1,0 ; pshufb 0x15ecf(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,100,93,1,0 ; pshufb 0x15d64(%rip),%xmm0 # 2c040 <_sk_overlay_sse2_8bit+0xf1f>
+ DB 102,15,56,0,5,203,94,1,0 ; pshufb 0x15ecb(%rip),%xmm0 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -20805,7 +21071,7 @@ _sk_store_bgra_sse41 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,61,93,1,0 ; movaps 0x15d3d(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,164,94,1,0 ; movaps 0x15ea4(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,40,202 ; movaps %xmm2,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -20824,23 +21090,23 @@ _sk_store_bgra_sse41 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 16373 <_sk_store_bgra_sse41+0x7f>
+ DB 117,10 ; jne 167ec <_sk_store_bgra_sse41+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,29 ; je 1639d <_sk_store_bgra_sse41+0xa9>
+ DB 116,29 ; je 16816 <_sk_store_bgra_sse41+0xa9>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 16395 <_sk_store_bgra_sse41+0xa1>
+ DB 116,15 ; je 1680e <_sk_store_bgra_sse41+0xa1>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 1636f <_sk_store_bgra_sse41+0x7b>
+ DB 117,227 ; jne 167e8 <_sk_store_bgra_sse41+0x7b>
DB 102,69,15,58,22,68,129,8,2 ; pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,210 ; jmp 1636f <_sk_store_bgra_sse41+0x7b>
+ DB 235,210 ; jmp 167e8 <_sk_store_bgra_sse41+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,202 ; jmp 1636f <_sk_store_bgra_sse41+0x7b>
+ DB 235,202 ; jmp 167e8 <_sk_store_bgra_sse41+0x7b>
PUBLIC _sk_load_f16_sse41
_sk_load_f16_sse41 LABEL PROC
@@ -20852,7 +21118,7 @@ _sk_load_f16_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,62,1,0,0 ; jne 16503 <_sk_load_f16_sse41+0x15e>
+ DB 15,133,62,1,0,0 ; jne 1697c <_sk_load_f16_sse41+0x15e>
DB 102,65,15,16,4,193 ; movupd (%r9,%rax,8),%xmm0
DB 243,65,15,111,76,193,16 ; movdqu 0x10(%r9,%rax,8),%xmm1
DB 102,68,15,40,200 ; movapd %xmm0,%xmm9
@@ -20862,18 +21128,18 @@ _sk_load_f16_sse41 LABEL PROC
DB 102,68,15,97,216 ; punpcklwd %xmm0,%xmm11
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,66,96,1,0 ; movdqa 0x16042(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x131f>
+ DB 102,68,15,111,5,169,97,1,0 ; movdqa 0x161a9(%rip),%xmm8 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,61,96,1,0 ; movdqa 0x1603d(%rip),%xmm3 # 2c450 <_sk_overlay_sse2_8bit+0x132f>
+ DB 102,15,111,29,164,97,1,0 ; movdqa 0x161a4(%rip),%xmm3 # 2ca30 <_sk_overlay_sse2_8bit+0x1323>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,41,96,1,0 ; movdqa 0x16029(%rip),%xmm10 # 2c460 <_sk_overlay_sse2_8bit+0x133f>
+ DB 102,68,15,111,21,144,97,1,0 ; movdqa 0x16190(%rip),%xmm10 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -20916,16 +21182,16 @@ _sk_load_f16_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,193 ; movsd (%r9,%rax,8),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 1651c <_sk_load_f16_sse41+0x177>
+ DB 117,13 ; jne 16995 <_sk_load_f16_sse41+0x177>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,182,254,255,255 ; jmpq 163d2 <_sk_load_f16_sse41+0x2d>
+ DB 233,182,254,255,255 ; jmpq 1684b <_sk_load_f16_sse41+0x2d>
DB 102,65,15,22,68,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,161,254,255,255 ; jb 163d2 <_sk_load_f16_sse41+0x2d>
+ DB 15,130,161,254,255,255 ; jb 1684b <_sk_load_f16_sse41+0x2d>
DB 243,65,15,126,76,193,16 ; movq 0x10(%r9,%rax,8),%xmm1
- DB 233,149,254,255,255 ; jmpq 163d2 <_sk_load_f16_sse41+0x2d>
+ DB 233,149,254,255,255 ; jmpq 1684b <_sk_load_f16_sse41+0x2d>
PUBLIC _sk_load_f16_dst_sse41
_sk_load_f16_dst_sse41 LABEL PROC
@@ -20937,7 +21203,7 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,62,1,0,0 ; jne 1669b <_sk_load_f16_dst_sse41+0x15e>
+ DB 15,133,62,1,0,0 ; jne 16b14 <_sk_load_f16_dst_sse41+0x15e>
DB 102,65,15,16,36,193 ; movupd (%r9,%rax,8),%xmm4
DB 243,65,15,111,108,193,16 ; movdqu 0x10(%r9,%rax,8),%xmm5
DB 102,68,15,40,204 ; movapd %xmm4,%xmm9
@@ -20947,18 +21213,18 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 102,68,15,97,220 ; punpcklwd %xmm4,%xmm11
DB 102,68,15,105,204 ; punpckhwd %xmm4,%xmm9
DB 102,65,15,56,51,235 ; pmovzxwd %xmm11,%xmm5
- DB 102,68,15,111,5,170,94,1,0 ; movdqa 0x15eaa(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x131f>
+ DB 102,68,15,111,5,17,96,1,0 ; movdqa 0x16011(%rip),%xmm8 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,245 ; movdqa %xmm5,%xmm6
DB 102,65,15,219,240 ; pand %xmm8,%xmm6
DB 102,15,239,238 ; pxor %xmm6,%xmm5
- DB 102,15,111,61,165,94,1,0 ; movdqa 0x15ea5(%rip),%xmm7 # 2c450 <_sk_overlay_sse2_8bit+0x132f>
+ DB 102,15,111,61,12,96,1,0 ; movdqa 0x1600c(%rip),%xmm7 # 2ca30 <_sk_overlay_sse2_8bit+0x1323>
DB 102,15,114,246,16 ; pslld $0x10,%xmm6
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,15,56,63,231 ; pmaxud %xmm7,%xmm4
DB 102,15,118,229 ; pcmpeqd %xmm5,%xmm4
DB 102,15,114,245,13 ; pslld $0xd,%xmm5
DB 102,15,235,238 ; por %xmm6,%xmm5
- DB 102,68,15,111,21,145,94,1,0 ; movdqa 0x15e91(%rip),%xmm10 # 2c460 <_sk_overlay_sse2_8bit+0x133f>
+ DB 102,68,15,111,21,248,95,1,0 ; movdqa 0x15ff8(%rip),%xmm10 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
DB 102,65,15,254,234 ; paddd %xmm10,%xmm5
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -21001,16 +21267,16 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,36,193 ; movsd (%r9,%rax,8),%xmm4
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 166b4 <_sk_load_f16_dst_sse41+0x177>
+ DB 117,13 ; jne 16b2d <_sk_load_f16_dst_sse41+0x177>
DB 243,15,126,228 ; movq %xmm4,%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
- DB 233,182,254,255,255 ; jmpq 1656a <_sk_load_f16_dst_sse41+0x2d>
+ DB 233,182,254,255,255 ; jmpq 169e3 <_sk_load_f16_dst_sse41+0x2d>
DB 102,65,15,22,100,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,161,254,255,255 ; jb 1656a <_sk_load_f16_dst_sse41+0x2d>
+ DB 15,130,161,254,255,255 ; jb 169e3 <_sk_load_f16_dst_sse41+0x2d>
DB 243,65,15,126,108,193,16 ; movq 0x10(%r9,%rax,8),%xmm5
- DB 233,149,254,255,255 ; jmpq 1656a <_sk_load_f16_dst_sse41+0x2d>
+ DB 233,149,254,255,255 ; jmpq 169e3 <_sk_load_f16_dst_sse41+0x2d>
PUBLIC _sk_gather_f16_sse41
_sk_gather_f16_sse41 LABEL PROC
@@ -21042,18 +21308,18 @@ _sk_gather_f16_sse41 LABEL PROC
DB 102,68,15,97,218 ; punpcklwd %xmm2,%xmm11
DB 102,68,15,105,202 ; punpckhwd %xmm2,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,228,92,1,0 ; movdqa 0x15ce4(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x131f>
+ DB 102,68,15,111,5,75,94,1,0 ; movdqa 0x15e4b(%rip),%xmm8 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,223,92,1,0 ; movdqa 0x15cdf(%rip),%xmm3 # 2c450 <_sk_overlay_sse2_8bit+0x132f>
+ DB 102,15,111,29,70,94,1,0 ; movdqa 0x15e46(%rip),%xmm3 # 2ca30 <_sk_overlay_sse2_8bit+0x1323>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,203,92,1,0 ; movdqa 0x15ccb(%rip),%xmm10 # 2c460 <_sk_overlay_sse2_8bit+0x133f>
+ DB 102,68,15,111,21,50,94,1,0 ; movdqa 0x15e32(%rip),%xmm10 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -21105,17 +21371,17 @@ _sk_store_f16_sse41 LABEL PROC
DB 73,193,225,3 ; shl $0x3,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 102,68,15,111,21,238,91,1,0 ; movdqa 0x15bee(%rip),%xmm10 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
+ DB 102,68,15,111,21,85,93,1,0 ; movdqa 0x15d55(%rip),%xmm10 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
DB 102,68,15,111,216 ; movdqa %xmm0,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,235 ; pxor %xmm11,%xmm13
- DB 102,68,15,111,13,225,91,1,0 ; movdqa 0x15be1(%rip),%xmm9 # 2c480 <_sk_overlay_sse2_8bit+0x135f>
+ DB 102,68,15,111,13,72,93,1,0 ; movdqa 0x15d48(%rip),%xmm9 # 2ca60 <_sk_overlay_sse2_8bit+0x1353>
DB 102,65,15,114,211,16 ; psrld $0x10,%xmm11
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,37,210,91,1,0 ; movdqa 0x15bd2(%rip),%xmm12 # 2c490 <_sk_overlay_sse2_8bit+0x136f>
+ DB 102,68,15,111,37,57,93,1,0 ; movdqa 0x15d39(%rip),%xmm12 # 2ca70 <_sk_overlay_sse2_8bit+0x1363>
DB 102,69,15,235,220 ; por %xmm12,%xmm11
DB 102,69,15,254,221 ; paddd %xmm13,%xmm11
DB 102,69,15,223,195 ; pandn %xmm11,%xmm8
@@ -21159,7 +21425,7 @@ _sk_store_f16_sse41 LABEL PROC
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,69,15,98,203 ; punpckldq %xmm11,%xmm9
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 169b4 <_sk_store_f16_sse41+0x152>
+ DB 117,21 ; jne 16e2d <_sk_store_f16_sse41+0x152>
DB 69,15,17,12,193 ; movups %xmm9,(%r9,%rax,8)
DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8
DB 243,69,15,127,68,193,16 ; movdqu %xmm8,0x10(%r9,%rax,8)
@@ -21167,13 +21433,13 @@ _sk_store_f16_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,12,193 ; movq %xmm9,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 169b0 <_sk_store_f16_sse41+0x14e>
+ DB 116,240 ; je 16e29 <_sk_store_f16_sse41+0x14e>
DB 102,69,15,23,76,193,8 ; movhpd %xmm9,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 169b0 <_sk_store_f16_sse41+0x14e>
+ DB 114,227 ; jb 16e29 <_sk_store_f16_sse41+0x14e>
DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8
DB 102,69,15,214,68,193,16 ; movq %xmm8,0x10(%r9,%rax,8)
- DB 235,213 ; jmp 169b0 <_sk_store_f16_sse41+0x14e>
+ DB 235,213 ; jmp 16e29 <_sk_store_f16_sse41+0x14e>
PUBLIC _sk_load_u16_be_sse41
_sk_load_u16_be_sse41 LABEL PROC
@@ -21186,7 +21452,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,185,0,0,0 ; jne 16abb <_sk_load_u16_be_sse41+0xe0>
+ DB 15,133,185,0,0,0 ; jne 16f34 <_sk_load_u16_be_sse41+0xe0>
DB 102,65,15,16,4,65 ; movupd (%r9,%rax,2),%xmm0
DB 243,65,15,111,76,65,16 ; movdqu 0x10(%r9,%rax,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -21202,7 +21468,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,178,87,1,0 ; movaps 0x157b2(%rip),%xmm8 # 2c200 <_sk_overlay_sse2_8bit+0x10df>
+ DB 68,15,40,5,25,89,1,0 ; movaps 0x15919(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -21230,16 +21496,16 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,65 ; movsd (%r9,%rax,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 16ad4 <_sk_load_u16_be_sse41+0xf9>
+ DB 117,13 ; jne 16f4d <_sk_load_u16_be_sse41+0xf9>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,59,255,255,255 ; jmpq 16a0f <_sk_load_u16_be_sse41+0x34>
+ DB 233,59,255,255,255 ; jmpq 16e88 <_sk_load_u16_be_sse41+0x34>
DB 102,65,15,22,68,65,8 ; movhpd 0x8(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,38,255,255,255 ; jb 16a0f <_sk_load_u16_be_sse41+0x34>
+ DB 15,130,38,255,255,255 ; jb 16e88 <_sk_load_u16_be_sse41+0x34>
DB 243,65,15,126,76,65,16 ; movq 0x10(%r9,%rax,2),%xmm1
- DB 233,26,255,255,255 ; jmpq 16a0f <_sk_load_u16_be_sse41+0x34>
+ DB 233,26,255,255,255 ; jmpq 16e88 <_sk_load_u16_be_sse41+0x34>
PUBLIC _sk_load_rgb_u16_be_sse41
_sk_load_rgb_u16_be_sse41 LABEL PROC
@@ -21254,7 +21520,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,170,0,0,0 ; jne 16bca <_sk_load_rgb_u16_be_sse41+0xd5>
+ DB 15,133,170,0,0,0 ; jne 17043 <_sk_load_rgb_u16_be_sse41+0xd5>
DB 243,65,15,111,20,65 ; movdqu (%r9,%rax,2),%xmm2
DB 243,65,15,111,92,65,8 ; movdqu 0x8(%r9,%rax,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -21274,7 +21540,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,129,86,1,0 ; movaps 0x15681(%rip),%xmm8 # 2c200 <_sk_overlay_sse2_8bit+0x10df>
+ DB 68,15,40,5,232,87,1,0 ; movaps 0x157e8(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -21291,27 +21557,27 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,168,83,1,0 ; movaps 0x153a8(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,15,85,1,0 ; movaps 0x1550f(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2
DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 16bef <_sk_load_rgb_u16_be_sse41+0xfa>
+ DB 117,13 ; jne 17068 <_sk_load_rgb_u16_be_sse41+0xfa>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,85,255,255,255 ; jmpq 16b44 <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,85,255,255,255 ; jmpq 16fbd <_sk_load_rgb_u16_be_sse41+0x4f>
DB 102,65,15,110,68,65,6 ; movd 0x6(%r9,%rax,2),%xmm0
DB 102,65,15,196,68,65,10,2 ; pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 16c20 <_sk_load_rgb_u16_be_sse41+0x12b>
+ DB 114,24 ; jb 17099 <_sk_load_rgb_u16_be_sse41+0x12b>
DB 102,65,15,110,92,65,12 ; movd 0xc(%r9,%rax,2),%xmm3
DB 102,65,15,196,92,65,16,2 ; pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,36,255,255,255 ; jmpq 16b44 <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,36,255,255,255 ; jmpq 16fbd <_sk_load_rgb_u16_be_sse41+0x4f>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,27,255,255,255 ; jmpq 16b44 <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,27,255,255,255 ; jmpq 16fbd <_sk_load_rgb_u16_be_sse41+0x4f>
PUBLIC _sk_store_u16_be_sse41
_sk_store_u16_be_sse41 LABEL PROC
@@ -21323,7 +21589,7 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 68,15,40,21,81,88,1,0 ; movaps 0x15851(%rip),%xmm10 # 2c4a0 <_sk_overlay_sse2_8bit+0x137f>
+ DB 68,15,40,21,184,89,1,0 ; movaps 0x159b8(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0x1373>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -21360,7 +21626,7 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10
DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 16d1d <_sk_store_u16_be_sse41+0xf4>
+ DB 117,21 ; jne 17196 <_sk_store_u16_be_sse41+0xf4>
DB 69,15,17,20,65 ; movups %xmm10,(%r9,%rax,2)
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 243,69,15,127,68,65,16 ; movdqu %xmm8,0x10(%r9,%rax,2)
@@ -21368,13 +21634,13 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,20,65 ; movq %xmm10,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 16d19 <_sk_store_u16_be_sse41+0xf0>
+ DB 116,240 ; je 17192 <_sk_store_u16_be_sse41+0xf0>
DB 102,69,15,23,84,65,8 ; movhpd %xmm10,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 16d19 <_sk_store_u16_be_sse41+0xf0>
+ DB 114,227 ; jb 17192 <_sk_store_u16_be_sse41+0xf0>
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 102,69,15,214,68,65,16 ; movq %xmm8,0x10(%r9,%rax,2)
- DB 235,213 ; jmp 16d19 <_sk_store_u16_be_sse41+0xf0>
+ DB 235,213 ; jmp 17192 <_sk_store_u16_be_sse41+0xf0>
PUBLIC _sk_load_f32_sse41
_sk_load_f32_sse41 LABEL PROC
@@ -21388,7 +21654,7 @@ _sk_load_f32_sse41 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 16daf <_sk_load_f32_sse41+0x6b>
+ DB 117,66 ; jne 17228 <_sk_load_f32_sse41+0x6b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -21408,17 +21674,17 @@ _sk_load_f32_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 16dc1 <_sk_load_f32_sse41+0x7d>
+ DB 117,8 ; jne 1723a <_sk_load_f32_sse41+0x7d>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 235,190 ; jmp 16d7f <_sk_load_f32_sse41+0x3b>
+ DB 235,190 ; jmp 171f8 <_sk_load_f32_sse41+0x3b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 16dd5 <_sk_load_f32_sse41+0x91>
+ DB 114,8 ; jb 1724e <_sk_load_f32_sse41+0x91>
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
- DB 235,170 ; jmp 16d7f <_sk_load_f32_sse41+0x3b>
+ DB 235,170 ; jmp 171f8 <_sk_load_f32_sse41+0x3b>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,165 ; jmp 16d7f <_sk_load_f32_sse41+0x3b>
+ DB 235,165 ; jmp 171f8 <_sk_load_f32_sse41+0x3b>
PUBLIC _sk_load_f32_dst_sse41
_sk_load_f32_dst_sse41 LABEL PROC
@@ -21432,7 +21698,7 @@ _sk_load_f32_dst_sse41 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 16e45 <_sk_load_f32_dst_sse41+0x6b>
+ DB 117,66 ; jne 172be <_sk_load_f32_dst_sse41+0x6b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -21452,17 +21718,17 @@ _sk_load_f32_dst_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 16e57 <_sk_load_f32_dst_sse41+0x7d>
+ DB 117,8 ; jne 172d0 <_sk_load_f32_dst_sse41+0x7d>
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 235,190 ; jmp 16e15 <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,190 ; jmp 1728e <_sk_load_f32_dst_sse41+0x3b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 16e6b <_sk_load_f32_dst_sse41+0x91>
+ DB 114,8 ; jb 172e4 <_sk_load_f32_dst_sse41+0x91>
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
- DB 235,170 ; jmp 16e15 <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,170 ; jmp 1728e <_sk_load_f32_dst_sse41+0x3b>
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,165 ; jmp 16e15 <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,165 ; jmp 1728e <_sk_load_f32_dst_sse41+0x3b>
PUBLIC _sk_store_f32_sse41
_sk_store_f32_sse41 LABEL PROC
@@ -21489,7 +21755,7 @@ _sk_store_f32_sse41 LABEL PROC
DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9
DB 102,69,15,17,36,129 ; movupd %xmm12,(%r9,%rax,4)
DB 77,133,192 ; test %r8,%r8
- DB 117,29 ; jne 16eed <_sk_store_f32_sse41+0x7d>
+ DB 117,29 ; jne 17366 <_sk_store_f32_sse41+0x7d>
DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
@@ -21497,12 +21763,12 @@ _sk_store_f32_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,246 ; je 16ee9 <_sk_store_f32_sse41+0x79>
+ DB 116,246 ; je 17362 <_sk_store_f32_sse41+0x79>
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,234 ; jb 16ee9 <_sk_store_f32_sse41+0x79>
+ DB 114,234 ; jb 17362 <_sk_store_f32_sse41+0x79>
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
- DB 235,225 ; jmp 16ee9 <_sk_store_f32_sse41+0x79>
+ DB 235,225 ; jmp 17362 <_sk_store_f32_sse41+0x79>
PUBLIC _sk_clamp_x_sse41
_sk_clamp_x_sse41 LABEL PROC
@@ -21582,7 +21848,7 @@ _sk_mirror_x_sse41 LABEL PROC
DB 65,15,92,194 ; subps %xmm10,%xmm0
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,119,69,1,0 ; mulss 0x14577(%rip),%xmm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 243,68,15,89,13,234,70,1,0 ; mulss 0x146ea(%rip),%xmm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -21611,7 +21877,7 @@ _sk_mirror_y_sse41 LABEL PROC
DB 65,15,92,202 ; subps %xmm10,%xmm1
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,5,69,1,0 ; mulss 0x14505(%rip),%xmm9 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 243,68,15,89,13,120,70,1,0 ; mulss 0x14678(%rip),%xmm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,201 ; mulps %xmm1,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -21634,7 +21900,7 @@ PUBLIC _sk_clamp_x_1_sse41
_sk_clamp_x_1_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,148,78,1,0 ; minps 0x14e94(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,93,5,251,79,1,0 ; minps 0x14ffb(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -21648,9 +21914,9 @@ _sk_repeat_x_1_sse41 LABEL PROC
PUBLIC _sk_mirror_x_1_sse41
_sk_mirror_x_1_sse41 LABEL PROC
- DB 68,15,40,5,213,78,1,0 ; movaps 0x14ed5(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0xeaf>
+ DB 68,15,40,5,60,80,1,0 ; movaps 0x1503c(%rip),%xmm8 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,89,78,1,0 ; movaps 0x14e59(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,13,192,79,1,0 ; movaps 0x14fc0(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
DB 69,15,88,201 ; addps %xmm9,%xmm9
@@ -21665,10 +21931,10 @@ _sk_mirror_x_1_sse41 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse41
_sk_luminance_to_alpha_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,120,83,1,0 ; mulps 0x15378(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x138f>
- DB 15,89,13,129,83,1,0 ; mulps 0x15381(%rip),%xmm1 # 2c4c0 <_sk_overlay_sse2_8bit+0x139f>
+ DB 15,89,5,223,84,1,0 ; mulps 0x154df(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0x1383>
+ DB 15,89,13,232,84,1,0 ; mulps 0x154e8(%rip),%xmm1 # 2caa0 <_sk_overlay_sse2_8bit+0x1393>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,135,83,1,0 ; mulps 0x15387(%rip),%xmm3 # 2c4d0 <_sk_overlay_sse2_8bit+0x13af>
+ DB 15,89,29,238,84,1,0 ; mulps 0x154ee(%rip),%xmm3 # 2cab0 <_sk_overlay_sse2_8bit+0x13a3>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -21965,9 +22231,9 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 76,139,112,8 ; mov 0x8(%rax),%r14
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js 175eb <_sk_evenly_spaced_gradient_sse41+0x1a>
+ DB 120,7 ; js 17a64 <_sk_evenly_spaced_gradient_sse41+0x1a>
DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1
- DB 235,21 ; jmp 17600 <_sk_evenly_spaced_gradient_sse41+0x2f>
+ DB 235,21 ; jmp 17a79 <_sk_evenly_spaced_gradient_sse41+0x2f>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -22055,15 +22321,15 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse41
_sk_gauss_a_to_rgba_sse41 LABEL PROC
- DB 15,40,5,50,77,1,0 ; movaps 0x14d32(%rip),%xmm0 # 2c4e0 <_sk_overlay_sse2_8bit+0x13bf>
+ DB 15,40,5,153,78,1,0 ; movaps 0x14e99(%rip),%xmm0 # 2cac0 <_sk_overlay_sse2_8bit+0x13b3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,56,77,1,0 ; addps 0x14d38(%rip),%xmm0 # 2c4f0 <_sk_overlay_sse2_8bit+0x13cf>
+ DB 15,88,5,159,78,1,0 ; addps 0x14e9f(%rip),%xmm0 # 2cad0 <_sk_overlay_sse2_8bit+0x13c3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,62,77,1,0 ; addps 0x14d3e(%rip),%xmm0 # 2c500 <_sk_overlay_sse2_8bit+0x13df>
+ DB 15,88,5,165,78,1,0 ; addps 0x14ea5(%rip),%xmm0 # 2cae0 <_sk_overlay_sse2_8bit+0x13d3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,68,77,1,0 ; addps 0x14d44(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0x13ef>
+ DB 15,88,5,171,78,1,0 ; addps 0x14eab(%rip),%xmm0 # 2caf0 <_sk_overlay_sse2_8bit+0x13e3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,74,77,1,0 ; addps 0x14d4a(%rip),%xmm0 # 2c520 <_sk_overlay_sse2_8bit+0x13ff>
+ DB 15,88,5,177,78,1,0 ; addps 0x14eb1(%rip),%xmm0 # 2cb00 <_sk_overlay_sse2_8bit+0x13f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -22079,12 +22345,12 @@ _sk_gradient_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,50 ; jb 17829 <_sk_gradient_sse41+0x46>
+ DB 114,50 ; jb 17ca2 <_sk_gradient_sse41+0x46>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,115,71,1,0 ; movaps 0x14773(%rip),%xmm2 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 15,40,21,218,72,1,0 ; movaps 0x148da(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 243,15,16,27 ; movss (%rbx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -22092,7 +22358,7 @@ _sk_gradient_sse41 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,228 ; jne 1780d <_sk_gradient_sse41+0x2a>
+ DB 117,228 ; jne 17c86 <_sk_gradient_sse41+0x2a>
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 69,137,202 ; mov %r9d,%r10d
DB 73,193,233,32 ; shr $0x20,%r9
@@ -22218,26 +22484,26 @@ _sk_xy_to_unit_angle_sse41 LABEL PROC
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,237 ; mulps %xmm13,%xmm13
- DB 68,15,40,21,180,74,1,0 ; movaps 0x14ab4(%rip),%xmm10 # 2c530 <_sk_overlay_sse2_8bit+0x140f>
+ DB 68,15,40,21,27,76,1,0 ; movaps 0x14c1b(%rip),%xmm10 # 2cb10 <_sk_overlay_sse2_8bit+0x1403>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,184,74,1,0 ; addps 0x14ab8(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0x141f>
+ DB 68,15,88,21,31,76,1,0 ; addps 0x14c1f(%rip),%xmm10 # 2cb20 <_sk_overlay_sse2_8bit+0x1413>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,188,74,1,0 ; addps 0x14abc(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0x142f>
+ DB 68,15,88,21,35,76,1,0 ; addps 0x14c23(%rip),%xmm10 # 2cb30 <_sk_overlay_sse2_8bit+0x1423>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,192,74,1,0 ; addps 0x14ac0(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0x143f>
+ DB 68,15,88,21,39,76,1,0 ; addps 0x14c27(%rip),%xmm10 # 2cb40 <_sk_overlay_sse2_8bit+0x1433>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 68,15,40,29,191,74,1,0 ; movaps 0x14abf(%rip),%xmm11 # 2c570 <_sk_overlay_sse2_8bit+0x144f>
+ DB 68,15,40,29,38,76,1,0 ; movaps 0x14c26(%rip),%xmm11 # 2cb50 <_sk_overlay_sse2_8bit+0x1443>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,40,29,152,68,1,0 ; movaps 0x14498(%rip),%xmm11 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,29,255,69,1,0 ; movaps 0x145ff(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,194,192,1 ; cmpltps %xmm8,%xmm0
- DB 68,15,40,13,138,68,1,0 ; movaps 0x1448a(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,241,69,1,0 ; movaps 0x145f1(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 102,69,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm10
DB 69,15,194,194,7 ; cmpordps %xmm10,%xmm8
@@ -22267,7 +22533,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,51,74,1,0 ; mulps 0x14a33(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f>
+ DB 68,15,89,13,154,75,1,0 ; mulps 0x14b9a(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -22275,7 +22541,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,30,74,1,0 ; mulps 0x14a1e(%rip),%xmm10 # 2c590 <_sk_overlay_sse2_8bit+0x146f>
+ DB 68,15,89,21,133,75,1,0 ; mulps 0x14b85(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -22284,8 +22550,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,214,72,1,0 ; xorps 0x148d6(%rip),%xmm9 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
- DB 68,15,89,5,190,67,1,0 ; mulps 0x143be(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,87,13,61,74,1,0 ; xorps 0x14a3d(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 68,15,89,5,37,69,1,0 ; mulps 0x14525(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -22304,7 +22570,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,149,73,1,0 ; mulps 0x14995(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f>
+ DB 68,15,89,13,252,74,1,0 ; mulps 0x14afc(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -22312,7 +22578,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,128,73,1,0 ; mulps 0x14980(%rip),%xmm10 # 2c590 <_sk_overlay_sse2_8bit+0x146f>
+ DB 68,15,89,21,231,74,1,0 ; mulps 0x14ae7(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -22321,8 +22587,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,56,72,1,0 ; xorps 0x14838(%rip),%xmm9 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
- DB 68,15,89,5,32,67,1,0 ; mulps 0x14320(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,87,13,159,73,1,0 ; xorps 0x1499f(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 68,15,89,5,135,68,1,0 ; mulps 0x14487(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -22338,7 +22604,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC
DB 243,69,15,89,200 ; mulss %xmm8,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,8,73,1,0 ; mulps 0x14908(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f>
+ DB 68,15,89,13,111,74,1,0 ; mulps 0x14a6f(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
@@ -22346,7 +22612,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC
DB 243,69,15,89,192 ; mulss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 15,87,5,212,71,1,0 ; xorps 0x147d4(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
+ DB 15,87,5,59,73,1,0 ; xorps 0x1493b(%rip),%xmm0 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
DB 65,15,94,193 ; divps %xmm9,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22383,7 +22649,7 @@ _sk_apply_vector_mask_sse41 LABEL PROC
PUBLIC _sk_save_xy_sse41
_sk_save_xy_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,90,66,1,0 ; movaps 0x1425a(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,5,193,67,1,0 ; movaps 0x143c1(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -22423,8 +22689,8 @@ _sk_bilinear_nx_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,12,72,1,0 ; addps 0x1480c(%rip),%xmm0 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,212,65,1,0 ; movaps 0x141d4(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,5,115,73,1,0 ; addps 0x14973(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,59,67,1,0 ; movaps 0x1433b(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22435,7 +22701,7 @@ _sk_bilinear_px_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,163,65,1,0 ; addps 0x141a3(%rip),%xmm0 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,88,5,10,67,1,0 ; addps 0x1430a(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22445,8 +22711,8 @@ _sk_bilinear_ny_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,197,71,1,0 ; addps 0x147c5(%rip),%xmm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,141,65,1,0 ; movaps 0x1418d(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,13,44,73,1,0 ; addps 0x1492c(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,244,66,1,0 ; movaps 0x142f4(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22457,7 +22723,7 @@ _sk_bilinear_py_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,91,65,1,0 ; addps 0x1415b(%rip),%xmm1 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,88,13,194,66,1,0 ; addps 0x142c2(%rip),%xmm1 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22467,13 +22733,13 @@ _sk_bicubic_n3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,142,71,1,0 ; addps 0x1478e(%rip),%xmm0 # 2c5b0 <_sk_overlay_sse2_8bit+0x148f>
- DB 68,15,40,13,70,65,1,0 ; movaps 0x14146(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,5,245,72,1,0 ; addps 0x148f5(%rip),%xmm0 # 2cb90 <_sk_overlay_sse2_8bit+0x1483>
+ DB 68,15,40,13,173,66,1,0 ; movaps 0x142ad(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,130,71,1,0 ; mulps 0x14782(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,13,26,67,1,0 ; addps 0x1431a(%rip),%xmm9 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,13,233,72,1,0 ; mulps 0x148e9(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,13,129,68,1,0 ; addps 0x14481(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22484,16 +22750,16 @@ _sk_bicubic_n1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,57,71,1,0 ; addps 0x14739(%rip),%xmm0 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,1,65,1,0 ; movaps 0x14101(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,5,160,72,1,0 ; addps 0x148a0(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,104,66,1,0 ; movaps 0x14268(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,85,71,1,0 ; movaps 0x14755(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,5,188,72,1,0 ; movaps 0x148bc(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,89,71,1,0 ; addps 0x14759(%rip),%xmm8 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,5,192,72,1,0 ; addps 0x148c0(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,205,64,1,0 ; addps 0x140cd(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,88,5,52,66,1,0 ; addps 0x14234(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,81,71,1,0 ; addps 0x14751(%rip),%xmm8 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,5,184,72,1,0 ; addps 0x148b8(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22501,17 +22767,17 @@ _sk_bicubic_n1x_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse41
_sk_bicubic_p1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,171,64,1,0 ; movaps 0x140ab(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,5,18,66,1,0 ; movaps 0x14212(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,7,71,1,0 ; movaps 0x14707(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,21,110,72,1,0 ; movaps 0x1486e(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,11,71,1,0 ; addps 0x1470b(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,21,114,72,1,0 ; addps 0x14872(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,7,71,1,0 ; addps 0x14707(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,21,110,72,1,0 ; addps 0x1486e(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22521,11 +22787,11 @@ _sk_bicubic_p3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,218,70,1,0 ; addps 0x146da(%rip),%xmm0 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 15,88,5,65,72,1,0 ; addps 0x14841(%rip),%xmm0 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,170,70,1,0 ; mulps 0x146aa(%rip),%xmm8 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,5,66,66,1,0 ; addps 0x14242(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,5,17,72,1,0 ; mulps 0x14811(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,5,169,67,1,0 ; addps 0x143a9(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22536,13 +22802,13 @@ _sk_bicubic_n3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,112,70,1,0 ; addps 0x14670(%rip),%xmm1 # 2c5b0 <_sk_overlay_sse2_8bit+0x148f>
- DB 68,15,40,13,40,64,1,0 ; movaps 0x14028(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,13,215,71,1,0 ; addps 0x147d7(%rip),%xmm1 # 2cb90 <_sk_overlay_sse2_8bit+0x1483>
+ DB 68,15,40,13,143,65,1,0 ; movaps 0x1418f(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,100,70,1,0 ; mulps 0x14664(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,13,252,65,1,0 ; addps 0x141fc(%rip),%xmm9 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,13,203,71,1,0 ; mulps 0x147cb(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,13,99,67,1,0 ; addps 0x14363(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22553,16 +22819,16 @@ _sk_bicubic_n1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,26,70,1,0 ; addps 0x1461a(%rip),%xmm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,226,63,1,0 ; movaps 0x13fe2(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,13,129,71,1,0 ; addps 0x14781(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,73,65,1,0 ; movaps 0x14149(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,54,70,1,0 ; movaps 0x14636(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,5,157,71,1,0 ; movaps 0x1479d(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,58,70,1,0 ; addps 0x1463a(%rip),%xmm8 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,5,161,71,1,0 ; addps 0x147a1(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,174,63,1,0 ; addps 0x13fae(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,88,5,21,65,1,0 ; addps 0x14115(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,50,70,1,0 ; addps 0x14632(%rip),%xmm8 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,5,153,71,1,0 ; addps 0x14799(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22570,17 +22836,17 @@ _sk_bicubic_n1y_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse41
_sk_bicubic_p1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,140,63,1,0 ; movaps 0x13f8c(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,5,243,64,1,0 ; movaps 0x140f3(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,231,69,1,0 ; movaps 0x145e7(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,21,78,71,1,0 ; movaps 0x1474e(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,235,69,1,0 ; addps 0x145eb(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,21,82,71,1,0 ; addps 0x14752(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,231,69,1,0 ; addps 0x145e7(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,21,78,71,1,0 ; addps 0x1474e(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22590,11 +22856,11 @@ _sk_bicubic_p3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,185,69,1,0 ; addps 0x145b9(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 15,88,13,32,71,1,0 ; addps 0x14720(%rip),%xmm1 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,137,69,1,0 ; mulps 0x14589(%rip),%xmm8 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,5,33,65,1,0 ; addps 0x14121(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,5,240,70,1,0 ; mulps 0x146f0(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,5,136,66,1,0 ; addps 0x14288(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22727,10 +22993,10 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,68,15,56,64,227 ; pmulld %xmm3,%xmm12
DB 102,65,15,111,212 ; movdqa %xmm12,%xmm2
DB 102,15,254,209 ; paddd %xmm1,%xmm2
- DB 102,15,111,37,241,67,1,0 ; movdqa 0x143f1(%rip),%xmm4 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,37,88,69,1,0 ; movdqa 0x14558(%rip),%xmm4 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,212 ; pmulld %xmm4,%xmm2
DB 102,68,15,111,220 ; movdqa %xmm4,%xmm11
- DB 102,68,15,111,61,78,61,1,0 ; movdqa 0x13d4e(%rip),%xmm15 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,61,181,62,1,0 ; movdqa 0x13eb5(%rip),%xmm15 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,111,226 ; movdqa %xmm2,%xmm4
DB 102,65,15,254,231 ; paddd %xmm15,%xmm4
DB 102,73,15,58,22,225,1 ; pextrq $0x1,%xmm4,%r9
@@ -22750,7 +23016,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,65,15,58,22,210,1 ; pextrd $0x1,%xmm2,%r10d
DB 102,65,15,58,22,211,2 ; pextrd $0x2,%xmm2,%r11d
DB 102,65,15,58,22,214,3 ; pextrd $0x3,%xmm2,%r14d
- DB 102,68,15,111,13,0,61,1,0 ; movdqa 0x13d00(%rip),%xmm9 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,13,103,62,1,0 ; movdqa 0x13e67(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,209 ; paddd %xmm9,%xmm2
DB 102,73,15,58,22,215,1 ; pextrq $0x1,%xmm2,%r15
DB 102,72,15,126,211 ; movq %xmm2,%rbx
@@ -22764,7 +23030,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 73,193,239,32 ; shr $0x20,%r15
DB 243,66,15,16,20,184 ; movss (%rax,%r15,4),%xmm2
DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6
- DB 15,40,45,21,67,1,0 ; movaps 0x14315(%rip),%xmm5 # 2c600 <_sk_overlay_sse2_8bit+0x14df>
+ DB 15,40,45,124,68,1,0 ; movaps 0x1447c(%rip),%xmm5 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3>
DB 68,15,88,197 ; addps %xmm5,%xmm8
DB 68,15,41,68,36,48 ; movaps %xmm8,0x30(%rsp)
DB 15,40,215 ; movaps %xmm7,%xmm2
@@ -22933,7 +23199,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,68,15,254,232 ; paddd %xmm0,%xmm13
DB 102,65,15,111,212 ; movdqa %xmm12,%xmm2
DB 102,65,15,254,213 ; paddd %xmm13,%xmm2
- DB 102,15,111,45,214,63,1,0 ; movdqa 0x13fd6(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,45,61,65,1,0 ; movdqa 0x1413d(%rip),%xmm5 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,213 ; pmulld %xmm5,%xmm2
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,65,15,254,207 ; paddd %xmm15,%xmm1
@@ -23039,7 +23305,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,69,15,58,22,225,1 ; pextrd $0x1,%xmm12,%r9d
DB 102,69,15,58,22,226,2 ; pextrd $0x2,%xmm12,%r10d
DB 102,69,15,58,22,227,3 ; pextrd $0x3,%xmm12,%r11d
- DB 102,15,111,21,58,55,1,0 ; movdqa 0x1373a(%rip),%xmm2 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,111,21,161,56,1,0 ; movdqa 0x138a1(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,68,15,254,226 ; paddd %xmm2,%xmm12
DB 102,76,15,58,22,225,1 ; pextrq $0x1,%xmm12,%rcx
DB 102,76,15,126,226 ; movq %xmm12,%rdx
@@ -23216,8 +23482,8 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,111,197 ; movdqa %xmm13,%xmm0
DB 102,68,15,127,108,36,48 ; movdqa %xmm13,0x30(%rsp)
DB 102,15,254,193 ; paddd %xmm1,%xmm0
- DB 102,15,56,64,5,130,58,1,0 ; pmulld 0x13a82(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
- DB 102,68,15,111,29,233,51,1,0 ; movdqa 0x133e9(%rip),%xmm11 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,56,64,5,233,59,1,0 ; pmulld 0x13be9(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,68,15,111,29,80,53,1,0 ; movdqa 0x13550(%rip),%xmm11 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,65,15,254,211 ; paddd %xmm11,%xmm2
DB 102,73,15,58,22,209,1 ; pextrq $0x1,%xmm2,%r9
@@ -23237,7 +23503,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,194,1 ; pextrd $0x1,%xmm0,%r10d
DB 102,65,15,58,22,195,2 ; pextrd $0x2,%xmm0,%r11d
DB 102,65,15,58,22,198,3 ; pextrd $0x3,%xmm0,%r14d
- DB 102,68,15,111,5,155,51,1,0 ; movdqa 0x1339b(%rip),%xmm8 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,5,2,53,1,0 ; movdqa 0x13502(%rip),%xmm8 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,192 ; paddd %xmm8,%xmm0
DB 102,73,15,58,22,199,1 ; pextrq $0x1,%xmm0,%r15
DB 102,72,15,126,195 ; movq %xmm0,%rbx
@@ -23251,7 +23517,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 73,193,239,32 ; shr $0x20,%r15
DB 243,66,15,16,4,184 ; movss (%rax,%r15,4),%xmm0
DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5
- DB 15,40,53,176,57,1,0 ; movaps 0x139b0(%rip),%xmm6 # 2c600 <_sk_overlay_sse2_8bit+0x14df>
+ DB 15,40,53,23,59,1,0 ; movaps 0x13b17(%rip),%xmm6 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3>
DB 68,15,88,214 ; addps %xmm6,%xmm10
DB 68,15,41,148,36,176,0,0,0 ; movaps %xmm10,0xb0(%rsp)
DB 15,88,254 ; addps %xmm6,%xmm7
@@ -23264,7 +23530,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,206 ; paddd %xmm6,%xmm1
DB 102,68,15,111,214 ; movdqa %xmm6,%xmm10
DB 102,68,15,127,84,36,32 ; movdqa %xmm10,0x20(%rsp)
- DB 102,15,56,64,13,123,57,1,0 ; pmulld 0x1397b(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,56,64,13,226,58,1,0 ; pmulld 0x13ae2(%rip),%xmm1 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,65,15,254,227 ; paddd %xmm11,%xmm4
DB 102,73,15,58,22,231,1 ; pextrq $0x1,%xmm4,%r15
@@ -23322,11 +23588,11 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
- DB 102,15,111,5,79,56,1,0 ; movdqa 0x1384f(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,5,182,57,1,0 ; movdqa 0x139b6(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,200 ; pmulld %xmm0,%xmm1
DB 102,68,15,111,200 ; movdqa %xmm0,%xmm9
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
- DB 102,68,15,111,5,168,49,1,0 ; movdqa 0x131a8(%rip),%xmm8 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,5,15,51,1,0 ; movdqa 0x1330f(%rip),%xmm8 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,192 ; paddd %xmm8,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -23428,7 +23694,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,68,15,111,108,36,48 ; movdqa 0x30(%rsp),%xmm13
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
- DB 102,15,111,45,28,54,1,0 ; movdqa 0x1361c(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,45,131,55,1,0 ; movdqa 0x13783(%rip),%xmm5 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,205 ; pmulld %xmm5,%xmm1
DB 102,15,126,201 ; movd %xmm1,%ecx
DB 102,15,58,22,202,1 ; pextrd $0x1,%xmm1,%edx
@@ -23440,7 +23706,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,111,29,71,47,1,0 ; movdqa 0x12f47(%rip),%xmm3 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,29,174,48,1,0 ; movdqa 0x130ae(%rip),%xmm3 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,72,15,58,22,209,1 ; pextrq $0x1,%xmm2,%rcx
DB 102,72,15,126,210 ; movq %xmm2,%rdx
@@ -23488,7 +23754,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,194,1 ; pextrd $0x1,%xmm0,%r10d
DB 102,65,15,58,22,198,2 ; pextrd $0x2,%xmm0,%r14d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,15,254,5,117,46,1,0 ; paddd 0x12e75(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,5,220,47,1,0 ; paddd 0x12fdc(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
DB 137,211 ; mov %edx,%ebx
@@ -23517,10 +23783,10 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,100,36,16 ; paddd 0x10(%rsp),%xmm4
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,65,15,254,197 ; paddd %xmm13,%xmm0
- DB 102,68,15,111,45,87,52,1,0 ; movdqa 0x13457(%rip),%xmm13 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,68,15,111,45,190,53,1,0 ; movdqa 0x135be(%rip),%xmm13 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,65,15,56,64,197 ; pmulld %xmm13,%xmm0
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,111,53,181,45,1,0 ; movdqa 0x12db5(%rip),%xmm6 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,53,28,47,1,0 ; movdqa 0x12f1c(%rip),%xmm6 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,206 ; paddd %xmm6,%xmm1
DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
DB 102,72,15,126,202 ; movq %xmm1,%rdx
@@ -23538,7 +23804,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,15,111,61,117,45,1,0 ; movdqa 0x12d75(%rip),%xmm7 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,111,61,220,46,1,0 ; movdqa 0x12edc(%rip),%xmm7 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,199 ; paddd %xmm7,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -23555,7 +23821,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,254,227 ; paddd %xmm11,%xmm4
DB 102,65,15,56,64,229 ; pmulld %xmm13,%xmm4
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
- DB 102,68,15,111,45,255,44,1,0 ; movdqa 0x12cff(%rip),%xmm13 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,45,102,46,1,0 ; movdqa 0x12e66(%rip),%xmm13 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,245 ; paddd %xmm13,%xmm6
DB 102,72,15,58,22,241,1 ; pextrq $0x1,%xmm6,%rcx
DB 102,72,15,126,242 ; movq %xmm6,%rdx
@@ -23634,7 +23900,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,68,15,111,76,36,48 ; movdqa 0x30(%rsp),%xmm9
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,254,194 ; paddd %xmm2,%xmm0
- DB 102,15,111,29,13,50,1,0 ; movdqa 0x1320d(%rip),%xmm3 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,29,116,51,1,0 ; movdqa 0x13374(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,195 ; pmulld %xmm3,%xmm0
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,69,15,111,213 ; movdqa %xmm13,%xmm10
@@ -23655,7 +23921,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,15,111,45,46,43,1,0 ; movdqa 0x12b2e(%rip),%xmm5 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,111,45,149,44,1,0 ; movdqa 0x12c95(%rip),%xmm5 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,197 ; paddd %xmm5,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -23743,7 +24009,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,225,1 ; pextrd $0x1,%xmm4,%r9d
DB 102,65,15,58,22,226,2 ; pextrd $0x2,%xmm4,%r10d
DB 102,65,15,58,22,227,3 ; pextrd $0x3,%xmm4,%r11d
- DB 102,68,15,111,13,106,41,1,0 ; movdqa 0x1296a(%rip),%xmm9 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,13,209,42,1,0 ; movdqa 0x12ad1(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,225 ; paddd %xmm9,%xmm4
DB 102,72,15,58,22,225,1 ; pextrq $0x1,%xmm4,%rcx
DB 102,72,15,126,226 ; movq %xmm4,%rdx
@@ -23825,7 +24091,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,76,36,48 ; paddd 0x30(%rsp),%xmm1
DB 102,65,15,56,64,205 ; pmulld %xmm13,%xmm1
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
- DB 102,68,15,111,37,164,39,1,0 ; movdqa 0x127a4(%rip),%xmm12 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,37,11,41,1,0 ; movdqa 0x1290b(%rip),%xmm12 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,196 ; paddd %xmm12,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -23843,7 +24109,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,201,1 ; pextrd $0x1,%xmm1,%r9d
DB 102,65,15,58,22,202,2 ; pextrd $0x2,%xmm1,%r10d
DB 102,65,15,58,22,203,3 ; pextrd $0x3,%xmm1,%r11d
- DB 102,15,111,29,99,39,1,0 ; movdqa 0x12763(%rip),%xmm3 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,111,29,202,40,1,0 ; movdqa 0x128ca(%rip),%xmm3 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
DB 102,72,15,126,202 ; movq %xmm1,%rdx
@@ -23912,9 +24178,9 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,68,15,254,116,36,16 ; paddd 0x10(%rsp),%xmm14
DB 102,15,111,68,36,48 ; movdqa 0x30(%rsp),%xmm0
DB 102,65,15,254,198 ; paddd %xmm14,%xmm0
- DB 102,15,56,64,5,100,44,1,0 ; pmulld 0x12c64(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,56,64,5,203,45,1,0 ; pmulld 0x12dcb(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,5,200,37,1,0 ; paddd 0x125c8(%rip),%xmm0 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,254,5,47,39,1,0 ; paddd 0x1272f(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
DB 137,213 ; mov %edx,%ebp
@@ -23947,8 +24213,8 @@ _sk_clut_4D_sse41 LABEL PROC
DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0
DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5
DB 102,68,15,254,116,36,32 ; paddd 0x20(%rsp),%xmm14
- DB 102,68,15,56,64,53,173,43,1,0 ; pmulld 0x12bad(%rip),%xmm14 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
- DB 102,15,111,5,21,37,1,0 ; movdqa 0x12515(%rip),%xmm0 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,56,64,53,20,45,1,0 ; pmulld 0x12d14(%rip),%xmm14 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,5,124,38,1,0 ; movdqa 0x1267c(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,198 ; paddd %xmm14,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -24029,7 +24295,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,88,215 ; addps %xmm7,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,144,35,1,0 ; movaps 0x12390(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,247,36,1,0 ; movaps 0x124f7(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 76,137,194 ; mov %r8,%rdx
DB 72,139,76,36,112 ; mov 0x70(%rsp),%rcx
DB 76,139,68,36,120 ; mov 0x78(%rsp),%r8
@@ -24077,13 +24343,13 @@ _sk_start_pipeline_sse2 LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,110 ; jae 19d0b <_sk_start_pipeline_sse2+0xeb>
+ DB 115,110 ; jae 1a184 <_sk_start_pipeline_sse2+0xeb>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,4 ; lea 0x4(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
- DB 119,43 ; ja 19cea <_sk_start_pipeline_sse2+0xca>
+ DB 119,43 ; ja 1a163 <_sk_start_pipeline_sse2+0xca>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 69,49,192 ; xor %r8d,%r8d
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
@@ -24095,17 +24361,17 @@ _sk_start_pipeline_sse2 LABEL PROC
DB 73,131,196,8 ; add $0x8,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,220 ; jbe 19cc6 <_sk_start_pipeline_sse2+0xa6>
+ DB 118,220 ; jbe 1a13f <_sk_start_pipeline_sse2+0xa6>
DB 77,137,248 ; mov %r15,%r8
DB 73,41,208 ; sub %rdx,%r8
- DB 116,13 ; je 19cff <_sk_start_pipeline_sse2+0xdf>
+ DB 116,13 ; je 1a178 <_sk_start_pipeline_sse2+0xdf>
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,164 ; jne 19caf <_sk_start_pipeline_sse2+0x8f>
+ DB 117,164 ; jne 1a128 <_sk_start_pipeline_sse2+0x8f>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -24136,7 +24402,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,21,235,33,1,0 ; movaps 0x121eb(%rip),%xmm2 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,40,21,82,35,1,0 ; movaps 0x12352(%rip),%xmm2 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,7 ; movups (%rdi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -24145,7 +24411,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,218,33,1,0 ; movaps 0x121da(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,65,35,1,0 ; movaps 0x12341(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -24163,14 +24429,14 @@ _sk_dither_sse2 LABEL PROC
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,168,33,1,0 ; movdqa 0x121a8(%rip),%xmm10 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,21,15,35,1,0 ; movdqa 0x1230f(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,148,33,1,0 ; movdqa 0x12194(%rip),%xmm12 # 2bf90 <_sk_overlay_sse2_8bit+0xe6f>
- DB 102,68,15,111,45,155,33,1,0 ; movdqa 0x1219b(%rip),%xmm13 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,37,251,34,1,0 ; movdqa 0x122fb(%rip),%xmm12 # 2c570 <_sk_overlay_sse2_8bit+0xe63>
+ DB 102,68,15,111,45,2,35,1,0 ; movdqa 0x12302(%rip),%xmm13 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -24186,8 +24452,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,86,33,1,0 ; mulps 0x12156(%rip),%xmm8 # 2bfb0 <_sk_overlay_sse2_8bit+0xe8f>
- DB 68,15,88,5,94,33,1,0 ; addps 0x1215e(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0xe9f>
+ DB 68,15,89,5,189,34,1,0 ; mulps 0x122bd(%rip),%xmm8 # 2c590 <_sk_overlay_sse2_8bit+0xe83>
+ DB 68,15,88,5,197,34,1,0 ; addps 0x122c5(%rip),%xmm8 # 2c5a0 <_sk_overlay_sse2_8bit+0xe93>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -24225,7 +24491,7 @@ _sk_uniform_color_sse2 LABEL PROC
PUBLIC _sk_black_color_sse2
_sk_black_color_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,148,32,1,0 ; movaps 0x12094(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,251,33,1,0 ; movaps 0x121fb(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -24234,7 +24500,7 @@ _sk_black_color_sse2 LABEL PROC
PUBLIC _sk_white_color_sse2
_sk_white_color_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,128,32,1,0 ; movaps 0x12080(%rip),%xmm0 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,5,231,33,1,0 ; movaps 0x121e7(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -24272,7 +24538,7 @@ _sk_clear_sse2 LABEL PROC
PUBLIC _sk_srcatop_sse2
_sk_srcatop_sse2 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,48,32,1,0 ; movaps 0x12030(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,151,33,1,0 ; movaps 0x12197(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -24295,7 +24561,7 @@ PUBLIC _sk_dstatop_sse2
_sk_dstatop_sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,227,31,1,0 ; movaps 0x11fe3(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,74,33,1,0 ; movaps 0x1214a(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -24336,7 +24602,7 @@ _sk_dstin_sse2 LABEL PROC
PUBLIC _sk_srcout_sse2
_sk_srcout_sse2 LABEL PROC
- DB 68,15,40,5,119,31,1,0 ; movaps 0x11f77(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,222,32,1,0 ; movaps 0x120de(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -24347,7 +24613,7 @@ _sk_srcout_sse2 LABEL PROC
PUBLIC _sk_dstout_sse2
_sk_dstout_sse2 LABEL PROC
- DB 68,15,40,5,87,31,1,0 ; movaps 0x11f57(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,190,32,1,0 ; movaps 0x120be(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -24362,7 +24628,7 @@ _sk_dstout_sse2 LABEL PROC
PUBLIC _sk_srcover_sse2
_sk_srcover_sse2 LABEL PROC
- DB 68,15,40,5,42,31,1,0 ; movaps 0x11f2a(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,145,32,1,0 ; movaps 0x12091(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -24380,7 +24646,7 @@ _sk_srcover_sse2 LABEL PROC
PUBLIC _sk_dstover_sse2
_sk_dstover_sse2 LABEL PROC
- DB 68,15,40,5,238,30,1,0 ; movaps 0x11eee(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,85,32,1,0 ; movaps 0x12055(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -24404,7 +24670,7 @@ _sk_modulate_sse2 LABEL PROC
PUBLIC _sk_multiply_sse2
_sk_multiply_sse2 LABEL PROC
- DB 68,15,40,5,178,30,1,0 ; movaps 0x11eb2(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,25,32,1,0 ; movaps 0x12019(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -24440,9 +24706,14 @@ _sk_multiply_sse2 LABEL PROC
PUBLIC _sk_plus__sse2
_sk_plus__sse2 LABEL PROC
DB 15,88,196 ; addps %xmm4,%xmm0
+ DB 68,15,40,5,154,31,1,0 ; movaps 0x11f9a(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 15,88,205 ; addps %xmm5,%xmm1
+ DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 15,88,214 ; addps %xmm6,%xmm2
+ DB 65,15,93,208 ; minps %xmm8,%xmm2
DB 15,88,223 ; addps %xmm7,%xmm3
+ DB 65,15,93,216 ; minps %xmm8,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -24473,7 +24744,7 @@ _sk_screen_sse2 LABEL PROC
PUBLIC _sk_xor__sse2
_sk_xor__sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,215,29,1,0 ; movaps 0x11dd7(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,38,31,1,0 ; movaps 0x11f26(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -24519,7 +24790,7 @@ _sk_darken_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,50,29,1,0 ; movaps 0x11d32(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,129,30,1,0 ; movaps 0x11e81(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -24551,7 +24822,7 @@ _sk_lighten_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,199,28,1,0 ; movaps 0x11cc7(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,22,30,1,0 ; movaps 0x11e16(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -24586,7 +24857,7 @@ _sk_difference_sse2 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,81,28,1,0 ; movaps 0x11c51(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,160,29,1,0 ; movaps 0x11da0(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -24612,7 +24883,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,1,28,1,0 ; movaps 0x11c01(%rip),%xmm2 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,21,80,29,1,0 ; movaps 0x11d50(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -24623,7 +24894,7 @@ _sk_exclusion_sse2 LABEL PROC
PUBLIC _sk_colorburn_sse2
_sk_colorburn_sse2 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,13,228,27,1,0 ; movaps 0x11be4(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,51,29,1,0 ; movaps 0x11d33(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -24716,7 +24987,7 @@ _sk_colorburn_sse2 LABEL PROC
PUBLIC _sk_colordodge_sse2
_sk_colordodge_sse2 LABEL PROC
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,140,26,1,0 ; movaps 0x11a8c(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,219,27,1,0 ; movaps 0x11bdb(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 65,15,40,195 ; movaps %xmm11,%xmm0
@@ -24807,7 +25078,7 @@ _sk_hardlight_sse2 LABEL PROC
DB 15,41,52,36 ; movaps %xmm6,(%rsp)
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 68,15,40,29,50,25,1,0 ; movaps 0x11932(%rip),%xmm11 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,29,129,26,1,0 ; movaps 0x11a81(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,194 ; movaps %xmm10,%xmm8
@@ -24894,7 +25165,7 @@ PUBLIC _sk_overlay_sse2
_sk_overlay_sse2 LABEL PROC
DB 68,15,40,193 ; movaps %xmm1,%xmm8
DB 68,15,40,232 ; movaps %xmm0,%xmm13
- DB 68,15,40,13,237,23,1,0 ; movaps 0x117ed(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,60,25,1,0 ; movaps 0x1193c(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -24984,7 +25255,7 @@ _sk_softlight_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 68,15,94,215 ; divps %xmm7,%xmm10
DB 69,15,84,212 ; andps %xmm12,%xmm10
- DB 68,15,40,13,151,22,1,0 ; movaps 0x11697(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,230,23,1,0 ; movaps 0x117e6(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 69,15,92,250 ; subps %xmm10,%xmm15
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -24997,10 +25268,10 @@ _sk_softlight_sse2 LABEL PROC
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,53,193,22,1,0 ; movaps 0x116c1(%rip),%xmm14 # 2bfd0 <_sk_overlay_sse2_8bit+0xeaf>
+ DB 68,15,40,53,16,24,1,0 ; movaps 0x11810(%rip),%xmm14 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3>
DB 69,15,88,222 ; addps %xmm14,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
- DB 68,15,40,21,193,22,1,0 ; movaps 0x116c1(%rip),%xmm10 # 2bfe0 <_sk_overlay_sse2_8bit+0xebf>
+ DB 68,15,40,21,16,24,1,0 ; movaps 0x11810(%rip),%xmm10 # 2c5c0 <_sk_overlay_sse2_8bit+0xeb3>
DB 69,15,89,234 ; mulps %xmm10,%xmm13
DB 69,15,88,235 ; addps %xmm11,%xmm13
DB 15,88,228 ; addps %xmm4,%xmm4
@@ -25145,7 +25416,7 @@ _sk_hue_sse2 LABEL PROC
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 68,15,89,211 ; mulps %xmm3,%xmm10
- DB 68,15,40,5,77,20,1,0 ; movaps 0x1144d(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,156,21,1,0 ; movaps 0x1159c(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 15,40,207 ; movaps %xmm7,%xmm1
DB 68,15,92,217 ; subps %xmm1,%xmm11
@@ -25193,12 +25464,12 @@ _sk_hue_sse2 LABEL PROC
DB 69,15,84,206 ; andps %xmm14,%xmm9
DB 69,15,84,214 ; andps %xmm14,%xmm10
DB 65,15,84,214 ; andps %xmm14,%xmm2
- DB 68,15,40,61,10,20,1,0 ; movaps 0x1140a(%rip),%xmm15 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,61,89,21,1,0 ; movaps 0x11559(%rip),%xmm15 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 65,15,89,231 ; mulps %xmm15,%xmm4
- DB 15,40,5,15,20,1,0 ; movaps 0x1140f(%rip),%xmm0 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 15,40,5,94,21,1,0 ; movaps 0x1155e(%rip),%xmm0 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
- DB 68,15,40,53,17,20,1,0 ; movaps 0x11411(%rip),%xmm14 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
+ DB 68,15,40,53,96,21,1,0 ; movaps 0x11560(%rip),%xmm14 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
DB 68,15,40,239 ; movaps %xmm7,%xmm13
DB 69,15,89,238 ; mulps %xmm14,%xmm13
DB 68,15,88,238 ; addps %xmm6,%xmm13
@@ -25376,14 +25647,14 @@ _sk_saturation_sse2 LABEL PROC
DB 68,15,84,211 ; andps %xmm3,%xmm10
DB 68,15,84,203 ; andps %xmm3,%xmm9
DB 15,84,195 ; andps %xmm3,%xmm0
- DB 68,15,40,5,94,17,1,0 ; movaps 0x1115e(%rip),%xmm8 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,5,173,18,1,0 ; movaps 0x112ad(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 15,40,214 ; movaps %xmm6,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
- DB 15,40,13,96,17,1,0 ; movaps 0x11160(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 15,40,13,175,18,1,0 ; movaps 0x112af(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,217 ; mulps %xmm1,%xmm3
DB 15,88,218 ; addps %xmm2,%xmm3
- DB 68,15,40,37,95,17,1,0 ; movaps 0x1115f(%rip),%xmm12 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
+ DB 68,15,40,37,174,18,1,0 ; movaps 0x112ae(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
DB 65,15,40,210 ; movaps %xmm10,%xmm2
@@ -25428,7 +25699,7 @@ _sk_saturation_sse2 LABEL PROC
DB 15,40,223 ; movaps %xmm7,%xmm3
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,221 ; mulps %xmm5,%xmm3
- DB 68,15,40,5,20,16,1,0 ; movaps 0x11014(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,99,17,1,0 ; movaps 0x11163(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 15,88,253 ; addps %xmm5,%xmm7
@@ -25529,14 +25800,14 @@ _sk_color_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
DB 65,15,40,208 ; movaps %xmm8,%xmm2
- DB 68,15,40,45,28,15,1,0 ; movaps 0x10f1c(%rip),%xmm13 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,45,107,16,1,0 ; movaps 0x1106b(%rip),%xmm13 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,198 ; movaps %xmm6,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,40,53,28,15,1,0 ; movaps 0x10f1c(%rip),%xmm14 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 68,15,40,53,107,16,1,0 ; movaps 0x1106b(%rip),%xmm14 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,29,24,15,1,0 ; movaps 0x10f18(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
+ DB 68,15,40,29,103,16,1,0 ; movaps 0x11067(%rip),%xmm11 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
DB 69,15,89,227 ; mulps %xmm11,%xmm12
DB 68,15,88,224 ; addps %xmm0,%xmm12
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -25544,7 +25815,7 @@ _sk_color_sse2 LABEL PROC
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 68,15,40,5,84,14,1,0 ; movaps 0x10e54(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,163,15,1,0 ; movaps 0x10fa3(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
DB 15,89,252 ; mulps %xmm4,%xmm7
@@ -25680,15 +25951,15 @@ _sk_luminosity_sse2 LABEL PROC
DB 68,15,40,205 ; movaps %xmm5,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 68,15,40,37,214,12,1,0 ; movaps 0x10cd6(%rip),%xmm12 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,37,37,14,1,0 ; movaps 0x10e25(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,199 ; movaps %xmm7,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,214,12,1,0 ; movaps 0x10cd6(%rip),%xmm13 # 2c000 <_sk_overlay_sse2_8bit+0xedf>
+ DB 68,15,40,45,37,14,1,0 ; movaps 0x10e25(%rip),%xmm13 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
DB 68,15,40,241 ; movaps %xmm1,%xmm14
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 69,15,88,240 ; addps %xmm8,%xmm14
- DB 68,15,40,29,210,12,1,0 ; movaps 0x10cd2(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0xeef>
- DB 68,15,40,5,42,12,1,0 ; movaps 0x10c2a(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,29,33,14,1,0 ; movaps 0x10e21(%rip),%xmm11 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
+ DB 68,15,40,5,121,13,1,0 ; movaps 0x10d79(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 68,15,92,248 ; subps %xmm0,%xmm15
@@ -25828,10 +26099,10 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,228,0,0,0 ; jne 1b633 <_sk_srcover_rgba_8888_sse2+0x104>
+ DB 15,133,228,0,0,0 ; jne 1bac4 <_sk_srcover_rgba_8888_sse2+0x104>
DB 243,69,15,111,4,129 ; movdqu (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,53,192,10,1,0 ; movdqa 0x10ac0(%rip),%xmm6 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,53,15,12,1,0 ; movdqa 0x10c0f(%rip),%xmm6 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,224 ; movdqa %xmm8,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
@@ -25845,9 +26116,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 15,91,247 ; cvtdq2ps %xmm7,%xmm6
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,248 ; cvtdq2ps %xmm8,%xmm7
- DB 68,15,40,5,208,9,1,0 ; movaps 0x109d0(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,31,11,1,0 ; movaps 0x10b1f(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,164,10,1,0 ; movaps 0x10aa4(%rip),%xmm12 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,37,243,11,1,0 ; movaps 0x10bf3(%rip),%xmm12 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -25873,7 +26144,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 102,15,114,240,24 ; pslld $0x18,%xmm0
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 102,15,235,193 ; por %xmm1,%xmm0
- DB 117,84 ; jne 1b66d <_sk_srcover_rgba_8888_sse2+0x13e>
+ DB 117,84 ; jne 1bafe <_sk_srcover_rgba_8888_sse2+0x13e>
DB 243,65,15,127,4,129 ; movdqu %xmm0,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -25884,32 +26155,32 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,90 ; je 1b69a <_sk_srcover_rgba_8888_sse2+0x16b>
+ DB 116,90 ; je 1bb2b <_sk_srcover_rgba_8888_sse2+0x16b>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 1b662 <_sk_srcover_rgba_8888_sse2+0x133>
+ DB 116,23 ; je 1baf3 <_sk_srcover_rgba_8888_sse2+0x133>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,0,255,255,255 ; jne 1b555 <_sk_srcover_rgba_8888_sse2+0x26>
+ DB 15,133,0,255,255,255 ; jne 1b9e6 <_sk_srcover_rgba_8888_sse2+0x26>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
DB 102,69,15,18,4,129 ; movlpd (%r9,%rax,4),%xmm8
- DB 233,232,254,255,255 ; jmpq 1b555 <_sk_srcover_rgba_8888_sse2+0x26>
+ DB 233,232,254,255,255 ; jmpq 1b9e6 <_sk_srcover_rgba_8888_sse2+0x26>
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,43 ; je 1b6a5 <_sk_srcover_rgba_8888_sse2+0x176>
+ DB 116,43 ; je 1bb36 <_sk_srcover_rgba_8888_sse2+0x176>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 1b692 <_sk_srcover_rgba_8888_sse2+0x163>
+ DB 116,18 ; je 1bb23 <_sk_srcover_rgba_8888_sse2+0x163>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,153 ; jne 1b61f <_sk_srcover_rgba_8888_sse2+0xf0>
+ DB 117,153 ; jne 1bab0 <_sk_srcover_rgba_8888_sse2+0xf0>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,65,15,126,76,129,8 ; movd %xmm1,0x8(%r9,%rax,4)
DB 102,65,15,214,4,129 ; movq %xmm0,(%r9,%rax,4)
- DB 235,133 ; jmp 1b61f <_sk_srcover_rgba_8888_sse2+0xf0>
+ DB 235,133 ; jmp 1bab0 <_sk_srcover_rgba_8888_sse2+0xf0>
DB 102,69,15,110,4,129 ; movd (%r9,%rax,4),%xmm8
- DB 233,176,254,255,255 ; jmpq 1b555 <_sk_srcover_rgba_8888_sse2+0x26>
+ DB 233,176,254,255,255 ; jmpq 1b9e6 <_sk_srcover_rgba_8888_sse2+0x26>
DB 102,65,15,126,4,129 ; movd %xmm0,(%r9,%rax,4)
- DB 233,111,255,255,255 ; jmpq 1b61f <_sk_srcover_rgba_8888_sse2+0xf0>
+ DB 233,111,255,255,255 ; jmpq 1bab0 <_sk_srcover_rgba_8888_sse2+0xf0>
PUBLIC _sk_clamp_0_sse2
_sk_clamp_0_sse2 LABEL PROC
@@ -25923,7 +26194,7 @@ _sk_clamp_0_sse2 LABEL PROC
PUBLIC _sk_clamp_1_sse2
_sk_clamp_1_sse2 LABEL PROC
- DB 68,15,40,5,160,8,1,0 ; movaps 0x108a0(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,239,9,1,0 ; movaps 0x109ef(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -25933,7 +26204,7 @@ _sk_clamp_1_sse2 LABEL PROC
PUBLIC _sk_clamp_a_sse2
_sk_clamp_a_sse2 LABEL PROC
- DB 15,93,29,133,8,1,0 ; minps 0x10885(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,93,29,212,9,1,0 ; minps 0x109d4(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -25942,7 +26213,7 @@ _sk_clamp_a_sse2 LABEL PROC
PUBLIC _sk_clamp_a_dst_sse2
_sk_clamp_a_dst_sse2 LABEL PROC
- DB 15,93,61,113,8,1,0 ; minps 0x10871(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,93,61,192,9,1,0 ; minps 0x109c0(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,93,239 ; minps %xmm7,%xmm5
DB 15,93,247 ; minps %xmm7,%xmm6
@@ -25971,7 +26242,7 @@ _sk_swap_rb_sse2 LABEL PROC
PUBLIC _sk_invert_sse2
_sk_invert_sse2 LABEL PROC
- DB 68,15,40,5,45,8,1,0 ; movaps 0x1082d(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,5,124,9,1,0 ; movaps 0x1097c(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,200 ; subps %xmm0,%xmm9
DB 69,15,40,208 ; movaps %xmm8,%xmm10
@@ -26023,7 +26294,7 @@ _sk_premul_dst_sse2 LABEL PROC
PUBLIC _sk_unpremul_sse2
_sk_unpremul_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,183,7,1,0 ; movaps 0x107b7(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,6,9,1,0 ; movaps 0x10906(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -26035,20 +26306,20 @@ _sk_unpremul_sse2 LABEL PROC
PUBLIC _sk_from_srgb_sse2
_sk_from_srgb_sse2 LABEL PROC
- DB 68,15,40,5,130,8,1,0 ; movaps 0x10882(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0xf3f>
+ DB 68,15,40,5,209,9,1,0 ; movaps 0x109d1(%rip),%xmm8 # 2c640 <_sk_overlay_sse2_8bit+0xf33>
DB 68,15,40,232 ; movaps %xmm0,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,216 ; movaps %xmm0,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,250,7,1,0 ; movaps 0x107fa(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,13,73,9,1,0 ; movaps 0x10949(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,106,8,1,0 ; movaps 0x1086a(%rip),%xmm10 # 2c070 <_sk_overlay_sse2_8bit+0xf4f>
+ DB 68,15,40,21,185,9,1,0 ; movaps 0x109b9(%rip),%xmm10 # 2c650 <_sk_overlay_sse2_8bit+0xf43>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,106,8,1,0 ; movaps 0x1086a(%rip),%xmm11 # 2c080 <_sk_overlay_sse2_8bit+0xf5f>
+ DB 68,15,40,29,185,9,1,0 ; movaps 0x109b9(%rip),%xmm11 # 2c660 <_sk_overlay_sse2_8bit+0xf53>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,110,8,1,0 ; movaps 0x1086e(%rip),%xmm12 # 2c090 <_sk_overlay_sse2_8bit+0xf6f>
+ DB 68,15,40,37,189,9,1,0 ; movaps 0x109bd(%rip),%xmm12 # 2c670 <_sk_overlay_sse2_8bit+0xf63>
DB 65,15,194,196,1 ; cmpltps %xmm12,%xmm0
DB 68,15,84,232 ; andps %xmm0,%xmm13
DB 65,15,85,198 ; andnps %xmm14,%xmm0
@@ -26082,20 +26353,20 @@ _sk_from_srgb_sse2 LABEL PROC
PUBLIC _sk_from_srgb_dst_sse2
_sk_from_srgb_dst_sse2 LABEL PROC
- DB 68,15,40,5,191,7,1,0 ; movaps 0x107bf(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0xf3f>
+ DB 68,15,40,5,14,9,1,0 ; movaps 0x1090e(%rip),%xmm8 # 2c640 <_sk_overlay_sse2_8bit+0xf33>
DB 68,15,40,236 ; movaps %xmm4,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,220 ; movaps %xmm4,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,55,7,1,0 ; movaps 0x10737(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0xecf>
+ DB 68,15,40,13,134,8,1,0 ; movaps 0x10886(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,244 ; movaps %xmm4,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,167,7,1,0 ; movaps 0x107a7(%rip),%xmm10 # 2c070 <_sk_overlay_sse2_8bit+0xf4f>
+ DB 68,15,40,21,246,8,1,0 ; movaps 0x108f6(%rip),%xmm10 # 2c650 <_sk_overlay_sse2_8bit+0xf43>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,167,7,1,0 ; movaps 0x107a7(%rip),%xmm11 # 2c080 <_sk_overlay_sse2_8bit+0xf5f>
+ DB 68,15,40,29,246,8,1,0 ; movaps 0x108f6(%rip),%xmm11 # 2c660 <_sk_overlay_sse2_8bit+0xf53>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,171,7,1,0 ; movaps 0x107ab(%rip),%xmm12 # 2c090 <_sk_overlay_sse2_8bit+0xf6f>
+ DB 68,15,40,37,250,8,1,0 ; movaps 0x108fa(%rip),%xmm12 # 2c670 <_sk_overlay_sse2_8bit+0xf63>
DB 65,15,194,228,1 ; cmpltps %xmm12,%xmm4
DB 68,15,84,236 ; andps %xmm4,%xmm13
DB 65,15,85,230 ; andnps %xmm14,%xmm4
@@ -26130,22 +26401,22 @@ _sk_from_srgb_dst_sse2 LABEL PROC
PUBLIC _sk_to_srgb_sse2
_sk_to_srgb_sse2 LABEL PROC
DB 68,15,82,232 ; rsqrtps %xmm0,%xmm13
- DB 68,15,40,5,56,7,1,0 ; movaps 0x10738(%rip),%xmm8 # 2c0a0 <_sk_overlay_sse2_8bit+0xf7f>
+ DB 68,15,40,5,135,8,1,0 ; movaps 0x10887(%rip),%xmm8 # 2c680 <_sk_overlay_sse2_8bit+0xf73>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,240 ; mulps %xmm8,%xmm14
- DB 68,15,40,13,56,7,1,0 ; movaps 0x10738(%rip),%xmm9 # 2c0b0 <_sk_overlay_sse2_8bit+0xf8f>
+ DB 68,15,40,13,135,8,1,0 ; movaps 0x10887(%rip),%xmm9 # 2c690 <_sk_overlay_sse2_8bit+0xf83>
DB 69,15,40,253 ; movaps %xmm13,%xmm15
DB 69,15,89,249 ; mulps %xmm9,%xmm15
- DB 68,15,40,21,56,7,1,0 ; movaps 0x10738(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0xf9f>
+ DB 68,15,40,21,135,8,1,0 ; movaps 0x10887(%rip),%xmm10 # 2c6a0 <_sk_overlay_sse2_8bit+0xf93>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,253 ; mulps %xmm13,%xmm15
- DB 68,15,40,29,56,7,1,0 ; movaps 0x10738(%rip),%xmm11 # 2c0d0 <_sk_overlay_sse2_8bit+0xfaf>
+ DB 68,15,40,29,135,8,1,0 ; movaps 0x10887(%rip),%xmm11 # 2c6b0 <_sk_overlay_sse2_8bit+0xfa3>
DB 69,15,88,251 ; addps %xmm11,%xmm15
- DB 68,15,40,37,60,7,1,0 ; movaps 0x1073c(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0xfbf>
+ DB 68,15,40,37,139,8,1,0 ; movaps 0x1088b(%rip),%xmm12 # 2c6c0 <_sk_overlay_sse2_8bit+0xfb3>
DB 69,15,88,236 ; addps %xmm12,%xmm13
DB 69,15,83,237 ; rcpps %xmm13,%xmm13
DB 69,15,89,239 ; mulps %xmm15,%xmm13
- DB 68,15,40,61,56,7,1,0 ; movaps 0x10738(%rip),%xmm15 # 2c0f0 <_sk_overlay_sse2_8bit+0xfcf>
+ DB 68,15,40,61,135,8,1,0 ; movaps 0x10887(%rip),%xmm15 # 2c6d0 <_sk_overlay_sse2_8bit+0xfc3>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,197 ; andnps %xmm13,%xmm0
@@ -26185,15 +26456,17 @@ PUBLIC _sk_rgb_to_hsl_sse2
_sk_rgb_to_hsl_sse2 LABEL PROC
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,40,192 ; movaps %xmm0,%xmm8
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 15,95,194 ; maxps %xmm2,%xmm0
DB 69,15,40,208 ; movaps %xmm8,%xmm10
- DB 69,15,95,209 ; maxps %xmm9,%xmm10
- DB 68,15,95,210 ; maxps %xmm2,%xmm10
+ DB 68,15,95,208 ; maxps %xmm0,%xmm10
+ DB 65,15,40,193 ; movaps %xmm9,%xmm0
+ DB 15,93,194 ; minps %xmm2,%xmm0
DB 69,15,40,216 ; movaps %xmm8,%xmm11
- DB 69,15,93,217 ; minps %xmm9,%xmm11
- DB 68,15,93,218 ; minps %xmm2,%xmm11
+ DB 68,15,93,216 ; minps %xmm0,%xmm11
DB 65,15,40,202 ; movaps %xmm10,%xmm1
DB 65,15,92,203 ; subps %xmm11,%xmm1
- DB 68,15,40,45,1,5,1,0 ; movaps 0x10501(%rip),%xmm13 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,45,74,6,1,0 ; movaps 0x1064a(%rip),%xmm13 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,94,233 ; divps %xmm1,%xmm13
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,194,192,0 ; cmpeqps %xmm8,%xmm0
@@ -26202,30 +26475,30 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,40,241 ; movaps %xmm9,%xmm14
DB 68,15,194,242,1 ; cmpltps %xmm2,%xmm14
- DB 68,15,84,53,103,6,1,0 ; andps 0x10667(%rip),%xmm14 # 2c100 <_sk_overlay_sse2_8bit+0xfdf>
+ DB 68,15,84,53,176,7,1,0 ; andps 0x107b0(%rip),%xmm14 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3>
DB 69,15,88,244 ; addps %xmm12,%xmm14
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,194,249,0 ; cmpeqps %xmm9,%xmm15
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,213 ; mulps %xmm13,%xmm2
- DB 68,15,40,37,90,6,1,0 ; movaps 0x1065a(%rip),%xmm12 # 2c110 <_sk_overlay_sse2_8bit+0xfef>
+ DB 68,15,40,37,163,7,1,0 ; movaps 0x107a3(%rip),%xmm12 # 2c6f0 <_sk_overlay_sse2_8bit+0xfe3>
DB 65,15,88,212 ; addps %xmm12,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,88,5,86,6,1,0 ; addps 0x10656(%rip),%xmm8 # 2c120 <_sk_overlay_sse2_8bit+0xfff>
+ DB 68,15,88,5,159,7,1,0 ; addps 0x1079f(%rip),%xmm8 # 2c700 <_sk_overlay_sse2_8bit+0xff3>
DB 65,15,84,215 ; andps %xmm15,%xmm2
DB 69,15,85,248 ; andnps %xmm8,%xmm15
DB 68,15,86,250 ; orps %xmm2,%xmm15
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,199 ; andnps %xmm15,%xmm0
DB 65,15,86,198 ; orps %xmm14,%xmm0
- DB 15,89,5,71,6,1,0 ; mulps 0x10647(%rip),%xmm0 # 2c130 <_sk_overlay_sse2_8bit+0x100f>
+ DB 15,89,5,144,7,1,0 ; mulps 0x10790(%rip),%xmm0 # 2c710 <_sk_overlay_sse2_8bit+0x1003>
DB 69,15,40,194 ; movaps %xmm10,%xmm8
DB 69,15,194,195,4 ; cmpneqps %xmm11,%xmm8
DB 65,15,84,192 ; andps %xmm8,%xmm0
DB 69,15,92,226 ; subps %xmm10,%xmm12
DB 69,15,88,211 ; addps %xmm11,%xmm10
- DB 68,15,40,13,90,4,1,0 ; movaps 0x1045a(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,13,163,5,1,0 ; movaps 0x105a3(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,40,210 ; movaps %xmm10,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 68,15,194,202,1 ; cmpltps %xmm2,%xmm9
@@ -26248,7 +26521,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,92,36,32 ; movaps %xmm3,0x20(%rsp)
DB 68,15,40,218 ; movaps %xmm2,%xmm11
DB 15,40,240 ; movaps %xmm0,%xmm6
- DB 68,15,40,13,5,4,1,0 ; movaps 0x10405(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,13,78,5,1,0 ; movaps 0x1054e(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,194,211,2 ; cmpleps %xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
@@ -26265,28 +26538,28 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 69,15,88,211 ; addps %xmm11,%xmm10
DB 69,15,88,219 ; addps %xmm11,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 15,40,5,159,5,1,0 ; movaps 0x1059f(%rip),%xmm0 # 2c140 <_sk_overlay_sse2_8bit+0x101f>
+ DB 15,40,5,232,6,1,0 ; movaps 0x106e8(%rip),%xmm0 # 2c720 <_sk_overlay_sse2_8bit+0x1013>
DB 15,88,198 ; addps %xmm6,%xmm0
DB 243,15,91,200 ; cvttps2dq %xmm0,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,216 ; movaps %xmm0,%xmm3
DB 15,194,217,1 ; cmpltps %xmm1,%xmm3
- DB 15,84,29,183,3,1,0 ; andps 0x103b7(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,84,29,0,5,1,0 ; andps 0x10500(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
- DB 68,15,40,45,137,5,1,0 ; movaps 0x10589(%rip),%xmm13 # 2c150 <_sk_overlay_sse2_8bit+0x102f>
+ DB 68,15,40,45,210,6,1,0 ; movaps 0x106d2(%rip),%xmm13 # 2c730 <_sk_overlay_sse2_8bit+0x1023>
DB 69,15,40,197 ; movaps %xmm13,%xmm8
DB 68,15,194,192,2 ; cmpleps %xmm0,%xmm8
DB 69,15,40,242 ; movaps %xmm10,%xmm14
DB 69,15,92,243 ; subps %xmm11,%xmm14
DB 65,15,40,217 ; movaps %xmm9,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
- DB 15,40,21,73,5,1,0 ; movaps 0x10549(%rip),%xmm2 # 2c130 <_sk_overlay_sse2_8bit+0x100f>
+ DB 15,40,21,146,6,1,0 ; movaps 0x10692(%rip),%xmm2 # 2c710 <_sk_overlay_sse2_8bit+0x1003>
DB 68,15,40,250 ; movaps %xmm2,%xmm15
DB 68,15,194,248,2 ; cmpleps %xmm0,%xmm15
- DB 15,40,13,9,5,1,0 ; movaps 0x10509(%rip),%xmm1 # 2c100 <_sk_overlay_sse2_8bit+0xfdf>
+ DB 15,40,13,82,6,1,0 ; movaps 0x10652(%rip),%xmm1 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3>
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,45,31,5,1,0 ; movaps 0x1051f(%rip),%xmm5 # 2c120 <_sk_overlay_sse2_8bit+0xfff>
+ DB 15,40,45,104,6,1,0 ; movaps 0x10668(%rip),%xmm5 # 2c700 <_sk_overlay_sse2_8bit+0xff3>
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,92,224 ; subps %xmm0,%xmm4
DB 65,15,89,230 ; mulps %xmm14,%xmm4
@@ -26309,7 +26582,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,20,3,1,0 ; andps 0x10314(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,84,29,93,4,1,0 ; andps 0x1045d(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 68,15,40,230 ; movaps %xmm6,%xmm12
DB 68,15,92,224 ; subps %xmm0,%xmm12
@@ -26339,12 +26612,12 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,60,36 ; movaps (%rsp),%xmm7
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 15,85,227 ; andnps %xmm3,%xmm4
- DB 15,88,53,141,4,1,0 ; addps 0x1048d(%rip),%xmm6 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 15,88,53,214,5,1,0 ; addps 0x105d6(%rip),%xmm6 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 243,15,91,198 ; cvttps2dq %xmm6,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,136,2,1,0 ; andps 0x10288(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,84,29,209,3,1,0 ; andps 0x103d1(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,89,206 ; mulps %xmm6,%xmm1
@@ -26405,13 +26678,13 @@ _sk_scale_u8_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,61 ; jne 1bded <_sk_scale_u8_sse2+0x55>
+ DB 117,61 ; jne 1c284 <_sk_scale_u8_sse2+0x55>
DB 102,71,15,110,4,25 ; movd (%r9,%r11,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,87,2,1,0 ; pand 0x10257(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,68,15,219,5,160,3,1,0 ; pand 0x103a0(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,155,3,1,0 ; mulps 0x1039b(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,89,5,228,4,1,0 ; mulps 0x104e4(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -26422,12 +26695,12 @@ _sk_scale_u8_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,61 ; je 1be37 <_sk_scale_u8_sse2+0x9f>
+ DB 116,61 ; je 1c2ce <_sk_scale_u8_sse2+0x9f>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 1be1c <_sk_scale_u8_sse2+0x84>
+ DB 116,23 ; je 1c2b3 <_sk_scale_u8_sse2+0x84>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,181 ; jne 1bdc0 <_sk_scale_u8_sse2+0x28>
+ DB 117,181 ; jne 1c257 <_sk_scale_u8_sse2+0x28>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -26436,10 +26709,77 @@ _sk_scale_u8_sse2 LABEL PROC
DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
- DB 235,137 ; jmp 1bdc0 <_sk_scale_u8_sse2+0x28>
+ DB 235,137 ; jmp 1c257 <_sk_scale_u8_sse2+0x28>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,122,255,255,255 ; jmpq 1bdc0 <_sk_scale_u8_sse2+0x28>
+ DB 233,122,255,255,255 ; jmpq 1c257 <_sk_scale_u8_sse2+0x28>
+
+PUBLIC _sk_scale_565_sse2
+_sk_scale_565_sse2 LABEL PROC
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,99,80,8 ; movslq 0x8(%rax),%r10
+ DB 76,99,201 ; movslq %ecx,%r9
+ DB 77,15,175,202 ; imul %r10,%r9
+ DB 77,1,201 ; add %r9,%r9
+ DB 76,3,8 ; add (%rax),%r9
+ DB 76,99,218 ; movslq %edx,%r11
+ DB 77,133,192 ; test %r8,%r8
+ DB 15,133,173,0,0,0 ; jne 1c3a9 <_sk_scale_565_sse2+0xcc>
+ DB 243,71,15,126,20,89 ; movq (%r9,%r11,2),%xmm10
+ DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10
+ DB 102,68,15,111,5,80,4,1,0 ; movdqa 0x10450(%rip),%xmm8 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,69,15,219,194 ; pand %xmm10,%xmm8
+ DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
+ DB 68,15,89,5,79,4,1,0 ; mulps 0x1044f(%rip),%xmm8 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,68,15,111,13,86,4,1,0 ; movdqa 0x10456(%rip),%xmm9 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 102,69,15,219,202 ; pand %xmm10,%xmm9
+ DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
+ DB 68,15,89,13,85,4,1,0 ; mulps 0x10455(%rip),%xmm9 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,68,15,219,21,92,4,1,0 ; pand 0x1045c(%rip),%xmm10 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
+ DB 68,15,89,21,96,4,1,0 ; mulps 0x10460(%rip),%xmm10 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 68,15,40,219 ; movaps %xmm3,%xmm11
+ DB 68,15,194,223,1 ; cmpltps %xmm7,%xmm11
+ DB 69,15,40,225 ; movaps %xmm9,%xmm12
+ DB 69,15,93,226 ; minps %xmm10,%xmm12
+ DB 69,15,40,232 ; movaps %xmm8,%xmm13
+ DB 69,15,93,236 ; minps %xmm12,%xmm13
+ DB 69,15,40,225 ; movaps %xmm9,%xmm12
+ DB 69,15,95,226 ; maxps %xmm10,%xmm12
+ DB 69,15,40,240 ; movaps %xmm8,%xmm14
+ DB 69,15,95,244 ; maxps %xmm12,%xmm14
+ DB 69,15,84,235 ; andps %xmm11,%xmm13
+ DB 69,15,85,222 ; andnps %xmm14,%xmm11
+ DB 69,15,86,221 ; orps %xmm13,%xmm11
+ DB 68,15,89,192 ; mulps %xmm0,%xmm8
+ DB 68,15,89,201 ; mulps %xmm1,%xmm9
+ DB 68,15,89,210 ; mulps %xmm2,%xmm10
+ DB 68,15,89,219 ; mulps %xmm3,%xmm11
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 65,15,40,192 ; movaps %xmm8,%xmm0
+ DB 65,15,40,201 ; movaps %xmm9,%xmm1
+ DB 65,15,40,210 ; movaps %xmm10,%xmm2
+ DB 65,15,40,219 ; movaps %xmm11,%xmm3
+ DB 255,224 ; jmpq *%rax
+ DB 69,137,194 ; mov %r8d,%r10d
+ DB 65,128,226,3 ; and $0x3,%r10b
+ DB 65,128,250,1 ; cmp $0x1,%r10b
+ DB 116,59 ; je 1c3f1 <_sk_scale_565_sse2+0x114>
+ DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
+ DB 65,128,250,2 ; cmp $0x2,%r10b
+ DB 116,27 ; je 1c3dc <_sk_scale_565_sse2+0xff>
+ DB 65,128,250,3 ; cmp $0x3,%r10b
+ DB 15,133,60,255,255,255 ; jne 1c307 <_sk_scale_565_sse2+0x2a>
+ DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
+ DB 102,68,15,110,192 ; movd %eax,%xmm8
+ DB 102,69,15,112,208,69 ; pshufd $0x45,%xmm8,%xmm10
+ DB 102,71,15,110,4,89 ; movd (%r9,%r11,2),%xmm8
+ DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
+ DB 242,69,15,16,208 ; movsd %xmm8,%xmm10
+ DB 233,22,255,255,255 ; jmpq 1c307 <_sk_scale_565_sse2+0x2a>
+ DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
+ DB 102,68,15,110,208 ; movd %eax,%xmm10
+ DB 233,7,255,255,255 ; jmpq 1c307 <_sk_scale_565_sse2+0x2a>
PUBLIC _sk_lerp_1_float_sse2
_sk_lerp_1_float_sse2 LABEL PROC
@@ -26470,13 +26810,13 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,81 ; jne 1bee7 <_sk_lerp_u8_sse2+0x69>
+ DB 117,81 ; jne 1c4a1 <_sk_lerp_u8_sse2+0x69>
DB 102,71,15,110,4,25 ; movd (%r9,%r11,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,113,1,1,0 ; pand 0x10171(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,68,15,219,5,151,1,1,0 ; pand 0x10197(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,181,2,1,0 ; mulps 0x102b5(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,89,5,219,2,1,0 ; mulps 0x102db(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -26494,12 +26834,12 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,64 ; je 1bf34 <_sk_lerp_u8_sse2+0xb6>
+ DB 116,64 ; je 1c4ee <_sk_lerp_u8_sse2+0xb6>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 1bf16 <_sk_lerp_u8_sse2+0x98>
+ DB 116,23 ; je 1c4d0 <_sk_lerp_u8_sse2+0x98>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,161 ; jne 1bea6 <_sk_lerp_u8_sse2+0x28>
+ DB 117,161 ; jne 1c460 <_sk_lerp_u8_sse2+0x28>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -26508,10 +26848,10 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
- DB 233,114,255,255,255 ; jmpq 1bea6 <_sk_lerp_u8_sse2+0x28>
+ DB 233,114,255,255,255 ; jmpq 1c460 <_sk_lerp_u8_sse2+0x28>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,99,255,255,255 ; jmpq 1bea6 <_sk_lerp_u8_sse2+0x28>
+ DB 233,99,255,255,255 ; jmpq 1c460 <_sk_lerp_u8_sse2+0x28>
PUBLIC _sk_lerp_565_sse2
_sk_lerp_565_sse2 LABEL PROC
@@ -26523,72 +26863,76 @@ _sk_lerp_565_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,156,0,0,0 ; jne 1bffe <_sk_lerp_565_sse2+0xbb>
- DB 243,71,15,126,12,89 ; movq (%r9,%r11,2),%xmm9
- DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
- DB 102,68,15,111,5,10,2,1,0 ; movdqa 0x1020a(%rip),%xmm8 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
- DB 102,69,15,219,193 ; pand %xmm9,%xmm8
- DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,9,2,1,0 ; mulps 0x10209(%rip),%xmm8 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,68,15,111,21,16,2,1,0 ; movdqa 0x10210(%rip),%xmm10 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
- DB 102,69,15,219,209 ; pand %xmm9,%xmm10
- DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,15,2,1,0 ; mulps 0x1020f(%rip),%xmm10 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,68,15,219,13,22,2,1,0 ; pand 0x10216(%rip),%xmm9 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 15,133,173,0,0,0 ; jne 1c5c9 <_sk_lerp_565_sse2+0xcc>
+ DB 243,71,15,126,4,89 ; movq (%r9,%r11,2),%xmm8
+ DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
+ DB 102,68,15,111,13,48,2,1,0 ; movdqa 0x10230(%rip),%xmm9 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,69,15,219,200 ; pand %xmm8,%xmm9
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,26,2,1,0 ; mulps 0x1021a(%rip),%xmm9 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
+ DB 68,15,89,13,47,2,1,0 ; mulps 0x1022f(%rip),%xmm9 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,68,15,111,21,54,2,1,0 ; movdqa 0x10236(%rip),%xmm10 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 102,69,15,219,208 ; pand %xmm8,%xmm10
+ DB 69,15,91,218 ; cvtdq2ps %xmm10,%xmm11
+ DB 68,15,89,29,53,2,1,0 ; mulps 0x10235(%rip),%xmm11 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,68,15,219,5,60,2,1,0 ; pand 0x1023c(%rip),%xmm8 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
+ DB 68,15,89,5,64,2,1,0 ; mulps 0x10240(%rip),%xmm8 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 68,15,40,211 ; movaps %xmm3,%xmm10
+ DB 68,15,194,215,1 ; cmpltps %xmm7,%xmm10
+ DB 69,15,40,227 ; movaps %xmm11,%xmm12
+ DB 15,92,205 ; subps %xmm5,%xmm1
+ DB 65,15,89,203 ; mulps %xmm11,%xmm1
+ DB 69,15,93,216 ; minps %xmm8,%xmm11
+ DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 65,15,89,192 ; mulps %xmm8,%xmm0
+ DB 65,15,89,193 ; mulps %xmm9,%xmm0
+ DB 69,15,93,203 ; minps %xmm11,%xmm9
+ DB 69,15,95,224 ; maxps %xmm8,%xmm12
+ DB 69,15,95,236 ; maxps %xmm12,%xmm13
+ DB 69,15,84,202 ; andps %xmm10,%xmm9
+ DB 69,15,85,213 ; andnps %xmm13,%xmm10
+ DB 69,15,86,209 ; orps %xmm9,%xmm10
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,92,205 ; subps %xmm5,%xmm1
- DB 65,15,89,202 ; mulps %xmm10,%xmm1
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,92,214 ; subps %xmm6,%xmm2
- DB 65,15,89,209 ; mulps %xmm9,%xmm2
+ DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 15,88,214 ; addps %xmm6,%xmm2
DB 15,92,223 ; subps %xmm7,%xmm3
- DB 68,15,89,195 ; mulps %xmm3,%xmm8
- DB 68,15,88,199 ; addps %xmm7,%xmm8
- DB 68,15,89,211 ; mulps %xmm3,%xmm10
- DB 68,15,88,215 ; addps %xmm7,%xmm10
- DB 65,15,89,217 ; mulps %xmm9,%xmm3
+ DB 65,15,89,218 ; mulps %xmm10,%xmm3
DB 15,88,223 ; addps %xmm7,%xmm3
- DB 68,15,95,211 ; maxps %xmm3,%xmm10
- DB 69,15,95,194 ; maxps %xmm10,%xmm8
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 65,15,40,216 ; movaps %xmm8,%xmm3
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,59 ; je 1c046 <_sk_lerp_565_sse2+0x103>
- DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
+ DB 116,59 ; je 1c611 <_sk_lerp_565_sse2+0x114>
+ DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,27 ; je 1c031 <_sk_lerp_565_sse2+0xee>
+ DB 116,27 ; je 1c5fc <_sk_lerp_565_sse2+0xff>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,77,255,255,255 ; jne 1bf6d <_sk_lerp_565_sse2+0x2a>
+ DB 15,133,60,255,255,255 ; jne 1c527 <_sk_lerp_565_sse2+0x2a>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 102,69,15,112,200,69 ; pshufd $0x45,%xmm8,%xmm9
- DB 102,71,15,110,4,89 ; movd (%r9,%r11,2),%xmm8
- DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 242,69,15,16,200 ; movsd %xmm8,%xmm9
- DB 233,39,255,255,255 ; jmpq 1bf6d <_sk_lerp_565_sse2+0x2a>
+ DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
+ DB 102,71,15,110,12,89 ; movd (%r9,%r11,2),%xmm9
+ DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
+ DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
+ DB 233,22,255,255,255 ; jmpq 1c527 <_sk_lerp_565_sse2+0x2a>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
- DB 102,68,15,110,200 ; movd %eax,%xmm9
- DB 233,24,255,255,255 ; jmpq 1bf6d <_sk_lerp_565_sse2+0x2a>
+ DB 102,68,15,110,192 ; movd %eax,%xmm8
+ DB 233,7,255,255,255 ; jmpq 1c527 <_sk_lerp_565_sse2+0x2a>
PUBLIC _sk_load_tables_sse2
_sk_load_tables_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 15,133,36,1,0,0 ; jne 1c187 <_sk_load_tables_sse2+0x132>
+ DB 15,133,36,1,0,0 ; jne 1c752 <_sk_load_tables_sse2+0x132>
DB 243,69,15,111,12,145 ; movdqu (%r9,%rdx,4),%xmm9
DB 65,87 ; push %r15
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,68,15,111,5,169,255,0,0 ; movdqa 0xffa9(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,68,15,111,5,190,255,0,0 ; movdqa 0xffbe(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
@@ -26644,7 +26988,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 102,65,15,114,209,24 ; psrld $0x18,%xmm9
DB 65,15,91,217 ; cvtdq2ps %xmm9,%xmm3
- DB 15,89,29,242,255,0,0 ; mulps 0xfff2(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,29,7,0,1,0 ; mulps 0x10007(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -26653,18 +26997,18 @@ _sk_load_tables_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 1c1c1 <_sk_load_tables_sse2+0x16c>
+ DB 116,45 ; je 1c78c <_sk_load_tables_sse2+0x16c>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 1c1b6 <_sk_load_tables_sse2+0x161>
+ DB 116,23 ; je 1c781 <_sk_load_tables_sse2+0x161>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,192,254,255,255 ; jne 1c069 <_sk_load_tables_sse2+0x14>
+ DB 15,133,192,254,255,255 ; jne 1c634 <_sk_load_tables_sse2+0x14>
DB 102,65,15,110,68,145,8 ; movd 0x8(%r9,%rdx,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
DB 102,69,15,18,12,145 ; movlpd (%r9,%rdx,4),%xmm9
- DB 233,168,254,255,255 ; jmpq 1c069 <_sk_load_tables_sse2+0x14>
+ DB 233,168,254,255,255 ; jmpq 1c634 <_sk_load_tables_sse2+0x14>
DB 102,69,15,110,12,145 ; movd (%r9,%rdx,4),%xmm9
- DB 233,157,254,255,255 ; jmpq 1c069 <_sk_load_tables_sse2+0x14>
+ DB 233,157,254,255,255 ; jmpq 1c634 <_sk_load_tables_sse2+0x14>
PUBLIC _sk_load_tables_u16_be_sse2
_sk_load_tables_u16_be_sse2 LABEL PROC
@@ -26672,7 +27016,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,101,1,0,0 ; jne 1c347 <_sk_load_tables_u16_be_sse2+0x17b>
+ DB 15,133,101,1,0,0 ; jne 1c912 <_sk_load_tables_u16_be_sse2+0x17b>
DB 102,67,15,16,4,81 ; movupd (%r9,%r10,2),%xmm0
DB 102,67,15,16,76,81,16 ; movupd 0x10(%r9,%r10,2),%xmm1
DB 65,87 ; push %r15
@@ -26684,7 +27028,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,21,199,255,0,0 ; movdqa 0xffc7(%rip),%xmm10 # 2c1e0 <_sk_overlay_sse2_8bit+0x10bf>
+ DB 102,68,15,111,21,220,255,0,0 ; movdqa 0xffdc(%rip),%xmm10 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -26746,7 +27090,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,235,217 ; por %xmm9,%xmm3
DB 102,65,15,97,216 ; punpcklwd %xmm8,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,194,254,0,0 ; mulps 0xfec2(%rip),%xmm3 # 2c200 <_sk_overlay_sse2_8bit+0x10df>
+ DB 15,89,29,215,254,0,0 ; mulps 0xfed7(%rip),%xmm3 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -26754,17 +27098,17 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,67,15,16,4,81 ; movsd (%r9,%r10,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 1c364 <_sk_load_tables_u16_be_sse2+0x198>
+ DB 117,17 ; jne 1c92f <_sk_load_tables_u16_be_sse2+0x198>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,139,254,255,255 ; jmpq 1c1ef <_sk_load_tables_u16_be_sse2+0x23>
+ DB 233,139,254,255,255 ; jmpq 1c7ba <_sk_load_tables_u16_be_sse2+0x23>
DB 102,67,15,22,68,81,8 ; movhpd 0x8(%r9,%r10,2),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,118,254,255,255 ; jb 1c1ef <_sk_load_tables_u16_be_sse2+0x23>
+ DB 15,130,118,254,255,255 ; jb 1c7ba <_sk_load_tables_u16_be_sse2+0x23>
DB 242,67,15,16,76,81,16 ; movsd 0x10(%r9,%r10,2),%xmm1
- DB 233,106,254,255,255 ; jmpq 1c1ef <_sk_load_tables_u16_be_sse2+0x23>
+ DB 233,106,254,255,255 ; jmpq 1c7ba <_sk_load_tables_u16_be_sse2+0x23>
PUBLIC _sk_load_tables_rgb_u16_be_sse2
_sk_load_tables_rgb_u16_be_sse2 LABEL PROC
@@ -26772,7 +27116,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,84,1,0,0 ; jne 1c4eb <_sk_load_tables_rgb_u16_be_sse2+0x166>
+ DB 15,133,84,1,0,0 ; jne 1cab6 <_sk_load_tables_rgb_u16_be_sse2+0x166>
DB 243,71,15,111,28,81 ; movdqu (%r9,%r10,2),%xmm11
DB 243,67,15,111,76,81,8 ; movdqu 0x8(%r9,%r10,2),%xmm1
DB 102,15,115,217,4 ; psrldq $0x4,%xmm1
@@ -26787,7 +27131,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10
DB 102,65,15,111,195 ; movdqa %xmm11,%xmm0
DB 102,65,15,97,194 ; punpcklwd %xmm10,%xmm0
- DB 102,68,15,111,5,1,254,0,0 ; movdqa 0xfe01(%rip),%xmm8 # 2c1e0 <_sk_overlay_sse2_8bit+0x10bf>
+ DB 102,68,15,111,5,22,254,0,0 ; movdqa 0xfe16(%rip),%xmm8 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
@@ -26843,7 +27187,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 15,20,211 ; unpcklps %xmm3,%xmm2
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,140,250,0,0 ; movaps 0xfa8c(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,161,250,0,0 ; movaps 0xfaa1(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 65,95 ; pop %r15
@@ -26852,21 +27196,21 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,71,15,196,92,81,4,2 ; pinsrw $0x2,0x4(%r9,%r10,2),%xmm11
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,14 ; jne 1c511 <_sk_load_tables_rgb_u16_be_sse2+0x18c>
+ DB 117,14 ; jne 1cadc <_sk_load_tables_rgb_u16_be_sse2+0x18c>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
- DB 233,172,254,255,255 ; jmpq 1c3bd <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,172,254,255,255 ; jmpq 1c988 <_sk_load_tables_rgb_u16_be_sse2+0x38>
DB 102,71,15,110,84,81,6 ; movd 0x6(%r9,%r10,2),%xmm10
DB 102,71,15,196,84,81,10,2 ; pinsrw $0x2,0xa(%r9,%r10,2),%xmm10
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 1c542 <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
+ DB 114,24 ; jb 1cb0d <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
DB 102,67,15,110,76,81,12 ; movd 0xc(%r9,%r10,2),%xmm1
DB 102,67,15,196,76,81,16,2 ; pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,123,254,255,255 ; jmpq 1c3bd <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,123,254,255,255 ; jmpq 1c988 <_sk_load_tables_rgb_u16_be_sse2+0x38>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,114,254,255,255 ; jmpq 1c3bd <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,114,254,255,255 ; jmpq 1c988 <_sk_load_tables_rgb_u16_be_sse2+0x38>
PUBLIC _sk_byte_tables_sse2
_sk_byte_tables_sse2 LABEL PROC
@@ -26875,7 +27219,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 65,86 ; push %r14
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,245,250,0,0 ; movaps 0xfaf5(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,10,251,0,0 ; movaps 0xfb0a(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,126,193 ; movq %xmm0,%r9
@@ -26903,7 +27247,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,159,251,0,0 ; movaps 0xfb9f(%rip),%xmm10 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,21,180,251,0,0 ; movaps 0xfbb4(%rip),%xmm10 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -27022,7 +27366,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,215,249,0,0 ; movaps 0xf9d7(%rip),%xmm10 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,21,236,249,0,0 ; movaps 0xf9ec(%rip),%xmm10 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -27219,15 +27563,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,171,247,0,0 ; mulps 0xf7ab(%rip),%xmm9 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,21,179,247,0,0 ; andps 0xf7b3(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,21,219,244,0,0 ; orps 0xf4db(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,13,179,247,0,0 ; addps 0xf7b3(%rip),%xmm9 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 68,15,40,37,187,247,0,0 ; movaps 0xf7bb(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,13,192,247,0,0 ; mulps 0xf7c0(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,200,247,0,0 ; andps 0xf7c8(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,240,244,0,0 ; orps 0xf4f0(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,13,200,247,0,0 ; addps 0xf7c8(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,208,247,0,0 ; movaps 0xf7d0(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,187,247,0,0 ; addps 0xf7bb(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 68,15,40,37,195,247,0,0 ; movaps 0xf7c3(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,21,208,247,0,0 ; addps 0xf7d0(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,216,247,0,0 ; movaps 0xf7d8(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27235,22 +27579,22 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,157,244,0,0 ; movaps 0xf49d(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,178,244,0,0 ; movaps 0xf4b2(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,145,247,0,0 ; addps 0xf791(%rip),%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 68,15,40,37,153,247,0,0 ; movaps 0xf799(%rip),%xmm12 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,13,166,247,0,0 ; addps 0xf7a6(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,37,174,247,0,0 ; movaps 0xf7ae(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,153,247,0,0 ; movaps 0xf799(%rip),%xmm12 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,37,174,247,0,0 ; movaps 0xf7ae(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,157,247,0,0 ; movaps 0xf79d(%rip),%xmm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 68,15,40,45,178,247,0,0 ; movaps 0xf7b2(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,157,247,0,0 ; mulps 0xf79d(%rip),%xmm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 68,15,89,45,178,247,0,0 ; mulps 0xf7b2(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27284,15 +27628,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,109,246,0,0 ; mulps 0xf66d(%rip),%xmm9 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,21,117,246,0,0 ; andps 0xf675(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,21,157,243,0,0 ; orps 0xf39d(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,13,117,246,0,0 ; addps 0xf675(%rip),%xmm9 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 68,15,40,37,125,246,0,0 ; movaps 0xf67d(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,13,130,246,0,0 ; mulps 0xf682(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,138,246,0,0 ; andps 0xf68a(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,178,243,0,0 ; orps 0xf3b2(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,13,138,246,0,0 ; addps 0xf68a(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,146,246,0,0 ; movaps 0xf692(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,125,246,0,0 ; addps 0xf67d(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 68,15,40,37,133,246,0,0 ; movaps 0xf685(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,21,146,246,0,0 ; addps 0xf692(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,154,246,0,0 ; movaps 0xf69a(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27300,22 +27644,22 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,95,243,0,0 ; movaps 0xf35f(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,116,243,0,0 ; movaps 0xf374(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,83,246,0,0 ; addps 0xf653(%rip),%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 68,15,40,37,91,246,0,0 ; movaps 0xf65b(%rip),%xmm12 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,13,104,246,0,0 ; addps 0xf668(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,37,112,246,0,0 ; movaps 0xf670(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,91,246,0,0 ; movaps 0xf65b(%rip),%xmm12 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,37,112,246,0,0 ; movaps 0xf670(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,95,246,0,0 ; movaps 0xf65f(%rip),%xmm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 68,15,40,45,116,246,0,0 ; movaps 0xf674(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,95,246,0,0 ; mulps 0xf65f(%rip),%xmm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 68,15,89,45,116,246,0,0 ; mulps 0xf674(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27349,15 +27693,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,47,245,0,0 ; mulps 0xf52f(%rip),%xmm9 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,21,55,245,0,0 ; andps 0xf537(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,21,95,242,0,0 ; orps 0xf25f(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,13,55,245,0,0 ; addps 0xf537(%rip),%xmm9 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 68,15,40,37,63,245,0,0 ; movaps 0xf53f(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,13,68,245,0,0 ; mulps 0xf544(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,76,245,0,0 ; andps 0xf54c(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,116,242,0,0 ; orps 0xf274(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,13,76,245,0,0 ; addps 0xf54c(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,84,245,0,0 ; movaps 0xf554(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,63,245,0,0 ; addps 0xf53f(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 68,15,40,37,71,245,0,0 ; movaps 0xf547(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,21,84,245,0,0 ; addps 0xf554(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,92,245,0,0 ; movaps 0xf55c(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27365,22 +27709,22 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,33,242,0,0 ; movaps 0xf221(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,54,242,0,0 ; movaps 0xf236(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,21,245,0,0 ; addps 0xf515(%rip),%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 68,15,40,37,29,245,0,0 ; movaps 0xf51d(%rip),%xmm12 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,13,42,245,0,0 ; addps 0xf52a(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,37,50,245,0,0 ; movaps 0xf532(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,29,245,0,0 ; movaps 0xf51d(%rip),%xmm12 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,37,50,245,0,0 ; movaps 0xf532(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,33,245,0,0 ; movaps 0xf521(%rip),%xmm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 68,15,40,45,54,245,0,0 ; movaps 0xf536(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,33,245,0,0 ; mulps 0xf521(%rip),%xmm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 68,15,89,45,54,245,0,0 ; mulps 0xf536(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27414,15 +27758,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,241,243,0,0 ; mulps 0xf3f1(%rip),%xmm9 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 68,15,84,21,249,243,0,0 ; andps 0xf3f9(%rip),%xmm10 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,86,21,33,241,0,0 ; orps 0xf121(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
- DB 68,15,88,13,249,243,0,0 ; addps 0xf3f9(%rip),%xmm9 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
- DB 68,15,40,37,1,244,0,0 ; movaps 0xf401(%rip),%xmm12 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,89,13,6,244,0,0 ; mulps 0xf406(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,14,244,0,0 ; andps 0xf40e(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,54,241,0,0 ; orps 0xf136(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,13,14,244,0,0 ; addps 0xf40e(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,22,244,0,0 ; movaps 0xf416(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,1,244,0,0 ; addps 0xf401(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
- DB 68,15,40,37,9,244,0,0 ; movaps 0xf409(%rip),%xmm12 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,88,21,22,244,0,0 ; addps 0xf416(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,30,244,0,0 ; movaps 0xf41e(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27430,22 +27774,22 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,227,240,0,0 ; movaps 0xf0e3(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,248,240,0,0 ; movaps 0xf0f8(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,215,243,0,0 ; addps 0xf3d7(%rip),%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
- DB 68,15,40,37,223,243,0,0 ; movaps 0xf3df(%rip),%xmm12 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 68,15,88,13,236,243,0,0 ; addps 0xf3ec(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,37,244,243,0,0 ; movaps 0xf3f4(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,223,243,0,0 ; movaps 0xf3df(%rip),%xmm12 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 68,15,40,37,244,243,0,0 ; movaps 0xf3f4(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,227,243,0,0 ; movaps 0xf3e3(%rip),%xmm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 68,15,40,45,248,243,0,0 ; movaps 0xf3f8(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,227,243,0,0 ; mulps 0xf3e3(%rip),%xmm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 68,15,89,45,248,243,0,0 ; mulps 0xf3f8(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27469,19 +27813,19 @@ _sk_gamma_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,5,235,242,0,0 ; mulps 0xf2eb(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 15,84,21,244,242,0,0 ; andps 0xf2f4(%rip),%xmm2 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 68,15,40,53,28,240,0,0 ; movaps 0xf01c(%rip),%xmm14 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,89,5,0,243,0,0 ; mulps 0xf300(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 15,84,21,9,243,0,0 ; andps 0xf309(%rip),%xmm2 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,40,53,49,240,0,0 ; movaps 0xf031(%rip),%xmm14 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,86,214 ; orps %xmm14,%xmm2
- DB 68,15,40,37,240,242,0,0 ; movaps 0xf2f0(%rip),%xmm12 # 2c240 <_sk_overlay_sse2_8bit+0x111f>
+ DB 68,15,40,37,5,243,0,0 ; movaps 0xf305(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
DB 65,15,88,196 ; addps %xmm12,%xmm0
- DB 68,15,40,29,244,242,0,0 ; movaps 0xf2f4(%rip),%xmm11 # 2c250 <_sk_overlay_sse2_8bit+0x112f>
+ DB 68,15,40,29,9,243,0,0 ; movaps 0xf309(%rip),%xmm11 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 65,15,89,227 ; mulps %xmm11,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 68,15,40,21,242,242,0,0 ; movaps 0xf2f2(%rip),%xmm10 # 2c260 <_sk_overlay_sse2_8bit+0x113f>
+ DB 68,15,40,21,7,243,0,0 ; movaps 0xf307(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
DB 65,15,88,210 ; addps %xmm10,%xmm2
- DB 68,15,40,45,246,242,0,0 ; movaps 0xf2f6(%rip),%xmm13 # 2c270 <_sk_overlay_sse2_8bit+0x114f>
+ DB 68,15,40,45,11,243,0,0 ; movaps 0xf30b(%rip),%xmm13 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,40,229 ; movaps %xmm13,%xmm4
DB 15,94,226 ; divps %xmm2,%xmm4
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -27493,27 +27837,27 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,194,226,1 ; cmpltps %xmm2,%xmm4
- DB 68,15,40,13,198,239,0,0 ; movaps 0xefc6(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,13,219,239,0,0 ; movaps 0xefdb(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,84,225 ; andps %xmm9,%xmm4
DB 15,92,212 ; subps %xmm4,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,53,194,242,0,0 ; movaps 0xf2c2(%rip),%xmm6 # 2c280 <_sk_overlay_sse2_8bit+0x115f>
+ DB 15,40,53,215,242,0,0 ; movaps 0xf2d7(%rip),%xmm6 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,40,61,216,242,0,0 ; movaps 0xf2d8(%rip),%xmm7 # 2c2a0 <_sk_overlay_sse2_8bit+0x117f>
+ DB 15,40,61,237,242,0,0 ; movaps 0xf2ed(%rip),%xmm7 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,37,184,242,0,0 ; movaps 0xf2b8(%rip),%xmm4 # 2c290 <_sk_overlay_sse2_8bit+0x116f>
+ DB 15,40,37,205,242,0,0 ; movaps 0xf2cd(%rip),%xmm4 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,92,194 ; subps %xmm2,%xmm0
- DB 68,15,40,61,202,242,0,0 ; movaps 0xf2ca(%rip),%xmm15 # 2c2b0 <_sk_overlay_sse2_8bit+0x118f>
+ DB 68,15,40,61,223,242,0,0 ; movaps 0xf2df(%rip),%xmm15 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,40,215 ; movaps %xmm15,%xmm2
DB 15,94,213 ; divps %xmm5,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,5,38,242,0,0 ; mulps 0xf226(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 15,84,13,47,242,0,0 ; andps 0xf22f(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
+ DB 15,89,5,59,242,0,0 ; mulps 0xf23b(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 15,84,13,68,242,0,0 ; andps 0xf244(%rip),%xmm1 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
DB 65,15,86,206 ; orps %xmm14,%xmm1
DB 65,15,88,196 ; addps %xmm12,%xmm0
DB 15,40,233 ; movaps %xmm1,%xmm5
@@ -27543,9 +27887,9 @@ _sk_gamma_sse2 LABEL PROC
DB 15,94,206 ; divps %xmm6,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,5,181,241,0,0 ; mulps 0xf1b5(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x10ff>
- DB 15,84,29,190,241,0,0 ; andps 0xf1be(%rip),%xmm3 # 2c230 <_sk_overlay_sse2_8bit+0x110f>
- DB 15,86,29,231,238,0,0 ; orps 0xeee7(%rip),%xmm3 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,89,5,202,241,0,0 ; mulps 0xf1ca(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 15,84,29,211,241,0,0 ; andps 0xf1d3(%rip),%xmm3 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 15,86,29,252,238,0,0 ; orps 0xeefc(%rip),%xmm3 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,88,196 ; addps %xmm12,%xmm0
DB 68,15,89,219 ; mulps %xmm3,%xmm11
DB 65,15,92,195 ; subps %xmm11,%xmm0
@@ -27567,7 +27911,7 @@ _sk_gamma_sse2 LABEL PROC
DB 15,92,253 ; subps %xmm5,%xmm7
DB 68,15,94,255 ; divps %xmm7,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 15,40,5,244,241,0,0 ; movaps 0xf1f4(%rip),%xmm0 # 2c2c0 <_sk_overlay_sse2_8bit+0x119f>
+ DB 15,40,5,9,242,0,0 ; movaps 0xf209(%rip),%xmm0 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 68,15,89,248 ; mulps %xmm0,%xmm15
@@ -27585,29 +27929,29 @@ _sk_gamma_sse2 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse2
_sk_lab_to_xyz_sse2 LABEL PROC
- DB 15,89,5,198,241,0,0 ; mulps 0xf1c6(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0x11af>
- DB 68,15,40,5,62,239,0,0 ; movaps 0xef3e(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 15,89,5,219,241,0,0 ; mulps 0xf1db(%rip),%xmm0 # 2c8b0 <_sk_overlay_sse2_8bit+0x11a3>
+ DB 68,15,40,5,83,239,0,0 ; movaps 0xef53(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,200 ; mulps %xmm8,%xmm1
- DB 68,15,40,13,194,241,0,0 ; movaps 0xf1c2(%rip),%xmm9 # 2c2e0 <_sk_overlay_sse2_8bit+0x11bf>
+ DB 68,15,40,13,215,241,0,0 ; movaps 0xf1d7(%rip),%xmm9 # 2c8c0 <_sk_overlay_sse2_8bit+0x11b3>
DB 65,15,88,201 ; addps %xmm9,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 15,88,5,191,241,0,0 ; addps 0xf1bf(%rip),%xmm0 # 2c2f0 <_sk_overlay_sse2_8bit+0x11cf>
- DB 15,89,5,200,241,0,0 ; mulps 0xf1c8(%rip),%xmm0 # 2c300 <_sk_overlay_sse2_8bit+0x11df>
- DB 15,89,13,209,241,0,0 ; mulps 0xf1d1(%rip),%xmm1 # 2c310 <_sk_overlay_sse2_8bit+0x11ef>
+ DB 15,88,5,212,241,0,0 ; addps 0xf1d4(%rip),%xmm0 # 2c8d0 <_sk_overlay_sse2_8bit+0x11c3>
+ DB 15,89,5,221,241,0,0 ; mulps 0xf1dd(%rip),%xmm0 # 2c8e0 <_sk_overlay_sse2_8bit+0x11d3>
+ DB 15,89,13,230,241,0,0 ; mulps 0xf1e6(%rip),%xmm1 # 2c8f0 <_sk_overlay_sse2_8bit+0x11e3>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,21,215,241,0,0 ; mulps 0xf1d7(%rip),%xmm2 # 2c320 <_sk_overlay_sse2_8bit+0x11ff>
+ DB 15,89,21,236,241,0,0 ; mulps 0xf1ec(%rip),%xmm2 # 2c900 <_sk_overlay_sse2_8bit+0x11f3>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 68,15,92,202 ; subps %xmm2,%xmm9
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
DB 68,15,89,225 ; mulps %xmm1,%xmm12
- DB 15,40,21,204,241,0,0 ; movaps 0xf1cc(%rip),%xmm2 # 2c330 <_sk_overlay_sse2_8bit+0x120f>
+ DB 15,40,21,225,241,0,0 ; movaps 0xf1e1(%rip),%xmm2 # 2c910 <_sk_overlay_sse2_8bit+0x1203>
DB 68,15,40,194 ; movaps %xmm2,%xmm8
DB 69,15,194,196,1 ; cmpltps %xmm12,%xmm8
- DB 68,15,40,21,203,241,0,0 ; movaps 0xf1cb(%rip),%xmm10 # 2c340 <_sk_overlay_sse2_8bit+0x121f>
+ DB 68,15,40,21,224,241,0,0 ; movaps 0xf1e0(%rip),%xmm10 # 2c920 <_sk_overlay_sse2_8bit+0x1213>
DB 65,15,88,202 ; addps %xmm10,%xmm1
- DB 68,15,40,29,207,241,0,0 ; movaps 0xf1cf(%rip),%xmm11 # 2c350 <_sk_overlay_sse2_8bit+0x122f>
+ DB 68,15,40,29,228,241,0,0 ; movaps 0xf1e4(%rip),%xmm11 # 2c930 <_sk_overlay_sse2_8bit+0x1223>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 69,15,84,224 ; andps %xmm8,%xmm12
DB 68,15,85,193 ; andnps %xmm1,%xmm8
@@ -27631,8 +27975,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,84,194 ; andps %xmm2,%xmm0
DB 65,15,85,209 ; andnps %xmm9,%xmm2
DB 15,86,208 ; orps %xmm0,%xmm2
- DB 68,15,89,5,127,241,0,0 ; mulps 0xf17f(%rip),%xmm8 # 2c360 <_sk_overlay_sse2_8bit+0x123f>
- DB 15,89,21,136,241,0,0 ; mulps 0xf188(%rip),%xmm2 # 2c370 <_sk_overlay_sse2_8bit+0x124f>
+ DB 68,15,89,5,148,241,0,0 ; mulps 0xf194(%rip),%xmm8 # 2c940 <_sk_overlay_sse2_8bit+0x1233>
+ DB 15,89,21,157,241,0,0 ; mulps 0xf19d(%rip),%xmm2 # 2c950 <_sk_overlay_sse2_8bit+0x1243>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -27646,13 +27990,13 @@ _sk_load_a8_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,46 ; jne 1d236 <_sk_load_a8_sse2+0x46>
+ DB 117,46 ; jne 1d801 <_sk_load_a8_sse2+0x46>
DB 102,67,15,110,4,25 ; movd (%r9,%r11,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,2,238,0,0 ; pand 0xee02(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,5,23,238,0,0 ; pand 0xee17(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,72,239,0,0 ; mulps 0xef48(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,29,93,239,0,0 ; mulps 0xef5d(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
@@ -27661,12 +28005,12 @@ _sk_load_a8_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 1d279 <_sk_load_a8_sse2+0x89>
+ DB 116,54 ; je 1d844 <_sk_load_a8_sse2+0x89>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d262 <_sk_load_a8_sse2+0x72>
+ DB 116,21 ; je 1d82d <_sk_load_a8_sse2+0x72>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 1d216 <_sk_load_a8_sse2+0x26>
+ DB 117,195 ; jne 1d7e1 <_sk_load_a8_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -27675,10 +28019,10 @@ _sk_load_a8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,157 ; jmp 1d216 <_sk_load_a8_sse2+0x26>
+ DB 235,157 ; jmp 1d7e1 <_sk_load_a8_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,146 ; jmp 1d216 <_sk_load_a8_sse2+0x26>
+ DB 235,146 ; jmp 1d7e1 <_sk_load_a8_sse2+0x26>
PUBLIC _sk_load_a8_dst_sse2
_sk_load_a8_dst_sse2 LABEL PROC
@@ -27689,13 +28033,13 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,46 ; jne 1d2ca <_sk_load_a8_dst_sse2+0x46>
+ DB 117,46 ; jne 1d895 <_sk_load_a8_dst_sse2+0x46>
DB 102,67,15,110,36,25 ; movd (%r9,%r11,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,37,110,237,0,0 ; pand 0xed6e(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,37,131,237,0,0 ; pand 0xed83(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
- DB 15,89,61,180,238,0,0 ; mulps 0xeeb4(%rip),%xmm7 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,61,201,238,0,0 ; mulps 0xeec9(%rip),%xmm7 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
@@ -27704,12 +28048,12 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 1d30d <_sk_load_a8_dst_sse2+0x89>
+ DB 116,54 ; je 1d8d8 <_sk_load_a8_dst_sse2+0x89>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d2f6 <_sk_load_a8_dst_sse2+0x72>
+ DB 116,21 ; je 1d8c1 <_sk_load_a8_dst_sse2+0x72>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 1d2aa <_sk_load_a8_dst_sse2+0x26>
+ DB 117,195 ; jne 1d875 <_sk_load_a8_dst_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -27718,10 +28062,10 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,157 ; jmp 1d2aa <_sk_load_a8_dst_sse2+0x26>
+ DB 235,157 ; jmp 1d875 <_sk_load_a8_dst_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,146 ; jmp 1d2aa <_sk_load_a8_dst_sse2+0x26>
+ DB 235,146 ; jmp 1d875 <_sk_load_a8_dst_sse2+0x26>
PUBLIC _sk_gather_a8_sse2
_sk_gather_a8_sse2 LABEL PROC
@@ -27761,7 +28105,7 @@ _sk_gather_a8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,197,237,0,0 ; mulps 0xedc5(%rip),%xmm3 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,29,218,237,0,0 ; mulps 0xedda(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -27779,7 +28123,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,117,236,0,0 ; movaps 0xec75(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,138,236,0,0 ; movaps 0xec8a(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,65,15,114,240,16 ; pslld $0x10,%xmm8
@@ -27787,7 +28131,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 1d410 <_sk_store_a8_sse2+0x54>
+ DB 117,17 ; jne 1d9db <_sk_store_a8_sse2+0x54>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 67,137,4,25 ; mov %eax,(%r9,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -27798,24 +28142,24 @@ _sk_store_a8_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,59 ; je 1d462 <_sk_store_a8_sse2+0xa6>
+ DB 116,59 ; je 1da2d <_sk_store_a8_sse2+0xa6>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,22 ; je 1d443 <_sk_store_a8_sse2+0x87>
+ DB 116,22 ; je 1da0e <_sk_store_a8_sse2+0x87>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,213 ; jne 1d408 <_sk_store_a8_sse2+0x4c>
+ DB 117,213 ; jne 1d9d3 <_sk_store_a8_sse2+0x4c>
DB 102,68,15,127,68,36,16 ; movdqa %xmm8,0x10(%rsp)
DB 138,68,36,24 ; mov 0x18(%rsp),%al
DB 67,136,68,25,2 ; mov %al,0x2(%r9,%r11,1)
- DB 102,68,15,219,5,212,235,0,0 ; pand 0xebd4(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,68,15,219,5,233,235,0,0 ; pand 0xebe9(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,25 ; mov %ax,(%r9,%r11,1)
- DB 235,166 ; jmp 1d408 <_sk_store_a8_sse2+0x4c>
+ DB 235,166 ; jmp 1d9d3 <_sk_store_a8_sse2+0x4c>
DB 102,68,15,127,4,36 ; movdqa %xmm8,(%rsp)
DB 138,4,36 ; mov (%rsp),%al
DB 67,136,4,25 ; mov %al,(%r9,%r11,1)
- DB 235,151 ; jmp 1d408 <_sk_store_a8_sse2+0x4c>
+ DB 235,151 ; jmp 1d9d3 <_sk_store_a8_sse2+0x4c>
PUBLIC _sk_load_g8_sse2
_sk_load_g8_sse2 LABEL PROC
@@ -27826,27 +28170,27 @@ _sk_load_g8_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,49 ; jne 1d4ba <_sk_load_g8_sse2+0x49>
+ DB 117,49 ; jne 1da85 <_sk_load_g8_sse2+0x49>
DB 102,67,15,110,4,25 ; movd (%r9,%r11,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,129,235,0,0 ; pand 0xeb81(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,5,150,235,0,0 ; pand 0xeb96(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,199,236,0,0 ; mulps 0xecc7(%rip),%xmm0 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,5,220,236,0,0 ; mulps 0xecdc(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,190,234,0,0 ; movaps 0xeabe(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,211,234,0,0 ; movaps 0xead3(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 1d4fd <_sk_load_g8_sse2+0x8c>
+ DB 116,54 ; je 1dac8 <_sk_load_g8_sse2+0x8c>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d4e6 <_sk_load_g8_sse2+0x75>
+ DB 116,21 ; je 1dab1 <_sk_load_g8_sse2+0x75>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 1d497 <_sk_load_g8_sse2+0x26>
+ DB 117,192 ; jne 1da62 <_sk_load_g8_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -27855,10 +28199,10 @@ _sk_load_g8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,154 ; jmp 1d497 <_sk_load_g8_sse2+0x26>
+ DB 235,154 ; jmp 1da62 <_sk_load_g8_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,143 ; jmp 1d497 <_sk_load_g8_sse2+0x26>
+ DB 235,143 ; jmp 1da62 <_sk_load_g8_sse2+0x26>
PUBLIC _sk_load_g8_dst_sse2
_sk_load_g8_dst_sse2 LABEL PROC
@@ -27869,27 +28213,27 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,49 ; jne 1d551 <_sk_load_g8_dst_sse2+0x49>
+ DB 117,49 ; jne 1db1c <_sk_load_g8_dst_sse2+0x49>
DB 102,67,15,110,36,25 ; movd (%r9,%r11,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,37,234,234,0,0 ; pand 0xeaea(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,219,37,255,234,0,0 ; pand 0xeaff(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,48,236,0,0 ; mulps 0xec30(%rip),%xmm4 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,37,69,236,0,0 ; mulps 0xec45(%rip),%xmm4 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,39,234,0,0 ; movaps 0xea27(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,61,60,234,0,0 ; movaps 0xea3c(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 1d594 <_sk_load_g8_dst_sse2+0x8c>
+ DB 116,54 ; je 1db5f <_sk_load_g8_dst_sse2+0x8c>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d57d <_sk_load_g8_dst_sse2+0x75>
+ DB 116,21 ; je 1db48 <_sk_load_g8_dst_sse2+0x75>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 1d52e <_sk_load_g8_dst_sse2+0x26>
+ DB 117,192 ; jne 1daf9 <_sk_load_g8_dst_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -27898,10 +28242,10 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,154 ; jmp 1d52e <_sk_load_g8_dst_sse2+0x26>
+ DB 235,154 ; jmp 1daf9 <_sk_load_g8_dst_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,143 ; jmp 1d52e <_sk_load_g8_dst_sse2+0x26>
+ DB 235,143 ; jmp 1daf9 <_sk_load_g8_dst_sse2+0x26>
PUBLIC _sk_gather_g8_sse2
_sk_gather_g8_sse2 LABEL PROC
@@ -27941,9 +28285,9 @@ _sk_gather_g8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,62,235,0,0 ; mulps 0xeb3e(%rip),%xmm0 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 15,89,5,83,235,0,0 ; mulps 0xeb53(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,53,233,0,0 ; movaps 0xe935(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,74,233,0,0 ; movaps 0xe94a(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 91 ; pop %rbx
@@ -27960,42 +28304,42 @@ _sk_load_565_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,83 ; jne 1d6b3 <_sk_load_565_sse2+0x6e>
+ DB 117,83 ; jne 1dc7e <_sk_load_565_sse2+0x6e>
DB 243,67,15,126,20,89 ; movq (%r9,%r11,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,14,235,0,0 ; movdqa 0xeb0e(%rip),%xmm0 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
+ DB 102,15,111,5,35,235,0,0 ; movdqa 0xeb23(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,16,235,0,0 ; mulps 0xeb10(%rip),%xmm0 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,15,111,13,24,235,0,0 ; movdqa 0xeb18(%rip),%xmm1 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
+ DB 15,89,5,37,235,0,0 ; mulps 0xeb25(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,13,45,235,0,0 ; movdqa 0xeb2d(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,26,235,0,0 ; mulps 0xeb1a(%rip),%xmm1 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,15,219,21,34,235,0,0 ; pand 0xeb22(%rip),%xmm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 15,89,13,47,235,0,0 ; mulps 0xeb2f(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,21,55,235,0,0 ; pand 0xeb37(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,40,235,0,0 ; mulps 0xeb28(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
+ DB 15,89,21,61,235,0,0 ; mulps 0xeb3d(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,191,232,0,0 ; movaps 0xe8bf(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,212,232,0,0 ; movaps 0xe8d4(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 1d6f2 <_sk_load_565_sse2+0xad>
+ DB 116,50 ; je 1dcbd <_sk_load_565_sse2+0xad>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d6df <_sk_load_565_sse2+0x9a>
+ DB 116,21 ; je 1dcaa <_sk_load_565_sse2+0x9a>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 1d66a <_sk_load_565_sse2+0x25>
+ DB 117,154 ; jne 1dc35 <_sk_load_565_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,208 ; movsd %xmm0,%xmm2
- DB 233,120,255,255,255 ; jmpq 1d66a <_sk_load_565_sse2+0x25>
+ DB 233,120,255,255,255 ; jmpq 1dc35 <_sk_load_565_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,106,255,255,255 ; jmpq 1d66a <_sk_load_565_sse2+0x25>
+ DB 233,106,255,255,255 ; jmpq 1dc35 <_sk_load_565_sse2+0x25>
PUBLIC _sk_load_565_dst_sse2
_sk_load_565_dst_sse2 LABEL PROC
@@ -28007,42 +28351,42 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,83 ; jne 1d76e <_sk_load_565_dst_sse2+0x6e>
+ DB 117,83 ; jne 1dd39 <_sk_load_565_dst_sse2+0x6e>
DB 243,67,15,126,52,89 ; movq (%r9,%r11,2),%xmm6
DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,111,37,83,234,0,0 ; movdqa 0xea53(%rip),%xmm4 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
+ DB 102,15,111,37,104,234,0,0 ; movdqa 0xea68(%rip),%xmm4 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,85,234,0,0 ; mulps 0xea55(%rip),%xmm4 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,15,111,45,93,234,0,0 ; movdqa 0xea5d(%rip),%xmm5 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
+ DB 15,89,37,106,234,0,0 ; mulps 0xea6a(%rip),%xmm4 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,45,114,234,0,0 ; movdqa 0xea72(%rip),%xmm5 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,95,234,0,0 ; mulps 0xea5f(%rip),%xmm5 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,15,219,53,103,234,0,0 ; pand 0xea67(%rip),%xmm6 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 15,89,45,116,234,0,0 ; mulps 0xea74(%rip),%xmm5 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,53,124,234,0,0 ; pand 0xea7c(%rip),%xmm6 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,109,234,0,0 ; mulps 0xea6d(%rip),%xmm6 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
+ DB 15,89,53,130,234,0,0 ; mulps 0xea82(%rip),%xmm6 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,4,232,0,0 ; movaps 0xe804(%rip),%xmm7 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,61,25,232,0,0 ; movaps 0xe819(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 1d7ad <_sk_load_565_dst_sse2+0xad>
+ DB 116,50 ; je 1dd78 <_sk_load_565_dst_sse2+0xad>
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d79a <_sk_load_565_dst_sse2+0x9a>
+ DB 116,21 ; je 1dd65 <_sk_load_565_dst_sse2+0x9a>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 1d725 <_sk_load_565_dst_sse2+0x25>
+ DB 117,154 ; jne 1dcf0 <_sk_load_565_dst_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 242,15,16,244 ; movsd %xmm4,%xmm6
- DB 233,120,255,255,255 ; jmpq 1d725 <_sk_load_565_dst_sse2+0x25>
+ DB 233,120,255,255,255 ; jmpq 1dcf0 <_sk_load_565_dst_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,106,255,255,255 ; jmpq 1d725 <_sk_load_565_dst_sse2+0x25>
+ DB 233,106,255,255,255 ; jmpq 1dcf0 <_sk_load_565_dst_sse2+0x25>
PUBLIC _sk_gather_565_sse2
_sk_gather_565_sse2 LABEL PROC
@@ -28075,19 +28419,19 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,208,3 ; pinsrw $0x3,%eax,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,63,233,0,0 ; movdqa 0xe93f(%rip),%xmm0 # 2c180 <_sk_overlay_sse2_8bit+0x105f>
+ DB 102,15,111,5,84,233,0,0 ; movdqa 0xe954(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,65,233,0,0 ; mulps 0xe941(%rip),%xmm0 # 2c190 <_sk_overlay_sse2_8bit+0x106f>
- DB 102,15,111,13,73,233,0,0 ; movdqa 0xe949(%rip),%xmm1 # 2c1a0 <_sk_overlay_sse2_8bit+0x107f>
+ DB 15,89,5,86,233,0,0 ; mulps 0xe956(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,13,94,233,0,0 ; movdqa 0xe95e(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,75,233,0,0 ; mulps 0xe94b(%rip),%xmm1 # 2c1b0 <_sk_overlay_sse2_8bit+0x108f>
- DB 102,15,219,21,83,233,0,0 ; pand 0xe953(%rip),%xmm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x109f>
+ DB 15,89,13,96,233,0,0 ; mulps 0xe960(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,21,104,233,0,0 ; pand 0xe968(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,89,233,0,0 ; mulps 0xe959(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x10af>
+ DB 15,89,21,110,233,0,0 ; mulps 0xe96e(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,240,230,0,0 ; movaps 0xe6f0(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,5,231,0,0 ; movaps 0xe705(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -28100,12 +28444,12 @@ _sk_store_565_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,239,234,0,0 ; movaps 0xeaef(%rip),%xmm8 # 2c390 <_sk_overlay_sse2_8bit+0x126f>
+ DB 68,15,40,5,4,235,0,0 ; movaps 0xeb04(%rip),%xmm8 # 2c970 <_sk_overlay_sse2_8bit+0x1263>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,228,234,0,0 ; movaps 0xeae4(%rip),%xmm10 # 2c3a0 <_sk_overlay_sse2_8bit+0x127f>
+ DB 68,15,40,21,249,234,0,0 ; movaps 0xeaf9(%rip),%xmm10 # 2c980 <_sk_overlay_sse2_8bit+0x1273>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -28117,7 +28461,7 @@ _sk_store_565_sse2 LABEL PROC
DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 1d8fe <_sk_store_565_sse2+0x7b>
+ DB 117,10 ; jne 1dec9 <_sk_store_565_sse2+0x7b>
DB 242,71,15,17,4,89 ; movsd %xmm8,(%r9,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28125,19 +28469,19 @@ _sk_store_565_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,38 ; je 1d936 <_sk_store_565_sse2+0xb3>
+ DB 116,38 ; je 1df01 <_sk_store_565_sse2+0xb3>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 1d928 <_sk_store_565_sse2+0xa5>
+ DB 116,18 ; je 1def3 <_sk_store_565_sse2+0xa5>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,222 ; jne 1d8fa <_sk_store_565_sse2+0x77>
+ DB 117,222 ; jne 1dec5 <_sk_store_565_sse2+0x77>
DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax
DB 102,67,137,68,89,4 ; mov %ax,0x4(%r9,%r11,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,71,15,126,4,89 ; movd %xmm8,(%r9,%r11,2)
- DB 235,196 ; jmp 1d8fa <_sk_store_565_sse2+0x77>
+ DB 235,196 ; jmp 1dec5 <_sk_store_565_sse2+0x77>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,89 ; mov %ax,(%r9,%r11,2)
- DB 235,184 ; jmp 1d8fa <_sk_store_565_sse2+0x77>
+ DB 235,184 ; jmp 1dec5 <_sk_store_565_sse2+0x77>
PUBLIC _sk_load_4444_sse2
_sk_load_4444_sse2 LABEL PROC
@@ -28149,45 +28493,45 @@ _sk_load_4444_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1d9bf <_sk_load_4444_sse2+0x7d>
+ DB 117,98 ; jne 1df8a <_sk_load_4444_sse2+0x7d>
DB 243,67,15,126,28,89 ; movq (%r9,%r11,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,65,234,0,0 ; movdqa 0xea41(%rip),%xmm0 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f>
+ DB 102,15,111,5,86,234,0,0 ; movdqa 0xea56(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,67,234,0,0 ; mulps 0xea43(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f>
- DB 102,15,111,13,75,234,0,0 ; movdqa 0xea4b(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af>
+ DB 15,89,5,88,234,0,0 ; mulps 0xea58(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,13,96,234,0,0 ; movdqa 0xea60(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,77,234,0,0 ; mulps 0xea4d(%rip),%xmm1 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf>
- DB 102,15,111,21,85,234,0,0 ; movdqa 0xea55(%rip),%xmm2 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf>
+ DB 15,89,13,98,234,0,0 ; mulps 0xea62(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,21,106,234,0,0 ; movdqa 0xea6a(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,87,234,0,0 ; mulps 0xea57(%rip),%xmm2 # 2c400 <_sk_overlay_sse2_8bit+0x12df>
- DB 102,15,219,29,95,234,0,0 ; pand 0xea5f(%rip),%xmm3 # 2c410 <_sk_overlay_sse2_8bit+0x12ef>
+ DB 15,89,21,108,234,0,0 ; mulps 0xea6c(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,29,116,234,0,0 ; pand 0xea74(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,101,234,0,0 ; mulps 0xea65(%rip),%xmm3 # 2c420 <_sk_overlay_sse2_8bit+0x12ff>
+ DB 15,89,29,122,234,0,0 ; mulps 0xea7a(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 1d9fe <_sk_load_4444_sse2+0xbc>
+ DB 116,50 ; je 1dfc9 <_sk_load_4444_sse2+0xbc>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d9eb <_sk_load_4444_sse2+0xa9>
+ DB 116,21 ; je 1dfb6 <_sk_load_4444_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 1d967 <_sk_load_4444_sse2+0x25>
+ DB 117,139 ; jne 1df32 <_sk_load_4444_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,216 ; movsd %xmm0,%xmm3
- DB 233,105,255,255,255 ; jmpq 1d967 <_sk_load_4444_sse2+0x25>
+ DB 233,105,255,255,255 ; jmpq 1df32 <_sk_load_4444_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 233,91,255,255,255 ; jmpq 1d967 <_sk_load_4444_sse2+0x25>
+ DB 233,91,255,255,255 ; jmpq 1df32 <_sk_load_4444_sse2+0x25>
PUBLIC _sk_load_4444_dst_sse2
_sk_load_4444_dst_sse2 LABEL PROC
@@ -28199,45 +28543,45 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1da89 <_sk_load_4444_dst_sse2+0x7d>
+ DB 117,98 ; jne 1e054 <_sk_load_4444_dst_sse2+0x7d>
DB 243,67,15,126,60,89 ; movq (%r9,%r11,2),%xmm7
DB 102,15,97,248 ; punpcklwd %xmm0,%xmm7
- DB 102,15,111,37,119,233,0,0 ; movdqa 0xe977(%rip),%xmm4 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f>
+ DB 102,15,111,37,140,233,0,0 ; movdqa 0xe98c(%rip),%xmm4 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,121,233,0,0 ; mulps 0xe979(%rip),%xmm4 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f>
- DB 102,15,111,45,129,233,0,0 ; movdqa 0xe981(%rip),%xmm5 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af>
+ DB 15,89,37,142,233,0,0 ; mulps 0xe98e(%rip),%xmm4 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,45,150,233,0,0 ; movdqa 0xe996(%rip),%xmm5 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,239 ; pand %xmm7,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,131,233,0,0 ; mulps 0xe983(%rip),%xmm5 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf>
- DB 102,15,111,53,139,233,0,0 ; movdqa 0xe98b(%rip),%xmm6 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf>
+ DB 15,89,45,152,233,0,0 ; mulps 0xe998(%rip),%xmm5 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,53,160,233,0,0 ; movdqa 0xe9a0(%rip),%xmm6 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,141,233,0,0 ; mulps 0xe98d(%rip),%xmm6 # 2c400 <_sk_overlay_sse2_8bit+0x12df>
- DB 102,15,219,61,149,233,0,0 ; pand 0xe995(%rip),%xmm7 # 2c410 <_sk_overlay_sse2_8bit+0x12ef>
+ DB 15,89,53,162,233,0,0 ; mulps 0xe9a2(%rip),%xmm6 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,61,170,233,0,0 ; pand 0xe9aa(%rip),%xmm7 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,61,155,233,0,0 ; mulps 0xe99b(%rip),%xmm7 # 2c420 <_sk_overlay_sse2_8bit+0x12ff>
+ DB 15,89,61,176,233,0,0 ; mulps 0xe9b0(%rip),%xmm7 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 1dac8 <_sk_load_4444_dst_sse2+0xbc>
+ DB 116,50 ; je 1e093 <_sk_load_4444_dst_sse2+0xbc>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1dab5 <_sk_load_4444_dst_sse2+0xa9>
+ DB 116,21 ; je 1e080 <_sk_load_4444_dst_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 1da31 <_sk_load_4444_dst_sse2+0x25>
+ DB 117,139 ; jne 1dffc <_sk_load_4444_dst_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 242,15,16,252 ; movsd %xmm4,%xmm7
- DB 233,105,255,255,255 ; jmpq 1da31 <_sk_load_4444_dst_sse2+0x25>
+ DB 233,105,255,255,255 ; jmpq 1dffc <_sk_load_4444_dst_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,91,255,255,255 ; jmpq 1da31 <_sk_load_4444_dst_sse2+0x25>
+ DB 233,91,255,255,255 ; jmpq 1dffc <_sk_load_4444_dst_sse2+0x25>
PUBLIC _sk_gather_4444_sse2
_sk_gather_4444_sse2 LABEL PROC
@@ -28270,21 +28614,21 @@ _sk_gather_4444_sse2 LABEL PROC
DB 102,15,196,216,3 ; pinsrw $0x3,%eax,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,84,232,0,0 ; movdqa 0xe854(%rip),%xmm0 # 2c3b0 <_sk_overlay_sse2_8bit+0x128f>
+ DB 102,15,111,5,105,232,0,0 ; movdqa 0xe869(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,86,232,0,0 ; mulps 0xe856(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x129f>
- DB 102,15,111,13,94,232,0,0 ; movdqa 0xe85e(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0x12af>
+ DB 15,89,5,107,232,0,0 ; mulps 0xe86b(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,13,115,232,0,0 ; movdqa 0xe873(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,96,232,0,0 ; mulps 0xe860(%rip),%xmm1 # 2c3e0 <_sk_overlay_sse2_8bit+0x12bf>
- DB 102,15,111,21,104,232,0,0 ; movdqa 0xe868(%rip),%xmm2 # 2c3f0 <_sk_overlay_sse2_8bit+0x12cf>
+ DB 15,89,13,117,232,0,0 ; mulps 0xe875(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,21,125,232,0,0 ; movdqa 0xe87d(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,106,232,0,0 ; mulps 0xe86a(%rip),%xmm2 # 2c400 <_sk_overlay_sse2_8bit+0x12df>
- DB 102,15,219,29,114,232,0,0 ; pand 0xe872(%rip),%xmm3 # 2c410 <_sk_overlay_sse2_8bit+0x12ef>
+ DB 15,89,21,127,232,0,0 ; mulps 0xe87f(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,29,135,232,0,0 ; pand 0xe887(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,120,232,0,0 ; mulps 0xe878(%rip),%xmm3 # 2c420 <_sk_overlay_sse2_8bit+0x12ff>
+ DB 15,89,29,141,232,0,0 ; mulps 0xe88d(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -28298,7 +28642,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,101,232,0,0 ; movaps 0xe865(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x130f>
+ DB 68,15,40,5,122,232,0,0 ; movaps 0xe87a(%rip),%xmm8 # 2ca10 <_sk_overlay_sse2_8bit+0x1303>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -28320,7 +28664,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 1dc3c <_sk_store_4444_sse2+0x8f>
+ DB 117,10 ; jne 1e207 <_sk_store_4444_sse2+0x8f>
DB 242,71,15,17,4,89 ; movsd %xmm8,(%r9,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28328,19 +28672,19 @@ _sk_store_4444_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,38 ; je 1dc74 <_sk_store_4444_sse2+0xc7>
+ DB 116,38 ; je 1e23f <_sk_store_4444_sse2+0xc7>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 1dc66 <_sk_store_4444_sse2+0xb9>
+ DB 116,18 ; je 1e231 <_sk_store_4444_sse2+0xb9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,222 ; jne 1dc38 <_sk_store_4444_sse2+0x8b>
+ DB 117,222 ; jne 1e203 <_sk_store_4444_sse2+0x8b>
DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax
DB 102,67,137,68,89,4 ; mov %ax,0x4(%r9,%r11,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,71,15,126,4,89 ; movd %xmm8,(%r9,%r11,2)
- DB 235,196 ; jmp 1dc38 <_sk_store_4444_sse2+0x8b>
+ DB 235,196 ; jmp 1e203 <_sk_store_4444_sse2+0x8b>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,89 ; mov %ax,(%r9,%r11,2)
- DB 235,184 ; jmp 1dc38 <_sk_store_4444_sse2+0x8b>
+ DB 235,184 ; jmp 1e203 <_sk_store_4444_sse2+0x8b>
PUBLIC _sk_load_8888_sse2
_sk_load_8888_sse2 LABEL PROC
@@ -28352,13 +28696,13 @@ _sk_load_8888_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1dcfe <_sk_load_8888_sse2+0x7e>
+ DB 117,98 ; jne 1e2c9 <_sk_load_8888_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,21,118,227,0,0 ; movdqa 0xe376(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,21,139,227,0,0 ; movdqa 0xe38b(%rip),%xmm2 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,178,228,0,0 ; movaps 0xe4b2(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,199,228,0,0 ; movaps 0xe4c7(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -28378,18 +28722,18 @@ _sk_load_8888_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 1dd34 <_sk_load_8888_sse2+0xb4>
+ DB 116,41 ; je 1e2ff <_sk_load_8888_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1dd29 <_sk_load_8888_sse2+0xa9>
+ DB 116,19 ; je 1e2f4 <_sk_load_8888_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 1dca2 <_sk_load_8888_sse2+0x22>
+ DB 117,134 ; jne 1e26d <_sk_load_8888_sse2+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1dca2 <_sk_load_8888_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1e26d <_sk_load_8888_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1dca2 <_sk_load_8888_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1e26d <_sk_load_8888_sse2+0x22>
PUBLIC _sk_load_8888_dst_sse2
_sk_load_8888_dst_sse2 LABEL PROC
@@ -28401,13 +28745,13 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1ddbd <_sk_load_8888_dst_sse2+0x7e>
+ DB 117,98 ; jne 1e388 <_sk_load_8888_dst_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,53,183,226,0,0 ; movdqa 0xe2b7(%rip),%xmm6 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,53,204,226,0,0 ; movdqa 0xe2cc(%rip),%xmm6 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,225 ; movdqa %xmm9,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 68,15,40,5,243,227,0,0 ; movaps 0xe3f3(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,8,228,0,0 ; movaps 0xe408(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,114,213,8 ; psrld $0x8,%xmm5
@@ -28427,18 +28771,18 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 1ddf3 <_sk_load_8888_dst_sse2+0xb4>
+ DB 116,41 ; je 1e3be <_sk_load_8888_dst_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1dde8 <_sk_load_8888_dst_sse2+0xa9>
+ DB 116,19 ; je 1e3b3 <_sk_load_8888_dst_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 1dd61 <_sk_load_8888_dst_sse2+0x22>
+ DB 117,134 ; jne 1e32c <_sk_load_8888_dst_sse2+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1dd61 <_sk_load_8888_dst_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1e32c <_sk_load_8888_dst_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1dd61 <_sk_load_8888_dst_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1e32c <_sk_load_8888_dst_sse2+0x22>
PUBLIC _sk_gather_8888_sse2
_sk_gather_8888_sse2 LABEL PROC
@@ -28470,11 +28814,11 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,21,160,225,0,0 ; movdqa 0xe1a0(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,21,181,225,0,0 ; movdqa 0xe1b5(%rip),%xmm2 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,220,226,0,0 ; movaps 0xe2dc(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,241,226,0,0 ; movaps 0xe2f1(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -28502,7 +28846,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,92,225,0,0 ; movaps 0xe15c(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,113,225,0,0 ; movaps 0xe171(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -28521,24 +28865,24 @@ _sk_store_8888_sse2 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 1df54 <_sk_store_8888_sse2+0x7f>
+ DB 117,10 ; jne 1e51f <_sk_store_8888_sse2+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,33 ; je 1df82 <_sk_store_8888_sse2+0xad>
+ DB 116,33 ; je 1e54d <_sk_store_8888_sse2+0xad>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1df7a <_sk_store_8888_sse2+0xa5>
+ DB 116,19 ; je 1e545 <_sk_store_8888_sse2+0xa5>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 1df50 <_sk_store_8888_sse2+0x7b>
+ DB 117,227 ; jne 1e51b <_sk_store_8888_sse2+0x7b>
DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9
DB 102,69,15,126,76,129,8 ; movd %xmm9,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,206 ; jmp 1df50 <_sk_store_8888_sse2+0x7b>
+ DB 235,206 ; jmp 1e51b <_sk_store_8888_sse2+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,198 ; jmp 1df50 <_sk_store_8888_sse2+0x7b>
+ DB 235,198 ; jmp 1e51b <_sk_store_8888_sse2+0x7b>
PUBLIC _sk_load_bgra_sse2
_sk_load_bgra_sse2 LABEL PROC
@@ -28550,13 +28894,13 @@ _sk_load_bgra_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1e008 <_sk_load_bgra_sse2+0x7e>
+ DB 117,98 ; jne 1e5d3 <_sk_load_bgra_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,5,108,224,0,0 ; movdqa 0xe06c(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,5,129,224,0,0 ; movdqa 0xe081(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 68,15,40,5,168,225,0,0 ; movaps 0xe1a8(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,189,225,0,0 ; movaps 0xe1bd(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -28576,18 +28920,18 @@ _sk_load_bgra_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 1e03e <_sk_load_bgra_sse2+0xb4>
+ DB 116,41 ; je 1e609 <_sk_load_bgra_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1e033 <_sk_load_bgra_sse2+0xa9>
+ DB 116,19 ; je 1e5fe <_sk_load_bgra_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 1dfac <_sk_load_bgra_sse2+0x22>
+ DB 117,134 ; jne 1e577 <_sk_load_bgra_sse2+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1dfac <_sk_load_bgra_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1e577 <_sk_load_bgra_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1dfac <_sk_load_bgra_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1e577 <_sk_load_bgra_sse2+0x22>
PUBLIC _sk_load_bgra_dst_sse2
_sk_load_bgra_dst_sse2 LABEL PROC
@@ -28599,13 +28943,13 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1e0c7 <_sk_load_bgra_dst_sse2+0x7e>
+ DB 117,98 ; jne 1e692 <_sk_load_bgra_dst_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,37,173,223,0,0 ; movdqa 0xdfad(%rip),%xmm4 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,37,194,223,0,0 ; movdqa 0xdfc2(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,245 ; cvtdq2ps %xmm5,%xmm6
- DB 68,15,40,5,233,224,0,0 ; movaps 0xe0e9(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,254,224,0,0 ; movaps 0xe0fe(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,114,213,8 ; psrld $0x8,%xmm5
@@ -28625,18 +28969,18 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 1e0fd <_sk_load_bgra_dst_sse2+0xb4>
+ DB 116,41 ; je 1e6c8 <_sk_load_bgra_dst_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1e0f2 <_sk_load_bgra_dst_sse2+0xa9>
+ DB 116,19 ; je 1e6bd <_sk_load_bgra_dst_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 1e06b <_sk_load_bgra_dst_sse2+0x22>
+ DB 117,134 ; jne 1e636 <_sk_load_bgra_dst_sse2+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1e06b <_sk_load_bgra_dst_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1e636 <_sk_load_bgra_dst_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1e06b <_sk_load_bgra_dst_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1e636 <_sk_load_bgra_dst_sse2+0x22>
PUBLIC _sk_gather_bgra_sse2
_sk_gather_bgra_sse2 LABEL PROC
@@ -28668,11 +29012,11 @@ _sk_gather_bgra_sse2 LABEL PROC
DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,5,150,222,0,0 ; movdqa 0xde96(%rip),%xmm0 # 2c020 <_sk_overlay_sse2_8bit+0xeff>
+ DB 102,15,111,5,171,222,0,0 ; movdqa 0xdeab(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 68,15,40,5,210,223,0,0 ; movaps 0xdfd2(%rip),%xmm8 # 2c170 <_sk_overlay_sse2_8bit+0x104f>
+ DB 68,15,40,5,231,223,0,0 ; movaps 0xdfe7(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -28700,7 +29044,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,82,222,0,0 ; movaps 0xde52(%rip),%xmm8 # 2c050 <_sk_overlay_sse2_8bit+0xf2f>
+ DB 68,15,40,5,103,222,0,0 ; movaps 0xde67(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,40,202 ; movaps %xmm2,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -28719,24 +29063,24 @@ _sk_store_bgra_sse2 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 1e25e <_sk_store_bgra_sse2+0x7f>
+ DB 117,10 ; jne 1e829 <_sk_store_bgra_sse2+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,33 ; je 1e28c <_sk_store_bgra_sse2+0xad>
+ DB 116,33 ; je 1e857 <_sk_store_bgra_sse2+0xad>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1e284 <_sk_store_bgra_sse2+0xa5>
+ DB 116,19 ; je 1e84f <_sk_store_bgra_sse2+0xa5>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 1e25a <_sk_store_bgra_sse2+0x7b>
+ DB 117,227 ; jne 1e825 <_sk_store_bgra_sse2+0x7b>
DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9
DB 102,69,15,126,76,129,8 ; movd %xmm9,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,206 ; jmp 1e25a <_sk_store_bgra_sse2+0x7b>
+ DB 235,206 ; jmp 1e825 <_sk_store_bgra_sse2+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,198 ; jmp 1e25a <_sk_store_bgra_sse2+0x7b>
+ DB 235,198 ; jmp 1e825 <_sk_store_bgra_sse2+0x7b>
PUBLIC _sk_load_f16_sse2
_sk_load_f16_sse2 LABEL PROC
@@ -28748,7 +29092,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,98,1,0,0 ; jne 1e416 <_sk_load_f16_sse2+0x182>
+ DB 15,133,98,1,0,0 ; jne 1e9e1 <_sk_load_f16_sse2+0x182>
DB 102,65,15,16,4,193 ; movupd (%r9,%rax,8),%xmm0
DB 102,65,15,16,76,193,16 ; movupd 0x10(%r9,%rax,8),%xmm1
DB 102,68,15,40,192 ; movapd %xmm0,%xmm8
@@ -28760,7 +29104,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,74,225,0,0 ; movdqa 0xe14a(%rip),%xmm9 # 2c440 <_sk_overlay_sse2_8bit+0x131f>
+ DB 102,68,15,111,13,95,225,0,0 ; movdqa 0xe15f(%rip),%xmm9 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -28768,11 +29112,11 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,63,225,0,0 ; movdqa 0xe13f(%rip),%xmm11 # 2c460 <_sk_overlay_sse2_8bit+0x133f>
+ DB 102,68,15,111,29,84,225,0,0 ; movdqa 0xe154(%rip),%xmm11 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,65,225,0,0 ; movdqa 0xe141(%rip),%xmm12 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
+ DB 102,68,15,111,37,86,225,0,0 ; movdqa 0xe156(%rip),%xmm12 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,228,226,0,0 ; movdqa 0xe2e4(%rip),%xmm3 # 2c620 <_sk_overlay_sse2_8bit+0x14ff>
+ DB 102,15,111,29,249,226,0,0 ; movdqa 0xe2f9(%rip),%xmm3 # 2cc00 <_sk_overlay_sse2_8bit+0x14f3>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -28820,17 +29164,17 @@ _sk_load_f16_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,193 ; movsd (%r9,%rax,8),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 1e433 <_sk_load_f16_sse2+0x19f>
+ DB 117,17 ; jne 1e9fe <_sk_load_f16_sse2+0x19f>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,142,254,255,255 ; jmpq 1e2c1 <_sk_load_f16_sse2+0x2d>
+ DB 233,142,254,255,255 ; jmpq 1e88c <_sk_load_f16_sse2+0x2d>
DB 102,65,15,22,68,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,121,254,255,255 ; jb 1e2c1 <_sk_load_f16_sse2+0x2d>
+ DB 15,130,121,254,255,255 ; jb 1e88c <_sk_load_f16_sse2+0x2d>
DB 242,65,15,16,76,193,16 ; movsd 0x10(%r9,%rax,8),%xmm1
- DB 233,109,254,255,255 ; jmpq 1e2c1 <_sk_load_f16_sse2+0x2d>
+ DB 233,109,254,255,255 ; jmpq 1e88c <_sk_load_f16_sse2+0x2d>
PUBLIC _sk_load_f16_dst_sse2
_sk_load_f16_dst_sse2 LABEL PROC
@@ -28842,7 +29186,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,98,1,0,0 ; jne 1e5d6 <_sk_load_f16_dst_sse2+0x182>
+ DB 15,133,98,1,0,0 ; jne 1eba1 <_sk_load_f16_dst_sse2+0x182>
DB 102,65,15,16,36,193 ; movupd (%r9,%rax,8),%xmm4
DB 102,65,15,16,108,193,16 ; movupd 0x10(%r9,%rax,8),%xmm5
DB 102,68,15,40,196 ; movapd %xmm4,%xmm8
@@ -28854,7 +29198,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,238 ; movdqa %xmm14,%xmm5
DB 102,65,15,97,234 ; punpcklwd %xmm10,%xmm5
- DB 102,68,15,111,13,138,223,0,0 ; movdqa 0xdf8a(%rip),%xmm9 # 2c440 <_sk_overlay_sse2_8bit+0x131f>
+ DB 102,68,15,111,13,159,223,0,0 ; movdqa 0xdf9f(%rip),%xmm9 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,65,15,219,225 ; pand %xmm9,%xmm4
DB 102,15,239,236 ; pxor %xmm4,%xmm5
@@ -28862,11 +29206,11 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,68,15,111,237 ; movdqa %xmm5,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,236 ; por %xmm4,%xmm13
- DB 102,68,15,111,29,127,223,0,0 ; movdqa 0xdf7f(%rip),%xmm11 # 2c460 <_sk_overlay_sse2_8bit+0x133f>
+ DB 102,68,15,111,29,148,223,0,0 ; movdqa 0xdf94(%rip),%xmm11 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,129,223,0,0 ; movdqa 0xdf81(%rip),%xmm12 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
+ DB 102,68,15,111,37,150,223,0,0 ; movdqa 0xdf96(%rip),%xmm12 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
DB 102,65,15,239,236 ; pxor %xmm12,%xmm5
- DB 102,15,111,61,36,225,0,0 ; movdqa 0xe124(%rip),%xmm7 # 2c620 <_sk_overlay_sse2_8bit+0x14ff>
+ DB 102,15,111,61,57,225,0,0 ; movdqa 0xe139(%rip),%xmm7 # 2cc00 <_sk_overlay_sse2_8bit+0x14f3>
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
DB 102,15,102,229 ; pcmpgtd %xmm5,%xmm4
DB 102,65,15,223,229 ; pandn %xmm13,%xmm4
@@ -28914,17 +29258,17 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,36,193 ; movsd (%r9,%rax,8),%xmm4
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 1e5f3 <_sk_load_f16_dst_sse2+0x19f>
+ DB 117,17 ; jne 1ebbe <_sk_load_f16_dst_sse2+0x19f>
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
DB 102,15,20,229 ; unpcklpd %xmm5,%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
- DB 233,142,254,255,255 ; jmpq 1e481 <_sk_load_f16_dst_sse2+0x2d>
+ DB 233,142,254,255,255 ; jmpq 1ea4c <_sk_load_f16_dst_sse2+0x2d>
DB 102,65,15,22,100,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,121,254,255,255 ; jb 1e481 <_sk_load_f16_dst_sse2+0x2d>
+ DB 15,130,121,254,255,255 ; jb 1ea4c <_sk_load_f16_dst_sse2+0x2d>
DB 242,65,15,16,108,193,16 ; movsd 0x10(%r9,%rax,8),%xmm5
- DB 233,109,254,255,255 ; jmpq 1e481 <_sk_load_f16_dst_sse2+0x2d>
+ DB 233,109,254,255,255 ; jmpq 1ea4c <_sk_load_f16_dst_sse2+0x2d>
PUBLIC _sk_gather_f16_sse2
_sk_gather_f16_sse2 LABEL PROC
@@ -28964,7 +29308,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,131,221,0,0 ; movdqa 0xdd83(%rip),%xmm9 # 2c440 <_sk_overlay_sse2_8bit+0x131f>
+ DB 102,68,15,111,13,152,221,0,0 ; movdqa 0xdd98(%rip),%xmm9 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -28972,11 +29316,11 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,120,221,0,0 ; movdqa 0xdd78(%rip),%xmm11 # 2c460 <_sk_overlay_sse2_8bit+0x133f>
+ DB 102,68,15,111,29,141,221,0,0 ; movdqa 0xdd8d(%rip),%xmm11 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,122,221,0,0 ; movdqa 0xdd7a(%rip),%xmm12 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
+ DB 102,68,15,111,37,143,221,0,0 ; movdqa 0xdd8f(%rip),%xmm12 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,29,223,0,0 ; movdqa 0xdf1d(%rip),%xmm3 # 2c620 <_sk_overlay_sse2_8bit+0x14ff>
+ DB 102,15,111,29,50,223,0,0 ; movdqa 0xdf32(%rip),%xmm3 # 2cc00 <_sk_overlay_sse2_8bit+0x14f3>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -29033,17 +29377,17 @@ _sk_store_f16_sse2 LABEL PROC
DB 73,193,225,3 ; shl $0x3,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 102,68,15,111,21,114,220,0,0 ; movdqa 0xdc72(%rip),%xmm10 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
+ DB 102,68,15,111,21,135,220,0,0 ; movdqa 0xdc87(%rip),%xmm10 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
DB 102,68,15,111,224 ; movdqa %xmm0,%xmm12
DB 102,69,15,219,226 ; pand %xmm10,%xmm12
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,236 ; pxor %xmm12,%xmm13
- DB 102,68,15,111,13,101,220,0,0 ; movdqa 0xdc65(%rip),%xmm9 # 2c480 <_sk_overlay_sse2_8bit+0x135f>
+ DB 102,68,15,111,13,122,220,0,0 ; movdqa 0xdc7a(%rip),%xmm9 # 2ca60 <_sk_overlay_sse2_8bit+0x1353>
DB 102,65,15,114,212,16 ; psrld $0x10,%xmm12
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,29,86,220,0,0 ; movdqa 0xdc56(%rip),%xmm11 # 2c490 <_sk_overlay_sse2_8bit+0x136f>
+ DB 102,68,15,111,29,107,220,0,0 ; movdqa 0xdc6b(%rip),%xmm11 # 2ca70 <_sk_overlay_sse2_8bit+0x1363>
DB 102,69,15,235,227 ; por %xmm11,%xmm12
DB 102,69,15,254,229 ; paddd %xmm13,%xmm12
DB 102,65,15,114,244,16 ; pslld $0x10,%xmm12
@@ -29095,7 +29439,7 @@ _sk_store_f16_sse2 LABEL PROC
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,69,15,98,204 ; punpckldq %xmm12,%xmm9
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 1e95c <_sk_store_f16_sse2+0x17e>
+ DB 117,21 ; jne 1ef27 <_sk_store_f16_sse2+0x17e>
DB 69,15,17,12,193 ; movups %xmm9,(%r9,%rax,8)
DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8
DB 243,69,15,127,68,193,16 ; movdqu %xmm8,0x10(%r9,%rax,8)
@@ -29103,13 +29447,13 @@ _sk_store_f16_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,12,193 ; movq %xmm9,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 1e958 <_sk_store_f16_sse2+0x17a>
+ DB 116,240 ; je 1ef23 <_sk_store_f16_sse2+0x17a>
DB 102,69,15,23,76,193,8 ; movhpd %xmm9,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 1e958 <_sk_store_f16_sse2+0x17a>
+ DB 114,227 ; jb 1ef23 <_sk_store_f16_sse2+0x17a>
DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8
DB 102,69,15,214,68,193,16 ; movq %xmm8,0x10(%r9,%rax,8)
- DB 235,213 ; jmp 1e958 <_sk_store_f16_sse2+0x17a>
+ DB 235,213 ; jmp 1ef23 <_sk_store_f16_sse2+0x17a>
PUBLIC _sk_load_u16_be_sse2
_sk_load_u16_be_sse2 LABEL PROC
@@ -29122,7 +29466,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,190,0,0,0 ; jne 1ea68 <_sk_load_u16_be_sse2+0xe5>
+ DB 15,133,190,0,0,0 ; jne 1f033 <_sk_load_u16_be_sse2+0xe5>
DB 102,65,15,16,4,65 ; movupd (%r9,%rax,2),%xmm0
DB 102,65,15,16,76,65,16 ; movupd 0x10(%r9,%rax,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -29139,7 +29483,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,5,5,216,0,0 ; movaps 0xd805(%rip),%xmm8 # 2c200 <_sk_overlay_sse2_8bit+0x10df>
+ DB 68,15,40,5,26,216,0,0 ; movaps 0xd81a(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -29167,17 +29511,17 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,65 ; movsd (%r9,%rax,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 1ea85 <_sk_load_u16_be_sse2+0x102>
+ DB 117,17 ; jne 1f050 <_sk_load_u16_be_sse2+0x102>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,50,255,255,255 ; jmpq 1e9b7 <_sk_load_u16_be_sse2+0x34>
+ DB 233,50,255,255,255 ; jmpq 1ef82 <_sk_load_u16_be_sse2+0x34>
DB 102,65,15,22,68,65,8 ; movhpd 0x8(%r9,%rax,2),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,29,255,255,255 ; jb 1e9b7 <_sk_load_u16_be_sse2+0x34>
+ DB 15,130,29,255,255,255 ; jb 1ef82 <_sk_load_u16_be_sse2+0x34>
DB 242,65,15,16,76,65,16 ; movsd 0x10(%r9,%rax,2),%xmm1
- DB 233,17,255,255,255 ; jmpq 1e9b7 <_sk_load_u16_be_sse2+0x34>
+ DB 233,17,255,255,255 ; jmpq 1ef82 <_sk_load_u16_be_sse2+0x34>
PUBLIC _sk_load_rgb_u16_be_sse2
_sk_load_rgb_u16_be_sse2 LABEL PROC
@@ -29192,7 +29536,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,175,0,0,0 ; jne 1eb80 <_sk_load_rgb_u16_be_sse2+0xda>
+ DB 15,133,175,0,0,0 ; jne 1f14b <_sk_load_rgb_u16_be_sse2+0xda>
DB 243,65,15,111,20,65 ; movdqu (%r9,%rax,2),%xmm2
DB 243,65,15,111,92,65,8 ; movdqu 0x8(%r9,%rax,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -29213,7 +29557,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,65,15,97,200 ; punpcklwd %xmm8,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,13,203,214,0,0 ; movaps 0xd6cb(%rip),%xmm9 # 2c200 <_sk_overlay_sse2_8bit+0x10df>
+ DB 68,15,40,13,224,214,0,0 ; movaps 0xd6e0(%rip),%xmm9 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -29230,27 +29574,27 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,242,211,0,0 ; movaps 0xd3f2(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,7,212,0,0 ; movaps 0xd407(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2
DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 1eba5 <_sk_load_rgb_u16_be_sse2+0xff>
+ DB 117,13 ; jne 1f170 <_sk_load_rgb_u16_be_sse2+0xff>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,80,255,255,255 ; jmpq 1eaf5 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,80,255,255,255 ; jmpq 1f0c0 <_sk_load_rgb_u16_be_sse2+0x4f>
DB 102,65,15,110,68,65,6 ; movd 0x6(%r9,%rax,2),%xmm0
DB 102,65,15,196,68,65,10,2 ; pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 1ebd6 <_sk_load_rgb_u16_be_sse2+0x130>
+ DB 114,24 ; jb 1f1a1 <_sk_load_rgb_u16_be_sse2+0x130>
DB 102,65,15,110,92,65,12 ; movd 0xc(%r9,%rax,2),%xmm3
DB 102,65,15,196,92,65,16,2 ; pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,31,255,255,255 ; jmpq 1eaf5 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,31,255,255,255 ; jmpq 1f0c0 <_sk_load_rgb_u16_be_sse2+0x4f>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,22,255,255,255 ; jmpq 1eaf5 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,22,255,255,255 ; jmpq 1f0c0 <_sk_load_rgb_u16_be_sse2+0x4f>
PUBLIC _sk_store_u16_be_sse2
_sk_store_u16_be_sse2 LABEL PROC
@@ -29262,7 +29606,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 68,15,40,21,155,216,0,0 ; movaps 0xd89b(%rip),%xmm10 # 2c4a0 <_sk_overlay_sse2_8bit+0x137f>
+ DB 68,15,40,21,176,216,0,0 ; movaps 0xd8b0(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0x1373>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -29307,7 +29651,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10
DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 1ecff <_sk_store_u16_be_sse2+0x120>
+ DB 117,21 ; jne 1f2ca <_sk_store_u16_be_sse2+0x120>
DB 69,15,17,20,65 ; movups %xmm10,(%r9,%rax,2)
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 243,69,15,127,68,65,16 ; movdqu %xmm8,0x10(%r9,%rax,2)
@@ -29315,13 +29659,13 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,20,65 ; movq %xmm10,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 1ecfb <_sk_store_u16_be_sse2+0x11c>
+ DB 116,240 ; je 1f2c6 <_sk_store_u16_be_sse2+0x11c>
DB 102,69,15,23,84,65,8 ; movhpd %xmm10,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 1ecfb <_sk_store_u16_be_sse2+0x11c>
+ DB 114,227 ; jb 1f2c6 <_sk_store_u16_be_sse2+0x11c>
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 102,69,15,214,68,65,16 ; movq %xmm8,0x10(%r9,%rax,2)
- DB 235,213 ; jmp 1ecfb <_sk_store_u16_be_sse2+0x11c>
+ DB 235,213 ; jmp 1f2c6 <_sk_store_u16_be_sse2+0x11c>
PUBLIC _sk_load_f32_sse2
_sk_load_f32_sse2 LABEL PROC
@@ -29335,7 +29679,7 @@ _sk_load_f32_sse2 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 1ed91 <_sk_load_f32_sse2+0x6b>
+ DB 117,66 ; jne 1f35c <_sk_load_f32_sse2+0x6b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -29355,17 +29699,17 @@ _sk_load_f32_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 1eda3 <_sk_load_f32_sse2+0x7d>
+ DB 117,8 ; jne 1f36e <_sk_load_f32_sse2+0x7d>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 235,190 ; jmp 1ed61 <_sk_load_f32_sse2+0x3b>
+ DB 235,190 ; jmp 1f32c <_sk_load_f32_sse2+0x3b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 1edb7 <_sk_load_f32_sse2+0x91>
+ DB 114,8 ; jb 1f382 <_sk_load_f32_sse2+0x91>
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
- DB 235,170 ; jmp 1ed61 <_sk_load_f32_sse2+0x3b>
+ DB 235,170 ; jmp 1f32c <_sk_load_f32_sse2+0x3b>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,165 ; jmp 1ed61 <_sk_load_f32_sse2+0x3b>
+ DB 235,165 ; jmp 1f32c <_sk_load_f32_sse2+0x3b>
PUBLIC _sk_load_f32_dst_sse2
_sk_load_f32_dst_sse2 LABEL PROC
@@ -29379,7 +29723,7 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 1ee27 <_sk_load_f32_dst_sse2+0x6b>
+ DB 117,66 ; jne 1f3f2 <_sk_load_f32_dst_sse2+0x6b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -29399,17 +29743,17 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 1ee39 <_sk_load_f32_dst_sse2+0x7d>
+ DB 117,8 ; jne 1f404 <_sk_load_f32_dst_sse2+0x7d>
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 235,190 ; jmp 1edf7 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,190 ; jmp 1f3c2 <_sk_load_f32_dst_sse2+0x3b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 1ee4d <_sk_load_f32_dst_sse2+0x91>
+ DB 114,8 ; jb 1f418 <_sk_load_f32_dst_sse2+0x91>
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
- DB 235,170 ; jmp 1edf7 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,170 ; jmp 1f3c2 <_sk_load_f32_dst_sse2+0x3b>
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,165 ; jmp 1edf7 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,165 ; jmp 1f3c2 <_sk_load_f32_dst_sse2+0x3b>
PUBLIC _sk_store_f32_sse2
_sk_store_f32_sse2 LABEL PROC
@@ -29436,7 +29780,7 @@ _sk_store_f32_sse2 LABEL PROC
DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9
DB 102,69,15,17,36,129 ; movupd %xmm12,(%r9,%rax,4)
DB 77,133,192 ; test %r8,%r8
- DB 117,29 ; jne 1eecf <_sk_store_f32_sse2+0x7d>
+ DB 117,29 ; jne 1f49a <_sk_store_f32_sse2+0x7d>
DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
@@ -29444,12 +29788,12 @@ _sk_store_f32_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,246 ; je 1eecb <_sk_store_f32_sse2+0x79>
+ DB 116,246 ; je 1f496 <_sk_store_f32_sse2+0x79>
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,234 ; jb 1eecb <_sk_store_f32_sse2+0x79>
+ DB 114,234 ; jb 1f496 <_sk_store_f32_sse2+0x79>
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
- DB 235,225 ; jmp 1eecb <_sk_store_f32_sse2+0x79>
+ DB 235,225 ; jmp 1f496 <_sk_store_f32_sse2+0x79>
PUBLIC _sk_clamp_x_sse2
_sk_clamp_x_sse2 LABEL PROC
@@ -29489,7 +29833,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8
DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,8,208,0,0 ; andps 0xd008(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,84,21,29,208,0,0 ; andps 0xd01d(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
@@ -29513,7 +29857,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8
DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,174,207,0,0 ; andps 0xcfae(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,84,21,195,207,0,0 ; andps 0xcfc3(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
@@ -29537,13 +29881,13 @@ _sk_mirror_x_sse2 LABEL PROC
DB 65,15,92,193 ; subps %xmm9,%xmm0
DB 243,69,15,88,210 ; addss %xmm10,%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
- DB 243,68,15,89,29,111,197,0,0 ; mulss 0xc56f(%rip),%xmm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 243,68,15,89,29,144,197,0,0 ; mulss 0xc590(%rip),%xmm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8
DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12
DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11
- DB 68,15,84,29,52,207,0,0 ; andps 0xcf34(%rip),%xmm11 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,84,29,73,207,0,0 ; andps 0xcf49(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
@@ -29570,13 +29914,13 @@ _sk_mirror_y_sse2 LABEL PROC
DB 65,15,92,201 ; subps %xmm9,%xmm1
DB 243,69,15,88,210 ; addss %xmm10,%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
- DB 243,68,15,89,29,234,196,0,0 ; mulss 0xc4ea(%rip),%xmm11 # 2b58c <_sk_overlay_sse2_8bit+0x46b>
+ DB 243,68,15,89,29,11,197,0,0 ; mulss 0xc50b(%rip),%xmm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8
DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12
DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11
- DB 68,15,84,29,175,206,0,0 ; andps 0xceaf(%rip),%xmm11 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,84,29,196,206,0,0 ; andps 0xcec4(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
@@ -29597,7 +29941,7 @@ PUBLIC _sk_clamp_x_1_sse2
_sk_clamp_x_1_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,102,206,0,0 ; minps 0xce66(%rip),%xmm8 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,93,5,123,206,0,0 ; minps 0xce7b(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -29608,7 +29952,7 @@ _sk_repeat_x_1_sse2 LABEL PROC
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,84,13,68,206,0,0 ; andps 0xce44(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,84,13,89,206,0,0 ; andps 0xce59(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -29616,14 +29960,14 @@ _sk_repeat_x_1_sse2 LABEL PROC
PUBLIC _sk_mirror_x_1_sse2
_sk_mirror_x_1_sse2 LABEL PROC
- DB 68,15,40,5,144,206,0,0 ; movaps 0xce90(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0xeaf>
+ DB 68,15,40,5,165,206,0,0 ; movaps 0xcea5(%rip),%xmm8 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,20,206,0,0 ; movaps 0xce14(%rip),%xmm9 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,13,41,206,0,0 ; movaps 0xce29(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,84,13,10,206,0,0 ; andps 0xce0a(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,84,13,31,206,0,0 ; andps 0xce1f(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,88,210 ; addps %xmm10,%xmm10
@@ -29637,10 +29981,10 @@ _sk_mirror_x_1_sse2 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse2
_sk_luminance_to_alpha_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,32,211,0,0 ; mulps 0xd320(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x138f>
- DB 15,89,13,41,211,0,0 ; mulps 0xd329(%rip),%xmm1 # 2c4c0 <_sk_overlay_sse2_8bit+0x139f>
+ DB 15,89,5,53,211,0,0 ; mulps 0xd335(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0x1383>
+ DB 15,89,13,62,211,0,0 ; mulps 0xd33e(%rip),%xmm1 # 2caa0 <_sk_overlay_sse2_8bit+0x1393>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,47,211,0,0 ; mulps 0xd32f(%rip),%xmm3 # 2c4d0 <_sk_overlay_sse2_8bit+0x13af>
+ DB 15,89,29,68,211,0,0 ; mulps 0xd344(%rip),%xmm3 # 2cab0 <_sk_overlay_sse2_8bit+0x13a3>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -29936,9 +30280,9 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 76,139,112,8 ; mov 0x8(%rax),%r14
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js 1f641 <_sk_evenly_spaced_gradient_sse2+0x18>
+ DB 120,7 ; js 1fc0c <_sk_evenly_spaced_gradient_sse2+0x18>
DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1
- DB 235,21 ; jmp 1f656 <_sk_evenly_spaced_gradient_sse2+0x2d>
+ DB 235,21 ; jmp 1fc21 <_sk_evenly_spaced_gradient_sse2+0x2d>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -30034,15 +30378,15 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse2
_sk_gauss_a_to_rgba_sse2 LABEL PROC
- DB 15,40,5,254,204,0,0 ; movaps 0xccfe(%rip),%xmm0 # 2c4e0 <_sk_overlay_sse2_8bit+0x13bf>
+ DB 15,40,5,19,205,0,0 ; movaps 0xcd13(%rip),%xmm0 # 2cac0 <_sk_overlay_sse2_8bit+0x13b3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,4,205,0,0 ; addps 0xcd04(%rip),%xmm0 # 2c4f0 <_sk_overlay_sse2_8bit+0x13cf>
+ DB 15,88,5,25,205,0,0 ; addps 0xcd19(%rip),%xmm0 # 2cad0 <_sk_overlay_sse2_8bit+0x13c3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,10,205,0,0 ; addps 0xcd0a(%rip),%xmm0 # 2c500 <_sk_overlay_sse2_8bit+0x13df>
+ DB 15,88,5,31,205,0,0 ; addps 0xcd1f(%rip),%xmm0 # 2cae0 <_sk_overlay_sse2_8bit+0x13d3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,16,205,0,0 ; addps 0xcd10(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0x13ef>
+ DB 15,88,5,37,205,0,0 ; addps 0xcd25(%rip),%xmm0 # 2caf0 <_sk_overlay_sse2_8bit+0x13e3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,22,205,0,0 ; addps 0xcd16(%rip),%xmm0 # 2c520 <_sk_overlay_sse2_8bit+0x13ff>
+ DB 15,88,5,43,205,0,0 ; addps 0xcd2b(%rip),%xmm0 # 2cb00 <_sk_overlay_sse2_8bit+0x13f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -30058,12 +30402,12 @@ _sk_gradient_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,50 ; jb 1f85d <_sk_gradient_sse2+0x46>
+ DB 114,50 ; jb 1fe28 <_sk_gradient_sse2+0x46>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,63,199,0,0 ; movaps 0xc73f(%rip),%xmm2 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 15,40,21,84,199,0,0 ; movaps 0xc754(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 243,15,16,27 ; movss (%rbx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -30071,7 +30415,7 @@ _sk_gradient_sse2 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,228 ; jne 1f841 <_sk_gradient_sse2+0x2a>
+ DB 117,228 ; jne 1fe0c <_sk_gradient_sse2+0x2a>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,211 ; movq %xmm2,%r11
DB 69,137,217 ; mov %r11d,%r9d
@@ -30206,29 +30550,29 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 69,15,94,220 ; divps %xmm12,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
- DB 68,15,40,45,160,202,0,0 ; movaps 0xcaa0(%rip),%xmm13 # 2c530 <_sk_overlay_sse2_8bit+0x140f>
+ DB 68,15,40,45,181,202,0,0 ; movaps 0xcab5(%rip),%xmm13 # 2cb10 <_sk_overlay_sse2_8bit+0x1403>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,164,202,0,0 ; addps 0xcaa4(%rip),%xmm13 # 2c540 <_sk_overlay_sse2_8bit+0x141f>
+ DB 68,15,88,45,185,202,0,0 ; addps 0xcab9(%rip),%xmm13 # 2cb20 <_sk_overlay_sse2_8bit+0x1413>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,168,202,0,0 ; addps 0xcaa8(%rip),%xmm13 # 2c550 <_sk_overlay_sse2_8bit+0x142f>
+ DB 68,15,88,45,189,202,0,0 ; addps 0xcabd(%rip),%xmm13 # 2cb30 <_sk_overlay_sse2_8bit+0x1423>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,172,202,0,0 ; addps 0xcaac(%rip),%xmm13 # 2c560 <_sk_overlay_sse2_8bit+0x143f>
+ DB 68,15,88,45,193,202,0,0 ; addps 0xcac1(%rip),%xmm13 # 2cb40 <_sk_overlay_sse2_8bit+0x1433>
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,40,21,171,202,0,0 ; movaps 0xcaab(%rip),%xmm10 # 2c570 <_sk_overlay_sse2_8bit+0x144f>
+ DB 68,15,40,21,192,202,0,0 ; movaps 0xcac0(%rip),%xmm10 # 2cb50 <_sk_overlay_sse2_8bit+0x1443>
DB 69,15,92,213 ; subps %xmm13,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,205 ; andnps %xmm13,%xmm9
DB 69,15,86,202 ; orps %xmm10,%xmm9
DB 68,15,194,192,1 ; cmpltps %xmm0,%xmm8
- DB 68,15,40,21,126,196,0,0 ; movaps 0xc47e(%rip),%xmm10 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,21,147,196,0,0 ; movaps 0xc493(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,84,208 ; andps %xmm8,%xmm10
DB 69,15,85,193 ; andnps %xmm9,%xmm8
DB 69,15,86,194 ; orps %xmm10,%xmm8
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,194,200,1 ; cmpltps %xmm0,%xmm9
- DB 68,15,40,21,109,196,0,0 ; movaps 0xc46d(%rip),%xmm10 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,21,130,196,0,0 ; movaps 0xc482(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,208 ; subps %xmm8,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,200 ; andnps %xmm8,%xmm9
@@ -30259,7 +30603,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,20,202,0,0 ; mulps 0xca14(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f>
+ DB 68,15,89,13,41,202,0,0 ; mulps 0xca29(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -30267,7 +30611,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,255,201,0,0 ; mulps 0xc9ff(%rip),%xmm10 # 2c590 <_sk_overlay_sse2_8bit+0x146f>
+ DB 68,15,89,21,20,202,0,0 ; mulps 0xca14(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -30276,8 +30620,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,183,200,0,0 ; xorps 0xc8b7(%rip),%xmm9 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
- DB 68,15,89,5,159,195,0,0 ; mulps 0xc39f(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,87,13,204,200,0,0 ; xorps 0xc8cc(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 68,15,89,5,180,195,0,0 ; mulps 0xc3b4(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -30296,7 +30640,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,118,201,0,0 ; mulps 0xc976(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f>
+ DB 68,15,89,13,139,201,0,0 ; mulps 0xc98b(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -30304,7 +30648,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,97,201,0,0 ; mulps 0xc961(%rip),%xmm10 # 2c590 <_sk_overlay_sse2_8bit+0x146f>
+ DB 68,15,89,21,118,201,0,0 ; mulps 0xc976(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -30313,8 +30657,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,25,200,0,0 ; xorps 0xc819(%rip),%xmm9 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
- DB 68,15,89,5,1,195,0,0 ; mulps 0xc301(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,87,13,46,200,0,0 ; xorps 0xc82e(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 68,15,89,5,22,195,0,0 ; mulps 0xc316(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -30330,7 +30674,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,69,15,89,200 ; mulss %xmm8,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,233,200,0,0 ; mulps 0xc8e9(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0x145f>
+ DB 68,15,89,13,254,200,0,0 ; mulps 0xc8fe(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
@@ -30338,7 +30682,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,69,15,89,192 ; mulss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 15,87,5,181,199,0,0 ; xorps 0xc7b5(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x134f>
+ DB 15,87,5,202,199,0,0 ; xorps 0xc7ca(%rip),%xmm0 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
DB 65,15,94,193 ; divps %xmm9,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30375,7 +30719,7 @@ _sk_apply_vector_mask_sse2 LABEL PROC
PUBLIC _sk_save_xy_sse2
_sk_save_xy_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,59,194,0,0 ; movaps 0xc23b(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,5,80,194,0,0 ; movaps 0xc250(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -30383,7 +30727,7 @@ _sk_save_xy_sse2 LABEL PROC
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,40,217 ; movaps %xmm9,%xmm11
DB 69,15,194,218,1 ; cmpltps %xmm10,%xmm11
- DB 68,15,40,37,38,194,0,0 ; movaps 0xc226(%rip),%xmm12 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 68,15,40,37,59,194,0,0 ; movaps 0xc23b(%rip),%xmm12 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,220 ; andps %xmm12,%xmm11
DB 69,15,92,211 ; subps %xmm11,%xmm10
DB 69,15,92,202 ; subps %xmm10,%xmm9
@@ -30426,8 +30770,8 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,191,199,0,0 ; addps 0xc7bf(%rip),%xmm0 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,135,193,0,0 ; movaps 0xc187(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,5,212,199,0,0 ; addps 0xc7d4(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,156,193,0,0 ; movaps 0xc19c(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30438,7 +30782,7 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,86,193,0,0 ; addps 0xc156(%rip),%xmm0 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,88,5,107,193,0,0 ; addps 0xc16b(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30448,8 +30792,8 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,120,199,0,0 ; addps 0xc778(%rip),%xmm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,64,193,0,0 ; movaps 0xc140(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,13,141,199,0,0 ; addps 0xc78d(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,85,193,0,0 ; movaps 0xc155(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30460,7 +30804,7 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,14,193,0,0 ; addps 0xc10e(%rip),%xmm1 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 15,88,13,35,193,0,0 ; addps 0xc123(%rip),%xmm1 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30470,13 +30814,13 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,65,199,0,0 ; addps 0xc741(%rip),%xmm0 # 2c5b0 <_sk_overlay_sse2_8bit+0x148f>
- DB 68,15,40,13,249,192,0,0 ; movaps 0xc0f9(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,5,86,199,0,0 ; addps 0xc756(%rip),%xmm0 # 2cb90 <_sk_overlay_sse2_8bit+0x1483>
+ DB 68,15,40,13,14,193,0,0 ; movaps 0xc10e(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,53,199,0,0 ; mulps 0xc735(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,13,205,194,0,0 ; addps 0xc2cd(%rip),%xmm9 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,13,74,199,0,0 ; mulps 0xc74a(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,13,226,194,0,0 ; addps 0xc2e2(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30487,16 +30831,16 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,236,198,0,0 ; addps 0xc6ec(%rip),%xmm0 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,180,192,0,0 ; movaps 0xc0b4(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,5,1,199,0,0 ; addps 0xc701(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,201,192,0,0 ; movaps 0xc0c9(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,8,199,0,0 ; movaps 0xc708(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,5,29,199,0,0 ; movaps 0xc71d(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,12,199,0,0 ; addps 0xc70c(%rip),%xmm8 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,5,33,199,0,0 ; addps 0xc721(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,128,192,0,0 ; addps 0xc080(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,88,5,149,192,0,0 ; addps 0xc095(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,4,199,0,0 ; addps 0xc704(%rip),%xmm8 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,5,25,199,0,0 ; addps 0xc719(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30504,17 +30848,17 @@ _sk_bicubic_n1x_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse2
_sk_bicubic_p1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,94,192,0,0 ; movaps 0xc05e(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,5,115,192,0,0 ; movaps 0xc073(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,186,198,0,0 ; movaps 0xc6ba(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,21,207,198,0,0 ; movaps 0xc6cf(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,190,198,0,0 ; addps 0xc6be(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,21,211,198,0,0 ; addps 0xc6d3(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,186,198,0,0 ; addps 0xc6ba(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,21,207,198,0,0 ; addps 0xc6cf(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30524,11 +30868,11 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,141,198,0,0 ; addps 0xc68d(%rip),%xmm0 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 15,88,5,162,198,0,0 ; addps 0xc6a2(%rip),%xmm0 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,93,198,0,0 ; mulps 0xc65d(%rip),%xmm8 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,5,245,193,0,0 ; addps 0xc1f5(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,5,114,198,0,0 ; mulps 0xc672(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,5,10,194,0,0 ; addps 0xc20a(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30539,13 +30883,13 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,35,198,0,0 ; addps 0xc623(%rip),%xmm1 # 2c5b0 <_sk_overlay_sse2_8bit+0x148f>
- DB 68,15,40,13,219,191,0,0 ; movaps 0xbfdb(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,13,56,198,0,0 ; addps 0xc638(%rip),%xmm1 # 2cb90 <_sk_overlay_sse2_8bit+0x1483>
+ DB 68,15,40,13,240,191,0,0 ; movaps 0xbff0(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,23,198,0,0 ; mulps 0xc617(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,13,175,193,0,0 ; addps 0xc1af(%rip),%xmm9 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,13,44,198,0,0 ; mulps 0xc62c(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,13,196,193,0,0 ; addps 0xc1c4(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30556,16 +30900,16 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,205,197,0,0 ; addps 0xc5cd(%rip),%xmm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x147f>
- DB 68,15,40,13,149,191,0,0 ; movaps 0xbf95(%rip),%xmm9 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,88,13,226,197,0,0 ; addps 0xc5e2(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,170,191,0,0 ; movaps 0xbfaa(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,233,197,0,0 ; movaps 0xc5e9(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,5,254,197,0,0 ; movaps 0xc5fe(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,237,197,0,0 ; addps 0xc5ed(%rip),%xmm8 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,5,2,198,0,0 ; addps 0xc602(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,97,191,0,0 ; addps 0xbf61(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,88,5,118,191,0,0 ; addps 0xbf76(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,229,197,0,0 ; addps 0xc5e5(%rip),%xmm8 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,5,250,197,0,0 ; addps 0xc5fa(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30573,17 +30917,17 @@ _sk_bicubic_n1y_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse2
_sk_bicubic_p1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,63,191,0,0 ; movaps 0xbf3f(%rip),%xmm8 # 2bf60 <_sk_overlay_sse2_8bit+0xe3f>
+ DB 68,15,40,5,84,191,0,0 ; movaps 0xbf54(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,154,197,0,0 ; movaps 0xc59a(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x14af>
+ DB 68,15,40,21,175,197,0,0 ; movaps 0xc5af(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,158,197,0,0 ; addps 0xc59e(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 68,15,88,21,179,197,0,0 ; addps 0xc5b3(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,154,197,0,0 ; addps 0xc59a(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x14cf>
+ DB 68,15,88,21,175,197,0,0 ; addps 0xc5af(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30593,11 +30937,11 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,108,197,0,0 ; addps 0xc56c(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0x14bf>
+ DB 15,88,13,129,197,0,0 ; addps 0xc581(%rip),%xmm1 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,60,197,0,0 ; mulps 0xc53c(%rip),%xmm8 # 2c5c0 <_sk_overlay_sse2_8bit+0x149f>
- DB 68,15,88,5,212,192,0,0 ; addps 0xc0d4(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x103f>
+ DB 68,15,89,5,81,197,0,0 ; mulps 0xc551(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,5,233,192,0,0 ; addps 0xc0e9(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30732,7 +31076,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,65,15,111,198 ; movdqa %xmm14,%xmm0
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,45,136,195,0,0 ; movdqa 0xc388(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,45,157,195,0,0 ; movdqa 0xc39d(%rip),%xmm5 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
DB 102,15,244,197 ; pmuludq %xmm5,%xmm0
DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
@@ -30755,7 +31099,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,241 ; unpcklps %xmm1,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,140,188,0,0 ; paddd 0xbc8c(%rip),%xmm1 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,254,13,161,188,0,0 ; paddd 0xbca1(%rip),%xmm1 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,233,78 ; pshufd $0x4e,%xmm1,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
DB 102,73,15,126,202 ; movq %xmm1,%r10
@@ -30772,7 +31116,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,253 ; unpcklps %xmm5,%xmm7
DB 15,20,249 ; unpcklps %xmm1,%xmm7
- DB 102,15,254,5,98,188,0,0 ; paddd 0xbc62(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,5,119,188,0,0 ; paddd 0xbc77(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,73,15,126,201 ; movq %xmm1,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -30789,7 +31133,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,20,200 ; unpcklps %xmm0,%xmm1
- DB 15,40,45,121,194,0,0 ; movaps 0xc279(%rip),%xmm5 # 2c600 <_sk_overlay_sse2_8bit+0x14df>
+ DB 15,40,45,142,194,0,0 ; movaps 0xc28e(%rip),%xmm5 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3>
DB 15,88,229 ; addps %xmm5,%xmm4
DB 15,41,100,36,64 ; movaps %xmm4,0x40(%rsp)
DB 68,15,88,213 ; addps %xmm5,%xmm10
@@ -30804,7 +31148,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,127,68,36,32 ; movdqa %xmm0,0x20(%rsp)
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
- DB 102,15,111,5,66,194,0,0 ; movdqa 0xc242(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,5,87,194,0,0 ; movdqa 0xc257(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
DB 102,15,112,211,232 ; pshufd $0xe8,%xmm3,%xmm2
DB 102,15,244,224 ; pmuludq %xmm0,%xmm4
@@ -30826,7 +31170,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,227 ; unpcklps %xmm3,%xmm4
DB 15,20,229 ; unpcklps %xmm5,%xmm4
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
- DB 102,15,254,29,75,187,0,0 ; paddd 0xbb4b(%rip),%xmm3 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,254,29,96,187,0,0 ; paddd 0xbb60(%rip),%xmm3 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,235,78 ; pshufd $0x4e,%xmm3,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
DB 102,73,15,126,218 ; movq %xmm3,%r10
@@ -30843,7 +31187,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,4,139 ; movss (%rbx,%r9,4),%xmm0
DB 15,20,216 ; unpcklps %xmm0,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
- DB 102,15,254,21,33,187,0,0 ; paddd 0xbb21(%rip),%xmm2 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,21,54,187,0,0 ; paddd 0xbb36(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
DB 102,73,15,126,193 ; movq %xmm0,%r9
DB 102,73,15,126,210 ; movq %xmm2,%r10
@@ -30905,7 +31249,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 68,15,20,193 ; unpcklps %xmm1,%xmm8
DB 68,15,20,199 ; unpcklps %xmm7,%xmm8
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,68,15,111,21,236,185,0,0 ; movdqa 0xb9ec(%rip),%xmm10 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,21,1,186,0,0 ; movdqa 0xba01(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,112,249,78 ; pshufd $0x4e,%xmm1,%xmm7
DB 102,73,15,126,249 ; movq %xmm7,%r9
@@ -30923,7 +31267,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,111,45,189,185,0,0 ; movdqa 0xb9bd(%rip),%xmm5 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,111,45,210,185,0,0 ; movdqa 0xb9d2(%rip),%xmm5 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,197 ; paddd %xmm5,%xmm0
DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
@@ -30981,7 +31325,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 68,15,20,223 ; unpcklps %xmm7,%xmm11
DB 68,15,20,221 ; unpcklps %xmm5,%xmm11
- DB 102,15,111,45,184,184,0,0 ; movdqa 0xb8b8(%rip),%xmm5 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,111,45,205,184,0,0 ; movdqa 0xb8cd(%rip),%xmm5 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,245 ; paddd %xmm5,%xmm6
DB 102,15,111,253 ; movdqa %xmm5,%xmm7
DB 102,15,112,238,78 ; pshufd $0x4e,%xmm6,%xmm5
@@ -31028,7 +31372,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,254,201 ; paddd %xmm9,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,5,91,190,0,0 ; movdqa 0xbe5b(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,5,112,190,0,0 ; movdqa 0xbe70(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
DB 102,15,112,217,232 ; pshufd $0xe8,%xmm1,%xmm3
DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
@@ -31050,7 +31394,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,202 ; unpcklps %xmm2,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,111,5,101,183,0,0 ; movdqa 0xb765(%rip),%xmm0 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,5,122,183,0,0 ; movdqa 0xb77a(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
@@ -31126,7 +31470,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,4,139 ; movss (%rbx,%r9,4),%xmm0
DB 15,20,240 ; unpcklps %xmm0,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
- DB 102,15,254,29,54,182,0,0 ; paddd 0xb636(%rip),%xmm3 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,29,75,182,0,0 ; paddd 0xb64b(%rip),%xmm3 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,195,78 ; pshufd $0x4e,%xmm3,%xmm0
DB 102,73,15,126,193 ; movq %xmm0,%r9
DB 102,73,15,126,218 ; movq %xmm3,%r10
@@ -31177,7 +31521,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 68,15,20,201 ; unpcklps %xmm1,%xmm9
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,51,181,0,0 ; paddd 0xb533(%rip),%xmm1 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,254,13,72,181,0,0 ; paddd 0xb548(%rip),%xmm1 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,209 ; movq %xmm2,%r9
DB 102,73,15,126,202 ; movq %xmm1,%r10
@@ -31194,7 +31538,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,20,139 ; movss (%rbx,%r9,4),%xmm2
DB 68,15,20,242 ; unpcklps %xmm2,%xmm14
DB 68,15,20,241 ; unpcklps %xmm1,%xmm14
- DB 102,15,254,5,6,181,0,0 ; paddd 0xb506(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,5,27,181,0,0 ; paddd 0xb51b(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,73,15,126,201 ; movq %xmm1,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -31232,7 +31576,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
- DB 102,15,111,37,57,180,0,0 ; movdqa 0xb439(%rip),%xmm4 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,37,78,180,0,0 ; movdqa 0xb44e(%rip),%xmm4 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,226 ; paddd %xmm2,%xmm4
DB 102,15,112,204,78 ; pshufd $0x4e,%xmm4,%xmm1
DB 102,73,15,126,201 ; movq %xmm1,%r9
@@ -31250,7 +31594,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,254,21,11,180,0,0 ; paddd 0xb40b(%rip),%xmm2 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,21,32,180,0,0 ; paddd 0xb420(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
DB 102,73,15,126,210 ; movq %xmm2,%r10
@@ -31401,7 +31745,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,209 ; paddd %xmm1,%xmm2
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
DB 102,15,254,218 ; paddd %xmm2,%xmm3
- DB 102,68,15,111,21,215,183,0,0 ; movdqa 0xb7d7(%rip),%xmm10 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,68,15,111,21,236,183,0,0 ; movdqa 0xb7ec(%rip),%xmm10 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,112,235,245 ; pshufd $0xf5,%xmm3,%xmm5
DB 102,65,15,244,218 ; pmuludq %xmm10,%xmm3
DB 102,15,112,227,232 ; pshufd $0xe8,%xmm3,%xmm4
@@ -31424,7 +31768,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,222 ; unpcklps %xmm6,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 102,15,111,236 ; movdqa %xmm4,%xmm5
- DB 102,15,254,45,217,176,0,0 ; paddd 0xb0d9(%rip),%xmm5 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,254,45,238,176,0,0 ; paddd 0xb0ee(%rip),%xmm5 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,245,78 ; pshufd $0x4e,%xmm5,%xmm6
DB 102,73,15,126,241 ; movq %xmm6,%r9
DB 102,73,15,126,234 ; movq %xmm5,%r10
@@ -31441,7 +31785,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 15,20,247 ; unpcklps %xmm7,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
- DB 102,15,254,37,175,176,0,0 ; paddd 0xb0af(%rip),%xmm4 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,37,196,176,0,0 ; paddd 0xb0c4(%rip),%xmm4 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
DB 102,73,15,126,226 ; movq %xmm4,%r10
@@ -31458,7 +31802,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 15,20,239 ; unpcklps %xmm7,%xmm5
DB 15,20,236 ; unpcklps %xmm4,%xmm5
- DB 15,40,61,198,182,0,0 ; movaps 0xb6c6(%rip),%xmm7 # 2c600 <_sk_overlay_sse2_8bit+0x14df>
+ DB 15,40,61,219,182,0,0 ; movaps 0xb6db(%rip),%xmm7 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3>
DB 68,15,88,199 ; addps %xmm7,%xmm8
DB 68,15,41,68,36,48 ; movaps %xmm8,0x30(%rsp)
DB 68,15,88,207 ; addps %xmm7,%xmm9
@@ -31496,7 +31840,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,234 ; unpcklps %xmm2,%xmm13
DB 68,15,20,239 ; unpcklps %xmm7,%xmm13
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
- DB 102,15,254,21,134,175,0,0 ; paddd 0xaf86(%rip),%xmm2 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,254,21,155,175,0,0 ; paddd 0xaf9b(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7
DB 102,73,15,126,249 ; movq %xmm7,%r9
DB 102,73,15,126,210 ; movq %xmm2,%r10
@@ -31513,7 +31857,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,70,15,16,12,139 ; movss (%rbx,%r9,4),%xmm9
DB 65,15,20,209 ; unpcklps %xmm9,%xmm2
DB 15,20,215 ; unpcklps %xmm7,%xmm2
- DB 102,15,254,5,91,175,0,0 ; paddd 0xaf5b(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,5,112,175,0,0 ; paddd 0xaf70(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,248,78 ; pshufd $0x4e,%xmm0,%xmm7
DB 102,73,15,126,249 ; movq %xmm7,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -31554,7 +31898,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,217 ; movdqa %xmm1,%xmm3
DB 102,15,254,92,36,32 ; paddd 0x20(%rsp),%xmm3
DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
- DB 102,68,15,111,53,25,181,0,0 ; movdqa 0xb519(%rip),%xmm14 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,68,15,111,53,46,181,0,0 ; movdqa 0xb52e(%rip),%xmm14 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,65,15,244,222 ; pmuludq %xmm14,%xmm3
DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
DB 102,65,15,244,230 ; pmuludq %xmm14,%xmm4
@@ -31575,7 +31919,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,228 ; unpcklps %xmm4,%xmm12
DB 68,15,20,229 ; unpcklps %xmm5,%xmm12
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
- DB 102,15,111,61,34,174,0,0 ; movdqa 0xae22(%rip),%xmm7 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,61,55,174,0,0 ; movdqa 0xae37(%rip),%xmm7 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,231 ; paddd %xmm7,%xmm4
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
@@ -31593,7 +31937,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,245 ; unpcklps %xmm5,%xmm6
DB 15,20,244 ; unpcklps %xmm4,%xmm6
- DB 102,68,15,111,5,243,173,0,0 ; movdqa 0xadf3(%rip),%xmm8 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,5,8,174,0,0 ; movdqa 0xae08(%rip),%xmm8 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,216 ; paddd %xmm8,%xmm3
DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
@@ -31707,7 +32051,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,68,15,111,108,36,32 ; movdqa 0x20(%rsp),%xmm13
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,29,86,178,0,0 ; movdqa 0xb256(%rip),%xmm3 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,29,107,178,0,0 ; movdqa 0xb26b(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
@@ -31729,7 +32073,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 68,15,20,205 ; unpcklps %xmm5,%xmm9
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,111,29,93,171,0,0 ; movdqa 0xab5d(%rip),%xmm3 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,29,114,171,0,0 ; movdqa 0xab72(%rip),%xmm3 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,234,78 ; pshufd $0x4e,%xmm2,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
@@ -31837,7 +32181,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,65,15,111,211 ; movdqa %xmm11,%xmm2
DB 102,65,15,254,213 ; paddd %xmm13,%xmm2
DB 102,15,112,218,245 ; pshufd $0xf5,%xmm2,%xmm3
- DB 102,15,111,5,27,176,0,0 ; movdqa 0xb01b(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,5,48,176,0,0 ; movdqa 0xb030(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
DB 102,15,112,250,232 ; pshufd $0xe8,%xmm2,%xmm7
DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
@@ -31858,7 +32202,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 68,15,20,203 ; unpcklps %xmm3,%xmm9
DB 102,15,111,215 ; movdqa %xmm7,%xmm2
- DB 102,15,111,5,38,169,0,0 ; movdqa 0xa926(%rip),%xmm0 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,5,59,169,0,0 ; movdqa 0xa93b(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
DB 102,73,15,126,217 ; movq %xmm3,%r9
@@ -31876,7 +32220,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,28,139 ; movss (%rbx,%r9,4),%xmm3
DB 15,20,243 ; unpcklps %xmm3,%xmm6
DB 15,20,242 ; unpcklps %xmm2,%xmm6
- DB 102,68,15,111,45,247,168,0,0 ; movdqa 0xa8f7(%rip),%xmm13 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,45,12,169,0,0 ; movdqa 0xa90c(%rip),%xmm13 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,253 ; paddd %xmm13,%xmm7
DB 102,15,112,215,78 ; pshufd $0x4e,%xmm7,%xmm2
DB 102,73,15,126,209 ; movq %xmm2,%r9
@@ -31896,7 +32240,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,250 ; unpcklps %xmm2,%xmm7
DB 102,68,15,254,220 ; paddd %xmm4,%xmm11
DB 102,65,15,112,219,245 ; pshufd $0xf5,%xmm11,%xmm3
- DB 102,15,111,37,13,175,0,0 ; movdqa 0xaf0d(%rip),%xmm4 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,37,34,175,0,0 ; movdqa 0xaf22(%rip),%xmm4 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,68,15,244,220 ; pmuludq %xmm4,%xmm11
DB 102,65,15,112,211,232 ; pshufd $0xe8,%xmm11,%xmm2
DB 102,15,244,220 ; pmuludq %xmm4,%xmm3
@@ -31997,7 +32341,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,65,15,111,202 ; movdqa %xmm10,%xmm1
DB 102,15,254,200 ; paddd %xmm0,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,29,67,173,0,0 ; movdqa 0xad43(%rip),%xmm3 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,29,88,173,0,0 ; movdqa 0xad58(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
@@ -32019,7 +32363,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,212 ; unpcklps %xmm4,%xmm2
DB 15,20,211 ; unpcklps %xmm3,%xmm2
DB 102,15,111,217 ; movdqa %xmm1,%xmm3
- DB 102,15,111,61,76,166,0,0 ; movdqa 0xa64c(%rip),%xmm7 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,61,97,166,0,0 ; movdqa 0xa661(%rip),%xmm7 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,223 ; paddd %xmm7,%xmm3
DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
@@ -32037,7 +32381,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 15,20,220 ; unpcklps %xmm4,%xmm3
- DB 102,68,15,111,13,29,166,0,0 ; movdqa 0xa61d(%rip),%xmm9 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,68,15,111,13,50,166,0,0 ; movdqa 0xa632(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,201 ; paddd %xmm9,%xmm1
DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
@@ -32149,7 +32493,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,246 ; unpcklps %xmm6,%xmm14
DB 68,15,20,243 ; unpcklps %xmm3,%xmm14
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
- DB 102,68,15,111,21,13,164,0,0 ; movdqa 0xa40d(%rip),%xmm10 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,21,34,164,0,0 ; movdqa 0xa422(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,218 ; paddd %xmm10,%xmm3
DB 102,15,112,243,78 ; pshufd $0x4e,%xmm3,%xmm6
DB 102,73,15,126,241 ; movq %xmm6,%r9
@@ -32270,7 +32614,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,116,36,32 ; movdqa 0x20(%rsp),%xmm6
DB 102,15,254,198 ; paddd %xmm6,%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,29,132,168,0,0 ; movdqa 0xa884(%rip),%xmm3 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,29,153,168,0,0 ; movdqa 0xa899(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,195 ; pmuludq %xmm3,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
@@ -32292,7 +32636,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,195 ; unpcklps %xmm3,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
- DB 102,68,15,111,5,140,161,0,0 ; movdqa 0xa18c(%rip),%xmm8 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,68,15,111,5,161,161,0,0 ; movdqa 0xa1a1(%rip),%xmm8 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,200 ; paddd %xmm8,%xmm1
DB 102,15,112,217,78 ; pshufd $0x4e,%xmm1,%xmm3
DB 102,73,15,126,217 ; movq %xmm3,%r9
@@ -32398,7 +32742,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,60,36 ; paddd (%rsp),%xmm7
DB 102,15,254,247 ; paddd %xmm7,%xmm6
DB 102,15,112,206,245 ; pshufd $0xf5,%xmm6,%xmm1
- DB 102,15,111,21,79,166,0,0 ; movdqa 0xa64f(%rip),%xmm2 # 2c610 <_sk_overlay_sse2_8bit+0x14ef>
+ DB 102,15,111,21,100,166,0,0 ; movdqa 0xa664(%rip),%xmm2 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,242 ; pmuludq %xmm2,%xmm6
DB 102,15,112,198,232 ; pshufd $0xe8,%xmm6,%xmm0
DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
@@ -32420,7 +32764,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,201 ; unpcklps %xmm1,%xmm9
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,86,159,0,0 ; paddd 0x9f56(%rip),%xmm1 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,254,13,107,159,0,0 ; paddd 0x9f6b(%rip),%xmm1 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,209 ; movq %xmm2,%r9
DB 102,73,15,126,202 ; movq %xmm1,%r10
@@ -32476,7 +32820,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
- DB 102,15,111,53,88,158,0,0 ; movdqa 0x9e58(%rip),%xmm6 # 2bf80 <_sk_overlay_sse2_8bit+0xe5f>
+ DB 102,15,111,53,109,158,0,0 ; movdqa 0x9e6d(%rip),%xmm6 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,242 ; paddd %xmm2,%xmm6
DB 102,15,112,206,78 ; pshufd $0x4e,%xmm6,%xmm1
DB 102,73,15,126,201 ; movq %xmm1,%r9
@@ -32494,7 +32838,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,70,15,16,60,139 ; movss (%rbx,%r9,4),%xmm15
DB 65,15,20,207 ; unpcklps %xmm15,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,254,21,41,158,0,0 ; paddd 0x9e29(%rip),%xmm2 # 2bfa0 <_sk_overlay_sse2_8bit+0xe7f>
+ DB 102,15,254,21,62,158,0,0 ; paddd 0x9e3e(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7
DB 102,73,15,126,249 ; movq %xmm7,%r9
DB 102,73,15,126,210 ; movq %xmm2,%r10
@@ -32556,7 +32900,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 65,15,88,213 ; addps %xmm13,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,5,157,0,0 ; movaps 0x9d05(%rip),%xmm3 # 2bf70 <_sk_overlay_sse2_8bit+0xe4f>
+ DB 15,40,29,26,157,0,0 ; movaps 0x9d1a(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,164,36,240,0,0,0 ; movaps 0xf0(%rsp),%xmm4
DB 15,40,172,36,0,1,0,0 ; movaps 0x100(%rsp),%xmm5
DB 15,40,180,36,16,1,0,0 ; movaps 0x110(%rsp),%xmm6
@@ -32564,9 +32908,6 @@ _sk_clut_4D_sse2 LABEL PROC
DB 72,129,196,48,1,0,0 ; add $0x130,%rsp
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
- DB 144 ; nop
- DB 144 ; nop
- DB 144 ; nop
PUBLIC _sk_start_pipeline_hsw_8bit
_sk_start_pipeline_hsw_8bit LABEL PROC
@@ -32599,7 +32940,7 @@ _sk_start_pipeline_hsw_8bit LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,240,254,255,255 ; mov %r9,-0x110(%rbp)
DB 77,57,207 ; cmp %r9,%r15
- DB 15,131,138,0,0,0 ; jae 223a5 <_sk_start_pipeline_hsw_8bit+0x10d>
+ DB 15,131,138,0,0,0 ; jae 2296d <_sk_start_pipeline_hsw_8bit+0x10d>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,16 ; lea 0x10(%rax),%rax
DB 72,137,133,248,254,255,255 ; mov %rax,-0x108(%rbp)
@@ -32609,7 +32950,7 @@ _sk_start_pipeline_hsw_8bit LABEL PROC
DB 76,137,189,8,255,255,255 ; mov %r15,-0xf8(%rbp)
DB 72,199,133,16,255,255,255,0,0,0,0 ; movq $0x0,-0xf0(%rbp)
DB 72,57,157,248,254,255,255 ; cmp %rbx,-0x108(%rbp)
- DB 119,36 ; ja 22381 <_sk_start_pipeline_hsw_8bit+0xe9>
+ DB 119,36 ; ja 22949 <_sk_start_pipeline_hsw_8bit+0xe9>
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
@@ -32618,17 +32959,17 @@ _sk_start_pipeline_hsw_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 72,131,193,32 ; add $0x20,%rcx
DB 72,57,217 ; cmp %rbx,%rcx
- DB 118,220 ; jbe 2235d <_sk_start_pipeline_hsw_8bit+0xc5>
+ DB 118,220 ; jbe 22925 <_sk_start_pipeline_hsw_8bit+0xc5>
DB 72,137,217 ; mov %rbx,%rcx
DB 72,41,193 ; sub %rax,%rcx
- DB 116,16 ; je 22399 <_sk_start_pipeline_hsw_8bit+0x101>
+ DB 116,16 ; je 22961 <_sk_start_pipeline_hsw_8bit+0x101>
DB 72,137,141,16,255,255,255 ; mov %rcx,-0xf0(%rbp)
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
DB 73,255,199 ; inc %r15
DB 76,59,189,240,254,255,255 ; cmp -0x110(%rbp),%r15
- DB 117,143 ; jne 22334 <_sk_start_pipeline_hsw_8bit+0x9c>
+ DB 117,143 ; jne 228fc <_sk_start_pipeline_hsw_8bit+0x9c>
DB 197,248,40,181,32,255,255,255 ; vmovaps -0xe0(%rbp),%xmm6
DB 197,248,40,189,48,255,255,255 ; vmovaps -0xd0(%rbp),%xmm7
DB 197,120,40,133,64,255,255,255 ; vmovaps -0xc0(%rbp),%xmm8
@@ -32666,7 +33007,7 @@ _sk_uniform_color_hsw_8bit LABEL PROC
PUBLIC _sk_set_rgb_hsw_8bit
_sk_set_rgb_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 197,250,16,37,161,145,0,0 ; vmovss 0x91a1(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 197,250,16,37,197,145,0,0 ; vmovss 0x91c5(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 197,218,89,40 ; vmulss (%rax),%xmm4,%xmm5
DB 196,225,250,44,205 ; vcvttss2si %xmm5,%rcx
DB 197,218,89,104,4 ; vmulss 0x4(%rax),%xmm4,%xmm5
@@ -32679,7 +33020,7 @@ _sk_set_rgb_hsw_8bit LABEL PROC
DB 9,208 ; or %edx,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,88,228 ; vpbroadcastd %xmm4,%ymm4
- DB 197,253,111,45,237,150,0,0 ; vmovdqa 0x96ed(%rip),%ymm5 # 2bb40 <_sk_overlay_sse2_8bit+0xa1f>
+ DB 197,253,111,45,5,151,0,0 ; vmovdqa 0x9705(%rip),%ymm5 # 2c120 <_sk_overlay_sse2_8bit+0xa13>
DB 197,245,219,205 ; vpand %ymm5,%ymm1,%ymm1
DB 197,253,219,197 ; vpand %ymm5,%ymm0,%ymm0
DB 197,221,235,192 ; vpor %ymm0,%ymm4,%ymm0
@@ -32689,10 +33030,10 @@ _sk_set_rgb_hsw_8bit LABEL PROC
PUBLIC _sk_premul_hsw_8bit
_sk_premul_hsw_8bit LABEL PROC
- DB 197,253,111,37,241,150,0,0 ; vmovdqa 0x96f1(%rip),%ymm4 # 2bb60 <_sk_overlay_sse2_8bit+0xa3f>
+ DB 197,253,111,37,9,151,0,0 ; vmovdqa 0x9709(%rip),%ymm4 # 2c140 <_sk_overlay_sse2_8bit+0xa33>
DB 196,226,125,0,236 ; vpshufb %ymm4,%ymm0,%ymm5
DB 196,226,117,0,228 ; vpshufb %ymm4,%ymm1,%ymm4
- DB 197,253,111,53,255,150,0,0 ; vmovdqa 0x96ff(%rip),%ymm6 # 2bb80 <_sk_overlay_sse2_8bit+0xa5f>
+ DB 197,253,111,53,23,151,0,0 ; vmovdqa 0x9717(%rip),%ymm6 # 2c160 <_sk_overlay_sse2_8bit+0xa53>
DB 197,221,235,230 ; vpor %ymm6,%ymm4,%ymm4
DB 197,213,235,238 ; vpor %ymm6,%ymm5,%ymm5
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -32730,7 +33071,7 @@ _sk_premul_hsw_8bit LABEL PROC
PUBLIC _sk_swap_rb_hsw_8bit
_sk_swap_rb_hsw_8bit LABEL PROC
- DB 197,253,111,37,119,150,0,0 ; vmovdqa 0x9677(%rip),%ymm4 # 2bba0 <_sk_overlay_sse2_8bit+0xa7f>
+ DB 197,253,111,37,143,150,0,0 ; vmovdqa 0x968f(%rip),%ymm4 # 2c180 <_sk_overlay_sse2_8bit+0xa73>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -32755,7 +33096,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 22579 <_sk_load_8888_hsw_8bit+0x32>
+ DB 117,17 ; jne 22b41 <_sk_load_8888_hsw_8bit+0x32>
DB 196,161,126,111,76,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm1
DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -32765,14 +33106,14 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 197,253,239,192 ; vpxor %ymm0,%ymm0,%ymm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,231 ; ja 22575 <_sk_load_8888_hsw_8bit+0x2e>
+ DB 119,231 ; ja 22b3d <_sk_load_8888_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,23,1,0,0 ; lea 0x117(%rip),%rcx # 226b0 <_sk_load_8888_hsw_8bit+0x169>
+ DB 72,141,13,23,1,0,0 ; lea 0x117(%rip),%rcx # 22c78 <_sk_load_8888_hsw_8bit+0x169>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,110,4,130 ; vmovd (%rdx,%r8,4),%xmm0
- DB 235,203 ; jmp 22575 <_sk_load_8888_hsw_8bit+0x2e>
+ DB 235,203 ; jmp 22b3d <_sk_load_8888_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -32780,7 +33121,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,125,2,196,3 ; vpblendd $0x3,%ymm4,%ymm0,%ymm0
- DB 235,162 ; jmp 22575 <_sk_load_8888_hsw_8bit+0x2e>
+ DB 235,162 ; jmp 22b3d <_sk_load_8888_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -32793,7 +33134,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,227,125,56,196,1 ; vinserti128 $0x1,%xmm4,%ymm0,%ymm0
DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4
DB 196,227,93,2,192,240 ; vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- DB 233,83,255,255,255 ; jmpq 22575 <_sk_load_8888_hsw_8bit+0x2e>
+ DB 233,83,255,255,255 ; jmpq 22b3d <_sk_load_8888_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -32802,7 +33143,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,227,117,2,200,15 ; vpblendd $0xf,%ymm0,%ymm1,%ymm1
DB 196,161,121,110,68,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm0
DB 196,227,117,2,200,1 ; vpblendd $0x1,%ymm0,%ymm1,%ymm1
- DB 233,23,255,255,255 ; jmpq 2256f <_sk_load_8888_hsw_8bit+0x28>
+ DB 233,23,255,255,255 ; jmpq 22b37 <_sk_load_8888_hsw_8bit+0x28>
DB 196,161,121,110,68,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -32816,7 +33157,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0
DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4
DB 196,227,93,2,201,240 ; vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- DB 233,199,254,255,255 ; jmpq 22575 <_sk_load_8888_hsw_8bit+0x2e>
+ DB 233,199,254,255,255 ; jmpq 22b3d <_sk_load_8888_hsw_8bit+0x2e>
DB 102,144 ; xchg %ax,%ax
DB 242,254 ; repnz (bad)
DB 255 ; (bad)
@@ -32867,7 +33208,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 2271e <_sk_load_8888_dst_hsw_8bit+0x32>
+ DB 117,17 ; jne 22ce6 <_sk_load_8888_dst_hsw_8bit+0x32>
DB 196,161,126,111,92,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm3
DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -32877,14 +33218,14 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 197,237,239,210 ; vpxor %ymm2,%ymm2,%ymm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,231 ; ja 2271a <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 119,231 ; ja 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,22,1,0,0 ; lea 0x116(%rip),%rcx # 22854 <_sk_load_8888_dst_hsw_8bit+0x168>
+ DB 72,141,13,22,1,0,0 ; lea 0x116(%rip),%rcx # 22e1c <_sk_load_8888_dst_hsw_8bit+0x168>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,110,20,130 ; vmovd (%rdx,%r8,4),%xmm2
- DB 235,203 ; jmp 2271a <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 235,203 ; jmp 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -32892,7 +33233,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,109,2,212,3 ; vpblendd $0x3,%ymm4,%ymm2,%ymm2
- DB 235,162 ; jmp 2271a <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 235,162 ; jmp 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -32905,7 +33246,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,227,109,56,212,1 ; vinserti128 $0x1,%xmm4,%ymm2,%ymm2
DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4
DB 196,227,93,2,210,240 ; vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- DB 233,83,255,255,255 ; jmpq 2271a <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 233,83,255,255,255 ; jmpq 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -32914,7 +33255,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,227,101,2,218,15 ; vpblendd $0xf,%ymm2,%ymm3,%ymm3
DB 196,161,121,110,84,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm2
DB 196,227,101,2,218,1 ; vpblendd $0x1,%ymm2,%ymm3,%ymm3
- DB 233,23,255,255,255 ; jmpq 22714 <_sk_load_8888_dst_hsw_8bit+0x28>
+ DB 233,23,255,255,255 ; jmpq 22cdc <_sk_load_8888_dst_hsw_8bit+0x28>
DB 196,161,121,110,84,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -32928,7 +33269,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2
DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4
DB 196,227,93,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- DB 233,199,254,255,255 ; jmpq 2271a <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 233,199,254,255,255 ; jmpq 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 144 ; nop
DB 243,254 ; repz (bad)
DB 255 ; (bad)
@@ -32979,7 +33320,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 228c2 <_sk_store_8888_hsw_8bit+0x32>
+ DB 117,17 ; jne 22e8a <_sk_store_8888_hsw_8bit+0x32>
DB 196,161,126,127,4,130 ; vmovdqu %ymm0,(%rdx,%r8,4)
DB 196,161,126,127,76,130,32 ; vmovdqu %ymm1,0x20(%rdx,%r8,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -32987,17 +33328,17 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,239 ; ja 228be <_sk_store_8888_hsw_8bit+0x2e>
+ DB 119,239 ; ja 22e86 <_sk_store_8888_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,178,0,0,0 ; lea 0xb2(%rip),%rcx # 2298c <_sk_store_8888_hsw_8bit+0xfc>
+ DB 72,141,13,178,0,0,0 ; lea 0xb2(%rip),%rcx # 22f54 <_sk_store_8888_hsw_8bit+0xfc>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,126,4,130 ; vmovd %xmm0,(%rdx,%r8,4)
- DB 235,211 ; jmp 228be <_sk_store_8888_hsw_8bit+0x2e>
+ DB 235,211 ; jmp 22e86 <_sk_store_8888_hsw_8bit+0x2e>
DB 196,163,121,22,68,130,8,2 ; vpextrd $0x2,%xmm0,0x8(%rdx,%r8,4)
DB 196,161,121,214,4,130 ; vmovq %xmm0,(%rdx,%r8,4)
- DB 235,195 ; jmp 228be <_sk_store_8888_hsw_8bit+0x2e>
+ DB 235,195 ; jmp 22e86 <_sk_store_8888_hsw_8bit+0x2e>
DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4
DB 196,163,121,22,100,130,24,2 ; vpextrd $0x2,%xmm4,0x18(%rdx,%r8,4)
DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4
@@ -33005,12 +33346,12 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4
DB 196,161,121,126,100,130,16 ; vmovd %xmm4,0x10(%rdx,%r8,4)
DB 196,161,122,127,4,130 ; vmovdqu %xmm0,(%rdx,%r8,4)
- DB 235,146 ; jmp 228be <_sk_store_8888_hsw_8bit+0x2e>
+ DB 235,146 ; jmp 22e86 <_sk_store_8888_hsw_8bit+0x2e>
DB 196,163,121,22,76,130,40,2 ; vpextrd $0x2,%xmm1,0x28(%rdx,%r8,4)
DB 196,163,121,22,76,130,36,1 ; vpextrd $0x1,%xmm1,0x24(%rdx,%r8,4)
DB 196,161,121,126,76,130,32 ; vmovd %xmm1,0x20(%rdx,%r8,4)
DB 196,161,126,127,4,130 ; vmovdqu %ymm0,(%rdx,%r8,4)
- DB 233,112,255,255,255 ; jmpq 228be <_sk_store_8888_hsw_8bit+0x2e>
+ DB 233,112,255,255,255 ; jmpq 22e86 <_sk_store_8888_hsw_8bit+0x2e>
DB 196,227,125,57,204,1 ; vextracti128 $0x1,%ymm1,%xmm4
DB 196,163,121,22,100,130,56,2 ; vpextrd $0x2,%xmm4,0x38(%rdx,%r8,4)
DB 196,227,125,57,204,1 ; vextracti128 $0x1,%ymm1,%xmm4
@@ -33019,7 +33360,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 196,161,121,126,100,130,48 ; vmovd %xmm4,0x30(%rdx,%r8,4)
DB 196,161,126,127,4,130 ; vmovdqu %ymm0,(%rdx,%r8,4)
DB 196,161,122,127,76,130,32 ; vmovdqu %xmm1,0x20(%rdx,%r8,4)
- DB 233,53,255,255,255 ; jmpq 228be <_sk_store_8888_hsw_8bit+0x2e>
+ DB 233,53,255,255,255 ; jmpq 22e86 <_sk_store_8888_hsw_8bit+0x2e>
DB 15,31,0 ; nopl (%rax)
DB 87 ; push %rdi
DB 255 ; (bad)
@@ -33032,7 +33373,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 125,255 ; jge 229a1 <_sk_store_8888_hsw_8bit+0x111>
+ DB 125,255 ; jge 22f69 <_sk_store_8888_hsw_8bit+0x111>
DB 255 ; (bad)
DB 255,111,255 ; ljmp *-0x1(%rdi)
DB 255 ; (bad)
@@ -33043,7 +33384,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 235,255 ; jmp 229b9 <_sk_store_8888_hsw_8bit+0x129>
+ DB 235,255 ; jmp 22f81 <_sk_store_8888_hsw_8bit+0x129>
DB 255 ; (bad)
DB 255 ; (bad)
DB 222,255 ; fdivrp %st,%st(7)
@@ -33067,10 +33408,10 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 22a0c <_sk_load_bgra_hsw_8bit+0x44>
+ DB 117,35 ; jne 22fd4 <_sk_load_bgra_hsw_8bit+0x44>
DB 196,161,126,111,76,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm1
DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0
- DB 197,253,111,37,194,145,0,0 ; vmovdqa 0x91c2(%rip),%ymm4 # 2bbc0 <_sk_overlay_sse2_8bit+0xa9f>
+ DB 197,253,111,37,218,145,0,0 ; vmovdqa 0x91da(%rip),%ymm4 # 2c1a0 <_sk_overlay_sse2_8bit+0xa93>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33080,14 +33421,14 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 197,253,239,192 ; vpxor %ymm0,%ymm0,%ymm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,213 ; ja 229f6 <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 119,213 ; ja 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 22b44 <_sk_load_bgra_hsw_8bit+0x17c>
+ DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 2310c <_sk_load_bgra_hsw_8bit+0x17c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,110,4,130 ; vmovd (%rdx,%r8,4),%xmm0
- DB 235,185 ; jmp 229f6 <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 235,185 ; jmp 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33095,7 +33436,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,125,2,196,3 ; vpblendd $0x3,%ymm4,%ymm0,%ymm0
- DB 235,144 ; jmp 229f6 <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 235,144 ; jmp 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33108,7 +33449,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,227,125,56,196,1 ; vinserti128 $0x1,%xmm4,%ymm0,%ymm0
DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4
DB 196,227,93,2,192,240 ; vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- DB 233,65,255,255,255 ; jmpq 229f6 <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 233,65,255,255,255 ; jmpq 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33117,7 +33458,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,227,117,2,200,15 ; vpblendd $0xf,%ymm0,%ymm1,%ymm1
DB 196,161,121,110,68,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm0
DB 196,227,117,2,200,1 ; vpblendd $0x1,%ymm0,%ymm1,%ymm1
- DB 233,5,255,255,255 ; jmpq 229f0 <_sk_load_bgra_hsw_8bit+0x28>
+ DB 233,5,255,255,255 ; jmpq 22fb8 <_sk_load_bgra_hsw_8bit+0x28>
DB 196,161,121,110,68,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33131,7 +33472,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0
DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4
DB 196,227,93,2,201,240 ; vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- DB 233,181,254,255,255 ; jmpq 229f6 <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 233,181,254,255,255 ; jmpq 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
DB 15,31,0 ; nopl (%rax)
DB 241 ; icebp
DB 254 ; (bad)
@@ -33180,10 +33521,10 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 22bc4 <_sk_load_bgra_dst_hsw_8bit+0x44>
+ DB 117,35 ; jne 2318c <_sk_load_bgra_dst_hsw_8bit+0x44>
DB 196,161,126,111,92,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm3
DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2
- DB 197,253,111,37,42,144,0,0 ; vmovdqa 0x902a(%rip),%ymm4 # 2bbe0 <_sk_overlay_sse2_8bit+0xabf>
+ DB 197,253,111,37,66,144,0,0 ; vmovdqa 0x9042(%rip),%ymm4 # 2c1c0 <_sk_overlay_sse2_8bit+0xab3>
DB 196,226,109,0,212 ; vpshufb %ymm4,%ymm2,%ymm2
DB 196,226,101,0,220 ; vpshufb %ymm4,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33193,14 +33534,14 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 197,237,239,210 ; vpxor %ymm2,%ymm2,%ymm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,213 ; ja 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 119,213 ; ja 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 22cfc <_sk_load_bgra_dst_hsw_8bit+0x17c>
+ DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 232c4 <_sk_load_bgra_dst_hsw_8bit+0x17c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,110,20,130 ; vmovd (%rdx,%r8,4),%xmm2
- DB 235,185 ; jmp 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 235,185 ; jmp 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33208,7 +33549,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,109,2,212,3 ; vpblendd $0x3,%ymm4,%ymm2,%ymm2
- DB 235,144 ; jmp 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 235,144 ; jmp 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33221,7 +33562,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,227,109,56,212,1 ; vinserti128 $0x1,%xmm4,%ymm2,%ymm2
DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4
DB 196,227,93,2,210,240 ; vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- DB 233,65,255,255,255 ; jmpq 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 233,65,255,255,255 ; jmpq 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33230,7 +33571,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,227,101,2,218,15 ; vpblendd $0xf,%ymm2,%ymm3,%ymm3
DB 196,161,121,110,84,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm2
DB 196,227,101,2,218,1 ; vpblendd $0x1,%ymm2,%ymm3,%ymm3
- DB 233,5,255,255,255 ; jmpq 22ba8 <_sk_load_bgra_dst_hsw_8bit+0x28>
+ DB 233,5,255,255,255 ; jmpq 23170 <_sk_load_bgra_dst_hsw_8bit+0x28>
DB 196,161,121,110,84,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33244,7 +33585,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2
DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4
DB 196,227,93,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- DB 233,181,254,255,255 ; jmpq 22bae <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 233,181,254,255,255 ; jmpq 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 15,31,0 ; nopl (%rax)
DB 241 ; icebp
DB 254 ; (bad)
@@ -33292,11 +33633,11 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
- DB 197,253,111,37,164,142,0,0 ; vmovdqa 0x8ea4(%rip),%ymm4 # 2bc00 <_sk_overlay_sse2_8bit+0xadf>
+ DB 197,253,111,37,188,142,0,0 ; vmovdqa 0x8ebc(%rip),%ymm4 # 2c1e0 <_sk_overlay_sse2_8bit+0xad3>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 22d7c <_sk_store_bgra_hsw_8bit+0x44>
+ DB 117,17 ; jne 23344 <_sk_store_bgra_hsw_8bit+0x44>
DB 196,161,126,127,36,130 ; vmovdqu %ymm4,(%rdx,%r8,4)
DB 196,161,126,127,108,130,32 ; vmovdqu %ymm5,0x20(%rdx,%r8,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33304,17 +33645,17 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,239 ; ja 22d78 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 119,239 ; ja 23340 <_sk_store_bgra_hsw_8bit+0x40>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,176,0,0,0 ; lea 0xb0(%rip),%rcx # 22e44 <_sk_store_bgra_hsw_8bit+0x10c>
+ DB 72,141,13,176,0,0,0 ; lea 0xb0(%rip),%rcx # 2340c <_sk_store_bgra_hsw_8bit+0x10c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,126,36,130 ; vmovd %xmm4,(%rdx,%r8,4)
- DB 235,211 ; jmp 22d78 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 235,211 ; jmp 23340 <_sk_store_bgra_hsw_8bit+0x40>
DB 196,163,121,22,100,130,8,2 ; vpextrd $0x2,%xmm4,0x8(%rdx,%r8,4)
DB 196,161,121,214,36,130 ; vmovq %xmm4,(%rdx,%r8,4)
- DB 235,195 ; jmp 22d78 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 235,195 ; jmp 23340 <_sk_store_bgra_hsw_8bit+0x40>
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,163,121,22,108,130,24,2 ; vpextrd $0x2,%xmm5,0x18(%rdx,%r8,4)
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
@@ -33322,12 +33663,12 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,161,121,126,108,130,16 ; vmovd %xmm5,0x10(%rdx,%r8,4)
DB 196,161,122,127,36,130 ; vmovdqu %xmm4,(%rdx,%r8,4)
- DB 235,146 ; jmp 22d78 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 235,146 ; jmp 23340 <_sk_store_bgra_hsw_8bit+0x40>
DB 196,163,121,22,108,130,40,2 ; vpextrd $0x2,%xmm5,0x28(%rdx,%r8,4)
DB 196,163,121,22,108,130,36,1 ; vpextrd $0x1,%xmm5,0x24(%rdx,%r8,4)
DB 196,161,121,126,108,130,32 ; vmovd %xmm5,0x20(%rdx,%r8,4)
DB 196,161,126,127,36,130 ; vmovdqu %ymm4,(%rdx,%r8,4)
- DB 233,112,255,255,255 ; jmpq 22d78 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 233,112,255,255,255 ; jmpq 23340 <_sk_store_bgra_hsw_8bit+0x40>
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
DB 196,163,121,22,116,130,56,2 ; vpextrd $0x2,%xmm6,0x38(%rdx,%r8,4)
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
@@ -33336,7 +33677,7 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 196,161,121,126,116,130,48 ; vmovd %xmm6,0x30(%rdx,%r8,4)
DB 196,161,126,127,36,130 ; vmovdqu %ymm4,(%rdx,%r8,4)
DB 196,161,122,127,108,130,32 ; vmovdqu %xmm5,0x20(%rdx,%r8,4)
- DB 233,53,255,255,255 ; jmpq 22d78 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 233,53,255,255,255 ; jmpq 23340 <_sk_store_bgra_hsw_8bit+0x40>
DB 144 ; nop
DB 89 ; pop %rcx
DB 255 ; (bad)
@@ -33349,7 +33690,7 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,255 ; jg 22e59 <_sk_store_bgra_hsw_8bit+0x121>
+ DB 127,255 ; jg 23421 <_sk_store_bgra_hsw_8bit+0x121>
DB 255 ; (bad)
DB 255,113,255 ; pushq -0x1(%rcx)
DB 255 ; (bad)
@@ -33385,7 +33726,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 22ec0 <_sk_load_a8_hsw_8bit+0x40>
+ DB 117,35 ; jne 23488 <_sk_load_a8_hsw_8bit+0x40>
DB 196,161,122,111,4,2 ; vmovdqu (%rdx,%r8,1),%xmm0
DB 197,249,112,200,78 ; vpshufd $0x4e,%xmm0,%xmm1
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
@@ -33398,35 +33739,35 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,210 ; ja 22ea3 <_sk_load_a8_hsw_8bit+0x23>
+ DB 119,210 ; ja 2346b <_sk_load_a8_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 22f9c <_sk_load_a8_hsw_8bit+0x11c>
+ DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 23564 <_sk_load_a8_hsw_8bit+0x11c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,179 ; jmp 22ea3 <_sk_load_a8_hsw_8bit+0x23>
+ DB 235,179 ; jmp 2346b <_sk_load_a8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,227,121,14,193,1 ; vpblendw $0x1,%xmm1,%xmm0,%xmm0
- DB 235,150 ; jmp 22ea3 <_sk_load_a8_hsw_8bit+0x23>
+ DB 235,150 ; jmp 2346b <_sk_load_a8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0
DB 196,161,121,110,12,2 ; vmovd (%rdx,%r8,1),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,105,255,255,255 ; jmpq 22ea3 <_sk_load_a8_hsw_8bit+0x23>
+ DB 233,105,255,255,255 ; jmpq 2346b <_sk_load_a8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0
DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,60,255,255,255 ; jmpq 22ea3 <_sk_load_a8_hsw_8bit+0x23>
+ DB 233,60,255,255,255 ; jmpq 2346b <_sk_load_a8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0
@@ -33434,7 +33775,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1
DB 196,163,113,34,76,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1
DB 196,227,113,2,192,8 ; vpblendd $0x8,%xmm0,%xmm1,%xmm0
- DB 233,7,255,255,255 ; jmpq 22ea3 <_sk_load_a8_hsw_8bit+0x23>
+ DB 233,7,255,255,255 ; jmpq 2346b <_sk_load_a8_hsw_8bit+0x23>
DB 73,255 ; rex.WB (bad)
DB 255 ; (bad)
DB 255,96,255 ; jmpq *-0x1(%rax)
@@ -33444,7 +33785,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 125,255 ; jge 22fb1 <_sk_load_a8_hsw_8bit+0x131>
+ DB 125,255 ; jge 23579 <_sk_load_a8_hsw_8bit+0x131>
DB 255 ; (bad)
DB 255,113,255 ; pushq -0x1(%rcx)
DB 255 ; (bad)
@@ -33479,7 +33820,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 23018 <_sk_load_a8_dst_hsw_8bit+0x40>
+ DB 117,35 ; jne 235e0 <_sk_load_a8_dst_hsw_8bit+0x40>
DB 196,161,122,111,20,2 ; vmovdqu (%rdx,%r8,1),%xmm2
DB 197,249,112,218,78 ; vpshufd $0x4e,%xmm2,%xmm3
DB 196,226,125,49,219 ; vpmovzxbd %xmm3,%ymm3
@@ -33492,35 +33833,35 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,210 ; ja 22ffb <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 119,210 ; ja 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 230f4 <_sk_load_a8_dst_hsw_8bit+0x11c>
+ DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 236bc <_sk_load_a8_dst_hsw_8bit+0x11c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
- DB 235,179 ; jmp 22ffb <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 235,179 ; jmp 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,216 ; vmovd %eax,%xmm3
DB 196,227,105,14,211,1 ; vpblendw $0x1,%xmm3,%xmm2,%xmm2
- DB 235,150 ; jmp 22ffb <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 235,150 ; jmp 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2
DB 196,161,121,110,28,2 ; vmovd (%rdx,%r8,1),%xmm3
DB 196,227,105,2,211,1 ; vpblendd $0x1,%xmm3,%xmm2,%xmm2
- DB 233,105,255,255,255 ; jmpq 22ffb <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 233,105,255,255,255 ; jmpq 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2
DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3
DB 196,227,97,2,210,12 ; vpblendd $0xc,%xmm2,%xmm3,%xmm2
- DB 233,60,255,255,255 ; jmpq 22ffb <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 233,60,255,255,255 ; jmpq 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2
@@ -33528,7 +33869,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3
DB 196,163,97,34,92,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3
DB 196,227,97,2,210,8 ; vpblendd $0x8,%xmm2,%xmm3,%xmm2
- DB 233,7,255,255,255 ; jmpq 22ffb <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 233,7,255,255,255 ; jmpq 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 73,255 ; rex.WB (bad)
DB 255 ; (bad)
DB 255,96,255 ; jmpq *-0x1(%rax)
@@ -33538,7 +33879,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 125,255 ; jge 23109 <_sk_load_a8_dst_hsw_8bit+0x131>
+ DB 125,255 ; jge 236d1 <_sk_load_a8_dst_hsw_8bit+0x131>
DB 255 ; (bad)
DB 255,113,255 ; pushq -0x1(%rcx)
DB 255 ; (bad)
@@ -33572,49 +33913,49 @@ _sk_store_a8_hsw_8bit LABEL PROC
DB 72,99,87,8 ; movslq 0x8(%rdi),%rdx
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
- DB 197,253,111,37,208,138,0,0 ; vmovdqa 0x8ad0(%rip),%ymm4 # 2bc20 <_sk_overlay_sse2_8bit+0xaff>
+ DB 197,253,111,37,232,138,0,0 ; vmovdqa 0x8ae8(%rip),%ymm4 # 2c200 <_sk_overlay_sse2_8bit+0xaf3>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,227,253,0,237,232 ; vpermq $0xe8,%ymm5,%ymm5
- DB 197,249,111,53,205,148,0,0 ; vmovdqa 0x94cd(%rip),%xmm6 # 2c630 <_sk_overlay_sse2_8bit+0x150f>
+ DB 197,249,111,53,229,148,0,0 ; vmovdqa 0x94e5(%rip),%xmm6 # 2cc10 <_sk_overlay_sse2_8bit+0x1503>
DB 196,226,81,0,238 ; vpshufb %xmm6,%xmm5,%xmm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 196,227,253,0,228,232 ; vpermq $0xe8,%ymm4,%ymm4
DB 196,226,89,0,230 ; vpshufb %xmm6,%xmm4,%xmm4
DB 197,217,108,229 ; vpunpcklqdq %xmm5,%xmm4,%xmm4
DB 77,133,201 ; test %r9,%r9
- DB 117,10 ; jne 2318b <_sk_store_a8_hsw_8bit+0x5b>
+ DB 117,10 ; jne 23753 <_sk_store_a8_hsw_8bit+0x5b>
DB 196,161,122,127,36,2 ; vmovdqu %xmm4,(%rdx,%r8,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,239 ; ja 23187 <_sk_store_a8_hsw_8bit+0x57>
+ DB 119,239 ; ja 2374f <_sk_store_a8_hsw_8bit+0x57>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,137,0,0,0 ; lea 0x89(%rip),%rcx # 2322c <_sk_store_a8_hsw_8bit+0xfc>
+ DB 72,141,13,137,0,0,0 ; lea 0x89(%rip),%rcx # 237f4 <_sk_store_a8_hsw_8bit+0xfc>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,163,121,20,36,2,0 ; vpextrb $0x0,%xmm4,(%rdx,%r8,1)
- DB 235,210 ; jmp 23187 <_sk_store_a8_hsw_8bit+0x57>
+ DB 235,210 ; jmp 2374f <_sk_store_a8_hsw_8bit+0x57>
DB 196,163,121,20,100,2,2,2 ; vpextrb $0x2,%xmm4,0x2(%rdx,%r8,1)
DB 196,163,121,21,36,2,0 ; vpextrw $0x0,%xmm4,(%rdx,%r8,1)
- DB 235,193 ; jmp 23187 <_sk_store_a8_hsw_8bit+0x57>
+ DB 235,193 ; jmp 2374f <_sk_store_a8_hsw_8bit+0x57>
DB 196,163,121,20,100,2,6,6 ; vpextrb $0x6,%xmm4,0x6(%rdx,%r8,1)
DB 196,163,121,20,100,2,5,5 ; vpextrb $0x5,%xmm4,0x5(%rdx,%r8,1)
DB 196,163,121,20,100,2,4,4 ; vpextrb $0x4,%xmm4,0x4(%rdx,%r8,1)
DB 196,161,121,126,36,2 ; vmovd %xmm4,(%rdx,%r8,1)
- DB 235,161 ; jmp 23187 <_sk_store_a8_hsw_8bit+0x57>
+ DB 235,161 ; jmp 2374f <_sk_store_a8_hsw_8bit+0x57>
DB 196,163,121,20,100,2,10,10 ; vpextrb $0xa,%xmm4,0xa(%rdx,%r8,1)
DB 196,163,121,20,100,2,9,9 ; vpextrb $0x9,%xmm4,0x9(%rdx,%r8,1)
DB 196,163,121,20,100,2,8,8 ; vpextrb $0x8,%xmm4,0x8(%rdx,%r8,1)
- DB 235,32 ; jmp 23220 <_sk_store_a8_hsw_8bit+0xf0>
+ DB 235,32 ; jmp 237e8 <_sk_store_a8_hsw_8bit+0xf0>
DB 196,163,121,20,100,2,14,14 ; vpextrb $0xe,%xmm4,0xe(%rdx,%r8,1)
DB 196,163,121,20,100,2,13,13 ; vpextrb $0xd,%xmm4,0xd(%rdx,%r8,1)
DB 196,163,121,20,100,2,12,12 ; vpextrb $0xc,%xmm4,0xc(%rdx,%r8,1)
DB 196,163,121,22,100,2,8,2 ; vpextrd $0x2,%xmm4,0x8(%rdx,%r8,1)
DB 196,161,121,214,36,2 ; vmovq %xmm4,(%rdx,%r8,1)
- DB 233,92,255,255,255 ; jmpq 23187 <_sk_store_a8_hsw_8bit+0x57>
+ DB 233,92,255,255,255 ; jmpq 2374f <_sk_store_a8_hsw_8bit+0x57>
DB 144 ; nop
DB 128,255,255 ; cmp $0xff,%bh
DB 255,145,255,255,255,137 ; callq *-0x76000001(%rcx)
@@ -33660,15 +34001,15 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,61 ; jne 232c2 <_sk_load_g8_hsw_8bit+0x5a>
+ DB 117,61 ; jne 2388a <_sk_load_g8_hsw_8bit+0x5a>
DB 196,161,122,111,4,2 ; vmovdqu (%rdx,%r8,1),%xmm0
DB 196,226,125,49,200 ; vpmovzxbd %xmm0,%ymm1
DB 197,249,112,192,78 ; vpshufd $0x4e,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
- DB 196,226,125,88,37,125,132,0,0 ; vpbroadcastd 0x847d(%rip),%ymm4 # 2b720 <_sk_overlay_sse2_8bit+0x5ff>
+ DB 196,226,125,88,37,161,132,0,0 ; vpbroadcastd 0x84a1(%rip),%ymm4 # 2bd0c <_sk_overlay_sse2_8bit+0x5ff>
DB 196,226,125,64,236 ; vpmulld %ymm4,%ymm0,%ymm5
DB 196,226,117,64,196 ; vpmulld %ymm4,%ymm1,%ymm0
- DB 196,226,125,88,13,110,132,0,0 ; vpbroadcastd 0x846e(%rip),%ymm1 # 2b724 <_sk_overlay_sse2_8bit+0x603>
+ DB 196,226,125,88,13,146,132,0,0 ; vpbroadcastd 0x8492(%rip),%ymm1 # 2bd10 <_sk_overlay_sse2_8bit+0x603>
DB 197,253,235,193 ; vpor %ymm1,%ymm0,%ymm0
DB 197,213,235,201 ; vpor %ymm1,%ymm5,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33677,35 +34018,35 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,184 ; ja 2328b <_sk_load_g8_hsw_8bit+0x23>
+ DB 119,184 ; ja 23853 <_sk_load_g8_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 233a4 <_sk_load_g8_hsw_8bit+0x13c>
+ DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 2396c <_sk_load_g8_hsw_8bit+0x13c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,153 ; jmp 2328b <_sk_load_g8_hsw_8bit+0x23>
+ DB 235,153 ; jmp 23853 <_sk_load_g8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,227,121,14,193,1 ; vpblendw $0x1,%xmm1,%xmm0,%xmm0
- DB 233,121,255,255,255 ; jmpq 2328b <_sk_load_g8_hsw_8bit+0x23>
+ DB 233,121,255,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0
DB 196,161,121,110,12,2 ; vmovd (%rdx,%r8,1),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,76,255,255,255 ; jmpq 2328b <_sk_load_g8_hsw_8bit+0x23>
+ DB 233,76,255,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0
DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,31,255,255,255 ; jmpq 2328b <_sk_load_g8_hsw_8bit+0x23>
+ DB 233,31,255,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0
@@ -33713,7 +34054,7 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1
DB 196,163,113,34,76,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1
DB 196,227,113,2,192,8 ; vpblendd $0x8,%xmm0,%xmm1,%xmm0
- DB 233,234,254,255,255 ; jmpq 2328b <_sk_load_g8_hsw_8bit+0x23>
+ DB 233,234,254,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23>
DB 15,31,0 ; nopl (%rax)
DB 67,255 ; rex.XB (bad)
DB 255 ; (bad)
@@ -33725,7 +34066,7 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 122,255 ; jp 233b9 <_sk_load_g8_hsw_8bit+0x151>
+ DB 122,255 ; jp 23981 <_sk_load_g8_hsw_8bit+0x151>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -33759,15 +34100,15 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,61 ; jne 2343a <_sk_load_g8_dst_hsw_8bit+0x5a>
+ DB 117,61 ; jne 23a02 <_sk_load_g8_dst_hsw_8bit+0x5a>
DB 196,161,122,111,20,2 ; vmovdqu (%rdx,%r8,1),%xmm2
DB 196,226,125,49,218 ; vpmovzxbd %xmm2,%ymm3
DB 197,249,112,210,78 ; vpshufd $0x4e,%xmm2,%xmm2
DB 196,226,125,49,210 ; vpmovzxbd %xmm2,%ymm2
- DB 196,226,125,88,37,5,131,0,0 ; vpbroadcastd 0x8305(%rip),%ymm4 # 2b720 <_sk_overlay_sse2_8bit+0x5ff>
+ DB 196,226,125,88,37,41,131,0,0 ; vpbroadcastd 0x8329(%rip),%ymm4 # 2bd0c <_sk_overlay_sse2_8bit+0x5ff>
DB 196,226,109,64,236 ; vpmulld %ymm4,%ymm2,%ymm5
DB 196,226,101,64,212 ; vpmulld %ymm4,%ymm3,%ymm2
- DB 196,226,125,88,29,246,130,0,0 ; vpbroadcastd 0x82f6(%rip),%ymm3 # 2b724 <_sk_overlay_sse2_8bit+0x603>
+ DB 196,226,125,88,29,26,131,0,0 ; vpbroadcastd 0x831a(%rip),%ymm3 # 2bd10 <_sk_overlay_sse2_8bit+0x603>
DB 197,237,235,211 ; vpor %ymm3,%ymm2,%ymm2
DB 197,213,235,219 ; vpor %ymm3,%ymm5,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33776,35 +34117,35 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,184 ; ja 23403 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 119,184 ; ja 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 2351c <_sk_load_g8_dst_hsw_8bit+0x13c>
+ DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 23ae4 <_sk_load_g8_dst_hsw_8bit+0x13c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
- DB 235,153 ; jmp 23403 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 235,153 ; jmp 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,216 ; vmovd %eax,%xmm3
DB 196,227,105,14,211,1 ; vpblendw $0x1,%xmm3,%xmm2,%xmm2
- DB 233,121,255,255,255 ; jmpq 23403 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 233,121,255,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2
DB 196,161,121,110,28,2 ; vmovd (%rdx,%r8,1),%xmm3
DB 196,227,105,2,211,1 ; vpblendd $0x1,%xmm3,%xmm2,%xmm2
- DB 233,76,255,255,255 ; jmpq 23403 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 233,76,255,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2
DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3
DB 196,227,97,2,210,12 ; vpblendd $0xc,%xmm2,%xmm3,%xmm2
- DB 233,31,255,255,255 ; jmpq 23403 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 233,31,255,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2
@@ -33812,7 +34153,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3
DB 196,163,97,34,92,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3
DB 196,227,97,2,210,8 ; vpblendd $0x8,%xmm2,%xmm3,%xmm2
- DB 233,234,254,255,255 ; jmpq 23403 <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 233,234,254,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
DB 15,31,0 ; nopl (%rax)
DB 67,255 ; rex.XB (bad)
DB 255 ; (bad)
@@ -33824,7 +34165,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 122,255 ; jp 23531 <_sk_load_g8_dst_hsw_8bit+0x151>
+ DB 122,255 ; jp 23af9 <_sk_load_g8_dst_hsw_8bit+0x151>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -33859,10 +34200,10 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,222,0,0,0 ; jne 2365b <_sk_srcover_rgba_8888_hsw_8bit+0x103>
+ DB 15,133,222,0,0,0 ; jne 23c23 <_sk_srcover_rgba_8888_hsw_8bit+0x103>
DB 196,33,126,111,76,138,32 ; vmovdqu 0x20(%rdx,%r9,4),%ymm9
DB 196,33,126,111,28,138 ; vmovdqu (%rdx,%r9,4),%ymm11
- DB 197,253,111,53,174,134,0,0 ; vmovdqa 0x86ae(%rip),%ymm6 # 2bc40 <_sk_overlay_sse2_8bit+0xb1f>
+ DB 197,253,111,53,198,134,0,0 ; vmovdqa 0x86c6(%rip),%ymm6 # 2c220 <_sk_overlay_sse2_8bit+0xb13>
DB 196,226,117,0,254 ; vpshufb %ymm6,%ymm1,%ymm7
DB 196,226,125,0,246 ; vpshufb %ymm6,%ymm0,%ymm6
DB 196,66,125,48,195 ; vpmovzxbw %xmm11,%ymm8
@@ -33900,7 +34241,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 197,221,252,224 ; vpaddb %ymm0,%ymm4,%ymm4
DB 197,213,252,233 ; vpaddb %ymm1,%ymm5,%ymm5
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne 23692 <_sk_srcover_rgba_8888_hsw_8bit+0x13a>
+ DB 117,72 ; jne 23c5a <_sk_srcover_rgba_8888_hsw_8bit+0x13a>
DB 196,161,126,127,36,138 ; vmovdqu %ymm4,(%rdx,%r9,4)
DB 196,161,126,127,108,138,32 ; vmovdqu %ymm5,0x20(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33911,25 +34252,25 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,65,37,239,219 ; vpxor %ymm11,%ymm11,%ymm11
DB 254,200 ; dec %al
DB 60,14 ; cmp $0xe,%al
- DB 15,135,22,255,255,255 ; ja 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 15,135,22,255,255,255 ; ja 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 15,182,192 ; movzbl %al,%eax
- DB 72,141,13,234,1,0,0 ; lea 0x1ea(%rip),%rcx # 23868 <_sk_srcover_rgba_8888_hsw_8bit+0x310>
+ DB 72,141,13,234,1,0,0 ; lea 0x1ea(%rip),%rcx # 23e30 <_sk_srcover_rgba_8888_hsw_8bit+0x310>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,33,121,110,28,138 ; vmovd (%rdx,%r9,4),%xmm11
- DB 233,248,254,255,255 ; jmpq 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 233,248,254,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 65,128,224,15 ; and $0xf,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,14 ; cmp $0xe,%r8b
- DB 119,184 ; ja 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 119,184 ; ja 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,250,1,0,0 ; lea 0x1fa(%rip),%rcx # 238a4 <_sk_srcover_rgba_8888_hsw_8bit+0x34c>
+ DB 72,141,13,250,1,0,0 ; lea 0x1fa(%rip),%rcx # 23e6c <_sk_srcover_rgba_8888_hsw_8bit+0x34c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,126,36,138 ; vmovd %xmm4,(%rdx,%r9,4)
- DB 235,156 ; jmp 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 235,156 ; jmp 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 196,161,121,110,100,138,8 ; vmovd 0x8(%rdx,%r9,4),%xmm4
DB 196,226,121,89,236 ; vpbroadcastq %xmm4,%xmm5
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
@@ -33937,7 +34278,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,162,121,53,52,138 ; vpmovzxdq (%rdx,%r9,4),%xmm6
DB 197,249,112,246,232 ; vpshufd $0xe8,%xmm6,%xmm6
DB 196,99,37,2,222,3 ; vpblendd $0x3,%ymm6,%ymm11,%ymm11
- DB 233,162,254,255,255 ; jmpq 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 233,162,254,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 196,161,121,110,100,138,24 ; vmovd 0x18(%rdx,%r9,4),%xmm4
DB 196,226,125,89,236 ; vpbroadcastq %xmm4,%ymm5
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
@@ -33950,7 +34291,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,99,37,56,222,1 ; vinserti128 $0x1,%xmm6,%ymm11,%ymm11
DB 196,161,122,111,52,138 ; vmovdqu (%rdx,%r9,4),%xmm6
DB 196,67,77,2,219,240 ; vpblendd $0xf0,%ymm11,%ymm6,%ymm11
- DB 233,82,254,255,255 ; jmpq 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 233,82,254,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 196,161,121,110,100,138,40 ; vmovd 0x28(%rdx,%r9,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -33959,7 +34300,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,99,53,2,205,15 ; vpblendd $0xf,%ymm5,%ymm9,%ymm9
DB 196,161,121,110,108,138,32 ; vmovd 0x20(%rdx,%r9,4),%xmm5
DB 196,99,53,2,205,1 ; vpblendd $0x1,%ymm5,%ymm9,%ymm9
- DB 233,22,254,255,255 ; jmpq 23584 <_sk_srcover_rgba_8888_hsw_8bit+0x2c>
+ DB 233,22,254,255,255 ; jmpq 23b4c <_sk_srcover_rgba_8888_hsw_8bit+0x2c>
DB 196,161,121,110,100,138,56 ; vmovd 0x38(%rdx,%r9,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -33973,10 +34314,10 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,33,126,111,28,138 ; vmovdqu (%rdx,%r9,4),%ymm11
DB 196,161,122,111,116,138,32 ; vmovdqu 0x20(%rdx,%r9,4),%xmm6
DB 196,67,77,2,201,240 ; vpblendd $0xf0,%ymm9,%ymm6,%ymm9
- DB 233,198,253,255,255 ; jmpq 2358a <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 233,198,253,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 196,163,121,22,100,138,8,2 ; vpextrd $0x2,%xmm4,0x8(%rdx,%r9,4)
DB 196,161,121,214,36,138 ; vmovq %xmm4,(%rdx,%r9,4)
- DB 233,128,254,255,255 ; jmpq 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 233,128,254,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,163,121,22,108,138,24,2 ; vpextrd $0x2,%xmm5,0x18(%rdx,%r9,4)
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
@@ -33984,12 +34325,12 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,161,121,126,108,138,16 ; vmovd %xmm5,0x10(%rdx,%r9,4)
DB 196,161,122,127,36,138 ; vmovdqu %xmm4,(%rdx,%r9,4)
- DB 233,76,254,255,255 ; jmpq 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 233,76,254,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 196,163,121,22,108,138,40,2 ; vpextrd $0x2,%xmm5,0x28(%rdx,%r9,4)
DB 196,163,121,22,108,138,36,1 ; vpextrd $0x1,%xmm5,0x24(%rdx,%r9,4)
DB 196,161,121,126,108,138,32 ; vmovd %xmm5,0x20(%rdx,%r9,4)
DB 196,161,126,127,36,138 ; vmovdqu %ymm4,(%rdx,%r9,4)
- DB 233,42,254,255,255 ; jmpq 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 233,42,254,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
DB 196,163,121,22,116,138,56,2 ; vpextrd $0x2,%xmm6,0x38(%rdx,%r9,4)
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
@@ -33998,7 +34339,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,161,121,126,116,138,48 ; vmovd %xmm6,0x30(%rdx,%r9,4)
DB 196,161,126,127,36,138 ; vmovdqu %ymm4,(%rdx,%r9,4)
DB 196,161,122,127,108,138,32 ; vmovdqu %xmm5,0x20(%rdx,%r9,4)
- DB 233,239,253,255,255 ; jmpq 23657 <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 233,239,253,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 31 ; (bad)
DB 254 ; (bad)
DB 255 ; (bad)
@@ -34048,7 +34389,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 126,255 ; jle 238c1 <_sk_srcover_rgba_8888_hsw_8bit+0x369>
+ DB 126,255 ; jle 23e89 <_sk_srcover_rgba_8888_hsw_8bit+0x369>
DB 255 ; (bad)
DB 255,119,255 ; pushq -0x1(%rdi)
DB 255 ; (bad)
@@ -34068,7 +34409,7 @@ PUBLIC _sk_scale_1_float_hsw_8bit
_sk_scale_1_float_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,250,16,32 ; vmovss (%rax),%xmm4
- DB 197,218,89,37,206,124,0,0 ; vmulss 0x7cce(%rip),%xmm4,%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 197,218,89,37,242,124,0,0 ; vmulss 0x7cf2(%rip),%xmm4,%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 197,250,44,196 ; vcvttss2si %xmm4,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,120,228 ; vpbroadcastb %xmm4,%ymm4
@@ -34078,7 +34419,7 @@ _sk_scale_1_float_hsw_8bit LABEL PROC
DB 196,226,125,48,241 ; vpmovzxbw %xmm1,%ymm6
DB 196,227,125,57,201,1 ; vextracti128 $0x1,%ymm1,%xmm1
DB 196,226,125,48,201 ; vpmovzxbw %xmm1,%ymm1
- DB 197,221,219,37,61,131,0,0 ; vpand 0x833d(%rip),%ymm4,%ymm4 # 2bc60 <_sk_overlay_sse2_8bit+0xb3f>
+ DB 197,221,219,37,85,131,0,0 ; vpand 0x8355(%rip),%ymm4,%ymm4 # 2c240 <_sk_overlay_sse2_8bit+0xb33>
DB 197,221,213,249 ; vpmullw %ymm1,%ymm4,%ymm7
DB 197,93,213,198 ; vpmullw %ymm6,%ymm4,%ymm8
DB 197,93,213,200 ; vpmullw %ymm0,%ymm4,%ymm9
@@ -34110,12 +34451,12 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,191,0,0,0 ; jne 23a5b <_sk_scale_u8_hsw_8bit+0xe0>
+ DB 15,133,191,0,0,0 ; jne 24023 <_sk_scale_u8_hsw_8bit+0xe0>
DB 196,161,122,111,36,2 ; vmovdqu (%rdx,%r8,1),%xmm4
DB 196,226,125,49,236 ; vpmovzxbd %xmm4,%ymm5
DB 197,249,112,228,78 ; vpshufd $0x4e,%xmm4,%xmm4
DB 196,226,125,49,228 ; vpmovzxbd %xmm4,%ymm4
- DB 197,253,111,53,199,130,0,0 ; vmovdqa 0x82c7(%rip),%ymm6 # 2bc80 <_sk_overlay_sse2_8bit+0xb5f>
+ DB 197,253,111,53,223,130,0,0 ; vmovdqa 0x82df(%rip),%ymm6 # 2c260 <_sk_overlay_sse2_8bit+0xb53>
DB 196,226,93,0,230 ; vpshufb %ymm6,%ymm4,%ymm4
DB 196,226,85,0,238 ; vpshufb %ymm6,%ymm5,%ymm5
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -34154,35 +34495,35 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 15,135,50,255,255,255 ; ja 239a2 <_sk_scale_u8_hsw_8bit+0x27>
+ DB 15,135,50,255,255,255 ; ja 23f6a <_sk_scale_u8_hsw_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 23b44 <_sk_scale_u8_hsw_8bit+0x1c9>
+ DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 2410c <_sk_scale_u8_hsw_8bit+0x1c9>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,16,255,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,16,255,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,227,89,14,229,1 ; vpblendw $0x1,%xmm5,%xmm4,%xmm4
- DB 233,240,254,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,240,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4
DB 196,161,121,110,44,2 ; vmovd (%rdx,%r8,1),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,195,254,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,195,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4
DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,150,254,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,150,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4
@@ -34190,7 +34531,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5
DB 196,163,81,34,108,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5
DB 196,227,81,2,228,8 ; vpblendd $0x8,%xmm4,%xmm5,%xmm4
- DB 233,97,254,255,255 ; jmpq 239a2 <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,97,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 64,255 ; rex (bad)
DB 255 ; (bad)
@@ -34202,7 +34543,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 122,255 ; jp 23b59 <_sk_scale_u8_hsw_8bit+0x1de>
+ DB 122,255 ; jp 24121 <_sk_scale_u8_hsw_8bit+0x1de>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -34230,7 +34571,7 @@ PUBLIC _sk_lerp_1_float_hsw_8bit
_sk_lerp_1_float_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,250,16,32 ; vmovss (%rax),%xmm4
- DB 197,218,89,37,46,122,0,0 ; vmulss 0x7a2e(%rip),%xmm4,%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 197,218,89,37,82,122,0,0 ; vmulss 0x7a52(%rip),%xmm4,%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 197,250,44,196 ; vcvttss2si %xmm4,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,120,228 ; vpbroadcastb %xmm4,%ymm4
@@ -34240,7 +34581,7 @@ _sk_lerp_1_float_hsw_8bit LABEL PROC
DB 196,226,125,48,241 ; vpmovzxbw %xmm1,%ymm6
DB 196,227,125,57,201,1 ; vextracti128 $0x1,%ymm1,%xmm1
DB 196,226,125,48,201 ; vpmovzxbw %xmm1,%ymm1
- DB 197,221,219,61,221,128,0,0 ; vpand 0x80dd(%rip),%ymm4,%ymm7 # 2bca0 <_sk_overlay_sse2_8bit+0xb7f>
+ DB 197,221,219,61,245,128,0,0 ; vpand 0x80f5(%rip),%ymm4,%ymm7 # 2c280 <_sk_overlay_sse2_8bit+0xb73>
DB 197,69,213,193 ; vpmullw %ymm1,%ymm7,%ymm8
DB 197,69,213,206 ; vpmullw %ymm6,%ymm7,%ymm9
DB 197,69,213,208 ; vpmullw %ymm0,%ymm7,%ymm10
@@ -34303,12 +34644,12 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,106,1,0,0 ; jne 23e3b <_sk_lerp_u8_hsw_8bit+0x18b>
+ DB 15,133,106,1,0,0 ; jne 24403 <_sk_lerp_u8_hsw_8bit+0x18b>
DB 196,161,122,111,36,2 ; vmovdqu (%rdx,%r8,1),%xmm4
DB 196,226,125,49,236 ; vpmovzxbd %xmm4,%ymm5
DB 197,249,112,228,78 ; vpshufd $0x4e,%xmm4,%xmm4
DB 196,226,125,49,228 ; vpmovzxbd %xmm4,%ymm4
- DB 197,253,111,53,210,127,0,0 ; vmovdqa 0x7fd2(%rip),%ymm6 # 2bcc0 <_sk_overlay_sse2_8bit+0xb9f>
+ DB 197,253,111,53,234,127,0,0 ; vmovdqa 0x7fea(%rip),%ymm6 # 2c2a0 <_sk_overlay_sse2_8bit+0xb93>
DB 196,98,93,0,206 ; vpshufb %ymm6,%ymm4,%ymm9
DB 196,98,85,0,222 ; vpshufb %ymm6,%ymm5,%ymm11
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -34382,35 +34723,35 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 15,135,135,254,255,255 ; ja 23cd7 <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 15,135,135,254,255,255 ; ja 2429f <_sk_lerp_u8_hsw_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 23f24 <_sk_lerp_u8_hsw_8bit+0x274>
+ DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 244ec <_sk_lerp_u8_hsw_8bit+0x274>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,101,254,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,101,254,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,227,89,14,229,1 ; vpblendw $0x1,%xmm5,%xmm4,%xmm4
- DB 233,69,254,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,69,254,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4
DB 196,161,121,110,44,2 ; vmovd (%rdx,%r8,1),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,24,254,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,24,254,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4
DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,235,253,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,235,253,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4
@@ -34418,7 +34759,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5
DB 196,163,81,34,108,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5
DB 196,227,81,2,228,8 ; vpblendd $0x8,%xmm4,%xmm5,%xmm4
- DB 233,182,253,255,255 ; jmpq 23cd7 <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,182,253,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 64,255 ; rex (bad)
DB 255 ; (bad)
@@ -34430,7 +34771,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 122,255 ; jp 23f39 <_sk_lerp_u8_hsw_8bit+0x289>
+ DB 122,255 ; jp 24501 <_sk_lerp_u8_hsw_8bit+0x289>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -34471,7 +34812,7 @@ _sk_move_dst_src_hsw_8bit LABEL PROC
PUBLIC _sk_black_color_hsw_8bit
_sk_black_color_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,161,119,0,0 ; vbroadcastss 0x77a1(%rip),%ymm0 # 2b724 <_sk_overlay_sse2_8bit+0x603>
+ DB 196,226,125,24,5,197,119,0,0 ; vbroadcastss 0x77c5(%rip),%ymm0 # 2bd10 <_sk_overlay_sse2_8bit+0x603>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 255,224 ; jmpq *%rax
@@ -34491,7 +34832,7 @@ _sk_clear_hsw_8bit LABEL PROC
PUBLIC _sk_srcatop_hsw_8bit
_sk_srcatop_hsw_8bit LABEL PROC
- DB 197,125,111,5,55,125,0,0 ; vmovdqa 0x7d37(%rip),%ymm8 # 2bce0 <_sk_overlay_sse2_8bit+0xbbf>
+ DB 197,125,111,5,79,125,0,0 ; vmovdqa 0x7d4f(%rip),%ymm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xbb3>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,232 ; vpshufb %ymm8,%ymm2,%ymm5
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -34566,7 +34907,7 @@ _sk_srcatop_hsw_8bit LABEL PROC
PUBLIC _sk_dstatop_hsw_8bit
_sk_dstatop_hsw_8bit LABEL PROC
- DB 197,125,111,5,242,123,0,0 ; vmovdqa 0x7bf2(%rip),%ymm8 # 2bd00 <_sk_overlay_sse2_8bit+0xbdf>
+ DB 197,125,111,5,10,124,0,0 ; vmovdqa 0x7c0a(%rip),%ymm8 # 2c2e0 <_sk_overlay_sse2_8bit+0xbd3>
DB 196,194,117,0,224 ; vpshufb %ymm8,%ymm1,%ymm4
DB 196,194,125,0,232 ; vpshufb %ymm8,%ymm0,%ymm5
DB 196,98,125,48,210 ; vpmovzxbw %xmm2,%ymm10
@@ -34641,7 +34982,7 @@ _sk_dstatop_hsw_8bit LABEL PROC
PUBLIC _sk_srcin_hsw_8bit
_sk_srcin_hsw_8bit LABEL PROC
- DB 197,253,111,37,169,122,0,0 ; vmovdqa 0x7aa9(%rip),%ymm4 # 2bd20 <_sk_overlay_sse2_8bit+0xbff>
+ DB 197,253,111,37,193,122,0,0 ; vmovdqa 0x7ac1(%rip),%ymm4 # 2c300 <_sk_overlay_sse2_8bit+0xbf3>
DB 196,226,101,0,236 ; vpshufb %ymm4,%ymm3,%ymm5
DB 196,226,109,0,228 ; vpshufb %ymm4,%ymm2,%ymm4
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -34679,7 +35020,7 @@ _sk_srcin_hsw_8bit LABEL PROC
PUBLIC _sk_dstin_hsw_8bit
_sk_dstin_hsw_8bit LABEL PROC
- DB 197,253,111,37,31,122,0,0 ; vmovdqa 0x7a1f(%rip),%ymm4 # 2bd40 <_sk_overlay_sse2_8bit+0xc1f>
+ DB 197,253,111,37,55,122,0,0 ; vmovdqa 0x7a37(%rip),%ymm4 # 2c320 <_sk_overlay_sse2_8bit+0xc13>
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,125,48,226 ; vpmovzxbw %xmm2,%ymm4
@@ -34717,7 +35058,7 @@ _sk_dstin_hsw_8bit LABEL PROC
PUBLIC _sk_srcout_hsw_8bit
_sk_srcout_hsw_8bit LABEL PROC
- DB 197,253,111,37,147,121,0,0 ; vmovdqa 0x7993(%rip),%ymm4 # 2bd60 <_sk_overlay_sse2_8bit+0xc3f>
+ DB 197,253,111,37,171,121,0,0 ; vmovdqa 0x79ab(%rip),%ymm4 # 2c340 <_sk_overlay_sse2_8bit+0xc33>
DB 196,226,109,0,236 ; vpshufb %ymm4,%ymm2,%ymm5
DB 196,226,101,0,228 ; vpshufb %ymm4,%ymm3,%ymm4
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
@@ -34758,7 +35099,7 @@ _sk_srcout_hsw_8bit LABEL PROC
PUBLIC _sk_dstout_hsw_8bit
_sk_dstout_hsw_8bit LABEL PROC
- DB 197,253,111,37,253,120,0,0 ; vmovdqa 0x78fd(%rip),%ymm4 # 2bd80 <_sk_overlay_sse2_8bit+0xc5f>
+ DB 197,253,111,37,21,121,0,0 ; vmovdqa 0x7915(%rip),%ymm4 # 2c360 <_sk_overlay_sse2_8bit+0xc53>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 197,221,118,228 ; vpcmpeqd %ymm4,%ymm4,%ymm4
@@ -34799,7 +35140,7 @@ _sk_dstout_hsw_8bit LABEL PROC
PUBLIC _sk_srcover_hsw_8bit
_sk_srcover_hsw_8bit LABEL PROC
- DB 197,253,111,37,101,120,0,0 ; vmovdqa 0x7865(%rip),%ymm4 # 2bda0 <_sk_overlay_sse2_8bit+0xc7f>
+ DB 197,253,111,37,125,120,0,0 ; vmovdqa 0x787d(%rip),%ymm4 # 2c380 <_sk_overlay_sse2_8bit+0xc73>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 196,98,125,48,202 ; vpmovzxbw %xmm2,%ymm9
@@ -34841,7 +35182,7 @@ _sk_srcover_hsw_8bit LABEL PROC
PUBLIC _sk_dstover_hsw_8bit
_sk_dstover_hsw_8bit LABEL PROC
- DB 197,253,111,37,198,119,0,0 ; vmovdqa 0x77c6(%rip),%ymm4 # 2bdc0 <_sk_overlay_sse2_8bit+0xc9f>
+ DB 197,253,111,37,222,119,0,0 ; vmovdqa 0x77de(%rip),%ymm4 # 2c3a0 <_sk_overlay_sse2_8bit+0xc93>
DB 196,226,101,0,236 ; vpshufb %ymm4,%ymm3,%ymm5
DB 196,226,109,0,228 ; vpshufb %ymm4,%ymm2,%ymm4
DB 196,98,125,48,200 ; vpmovzxbw %xmm0,%ymm9
@@ -34921,7 +35262,7 @@ _sk_multiply_hsw_8bit LABEL PROC
DB 72,131,236,56 ; sub $0x38,%rsp
DB 197,253,111,243 ; vmovdqa %ymm3,%ymm6
DB 197,253,111,218 ; vmovdqa %ymm2,%ymm3
- DB 197,125,111,13,131,118,0,0 ; vmovdqa 0x7683(%rip),%ymm9 # 2bde0 <_sk_overlay_sse2_8bit+0xcbf>
+ DB 197,125,111,13,155,118,0,0 ; vmovdqa 0x769b(%rip),%ymm9 # 2c3c0 <_sk_overlay_sse2_8bit+0xcb3>
DB 196,194,101,0,225 ; vpshufb %ymm9,%ymm3,%ymm4
DB 196,194,77,0,233 ; vpshufb %ymm9,%ymm6,%ymm5
DB 196,65,45,118,210 ; vpcmpeqd %ymm10,%ymm10,%ymm10
@@ -35062,7 +35403,7 @@ _sk_screen_hsw_8bit LABEL PROC
PUBLIC _sk_xor__hsw_8bit
_sk_xor__hsw_8bit LABEL PROC
- DB 197,125,111,13,15,116,0,0 ; vmovdqa 0x740f(%rip),%ymm9 # 2be00 <_sk_overlay_sse2_8bit+0xcdf>
+ DB 197,125,111,13,39,116,0,0 ; vmovdqa 0x7427(%rip),%ymm9 # 2c3e0 <_sk_overlay_sse2_8bit+0xcd3>
DB 196,194,109,0,225 ; vpshufb %ymm9,%ymm2,%ymm4
DB 196,194,101,0,249 ; vpshufb %ymm9,%ymm3,%ymm7
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -35137,9 +35478,16 @@ _sk_xor__hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
+PUBLIC _sk_plus__hsw_8bit
+_sk_plus__hsw_8bit LABEL PROC
+ DB 197,253,220,194 ; vpaddusb %ymm2,%ymm0,%ymm0
+ DB 197,245,220,203 ; vpaddusb %ymm3,%ymm1,%ymm1
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 255,224 ; jmpq *%rax
+
PUBLIC _sk_darken_hsw_8bit
_sk_darken_hsw_8bit LABEL PROC
- DB 197,125,111,5,189,114,0,0 ; vmovdqa 0x72bd(%rip),%ymm8 # 2be20 <_sk_overlay_sse2_8bit+0xcff>
+ DB 197,125,111,5,201,114,0,0 ; vmovdqa 0x72c9(%rip),%ymm8 # 2c400 <_sk_overlay_sse2_8bit+0xcf3>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -35212,7 +35560,7 @@ _sk_darken_hsw_8bit LABEL PROC
DB 197,253,248,246 ; vpsubb %ymm6,%ymm0,%ymm6
DB 197,245,248,205 ; vpsubb %ymm5,%ymm1,%ymm1
DB 197,253,248,196 ; vpsubb %ymm4,%ymm0,%ymm0
- DB 196,226,125,88,37,86,106,0,0 ; vpbroadcastd 0x6a56(%rip),%ymm4 # 2b728 <_sk_overlay_sse2_8bit+0x607>
+ DB 196,226,125,88,37,110,106,0,0 ; vpbroadcastd 0x6a6e(%rip),%ymm4 # 2bd14 <_sk_overlay_sse2_8bit+0x607>
DB 196,227,125,76,198,64 ; vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
DB 196,227,117,76,207,64 ; vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -35220,7 +35568,7 @@ _sk_darken_hsw_8bit LABEL PROC
PUBLIC _sk_lighten_hsw_8bit
_sk_lighten_hsw_8bit LABEL PROC
- DB 197,125,111,5,86,113,0,0 ; vmovdqa 0x7156(%rip),%ymm8 # 2be40 <_sk_overlay_sse2_8bit+0xd1f>
+ DB 197,125,111,5,98,113,0,0 ; vmovdqa 0x7162(%rip),%ymm8 # 2c420 <_sk_overlay_sse2_8bit+0xd13>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -35293,7 +35641,7 @@ _sk_lighten_hsw_8bit LABEL PROC
DB 197,253,248,246 ; vpsubb %ymm6,%ymm0,%ymm6
DB 197,245,248,205 ; vpsubb %ymm5,%ymm1,%ymm1
DB 197,253,248,196 ; vpsubb %ymm4,%ymm0,%ymm0
- DB 196,226,125,88,37,207,104,0,0 ; vpbroadcastd 0x68cf(%rip),%ymm4 # 2b728 <_sk_overlay_sse2_8bit+0x607>
+ DB 196,226,125,88,37,231,104,0,0 ; vpbroadcastd 0x68e7(%rip),%ymm4 # 2bd14 <_sk_overlay_sse2_8bit+0x607>
DB 196,227,125,76,198,64 ; vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
DB 196,227,117,76,207,64 ; vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -35331,7 +35679,7 @@ _sk_exclusion_hsw_8bit LABEL PROC
DB 196,227,77,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm6,%ymm7
DB 196,227,77,70,228,49 ; vperm2i128 $0x31,%ymm4,%ymm6,%ymm4
DB 197,197,103,228 ; vpackuswb %ymm4,%ymm7,%ymm4
- DB 197,253,111,53,88,111,0,0 ; vmovdqa 0x6f58(%rip),%ymm6 # 2be60 <_sk_overlay_sse2_8bit+0xd3f>
+ DB 197,253,111,53,100,111,0,0 ; vmovdqa 0x6f64(%rip),%ymm6 # 2c440 <_sk_overlay_sse2_8bit+0xd33>
DB 197,221,219,254 ; vpand %ymm6,%ymm4,%ymm7
DB 197,213,219,246 ; vpand %ymm6,%ymm5,%ymm6
DB 197,237,252,192 ; vpaddb %ymm0,%ymm2,%ymm0
@@ -35345,7 +35693,7 @@ _sk_exclusion_hsw_8bit LABEL PROC
PUBLIC _sk_difference_hsw_8bit
_sk_difference_hsw_8bit LABEL PROC
- DB 197,125,111,5,76,111,0,0 ; vmovdqa 0x6f4c(%rip),%ymm8 # 2be80 <_sk_overlay_sse2_8bit+0xd5f>
+ DB 197,125,111,5,88,111,0,0 ; vmovdqa 0x6f58(%rip),%ymm8 # 2c460 <_sk_overlay_sse2_8bit+0xd53>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -35412,7 +35760,7 @@ _sk_difference_hsw_8bit LABEL PROC
DB 197,197,103,237 ; vpackuswb %ymm5,%ymm7,%ymm5
DB 197,181,218,228 ; vpminub %ymm4,%ymm9,%ymm4
DB 197,165,218,237 ; vpminub %ymm5,%ymm11,%ymm5
- DB 197,253,111,53,22,110,0,0 ; vmovdqa 0x6e16(%rip),%ymm6 # 2bea0 <_sk_overlay_sse2_8bit+0xd7f>
+ DB 197,253,111,53,34,110,0,0 ; vmovdqa 0x6e22(%rip),%ymm6 # 2c480 <_sk_overlay_sse2_8bit+0xd73>
DB 197,213,219,254 ; vpand %ymm6,%ymm5,%ymm7
DB 197,221,219,246 ; vpand %ymm6,%ymm4,%ymm6
DB 197,237,252,192 ; vpaddb %ymm0,%ymm2,%ymm0
@@ -35436,7 +35784,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 196,227,125,57,203,1 ; vextracti128 $0x1,%ymm1,%xmm3
DB 196,98,125,48,195 ; vpmovzxbw %xmm3,%ymm8
DB 197,126,127,132,36,64,1,0,0 ; vmovdqu %ymm8,0x140(%rsp)
- DB 197,253,111,29,204,109,0,0 ; vmovdqa 0x6dcc(%rip),%ymm3 # 2bec0 <_sk_overlay_sse2_8bit+0xd9f>
+ DB 197,253,111,29,216,109,0,0 ; vmovdqa 0x6dd8(%rip),%ymm3 # 2c4a0 <_sk_overlay_sse2_8bit+0xd93>
DB 196,226,125,0,227 ; vpshufb %ymm3,%ymm0,%ymm4
DB 196,226,117,0,203 ; vpshufb %ymm3,%ymm1,%ymm1
DB 197,125,111,251 ; vmovdqa %ymm3,%ymm15
@@ -35465,7 +35813,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 196,65,125,111,231 ; vmovdqa %ymm15,%ymm12
DB 196,194,93,0,220 ; vpshufb %ymm12,%ymm4,%ymm3
DB 196,226,125,48,211 ; vpmovzxbw %xmm3,%ymm2
- DB 196,226,125,121,5,78,109,0,0 ; vpbroadcastw 0x6d4e(%rip),%ymm0 # 2bee0 <_sk_overlay_sse2_8bit+0xdbf>
+ DB 196,226,125,121,5,90,109,0,0 ; vpbroadcastw 0x6d5a(%rip),%ymm0 # 2c4c0 <_sk_overlay_sse2_8bit+0xdb3>
DB 197,109,239,248 ; vpxor %ymm0,%ymm2,%ymm15
DB 197,133,213,207 ; vpmullw %ymm7,%ymm15,%ymm1
DB 197,254,127,140,36,160,1,0,0 ; vmovdqu %ymm1,0x1a0(%rsp)
@@ -35565,7 +35913,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 197,254,111,116,36,96 ; vmovdqu 0x60(%rsp),%ymm6
DB 197,205,253,180,36,128,0,0,0 ; vpaddw 0x80(%rsp),%ymm6,%ymm6
DB 196,193,53,253,252 ; vpaddw %ymm12,%ymm9,%ymm7
- DB 196,98,125,121,5,45,107,0,0 ; vpbroadcastw 0x6b2d(%rip),%ymm8 # 2bee2 <_sk_overlay_sse2_8bit+0xdc1>
+ DB 196,98,125,121,5,57,107,0,0 ; vpbroadcastw 0x6b39(%rip),%ymm8 # 2c4c2 <_sk_overlay_sse2_8bit+0xdb5>
DB 196,193,93,253,224 ; vpaddw %ymm8,%ymm4,%ymm4
DB 197,229,253,220 ; vpaddw %ymm4,%ymm3,%ymm3
DB 196,193,85,253,224 ; vpaddw %ymm8,%ymm5,%ymm4
@@ -35574,7 +35922,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 197,245,253,204 ; vpaddw %ymm4,%ymm1,%ymm1
DB 196,193,69,253,224 ; vpaddw %ymm8,%ymm7,%ymm4
DB 197,253,253,196 ; vpaddw %ymm4,%ymm0,%ymm0
- DB 196,226,125,121,37,2,107,0,0 ; vpbroadcastw 0x6b02(%rip),%ymm4 # 2bee4 <_sk_overlay_sse2_8bit+0xdc3>
+ DB 196,226,125,121,37,14,107,0,0 ; vpbroadcastw 0x6b0e(%rip),%ymm4 # 2c4c4 <_sk_overlay_sse2_8bit+0xdb7>
DB 197,253,228,196 ; vpmulhuw %ymm4,%ymm0,%ymm0
DB 197,245,228,204 ; vpmulhuw %ymm4,%ymm1,%ymm1
DB 197,237,228,212 ; vpmulhuw %ymm4,%ymm2,%ymm2
@@ -35599,7 +35947,7 @@ PUBLIC _sk_overlay_hsw_8bit
_sk_overlay_hsw_8bit LABEL PROC
DB 72,129,236,24,2,0,0 ; sub $0x218,%rsp
DB 197,252,17,140,36,192,1,0,0 ; vmovups %ymm1,0x1c0(%rsp)
- DB 197,253,111,45,169,106,0,0 ; vmovdqa 0x6aa9(%rip),%ymm5 # 2bf00 <_sk_overlay_sse2_8bit+0xddf>
+ DB 197,253,111,45,181,106,0,0 ; vmovdqa 0x6ab5(%rip),%ymm5 # 2c4e0 <_sk_overlay_sse2_8bit+0xdd3>
DB 197,253,111,226 ; vmovdqa %ymm2,%ymm4
DB 196,227,125,57,225,1 ; vextracti128 $0x1,%ymm4,%xmm1
DB 196,98,125,48,193 ; vpmovzxbw %xmm1,%ymm8
@@ -35634,7 +35982,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,93,117,251 ; vpcmpeqw %ymm3,%ymm4,%ymm15
DB 197,253,111,216 ; vmovdqa %ymm0,%ymm3
DB 196,226,125,48,227 ; vpmovzxbw %xmm3,%ymm4
- DB 196,226,125,121,5,3,106,0,0 ; vpbroadcastw 0x6a03(%rip),%ymm0 # 2bf20 <_sk_overlay_sse2_8bit+0xdff>
+ DB 196,226,125,121,5,15,106,0,0 ; vpbroadcastw 0x6a0f(%rip),%ymm0 # 2c500 <_sk_overlay_sse2_8bit+0xdf3>
DB 197,117,239,232 ; vpxor %ymm0,%ymm1,%ymm13
DB 197,21,213,212 ; vpmullw %ymm4,%ymm13,%ymm10
DB 197,126,127,148,36,64,1,0,0 ; vmovdqu %ymm10,0x140(%rsp)
@@ -35735,7 +36083,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,254,111,116,36,64 ; vmovdqu 0x40(%rsp),%ymm6
DB 197,205,253,116,36,96 ; vpaddw 0x60(%rsp),%ymm6,%ymm6
DB 196,193,29,253,253 ; vpaddw %ymm13,%ymm12,%ymm7
- DB 196,98,125,121,5,246,103,0,0 ; vpbroadcastw 0x67f6(%rip),%ymm8 # 2bf22 <_sk_overlay_sse2_8bit+0xe01>
+ DB 196,98,125,121,5,2,104,0,0 ; vpbroadcastw 0x6802(%rip),%ymm8 # 2c502 <_sk_overlay_sse2_8bit+0xdf5>
DB 196,193,109,253,208 ; vpaddw %ymm8,%ymm2,%ymm2
DB 197,229,253,210 ; vpaddw %ymm2,%ymm3,%ymm2
DB 196,193,85,253,216 ; vpaddw %ymm8,%ymm5,%ymm3
@@ -35744,7 +36092,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,245,253,204 ; vpaddw %ymm4,%ymm1,%ymm1
DB 196,193,69,253,224 ; vpaddw %ymm8,%ymm7,%ymm4
DB 197,253,253,196 ; vpaddw %ymm4,%ymm0,%ymm0
- DB 196,226,125,121,37,203,103,0,0 ; vpbroadcastw 0x67cb(%rip),%ymm4 # 2bf24 <_sk_overlay_sse2_8bit+0xe03>
+ DB 196,226,125,121,37,215,103,0,0 ; vpbroadcastw 0x67d7(%rip),%ymm4 # 2c504 <_sk_overlay_sse2_8bit+0xdf7>
DB 197,253,228,196 ; vpmulhuw %ymm4,%ymm0,%ymm0
DB 197,245,228,204 ; vpmulhuw %ymm4,%ymm1,%ymm1
DB 197,229,228,220 ; vpmulhuw %ymm4,%ymm3,%ymm3
@@ -35798,7 +36146,7 @@ _sk_start_pipeline_sse41_8bit LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,240,254,255,255 ; mov %r9,-0x110(%rbp)
DB 77,57,207 ; cmp %r9,%r15
- DB 15,131,138,0,0,0 ; jae 258c7 <_sk_start_pipeline_sse41_8bit+0x10b>
+ DB 15,131,138,0,0,0 ; jae 25e9b <_sk_start_pipeline_sse41_8bit+0x10b>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,8 ; lea 0x8(%rax),%rax
DB 72,137,133,248,254,255,255 ; mov %rax,-0x108(%rbp)
@@ -35808,7 +36156,7 @@ _sk_start_pipeline_sse41_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 76,137,189,8,255,255,255 ; mov %r15,-0xf8(%rbp)
DB 72,199,133,16,255,255,255,0,0,0,0 ; movq $0x0,-0xf0(%rbp)
- DB 119,36 ; ja 258a3 <_sk_start_pipeline_sse41_8bit+0xe7>
+ DB 119,36 ; ja 25e77 <_sk_start_pipeline_sse41_8bit+0xe7>
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
@@ -35817,17 +36165,17 @@ _sk_start_pipeline_sse41_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 72,131,193,16 ; add $0x10,%rcx
DB 72,57,217 ; cmp %rbx,%rcx
- DB 118,220 ; jbe 2587f <_sk_start_pipeline_sse41_8bit+0xc3>
+ DB 118,220 ; jbe 25e53 <_sk_start_pipeline_sse41_8bit+0xc3>
DB 72,137,217 ; mov %rbx,%rcx
DB 72,41,193 ; sub %rax,%rcx
- DB 116,16 ; je 258bb <_sk_start_pipeline_sse41_8bit+0xff>
+ DB 116,16 ; je 25e8f <_sk_start_pipeline_sse41_8bit+0xff>
DB 72,137,141,16,255,255,255 ; mov %rcx,-0xf0(%rbp)
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
DB 73,255,199 ; inc %r15
DB 76,59,189,240,254,255,255 ; cmp -0x110(%rbp),%r15
- DB 117,143 ; jne 25856 <_sk_start_pipeline_sse41_8bit+0x9a>
+ DB 117,143 ; jne 25e2a <_sk_start_pipeline_sse41_8bit+0x9a>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -35865,7 +36213,7 @@ _sk_uniform_color_sse41_8bit LABEL PROC
PUBLIC _sk_set_rgb_sse41_8bit
_sk_set_rgb_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,37,128,92,0,0 ; movss 0x5c80(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,16,37,152,92,0,0 ; movss 0x5c98(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,16,40 ; movss (%rax),%xmm5
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 243,72,15,44,205 ; cvttss2si %xmm5,%rcx
@@ -35880,7 +36228,7 @@ _sk_set_rgb_sse41_8bit LABEL PROC
DB 9,208 ; or %edx,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
- DB 102,15,111,45,196,108,0,0 ; movdqa 0x6cc4(%rip),%xmm5 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,45,208,108,0,0 ; movdqa 0x6cd0(%rip),%xmm5 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,219,205 ; pand %xmm5,%xmm1
DB 102,15,219,197 ; pand %xmm5,%xmm0
DB 102,15,235,196 ; por %xmm4,%xmm0
@@ -35892,12 +36240,12 @@ PUBLIC _sk_premul_sse41_8bit
_sk_premul_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,176,108,0,0 ; movdqa 0x6cb0(%rip),%xmm0 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,5,188,108,0,0 ; movdqa 0x6cbc(%rip),%xmm0 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,111,253 ; movdqa %xmm5,%xmm7
DB 102,15,56,0,248 ; pshufb %xmm0,%xmm7
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,56,0,240 ; pshufb %xmm0,%xmm6
- DB 102,15,111,5,134,108,0,0 ; movdqa 0x6c86(%rip),%xmm0 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,5,146,108,0,0 ; movdqa 0x6c92(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,240 ; por %xmm0,%xmm6
DB 102,15,235,248 ; por %xmm0,%xmm7
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -35928,7 +36276,7 @@ _sk_premul_sse41_8bit LABEL PROC
PUBLIC _sk_swap_rb_sse41_8bit
_sk_swap_rb_sse41_8bit LABEL PROC
- DB 102,15,111,37,35,108,0,0 ; movdqa 0x6c23(%rip),%xmm4 # 2c660 <_sk_overlay_sse2_8bit+0x153f>
+ DB 102,15,111,37,47,108,0,0 ; movdqa 0x6c2f(%rip),%xmm4 # 2cc40 <_sk_overlay_sse2_8bit+0x1533>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -35953,7 +36301,7 @@ _sk_load_8888_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 25a8d <_sk_load_8888_sse41_8bit+0x32>
+ DB 117,17 ; jne 26061 <_sk_load_8888_sse41_8bit+0x32>
DB 243,66,15,111,76,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm1
DB 243,66,15,111,4,130 ; movdqu (%rdx,%r8,4),%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -35963,24 +36311,24 @@ _sk_load_8888_sse41_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,231 ; ja 25a89 <_sk_load_8888_sse41_8bit+0x2e>
+ DB 119,231 ; ja 2605d <_sk_load_8888_sse41_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,75,0,0,0 ; lea 0x4b(%rip),%rcx # 25af8 <_sk_load_8888_sse41_8bit+0x9d>
+ DB 72,141,13,75,0,0,0 ; lea 0x4b(%rip),%rcx # 260cc <_sk_load_8888_sse41_8bit+0x9d>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,110,4,130 ; movd (%rdx,%r8,4),%xmm0
- DB 235,203 ; jmp 25a89 <_sk_load_8888_sse41_8bit+0x2e>
+ DB 235,203 ; jmp 2605d <_sk_load_8888_sse41_8bit+0x2e>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4
DB 102,15,58,14,196,15 ; pblendw $0xf,%xmm4,%xmm0
- DB 235,177 ; jmp 25a89 <_sk_load_8888_sse41_8bit+0x2e>
+ DB 235,177 ; jmp 2605d <_sk_load_8888_sse41_8bit+0x2e>
DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 102,66,15,58,34,76,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1
DB 102,66,15,58,34,76,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1
- DB 235,139 ; jmp 25a83 <_sk_load_8888_sse41_8bit+0x28>
+ DB 235,139 ; jmp 26057 <_sk_load_8888_sse41_8bit+0x28>
DB 190,255,255,255,210 ; mov $0xd2ffffff,%esi
DB 255 ; (bad)
DB 255 ; (bad)
@@ -36010,7 +36358,7 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 25b46 <_sk_load_8888_dst_sse41_8bit+0x32>
+ DB 117,17 ; jne 2611a <_sk_load_8888_dst_sse41_8bit+0x32>
DB 243,66,15,111,92,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm3
DB 243,66,15,111,20,130 ; movdqu (%rdx,%r8,4),%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36020,24 +36368,24 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,231 ; ja 25b42 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ DB 119,231 ; ja 26116 <_sk_load_8888_dst_sse41_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 25bb4 <_sk_load_8888_dst_sse41_8bit+0xa0>
+ DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 26188 <_sk_load_8888_dst_sse41_8bit+0xa0>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,110,20,130 ; movd (%rdx,%r8,4),%xmm2
- DB 235,203 ; jmp 25b42 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ DB 235,203 ; jmp 26116 <_sk_load_8888_dst_sse41_8bit+0x2e>
DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4
DB 102,15,58,14,212,15 ; pblendw $0xf,%xmm4,%xmm2
- DB 235,177 ; jmp 25b42 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ DB 235,177 ; jmp 26116 <_sk_load_8888_dst_sse41_8bit+0x2e>
DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 102,66,15,58,34,92,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3
DB 102,66,15,58,34,92,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3
- DB 235,139 ; jmp 25b3c <_sk_load_8888_dst_sse41_8bit+0x28>
+ DB 235,139 ; jmp 26110 <_sk_load_8888_dst_sse41_8bit+0x28>
DB 15,31,0 ; nopl (%rax)
DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx
DB 255 ; (bad)
@@ -36049,7 +36397,7 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,221 ; jmpq ffffffffde025bcc <_sk_overlay_sse2_8bit+0xffffffffddffaaab>
+ DB 233,255,255,255,221 ; jmpq ffffffffde0261a0 <_sk_overlay_sse2_8bit+0xffffffffddffaa93>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -36065,7 +36413,7 @@ _sk_store_8888_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 25c02 <_sk_store_8888_sse41_8bit+0x32>
+ DB 117,17 ; jne 261d6 <_sk_store_8888_sse41_8bit+0x32>
DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4)
DB 243,66,15,127,76,138,16 ; movdqu %xmm1,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36073,22 +36421,22 @@ _sk_store_8888_sse41_8bit LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,239 ; ja 25bfe <_sk_store_8888_sse41_8bit+0x2e>
+ DB 119,239 ; ja 261d2 <_sk_store_8888_sse41_8bit+0x2e>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,70,0,0,0 ; lea 0x46(%rip),%rcx # 25c60 <_sk_store_8888_sse41_8bit+0x90>
+ DB 72,141,13,70,0,0,0 ; lea 0x46(%rip),%rcx # 26234 <_sk_store_8888_sse41_8bit+0x90>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,126,4,138 ; movd %xmm0,(%rdx,%r9,4)
- DB 235,211 ; jmp 25bfe <_sk_store_8888_sse41_8bit+0x2e>
+ DB 235,211 ; jmp 261d2 <_sk_store_8888_sse41_8bit+0x2e>
DB 102,66,15,58,22,68,138,8,2 ; pextrd $0x2,%xmm0,0x8(%rdx,%r9,4)
DB 102,66,15,214,4,138 ; movq %xmm0,(%rdx,%r9,4)
- DB 235,194 ; jmp 25bfe <_sk_store_8888_sse41_8bit+0x2e>
+ DB 235,194 ; jmp 261d2 <_sk_store_8888_sse41_8bit+0x2e>
DB 102,66,15,58,22,76,138,24,2 ; pextrd $0x2,%xmm1,0x18(%rdx,%r9,4)
DB 102,66,15,58,22,76,138,20,1 ; pextrd $0x1,%xmm1,0x14(%rdx,%r9,4)
DB 102,66,15,126,76,138,16 ; movd %xmm1,0x10(%rdx,%r9,4)
DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4)
- DB 235,161 ; jmp 25bfe <_sk_store_8888_sse41_8bit+0x2e>
+ DB 235,161 ; jmp 261d2 <_sk_store_8888_sse41_8bit+0x2e>
DB 15,31,0 ; nopl (%rax)
DB 195 ; retq
DB 255 ; (bad)
@@ -36125,10 +36473,10 @@ _sk_load_bgra_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 25cc0 <_sk_load_bgra_sse41_8bit+0x44>
+ DB 117,35 ; jne 26294 <_sk_load_bgra_sse41_8bit+0x44>
DB 243,66,15,111,76,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm1
DB 243,66,15,111,4,130 ; movdqu (%rdx,%r8,4),%xmm0
- DB 102,15,111,37,174,105,0,0 ; movdqa 0x69ae(%rip),%xmm4 # 2c660 <_sk_overlay_sse2_8bit+0x153f>
+ DB 102,15,111,37,186,105,0,0 ; movdqa 0x69ba(%rip),%xmm4 # 2cc40 <_sk_overlay_sse2_8bit+0x1533>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36138,24 +36486,24 @@ _sk_load_bgra_sse41_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,213 ; ja 25caa <_sk_load_bgra_sse41_8bit+0x2e>
+ DB 119,213 ; ja 2627e <_sk_load_bgra_sse41_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 25d30 <_sk_load_bgra_sse41_8bit+0xb4>
+ DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 26304 <_sk_load_bgra_sse41_8bit+0xb4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,110,4,130 ; movd (%rdx,%r8,4),%xmm0
- DB 235,185 ; jmp 25caa <_sk_load_bgra_sse41_8bit+0x2e>
+ DB 235,185 ; jmp 2627e <_sk_load_bgra_sse41_8bit+0x2e>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4
DB 102,15,58,14,196,15 ; pblendw $0xf,%xmm4,%xmm0
- DB 235,159 ; jmp 25caa <_sk_load_bgra_sse41_8bit+0x2e>
+ DB 235,159 ; jmp 2627e <_sk_load_bgra_sse41_8bit+0x2e>
DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 102,66,15,58,34,76,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1
DB 102,66,15,58,34,76,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1
- DB 233,118,255,255,255 ; jmpq 25ca4 <_sk_load_bgra_sse41_8bit+0x28>
+ DB 233,118,255,255,255 ; jmpq 26278 <_sk_load_bgra_sse41_8bit+0x28>
DB 102,144 ; xchg %ax,%ax
DB 185,255,255,255,205 ; mov $0xcdffffff,%ecx
DB 255 ; (bad)
@@ -36186,10 +36534,10 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 25d90 <_sk_load_bgra_dst_sse41_8bit+0x44>
+ DB 117,35 ; jne 26364 <_sk_load_bgra_dst_sse41_8bit+0x44>
DB 243,66,15,111,92,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm3
DB 243,66,15,111,20,130 ; movdqu (%rdx,%r8,4),%xmm2
- DB 102,15,111,37,222,104,0,0 ; movdqa 0x68de(%rip),%xmm4 # 2c660 <_sk_overlay_sse2_8bit+0x153f>
+ DB 102,15,111,37,234,104,0,0 ; movdqa 0x68ea(%rip),%xmm4 # 2cc40 <_sk_overlay_sse2_8bit+0x1533>
DB 102,15,56,0,212 ; pshufb %xmm4,%xmm2
DB 102,15,56,0,220 ; pshufb %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36199,24 +36547,24 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,213 ; ja 25d7a <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ DB 119,213 ; ja 2634e <_sk_load_bgra_dst_sse41_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 25e00 <_sk_load_bgra_dst_sse41_8bit+0xb4>
+ DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 263d4 <_sk_load_bgra_dst_sse41_8bit+0xb4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,110,20,130 ; movd (%rdx,%r8,4),%xmm2
- DB 235,185 ; jmp 25d7a <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ DB 235,185 ; jmp 2634e <_sk_load_bgra_dst_sse41_8bit+0x2e>
DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4
DB 102,15,58,14,212,15 ; pblendw $0xf,%xmm4,%xmm2
- DB 235,159 ; jmp 25d7a <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ DB 235,159 ; jmp 2634e <_sk_load_bgra_dst_sse41_8bit+0x2e>
DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 102,66,15,58,34,92,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3
DB 102,66,15,58,34,92,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3
- DB 233,118,255,255,255 ; jmpq 25d74 <_sk_load_bgra_dst_sse41_8bit+0x28>
+ DB 233,118,255,255,255 ; jmpq 26348 <_sk_load_bgra_dst_sse41_8bit+0x28>
DB 102,144 ; xchg %ax,%ax
DB 185,255,255,255,205 ; mov $0xcdffffff,%ecx
DB 255 ; (bad)
@@ -36246,13 +36594,13 @@ _sk_store_bgra_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
- DB 102,15,111,53,32,104,0,0 ; movdqa 0x6820(%rip),%xmm6 # 2c660 <_sk_overlay_sse2_8bit+0x153f>
+ DB 102,15,111,53,44,104,0,0 ; movdqa 0x682c(%rip),%xmm6 # 2cc40 <_sk_overlay_sse2_8bit+0x1533>
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
DB 102,15,56,0,238 ; pshufb %xmm6,%xmm5
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,56,0,230 ; pshufb %xmm6,%xmm4
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 25e68 <_sk_store_bgra_sse41_8bit+0x4c>
+ DB 117,17 ; jne 2643c <_sk_store_bgra_sse41_8bit+0x4c>
DB 243,66,15,127,36,138 ; movdqu %xmm4,(%rdx,%r9,4)
DB 243,66,15,127,108,138,16 ; movdqu %xmm5,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36260,22 +36608,22 @@ _sk_store_bgra_sse41_8bit LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,239 ; ja 25e64 <_sk_store_bgra_sse41_8bit+0x48>
+ DB 119,239 ; ja 26438 <_sk_store_bgra_sse41_8bit+0x48>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,68,0,0,0 ; lea 0x44(%rip),%rcx # 25ec4 <_sk_store_bgra_sse41_8bit+0xa8>
+ DB 72,141,13,68,0,0,0 ; lea 0x44(%rip),%rcx # 26498 <_sk_store_bgra_sse41_8bit+0xa8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,126,36,138 ; movd %xmm4,(%rdx,%r9,4)
- DB 235,211 ; jmp 25e64 <_sk_store_bgra_sse41_8bit+0x48>
+ DB 235,211 ; jmp 26438 <_sk_store_bgra_sse41_8bit+0x48>
DB 102,66,15,58,22,100,138,8,2 ; pextrd $0x2,%xmm4,0x8(%rdx,%r9,4)
DB 102,66,15,214,36,138 ; movq %xmm4,(%rdx,%r9,4)
- DB 235,194 ; jmp 25e64 <_sk_store_bgra_sse41_8bit+0x48>
+ DB 235,194 ; jmp 26438 <_sk_store_bgra_sse41_8bit+0x48>
DB 102,66,15,58,22,108,138,24,2 ; pextrd $0x2,%xmm5,0x18(%rdx,%r9,4)
DB 102,66,15,58,22,108,138,20,1 ; pextrd $0x1,%xmm5,0x14(%rdx,%r9,4)
DB 102,66,15,126,108,138,16 ; movd %xmm5,0x10(%rdx,%r9,4)
DB 243,66,15,127,36,138 ; movdqu %xmm4,(%rdx,%r9,4)
- DB 235,161 ; jmp 25e64 <_sk_store_bgra_sse41_8bit+0x48>
+ DB 235,161 ; jmp 26438 <_sk_store_bgra_sse41_8bit+0x48>
DB 144 ; nop
DB 197,255,255 ; (bad)
DB 255,214 ; callq *%rsi
@@ -36308,9 +36656,9 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,42 ; jne 25f27 <_sk_load_a8_sse41_8bit+0x47>
+ DB 117,42 ; jne 264fb <_sk_load_a8_sse41_8bit+0x47>
DB 102,66,15,56,48,12,2 ; pmovzxbw (%rdx,%r8,1),%xmm1
- DB 102,15,219,13,36,96,0,0 ; pand 0x6024(%rip),%xmm1 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,13,48,96,0,0 ; pand 0x6030(%rip),%xmm1 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
@@ -36322,15 +36670,15 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,204 ; ja 25f04 <_sk_load_a8_sse41_8bit+0x24>
+ DB 119,204 ; ja 264d8 <_sk_load_a8_sse41_8bit+0x24>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 25fb8 <_sk_load_a8_sse41_8bit+0xd8>
+ DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 2658c <_sk_load_a8_sse41_8bit+0xd8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 235,173 ; jmp 25f04 <_sk_load_a8_sse41_8bit+0x24>
+ DB 235,173 ; jmp 264d8 <_sk_load_a8_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,2 ; pinsrw $0x2,%eax,%xmm1
@@ -36338,7 +36686,7 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,3 ; pblendw $0x3,%xmm0,%xmm1
- DB 235,136 ; jmp 25f04 <_sk_load_a8_sse41_8bit+0x24>
+ DB 235,136 ; jmp 264d8 <_sk_load_a8_sse41_8bit+0x24>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,6 ; pinsrw $0x6,%eax,%xmm1
@@ -36349,7 +36697,7 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,66,15,110,4,2 ; movd (%rdx,%r8,1),%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,15 ; pblendw $0xf,%xmm0,%xmm1
- DB 233,77,255,255,255 ; jmpq 25f04 <_sk_load_a8_sse41_8bit+0x24>
+ DB 233,77,255,255,255 ; jmpq 264d8 <_sk_load_a8_sse41_8bit+0x24>
DB 144 ; nop
DB 148 ; xchg %eax,%esp
DB 255 ; (bad)
@@ -36358,7 +36706,7 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf025fc8 <_sk_overlay_sse2_8bit+0xffffffffdeffaea7>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf02659c <_sk_overlay_sse2_8bit+0xffffffffdeffae8f>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -36379,9 +36727,9 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,42 ; jne 2601b <_sk_load_a8_dst_sse41_8bit+0x47>
+ DB 117,42 ; jne 265ef <_sk_load_a8_dst_sse41_8bit+0x47>
DB 102,66,15,56,48,28,2 ; pmovzxbw (%rdx,%r8,1),%xmm3
- DB 102,15,219,29,48,95,0,0 ; pand 0x5f30(%rip),%xmm3 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,29,60,95,0,0 ; pand 0x5f3c(%rip),%xmm3 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,211 ; pmovzxwd %xmm3,%xmm2
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
@@ -36393,15 +36741,15 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,204 ; ja 25ff8 <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 119,204 ; ja 265cc <_sk_load_a8_dst_sse41_8bit+0x24>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 260ac <_sk_load_a8_dst_sse41_8bit+0xd8>
+ DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 26680 <_sk_load_a8_dst_sse41_8bit+0xd8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 235,173 ; jmp 25ff8 <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 235,173 ; jmp 265cc <_sk_load_a8_dst_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3
@@ -36409,7 +36757,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,3 ; pblendw $0x3,%xmm2,%xmm3
- DB 235,136 ; jmp 25ff8 <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 235,136 ; jmp 265cc <_sk_load_a8_dst_sse41_8bit+0x24>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,6 ; pinsrw $0x6,%eax,%xmm3
@@ -36420,7 +36768,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,66,15,110,20,2 ; movd (%rdx,%r8,1),%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3
- DB 233,77,255,255,255 ; jmpq 25ff8 <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 233,77,255,255,255 ; jmpq 265cc <_sk_load_a8_dst_sse41_8bit+0x24>
DB 144 ; nop
DB 148 ; xchg %eax,%esp
DB 255 ; (bad)
@@ -36429,7 +36777,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf0260bc <_sk_overlay_sse2_8bit+0xffffffffdeffaf9b>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf026690 <_sk_overlay_sse2_8bit+0xffffffffdeffaf83>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -36449,39 +36797,39 @@ _sk_store_a8_sse41_8bit LABEL PROC
DB 72,99,87,8 ; movslq 0x8(%rdi),%rdx
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
- DB 102,15,111,45,136,101,0,0 ; movdqa 0x6588(%rip),%xmm5 # 2c670 <_sk_overlay_sse2_8bit+0x154f>
+ DB 102,15,111,45,148,101,0,0 ; movdqa 0x6594(%rip),%xmm5 # 2cc50 <_sk_overlay_sse2_8bit+0x1543>
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,56,0,245 ; pshufb %xmm5,%xmm6
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,56,0,229 ; pshufb %xmm5,%xmm4
DB 102,15,108,230 ; punpcklqdq %xmm6,%xmm4
DB 77,133,201 ; test %r9,%r9
- DB 117,19 ; jne 26116 <_sk_store_a8_sse41_8bit+0x4e>
- DB 102,15,56,0,37,36,101,0,0 ; pshufb 0x6524(%rip),%xmm4 # 2c630 <_sk_overlay_sse2_8bit+0x150f>
+ DB 117,19 ; jne 266ea <_sk_store_a8_sse41_8bit+0x4e>
+ DB 102,15,56,0,37,48,101,0,0 ; pshufb 0x6530(%rip),%xmm4 # 2cc10 <_sk_overlay_sse2_8bit+0x1503>
DB 102,66,15,214,36,2 ; movq %xmm4,(%rdx,%r8,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,239 ; ja 26112 <_sk_store_a8_sse41_8bit+0x4a>
+ DB 119,239 ; ja 266e6 <_sk_store_a8_sse41_8bit+0x4a>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,94,0,0,0 ; lea 0x5e(%rip),%rcx # 2618c <_sk_store_a8_sse41_8bit+0xc4>
+ DB 72,141,13,94,0,0,0 ; lea 0x5e(%rip),%rcx # 26760 <_sk_store_a8_sse41_8bit+0xc4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,58,20,36,2,0 ; pextrb $0x0,%xmm4,(%rdx,%r8,1)
- DB 235,209 ; jmp 26112 <_sk_store_a8_sse41_8bit+0x4a>
+ DB 235,209 ; jmp 266e6 <_sk_store_a8_sse41_8bit+0x4a>
DB 102,66,15,58,20,100,2,2,4 ; pextrb $0x4,%xmm4,0x2(%rdx,%r8,1)
- DB 102,15,56,0,37,237,93,0,0 ; pshufb 0x5ded(%rip),%xmm4 # 2bf40 <_sk_overlay_sse2_8bit+0xe1f>
+ DB 102,15,56,0,37,249,93,0,0 ; pshufb 0x5df9(%rip),%xmm4 # 2c520 <_sk_overlay_sse2_8bit+0xe13>
DB 102,66,15,58,21,36,2,0 ; pextrw $0x0,%xmm4,(%rdx,%r8,1)
- DB 235,181 ; jmp 26112 <_sk_store_a8_sse41_8bit+0x4a>
+ DB 235,181 ; jmp 266e6 <_sk_store_a8_sse41_8bit+0x4a>
DB 102,66,15,58,20,100,2,6,12 ; pextrb $0xc,%xmm4,0x6(%rdx,%r8,1)
DB 102,66,15,58,20,100,2,5,10 ; pextrb $0xa,%xmm4,0x5(%rdx,%r8,1)
DB 102,66,15,58,20,100,2,4,8 ; pextrb $0x8,%xmm4,0x4(%rdx,%r8,1)
- DB 102,15,56,0,37,207,93,0,0 ; pshufb 0x5dcf(%rip),%xmm4 # 2bf50 <_sk_overlay_sse2_8bit+0xe2f>
+ DB 102,15,56,0,37,219,93,0,0 ; pshufb 0x5ddb(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0xe23>
DB 102,66,15,126,36,2 ; movd %xmm4,(%rdx,%r8,1)
- DB 235,137 ; jmp 26112 <_sk_store_a8_sse41_8bit+0x4a>
+ DB 235,137 ; jmp 266e6 <_sk_store_a8_sse41_8bit+0x4a>
DB 15,31,0 ; nopl (%rax)
DB 171 ; stos %eax,%es:(%rdi)
DB 255 ; (bad)
@@ -36515,16 +36863,16 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,66 ; jne 26207 <_sk_load_g8_sse41_8bit+0x5f>
+ DB 117,66 ; jne 267db <_sk_load_g8_sse41_8bit+0x5f>
DB 102,66,15,56,48,12,2 ; pmovzxbw (%rdx,%r8,1),%xmm1
- DB 102,15,219,13,92,93,0,0 ; pand 0x5d5c(%rip),%xmm1 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,13,104,93,0,0 ; pand 0x5d68(%rip),%xmm1 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
- DB 102,15,111,37,151,100,0,0 ; movdqa 0x6497(%rip),%xmm4 # 2c680 <_sk_overlay_sse2_8bit+0x155f>
+ DB 102,15,111,37,163,100,0,0 ; movdqa 0x64a3(%rip),%xmm4 # 2cc60 <_sk_overlay_sse2_8bit+0x1553>
DB 102,15,56,64,204 ; pmulld %xmm4,%xmm1
DB 102,15,56,64,196 ; pmulld %xmm4,%xmm0
- DB 102,15,111,37,69,100,0,0 ; movdqa 0x6445(%rip),%xmm4 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,37,81,100,0,0 ; movdqa 0x6451(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,196 ; por %xmm4,%xmm0
DB 102,15,235,204 ; por %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36533,15 +36881,15 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,180 ; ja 261cc <_sk_load_g8_sse41_8bit+0x24>
+ DB 119,180 ; ja 267a0 <_sk_load_g8_sse41_8bit+0x24>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 2629c <_sk_load_g8_sse41_8bit+0xf4>
+ DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 26870 <_sk_load_g8_sse41_8bit+0xf4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 235,149 ; jmp 261cc <_sk_load_g8_sse41_8bit+0x24>
+ DB 235,149 ; jmp 267a0 <_sk_load_g8_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,2 ; pinsrw $0x2,%eax,%xmm1
@@ -36549,7 +36897,7 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,3 ; pblendw $0x3,%xmm0,%xmm1
- DB 233,109,255,255,255 ; jmpq 261cc <_sk_load_g8_sse41_8bit+0x24>
+ DB 233,109,255,255,255 ; jmpq 267a0 <_sk_load_g8_sse41_8bit+0x24>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,6 ; pinsrw $0x6,%eax,%xmm1
@@ -36560,7 +36908,7 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,66,15,110,4,2 ; movd (%rdx,%r8,1),%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,15 ; pblendw $0xf,%xmm0,%xmm1
- DB 233,50,255,255,255 ; jmpq 261cc <_sk_load_g8_sse41_8bit+0x24>
+ DB 233,50,255,255,255 ; jmpq 267a0 <_sk_load_g8_sse41_8bit+0x24>
DB 102,144 ; xchg %ax,%ax
DB 144 ; nop
DB 255 ; (bad)
@@ -36569,7 +36917,7 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde0262ac <_sk_overlay_sse2_8bit+0xffffffffddffb18b>
+ DB 232,255,255,255,221 ; callq ffffffffde026880 <_sk_overlay_sse2_8bit+0xffffffffddffb173>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -36590,16 +36938,16 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,66 ; jne 26317 <_sk_load_g8_dst_sse41_8bit+0x5f>
+ DB 117,66 ; jne 268eb <_sk_load_g8_dst_sse41_8bit+0x5f>
DB 102,66,15,56,48,28,2 ; pmovzxbw (%rdx,%r8,1),%xmm3
- DB 102,15,219,29,76,92,0,0 ; pand 0x5c4c(%rip),%xmm3 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,29,88,92,0,0 ; pand 0x5c58(%rip),%xmm3 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,211 ; pmovzxwd %xmm3,%xmm2
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
- DB 102,15,111,37,135,99,0,0 ; movdqa 0x6387(%rip),%xmm4 # 2c680 <_sk_overlay_sse2_8bit+0x155f>
+ DB 102,15,111,37,147,99,0,0 ; movdqa 0x6393(%rip),%xmm4 # 2cc60 <_sk_overlay_sse2_8bit+0x1553>
DB 102,15,56,64,220 ; pmulld %xmm4,%xmm3
DB 102,15,56,64,212 ; pmulld %xmm4,%xmm2
- DB 102,15,111,37,53,99,0,0 ; movdqa 0x6335(%rip),%xmm4 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,37,65,99,0,0 ; movdqa 0x6341(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,235,220 ; por %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36608,15 +36956,15 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,180 ; ja 262dc <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 119,180 ; ja 268b0 <_sk_load_g8_dst_sse41_8bit+0x24>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 263ac <_sk_load_g8_dst_sse41_8bit+0xf4>
+ DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 26980 <_sk_load_g8_dst_sse41_8bit+0xf4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 235,149 ; jmp 262dc <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 235,149 ; jmp 268b0 <_sk_load_g8_dst_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3
@@ -36624,7 +36972,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,3 ; pblendw $0x3,%xmm2,%xmm3
- DB 233,109,255,255,255 ; jmpq 262dc <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 233,109,255,255,255 ; jmpq 268b0 <_sk_load_g8_dst_sse41_8bit+0x24>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,6 ; pinsrw $0x6,%eax,%xmm3
@@ -36635,7 +36983,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,66,15,110,20,2 ; movd (%rdx,%r8,1),%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3
- DB 233,50,255,255,255 ; jmpq 262dc <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 233,50,255,255,255 ; jmpq 268b0 <_sk_load_g8_dst_sse41_8bit+0x24>
DB 102,144 ; xchg %ax,%ax
DB 144 ; nop
DB 255 ; (bad)
@@ -36644,7 +36992,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde0263bc <_sk_overlay_sse2_8bit+0xffffffffddffb29b>
+ DB 232,255,255,255,221 ; callq ffffffffde026990 <_sk_overlay_sse2_8bit+0xffffffffddffb283>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -36666,11 +37014,11 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,206,0,0,0 ; jne 264bb <_sk_srcover_rgba_8888_sse41_8bit+0xf3>
+ DB 15,133,206,0,0,0 ; jne 26a8f <_sk_srcover_rgba_8888_sse41_8bit+0xf3>
DB 243,70,15,111,68,138,16 ; movdqu 0x10(%rdx,%r9,4),%xmm8
DB 243,70,15,111,12,138 ; movdqu (%rdx,%r9,4),%xmm9
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,37,75,98,0,0 ; movdqa 0x624b(%rip),%xmm4 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,37,87,98,0,0 ; movdqa 0x6257(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,56,0,244 ; pshufb %xmm4,%xmm6
DB 102,15,111,248 ; movdqa %xmm0,%xmm7
@@ -36704,7 +37052,7 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 102,68,15,248,204 ; psubb %xmm4,%xmm9
DB 102,68,15,252,200 ; paddb %xmm0,%xmm9
DB 102,68,15,252,193 ; paddb %xmm1,%xmm8
- DB 117,72 ; jne 264f2 <_sk_srcover_rgba_8888_sse41_8bit+0x12a>
+ DB 117,72 ; jne 26ac6 <_sk_srcover_rgba_8888_sse41_8bit+0x12a>
DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4)
DB 243,70,15,127,68,138,16 ; movdqu %xmm8,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36715,43 +37063,43 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 254,200 ; dec %al
DB 60,6 ; cmp $0x6,%al
- DB 15,135,38,255,255,255 ; ja 263fa <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ DB 15,135,38,255,255,255 ; ja 269ce <_sk_srcover_rgba_8888_sse41_8bit+0x32>
DB 15,182,192 ; movzbl %al,%eax
- DB 72,141,13,186,0,0,0 ; lea 0xba(%rip),%rcx # 26598 <_sk_srcover_rgba_8888_sse41_8bit+0x1d0>
+ DB 72,141,13,186,0,0,0 ; lea 0xba(%rip),%rcx # 26b6c <_sk_srcover_rgba_8888_sse41_8bit+0x1d0>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,70,15,110,12,138 ; movd (%rdx,%r9,4),%xmm9
- DB 233,8,255,255,255 ; jmpq 263fa <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ DB 233,8,255,255,255 ; jmpq 269ce <_sk_srcover_rgba_8888_sse41_8bit+0x32>
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,184 ; ja 264b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ DB 119,184 ; ja 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,170,0,0,0 ; lea 0xaa(%rip),%rcx # 265b4 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec>
+ DB 72,141,13,170,0,0,0 ; lea 0xaa(%rip),%rcx # 26b88 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,70,15,126,12,138 ; movd %xmm9,(%rdx,%r9,4)
- DB 235,156 ; jmp 264b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ DB 235,156 ; jmp 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef>
DB 102,66,15,110,100,138,8 ; movd 0x8(%rdx,%r9,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 243,66,15,126,36,138 ; movq (%rdx,%r9,4),%xmm4
DB 102,68,15,58,14,204,15 ; pblendw $0xf,%xmm4,%xmm9
- DB 233,192,254,255,255 ; jmpq 263fa <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ DB 233,192,254,255,255 ; jmpq 269ce <_sk_srcover_rgba_8888_sse41_8bit+0x32>
DB 102,66,15,110,100,138,24 ; movd 0x18(%rdx,%r9,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
DB 102,70,15,58,34,68,138,20,1 ; pinsrd $0x1,0x14(%rdx,%r9,4),%xmm8
DB 102,70,15,58,34,68,138,16,0 ; pinsrd $0x0,0x10(%rdx,%r9,4),%xmm8
- DB 233,150,254,255,255 ; jmpq 263f4 <_sk_srcover_rgba_8888_sse41_8bit+0x2c>
+ DB 233,150,254,255,255 ; jmpq 269c8 <_sk_srcover_rgba_8888_sse41_8bit+0x2c>
DB 102,70,15,58,22,76,138,8,2 ; pextrd $0x2,%xmm9,0x8(%rdx,%r9,4)
DB 102,70,15,214,12,138 ; movq %xmm9,(%rdx,%r9,4)
- DB 233,69,255,255,255 ; jmpq 264b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ DB 233,69,255,255,255 ; jmpq 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef>
DB 102,70,15,58,22,68,138,24,2 ; pextrd $0x2,%xmm8,0x18(%rdx,%r9,4)
DB 102,70,15,58,22,68,138,20,1 ; pextrd $0x1,%xmm8,0x14(%rdx,%r9,4)
DB 102,70,15,126,68,138,16 ; movd %xmm8,0x10(%rdx,%r9,4)
DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4)
- DB 233,33,255,255,255 ; jmpq 264b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ DB 233,33,255,255,255 ; jmpq 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef>
DB 102,144 ; xchg %ax,%ax
DB 79,255 ; rex.WRXB (bad)
DB 255 ; (bad)
@@ -36790,7 +37138,7 @@ _sk_scale_1_float_sse41_8bit LABEL PROC
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,0 ; movss (%rax),%xmm0
- DB 243,15,89,5,214,79,0,0 ; mulss 0x4fd6(%rip),%xmm0 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,89,5,238,79,0,0 ; mulss 0x4fee(%rip),%xmm0 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,44,192 ; cvttss2si %xmm0,%eax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,68,15,56,48,197 ; pmovzxbw %xmm5,%xmm8
@@ -36798,7 +37146,7 @@ _sk_scale_1_float_sse41_8bit LABEL PROC
DB 102,68,15,56,48,204 ; pmovzxbw %xmm4,%xmm9
DB 102,15,104,224 ; punpckhbw %xmm0,%xmm4
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 102,15,56,0,53,130,96,0,0 ; pshufb 0x6082(%rip),%xmm6 # 2c690 <_sk_overlay_sse2_8bit+0x156f>
+ DB 102,15,56,0,53,142,96,0,0 ; pshufb 0x608e(%rip),%xmm6 # 2cc70 <_sk_overlay_sse2_8bit+0x1563>
DB 102,15,111,206 ; movdqa %xmm6,%xmm1
DB 102,65,15,213,201 ; pmullw %xmm9,%xmm1
DB 102,15,111,198 ; movdqa %xmm6,%xmm0
@@ -36829,13 +37177,13 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,160,0,0,0 ; jne 2671f <_sk_scale_u8_sse41_8bit+0xc1>
+ DB 15,133,160,0,0,0 ; jne 26cf3 <_sk_scale_u8_sse41_8bit+0xc1>
DB 102,66,15,56,48,52,2 ; pmovzxbw (%rdx,%r8,1),%xmm6
- DB 102,15,219,53,162,88,0,0 ; pand 0x58a2(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,53,174,88,0,0 ; pand 0x58ae(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
- DB 102,15,56,0,61,0,96,0,0 ; pshufb 0x6000(%rip),%xmm7 # 2c6a0 <_sk_overlay_sse2_8bit+0x157f>
- DB 102,15,56,0,53,7,96,0,0 ; pshufb 0x6007(%rip),%xmm6 # 2c6b0 <_sk_overlay_sse2_8bit+0x158f>
+ DB 102,15,56,0,61,12,96,0,0 ; pshufb 0x600c(%rip),%xmm7 # 2cc80 <_sk_overlay_sse2_8bit+0x1573>
+ DB 102,15,56,0,53,19,96,0,0 ; pshufb 0x6013(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0x1583>
DB 102,68,15,56,48,200 ; pmovzxbw %xmm0,%xmm9
DB 102,65,15,104,192 ; punpckhbw %xmm8,%xmm0
DB 102,68,15,56,48,209 ; pmovzxbw %xmm1,%xmm10
@@ -36866,15 +37214,15 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,82,255,255,255 ; ja 26686 <_sk_scale_u8_sse41_8bit+0x28>
+ DB 15,135,82,255,255,255 ; ja 26c5a <_sk_scale_u8_sse41_8bit+0x28>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,125,0,0,0 ; lea 0x7d(%rip),%rcx # 267bc <_sk_scale_u8_sse41_8bit+0x15e>
+ DB 72,141,13,125,0,0,0 ; lea 0x7d(%rip),%rcx # 26d90 <_sk_scale_u8_sse41_8bit+0x15e>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,48,255,255,255 ; jmpq 26686 <_sk_scale_u8_sse41_8bit+0x28>
+ DB 233,48,255,255,255 ; jmpq 26c5a <_sk_scale_u8_sse41_8bit+0x28>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,15,196,240,2 ; pinsrw $0x2,%eax,%xmm6
@@ -36882,7 +37230,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,56,48,228 ; pmovzxbw %xmm4,%xmm4
DB 102,15,58,14,244,3 ; pblendw $0x3,%xmm4,%xmm6
- DB 233,8,255,255,255 ; jmpq 26686 <_sk_scale_u8_sse41_8bit+0x28>
+ DB 233,8,255,255,255 ; jmpq 26c5a <_sk_scale_u8_sse41_8bit+0x28>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,15,196,240,6 ; pinsrw $0x6,%eax,%xmm6
@@ -36893,7 +37241,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,66,15,110,36,2 ; movd (%rdx,%r8,1),%xmm4
DB 102,15,56,48,228 ; pmovzxbw %xmm4,%xmm4
DB 102,15,58,14,244,15 ; pblendw $0xf,%xmm4,%xmm6
- DB 233,205,254,255,255 ; jmpq 26686 <_sk_scale_u8_sse41_8bit+0x28>
+ DB 233,205,254,255,255 ; jmpq 26c5a <_sk_scale_u8_sse41_8bit+0x28>
DB 15,31,0 ; nopl (%rax)
DB 140,255 ; mov %?,%edi
DB 255 ; (bad)
@@ -36918,7 +37266,7 @@ PUBLIC _sk_lerp_1_float_sse41_8bit
_sk_lerp_1_float_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,32 ; movss (%rax),%xmm4
- DB 243,15,89,37,214,77,0,0 ; mulss 0x4dd6(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,89,37,238,77,0,0 ; mulss 0x4dee(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,44,196 ; cvttss2si %xmm4,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4
@@ -36929,7 +37277,7 @@ _sk_lerp_1_float_sse41_8bit LABEL PROC
DB 102,65,15,104,193 ; punpckhbw %xmm9,%xmm0
DB 102,68,15,56,48,217 ; pmovzxbw %xmm1,%xmm11
DB 102,65,15,104,201 ; punpckhbw %xmm9,%xmm1
- DB 102,15,56,0,61,159,94,0,0 ; pshufb 0x5e9f(%rip),%xmm7 # 2c6c0 <_sk_overlay_sse2_8bit+0x159f>
+ DB 102,15,56,0,61,171,94,0,0 ; pshufb 0x5eab(%rip),%xmm7 # 2cca0 <_sk_overlay_sse2_8bit+0x1593>
DB 102,68,15,111,231 ; movdqa %xmm7,%xmm12
DB 102,69,15,213,227 ; pmullw %xmm11,%xmm12
DB 102,68,15,111,239 ; movdqa %xmm7,%xmm13
@@ -36988,13 +37336,13 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,46,1,0,0 ; jne 26a49 <_sk_lerp_u8_sse41_8bit+0x14f>
+ DB 15,133,46,1,0,0 ; jne 2701d <_sk_lerp_u8_sse41_8bit+0x14f>
DB 102,66,15,56,48,60,2 ; pmovzxbw (%rdx,%r8,1),%xmm7
- DB 102,15,219,61,6,86,0,0 ; pand 0x5606(%rip),%xmm7 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,61,18,86,0,0 ; pand 0x5612(%rip),%xmm7 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,100,93,0,0 ; pshufb 0x5d64(%rip),%xmm6 # 2c6a0 <_sk_overlay_sse2_8bit+0x157f>
- DB 102,15,56,0,61,107,93,0,0 ; pshufb 0x5d6b(%rip),%xmm7 # 2c6b0 <_sk_overlay_sse2_8bit+0x158f>
+ DB 102,15,56,0,53,112,93,0,0 ; pshufb 0x5d70(%rip),%xmm6 # 2cc80 <_sk_overlay_sse2_8bit+0x1573>
+ DB 102,15,56,0,61,119,93,0,0 ; pshufb 0x5d77(%rip),%xmm7 # 2cc90 <_sk_overlay_sse2_8bit+0x1583>
DB 102,68,15,56,48,200 ; pmovzxbw %xmm0,%xmm9
DB 102,65,15,104,192 ; punpckhbw %xmm8,%xmm0
DB 102,68,15,56,48,209 ; pmovzxbw %xmm1,%xmm10
@@ -37054,15 +37402,15 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,196,254,255,255 ; ja 26922 <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 15,135,196,254,255,255 ; ja 26ef6 <_sk_lerp_u8_sse41_8bit+0x28>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,123,0,0,0 ; lea 0x7b(%rip),%rcx # 26ae4 <_sk_lerp_u8_sse41_8bit+0x1ea>
+ DB 72,141,13,123,0,0,0 ; lea 0x7b(%rip),%rcx # 270b8 <_sk_lerp_u8_sse41_8bit+0x1ea>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,162,254,255,255 ; jmpq 26922 <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 233,162,254,255,255 ; jmpq 26ef6 <_sk_lerp_u8_sse41_8bit+0x28>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 102,15,196,248,2 ; pinsrw $0x2,%eax,%xmm7
@@ -37070,7 +37418,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,48,237 ; pmovzxbw %xmm5,%xmm5
DB 102,15,58,14,253,3 ; pblendw $0x3,%xmm5,%xmm7
- DB 233,122,254,255,255 ; jmpq 26922 <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 233,122,254,255,255 ; jmpq 26ef6 <_sk_lerp_u8_sse41_8bit+0x28>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 102,15,196,248,6 ; pinsrw $0x6,%eax,%xmm7
@@ -37081,7 +37429,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,66,15,110,44,2 ; movd (%rdx,%r8,1),%xmm5
DB 102,15,56,48,237 ; pmovzxbw %xmm5,%xmm5
DB 102,15,58,14,253,15 ; pblendw $0xf,%xmm5,%xmm7
- DB 233,63,254,255,255 ; jmpq 26922 <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 233,63,254,255,255 ; jmpq 26ef6 <_sk_lerp_u8_sse41_8bit+0x28>
DB 144 ; nop
DB 142,255 ; mov %edi,%?
DB 255 ; (bad)
@@ -37089,7 +37437,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf026af4 <_sk_overlay_sse2_8bit+0xffffffffdeffb9d3>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf0270c8 <_sk_overlay_sse2_8bit+0xffffffffdeffb9bb>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -37117,7 +37465,7 @@ _sk_move_dst_src_sse41_8bit LABEL PROC
PUBLIC _sk_black_color_sse41_8bit
_sk_black_color_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,35,91,0,0 ; movaps 0x5b23(%rip),%xmm0 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 15,40,5,47,91,0,0 ; movaps 0x5b2f(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 255,224 ; jmpq *%rax
@@ -37137,7 +37485,7 @@ _sk_clear_sse41_8bit LABEL PROC
PUBLIC _sk_srcatop_sse41_8bit
_sk_srcatop_sse41_8bit LABEL PROC
- DB 102,68,15,111,21,15,91,0,0 ; movdqa 0x5b0f(%rip),%xmm10 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,68,15,111,21,27,91,0,0 ; movdqa 0x5b1b(%rip),%xmm10 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,195 ; pmovzxbw %xmm3,%xmm8
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
@@ -37205,7 +37553,7 @@ _sk_srcatop_sse41_8bit LABEL PROC
PUBLIC _sk_dstatop_sse41_8bit
_sk_dstatop_sse41_8bit LABEL PROC
- DB 102,68,15,111,29,212,89,0,0 ; movdqa 0x59d4(%rip),%xmm11 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,68,15,111,29,224,89,0,0 ; movdqa 0x59e0(%rip),%xmm11 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,69,15,56,0,235 ; pshufb %xmm11,%xmm13
DB 102,68,15,111,248 ; movdqa %xmm0,%xmm15
@@ -37275,7 +37623,7 @@ PUBLIC _sk_srcin_sse41_8bit
_sk_srcin_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,139,88,0,0 ; movdqa 0x588b(%rip),%xmm0 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,5,151,88,0,0 ; movdqa 0x5897(%rip),%xmm0 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
DB 102,15,56,0,240 ; pshufb %xmm0,%xmm6
DB 102,15,111,250 ; movdqa %xmm2,%xmm7
@@ -37308,7 +37656,7 @@ _sk_srcin_sse41_8bit LABEL PROC
PUBLIC _sk_dstin_sse41_8bit
_sk_dstin_sse41_8bit LABEL PROC
- DB 102,15,111,37,254,87,0,0 ; movdqa 0x57fe(%rip),%xmm4 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,37,10,88,0,0 ; movdqa 0x580a(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
@@ -37345,7 +37693,7 @@ PUBLIC _sk_srcout_sse41_8bit
_sk_srcout_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,97,87,0,0 ; movdqa 0x5761(%rip),%xmm0 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,5,109,87,0,0 ; movdqa 0x576d(%rip),%xmm0 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,111,250 ; movdqa %xmm2,%xmm7
DB 102,15,56,0,248 ; pshufb %xmm0,%xmm7
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -37381,7 +37729,7 @@ _sk_srcout_sse41_8bit LABEL PROC
PUBLIC _sk_dstout_sse41_8bit
_sk_dstout_sse41_8bit LABEL PROC
- DB 102,15,111,37,200,86,0,0 ; movdqa 0x56c8(%rip),%xmm4 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,37,212,86,0,0 ; movdqa 0x56d4(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 102,15,118,228 ; pcmpeqd %xmm4,%xmm4
@@ -37419,7 +37767,7 @@ _sk_dstout_sse41_8bit LABEL PROC
PUBLIC _sk_srcover_sse41_8bit
_sk_srcover_sse41_8bit LABEL PROC
- DB 102,15,111,53,39,86,0,0 ; movdqa 0x5627(%rip),%xmm6 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,53,51,86,0,0 ; movdqa 0x5633(%rip),%xmm6 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,217 ; movdqa %xmm1,%xmm11
DB 102,68,15,56,0,222 ; pshufb %xmm6,%xmm11
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
@@ -37458,7 +37806,7 @@ _sk_srcover_sse41_8bit LABEL PROC
PUBLIC _sk_dstover_sse41_8bit
_sk_dstover_sse41_8bit LABEL PROC
- DB 102,68,15,111,5,119,85,0,0 ; movdqa 0x5577(%rip),%xmm8 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,68,15,111,5,131,85,0,0 ; movdqa 0x5583(%rip),%xmm8 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,209 ; movdqa %xmm1,%xmm10
DB 102,68,15,56,48,201 ; pmovzxbw %xmm1,%xmm9
DB 102,15,252,203 ; paddb %xmm3,%xmm1
@@ -37533,7 +37881,7 @@ _sk_multiply_sse41_8bit LABEL PROC
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,68,15,111,53,53,84,0,0 ; movdqa 0x5435(%rip),%xmm14 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,68,15,111,53,65,84,0,0 ; movdqa 0x5441(%rip),%xmm14 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,195 ; movdqa %xmm3,%xmm8
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
DB 102,65,15,56,0,238 ; pshufb %xmm14,%xmm5
@@ -37658,7 +38006,7 @@ _sk_screen_sse41_8bit LABEL PROC
PUBLIC _sk_xor__sse41_8bit
_sk_xor__sse41_8bit LABEL PROC
- DB 102,68,15,111,21,243,81,0,0 ; movdqa 0x51f3(%rip),%xmm10 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,68,15,111,21,255,81,0,0 ; movdqa 0x51ff(%rip),%xmm10 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,226 ; movdqa %xmm2,%xmm12
DB 102,68,15,56,48,194 ; pmovzxbw %xmm2,%xmm8
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
@@ -37726,10 +38074,17 @@ _sk_xor__sse41_8bit LABEL PROC
DB 102,15,111,205 ; movdqa %xmm5,%xmm1
DB 255,224 ; jmpq *%rax
+PUBLIC _sk_plus__sse41_8bit
+_sk_plus__sse41_8bit LABEL PROC
+ DB 102,15,220,194 ; paddusb %xmm2,%xmm0
+ DB 102,15,220,203 ; paddusb %xmm3,%xmm1
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 255,224 ; jmpq *%rax
+
PUBLIC _sk_darken_sse41_8bit
_sk_darken_sse41_8bit LABEL PROC
DB 102,68,15,111,240 ; movdqa %xmm0,%xmm14
- DB 102,68,15,111,5,166,80,0,0 ; movdqa 0x50a6(%rip),%xmm8 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,68,15,111,5,166,80,0,0 ; movdqa 0x50a6(%rip),%xmm8 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -37796,7 +38151,7 @@ _sk_darken_sse41_8bit LABEL PROC
DB 102,15,248,231 ; psubb %xmm7,%xmm4
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,68,15,248,245 ; psubb %xmm5,%xmm14
- DB 15,40,5,218,79,0,0 ; movaps 0x4fda(%rip),%xmm0 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 15,40,5,218,79,0,0 ; movaps 0x4fda(%rip),%xmm0 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,68,15,56,16,244 ; pblendvb %xmm0,%xmm4,%xmm14
DB 102,65,15,56,16,200 ; pblendvb %xmm0,%xmm8,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -37806,7 +38161,7 @@ _sk_darken_sse41_8bit LABEL PROC
PUBLIC _sk_lighten_sse41_8bit
_sk_lighten_sse41_8bit LABEL PROC
DB 102,68,15,111,240 ; movdqa %xmm0,%xmm14
- DB 102,68,15,111,5,55,79,0,0 ; movdqa 0x4f37(%rip),%xmm8 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,68,15,111,5,55,79,0,0 ; movdqa 0x4f37(%rip),%xmm8 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -37873,7 +38228,7 @@ _sk_lighten_sse41_8bit LABEL PROC
DB 102,15,248,231 ; psubb %xmm7,%xmm4
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,68,15,248,245 ; psubb %xmm5,%xmm14
- DB 15,40,5,107,78,0,0 ; movaps 0x4e6b(%rip),%xmm0 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 15,40,5,107,78,0,0 ; movaps 0x4e6b(%rip),%xmm0 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,68,15,56,16,244 ; pblendvb %xmm0,%xmm4,%xmm14
DB 102,65,15,56,16,200 ; pblendvb %xmm0,%xmm8,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -37911,7 +38266,7 @@ _sk_exclusion_sse41_8bit LABEL PROC
DB 102,15,113,215,8 ; psrlw $0x8,%xmm7
DB 102,15,103,253 ; packuswb %xmm5,%xmm7
DB 102,15,103,230 ; packuswb %xmm6,%xmm4
- DB 102,15,111,45,193,77,0,0 ; movdqa 0x4dc1(%rip),%xmm5 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 102,15,111,45,193,77,0,0 ; movdqa 0x4dc1(%rip),%xmm5 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,248,204 ; psubb %xmm4,%xmm1
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,15,219,239 ; pand %xmm7,%xmm5
@@ -37924,7 +38279,7 @@ _sk_exclusion_sse41_8bit LABEL PROC
PUBLIC _sk_difference_sse41_8bit
_sk_difference_sse41_8bit LABEL PROC
DB 102,68,15,111,193 ; movdqa %xmm1,%xmm8
- DB 102,15,111,13,24,77,0,0 ; movdqa 0x4d18(%rip),%xmm1 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,13,24,77,0,0 ; movdqa 0x4d18(%rip),%xmm1 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -37962,7 +38317,7 @@ _sk_difference_sse41_8bit LABEL PROC
DB 102,15,113,214,8 ; psrlw $0x8,%xmm6
DB 102,15,113,215,8 ; psrlw $0x8,%xmm7
DB 102,15,103,254 ; packuswb %xmm6,%xmm7
- DB 102,15,111,37,93,76,0,0 ; movdqa 0x4c5d(%rip),%xmm4 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,37,93,76,0,0 ; movdqa 0x4c5d(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 102,15,56,0,236 ; pshufb %xmm4,%xmm5
DB 102,69,15,104,236 ; punpckhbw %xmm12,%xmm13
@@ -37987,7 +38342,7 @@ _sk_difference_sse41_8bit LABEL PROC
DB 102,15,103,241 ; packuswb %xmm1,%xmm6
DB 102,65,15,218,230 ; pminub %xmm14,%xmm4
DB 102,15,218,247 ; pminub %xmm7,%xmm6
- DB 102,15,111,13,96,76,0,0 ; movdqa 0x4c60(%rip),%xmm1 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 102,15,111,13,96,76,0,0 ; movdqa 0x4c60(%rip),%xmm1 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,68,15,248,198 ; psubb %xmm6,%xmm8
DB 102,15,219,241 ; pand %xmm1,%xmm6
DB 102,15,219,204 ; pand %xmm4,%xmm1
@@ -38014,7 +38369,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,15,127,12,36 ; movdqa %xmm1,(%rsp)
DB 102,69,15,56,48,221 ; pmovzxbw %xmm13,%xmm11
DB 102,68,15,127,156,36,176,0,0,0 ; movdqa %xmm11,0xb0(%rsp)
- DB 102,15,111,13,104,75,0,0 ; movdqa 0x4b68(%rip),%xmm1 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,13,104,75,0,0 ; movdqa 0x4b68(%rip),%xmm1 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,56,0,241 ; pshufb %xmm1,%xmm14
DB 102,68,15,56,0,233 ; pshufb %xmm1,%xmm13
DB 102,69,15,56,48,205 ; pmovzxbw %xmm13,%xmm9
@@ -38063,7 +38418,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,65,15,56,58,242 ; pminuw %xmm10,%xmm6
DB 102,15,117,240 ; pcmpeqw %xmm0,%xmm6
DB 102,15,127,180,36,192,0,0,0 ; movdqa %xmm6,0xc0(%rsp)
- DB 102,15,111,53,68,67,0,0 ; movdqa 0x4344(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,111,53,68,67,0,0 ; movdqa 0x4344(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,65,15,213,192 ; pmullw %xmm8,%xmm0
@@ -38170,7 +38525,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,15,253,180,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm6
DB 102,15,253,124,36,16 ; paddw 0x10(%rsp),%xmm7
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
- DB 102,15,111,5,177,72,0,0 ; movdqa 0x48b1(%rip),%xmm0 # 2c6e0 <_sk_overlay_sse2_8bit+0x15bf>
+ DB 102,15,111,5,177,72,0,0 ; movdqa 0x48b1(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3>
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
DB 102,68,15,253,219 ; paddw %xmm3,%xmm11
DB 102,15,253,240 ; paddw %xmm0,%xmm6
@@ -38179,7 +38534,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,15,253,252 ; paddw %xmm4,%xmm7
DB 102,15,253,232 ; paddw %xmm0,%xmm5
DB 102,15,253,234 ; paddw %xmm2,%xmm5
- DB 102,15,111,5,151,72,0,0 ; movdqa 0x4897(%rip),%xmm0 # 2c6f0 <_sk_overlay_sse2_8bit+0x15cf>
+ DB 102,15,111,5,151,72,0,0 ; movdqa 0x4897(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
@@ -38212,7 +38567,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,15,127,12,36 ; movdqa %xmm1,(%rsp)
DB 102,65,15,56,48,206 ; pmovzxbw %xmm14,%xmm1
DB 102,15,127,140,36,16,1,0,0 ; movdqa %xmm1,0x110(%rsp)
- DB 102,15,111,13,97,71,0,0 ; movdqa 0x4761(%rip),%xmm1 # 2c650 <_sk_overlay_sse2_8bit+0x152f>
+ DB 102,15,111,13,97,71,0,0 ; movdqa 0x4761(%rip),%xmm1 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,56,0,249 ; pshufb %xmm1,%xmm15
DB 102,68,15,56,0,241 ; pshufb %xmm1,%xmm14
DB 102,65,15,56,48,238 ; pmovzxbw %xmm14,%xmm5
@@ -38264,7 +38619,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,65,15,56,58,221 ; pminuw %xmm13,%xmm3
DB 102,15,117,216 ; pcmpeqw %xmm0,%xmm3
DB 102,15,127,156,36,176,0,0,0 ; movdqa %xmm3,0xb0(%rsp)
- DB 102,15,111,53,36,63,0,0 ; movdqa 0x3f24(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,111,53,36,63,0,0 ; movdqa 0x3f24(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,15,213,196 ; pmullw %xmm4,%xmm0
@@ -38373,7 +38728,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,15,253,180,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm6
DB 102,68,15,253,132,36,128,0,0,0 ; paddw 0x80(%rsp),%xmm8
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
- DB 102,15,111,5,144,68,0,0 ; movdqa 0x4490(%rip),%xmm0 # 2c6e0 <_sk_overlay_sse2_8bit+0x15bf>
+ DB 102,15,111,5,144,68,0,0 ; movdqa 0x4490(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3>
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
DB 102,69,15,253,217 ; paddw %xmm9,%xmm11
DB 102,15,253,240 ; paddw %xmm0,%xmm6
@@ -38382,7 +38737,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,68,15,253,195 ; paddw %xmm3,%xmm8
DB 102,15,253,232 ; paddw %xmm0,%xmm5
DB 102,15,253,234 ; paddw %xmm2,%xmm5
- DB 102,15,111,5,116,68,0,0 ; movdqa 0x4474(%rip),%xmm0 # 2c6f0 <_sk_overlay_sse2_8bit+0x15cf>
+ DB 102,15,111,5,116,68,0,0 ; movdqa 0x4474(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
@@ -38435,7 +38790,7 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,240,254,255,255 ; mov %r9,-0x110(%rbp)
DB 77,57,207 ; cmp %r9,%r15
- DB 15,131,138,0,0,0 ; jae 283df <_sk_start_pipeline_sse2_8bit+0x10b>
+ DB 15,131,138,0,0,0 ; jae 289bf <_sk_start_pipeline_sse2_8bit+0x10b>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,8 ; lea 0x8(%rax),%rax
DB 72,137,133,248,254,255,255 ; mov %rax,-0x108(%rbp)
@@ -38445,7 +38800,7 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 76,137,189,8,255,255,255 ; mov %r15,-0xf8(%rbp)
DB 72,199,133,16,255,255,255,0,0,0,0 ; movq $0x0,-0xf0(%rbp)
- DB 119,36 ; ja 283bb <_sk_start_pipeline_sse2_8bit+0xe7>
+ DB 119,36 ; ja 2899b <_sk_start_pipeline_sse2_8bit+0xe7>
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
@@ -38454,17 +38809,17 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 72,131,193,16 ; add $0x10,%rcx
DB 72,57,217 ; cmp %rbx,%rcx
- DB 118,220 ; jbe 28397 <_sk_start_pipeline_sse2_8bit+0xc3>
+ DB 118,220 ; jbe 28977 <_sk_start_pipeline_sse2_8bit+0xc3>
DB 72,137,217 ; mov %rbx,%rcx
DB 72,41,193 ; sub %rax,%rcx
- DB 116,16 ; je 283d3 <_sk_start_pipeline_sse2_8bit+0xff>
+ DB 116,16 ; je 289b3 <_sk_start_pipeline_sse2_8bit+0xff>
DB 72,137,141,16,255,255,255 ; mov %rcx,-0xf0(%rbp)
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
DB 73,255,199 ; inc %r15
DB 76,59,189,240,254,255,255 ; cmp -0x110(%rbp),%r15
- DB 117,143 ; jne 2836e <_sk_start_pipeline_sse2_8bit+0x9a>
+ DB 117,143 ; jne 2894e <_sk_start_pipeline_sse2_8bit+0x9a>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -38502,7 +38857,7 @@ _sk_uniform_color_sse2_8bit LABEL PROC
PUBLIC _sk_set_rgb_sse2_8bit
_sk_set_rgb_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,37,104,49,0,0 ; movss 0x3168(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,16,37,116,49,0,0 ; movss 0x3174(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,16,40 ; movss (%rax),%xmm5
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 243,72,15,44,205 ; cvttss2si %xmm5,%rcx
@@ -38517,7 +38872,7 @@ _sk_set_rgb_sse2_8bit LABEL PROC
DB 9,208 ; or %edx,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
- DB 102,15,111,45,172,65,0,0 ; movdqa 0x41ac(%rip),%xmm5 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,45,172,65,0,0 ; movdqa 0x41ac(%rip),%xmm5 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,219,205 ; pand %xmm5,%xmm1
DB 102,15,219,197 ; pand %xmm5,%xmm0
DB 102,15,235,196 ; por %xmm4,%xmm0
@@ -38540,7 +38895,7 @@ _sk_premul_sse2_8bit LABEL PROC
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 242,15,112,192,95 ; pshuflw $0x5f,%xmm0,%xmm0
DB 243,15,112,248,95 ; pshufhw $0x5f,%xmm0,%xmm7
- DB 102,15,111,5,80,65,0,0 ; movdqa 0x4150(%rip),%xmm0 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,5,80,65,0,0 ; movdqa 0x4150(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,248 ; por %xmm0,%xmm7
DB 102,15,235,240 ; por %xmm0,%xmm6
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
@@ -38615,7 +38970,7 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,16 ; jne 28610 <_sk_load_8888_sse2_8bit+0x31>
+ DB 117,16 ; jne 28bf0 <_sk_load_8888_sse2_8bit+0x31>
DB 66,15,16,76,130,16 ; movups 0x10(%rdx,%r8,4),%xmm1
DB 102,66,15,16,4,130 ; movupd (%rdx,%r8,4),%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38625,18 +38980,18 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,231 ; ja 2860c <_sk_load_8888_sse2_8bit+0x2d>
+ DB 119,231 ; ja 28bec <_sk_load_8888_sse2_8bit+0x2d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 28680 <_sk_load_8888_sse2_8bit+0xa1>
+ DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 28c60 <_sk_load_8888_sse2_8bit+0xa1>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,66,15,16,4,130 ; movss (%rdx,%r8,4),%xmm0
- DB 235,203 ; jmp 2860c <_sk_load_8888_sse2_8bit+0x2d>
+ DB 235,203 ; jmp 28bec <_sk_load_8888_sse2_8bit+0x2d>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 102,66,15,18,4,130 ; movlpd (%rdx,%r8,4),%xmm0
- DB 235,183 ; jmp 2860c <_sk_load_8888_sse2_8bit+0x2d>
+ DB 235,183 ; jmp 28bec <_sk_load_8888_sse2_8bit+0x2d>
DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 243,66,15,16,68,130,20 ; movss 0x14(%rdx,%r8,4),%xmm0
@@ -38645,7 +39000,7 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 243,66,15,16,68,130,16 ; movss 0x10(%rdx,%r8,4),%xmm0
DB 243,15,16,200 ; movss %xmm0,%xmm1
- DB 235,134 ; jmp 28606 <_sk_load_8888_sse2_8bit+0x27>
+ DB 235,134 ; jmp 28be6 <_sk_load_8888_sse2_8bit+0x27>
DB 185,255,255,255,205 ; mov $0xcdffffff,%ecx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -38674,7 +39029,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,16 ; jne 286cd <_sk_load_8888_dst_sse2_8bit+0x31>
+ DB 117,16 ; jne 28cad <_sk_load_8888_dst_sse2_8bit+0x31>
DB 66,15,16,92,130,16 ; movups 0x10(%rdx,%r8,4),%xmm3
DB 102,66,15,16,20,130 ; movupd (%rdx,%r8,4),%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38684,18 +39039,18 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,231 ; ja 286c9 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ DB 119,231 ; ja 28ca9 <_sk_load_8888_dst_sse2_8bit+0x2d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,83,0,0,0 ; lea 0x53(%rip),%rcx # 28740 <_sk_load_8888_dst_sse2_8bit+0xa4>
+ DB 72,141,13,83,0,0,0 ; lea 0x53(%rip),%rcx # 28d20 <_sk_load_8888_dst_sse2_8bit+0xa4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,66,15,16,20,130 ; movss (%rdx,%r8,4),%xmm2
- DB 235,203 ; jmp 286c9 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ DB 235,203 ; jmp 28ca9 <_sk_load_8888_dst_sse2_8bit+0x2d>
DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,66,15,18,20,130 ; movlpd (%rdx,%r8,4),%xmm2
- DB 235,183 ; jmp 286c9 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ DB 235,183 ; jmp 28ca9 <_sk_load_8888_dst_sse2_8bit+0x2d>
DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 243,66,15,16,84,130,20 ; movss 0x14(%rdx,%r8,4),%xmm2
@@ -38704,7 +39059,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 243,66,15,16,84,130,16 ; movss 0x10(%rdx,%r8,4),%xmm2
DB 243,15,16,218 ; movss %xmm2,%xmm3
- DB 235,134 ; jmp 286c3 <_sk_load_8888_dst_sse2_8bit+0x27>
+ DB 235,134 ; jmp 28ca3 <_sk_load_8888_dst_sse2_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 182,255 ; mov $0xff,%dh
DB 255 ; (bad)
@@ -38737,7 +39092,7 @@ _sk_store_8888_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 2878e <_sk_store_8888_sse2_8bit+0x32>
+ DB 117,17 ; jne 28d6e <_sk_store_8888_sse2_8bit+0x32>
DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4)
DB 243,66,15,127,76,138,16 ; movdqu %xmm1,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38745,25 +39100,25 @@ _sk_store_8888_sse2_8bit LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,239 ; ja 2878a <_sk_store_8888_sse2_8bit+0x2e>
+ DB 119,239 ; ja 28d6a <_sk_store_8888_sse2_8bit+0x2e>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 287f4 <_sk_store_8888_sse2_8bit+0x98>
+ DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 28dd4 <_sk_store_8888_sse2_8bit+0x98>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,126,4,138 ; movd %xmm0,(%rdx,%r9,4)
- DB 235,211 ; jmp 2878a <_sk_store_8888_sse2_8bit+0x2e>
+ DB 235,211 ; jmp 28d6a <_sk_store_8888_sse2_8bit+0x2e>
DB 102,15,112,224,78 ; pshufd $0x4e,%xmm0,%xmm4
DB 102,66,15,126,100,138,8 ; movd %xmm4,0x8(%rdx,%r9,4)
DB 102,66,15,214,4,138 ; movq %xmm0,(%rdx,%r9,4)
- DB 235,191 ; jmp 2878a <_sk_store_8888_sse2_8bit+0x2e>
+ DB 235,191 ; jmp 28d6a <_sk_store_8888_sse2_8bit+0x2e>
DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
DB 102,66,15,126,100,138,24 ; movd %xmm4,0x18(%rdx,%r9,4)
DB 102,15,112,225,229 ; pshufd $0xe5,%xmm1,%xmm4
DB 102,66,15,126,100,138,20 ; movd %xmm4,0x14(%rdx,%r9,4)
DB 102,66,15,126,76,138,16 ; movd %xmm1,0x10(%rdx,%r9,4)
DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4)
- DB 235,152 ; jmp 2878a <_sk_store_8888_sse2_8bit+0x2e>
+ DB 235,152 ; jmp 28d6a <_sk_store_8888_sse2_8bit+0x2e>
DB 102,144 ; xchg %ax,%ax
DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx
DB 255 ; (bad)
@@ -38797,7 +39152,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,92 ; jne 2888d <_sk_load_bgra_sse2_8bit+0x7d>
+ DB 117,92 ; jne 28e6d <_sk_load_bgra_sse2_8bit+0x7d>
DB 66,15,16,76,130,16 ; movups 0x10(%rdx,%r8,4),%xmm1
DB 102,66,15,16,4,130 ; movupd (%rdx,%r8,4),%xmm0
DB 102,15,239,228 ; pxor %xmm4,%xmm4
@@ -38824,18 +39179,18 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,155 ; ja 2883d <_sk_load_bgra_sse2_8bit+0x2d>
+ DB 119,155 ; ja 28e1d <_sk_load_bgra_sse2_8bit+0x2d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 28908 <_sk_load_bgra_sse2_8bit+0xf8>
+ DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 28ee8 <_sk_load_bgra_sse2_8bit+0xf8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,66,15,16,4,130 ; movss (%rdx,%r8,4),%xmm0
- DB 233,124,255,255,255 ; jmpq 2883d <_sk_load_bgra_sse2_8bit+0x2d>
+ DB 233,124,255,255,255 ; jmpq 28e1d <_sk_load_bgra_sse2_8bit+0x2d>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 102,66,15,18,4,130 ; movlpd (%rdx,%r8,4),%xmm0
- DB 233,101,255,255,255 ; jmpq 2883d <_sk_load_bgra_sse2_8bit+0x2d>
+ DB 233,101,255,255,255 ; jmpq 28e1d <_sk_load_bgra_sse2_8bit+0x2d>
DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 243,66,15,16,68,130,20 ; movss 0x14(%rdx,%r8,4),%xmm0
@@ -38844,7 +39199,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 243,66,15,16,68,130,16 ; movss 0x10(%rdx,%r8,4),%xmm0
DB 243,15,16,200 ; movss %xmm0,%xmm1
- DB 233,49,255,255,255 ; jmpq 28837 <_sk_load_bgra_sse2_8bit+0x27>
+ DB 233,49,255,255,255 ; jmpq 28e17 <_sk_load_bgra_sse2_8bit+0x27>
DB 102,144 ; xchg %ax,%ax
DB 174 ; scas %es:(%rdi),%al
DB 255 ; (bad)
@@ -38879,7 +39234,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,92 ; jne 289a1 <_sk_load_bgra_dst_sse2_8bit+0x7d>
+ DB 117,92 ; jne 28f81 <_sk_load_bgra_dst_sse2_8bit+0x7d>
DB 66,15,16,92,130,16 ; movups 0x10(%rdx,%r8,4),%xmm3
DB 102,66,15,16,20,130 ; movupd (%rdx,%r8,4),%xmm2
DB 102,15,239,228 ; pxor %xmm4,%xmm4
@@ -38906,18 +39261,18 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,155 ; ja 28951 <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ DB 119,155 ; ja 28f31 <_sk_load_bgra_dst_sse2_8bit+0x2d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 28a1c <_sk_load_bgra_dst_sse2_8bit+0xf8>
+ DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 28ffc <_sk_load_bgra_dst_sse2_8bit+0xf8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,66,15,16,20,130 ; movss (%rdx,%r8,4),%xmm2
- DB 233,124,255,255,255 ; jmpq 28951 <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ DB 233,124,255,255,255 ; jmpq 28f31 <_sk_load_bgra_dst_sse2_8bit+0x2d>
DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,66,15,18,20,130 ; movlpd (%rdx,%r8,4),%xmm2
- DB 233,101,255,255,255 ; jmpq 28951 <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ DB 233,101,255,255,255 ; jmpq 28f31 <_sk_load_bgra_dst_sse2_8bit+0x2d>
DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 243,66,15,16,84,130,20 ; movss 0x14(%rdx,%r8,4),%xmm2
@@ -38926,7 +39281,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 243,66,15,16,84,130,16 ; movss 0x10(%rdx,%r8,4),%xmm2
DB 243,15,16,218 ; movss %xmm2,%xmm3
- DB 233,49,255,255,255 ; jmpq 2894b <_sk_load_bgra_dst_sse2_8bit+0x27>
+ DB 233,49,255,255,255 ; jmpq 28f2b <_sk_load_bgra_dst_sse2_8bit+0x27>
DB 102,144 ; xchg %ax,%ax
DB 174 ; scas %es:(%rdi),%al
DB 255 ; (bad)
@@ -38980,7 +39335,7 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 243,15,112,237,198 ; pshufhw $0xc6,%xmm5,%xmm5
DB 102,15,103,238 ; packuswb %xmm6,%xmm5
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 28abe <_sk_store_bgra_sse2_8bit+0x86>
+ DB 117,17 ; jne 2909e <_sk_store_bgra_sse2_8bit+0x86>
DB 243,66,15,127,44,138 ; movdqu %xmm5,(%rdx,%r9,4)
DB 243,66,15,127,100,138,16 ; movdqu %xmm4,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38988,25 +39343,25 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,239 ; ja 28aba <_sk_store_bgra_sse2_8bit+0x82>
+ DB 119,239 ; ja 2909a <_sk_store_bgra_sse2_8bit+0x82>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 28b24 <_sk_store_bgra_sse2_8bit+0xec>
+ DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 29104 <_sk_store_bgra_sse2_8bit+0xec>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,126,44,138 ; movd %xmm5,(%rdx,%r9,4)
- DB 235,211 ; jmp 28aba <_sk_store_bgra_sse2_8bit+0x82>
+ DB 235,211 ; jmp 2909a <_sk_store_bgra_sse2_8bit+0x82>
DB 102,15,112,229,78 ; pshufd $0x4e,%xmm5,%xmm4
DB 102,66,15,126,100,138,8 ; movd %xmm4,0x8(%rdx,%r9,4)
DB 102,66,15,214,44,138 ; movq %xmm5,(%rdx,%r9,4)
- DB 235,191 ; jmp 28aba <_sk_store_bgra_sse2_8bit+0x82>
+ DB 235,191 ; jmp 2909a <_sk_store_bgra_sse2_8bit+0x82>
DB 102,15,112,244,78 ; pshufd $0x4e,%xmm4,%xmm6
DB 102,66,15,126,116,138,24 ; movd %xmm6,0x18(%rdx,%r9,4)
DB 102,15,112,244,229 ; pshufd $0xe5,%xmm4,%xmm6
DB 102,66,15,126,116,138,20 ; movd %xmm6,0x14(%rdx,%r9,4)
DB 102,66,15,126,100,138,16 ; movd %xmm4,0x10(%rdx,%r9,4)
DB 243,66,15,127,44,138 ; movdqu %xmm5,(%rdx,%r9,4)
- DB 235,152 ; jmp 28aba <_sk_store_bgra_sse2_8bit+0x82>
+ DB 235,152 ; jmp 2909a <_sk_store_bgra_sse2_8bit+0x82>
DB 102,144 ; xchg %ax,%ax
DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx
DB 255 ; (bad)
@@ -39039,10 +39394,10 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,48 ; jne 28b8d <_sk_load_a8_sse2_8bit+0x4d>
+ DB 117,48 ; jne 2916d <_sk_load_a8_sse2_8bit+0x4d>
DB 243,66,15,126,4,2 ; movq (%rdx,%r8,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
- DB 102,15,84,5,193,51,0,0 ; andpd 0x33c1(%rip),%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,84,5,193,51,0,0 ; andpd 0x33c1(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,40,200 ; movapd %xmm0,%xmm1
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
@@ -39055,15 +39410,15 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,201 ; ja 28b67 <_sk_load_a8_sse2_8bit+0x27>
+ DB 119,201 ; ja 29147 <_sk_load_a8_sse2_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 28c18 <_sk_load_a8_sse2_8bit+0xd8>
+ DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 291f8 <_sk_load_a8_sse2_8bit+0xd8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,170 ; jmp 28b67 <_sk_load_a8_sse2_8bit+0x27>
+ DB 235,170 ; jmp 29147 <_sk_load_a8_sse2_8bit+0x27>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0
@@ -39071,7 +39426,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 235,136 ; jmp 28b67 <_sk_load_a8_sse2_8bit+0x27>
+ DB 235,136 ; jmp 29147 <_sk_load_a8_sse2_8bit+0x27>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,6 ; pinsrw $0x6,%eax,%xmm0
@@ -39082,7 +39437,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,66,15,110,12,2 ; movd (%rdx,%r8,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 233,80,255,255,255 ; jmpq 28b67 <_sk_load_a8_sse2_8bit+0x27>
+ DB 233,80,255,255,255 ; jmpq 29147 <_sk_load_a8_sse2_8bit+0x27>
DB 144 ; nop
DB 154 ; (bad)
DB 255 ; (bad)
@@ -39114,10 +39469,10 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,48 ; jne 28c81 <_sk_load_a8_dst_sse2_8bit+0x4d>
+ DB 117,48 ; jne 29261 <_sk_load_a8_dst_sse2_8bit+0x4d>
DB 243,66,15,126,20,2 ; movq (%rdx,%r8,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
- DB 102,15,84,21,205,50,0,0 ; andpd 0x32cd(%rip),%xmm2 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,84,21,205,50,0,0 ; andpd 0x32cd(%rip),%xmm2 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,40,218 ; movapd %xmm2,%xmm3
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
@@ -39130,15 +39485,15 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,201 ; ja 28c5b <_sk_load_a8_dst_sse2_8bit+0x27>
+ DB 119,201 ; ja 2923b <_sk_load_a8_dst_sse2_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 28d0c <_sk_load_a8_dst_sse2_8bit+0xd8>
+ DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 292ec <_sk_load_a8_dst_sse2_8bit+0xd8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 235,170 ; jmp 28c5b <_sk_load_a8_dst_sse2_8bit+0x27>
+ DB 235,170 ; jmp 2923b <_sk_load_a8_dst_sse2_8bit+0x27>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,2 ; pinsrw $0x2,%eax,%xmm2
@@ -39146,7 +39501,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,110,216 ; movd %eax,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 235,136 ; jmp 28c5b <_sk_load_a8_dst_sse2_8bit+0x27>
+ DB 235,136 ; jmp 2923b <_sk_load_a8_dst_sse2_8bit+0x27>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,6 ; pinsrw $0x6,%eax,%xmm2
@@ -39157,7 +39512,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,66,15,110,28,2 ; movd (%rdx,%r8,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,80,255,255,255 ; jmpq 28c5b <_sk_load_a8_dst_sse2_8bit+0x27>
+ DB 233,80,255,255,255 ; jmpq 2923b <_sk_load_a8_dst_sse2_8bit+0x27>
DB 144 ; nop
DB 154 ; (bad)
DB 255 ; (bad)
@@ -39199,8 +39554,8 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,114,228,16 ; psrad $0x10,%xmm4
DB 102,15,107,229 ; packssdw %xmm5,%xmm4
DB 77,133,201 ; test %r9,%r9
- DB 117,26 ; jne 28d8d <_sk_store_a8_sse2_8bit+0x65>
- DB 102,15,219,37,181,49,0,0 ; pand 0x31b5(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 117,26 ; jne 2936d <_sk_store_a8_sse2_8bit+0x65>
+ DB 102,15,219,37,181,49,0,0 ; pand 0x31b5(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,66,15,214,36,2 ; movq %xmm4,(%rdx,%r8,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39209,24 +39564,24 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,235 ; ja 28d85 <_sk_store_a8_sse2_8bit+0x5d>
+ DB 119,235 ; ja 29365 <_sk_store_a8_sse2_8bit+0x5d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,131,0,0,0 ; lea 0x83(%rip),%rcx # 28e28 <_sk_store_a8_sse2_8bit+0x100>
+ DB 72,141,13,131,0,0,0 ; lea 0x83(%rip),%rcx # 29408 <_sk_store_a8_sse2_8bit+0x100>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,15,127,36,36 ; movdqa %xmm4,(%rsp)
DB 138,4,36 ; mov (%rsp),%al
DB 66,136,4,2 ; mov %al,(%rdx,%r8,1)
- DB 235,201 ; jmp 28d85 <_sk_store_a8_sse2_8bit+0x5d>
+ DB 235,201 ; jmp 29365 <_sk_store_a8_sse2_8bit+0x5d>
DB 102,15,127,100,36,16 ; movdqa %xmm4,0x10(%rsp)
DB 138,68,36,20 ; mov 0x14(%rsp),%al
DB 66,136,68,2,2 ; mov %al,0x2(%rdx,%r8,1)
- DB 102,15,219,37,93,49,0,0 ; pand 0x315d(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,37,93,49,0,0 ; pand 0x315d(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,126,224 ; movd %xmm4,%eax
DB 102,66,137,4,2 ; mov %ax,(%rdx,%r8,1)
- DB 235,163 ; jmp 28d85 <_sk_store_a8_sse2_8bit+0x5d>
+ DB 235,163 ; jmp 29365 <_sk_store_a8_sse2_8bit+0x5d>
DB 102,15,127,100,36,64 ; movdqa %xmm4,0x40(%rsp)
DB 138,68,36,76 ; mov 0x4c(%rsp),%al
DB 66,136,68,2,6 ; mov %al,0x6(%rdx,%r8,1)
@@ -39236,10 +39591,10 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,127,100,36,32 ; movdqa %xmm4,0x20(%rsp)
DB 138,68,36,40 ; mov 0x28(%rsp),%al
DB 66,136,68,2,4 ; mov %al,0x4(%rdx,%r8,1)
- DB 102,15,219,37,25,49,0,0 ; pand 0x3119(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,37,25,49,0,0 ; pand 0x3119(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,66,15,126,36,2 ; movd %xmm4,(%rdx,%r8,1)
- DB 233,95,255,255,255 ; jmpq 28d85 <_sk_store_a8_sse2_8bit+0x5d>
+ DB 233,95,255,255,255 ; jmpq 29365 <_sk_store_a8_sse2_8bit+0x5d>
DB 102,144 ; xchg %ax,%ax
DB 134,255 ; xchg %bh,%bh
DB 255 ; (bad)
@@ -39271,15 +39626,15 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,116 ; jne 28ed5 <_sk_load_g8_sse2_8bit+0x91>
+ DB 117,116 ; jne 294b5 <_sk_load_g8_sse2_8bit+0x91>
DB 243,66,15,126,4,2 ; movq (%rdx,%r8,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
- DB 102,15,84,5,189,48,0,0 ; andpd 0x30bd(%rip),%xmm0 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,84,5,189,48,0,0 ; andpd 0x30bd(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,40,224 ; movapd %xmm0,%xmm4
DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4
DB 102,15,105,193 ; punpckhwd %xmm1,%xmm0
- DB 102,15,111,45,245,55,0,0 ; movdqa 0x37f5(%rip),%xmm5 # 2c680 <_sk_overlay_sse2_8bit+0x155f>
+ DB 102,15,111,45,245,55,0,0 ; movdqa 0x37f5(%rip),%xmm5 # 2cc60 <_sk_overlay_sse2_8bit+0x1553>
DB 102,15,112,240,245 ; pshufd $0xf5,%xmm0,%xmm6
DB 102,15,244,197 ; pmuludq %xmm5,%xmm0
DB 102,15,112,200,232 ; pshufd $0xe8,%xmm0,%xmm1
@@ -39292,7 +39647,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,244,245 ; pmuludq %xmm5,%xmm6
DB 102,15,112,230,232 ; pshufd $0xe8,%xmm6,%xmm4
DB 102,15,98,196 ; punpckldq %xmm4,%xmm0
- DB 102,15,111,37,119,55,0,0 ; movdqa 0x3777(%rip),%xmm4 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,37,119,55,0,0 ; movdqa 0x3777(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,196 ; por %xmm4,%xmm0
DB 102,15,235,204 ; por %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39301,15 +39656,15 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,133 ; ja 28e6b <_sk_load_g8_sse2_8bit+0x27>
+ DB 119,133 ; ja 2944b <_sk_load_g8_sse2_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 28f68 <_sk_load_g8_sse2_8bit+0x124>
+ DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29548 <_sk_load_g8_sse2_8bit+0x124>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 233,99,255,255,255 ; jmpq 28e6b <_sk_load_g8_sse2_8bit+0x27>
+ DB 233,99,255,255,255 ; jmpq 2944b <_sk_load_g8_sse2_8bit+0x27>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0
@@ -39317,7 +39672,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 233,62,255,255,255 ; jmpq 28e6b <_sk_load_g8_sse2_8bit+0x27>
+ DB 233,62,255,255,255 ; jmpq 2944b <_sk_load_g8_sse2_8bit+0x27>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,6 ; pinsrw $0x6,%eax,%xmm0
@@ -39328,7 +39683,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,66,15,110,12,2 ; movd (%rdx,%r8,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 233,6,255,255,255 ; jmpq 28e6b <_sk_load_g8_sse2_8bit+0x27>
+ DB 233,6,255,255,255 ; jmpq 2944b <_sk_load_g8_sse2_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
@@ -39361,15 +39716,15 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,116 ; jne 29015 <_sk_load_g8_dst_sse2_8bit+0x91>
+ DB 117,116 ; jne 295f5 <_sk_load_g8_dst_sse2_8bit+0x91>
DB 243,66,15,126,20,2 ; movq (%rdx,%r8,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
- DB 102,15,84,21,125,47,0,0 ; andpd 0x2f7d(%rip),%xmm2 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,84,21,125,47,0,0 ; andpd 0x2f7d(%rip),%xmm2 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,40,226 ; movapd %xmm2,%xmm4
DB 102,15,97,227 ; punpcklwd %xmm3,%xmm4
DB 102,15,105,211 ; punpckhwd %xmm3,%xmm2
- DB 102,15,111,45,181,54,0,0 ; movdqa 0x36b5(%rip),%xmm5 # 2c680 <_sk_overlay_sse2_8bit+0x155f>
+ DB 102,15,111,45,181,54,0,0 ; movdqa 0x36b5(%rip),%xmm5 # 2cc60 <_sk_overlay_sse2_8bit+0x1553>
DB 102,15,112,242,245 ; pshufd $0xf5,%xmm2,%xmm6
DB 102,15,244,213 ; pmuludq %xmm5,%xmm2
DB 102,15,112,218,232 ; pshufd $0xe8,%xmm2,%xmm3
@@ -39382,7 +39737,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,244,245 ; pmuludq %xmm5,%xmm6
DB 102,15,112,230,232 ; pshufd $0xe8,%xmm6,%xmm4
DB 102,15,98,212 ; punpckldq %xmm4,%xmm2
- DB 102,15,111,37,55,54,0,0 ; movdqa 0x3637(%rip),%xmm4 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 102,15,111,37,55,54,0,0 ; movdqa 0x3637(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,235,220 ; por %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39391,15 +39746,15 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,133 ; ja 28fab <_sk_load_g8_dst_sse2_8bit+0x27>
+ DB 119,133 ; ja 2958b <_sk_load_g8_dst_sse2_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 290a8 <_sk_load_g8_dst_sse2_8bit+0x124>
+ DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29688 <_sk_load_g8_dst_sse2_8bit+0x124>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,99,255,255,255 ; jmpq 28fab <_sk_load_g8_dst_sse2_8bit+0x27>
+ DB 233,99,255,255,255 ; jmpq 2958b <_sk_load_g8_dst_sse2_8bit+0x27>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,2 ; pinsrw $0x2,%eax,%xmm2
@@ -39407,7 +39762,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,110,216 ; movd %eax,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 233,62,255,255,255 ; jmpq 28fab <_sk_load_g8_dst_sse2_8bit+0x27>
+ DB 233,62,255,255,255 ; jmpq 2958b <_sk_load_g8_dst_sse2_8bit+0x27>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,6 ; pinsrw $0x6,%eax,%xmm2
@@ -39418,7 +39773,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,66,15,110,28,2 ; movd (%rdx,%r8,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,6,255,255,255 ; jmpq 28fab <_sk_load_g8_dst_sse2_8bit+0x27>
+ DB 233,6,255,255,255 ; jmpq 2958b <_sk_load_g8_dst_sse2_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
@@ -39452,7 +39807,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,253,0,0,0 ; jne 291e6 <_sk_srcover_rgba_8888_sse2_8bit+0x122>
+ DB 15,133,253,0,0,0 ; jne 297c6 <_sk_srcover_rgba_8888_sse2_8bit+0x122>
DB 70,15,16,68,138,16 ; movups 0x10(%rdx,%r9,4),%xmm8
DB 102,70,15,16,12,138 ; movupd (%rdx,%r9,4),%xmm9
DB 77,133,192 ; test %r8,%r8
@@ -39501,7 +39856,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,68,15,248,207 ; psubb %xmm7,%xmm9
DB 102,68,15,252,200 ; paddb %xmm0,%xmm9
DB 102,68,15,252,193 ; paddb %xmm1,%xmm8
- DB 117,72 ; jne 2921d <_sk_srcover_rgba_8888_sse2_8bit+0x159>
+ DB 117,72 ; jne 297fd <_sk_srcover_rgba_8888_sse2_8bit+0x159>
DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4)
DB 243,70,15,127,68,138,16 ; movdqu %xmm8,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39512,29 +39867,29 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 254,200 ; dec %al
DB 60,6 ; cmp $0x6,%al
- DB 15,135,246,254,255,255 ; ja 290f5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ DB 15,135,246,254,255,255 ; ja 296d5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
DB 15,182,192 ; movzbl %al,%eax
- DB 72,141,13,207,0,0,0 ; lea 0xcf(%rip),%rcx # 292d8 <_sk_srcover_rgba_8888_sse2_8bit+0x214>
+ DB 72,141,13,207,0,0,0 ; lea 0xcf(%rip),%rcx # 298b8 <_sk_srcover_rgba_8888_sse2_8bit+0x214>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,70,15,16,12,138 ; movss (%rdx,%r9,4),%xmm9
- DB 233,216,254,255,255 ; jmpq 290f5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ DB 233,216,254,255,255 ; jmpq 296d5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,184 ; ja 291e2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ DB 119,184 ; ja 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,191,0,0,0 ; lea 0xbf(%rip),%rcx # 292f4 <_sk_srcover_rgba_8888_sse2_8bit+0x230>
+ DB 72,141,13,191,0,0,0 ; lea 0xbf(%rip),%rcx # 298d4 <_sk_srcover_rgba_8888_sse2_8bit+0x230>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,70,15,126,12,138 ; movd %xmm9,(%rdx,%r9,4)
- DB 235,156 ; jmp 291e2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ DB 235,156 ; jmp 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
DB 102,66,15,110,100,138,8 ; movd 0x8(%rdx,%r9,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,70,15,18,12,138 ; movlpd (%rdx,%r9,4),%xmm9
- DB 233,151,254,255,255 ; jmpq 290f5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ DB 233,151,254,255,255 ; jmpq 296d5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
DB 102,66,15,110,100,138,24 ; movd 0x18(%rdx,%r9,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
DB 243,66,15,16,100,138,20 ; movss 0x14(%rdx,%r9,4),%xmm4
@@ -39543,23 +39898,23 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 68,15,40,196 ; movaps %xmm4,%xmm8
DB 243,66,15,16,100,138,16 ; movss 0x10(%rdx,%r9,4),%xmm4
DB 243,68,15,16,196 ; movss %xmm4,%xmm8
- DB 233,94,254,255,255 ; jmpq 290ef <_sk_srcover_rgba_8888_sse2_8bit+0x2b>
+ DB 233,94,254,255,255 ; jmpq 296cf <_sk_srcover_rgba_8888_sse2_8bit+0x2b>
DB 102,65,15,112,225,78 ; pshufd $0x4e,%xmm9,%xmm4
DB 102,66,15,126,100,138,8 ; movd %xmm4,0x8(%rdx,%r9,4)
DB 102,70,15,214,12,138 ; movq %xmm9,(%rdx,%r9,4)
- DB 233,57,255,255,255 ; jmpq 291e2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ DB 233,57,255,255,255 ; jmpq 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
DB 102,65,15,112,224,78 ; pshufd $0x4e,%xmm8,%xmm4
DB 102,66,15,126,100,138,24 ; movd %xmm4,0x18(%rdx,%r9,4)
DB 102,65,15,112,224,229 ; pshufd $0xe5,%xmm8,%xmm4
DB 102,66,15,126,100,138,20 ; movd %xmm4,0x14(%rdx,%r9,4)
DB 102,70,15,126,68,138,16 ; movd %xmm8,0x10(%rdx,%r9,4)
DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4)
- DB 233,13,255,255,255 ; jmpq 291e2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ DB 233,13,255,255,255 ; jmpq 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
DB 15,31,0 ; nopl (%rax)
DB 58,255 ; cmp %bh,%bh
DB 255 ; (bad)
DB 255 ; (bad)
- DB 123,255 ; jnp 292dd <_sk_srcover_rgba_8888_sse2_8bit+0x219>
+ DB 123,255 ; jnp 298bd <_sk_srcover_rgba_8888_sse2_8bit+0x219>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -39595,7 +39950,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 102,68,15,111,200 ; movdqa %xmm0,%xmm9
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,0 ; movss (%rax),%xmm0
- DB 243,15,89,5,148,34,0,0 ; mulss 0x2294(%rip),%xmm0 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,89,5,160,34,0,0 ; mulss 0x22a0(%rip),%xmm0 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,44,192 ; cvttss2si %xmm0,%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
@@ -39607,7 +39962,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 102,15,96,246 ; punpcklbw %xmm6,%xmm6
DB 242,15,112,246,0 ; pshuflw $0x0,%xmm6,%xmm6
DB 102,15,112,246,80 ; pshufd $0x50,%xmm6,%xmm6
- DB 102,15,219,53,207,43,0,0 ; pand 0x2bcf(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,219,53,207,43,0,0 ; pand 0x2bcf(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
DB 102,65,15,213,248 ; pmullw %xmm8,%xmm7
DB 102,15,111,230 ; movdqa %xmm6,%xmm4
@@ -39638,10 +39993,10 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,239,0,0,0 ; jne 294c1 <_sk_scale_u8_sse2_8bit+0x110>
+ DB 15,133,239,0,0,0 ; jne 29aa1 <_sk_scale_u8_sse2_8bit+0x110>
DB 243,66,15,126,36,2 ; movq (%rdx,%r8,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
- DB 102,15,84,37,76,43,0,0 ; andpd 0x2b4c(%rip),%xmm4 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,84,37,76,43,0,0 ; andpd 0x2b4c(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,40,236 ; movapd %xmm4,%xmm5
DB 102,65,15,105,232 ; punpckhwd %xmm8,%xmm5
@@ -39694,15 +40049,15 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,6,255,255,255 ; ja 293dc <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 15,135,6,255,255,255 ; ja 299bc <_sk_scale_u8_sse2_8bit+0x2b>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29558 <_sk_scale_u8_sse2_8bit+0x1a7>
+ DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29b38 <_sk_scale_u8_sse2_8bit+0x1a7>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 233,228,254,255,255 ; jmpq 293dc <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 233,228,254,255,255 ; jmpq 299bc <_sk_scale_u8_sse2_8bit+0x2b>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,196,224,2 ; pinsrw $0x2,%eax,%xmm4
@@ -39710,7 +40065,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 243,15,16,229 ; movss %xmm5,%xmm4
- DB 233,191,254,255,255 ; jmpq 293dc <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 233,191,254,255,255 ; jmpq 299bc <_sk_scale_u8_sse2_8bit+0x2b>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,196,224,6 ; pinsrw $0x6,%eax,%xmm4
@@ -39721,7 +40076,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,66,15,110,44,2 ; movd (%rdx,%r8,1),%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,135,254,255,255 ; jmpq 293dc <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 233,135,254,255,255 ; jmpq 299bc <_sk_scale_u8_sse2_8bit+0x2b>
DB 15,31,0 ; nopl (%rax)
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
@@ -39748,7 +40103,7 @@ PUBLIC _sk_lerp_1_float_sse2_8bit
_sk_lerp_1_float_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,32 ; movss (%rax),%xmm4
- DB 243,15,89,37,58,32,0,0 ; mulss 0x203a(%rip),%xmm4 # 2b5bc <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,89,37,70,32,0,0 ; mulss 0x2046(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,44,196 ; cvttss2si %xmm4,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4
@@ -39761,7 +40116,7 @@ _sk_lerp_1_float_sse2_8bit LABEL PROC
DB 102,68,15,111,217 ; movdqa %xmm1,%xmm11
DB 102,69,15,96,217 ; punpcklbw %xmm9,%xmm11
DB 102,65,15,104,201 ; punpckhbw %xmm9,%xmm1
- DB 102,15,111,53,109,41,0,0 ; movdqa 0x296d(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,111,53,109,41,0,0 ; movdqa 0x296d(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,65,15,219,240 ; pand %xmm8,%xmm6
DB 102,15,111,230 ; movdqa %xmm6,%xmm4
DB 102,15,213,225 ; pmullw %xmm1,%xmm4
@@ -39824,10 +40179,10 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,141,1,0,0 ; jne 29858 <_sk_lerp_u8_sse2_8bit+0x1ae>
+ DB 15,133,141,1,0,0 ; jne 29e38 <_sk_lerp_u8_sse2_8bit+0x1ae>
DB 243,66,15,126,44,2 ; movq (%rdx,%r8,1),%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
- DB 102,15,84,45,83,40,0,0 ; andpd 0x2853(%rip),%xmm5 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,84,45,83,40,0,0 ; andpd 0x2853(%rip),%xmm5 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,40,229 ; movapd %xmm5,%xmm4
DB 102,65,15,105,224 ; punpckhwd %xmm8,%xmm4
@@ -39913,15 +40268,15 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,104,254,255,255 ; ja 296d5 <_sk_lerp_u8_sse2_8bit+0x2b>
+ DB 15,135,104,254,255,255 ; ja 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,116,0,0,0 ; lea 0x74(%rip),%rcx # 298ec <_sk_lerp_u8_sse2_8bit+0x242>
+ DB 72,141,13,116,0,0,0 ; lea 0x74(%rip),%rcx # 29ecc <_sk_lerp_u8_sse2_8bit+0x242>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,232 ; movd %eax,%xmm5
- DB 233,70,254,255,255 ; jmpq 296d5 <_sk_lerp_u8_sse2_8bit+0x2b>
+ DB 233,70,254,255,255 ; jmpq 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,196,232,2 ; pinsrw $0x2,%eax,%xmm5
@@ -39929,7 +40284,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 243,15,16,236 ; movss %xmm4,%xmm5
- DB 233,33,254,255,255 ; jmpq 296d5 <_sk_lerp_u8_sse2_8bit+0x2b>
+ DB 233,33,254,255,255 ; jmpq 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,196,232,6 ; pinsrw $0x6,%eax,%xmm5
@@ -39940,7 +40295,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,66,15,110,36,2 ; movd (%rdx,%r8,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 242,15,16,236 ; movsd %xmm4,%xmm5
- DB 233,233,253,255,255 ; jmpq 296d5 <_sk_lerp_u8_sse2_8bit+0x2b>
+ DB 233,233,253,255,255 ; jmpq 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b>
DB 149 ; xchg %eax,%ebp
DB 255 ; (bad)
DB 255 ; (bad)
@@ -39979,7 +40334,7 @@ _sk_move_dst_src_sse2_8bit LABEL PROC
PUBLIC _sk_black_color_sse2_8bit
_sk_black_color_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,27,45,0,0 ; movaps 0x2d1b(%rip),%xmm0 # 2c640 <_sk_overlay_sse2_8bit+0x151f>
+ DB 15,40,5,27,45,0,0 ; movaps 0x2d1b(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 255,224 ; jmpq *%rax
@@ -40750,6 +41105,13 @@ _sk_xor__sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
+PUBLIC _sk_plus__sse2_8bit
+_sk_plus__sse2_8bit LABEL PROC
+ DB 102,15,220,194 ; paddusb %xmm2,%xmm0
+ DB 102,15,220,203 ; paddusb %xmm3,%xmm1
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 255,224 ; jmpq *%rax
+
PUBLIC _sk_darken_sse2_8bit
_sk_darken_sse2_8bit LABEL PROC
DB 242,15,112,227,231 ; pshuflw $0xe7,%xmm3,%xmm4
@@ -40843,7 +41205,7 @@ _sk_darken_sse2_8bit LABEL PROC
DB 102,65,15,248,234 ; psubb %xmm10,%xmm5
DB 102,15,248,207 ; psubb %xmm7,%xmm1
DB 102,15,248,196 ; psubb %xmm4,%xmm0
- DB 102,15,111,37,176,30,0,0 ; movdqa 0x1eb0(%rip),%xmm4 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 102,15,111,37,164,30,0,0 ; movdqa 0x1ea4(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,252 ; movdqa %xmm4,%xmm7
DB 102,15,223,248 ; pandn %xmm0,%xmm7
@@ -40949,7 +41311,7 @@ _sk_lighten_sse2_8bit LABEL PROC
DB 102,65,15,248,234 ; psubb %xmm10,%xmm5
DB 102,15,248,207 ; psubb %xmm7,%xmm1
DB 102,15,248,196 ; psubb %xmm4,%xmm0
- DB 102,15,111,37,196,28,0,0 ; movdqa 0x1cc4(%rip),%xmm4 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 102,15,111,37,184,28,0,0 ; movdqa 0x1cb8(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,252 ; movdqa %xmm4,%xmm7
DB 102,15,223,248 ; pandn %xmm0,%xmm7
@@ -40997,7 +41359,7 @@ _sk_exclusion_sse2_8bit LABEL PROC
DB 102,15,113,214,8 ; psrlw $0x8,%xmm6
DB 102,15,103,244 ; packuswb %xmm4,%xmm6
DB 102,15,103,239 ; packuswb %xmm7,%xmm5
- DB 102,15,111,37,247,27,0,0 ; movdqa 0x1bf7(%rip),%xmm4 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 102,15,111,37,235,27,0,0 ; movdqa 0x1beb(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,248,205 ; psubb %xmm5,%xmm1
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,219,230 ; pand %xmm6,%xmm4
@@ -41094,7 +41456,7 @@ _sk_difference_sse2_8bit LABEL PROC
DB 102,65,15,103,244 ; packuswb %xmm12,%xmm6
DB 102,65,15,218,226 ; pminub %xmm10,%xmm4
DB 102,65,15,218,243 ; pminub %xmm11,%xmm6
- DB 102,15,111,45,52,26,0,0 ; movdqa 0x1a34(%rip),%xmm5 # 2c6d0 <_sk_overlay_sse2_8bit+0x15af>
+ DB 102,15,111,45,40,26,0,0 ; movdqa 0x1a28(%rip),%xmm5 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 102,15,219,236 ; pand %xmm4,%xmm5
@@ -41189,7 +41551,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,68,15,111,220 ; movdqa %xmm4,%xmm11
DB 102,69,15,217,211 ; psubusw %xmm11,%xmm10
DB 102,68,15,117,213 ; pcmpeqw %xmm5,%xmm10
- DB 102,15,111,45,199,16,0,0 ; movdqa 0x10c7(%rip),%xmm5 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,111,45,187,16,0,0 ; movdqa 0x10bb(%rip),%xmm5 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,111,198 ; movdqa %xmm6,%xmm0
DB 102,15,239,197 ; pxor %xmm5,%xmm0
DB 102,65,15,213,198 ; pmullw %xmm14,%xmm0
@@ -41293,7 +41655,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,68,15,253,188,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm15
DB 102,68,15,253,76,36,16 ; paddw 0x10(%rsp),%xmm9
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
- DB 102,15,111,5,69,22,0,0 ; movdqa 0x1645(%rip),%xmm0 # 2c6e0 <_sk_overlay_sse2_8bit+0x15bf>
+ DB 102,15,111,5,57,22,0,0 ; movdqa 0x1639(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3>
DB 102,15,253,208 ; paddw %xmm0,%xmm2
DB 102,68,15,253,210 ; paddw %xmm2,%xmm10
DB 102,68,15,253,248 ; paddw %xmm0,%xmm15
@@ -41302,7 +41664,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,69,15,253,193 ; paddw %xmm9,%xmm8
DB 102,15,253,232 ; paddw %xmm0,%xmm5
DB 102,15,253,233 ; paddw %xmm1,%xmm5
- DB 102,15,111,5,40,22,0,0 ; movdqa 0x1628(%rip),%xmm0 # 2c6f0 <_sk_overlay_sse2_8bit+0x15cf>
+ DB 102,15,111,5,28,22,0,0 ; movdqa 0x161c(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3>
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
DB 102,68,15,228,192 ; pmulhuw %xmm0,%xmm8
DB 102,68,15,228,248 ; pmulhuw %xmm0,%xmm15
@@ -41405,7 +41767,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,217,234 ; psubusw %xmm2,%xmm5
DB 102,15,117,236 ; pcmpeqw %xmm4,%xmm5
DB 102,15,127,172,36,160,0,0,0 ; movdqa %xmm5,0xa0(%rsp)
- DB 102,15,111,53,92,12,0,0 ; movdqa 0xc5c(%rip),%xmm6 # 2bf30 <_sk_overlay_sse2_8bit+0xe0f>
+ DB 102,15,111,53,80,12,0,0 ; movdqa 0xc50(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,111,194 ; movdqa %xmm2,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,65,15,213,199 ; pmullw %xmm15,%xmm0
@@ -41513,7 +41875,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,68,15,253,92,36,112 ; paddw 0x70(%rsp),%xmm11
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
DB 102,15,253,116,36,16 ; paddw 0x10(%rsp),%xmm6
- DB 102,15,111,5,214,17,0,0 ; movdqa 0x11d6(%rip),%xmm0 # 2c6e0 <_sk_overlay_sse2_8bit+0x15bf>
+ DB 102,15,111,5,202,17,0,0 ; movdqa 0x11ca(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3>
DB 102,68,15,253,224 ; paddw %xmm0,%xmm12
DB 102,68,15,253,227 ; paddw %xmm3,%xmm12
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
@@ -41522,7 +41884,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,253,234 ; paddw %xmm2,%xmm5
DB 102,15,253,240 ; paddw %xmm0,%xmm6
DB 102,15,253,241 ; paddw %xmm1,%xmm6
- DB 102,15,111,5,186,17,0,0 ; movdqa 0x11ba(%rip),%xmm0 # 2c6f0 <_sk_overlay_sse2_8bit+0x15cf>
+ DB 102,15,111,5,174,17,0,0 ; movdqa 0x11ae(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
@@ -41556,14 +41918,14 @@ ALIGN 4
DB 252 ; cld
DB 190,0,0,128,191 ; mov $0xbf800000,%esi
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2b5f0 <.literal4+0x64>
+ DB 224,64 ; loopne 2bbdc <.literal4+0x64>
DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 2b5f9 <.literal4+0x6d>
+ DB 71,225,61 ; rex.RXB loope 2bbe5 <.literal4+0x6d>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2b603 <.literal4+0x77>
+ DB 127,67 ; jg 2bbef <.literal4+0x77>
DB 145 ; xchg %eax,%ecx
DB 131,158,61,92,143,50,63 ; sbbl $0x3f,0x328f5c3d(%rsi)
DB 10,215 ; or %bh,%dl
@@ -41596,7 +41958,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 2b619 <.literal4+0x8d>
+ DB 224,7 ; loopne 2bc05 <.literal4+0x8d>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -41607,8 +41969,8 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 0,52,255 ; add %dh,(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 127,0 ; jg 2b62c <.literal4+0xa0>
- DB 119,115 ; ja 2b6a1 <.literal4+0x115>
+ DB 127,0 ; jg 2bc18 <.literal4+0xa0>
+ DB 119,115 ; ja 2bc8d <.literal4+0x115>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -41631,12 +41993,12 @@ ALIGN 4
DB 190,80,128,3,62 ; mov $0x3e038050,%esi
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2b6b7 <.literal4+0x12b>
+ DB 118,63 ; jbe 2bca3 <.literal4+0x12b>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 0,0 ; add %al,(%rax)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 2b6c6 <.literal4+0x13a>
+ DB 124,66 ; jl 2bcb2 <.literal4+0x13a>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax)
@@ -41646,9 +42008,9 @@ ALIGN 4
DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax)
DB 0,0 ; add %al,(%rax)
DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax)
- DB 112,65 ; jo 2b6e9 <.literal4+0x15d>
+ DB 112,65 ; jo 2bcd5 <.literal4+0x15d>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2b6f3 <.literal4+0x167>
+ DB 127,71 ; jg 2bcdf <.literal4+0x167>
DB 208 ; (bad)
DB 179,89 ; mov $0x59,%bl
DB 62,89 ; ds pop %rcx
@@ -41675,15 +42037,15 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 128,0,0 ; addb $0x0,(%rax)
DB 0,191,0,0,192,191 ; add %bh,-0x40400000(%rdi)
- DB 114,28 ; jb 2b712 <.literal4+0x186>
+ DB 114,28 ; jb 2bcfe <.literal4+0x186>
DB 199 ; (bad)
DB 62,0,0 ; add %al,%ds:(%rax)
DB 192,63,85 ; sarb $0x55,(%rdi)
DB 85 ; push %rbp
DB 149 ; xchg %eax,%ebp
DB 191,57,142,99,61 ; mov $0x3d638e39,%edi
- DB 114,249 ; jb 2b6ff <.literal4+0x173>
- DB 127,63 ; jg 2b747 <_sk_overlay_sse2_8bit+0x626>
+ DB 114,249 ; jb 2bceb <.literal4+0x173>
+ DB 127,63 ; jg 2bd33 <_sk_overlay_sse2_8bit+0x626>
DB 3,0 ; add (%rax),%eax
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,4 ; add %al,0x4000000(%rax)
@@ -41719,16 +42081,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b768 <_sk_overlay_sse2_8bit+0xa000647>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bd48 <_sk_overlay_sse2_8bit+0xa00063b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b770 <_sk_overlay_sse2_8bit+0x1200064f>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bd50 <_sk_overlay_sse2_8bit+0x12000643>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b778 <_sk_overlay_sse2_8bit+0x1a000657>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bd58 <_sk_overlay_sse2_8bit+0x1a00064b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b780 <_sk_overlay_sse2_8bit+0x300065f>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bd60 <_sk_overlay_sse2_8bit+0x3000653>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -41771,16 +42133,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b7c8 <_sk_overlay_sse2_8bit+0xa0006a7>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bda8 <_sk_overlay_sse2_8bit+0xa00069b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b7d0 <_sk_overlay_sse2_8bit+0x120006af>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bdb0 <_sk_overlay_sse2_8bit+0x120006a3>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b7d8 <_sk_overlay_sse2_8bit+0x1a0006b7>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bdb8 <_sk_overlay_sse2_8bit+0x1a0006ab>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b7e0 <_sk_overlay_sse2_8bit+0x30006bf>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bdc0 <_sk_overlay_sse2_8bit+0x30006b3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -41823,16 +42185,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b828 <_sk_overlay_sse2_8bit+0xa000707>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02be08 <_sk_overlay_sse2_8bit+0xa0006fb>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b830 <_sk_overlay_sse2_8bit+0x1200070f>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202be10 <_sk_overlay_sse2_8bit+0x12000703>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b838 <_sk_overlay_sse2_8bit+0x1a000717>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02be18 <_sk_overlay_sse2_8bit+0x1a00070b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b840 <_sk_overlay_sse2_8bit+0x300071f>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302be20 <_sk_overlay_sse2_8bit+0x3000713>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -41875,16 +42237,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b888 <_sk_overlay_sse2_8bit+0xa000767>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02be68 <_sk_overlay_sse2_8bit+0xa00075b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b890 <_sk_overlay_sse2_8bit+0x1200076f>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202be70 <_sk_overlay_sse2_8bit+0x12000763>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b898 <_sk_overlay_sse2_8bit+0x1a000777>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02be78 <_sk_overlay_sse2_8bit+0x1a00076b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b8a0 <_sk_overlay_sse2_8bit+0x300077f>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302be80 <_sk_overlay_sse2_8bit+0x3000773>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -41927,16 +42289,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b8e8 <_sk_overlay_sse2_8bit+0xa0007c7>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bec8 <_sk_overlay_sse2_8bit+0xa0007bb>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b8f0 <_sk_overlay_sse2_8bit+0x120007cf>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bed0 <_sk_overlay_sse2_8bit+0x120007c3>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b8f8 <_sk_overlay_sse2_8bit+0x1a0007d7>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bed8 <_sk_overlay_sse2_8bit+0x1a0007cb>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b900 <_sk_overlay_sse2_8bit+0x30007df>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bee0 <_sk_overlay_sse2_8bit+0x30007d3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -41979,16 +42341,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b948 <_sk_overlay_sse2_8bit+0xa000827>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bf28 <_sk_overlay_sse2_8bit+0xa00081b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b950 <_sk_overlay_sse2_8bit+0x1200082f>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bf30 <_sk_overlay_sse2_8bit+0x12000823>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b958 <_sk_overlay_sse2_8bit+0x1a000837>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bf38 <_sk_overlay_sse2_8bit+0x1a00082b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b960 <_sk_overlay_sse2_8bit+0x300083f>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bf40 <_sk_overlay_sse2_8bit+0x3000833>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42031,16 +42393,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02b9a8 <_sk_overlay_sse2_8bit+0xa000887>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bf88 <_sk_overlay_sse2_8bit+0xa00087b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202b9b0 <_sk_overlay_sse2_8bit+0x1200088f>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bf90 <_sk_overlay_sse2_8bit+0x12000883>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02b9b8 <_sk_overlay_sse2_8bit+0x1a000897>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bf98 <_sk_overlay_sse2_8bit+0x1a00088b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302b9c0 <_sk_overlay_sse2_8bit+0x300089f>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bfa0 <_sk_overlay_sse2_8bit+0x3000893>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42083,16 +42445,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02ba08 <_sk_overlay_sse2_8bit+0xa0008e7>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bfe8 <_sk_overlay_sse2_8bit+0xa0008db>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202ba10 <_sk_overlay_sse2_8bit+0x120008ef>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bff0 <_sk_overlay_sse2_8bit+0x120008e3>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02ba18 <_sk_overlay_sse2_8bit+0x1a0008f7>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bff8 <_sk_overlay_sse2_8bit+0x1a0008eb>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302ba20 <_sk_overlay_sse2_8bit+0x30008ff>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c000 <_sk_overlay_sse2_8bit+0x30008f3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42929,11 +43291,11 @@ ALIGN 16
DB 0,128,191,0,0,128 ; add %al,-0x7fffff41(%rax)
DB 191,0,0,224,64 ; mov $0x40e00000,%edi
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2c028 <.literal16+0xf8>
+ DB 224,64 ; loopne 2c608 <.literal16+0xf8>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2c02c <.literal16+0xfc>
+ DB 224,64 ; loopne 2c60c <.literal16+0xfc>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2c030 <.literal16+0x100>
+ DB 224,64 ; loopne 2c610 <.literal16+0x100>
DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
@@ -42953,13 +43315,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2c051 <.literal16+0x121>
+ DB 71,225,61 ; rex.RXB loope 2c631 <.literal16+0x121>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2c055 <.literal16+0x125>
+ DB 71,225,61 ; rex.RXB loope 2c635 <.literal16+0x125>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2c059 <.literal16+0x129>
+ DB 71,225,61 ; rex.RXB loope 2c639 <.literal16+0x129>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2c05d <.literal16+0x12d>
+ DB 71,225,61 ; rex.RXB loope 2c63d <.literal16+0x12d>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -42970,10 +43332,10 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c038 <_sk_overlay_sse2_8bit+0xa000f17>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c618 <_sk_overlay_sse2_8bit+0xa000f0b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 302c040 <_sk_overlay_sse2_8bit+0x3000f1f>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 302c620 <_sk_overlay_sse2_8bit+0x3000f13>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42988,11 +43350,11 @@ ALIGN 16
DB 255,0 ; incl (%rax)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2c09b <.literal16+0x16b>
+ DB 127,67 ; jg 2c67b <.literal16+0x16b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2c09f <.literal16+0x16f>
+ DB 127,67 ; jg 2c67f <.literal16+0x16f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2c0a3 <.literal16+0x173>
+ DB 127,67 ; jg 2c683 <.literal16+0x173>
DB 145 ; xchg %eax,%ecx
DB 131,158,61,145,131,158,61 ; sbbl $0x3d,-0x617c6ec3(%rsi)
DB 145 ; xchg %eax,%ecx
@@ -43143,13 +43505,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 2c1a9 <.literal16+0x279>
+ DB 224,7 ; loopne 2c789 <.literal16+0x279>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 2c1ad <.literal16+0x27d>
+ DB 224,7 ; loopne 2c78d <.literal16+0x27d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 2c1b1 <.literal16+0x281>
+ DB 224,7 ; loopne 2c791 <.literal16+0x281>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 2c1b5 <.literal16+0x285>
+ DB 224,7 ; loopne 2c795 <.literal16+0x285>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -43209,17 +43571,17 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 2c234 <.literal16+0x304>
+ DB 127,0 ; jg 2c814 <.literal16+0x304>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 2c238 <.literal16+0x308>
+ DB 127,0 ; jg 2c818 <.literal16+0x308>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 2c23c <.literal16+0x30c>
+ DB 127,0 ; jg 2c81c <.literal16+0x30c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 2c240 <.literal16+0x310>
- DB 119,115 ; ja 2c2b5 <.literal16+0x385>
+ DB 127,0 ; jg 2c820 <.literal16+0x310>
+ DB 119,115 ; ja 2c895 <.literal16+0x385>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -43230,7 +43592,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 2c219 <.literal16+0x2e9>
+ DB 117,191 ; jne 2c7f9 <.literal16+0x2e9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -43242,7 +43604,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a6025a <_sk_overlay_sse2_8bit+0xffffffffe9a35139>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a6083a <_sk_overlay_sse2_8bit+0xffffffffe9a3512d>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -43332,16 +43694,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%rbx)
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2c3a3 <.literal16+0x473>
+ DB 118,63 ; jbe 2c983 <.literal16+0x473>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2c3a7 <.literal16+0x477>
+ DB 118,63 ; jbe 2c987 <.literal16+0x477>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2c3ab <.literal16+0x47b>
+ DB 118,63 ; jbe 2c98b <.literal16+0x47b>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2c3af <.literal16+0x47f>
+ DB 118,63 ; jbe 2c98f <.literal16+0x47f>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
@@ -43362,13 +43724,13 @@ ALIGN 16
DB 65,0,0 ; add %al,(%r8)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 2c3e6 <.literal16+0x4b6>
+ DB 124,66 ; jl 2c9c6 <.literal16+0x4b6>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 2c3ea <.literal16+0x4ba>
+ DB 124,66 ; jl 2c9ca <.literal16+0x4ba>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 2c3ee <.literal16+0x4be>
+ DB 124,66 ; jl 2c9ce <.literal16+0x4be>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 2c3f2 <.literal16+0x4c2>
+ DB 124,66 ; jl 2c9d2 <.literal16+0x4c2>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 0,240 ; add %dh,%al
@@ -43414,13 +43776,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2c475 <.literal16+0x545>
+ DB 112,65 ; jo 2ca55 <.literal16+0x545>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2c479 <.literal16+0x549>
+ DB 112,65 ; jo 2ca59 <.literal16+0x549>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2c47d <.literal16+0x54d>
+ DB 112,65 ; jo 2ca5d <.literal16+0x54d>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2c481 <.literal16+0x551>
+ DB 112,65 ; jo 2ca61 <.literal16+0x551>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
@@ -43459,13 +43821,13 @@ ALIGN 16
DB 64,254 ; rex (bad)
DB 255,0 ; incl (%rax)
DB 255 ; (bad)
- DB 127,71 ; jg 2c4eb <.literal16+0x5bb>
+ DB 127,71 ; jg 2cacb <.literal16+0x5bb>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2c4ef <.literal16+0x5bf>
+ DB 127,71 ; jg 2cacf <.literal16+0x5bf>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2c4f3 <.literal16+0x5c3>
+ DB 127,71 ; jg 2cad3 <.literal16+0x5c3>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2c4f7 <.literal16+0x5c7>
+ DB 127,71 ; jg 2cad7 <.literal16+0x5c7>
DB 208 ; (bad)
DB 179,89 ; mov $0x59,%bl
DB 62,208 ; ds (bad)
@@ -43495,10 +43857,10 @@ ALIGN 16
DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax
DB 152 ; cwtl
DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx)
- DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc2d5fa <_sk_overlay_sse2_8bit+0x2dc024d9>
+ DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc2dbda <_sk_overlay_sse2_8bit+0x2dc024cd>
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js 2c52c <.literal16+0x5fc>
+ DB 120,57 ; js 2cb0c <.literal16+0x5fc>
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
@@ -43563,13 +43925,13 @@ ALIGN 16
DB 192,191,0,0,192,191,0 ; sarb $0x0,-0x40400000(%rdi)
DB 0,192 ; add %al,%al
DB 191,0,0,192,191 ; mov $0xbfc00000,%edi
- DB 114,28 ; jb 2c5de <.literal16+0x6ae>
+ DB 114,28 ; jb 2cbbe <.literal16+0x6ae>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 2c5e2 <.literal16+0x6b2>
+ DB 62,114,28 ; jb,pt 2cbc2 <.literal16+0x6b2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 2c5e6 <.literal16+0x6b6>
+ DB 62,114,28 ; jb,pt 2cbc6 <.literal16+0x6b6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 2c5ea <.literal16+0x6ba>
+ DB 62,114,28 ; jb,pt 2cbca <.literal16+0x6ba>
DB 199 ; (bad)
DB 62,85 ; ds push %rbp
DB 85 ; push %rbp
@@ -43588,15 +43950,15 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d665435 <_sk_overlay_sse2_8bit+0x3d63a314>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d665a15 <_sk_overlay_sse2_8bit+0x3d63a308>
DB 57,142,99,61,114,249 ; cmp %ecx,-0x68dc29d(%rsi)
- DB 127,63 ; jg 2c643 <.literal16+0x713>
- DB 114,249 ; jb 2c5ff <.literal16+0x6cf>
- DB 127,63 ; jg 2c647 <.literal16+0x717>
- DB 114,249 ; jb 2c603 <.literal16+0x6d3>
- DB 127,63 ; jg 2c64b <.literal16+0x71b>
- DB 114,249 ; jb 2c607 <.literal16+0x6d7>
- DB 127,63 ; jg 2c64f <.literal16+0x71f>
+ DB 127,63 ; jg 2cc23 <.literal16+0x713>
+ DB 114,249 ; jb 2cbdf <.literal16+0x6cf>
+ DB 127,63 ; jg 2cc27 <.literal16+0x717>
+ DB 114,249 ; jb 2cbe3 <.literal16+0x6d3>
+ DB 127,63 ; jg 2cc2b <.literal16+0x71b>
+ DB 114,249 ; jb 2cbe7 <.literal16+0x6d7>
+ DB 127,63 ; jg 2cc2f <.literal16+0x71f>
DB 3,0 ; add (%rax),%eax
DB 0,0 ; add %al,(%rax)
DB 3,0 ; add (%rax),%eax
@@ -43703,14 +44065,14 @@ ALIGN 16
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,0 ; incl (%rax)
- DB 127,0 ; jg 2c6e2 <.literal16+0x7b2>
- DB 127,0 ; jg 2c6e4 <.literal16+0x7b4>
- DB 127,0 ; jg 2c6e6 <.literal16+0x7b6>
- DB 127,0 ; jg 2c6e8 <.literal16+0x7b8>
- DB 127,0 ; jg 2c6ea <.literal16+0x7ba>
- DB 127,0 ; jg 2c6ec <.literal16+0x7bc>
- DB 127,0 ; jg 2c6ee <.literal16+0x7be>
- DB 127,0 ; jg 2c6f0 <.literal16+0x7c0>
+ DB 127,0 ; jg 2ccc2 <.literal16+0x7b2>
+ DB 127,0 ; jg 2ccc4 <.literal16+0x7b4>
+ DB 127,0 ; jg 2ccc6 <.literal16+0x7b6>
+ DB 127,0 ; jg 2ccc8 <.literal16+0x7b8>
+ DB 127,0 ; jg 2ccca <.literal16+0x7ba>
+ DB 127,0 ; jg 2cccc <.literal16+0x7bc>
+ DB 127,0 ; jg 2ccce <.literal16+0x7be>
+ DB 127,0 ; jg 2ccd0 <.literal16+0x7c0>
DB 129,128,129,128,129,128,129,128,129,128; addl $0x80818081,-0x7f7e7f7f(%rax)
DB 129 ; .byte 0x81
DB 128 ; .byte 0x80
@@ -43805,7 +44167,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,2 ; movd (%edx),%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,144,226,144,0,0 ; movaps 0x90e2(%eax),%xmm2
+ DB 15,40,144,98,146,0,0 ; movaps 0x9262(%eax),%xmm2
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -43820,7 +44182,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 15,41,82,32 ; movaps %xmm2,0x20(%edx)
DB 15,41,82,16 ; movaps %xmm2,0x10(%edx)
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,144,242,144,0,0 ; movaps 0x90f2(%eax),%xmm2
+ DB 15,40,144,114,146,0,0 ; movaps 0x9272(%eax),%xmm2
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 86 ; push %esi
DB 82 ; push %edx
@@ -43851,16 +44213,16 @@ _sk_dither_sse2 LABEL PROC
DB 102,15,110,96,4 ; movd 0x4(%eax),%xmm4
DB 102,15,112,252,0 ; pshufd $0x0,%xmm4,%xmm7
DB 102,15,239,253 ; pxor %xmm5,%xmm7
- DB 102,15,111,177,133,144,0,0 ; movdqa 0x9085(%ecx),%xmm6
+ DB 102,15,111,177,5,146,0,0 ; movdqa 0x9205(%ecx),%xmm6
DB 102,15,111,207 ; movdqa %xmm7,%xmm1
DB 102,15,219,206 ; pand %xmm6,%xmm1
DB 102,15,219,245 ; pand %xmm5,%xmm6
- DB 102,15,111,129,165,144,0,0 ; movdqa 0x90a5(%ecx),%xmm0
+ DB 102,15,111,129,37,146,0,0 ; movdqa 0x9225(%ecx),%xmm0
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
DB 102,15,219,224 ; pand %xmm0,%xmm4
DB 102,15,219,197 ; pand %xmm5,%xmm0
- DB 102,15,219,185,149,144,0,0 ; pand 0x9095(%ecx),%xmm7
- DB 102,15,219,169,149,144,0,0 ; pand 0x9095(%ecx),%xmm5
+ DB 102,15,219,185,21,146,0,0 ; pand 0x9215(%ecx),%xmm7
+ DB 102,15,219,169,21,146,0,0 ; pand 0x9215(%ecx),%xmm5
DB 102,15,114,246,4 ; pslld $0x4,%xmm6
DB 102,15,254,192 ; paddd %xmm0,%xmm0
DB 102,15,235,198 ; por %xmm6,%xmm0
@@ -43875,8 +44237,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,15,114,215,1 ; psrld $0x1,%xmm7
DB 102,15,235,231 ; por %xmm7,%xmm4
DB 15,91,196 ; cvtdq2ps %xmm4,%xmm0
- DB 15,89,129,181,144,0,0 ; mulps 0x90b5(%ecx),%xmm0
- DB 15,88,129,197,144,0,0 ; addps 0x90c5(%ecx),%xmm0
+ DB 15,89,129,53,146,0,0 ; mulps 0x9235(%ecx),%xmm0
+ DB 15,88,129,69,146,0,0 ; addps 0x9245(%ecx),%xmm0
DB 243,15,16,14 ; movss (%esi),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
@@ -43940,7 +44302,7 @@ _sk_black_color_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,152,149,143,0,0 ; movaps 0x8f95(%eax),%xmm3
+ DB 15,40,152,21,145,0,0 ; movaps 0x9115(%eax),%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -43961,7 +44323,7 @@ _sk_white_color_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,128,117,143,0,0 ; movaps 0x8f75(%eax),%xmm0
+ DB 15,40,128,245,144,0,0 ; movaps 0x90f5(%eax),%xmm0
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -44043,7 +44405,7 @@ _sk_srcatop_sse2 LABEL PROC
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 15,40,97,64 ; movaps 0x40(%ecx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,170,214,142,0,0 ; movaps 0x8ed6(%edx),%xmm5
+ DB 15,40,170,86,144,0,0 ; movaps 0x9056(%edx),%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
@@ -44080,7 +44442,7 @@ _sk_dstatop_sse2 LABEL PROC
DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
DB 15,89,243 ; mulps %xmm3,%xmm6
- DB 15,40,162,135,142,0,0 ; movaps 0x8e87(%edx),%xmm4
+ DB 15,40,162,7,144,0,0 ; movaps 0x9007(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,198 ; addps %xmm6,%xmm0
@@ -44158,7 +44520,7 @@ _sk_srcout_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,214,141,0,0 ; movaps 0x8dd6(%eax),%xmm4
+ DB 15,40,160,86,143,0,0 ; movaps 0x8f56(%eax),%xmm4
DB 15,92,98,64 ; subps 0x40(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
@@ -44182,7 +44544,7 @@ _sk_dstout_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,174,141,0,0 ; movaps 0x8dae(%eax),%xmm4
+ DB 15,40,160,46,143,0,0 ; movaps 0x8f2e(%eax),%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
DB 15,40,66,16 ; movaps 0x10(%edx),%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -44210,7 +44572,7 @@ _sk_srcover_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,119,141,0,0 ; movaps 0x8d77(%eax),%xmm4
+ DB 15,40,160,247,142,0,0 ; movaps 0x8ef7(%eax),%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -44242,7 +44604,7 @@ _sk_dstover_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 15,40,106,64 ; movaps 0x40(%edx),%xmm5
- DB 15,40,160,55,141,0,0 ; movaps 0x8d37(%eax),%xmm4
+ DB 15,40,160,183,142,0,0 ; movaps 0x8eb7(%eax),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,66,16 ; addps 0x10(%edx),%xmm0
@@ -44294,7 +44656,7 @@ _sk_multiply_sse2 LABEL PROC
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
- DB 15,40,129,200,140,0,0 ; movaps 0x8cc8(%ecx),%xmm0
+ DB 15,40,129,72,142,0,0 ; movaps 0x8e48(%ecx),%xmm0
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
DB 15,40,254 ; movaps %xmm6,%xmm7
@@ -44347,17 +44709,24 @@ _sk_plus__sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 139,77,8 ; mov 0x8(%ebp),%ecx
- DB 15,88,65,16 ; addps 0x10(%ecx),%xmm0
- DB 15,88,73,32 ; addps 0x20(%ecx),%xmm1
- DB 15,88,81,48 ; addps 0x30(%ecx),%xmm2
- DB 15,88,89,64 ; addps 0x40(%ecx),%xmm3
- DB 141,80,4 ; lea 0x4(%eax),%edx
+ DB 232,0,0,0,0 ; call 65e <_sk_plus__sse2+0xb>
+ DB 88 ; pop %eax
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,85,8 ; mov 0x8(%ebp),%edx
+ DB 15,88,66,16 ; addps 0x10(%edx),%xmm0
+ DB 15,40,160,178,141,0,0 ; movaps 0x8db2(%eax),%xmm4
+ DB 15,93,196 ; minps %xmm4,%xmm0
+ DB 15,88,74,32 ; addps 0x20(%edx),%xmm1
+ DB 15,93,204 ; minps %xmm4,%xmm1
+ DB 15,88,82,48 ; addps 0x30(%edx),%xmm2
+ DB 15,93,212 ; minps %xmm4,%xmm2
+ DB 15,88,90,64 ; addps 0x40(%edx),%xmm3
+ DB 15,93,220 ; minps %xmm4,%xmm3
+ DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
+ DB 80 ; push %eax
DB 82 ; push %edx
- DB 81 ; push %ecx
- DB 255,16 ; call *(%eax)
+ DB 255,17 ; call *(%ecx)
DB 131,196,24 ; add $0x18,%esp
DB 93 ; pop %ebp
DB 195 ; ret
@@ -44408,12 +44777,12 @@ _sk_xor__sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 232,0,0,0,0 ; call 6f3 <_sk_xor__sse2+0xe>
+ DB 232,0,0,0,0 ; call 70c <_sk_xor__sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
- DB 15,40,154,157,139,0,0 ; movaps 0x8b9d(%edx),%xmm3
+ DB 15,40,154,20,141,0,0 ; movaps 0x8d14(%edx),%xmm3
DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,92,245 ; subps %xmm5,%xmm6
DB 15,89,198 ; mulps %xmm6,%xmm0
@@ -44447,7 +44816,7 @@ _sk_darken_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 75b <_sk_darken_sse2+0xe>
+ DB 232,0,0,0,0 ; call 774 <_sk_darken_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -44473,7 +44842,7 @@ _sk_darken_sse2 LABEL PROC
DB 15,89,203 ; mulps %xmm3,%xmm1
DB 15,95,209 ; maxps %xmm1,%xmm2
DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,40,138,69,139,0,0 ; movaps 0x8b45(%edx),%xmm1
+ DB 15,40,138,188,140,0,0 ; movaps 0x8cbc(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -44494,7 +44863,7 @@ _sk_lighten_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 7db <_sk_lighten_sse2+0xe>
+ DB 232,0,0,0,0 ; call 7f4 <_sk_lighten_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -44520,7 +44889,7 @@ _sk_lighten_sse2 LABEL PROC
DB 15,89,203 ; mulps %xmm3,%xmm1
DB 15,93,209 ; minps %xmm1,%xmm2
DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,40,138,213,138,0,0 ; movaps 0x8ad5(%edx),%xmm1
+ DB 15,40,138,76,140,0,0 ; movaps 0x8c4c(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -44542,7 +44911,7 @@ _sk_difference_sse2 LABEL PROC
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,225 ; movaps %xmm1,%xmm4
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 85e <_sk_difference_sse2+0x11>
+ DB 232,0,0,0,0 ; call 877 <_sk_difference_sse2+0x11>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -44571,7 +44940,7 @@ _sk_difference_sse2 LABEL PROC
DB 15,93,214 ; minps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,146,98,138,0,0 ; movaps 0x8a62(%edx),%xmm2
+ DB 15,40,146,217,139,0,0 ; movaps 0x8bd9(%edx),%xmm2
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -44591,7 +44960,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 8e4 <_sk_exclusion_sse2+0xe>
+ DB 232,0,0,0,0 ; call 8fd <_sk_exclusion_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -44613,7 +44982,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,202 ; mulps %xmm2,%xmm1
DB 15,88,201 ; addps %xmm1,%xmm1
DB 15,92,233 ; subps %xmm1,%xmm5
- DB 15,40,138,236,137,0,0 ; movaps 0x89ec(%edx),%xmm1
+ DB 15,40,138,99,139,0,0 ; movaps 0x8b63(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,73,64 ; mulps 0x40(%ecx),%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -44637,7 +45006,7 @@ _sk_colorburn_sse2 LABEL PROC
DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 963 <_sk_colorburn_sse2+0x19>
+ DB 232,0,0,0,0 ; call 97c <_sk_colorburn_sse2+0x19>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
@@ -44652,7 +45021,7 @@ _sk_colorburn_sse2 LABEL PROC
DB 15,93,198 ; minps %xmm6,%xmm0
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,92,232 ; subps %xmm0,%xmm5
- DB 15,40,177,125,137,0,0 ; movaps 0x897d(%ecx),%xmm6
+ DB 15,40,177,244,138,0,0 ; movaps 0x8af4(%ecx),%xmm6
DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,92,193 ; subps %xmm1,%xmm0
DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
@@ -44763,11 +45132,11 @@ _sk_colordodge_sse2 LABEL PROC
DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
DB 15,41,77,232 ; movaps %xmm1,-0x18(%ebp)
- DB 232,0,0,0,0 ; call aec <_sk_colordodge_sse2+0x16>
+ DB 232,0,0,0,0 ; call b05 <_sk_colordodge_sse2+0x16>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,16 ; movaps 0x10(%eax),%xmm1
- DB 15,40,145,4,136,0,0 ; movaps 0x8804(%ecx),%xmm2
+ DB 15,40,145,123,137,0,0 ; movaps 0x897b(%ecx),%xmm2
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 15,92,214 ; subps %xmm6,%xmm2
DB 15,40,250 ; movaps %xmm2,%xmm7
@@ -44878,11 +45247,11 @@ _sk_hardlight_sse2 LABEL PROC
DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
DB 15,41,77,232 ; movaps %xmm1,-0x18(%ebp)
- DB 232,0,0,0,0 ; call c4d <_sk_hardlight_sse2+0x16>
+ DB 232,0,0,0,0 ; call c66 <_sk_hardlight_sse2+0x16>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
- DB 15,40,145,179,134,0,0 ; movaps 0x86b3(%ecx),%xmm2
+ DB 15,40,145,42,136,0,0 ; movaps 0x882a(%ecx),%xmm2
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,40,225 ; movaps %xmm1,%xmm4
@@ -44986,11 +45355,11 @@ _sk_overlay_sse2 LABEL PROC
DB 15,41,85,152 ; movaps %xmm2,-0x68(%ebp)
DB 15,41,77,168 ; movaps %xmm1,-0x58(%ebp)
DB 15,40,232 ; movaps %xmm0,%xmm5
- DB 232,0,0,0,0 ; call d98 <_sk_overlay_sse2+0x1a>
+ DB 232,0,0,0,0 ; call db1 <_sk_overlay_sse2+0x1a>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
- DB 15,40,161,120,133,0,0 ; movaps 0x8578(%ecx),%xmm4
+ DB 15,40,161,239,134,0,0 ; movaps 0x86ef(%ecx),%xmm4
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
@@ -45113,20 +45482,20 @@ _sk_softlight_sse2 LABEL PROC
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
DB 15,88,241 ; addps %xmm1,%xmm6
- DB 232,0,0,0,0 ; call f28 <_sk_softlight_sse2+0x52>
+ DB 232,0,0,0,0 ; call f41 <_sk_softlight_sse2+0x52>
DB 89 ; pop %ecx
DB 15,40,194 ; movaps %xmm2,%xmm0
- DB 15,40,137,8,132,0,0 ; movaps 0x8408(%ecx),%xmm1
+ DB 15,40,137,127,133,0,0 ; movaps 0x857f(%ecx),%xmm1
DB 15,41,141,104,255,255,255 ; movaps %xmm1,-0x98(%ebp)
DB 15,88,193 ; addps %xmm1,%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,185,248,131,0,0 ; movaps 0x83f8(%ecx),%xmm7
+ DB 15,40,185,111,133,0,0 ; movaps 0x856f(%ecx),%xmm7
DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
DB 15,92,250 ; subps %xmm2,%xmm7
DB 15,82,242 ; rsqrtps %xmm2,%xmm6
DB 15,83,206 ; rcpps %xmm6,%xmm1
DB 15,92,202 ; subps %xmm2,%xmm1
- DB 15,40,161,24,132,0,0 ; movaps 0x8418(%ecx),%xmm4
+ DB 15,40,161,143,133,0,0 ; movaps 0x858f(%ecx),%xmm4
DB 15,41,101,152 ; movaps %xmm4,-0x68(%ebp)
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
@@ -45320,7 +45689,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,93,200 ; minps %xmm0,%xmm1
DB 15,92,225 ; subps %xmm1,%xmm4
DB 15,41,101,168 ; movaps %xmm4,-0x58(%ebp)
- DB 232,0,0,0,0 ; call 11e9 <_sk_hue_sse2+0x4f>
+ DB 232,0,0,0,0 ; call 1202 <_sk_hue_sse2+0x4f>
DB 89 ; pop %ecx
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,40,197 ; movaps %xmm5,%xmm0
@@ -45330,7 +45699,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
- DB 15,40,169,151,129,0,0 ; movaps 0x8197(%ecx),%xmm5
+ DB 15,40,169,14,131,0,0 ; movaps 0x830e(%ecx),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
@@ -45363,17 +45732,17 @@ _sk_hue_sse2 LABEL PROC
DB 15,89,233 ; mulps %xmm1,%xmm5
DB 15,41,173,120,255,255,255 ; movaps %xmm5,-0x88(%ebp)
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,153,103,129,0,0 ; movaps 0x8167(%ecx),%xmm3
+ DB 15,40,153,222,130,0,0 ; movaps 0x82de(%ecx),%xmm3
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,117,152 ; movaps -0x68(%ebp),%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
DB 15,89,203 ; mulps %xmm3,%xmm1
- DB 15,40,153,119,129,0,0 ; movaps 0x8177(%ecx),%xmm3
+ DB 15,40,153,238,130,0,0 ; movaps 0x82ee(%ecx),%xmm3
DB 15,40,109,136 ; movaps -0x78(%ebp),%xmm5
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,89,251 ; mulps %xmm3,%xmm7
DB 15,88,249 ; addps %xmm1,%xmm7
- DB 15,40,137,151,129,0,0 ; movaps 0x8197(%ecx),%xmm1
+ DB 15,40,137,14,131,0,0 ; movaps 0x830e(%ecx),%xmm1
DB 15,92,77,184 ; subps -0x48(%ebp),%xmm1
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 15,41,117,152 ; movaps %xmm6,-0x68(%ebp)
@@ -45383,7 +45752,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 15,41,117,168 ; movaps %xmm6,-0x58(%ebp)
- DB 15,40,169,135,129,0,0 ; movaps 0x8187(%ecx),%xmm5
+ DB 15,40,169,254,130,0,0 ; movaps 0x82fe(%ecx),%xmm5
DB 15,89,205 ; mulps %xmm5,%xmm1
DB 15,88,207 ; addps %xmm7,%xmm1
DB 15,94,212 ; divps %xmm4,%xmm2
@@ -45572,19 +45941,19 @@ _sk_saturation_sse2 LABEL PROC
DB 15,89,221 ; mulps %xmm5,%xmm3
DB 15,40,211 ; movaps %xmm3,%xmm2
DB 15,89,253 ; mulps %xmm5,%xmm7
- DB 232,0,0,0,0 ; call 153d <_sk_saturation_sse2+0xb0>
+ DB 232,0,0,0,0 ; call 1556 <_sk_saturation_sse2+0xb0>
DB 89 ; pop %ecx
- DB 15,40,153,83,126,0,0 ; movaps 0x7e53(%ecx),%xmm3
+ DB 15,40,153,202,127,0,0 ; movaps 0x7fca(%ecx),%xmm3
DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp)
DB 15,40,77,184 ; movaps -0x48(%ebp),%xmm1
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,40,153,99,126,0,0 ; movaps 0x7e63(%ecx),%xmm3
+ DB 15,40,153,218,127,0,0 ; movaps 0x7fda(%ecx),%xmm3
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,238 ; movaps %xmm6,%xmm5
DB 15,89,235 ; mulps %xmm3,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,129,131,126,0,0 ; movaps 0x7e83(%ecx),%xmm0
+ DB 15,40,129,250,127,0,0 ; movaps 0x7ffa(%ecx),%xmm0
DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp)
DB 15,92,69,216 ; subps -0x28(%ebp),%xmm0
DB 15,89,200 ; mulps %xmm0,%xmm1
@@ -45596,7 +45965,7 @@ _sk_saturation_sse2 LABEL PROC
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,41,141,120,255,255,255 ; movaps %xmm1,-0x88(%ebp)
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 15,40,129,115,126,0,0 ; movaps 0x7e73(%ecx),%xmm0
+ DB 15,40,129,234,127,0,0 ; movaps 0x7fea(%ecx),%xmm0
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,40,109,168 ; movaps -0x58(%ebp),%xmm5
@@ -45748,21 +46117,21 @@ _sk_color_sse2 LABEL PROC
DB 15,41,165,104,255,255,255 ; movaps %xmm4,-0x98(%ebp)
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,41,173,120,255,255,255 ; movaps %xmm5,-0x88(%ebp)
- DB 232,0,0,0,0 ; call 1798 <_sk_color_sse2+0x2a>
+ DB 232,0,0,0,0 ; call 17b1 <_sk_color_sse2+0x2a>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,16 ; movaps 0x10(%eax),%xmm2
DB 15,40,72,32 ; movaps 0x20(%eax),%xmm1
- DB 15,40,177,56,124,0,0 ; movaps 0x7c38(%ecx),%xmm6
+ DB 15,40,177,175,125,0,0 ; movaps 0x7daf(%ecx),%xmm6
DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp)
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,153,72,124,0,0 ; movaps 0x7c48(%ecx),%xmm3
+ DB 15,40,153,191,125,0,0 ; movaps 0x7dbf(%ecx),%xmm3
DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,243 ; mulps %xmm3,%xmm6
DB 15,88,240 ; addps %xmm0,%xmm6
- DB 15,40,129,104,124,0,0 ; movaps 0x7c68(%ecx),%xmm0
+ DB 15,40,129,223,125,0,0 ; movaps 0x7ddf(%ecx),%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
DB 15,92,69,200 ; subps -0x38(%ebp),%xmm0
DB 15,89,208 ; mulps %xmm0,%xmm2
@@ -45772,7 +46141,7 @@ _sk_color_sse2 LABEL PROC
DB 15,40,80,48 ; movaps 0x30(%eax),%xmm2
DB 15,89,194 ; mulps %xmm2,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
- DB 15,40,137,88,124,0,0 ; movaps 0x7c58(%ecx),%xmm1
+ DB 15,40,137,207,125,0,0 ; movaps 0x7dcf(%ecx),%xmm1
DB 15,89,209 ; mulps %xmm1,%xmm2
DB 15,88,214 ; addps %xmm6,%xmm2
DB 15,40,88,64 ; movaps 0x40(%eax),%xmm3
@@ -45926,21 +46295,21 @@ _sk_luminosity_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 129,236,184,0,0,0 ; sub $0xb8,%esp
DB 15,40,242 ; movaps %xmm2,%xmm6
- DB 232,0,0,0,0 ; call 19fb <_sk_luminosity_sse2+0x11>
+ DB 232,0,0,0,0 ; call 1a14 <_sk_luminosity_sse2+0x11>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 15,40,161,21,122,0,0 ; movaps 0x7a15(%ecx),%xmm4
+ DB 15,40,161,140,123,0,0 ; movaps 0x7b8c(%ecx),%xmm4
DB 15,41,101,232 ; movaps %xmm4,-0x18(%ebp)
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 15,40,161,37,122,0,0 ; movaps 0x7a25(%ecx),%xmm4
+ DB 15,40,161,156,123,0,0 ; movaps 0x7b9c(%ecx),%xmm4
DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,88,234 ; addps %xmm2,%xmm5
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
DB 15,41,85,184 ; movaps %xmm2,-0x48(%ebp)
- DB 15,40,161,69,122,0,0 ; movaps 0x7a45(%ecx),%xmm4
+ DB 15,40,161,188,123,0,0 ; movaps 0x7bbc(%ecx),%xmm4
DB 15,40,252 ; movaps %xmm4,%xmm7
DB 15,92,250 ; subps %xmm2,%xmm7
DB 15,89,199 ; mulps %xmm7,%xmm0
@@ -45950,7 +46319,7 @@ _sk_luminosity_sse2 LABEL PROC
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,41,189,104,255,255,255 ; movaps %xmm7,-0x98(%ebp)
DB 15,40,214 ; movaps %xmm6,%xmm2
- DB 15,40,137,53,122,0,0 ; movaps 0x7a35(%ecx),%xmm1
+ DB 15,40,137,172,123,0,0 ; movaps 0x7bac(%ecx),%xmm1
DB 15,89,209 ; mulps %xmm1,%xmm2
DB 15,88,213 ; addps %xmm5,%xmm2
DB 15,40,104,16 ; movaps 0x10(%eax),%xmm5
@@ -46110,7 +46479,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 131,236,44 ; sub $0x2c,%esp
DB 102,15,127,85,200 ; movdqa %xmm2,-0x38(%ebp)
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
- DB 232,0,0,0,0 ; call 1c66 <_sk_srcover_rgba_8888_sse2+0x17>
+ DB 232,0,0,0,0 ; call 1c7f <_sk_srcover_rgba_8888_sse2+0x17>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -46122,9 +46491,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,49 ; mov (%ecx),%esi
- DB 15,133,224,0,0,0 ; jne 1d68 <_sk_srcover_rgba_8888_sse2+0x119>
+ DB 15,133,224,0,0,0 ; jne 1d81 <_sk_srcover_rgba_8888_sse2+0x119>
DB 243,15,111,20,178 ; movdqu (%edx,%esi,4),%xmm2
- DB 102,15,111,167,234,119,0,0 ; movdqa 0x77ea(%edi),%xmm4
+ DB 102,15,111,167,97,121,0,0 ; movdqa 0x7961(%edi),%xmm4
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,242 ; movdqa %xmm2,%xmm6
@@ -46135,9 +46504,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 102,15,219,252 ; pand %xmm4,%xmm7
DB 15,91,229 ; cvtdq2ps %xmm5,%xmm4
DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx)
- DB 15,40,175,250,119,0,0 ; movaps 0x77fa(%edi),%xmm5
+ DB 15,40,175,113,121,0,0 ; movaps 0x7971(%edi),%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
- DB 15,40,143,10,120,0,0 ; movaps 0x780a(%edi),%xmm1
+ DB 15,40,143,129,121,0,0 ; movaps 0x7981(%edi),%xmm1
DB 15,89,193 ; mulps %xmm1,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,88,224 ; addps %xmm0,%xmm4
@@ -46170,7 +46539,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 102,15,235,193 ; por %xmm1,%xmm0
DB 133,219 ; test %ebx,%ebx
- DB 117,95 ; jne 1da3 <_sk_srcover_rgba_8888_sse2+0x154>
+ DB 117,95 ; jne 1dbc <_sk_srcover_rgba_8888_sse2+0x154>
DB 243,15,127,4,178 ; movdqu %xmm0,(%edx,%esi,4)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -46191,33 +46560,33 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 136,69,243 ; mov %al,-0xd(%ebp)
DB 128,101,243,3 ; andb $0x3,-0xd(%ebp)
DB 128,125,243,1 ; cmpb $0x1,-0xd(%ebp)
- DB 116,80 ; je 1dc7 <_sk_srcover_rgba_8888_sse2+0x178>
+ DB 116,80 ; je 1de0 <_sk_srcover_rgba_8888_sse2+0x178>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 128,125,243,2 ; cmpb $0x2,-0xd(%ebp)
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 116,21 ; je 1d99 <_sk_srcover_rgba_8888_sse2+0x14a>
+ DB 116,21 ; je 1db2 <_sk_srcover_rgba_8888_sse2+0x14a>
DB 128,125,243,3 ; cmpb $0x3,-0xd(%ebp)
- DB 15,133,255,254,255,255 ; jne 1c8d <_sk_srcover_rgba_8888_sse2+0x3e>
+ DB 15,133,255,254,255,255 ; jne 1ca6 <_sk_srcover_rgba_8888_sse2+0x3e>
DB 102,15,110,84,178,8 ; movd 0x8(%edx,%esi,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,15,18,20,178 ; movlpd (%edx,%esi,4),%xmm2
- DB 233,234,254,255,255 ; jmp 1c8d <_sk_srcover_rgba_8888_sse2+0x3e>
+ DB 233,234,254,255,255 ; jmp 1ca6 <_sk_srcover_rgba_8888_sse2+0x3e>
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,41 ; je 1dd4 <_sk_srcover_rgba_8888_sse2+0x185>
+ DB 116,41 ; je 1ded <_sk_srcover_rgba_8888_sse2+0x185>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 1dc0 <_sk_srcover_rgba_8888_sse2+0x171>
+ DB 116,16 ; je 1dd9 <_sk_srcover_rgba_8888_sse2+0x171>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,148 ; jne 1d49 <_sk_srcover_rgba_8888_sse2+0xfa>
+ DB 117,148 ; jne 1d62 <_sk_srcover_rgba_8888_sse2+0xfa>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,15,126,76,178,8 ; movd %xmm1,0x8(%edx,%esi,4)
DB 102,15,214,4,178 ; movq %xmm0,(%edx,%esi,4)
- DB 235,130 ; jmp 1d49 <_sk_srcover_rgba_8888_sse2+0xfa>
+ DB 235,130 ; jmp 1d62 <_sk_srcover_rgba_8888_sse2+0xfa>
DB 102,15,110,20,178 ; movd (%edx,%esi,4),%xmm2
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 233,185,254,255,255 ; jmp 1c8d <_sk_srcover_rgba_8888_sse2+0x3e>
+ DB 233,185,254,255,255 ; jmp 1ca6 <_sk_srcover_rgba_8888_sse2+0x3e>
DB 102,15,126,4,178 ; movd %xmm0,(%edx,%esi,4)
- DB 233,107,255,255,255 ; jmp 1d49 <_sk_srcover_rgba_8888_sse2+0xfa>
+ DB 233,107,255,255,255 ; jmp 1d62 <_sk_srcover_rgba_8888_sse2+0xfa>
PUBLIC _sk_clamp_0_sse2
_sk_clamp_0_sse2 LABEL PROC
@@ -46244,10 +46613,10 @@ _sk_clamp_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 1e12 <_sk_clamp_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 1e2b <_sk_clamp_1_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,160,110,118,0,0 ; movaps 0x766e(%eax),%xmm4
+ DB 15,40,160,229,119,0,0 ; movaps 0x77e5(%eax),%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
DB 15,93,204 ; minps %xmm4,%xmm1
DB 15,93,212 ; minps %xmm4,%xmm2
@@ -46266,10 +46635,10 @@ _sk_clamp_a_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 1e45 <_sk_clamp_a_sse2+0xb>
+ DB 232,0,0,0,0 ; call 1e5e <_sk_clamp_a_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,93,152,75,118,0,0 ; minps 0x764b(%eax),%xmm3
+ DB 15,93,152,194,119,0,0 ; minps 0x77c2(%eax),%xmm3
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -46287,12 +46656,12 @@ _sk_clamp_a_dst_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 1e75 <_sk_clamp_a_dst_sse2+0xb>
+ DB 232,0,0,0,0 ; call 1e8e <_sk_clamp_a_dst_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 15,40,98,64 ; movaps 0x40(%edx),%xmm4
- DB 15,93,160,43,118,0,0 ; minps 0x762b(%eax),%xmm4
+ DB 15,93,160,162,119,0,0 ; minps 0x77a2(%eax),%xmm4
DB 15,41,98,64 ; movaps %xmm4,0x40(%edx)
DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5
DB 15,93,236 ; minps %xmm4,%xmm5
@@ -46357,10 +46726,10 @@ _sk_invert_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 1f20 <_sk_invert_sse2+0xb>
+ DB 232,0,0,0,0 ; call 1f39 <_sk_invert_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,160,144,117,0,0 ; movaps 0x7590(%eax),%xmm4
+ DB 15,40,160,7,119,0,0 ; movaps 0x7707(%eax),%xmm4
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,92,232 ; subps %xmm0,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
@@ -46469,11 +46838,11 @@ _sk_unpremul_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 201e <_sk_unpremul_sse2+0xb>
+ DB 232,0,0,0,0 ; call 2037 <_sk_unpremul_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 15,40,168,162,116,0,0 ; movaps 0x74a2(%eax),%xmm5
+ DB 15,40,168,25,118,0,0 ; movaps 0x7619(%eax),%xmm5
DB 15,94,235 ; divps %xmm3,%xmm5
DB 15,194,227,4 ; cmpneqps %xmm3,%xmm4
DB 15,84,229 ; andps %xmm5,%xmm4
@@ -46498,23 +46867,23 @@ _sk_from_srgb_sse2 LABEL PROC
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,40,217 ; movaps %xmm1,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 2068 <_sk_from_srgb_sse2+0x18>
+ DB 232,0,0,0,0 ; call 2081 <_sk_from_srgb_sse2+0x18>
DB 88 ; pop %eax
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,201 ; mulps %xmm1,%xmm1
- DB 15,40,160,120,116,0,0 ; movaps 0x7478(%eax),%xmm4
+ DB 15,40,160,239,117,0,0 ; movaps 0x75ef(%eax),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,176,136,116,0,0 ; movaps 0x7488(%eax),%xmm6
+ DB 15,40,176,255,117,0,0 ; movaps 0x75ff(%eax),%xmm6
DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp)
DB 15,88,198 ; addps %xmm6,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,176,104,116,0,0 ; movaps 0x7468(%eax),%xmm6
+ DB 15,40,176,223,117,0,0 ; movaps 0x75df(%eax),%xmm6
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,40,184,152,116,0,0 ; movaps 0x7498(%eax),%xmm7
+ DB 15,40,184,15,118,0,0 ; movaps 0x760f(%eax),%xmm7
DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,184,168,116,0,0 ; movaps 0x74a8(%eax),%xmm7
+ DB 15,40,184,31,118,0,0 ; movaps 0x761f(%eax),%xmm7
DB 15,194,215,1 ; cmpltps %xmm7,%xmm2
DB 15,84,202 ; andps %xmm2,%xmm1
DB 15,85,208 ; andnps %xmm0,%xmm2
@@ -46566,24 +46935,24 @@ _sk_from_srgb_dst_sse2 LABEL PROC
DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp)
- DB 232,0,0,0,0 ; call 2143 <_sk_from_srgb_dst_sse2+0x1b>
+ DB 232,0,0,0,0 ; call 215c <_sk_from_srgb_dst_sse2+0x1b>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,16 ; movaps 0x10(%eax),%xmm1
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,40,161,237,115,0,0 ; movaps 0x73ed(%ecx),%xmm4
+ DB 15,40,161,100,117,0,0 ; movaps 0x7564(%ecx),%xmm4
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,177,253,115,0,0 ; movaps 0x73fd(%ecx),%xmm6
+ DB 15,40,177,116,117,0,0 ; movaps 0x7574(%ecx),%xmm6
DB 15,88,198 ; addps %xmm6,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,169,221,115,0,0 ; movaps 0x73dd(%ecx),%xmm5
+ DB 15,40,169,84,117,0,0 ; movaps 0x7554(%ecx),%xmm5
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,40,185,13,116,0,0 ; movaps 0x740d(%ecx),%xmm7
+ DB 15,40,185,132,117,0,0 ; movaps 0x7584(%ecx),%xmm7
DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,153,29,116,0,0 ; movaps 0x741d(%ecx),%xmm3
+ DB 15,40,153,148,117,0,0 ; movaps 0x7594(%ecx),%xmm3
DB 15,194,203,1 ; cmpltps %xmm3,%xmm1
DB 15,84,209 ; andps %xmm1,%xmm2
DB 15,85,200 ; andnps %xmm0,%xmm1
@@ -46640,28 +47009,28 @@ _sk_to_srgb_sse2 LABEL PROC
DB 15,40,250 ; movaps %xmm2,%xmm7
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 222e <_sk_to_srgb_sse2+0x18>
+ DB 232,0,0,0,0 ; call 2247 <_sk_to_srgb_sse2+0x18>
DB 88 ; pop %eax
DB 15,82,218 ; rsqrtps %xmm2,%xmm3
- DB 15,40,160,82,115,0,0 ; movaps 0x7352(%eax),%xmm4
+ DB 15,40,160,201,116,0,0 ; movaps 0x74c9(%eax),%xmm4
DB 15,40,235 ; movaps %xmm3,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,40,128,98,115,0,0 ; movaps 0x7362(%eax),%xmm0
+ DB 15,40,128,217,116,0,0 ; movaps 0x74d9(%eax),%xmm0
DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp)
DB 15,88,232 ; addps %xmm0,%xmm5
DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,40,128,114,115,0,0 ; movaps 0x7372(%eax),%xmm0
+ DB 15,40,128,233,116,0,0 ; movaps 0x74e9(%eax),%xmm0
DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,128,130,115,0,0 ; movaps 0x7382(%eax),%xmm0
+ DB 15,40,128,249,116,0,0 ; movaps 0x74f9(%eax),%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 15,88,216 ; addps %xmm0,%xmm3
DB 15,83,195 ; rcpps %xmm3,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,168,66,115,0,0 ; movaps 0x7342(%eax),%xmm5
+ DB 15,40,168,185,116,0,0 ; movaps 0x74b9(%eax),%xmm5
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,40,152,146,115,0,0 ; movaps 0x7392(%eax),%xmm3
+ DB 15,40,152,9,117,0,0 ; movaps 0x7509(%eax),%xmm3
DB 15,194,211,1 ; cmpltps %xmm3,%xmm2
DB 15,84,202 ; andps %xmm2,%xmm1
DB 15,85,208 ; andnps %xmm0,%xmm2
@@ -46716,60 +47085,62 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
DB 15,40,249 ; movaps %xmm1,%xmm7
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 2325 <_sk_rgb_to_hsl_sse2+0x15>
+ DB 232,0,0,0,0 ; call 233e <_sk_rgb_to_hsl_sse2+0x15>
DB 88 ; pop %eax
- DB 15,40,204 ; movaps %xmm4,%xmm1
- DB 15,95,207 ; maxps %xmm7,%xmm1
- DB 15,95,202 ; maxps %xmm2,%xmm1
+ DB 15,40,199 ; movaps %xmm7,%xmm0
+ DB 15,95,194 ; maxps %xmm2,%xmm0
DB 15,40,220 ; movaps %xmm4,%xmm3
- DB 15,93,223 ; minps %xmm7,%xmm3
- DB 15,93,218 ; minps %xmm2,%xmm3
- DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
- DB 15,40,193 ; movaps %xmm1,%xmm0
- DB 15,92,195 ; subps %xmm3,%xmm0
+ DB 15,95,216 ; maxps %xmm0,%xmm3
+ DB 15,40,199 ; movaps %xmm7,%xmm0
+ DB 15,93,194 ; minps %xmm2,%xmm0
+ DB 15,40,204 ; movaps %xmm4,%xmm1
+ DB 15,93,200 ; minps %xmm0,%xmm1
+ DB 15,41,77,232 ; movaps %xmm1,-0x18(%ebp)
+ DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 15,92,193 ; subps %xmm1,%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
- DB 15,40,152,171,114,0,0 ; movaps 0x72ab(%eax),%xmm3
- DB 15,94,216 ; divps %xmm0,%xmm3
+ DB 15,40,136,34,116,0,0 ; movaps 0x7422(%eax),%xmm1
+ DB 15,94,200 ; divps %xmm0,%xmm1
DB 15,40,199 ; movaps %xmm7,%xmm0
DB 15,92,194 ; subps %xmm2,%xmm0
- DB 15,89,195 ; mulps %xmm3,%xmm0
+ DB 15,89,193 ; mulps %xmm1,%xmm0
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,194,234,1 ; cmpltps %xmm2,%xmm5
- DB 15,84,168,187,114,0,0 ; andps 0x72bb(%eax),%xmm5
+ DB 15,84,168,50,116,0,0 ; andps 0x7432(%eax),%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,193 ; movaps %xmm1,%xmm0
+ DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,194,196,0 ; cmpeqps %xmm4,%xmm0
- DB 15,40,241 ; movaps %xmm1,%xmm6
+ DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,194,247,0 ; cmpeqps %xmm7,%xmm6
DB 15,92,212 ; subps %xmm4,%xmm2
DB 15,92,231 ; subps %xmm7,%xmm4
- DB 15,89,211 ; mulps %xmm3,%xmm2
- DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,40,152,203,114,0,0 ; movaps 0x72cb(%eax),%xmm3
- DB 15,88,211 ; addps %xmm3,%xmm2
- DB 15,88,160,219,114,0,0 ; addps 0x72db(%eax),%xmm4
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 15,89,225 ; mulps %xmm1,%xmm4
+ DB 15,40,136,66,116,0,0 ; movaps 0x7442(%eax),%xmm1
+ DB 15,88,209 ; addps %xmm1,%xmm2
+ DB 15,88,160,82,116,0,0 ; addps 0x7452(%eax),%xmm4
DB 15,84,214 ; andps %xmm6,%xmm2
DB 15,85,244 ; andnps %xmm4,%xmm6
DB 15,86,242 ; orps %xmm2,%xmm6
DB 15,84,232 ; andps %xmm0,%xmm5
DB 15,85,198 ; andnps %xmm6,%xmm0
DB 15,86,197 ; orps %xmm5,%xmm0
- DB 15,40,225 ; movaps %xmm1,%xmm4
+ DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,40,85,232 ; movaps -0x18(%ebp),%xmm2
DB 15,194,226,4 ; cmpneqps %xmm2,%xmm4
- DB 15,92,217 ; subps %xmm1,%xmm3
- DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,40,168,251,114,0,0 ; movaps 0x72fb(%eax),%xmm5
- DB 15,92,218 ; subps %xmm2,%xmm3
- DB 15,40,209 ; movaps %xmm1,%xmm2
+ DB 15,92,203 ; subps %xmm3,%xmm1
+ DB 15,88,218 ; addps %xmm2,%xmm3
+ DB 15,40,168,114,116,0,0 ; movaps 0x7472(%eax),%xmm5
+ DB 15,92,202 ; subps %xmm2,%xmm1
+ DB 15,40,211 ; movaps %xmm3,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 15,194,234,1 ; cmpltps %xmm2,%xmm5
- DB 15,84,221 ; andps %xmm5,%xmm3
- DB 15,85,233 ; andnps %xmm1,%xmm5
- DB 15,86,235 ; orps %xmm3,%xmm5
+ DB 15,84,205 ; andps %xmm5,%xmm1
+ DB 15,85,235 ; andnps %xmm3,%xmm5
+ DB 15,86,233 ; orps %xmm1,%xmm5
DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
DB 15,94,205 ; divps %xmm5,%xmm1
- DB 15,89,128,235,114,0,0 ; mulps 0x72eb(%eax),%xmm0
+ DB 15,89,128,98,116,0,0 ; mulps 0x7462(%eax),%xmm0
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,84,204 ; andps %xmm4,%xmm1
DB 139,69,12 ; mov 0xc(%ebp),%eax
@@ -46790,9 +47161,9 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 129,236,200,0,0,0 ; sub $0xc8,%esp
DB 15,41,157,56,255,255,255 ; movaps %xmm3,-0xc8(%ebp)
DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
- DB 232,0,0,0,0 ; call 241a <_sk_hsl_to_rgb_sse2+0x19>
+ DB 232,0,0,0,0 ; call 2439 <_sk_hsl_to_rgb_sse2+0x19>
DB 88 ; pop %eax
- DB 15,40,160,22,114,0,0 ; movaps 0x7216(%eax),%xmm4
+ DB 15,40,160,135,115,0,0 ; movaps 0x7387(%eax),%xmm4
DB 15,40,220 ; movaps %xmm4,%xmm3
DB 15,41,165,104,255,255,255 ; movaps %xmm4,-0x98(%ebp)
DB 15,194,218,2 ; cmpleps %xmm2,%xmm3
@@ -46805,13 +47176,13 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,84,243 ; andps %xmm3,%xmm6
DB 15,85,217 ; andnps %xmm1,%xmm3
DB 15,86,222 ; orps %xmm6,%xmm3
- DB 15,40,168,38,114,0,0 ; movaps 0x7226(%eax),%xmm5
+ DB 15,40,168,151,115,0,0 ; movaps 0x7397(%eax),%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
DB 243,15,91,205 ; cvttps2dq %xmm5,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,193,1 ; cmpltps %xmm1,%xmm0
- DB 15,40,176,54,114,0,0 ; movaps 0x7236(%eax),%xmm6
+ DB 15,40,176,167,115,0,0 ; movaps 0x73a7(%eax),%xmm6
DB 15,41,117,136 ; movaps %xmm6,-0x78(%ebp)
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,200 ; subps %xmm0,%xmm1
@@ -46821,19 +47192,19 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
DB 15,88,210 ; addps %xmm2,%xmm2
DB 15,92,211 ; subps %xmm3,%xmm2
- DB 15,40,184,70,114,0,0 ; movaps 0x7246(%eax),%xmm7
+ DB 15,40,184,183,115,0,0 ; movaps 0x73b7(%eax),%xmm7
DB 15,41,189,88,255,255,255 ; movaps %xmm7,-0xa8(%ebp)
DB 15,194,253,2 ; cmpleps %xmm5,%xmm7
DB 15,92,218 ; subps %xmm2,%xmm3
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
DB 15,40,204 ; movaps %xmm4,%xmm1
DB 15,194,205,2 ; cmpleps %xmm5,%xmm1
- DB 15,40,160,118,114,0,0 ; movaps 0x7276(%eax),%xmm4
+ DB 15,40,160,231,115,0,0 ; movaps 0x73e7(%eax),%xmm4
DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp)
DB 15,194,229,2 ; cmpleps %xmm5,%xmm4
- DB 15,40,176,86,114,0,0 ; movaps 0x7256(%eax),%xmm6
+ DB 15,40,176,199,115,0,0 ; movaps 0x73c7(%eax),%xmm6
DB 15,89,238 ; mulps %xmm6,%xmm5
- DB 15,40,128,102,114,0,0 ; movaps 0x7266(%eax),%xmm0
+ DB 15,40,128,215,115,0,0 ; movaps 0x73d7(%eax),%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
DB 15,92,197 ; subps %xmm5,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
@@ -46859,18 +47230,18 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,194,200,1 ; cmpltps %xmm0,%xmm1
- DB 15,84,136,54,114,0,0 ; andps 0x7236(%eax),%xmm1
+ DB 15,84,136,167,115,0,0 ; andps 0x73a7(%eax),%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,92,200 ; subps %xmm0,%xmm1
- DB 15,40,128,70,114,0,0 ; movaps 0x7246(%eax),%xmm0
+ DB 15,40,128,183,115,0,0 ; movaps 0x73b7(%eax),%xmm0
DB 15,194,193,2 ; cmpleps %xmm1,%xmm0
- DB 15,40,152,22,114,0,0 ; movaps 0x7216(%eax),%xmm3
+ DB 15,40,152,135,115,0,0 ; movaps 0x7387(%eax),%xmm3
DB 15,194,217,2 ; cmpleps %xmm1,%xmm3
- DB 15,40,160,118,114,0,0 ; movaps 0x7276(%eax),%xmm4
+ DB 15,40,160,231,115,0,0 ; movaps 0x73e7(%eax),%xmm4
DB 15,194,225,2 ; cmpleps %xmm1,%xmm4
DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,40,168,102,114,0,0 ; movaps 0x7266(%eax),%xmm5
+ DB 15,40,168,215,115,0,0 ; movaps 0x73d7(%eax),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,89,239 ; mulps %xmm7,%xmm5
DB 15,88,234 ; addps %xmm2,%xmm5
@@ -46890,7 +47261,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,125,232 ; movaps -0x18(%ebp),%xmm7
DB 15,85,252 ; andnps %xmm4,%xmm7
DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
- DB 15,88,152,134,114,0,0 ; addps 0x7286(%eax),%xmm3
+ DB 15,88,152,247,115,0,0 ; addps 0x73f7(%eax),%xmm3
DB 243,15,91,195 ; cvttps2dq %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
@@ -46973,7 +47344,7 @@ _sk_scale_u8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 2694 <_sk_scale_u8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 26b3 <_sk_scale_u8_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -46984,13 +47355,13 @@ _sk_scale_u8_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,65 ; jne 26f0 <_sk_scale_u8_sse2+0x6a>
+ DB 117,65 ; jne 270f <_sk_scale_u8_sse2+0x6a>
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,28,112,0,0 ; pand 0x701c(%edx),%xmm4
+ DB 102,15,219,162,141,113,0,0 ; pand 0x718d(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,44,112,0,0 ; mulps 0x702c(%edx),%xmm4
+ DB 15,89,162,157,113,0,0 ; mulps 0x719d(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 15,89,212 ; mulps %xmm4,%xmm2
@@ -47009,12 +47380,12 @@ _sk_scale_u8_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 272a <_sk_scale_u8_sse2+0xa4>
+ DB 116,50 ; je 2749 <_sk_scale_u8_sse2+0xa4>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 2714 <_sk_scale_u8_sse2+0x8e>
+ DB 116,19 ; je 2733 <_sk_scale_u8_sse2+0x8e>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,182 ; jne 26bc <_sk_scale_u8_sse2+0x36>
+ DB 117,182 ; jne 26db <_sk_scale_u8_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -47023,10 +47394,98 @@ _sk_scale_u8_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,146 ; jmp 26bc <_sk_scale_u8_sse2+0x36>
+ DB 235,146 ; jmp 26db <_sk_scale_u8_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 235,136 ; jmp 26bc <_sk_scale_u8_sse2+0x36>
+ DB 235,136 ; jmp 26db <_sk_scale_u8_sse2+0x36>
+
+PUBLIC _sk_scale_565_sse2
+_sk_scale_565_sse2 LABEL PROC
+ DB 85 ; push %ebp
+ DB 137,229 ; mov %esp,%ebp
+ DB 83 ; push %ebx
+ DB 87 ; push %edi
+ DB 86 ; push %esi
+ DB 131,236,44 ; sub $0x2c,%esp
+ DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
+ DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
+ DB 102,15,111,200 ; movdqa %xmm0,%xmm1
+ DB 232,0,0,0,0 ; call 276d <_sk_scale_565_sse2+0x1a>
+ DB 90 ; pop %edx
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,77,8 ; mov 0x8(%ebp),%ecx
+ DB 139,56 ; mov (%eax),%edi
+ DB 139,119,4 ; mov 0x4(%edi),%esi
+ DB 15,175,113,4 ; imul 0x4(%ecx),%esi
+ DB 1,246 ; add %esi,%esi
+ DB 3,55 ; add (%edi),%esi
+ DB 139,89,8 ; mov 0x8(%ecx),%ebx
+ DB 133,219 ; test %ebx,%ebx
+ DB 139,57 ; mov (%ecx),%edi
+ DB 15,133,157,0,0,0 ; jne 282b <_sk_scale_565_sse2+0xd8>
+ DB 243,15,126,52,126 ; movq (%esi,%edi,2),%xmm6
+ DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
+ DB 102,15,111,162,243,112,0,0 ; movdqa 0x70f3(%edx),%xmm4
+ DB 102,15,219,230 ; pand %xmm6,%xmm4
+ DB 15,91,212 ; cvtdq2ps %xmm4,%xmm2
+ DB 15,89,146,3,113,0,0 ; mulps 0x7103(%edx),%xmm2
+ DB 102,15,111,170,19,113,0,0 ; movdqa 0x7113(%edx),%xmm5
+ DB 102,15,219,238 ; pand %xmm6,%xmm5
+ DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
+ DB 15,89,170,35,113,0,0 ; mulps 0x7123(%edx),%xmm5
+ DB 102,15,219,178,51,113,0,0 ; pand 0x7133(%edx),%xmm6
+ DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
+ DB 15,89,178,67,113,0,0 ; mulps 0x7143(%edx),%xmm6
+ DB 15,40,253 ; movaps %xmm5,%xmm7
+ DB 15,93,254 ; minps %xmm6,%xmm7
+ DB 15,40,226 ; movaps %xmm2,%xmm4
+ DB 15,93,231 ; minps %xmm7,%xmm4
+ DB 15,40,253 ; movaps %xmm5,%xmm7
+ DB 15,95,254 ; maxps %xmm6,%xmm7
+ DB 15,40,194 ; movaps %xmm2,%xmm0
+ DB 15,95,199 ; maxps %xmm7,%xmm0
+ DB 15,40,251 ; movaps %xmm3,%xmm7
+ DB 15,194,121,64,1 ; cmpltps 0x40(%ecx),%xmm7
+ DB 15,84,231 ; andps %xmm7,%xmm4
+ DB 15,85,248 ; andnps %xmm0,%xmm7
+ DB 15,86,252 ; orps %xmm4,%xmm7
+ DB 15,89,209 ; mulps %xmm1,%xmm2
+ DB 15,89,109,216 ; mulps -0x28(%ebp),%xmm5
+ DB 15,89,117,200 ; mulps -0x38(%ebp),%xmm6
+ DB 15,89,251 ; mulps %xmm3,%xmm7
+ DB 141,80,8 ; lea 0x8(%eax),%edx
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,194 ; movaps %xmm2,%xmm0
+ DB 15,40,205 ; movaps %xmm5,%xmm1
+ DB 15,40,214 ; movaps %xmm6,%xmm2
+ DB 15,40,223 ; movaps %xmm7,%xmm3
+ DB 82 ; push %edx
+ DB 81 ; push %ecx
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,60 ; add $0x3c,%esp
+ DB 94 ; pop %esi
+ DB 95 ; pop %edi
+ DB 91 ; pop %ebx
+ DB 93 ; pop %ebp
+ DB 195 ; ret
+ DB 128,227,3 ; and $0x3,%bl
+ DB 128,251,1 ; cmp $0x1,%bl
+ DB 116,50 ; je 2865 <_sk_scale_565_sse2+0x112>
+ DB 102,15,239,246 ; pxor %xmm6,%xmm6
+ DB 128,251,2 ; cmp $0x2,%bl
+ DB 116,23 ; je 2853 <_sk_scale_565_sse2+0x100>
+ DB 128,251,3 ; cmp $0x3,%bl
+ DB 15,133,82,255,255,255 ; jne 2797 <_sk_scale_565_sse2+0x44>
+ DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
+ DB 102,15,110,227 ; movd %ebx,%xmm4
+ DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
+ DB 102,15,110,36,126 ; movd (%esi,%edi,2),%xmm4
+ DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
+ DB 242,15,16,244 ; movsd %xmm4,%xmm6
+ DB 233,50,255,255,255 ; jmp 2797 <_sk_scale_565_sse2+0x44>
+ DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
+ DB 102,15,110,246 ; movd %esi,%xmm6
+ DB 233,37,255,255,255 ; jmp 2797 <_sk_scale_565_sse2+0x44>
PUBLIC _sk_lerp_1_float_sse2
_sk_lerp_1_float_sse2 LABEL PROC
@@ -47071,7 +47530,7 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 279c <_sk_lerp_u8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 28da <_sk_lerp_u8_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -47082,13 +47541,13 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,102 ; jne 281d <_sk_lerp_u8_sse2+0x8f>
+ DB 117,102 ; jne 295b <_sk_lerp_u8_sse2+0x8f>
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,52,111,0,0 ; pand 0x6f34(%edx),%xmm4
+ DB 102,15,219,162,230,111,0,0 ; pand 0x6fe6(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,68,111,0,0 ; mulps 0x6f44(%edx),%xmm4
+ DB 15,89,162,246,111,0,0 ; mulps 0x6ff6(%edx),%xmm4
DB 15,40,105,16 ; movaps 0x10(%ecx),%xmm5
DB 15,40,113,32 ; movaps 0x20(%ecx),%xmm6
DB 15,92,197 ; subps %xmm5,%xmm0
@@ -47118,12 +47577,12 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,53 ; je 285a <_sk_lerp_u8_sse2+0xcc>
+ DB 116,53 ; je 2998 <_sk_lerp_u8_sse2+0xcc>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 2841 <_sk_lerp_u8_sse2+0xb3>
+ DB 116,19 ; je 297f <_sk_lerp_u8_sse2+0xb3>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,145 ; jne 27c4 <_sk_lerp_u8_sse2+0x36>
+ DB 117,145 ; jne 2902 <_sk_lerp_u8_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -47132,10 +47591,10 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,106,255,255,255 ; jmp 27c4 <_sk_lerp_u8_sse2+0x36>
+ DB 233,106,255,255,255 ; jmp 2902 <_sk_lerp_u8_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 233,93,255,255,255 ; jmp 27c4 <_sk_lerp_u8_sse2+0x36>
+ DB 233,93,255,255,255 ; jmp 2902 <_sk_lerp_u8_sse2+0x36>
PUBLIC _sk_lerp_565_sse2
_sk_lerp_565_sse2 LABEL PROC
@@ -47144,8 +47603,12 @@ _sk_lerp_565_sse2 LABEL PROC
DB 83 ; push %ebx
DB 87 ; push %edi
DB 86 ; push %esi
- DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 2875 <_sk_lerp_565_sse2+0xe>
+ DB 131,236,108 ; sub $0x6c,%esp
+ DB 15,41,93,168 ; movaps %xmm3,-0x58(%ebp)
+ DB 15,41,85,136 ; movaps %xmm2,-0x78(%ebp)
+ DB 15,41,77,152 ; movaps %xmm1,-0x68(%ebp)
+ DB 102,15,127,69,184 ; movdqa %xmm0,-0x48(%ebp)
+ DB 232,0,0,0,0 ; call 29c4 <_sk_lerp_565_sse2+0x1f>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -47157,49 +47620,62 @@ _sk_lerp_565_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,163,0,0,0 ; jne 2939 <_sk_lerp_565_sse2+0xd2>
- DB 243,15,126,52,126 ; movq (%esi,%edi,2),%xmm6
- DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,111,162,123,110,0,0 ; movdqa 0x6e7b(%edx),%xmm4
- DB 102,15,219,230 ; pand %xmm6,%xmm4
- DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,139,110,0,0 ; mulps 0x6e8b(%edx),%xmm4
- DB 102,15,111,170,155,110,0,0 ; movdqa 0x6e9b(%edx),%xmm5
- DB 102,15,219,238 ; pand %xmm6,%xmm5
- DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,171,110,0,0 ; mulps 0x6eab(%edx),%xmm5
- DB 102,15,219,178,187,110,0,0 ; pand 0x6ebb(%edx),%xmm6
+ DB 15,133,211,0,0,0 ; jne 2ab8 <_sk_lerp_565_sse2+0x113>
+ DB 243,15,126,44,126 ; movq (%esi,%edi,2),%xmm5
+ DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
+ DB 102,15,111,162,28,111,0,0 ; movdqa 0x6f1c(%edx),%xmm4
+ DB 102,15,219,229 ; pand %xmm5,%xmm4
+ DB 15,91,204 ; cvtdq2ps %xmm4,%xmm1
+ DB 15,89,138,44,111,0,0 ; mulps 0x6f2c(%edx),%xmm1
+ DB 102,15,111,178,60,111,0,0 ; movdqa 0x6f3c(%edx),%xmm6
+ DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,178,203,110,0,0 ; mulps 0x6ecb(%edx),%xmm6
- DB 15,40,121,16 ; movaps 0x10(%ecx),%xmm7
- DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,121,32 ; movaps 0x20(%ecx),%xmm7
- DB 15,92,207 ; subps %xmm7,%xmm1
- DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,88,207 ; addps %xmm7,%xmm1
- DB 15,40,121,48 ; movaps 0x30(%ecx),%xmm7
- DB 15,92,215 ; subps %xmm7,%xmm2
- DB 15,89,214 ; mulps %xmm6,%xmm2
- DB 15,88,215 ; addps %xmm7,%xmm2
- DB 15,40,121,64 ; movaps 0x40(%ecx),%xmm7
- DB 15,92,223 ; subps %xmm7,%xmm3
- DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 15,88,231 ; addps %xmm7,%xmm4
- DB 15,88,239 ; addps %xmm7,%xmm5
- DB 15,88,223 ; addps %xmm7,%xmm3
- DB 15,95,235 ; maxps %xmm3,%xmm5
- DB 15,95,229 ; maxps %xmm5,%xmm4
+ DB 15,89,178,76,111,0,0 ; mulps 0x6f4c(%edx),%xmm6
+ DB 102,15,219,170,92,111,0,0 ; pand 0x6f5c(%edx),%xmm5
+ DB 15,91,213 ; cvtdq2ps %xmm5,%xmm2
+ DB 15,89,146,108,111,0,0 ; mulps 0x6f6c(%edx),%xmm2
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
+ DB 15,40,254 ; movaps %xmm6,%xmm7
+ DB 15,40,65,32 ; movaps 0x20(%ecx),%xmm0
+ DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
+ DB 15,40,101,152 ; movaps -0x68(%ebp),%xmm4
+ DB 15,92,224 ; subps %xmm0,%xmm4
+ DB 15,89,230 ; mulps %xmm6,%xmm4
+ DB 15,93,243 ; minps %xmm3,%xmm6
+ DB 15,40,209 ; movaps %xmm1,%xmm2
+ DB 15,40,65,16 ; movaps 0x10(%ecx),%xmm0
+ DB 15,40,109,184 ; movaps -0x48(%ebp),%xmm5
+ DB 15,92,232 ; subps %xmm0,%xmm5
+ DB 15,89,233 ; mulps %xmm1,%xmm5
+ DB 15,93,206 ; minps %xmm6,%xmm1
+ DB 15,40,113,64 ; movaps 0x40(%ecx),%xmm6
+ DB 15,95,251 ; maxps %xmm3,%xmm7
+ DB 15,95,215 ; maxps %xmm7,%xmm2
+ DB 15,40,93,168 ; movaps -0x58(%ebp),%xmm3
+ DB 15,40,251 ; movaps %xmm3,%xmm7
+ DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
+ DB 15,84,207 ; andps %xmm7,%xmm1
+ DB 15,85,250 ; andnps %xmm2,%xmm7
+ DB 15,86,249 ; orps %xmm1,%xmm7
+ DB 15,88,232 ; addps %xmm0,%xmm5
+ DB 15,88,101,216 ; addps -0x28(%ebp),%xmm4
+ DB 15,40,65,48 ; movaps 0x30(%ecx),%xmm0
+ DB 15,40,85,136 ; movaps -0x78(%ebp),%xmm2
+ DB 15,92,208 ; subps %xmm0,%xmm2
+ DB 15,89,85,200 ; mulps -0x38(%ebp),%xmm2
+ DB 15,88,208 ; addps %xmm0,%xmm2
+ DB 15,92,222 ; subps %xmm6,%xmm3
+ DB 15,89,223 ; mulps %xmm7,%xmm3
+ DB 15,88,222 ; addps %xmm6,%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,220 ; movaps %xmm4,%xmm3
+ DB 15,40,197 ; movaps %xmm5,%xmm0
+ DB 15,40,204 ; movaps %xmm4,%xmm1
DB 82 ; push %edx
DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
- DB 131,196,28 ; add $0x1c,%esp
+ DB 131,196,124 ; add $0x7c,%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
DB 91 ; pop %ebx
@@ -47207,22 +47683,22 @@ _sk_lerp_565_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 2973 <_sk_lerp_565_sse2+0x10c>
- DB 102,15,239,246 ; pxor %xmm6,%xmm6
+ DB 116,50 ; je 2af2 <_sk_lerp_565_sse2+0x14d>
+ DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,23 ; je 2961 <_sk_lerp_565_sse2+0xfa>
+ DB 116,23 ; je 2ae0 <_sk_lerp_565_sse2+0x13b>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,76,255,255,255 ; jne 289f <_sk_lerp_565_sse2+0x38>
+ DB 15,133,28,255,255,255 ; jne 29ee <_sk_lerp_565_sse2+0x49>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
- DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
+ DB 102,15,112,236,69 ; pshufd $0x45,%xmm4,%xmm5
DB 102,15,110,36,126 ; movd (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 242,15,16,244 ; movsd %xmm4,%xmm6
- DB 233,44,255,255,255 ; jmp 289f <_sk_lerp_565_sse2+0x38>
+ DB 242,15,16,236 ; movsd %xmm4,%xmm5
+ DB 233,252,254,255,255 ; jmp 29ee <_sk_lerp_565_sse2+0x49>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
- DB 102,15,110,246 ; movd %esi,%xmm6
- DB 233,31,255,255,255 ; jmp 289f <_sk_lerp_565_sse2+0x38>
+ DB 102,15,110,238 ; movd %esi,%xmm5
+ DB 233,239,254,255,255 ; jmp 29ee <_sk_lerp_565_sse2+0x49>
PUBLIC _sk_load_tables_sse2
_sk_load_tables_sse2 LABEL PROC
@@ -47232,7 +47708,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 298e <_sk_load_tables_sse2+0xe>
+ DB 232,0,0,0,0 ; call 2b0d <_sk_load_tables_sse2+0xe>
DB 90 ; pop %edx
DB 139,117,12 ; mov 0xc(%ebp),%esi
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -47241,9 +47717,9 @@ _sk_load_tables_sse2 LABEL PROC
DB 133,192 ; test %eax,%eax
DB 139,54 ; mov (%esi),%esi
DB 139,30 ; mov (%esi),%ebx
- DB 15,133,19,1,0,0 ; jne 2ab9 <_sk_load_tables_sse2+0x139>
+ DB 15,133,19,1,0,0 ; jne 2c38 <_sk_load_tables_sse2+0x139>
DB 243,15,111,28,187 ; movdqu (%ebx,%edi,4),%xmm3
- DB 102,15,111,146,194,109,0,0 ; movdqa 0x6dc2(%edx),%xmm2
+ DB 102,15,111,146,51,110,0,0 ; movdqa 0x6e33(%edx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
@@ -47299,7 +47775,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 15,20,215 ; unpcklps %xmm7,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,210,109,0,0 ; mulps 0x6dd2(%edx),%xmm3
+ DB 15,89,154,67,110,0,0 ; mulps 0x6e43(%edx),%xmm3
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 137,194 ; mov %eax,%edx
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -47315,18 +47791,18 @@ _sk_load_tables_sse2 LABEL PROC
DB 195 ; ret
DB 36,3 ; and $0x3,%al
DB 60,1 ; cmp $0x1,%al
- DB 116,37 ; je 2ae4 <_sk_load_tables_sse2+0x164>
+ DB 116,37 ; je 2c63 <_sk_load_tables_sse2+0x164>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 60,2 ; cmp $0x2,%al
- DB 116,19 ; je 2ada <_sk_load_tables_sse2+0x15a>
+ DB 116,19 ; je 2c59 <_sk_load_tables_sse2+0x15a>
DB 60,3 ; cmp $0x3,%al
- DB 15,133,220,254,255,255 ; jne 29ab <_sk_load_tables_sse2+0x2b>
+ DB 15,133,220,254,255,255 ; jne 2b2a <_sk_load_tables_sse2+0x2b>
DB 102,15,110,68,187,8 ; movd 0x8(%ebx,%edi,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,18,28,187 ; movlpd (%ebx,%edi,4),%xmm3
- DB 233,199,254,255,255 ; jmp 29ab <_sk_load_tables_sse2+0x2b>
+ DB 233,199,254,255,255 ; jmp 2b2a <_sk_load_tables_sse2+0x2b>
DB 102,15,110,28,187 ; movd (%ebx,%edi,4),%xmm3
- DB 233,189,254,255,255 ; jmp 29ab <_sk_load_tables_sse2+0x2b>
+ DB 233,189,254,255,255 ; jmp 2b2a <_sk_load_tables_sse2+0x2b>
PUBLIC _sk_load_tables_u16_be_sse2
_sk_load_tables_u16_be_sse2 LABEL PROC
@@ -47336,7 +47812,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,44 ; sub $0x2c,%esp
- DB 232,0,0,0,0 ; call 2afc <_sk_load_tables_u16_be_sse2+0xe>
+ DB 232,0,0,0,0 ; call 2c7b <_sk_load_tables_u16_be_sse2+0xe>
DB 90 ; pop %edx
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
@@ -47347,7 +47823,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 139,57 ; mov (%ecx),%edi
DB 139,15 ; mov (%edi),%ecx
DB 190,255,0,255,0 ; mov $0xff00ff,%esi
- DB 15,133,166,1,0,0 ; jne 2cc2 <_sk_load_tables_u16_be_sse2+0x1d4>
+ DB 15,133,166,1,0,0 ; jne 2e41 <_sk_load_tables_u16_be_sse2+0x1d4>
DB 102,15,16,4,89 ; movupd (%ecx,%ebx,2),%xmm0
DB 243,15,111,76,89,16 ; movdqu 0x10(%ecx,%ebx,2),%xmm1
DB 102,15,40,216 ; movapd %xmm0,%xmm3
@@ -47444,7 +47920,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 243,15,126,93,208 ; movq -0x30(%ebp),%xmm3
DB 102,15,97,223 ; punpcklwd %xmm7,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,116,108,0,0 ; mulps 0x6c74(%edx),%xmm3
+ DB 15,89,154,229,108,0,0 ; mulps 0x6ce5(%edx),%xmm3
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 137,193 ; mov %eax,%ecx
DB 141,65,8 ; lea 0x8(%ecx),%eax
@@ -47461,12 +47937,12 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 242,15,16,4,89 ; movsd (%ecx,%ebx,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,248,1 ; cmp $0x1,%eax
- DB 15,132,83,254,255,255 ; je 2b27 <_sk_load_tables_u16_be_sse2+0x39>
+ DB 15,132,83,254,255,255 ; je 2ca6 <_sk_load_tables_u16_be_sse2+0x39>
DB 102,15,22,68,89,8 ; movhpd 0x8(%ecx,%ebx,2),%xmm0
DB 131,248,3 ; cmp $0x3,%eax
- DB 15,130,68,254,255,255 ; jb 2b27 <_sk_load_tables_u16_be_sse2+0x39>
+ DB 15,130,68,254,255,255 ; jb 2ca6 <_sk_load_tables_u16_be_sse2+0x39>
DB 243,15,126,76,89,16 ; movq 0x10(%ecx,%ebx,2),%xmm1
- DB 233,57,254,255,255 ; jmp 2b27 <_sk_load_tables_u16_be_sse2+0x39>
+ DB 233,57,254,255,255 ; jmp 2ca6 <_sk_load_tables_u16_be_sse2+0x39>
PUBLIC _sk_load_tables_rgb_u16_be_sse2
_sk_load_tables_rgb_u16_be_sse2 LABEL PROC
@@ -47476,7 +47952,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,28 ; sub $0x1c,%esp
- DB 232,0,0,0,0 ; call 2cfc <_sk_load_tables_rgb_u16_be_sse2+0xe>
+ DB 232,0,0,0,0 ; call 2e7b <_sk_load_tables_rgb_u16_be_sse2+0xe>
DB 88 ; pop %eax
DB 137,69,240 ; mov %eax,-0x10(%ebp)
DB 139,69,12 ; mov 0xc(%ebp),%eax
@@ -47487,7 +47963,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 139,56 ; mov (%eax),%edi
DB 139,7 ; mov (%edi),%eax
DB 190,255,0,255,0 ; mov $0xff00ff,%esi
- DB 15,133,141,1,0,0 ; jne 2eaa <_sk_load_tables_rgb_u16_be_sse2+0x1bc>
+ DB 15,133,141,1,0,0 ; jne 3029 <_sk_load_tables_rgb_u16_be_sse2+0x1bc>
DB 243,15,111,12,88 ; movdqu (%eax,%ebx,2),%xmm1
DB 243,15,111,92,88,8 ; movdqu 0x8(%eax,%ebx,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -47581,7 +48057,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 141,65,8 ; lea 0x8(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 139,85,240 ; mov -0x10(%ebp),%edx
- DB 15,40,162,132,106,0,0 ; movaps 0x6a84(%edx),%xmm4
+ DB 15,40,162,245,106,0,0 ; movaps 0x6af5(%edx),%xmm4
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,40,220 ; movaps %xmm4,%xmm3
DB 80 ; push %eax
@@ -47597,20 +48073,20 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,15,196,76,88,4,2 ; pinsrw $0x2,0x4(%eax,%ebx,2),%xmm1
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 131,249,1 ; cmp $0x1,%ecx
- DB 117,13 ; jne 2ecc <_sk_load_tables_rgb_u16_be_sse2+0x1de>
+ DB 117,13 ; jne 304b <_sk_load_tables_rgb_u16_be_sse2+0x1de>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,115,254,255,255 ; jmp 2d3f <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ DB 233,115,254,255,255 ; jmp 2ebe <_sk_load_tables_rgb_u16_be_sse2+0x51>
DB 102,15,110,68,88,6 ; movd 0x6(%eax,%ebx,2),%xmm0
DB 102,15,196,68,88,10,2 ; pinsrw $0x2,0xa(%eax,%ebx,2),%xmm0
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 131,249,3 ; cmp $0x3,%ecx
- DB 114,18 ; jb 2ef4 <_sk_load_tables_rgb_u16_be_sse2+0x206>
+ DB 114,18 ; jb 3073 <_sk_load_tables_rgb_u16_be_sse2+0x206>
DB 102,15,110,92,88,12 ; movd 0xc(%eax,%ebx,2),%xmm3
DB 102,15,196,92,88,16,2 ; pinsrw $0x2,0x10(%eax,%ebx,2),%xmm3
- DB 233,75,254,255,255 ; jmp 2d3f <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ DB 233,75,254,255,255 ; jmp 2ebe <_sk_load_tables_rgb_u16_be_sse2+0x51>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,66,254,255,255 ; jmp 2d3f <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ DB 233,66,254,255,255 ; jmp 2ebe <_sk_load_tables_rgb_u16_be_sse2+0x51>
PUBLIC _sk_byte_tables_sse2
_sk_byte_tables_sse2 LABEL PROC
@@ -47620,11 +48096,11 @@ _sk_byte_tables_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 2f0b <_sk_byte_tables_sse2+0xe>
+ DB 232,0,0,0,0 ; call 308a <_sk_byte_tables_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
- DB 15,40,162,133,104,0,0 ; movaps 0x6885(%edx),%xmm4
+ DB 15,40,162,246,104,0,0 ; movaps 0x68f6(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5
@@ -47646,7 +48122,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,15,196,192,0 ; pinsrw $0x0,%eax,%xmm0
DB 139,65,4 ; mov 0x4(%ecx),%eax
DB 102,15,196,195,1 ; pinsrw $0x1,%ebx,%xmm0
- DB 15,40,170,149,104,0,0 ; movaps 0x6895(%edx),%xmm5
+ DB 15,40,170,6,105,0,0 ; movaps 0x6906(%edx),%xmm5
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -47769,12 +48245,12 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 15,182,60,31 ; movzbl (%edi,%ebx,1),%edi
DB 193,231,8 ; shl $0x8,%edi
DB 9,215 ; or %edx,%edi
- DB 232,0,0,0,0 ; call 310b <_sk_byte_tables_rgb_sse2+0x65>
+ DB 232,0,0,0,0 ; call 328a <_sk_byte_tables_rgb_sse2+0x65>
DB 90 ; pop %edx
DB 102,15,196,199,0 ; pinsrw $0x0,%edi,%xmm0
DB 139,121,4 ; mov 0x4(%ecx),%edi
DB 102,15,196,198,1 ; pinsrw $0x1,%esi,%xmm0
- DB 15,40,170,165,102,0,0 ; movaps 0x66a5(%edx),%xmm5
+ DB 15,40,170,22,103,0,0 ; movaps 0x6716(%edx),%xmm5
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -48000,7 +48476,7 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 33da <_sk_parametric_r_sse2+0x18>
+ DB 232,0,0,0,0 ; call 3559 <_sk_parametric_r_sse2+0x18>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
@@ -48020,15 +48496,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,230,99,0,0 ; mulps 0x63e6(%edx),%xmm5
- DB 15,84,178,246,99,0,0 ; andps 0x63f6(%edx),%xmm6
- DB 15,86,178,6,100,0,0 ; orps 0x6406(%edx),%xmm6
- DB 15,88,170,22,100,0,0 ; addps 0x6416(%edx),%xmm5
- DB 15,40,186,38,100,0,0 ; movaps 0x6426(%edx),%xmm7
+ DB 15,89,170,87,100,0,0 ; mulps 0x6457(%edx),%xmm5
+ DB 15,84,178,103,100,0,0 ; andps 0x6467(%edx),%xmm6
+ DB 15,86,178,119,100,0,0 ; orps 0x6477(%edx),%xmm6
+ DB 15,88,170,135,100,0,0 ; addps 0x6487(%edx),%xmm5
+ DB 15,40,186,151,100,0,0 ; movaps 0x6497(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,54,100,0,0 ; addps 0x6436(%edx),%xmm6
- DB 15,40,186,70,100,0,0 ; movaps 0x6446(%edx),%xmm7
+ DB 15,88,178,167,100,0,0 ; addps 0x64a7(%edx),%xmm6
+ DB 15,40,186,183,100,0,0 ; movaps 0x64b7(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -48038,21 +48514,21 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,86,100,0,0 ; movaps 0x6456(%edx),%xmm6
+ DB 15,40,178,199,100,0,0 ; movaps 0x64c7(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,102,100,0,0 ; addps 0x6466(%edx),%xmm5
- DB 15,40,186,118,100,0,0 ; movaps 0x6476(%edx),%xmm7
+ DB 15,88,170,215,100,0,0 ; addps 0x64d7(%edx),%xmm5
+ DB 15,40,186,231,100,0,0 ; movaps 0x64e7(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,134,100,0,0 ; movaps 0x6486(%edx),%xmm7
+ DB 15,40,186,247,100,0,0 ; movaps 0x64f7(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,150,100,0,0 ; movaps 0x6496(%edx),%xmm0
+ DB 15,40,130,7,101,0,0 ; movaps 0x6507(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,166,100,0,0 ; mulps 0x64a6(%edx),%xmm0
+ DB 15,89,130,23,101,0,0 ; mulps 0x6517(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -48084,7 +48560,7 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 3511 <_sk_parametric_g_sse2+0x15>
+ DB 232,0,0,0,0 ; call 3690 <_sk_parametric_g_sse2+0x15>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
@@ -48104,15 +48580,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,127,99,0,0 ; mulps 0x637f(%edx),%xmm5
- DB 15,84,178,143,99,0,0 ; andps 0x638f(%edx),%xmm6
- DB 15,86,178,159,99,0,0 ; orps 0x639f(%edx),%xmm6
- DB 15,88,170,175,99,0,0 ; addps 0x63af(%edx),%xmm5
- DB 15,40,186,191,99,0,0 ; movaps 0x63bf(%edx),%xmm7
+ DB 15,89,170,240,99,0,0 ; mulps 0x63f0(%edx),%xmm5
+ DB 15,84,178,0,100,0,0 ; andps 0x6400(%edx),%xmm6
+ DB 15,86,178,16,100,0,0 ; orps 0x6410(%edx),%xmm6
+ DB 15,88,170,32,100,0,0 ; addps 0x6420(%edx),%xmm5
+ DB 15,40,186,48,100,0,0 ; movaps 0x6430(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,207,99,0,0 ; addps 0x63cf(%edx),%xmm6
- DB 15,40,186,223,99,0,0 ; movaps 0x63df(%edx),%xmm7
+ DB 15,88,178,64,100,0,0 ; addps 0x6440(%edx),%xmm6
+ DB 15,40,186,80,100,0,0 ; movaps 0x6450(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -48122,21 +48598,21 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,239,99,0,0 ; movaps 0x63ef(%edx),%xmm6
+ DB 15,40,178,96,100,0,0 ; movaps 0x6460(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,255,99,0,0 ; addps 0x63ff(%edx),%xmm5
- DB 15,40,186,15,100,0,0 ; movaps 0x640f(%edx),%xmm7
+ DB 15,88,170,112,100,0,0 ; addps 0x6470(%edx),%xmm5
+ DB 15,40,186,128,100,0,0 ; movaps 0x6480(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,31,100,0,0 ; movaps 0x641f(%edx),%xmm7
+ DB 15,40,186,144,100,0,0 ; movaps 0x6490(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,47,100,0,0 ; movaps 0x642f(%edx),%xmm0
+ DB 15,40,130,160,100,0,0 ; movaps 0x64a0(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,63,100,0,0 ; mulps 0x643f(%edx),%xmm0
+ DB 15,89,130,176,100,0,0 ; mulps 0x64b0(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -48167,7 +48643,7 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,217 ; movaps %xmm1,%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 3645 <_sk_parametric_b_sse2+0x15>
+ DB 232,0,0,0,0 ; call 37c4 <_sk_parametric_b_sse2+0x15>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
@@ -48187,15 +48663,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,27,99,0,0 ; mulps 0x631b(%edx),%xmm5
- DB 15,84,178,43,99,0,0 ; andps 0x632b(%edx),%xmm6
- DB 15,86,178,59,99,0,0 ; orps 0x633b(%edx),%xmm6
- DB 15,88,170,75,99,0,0 ; addps 0x634b(%edx),%xmm5
- DB 15,40,186,91,99,0,0 ; movaps 0x635b(%edx),%xmm7
+ DB 15,89,170,140,99,0,0 ; mulps 0x638c(%edx),%xmm5
+ DB 15,84,178,156,99,0,0 ; andps 0x639c(%edx),%xmm6
+ DB 15,86,178,172,99,0,0 ; orps 0x63ac(%edx),%xmm6
+ DB 15,88,170,188,99,0,0 ; addps 0x63bc(%edx),%xmm5
+ DB 15,40,186,204,99,0,0 ; movaps 0x63cc(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,107,99,0,0 ; addps 0x636b(%edx),%xmm6
- DB 15,40,186,123,99,0,0 ; movaps 0x637b(%edx),%xmm7
+ DB 15,88,178,220,99,0,0 ; addps 0x63dc(%edx),%xmm6
+ DB 15,40,186,236,99,0,0 ; movaps 0x63ec(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -48205,21 +48681,21 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,139,99,0,0 ; movaps 0x638b(%edx),%xmm6
+ DB 15,40,178,252,99,0,0 ; movaps 0x63fc(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,155,99,0,0 ; addps 0x639b(%edx),%xmm5
- DB 15,40,186,171,99,0,0 ; movaps 0x63ab(%edx),%xmm7
+ DB 15,88,170,12,100,0,0 ; addps 0x640c(%edx),%xmm5
+ DB 15,40,186,28,100,0,0 ; movaps 0x641c(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,187,99,0,0 ; movaps 0x63bb(%edx),%xmm7
+ DB 15,40,186,44,100,0,0 ; movaps 0x642c(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,203,99,0,0 ; movaps 0x63cb(%edx),%xmm0
+ DB 15,40,130,60,100,0,0 ; movaps 0x643c(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,219,99,0,0 ; mulps 0x63db(%edx),%xmm0
+ DB 15,89,130,76,100,0,0 ; mulps 0x644c(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -48250,7 +48726,7 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,41,85,232 ; movaps %xmm2,-0x18(%ebp)
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 3779 <_sk_parametric_a_sse2+0x15>
+ DB 232,0,0,0,0 ; call 38f8 <_sk_parametric_a_sse2+0x15>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
@@ -48270,15 +48746,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,183,98,0,0 ; mulps 0x62b7(%edx),%xmm5
- DB 15,84,178,199,98,0,0 ; andps 0x62c7(%edx),%xmm6
- DB 15,86,178,215,98,0,0 ; orps 0x62d7(%edx),%xmm6
- DB 15,88,170,231,98,0,0 ; addps 0x62e7(%edx),%xmm5
- DB 15,40,186,247,98,0,0 ; movaps 0x62f7(%edx),%xmm7
+ DB 15,89,170,40,99,0,0 ; mulps 0x6328(%edx),%xmm5
+ DB 15,84,178,56,99,0,0 ; andps 0x6338(%edx),%xmm6
+ DB 15,86,178,72,99,0,0 ; orps 0x6348(%edx),%xmm6
+ DB 15,88,170,88,99,0,0 ; addps 0x6358(%edx),%xmm5
+ DB 15,40,186,104,99,0,0 ; movaps 0x6368(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,7,99,0,0 ; addps 0x6307(%edx),%xmm6
- DB 15,40,186,23,99,0,0 ; movaps 0x6317(%edx),%xmm7
+ DB 15,88,178,120,99,0,0 ; addps 0x6378(%edx),%xmm6
+ DB 15,40,186,136,99,0,0 ; movaps 0x6388(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -48288,21 +48764,21 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,39,99,0,0 ; movaps 0x6327(%edx),%xmm6
+ DB 15,40,178,152,99,0,0 ; movaps 0x6398(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,55,99,0,0 ; addps 0x6337(%edx),%xmm5
- DB 15,40,186,71,99,0,0 ; movaps 0x6347(%edx),%xmm7
+ DB 15,88,170,168,99,0,0 ; addps 0x63a8(%edx),%xmm5
+ DB 15,40,186,184,99,0,0 ; movaps 0x63b8(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,87,99,0,0 ; movaps 0x6357(%edx),%xmm7
+ DB 15,40,186,200,99,0,0 ; movaps 0x63c8(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,103,99,0,0 ; movaps 0x6367(%edx),%xmm0
+ DB 15,40,130,216,99,0,0 ; movaps 0x63d8(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,119,99,0,0 ; mulps 0x6377(%edx),%xmm0
+ DB 15,89,130,232,99,0,0 ; mulps 0x63e8(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -48332,18 +48808,18 @@ _sk_gamma_sse2 LABEL PROC
DB 131,236,40 ; sub $0x28,%esp
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
DB 15,40,216 ; movaps %xmm0,%xmm3
- DB 232,0,0,0,0 ; call 38aa <_sk_gamma_sse2+0x12>
+ DB 232,0,0,0,0 ; call 3a29 <_sk_gamma_sse2+0x12>
DB 88 ; pop %eax
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,128,86,98,0,0 ; mulps 0x6256(%eax),%xmm0
- DB 15,84,152,102,98,0,0 ; andps 0x6266(%eax),%xmm3
- DB 15,86,152,118,98,0,0 ; orps 0x6276(%eax),%xmm3
- DB 15,88,128,134,98,0,0 ; addps 0x6286(%eax),%xmm0
+ DB 15,89,128,199,98,0,0 ; mulps 0x62c7(%eax),%xmm0
+ DB 15,84,152,215,98,0,0 ; andps 0x62d7(%eax),%xmm3
+ DB 15,86,152,231,98,0,0 ; orps 0x62e7(%eax),%xmm3
+ DB 15,88,128,247,98,0,0 ; addps 0x62f7(%eax),%xmm0
DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 15,89,160,150,98,0,0 ; mulps 0x6296(%eax),%xmm4
+ DB 15,89,160,7,99,0,0 ; mulps 0x6307(%eax),%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,88,152,166,98,0,0 ; addps 0x62a6(%eax),%xmm3
- DB 15,40,160,182,98,0,0 ; movaps 0x62b6(%eax),%xmm4
+ DB 15,88,152,23,99,0,0 ; addps 0x6317(%eax),%xmm3
+ DB 15,40,160,39,99,0,0 ; movaps 0x6327(%eax),%xmm4
DB 15,94,227 ; divps %xmm3,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
DB 139,77,12 ; mov 0xc(%ebp),%ecx
@@ -48356,30 +48832,30 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,194,227,1 ; cmpltps %xmm3,%xmm4
- DB 15,84,160,198,98,0,0 ; andps 0x62c6(%eax),%xmm4
+ DB 15,84,160,55,99,0,0 ; andps 0x6337(%eax),%xmm4
DB 15,92,220 ; subps %xmm4,%xmm3
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
- DB 15,88,128,214,98,0,0 ; addps 0x62d6(%eax),%xmm0
- DB 15,40,176,246,98,0,0 ; movaps 0x62f6(%eax),%xmm6
+ DB 15,88,128,71,99,0,0 ; addps 0x6347(%eax),%xmm0
+ DB 15,40,176,103,99,0,0 ; movaps 0x6367(%eax),%xmm6
DB 15,92,244 ; subps %xmm4,%xmm6
- DB 15,40,168,230,98,0,0 ; movaps 0x62e6(%eax),%xmm5
+ DB 15,40,168,87,99,0,0 ; movaps 0x6357(%eax),%xmm5
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,40,152,6,99,0,0 ; movaps 0x6306(%eax),%xmm3
+ DB 15,40,152,119,99,0,0 ; movaps 0x6377(%eax),%xmm3
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,94,230 ; divps %xmm6,%xmm4
DB 15,88,224 ; addps %xmm0,%xmm4
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,128,86,98,0,0 ; mulps 0x6256(%eax),%xmm0
- DB 15,84,136,102,98,0,0 ; andps 0x6266(%eax),%xmm1
- DB 15,86,136,118,98,0,0 ; orps 0x6276(%eax),%xmm1
- DB 15,88,128,134,98,0,0 ; addps 0x6286(%eax),%xmm0
+ DB 15,89,128,199,98,0,0 ; mulps 0x62c7(%eax),%xmm0
+ DB 15,84,136,215,98,0,0 ; andps 0x62d7(%eax),%xmm1
+ DB 15,86,136,231,98,0,0 ; orps 0x62e7(%eax),%xmm1
+ DB 15,88,128,247,98,0,0 ; addps 0x62f7(%eax),%xmm0
DB 15,40,241 ; movaps %xmm1,%xmm6
- DB 15,89,176,150,98,0,0 ; mulps 0x6296(%eax),%xmm6
+ DB 15,89,176,7,99,0,0 ; mulps 0x6307(%eax),%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
- DB 15,88,136,166,98,0,0 ; addps 0x62a6(%eax),%xmm1
- DB 15,40,176,182,98,0,0 ; movaps 0x62b6(%eax),%xmm6
+ DB 15,88,136,23,99,0,0 ; addps 0x6317(%eax),%xmm1
+ DB 15,40,176,39,99,0,0 ; movaps 0x6327(%eax),%xmm6
DB 15,94,241 ; divps %xmm1,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
@@ -48387,12 +48863,12 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,194,241,1 ; cmpltps %xmm1,%xmm6
- DB 15,84,176,198,98,0,0 ; andps 0x62c6(%eax),%xmm6
+ DB 15,84,176,55,99,0,0 ; andps 0x6337(%eax),%xmm6
DB 15,92,206 ; subps %xmm6,%xmm1
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,241 ; subps %xmm1,%xmm6
- DB 15,88,128,214,98,0,0 ; addps 0x62d6(%eax),%xmm0
- DB 15,40,184,246,98,0,0 ; movaps 0x62f6(%eax),%xmm7
+ DB 15,88,128,71,99,0,0 ; addps 0x6347(%eax),%xmm0
+ DB 15,40,184,103,99,0,0 ; movaps 0x6367(%eax),%xmm7
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
@@ -48400,15 +48876,15 @@ _sk_gamma_sse2 LABEL PROC
DB 15,94,207 ; divps %xmm7,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,128,86,98,0,0 ; mulps 0x6256(%eax),%xmm0
- DB 15,84,144,102,98,0,0 ; andps 0x6266(%eax),%xmm2
- DB 15,86,144,118,98,0,0 ; orps 0x6276(%eax),%xmm2
- DB 15,88,128,134,98,0,0 ; addps 0x6286(%eax),%xmm0
- DB 15,40,176,150,98,0,0 ; movaps 0x6296(%eax),%xmm6
+ DB 15,89,128,199,98,0,0 ; mulps 0x62c7(%eax),%xmm0
+ DB 15,84,144,215,98,0,0 ; andps 0x62d7(%eax),%xmm2
+ DB 15,86,144,231,98,0,0 ; orps 0x62e7(%eax),%xmm2
+ DB 15,88,128,247,98,0,0 ; addps 0x62f7(%eax),%xmm0
+ DB 15,40,176,7,99,0,0 ; movaps 0x6307(%eax),%xmm6
DB 15,89,242 ; mulps %xmm2,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
- DB 15,88,144,166,98,0,0 ; addps 0x62a6(%eax),%xmm2
- DB 15,40,176,182,98,0,0 ; movaps 0x62b6(%eax),%xmm6
+ DB 15,88,144,23,99,0,0 ; addps 0x6317(%eax),%xmm2
+ DB 15,40,176,39,99,0,0 ; movaps 0x6327(%eax),%xmm6
DB 15,94,242 ; divps %xmm2,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
DB 15,89,69,232 ; mulps -0x18(%ebp),%xmm0
@@ -48416,18 +48892,18 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,194,242,1 ; cmpltps %xmm2,%xmm6
- DB 15,84,176,198,98,0,0 ; andps 0x62c6(%eax),%xmm6
+ DB 15,84,176,55,99,0,0 ; andps 0x6337(%eax),%xmm6
DB 15,92,214 ; subps %xmm6,%xmm2
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
- DB 15,88,128,214,98,0,0 ; addps 0x62d6(%eax),%xmm0
+ DB 15,88,128,71,99,0,0 ; addps 0x6347(%eax),%xmm0
DB 15,89,238 ; mulps %xmm6,%xmm5
DB 15,92,197 ; subps %xmm5,%xmm0
- DB 15,40,144,246,98,0,0 ; movaps 0x62f6(%eax),%xmm2
+ DB 15,40,144,103,99,0,0 ; movaps 0x6367(%eax),%xmm2
DB 15,92,214 ; subps %xmm6,%xmm2
DB 15,94,218 ; divps %xmm2,%xmm3
DB 15,88,216 ; addps %xmm0,%xmm3
- DB 15,40,128,22,99,0,0 ; movaps 0x6316(%eax),%xmm0
+ DB 15,40,128,135,99,0,0 ; movaps 0x6387(%eax),%xmm0
DB 15,89,224 ; mulps %xmm0,%xmm4
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,89,216 ; mulps %xmm0,%xmm3
@@ -48452,31 +48928,31 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 3a92 <_sk_lab_to_xyz_sse2+0x15>
+ DB 232,0,0,0,0 ; call 3c11 <_sk_lab_to_xyz_sse2+0x15>
DB 88 ; pop %eax
- DB 15,89,144,62,97,0,0 ; mulps 0x613e(%eax),%xmm2
- DB 15,40,160,78,97,0,0 ; movaps 0x614e(%eax),%xmm4
+ DB 15,89,144,175,97,0,0 ; mulps 0x61af(%eax),%xmm2
+ DB 15,40,160,191,97,0,0 ; movaps 0x61bf(%eax),%xmm4
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,40,168,94,97,0,0 ; movaps 0x615e(%eax),%xmm5
+ DB 15,40,168,207,97,0,0 ; movaps 0x61cf(%eax),%xmm5
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,89,220 ; mulps %xmm4,%xmm3
DB 15,88,221 ; addps %xmm5,%xmm3
- DB 15,88,144,110,97,0,0 ; addps 0x616e(%eax),%xmm2
- DB 15,89,144,126,97,0,0 ; mulps 0x617e(%eax),%xmm2
- DB 15,89,136,142,97,0,0 ; mulps 0x618e(%eax),%xmm1
+ DB 15,88,144,223,97,0,0 ; addps 0x61df(%eax),%xmm2
+ DB 15,89,144,239,97,0,0 ; mulps 0x61ef(%eax),%xmm2
+ DB 15,89,136,255,97,0,0 ; mulps 0x61ff(%eax),%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,89,152,158,97,0,0 ; mulps 0x619e(%eax),%xmm3
+ DB 15,89,152,15,98,0,0 ; mulps 0x620f(%eax),%xmm3
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,152,174,97,0,0 ; movaps 0x61ae(%eax),%xmm3
+ DB 15,40,152,31,98,0,0 ; movaps 0x621f(%eax),%xmm3
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,194,224,1 ; cmpltps %xmm0,%xmm4
- DB 15,40,176,190,97,0,0 ; movaps 0x61be(%eax),%xmm6
+ DB 15,40,176,47,98,0,0 ; movaps 0x622f(%eax),%xmm6
DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,40,184,206,97,0,0 ; movaps 0x61ce(%eax),%xmm7
+ DB 15,40,184,63,98,0,0 ; movaps 0x623f(%eax),%xmm7
DB 15,89,207 ; mulps %xmm7,%xmm1
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,85,225 ; andnps %xmm1,%xmm4
@@ -48501,8 +48977,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,85,221 ; andnps %xmm5,%xmm3
DB 15,86,216 ; orps %xmm0,%xmm3
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,89,160,222,97,0,0 ; mulps 0x61de(%eax),%xmm4
- DB 15,89,152,238,97,0,0 ; mulps 0x61ee(%eax),%xmm3
+ DB 15,89,160,79,98,0,0 ; mulps 0x624f(%eax),%xmm4
+ DB 15,89,152,95,98,0,0 ; mulps 0x625f(%eax),%xmm3
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
@@ -48523,7 +48999,7 @@ _sk_load_a8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 3b82 <_sk_load_a8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 3d01 <_sk_load_a8_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48534,13 +49010,13 @@ _sk_load_a8_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,60 ; jne 3bd9 <_sk_load_a8_sse2+0x65>
+ DB 117,60 ; jne 3d58 <_sk_load_a8_sse2+0x65>
DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,130,14,97,0,0 ; pand 0x610e(%edx),%xmm0
+ DB 102,15,219,130,127,97,0,0 ; pand 0x617f(%edx),%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,154,30,97,0,0 ; mulps 0x611e(%edx),%xmm3
+ DB 15,89,154,143,97,0,0 ; mulps 0x618f(%edx),%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -48557,12 +49033,12 @@ _sk_load_a8_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 3c13 <_sk_load_a8_sse2+0x9f>
+ DB 116,50 ; je 3d92 <_sk_load_a8_sse2+0x9f>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3bfd <_sk_load_a8_sse2+0x89>
+ DB 116,19 ; je 3d7c <_sk_load_a8_sse2+0x89>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,187 ; jne 3baa <_sk_load_a8_sse2+0x36>
+ DB 117,187 ; jne 3d29 <_sk_load_a8_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -48571,10 +49047,10 @@ _sk_load_a8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,151 ; jmp 3baa <_sk_load_a8_sse2+0x36>
+ DB 235,151 ; jmp 3d29 <_sk_load_a8_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,198 ; movd %esi,%xmm0
- DB 235,141 ; jmp 3baa <_sk_load_a8_sse2+0x36>
+ DB 235,141 ; jmp 3d29 <_sk_load_a8_sse2+0x36>
PUBLIC _sk_load_a8_dst_sse2
_sk_load_a8_dst_sse2 LABEL PROC
@@ -48597,15 +49073,15 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,127,97,32 ; movdqa %xmm4,0x20(%ecx)
DB 102,15,127,97,16 ; movdqa %xmm4,0x10(%ecx)
DB 133,219 ; test %ebx,%ebx
- DB 232,0,0,0,0 ; call 3c56 <_sk_load_a8_dst_sse2+0x39>
+ DB 232,0,0,0,0 ; call 3dd5 <_sk_load_a8_dst_sse2+0x39>
DB 90 ; pop %edx
- DB 117,54 ; jne 3c8f <_sk_load_a8_dst_sse2+0x72>
+ DB 117,54 ; jne 3e0e <_sk_load_a8_dst_sse2+0x72>
DB 102,15,110,36,55 ; movd (%edi,%esi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,90,96,0,0 ; pand 0x605a(%edx),%xmm4
+ DB 102,15,219,162,203,96,0,0 ; pand 0x60cb(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,106,96,0,0 ; mulps 0x606a(%edx),%xmm4
+ DB 15,89,162,219,96,0,0 ; mulps 0x60db(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -48620,11 +49096,11 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 3cc5 <_sk_load_a8_dst_sse2+0xa8>
+ DB 116,46 ; je 3e44 <_sk_load_a8_dst_sse2+0xa8>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3caf <_sk_load_a8_dst_sse2+0x92>
+ DB 116,19 ; je 3e2e <_sk_load_a8_dst_sse2+0x92>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,197 ; jne 3c66 <_sk_load_a8_dst_sse2+0x49>
+ DB 117,197 ; jne 3de5 <_sk_load_a8_dst_sse2+0x49>
DB 15,182,92,55,2 ; movzbl 0x2(%edi,%esi,1),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -48633,10 +49109,10 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,161 ; jmp 3c66 <_sk_load_a8_dst_sse2+0x49>
+ DB 235,161 ; jmp 3de5 <_sk_load_a8_dst_sse2+0x49>
DB 15,182,52,55 ; movzbl (%edi,%esi,1),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 235,151 ; jmp 3c66 <_sk_load_a8_dst_sse2+0x49>
+ DB 235,151 ; jmp 3de5 <_sk_load_a8_dst_sse2+0x49>
PUBLIC _sk_gather_a8_sse2
_sk_gather_a8_sse2 LABEL PROC
@@ -48675,13 +49151,13 @@ _sk_gather_a8_sse2 LABEL PROC
DB 9,202 ; or %ecx,%edx
DB 102,15,196,194,0 ; pinsrw $0x0,%edx,%xmm0
DB 102,15,196,199,1 ; pinsrw $0x1,%edi,%xmm0
- DB 232,0,0,0,0 ; call 3d54 <_sk_gather_a8_sse2+0x85>
+ DB 232,0,0,0,0 ; call 3ed3 <_sk_gather_a8_sse2+0x85>
DB 89 ; pop %ecx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,153,124,95,0,0 ; mulps 0x5f7c(%ecx),%xmm3
+ DB 15,89,153,237,95,0,0 ; mulps 0x5fed(%ecx),%xmm3
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -48704,7 +49180,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,60 ; sub $0x3c,%esp
- DB 232,0,0,0,0 ; call 3d98 <_sk_store_a8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 3f17 <_sk_store_a8_sse2+0xe>
DB 94 ; pop %esi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48713,7 +49189,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 15,175,81,4 ; imul 0x4(%ecx),%edx
DB 3,23 ; add (%edi),%edx
DB 139,89,8 ; mov 0x8(%ecx),%ebx
- DB 15,40,166,72,95,0,0 ; movaps 0x5f48(%esi),%xmm4
+ DB 15,40,166,185,95,0,0 ; movaps 0x5fb9(%esi),%xmm4
DB 15,89,227 ; mulps %xmm3,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
DB 102,15,114,244,16 ; pslld $0x10,%xmm4
@@ -48722,7 +49198,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,26 ; jne 3ded <_sk_store_a8_sse2+0x63>
+ DB 117,26 ; jne 3f6c <_sk_store_a8_sse2+0x63>
DB 102,15,126,230 ; movd %xmm4,%esi
DB 137,52,58 ; mov %esi,(%edx,%edi,1)
DB 141,80,8 ; lea 0x8(%eax),%edx
@@ -48740,26 +49216,26 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,57 ; je 3e36 <_sk_store_a8_sse2+0xac>
+ DB 116,57 ; je 3fb5 <_sk_store_a8_sse2+0xac>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,17 ; je 3e13 <_sk_store_a8_sse2+0x89>
+ DB 116,17 ; je 3f92 <_sk_store_a8_sse2+0x89>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,211 ; jne 3dda <_sk_store_a8_sse2+0x50>
+ DB 117,211 ; jne 3f59 <_sk_store_a8_sse2+0x50>
DB 102,15,127,101,200 ; movdqa %xmm4,-0x38(%ebp)
DB 138,93,208 ; mov -0x30(%ebp),%bl
DB 136,92,58,2 ; mov %bl,0x2(%edx,%edi,1)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
- DB 102,15,219,166,88,95,0,0 ; pand 0x5f58(%esi),%xmm4
+ DB 102,15,219,166,201,95,0,0 ; pand 0x5fc9(%esi),%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,126,230 ; movd %xmm4,%esi
DB 102,137,52,58 ; mov %si,(%edx,%edi,1)
- DB 235,164 ; jmp 3dda <_sk_store_a8_sse2+0x50>
+ DB 235,164 ; jmp 3f59 <_sk_store_a8_sse2+0x50>
DB 102,15,127,101,216 ; movdqa %xmm4,-0x28(%ebp)
DB 138,93,216 ; mov -0x28(%ebp),%bl
DB 136,28,58 ; mov %bl,(%edx,%edi,1)
- DB 235,151 ; jmp 3dda <_sk_store_a8_sse2+0x50>
+ DB 235,151 ; jmp 3f59 <_sk_store_a8_sse2+0x50>
PUBLIC _sk_load_g8_sse2
_sk_load_g8_sse2 LABEL PROC
@@ -48769,7 +49245,7 @@ _sk_load_g8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 3e51 <_sk_load_g8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 3fd0 <_sk_load_g8_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48780,16 +49256,16 @@ _sk_load_g8_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,63 ; jne 3eab <_sk_load_g8_sse2+0x68>
+ DB 117,63 ; jne 402a <_sk_load_g8_sse2+0x68>
DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,130,175,94,0,0 ; pand 0x5eaf(%edx),%xmm0
+ DB 102,15,219,130,32,95,0,0 ; pand 0x5f20(%edx),%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,191,94,0,0 ; mulps 0x5ebf(%edx),%xmm0
+ DB 15,89,130,48,95,0,0 ; mulps 0x5f30(%edx),%xmm0
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,207,94,0,0 ; movaps 0x5ecf(%edx),%xmm3
+ DB 15,40,154,64,95,0,0 ; movaps 0x5f40(%edx),%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 86 ; push %esi
@@ -48803,12 +49279,12 @@ _sk_load_g8_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 3ee5 <_sk_load_g8_sse2+0xa2>
+ DB 116,50 ; je 4064 <_sk_load_g8_sse2+0xa2>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3ecf <_sk_load_g8_sse2+0x8c>
+ DB 116,19 ; je 404e <_sk_load_g8_sse2+0x8c>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,184 ; jne 3e79 <_sk_load_g8_sse2+0x36>
+ DB 117,184 ; jne 3ff8 <_sk_load_g8_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -48817,10 +49293,10 @@ _sk_load_g8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,148 ; jmp 3e79 <_sk_load_g8_sse2+0x36>
+ DB 235,148 ; jmp 3ff8 <_sk_load_g8_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,198 ; movd %esi,%xmm0
- DB 235,138 ; jmp 3e79 <_sk_load_g8_sse2+0x36>
+ DB 235,138 ; jmp 3ff8 <_sk_load_g8_sse2+0x36>
PUBLIC _sk_load_g8_dst_sse2
_sk_load_g8_dst_sse2 LABEL PROC
@@ -48830,7 +49306,7 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 3efd <_sk_load_g8_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 407c <_sk_load_g8_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48841,17 +49317,17 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,73 ; jne 3f61 <_sk_load_g8_dst_sse2+0x72>
+ DB 117,73 ; jne 40e0 <_sk_load_g8_dst_sse2+0x72>
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,51,94,0,0 ; pand 0x5e33(%edx),%xmm4
+ DB 102,15,219,162,164,94,0,0 ; pand 0x5ea4(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,67,94,0,0 ; mulps 0x5e43(%edx),%xmm4
+ DB 15,89,162,180,94,0,0 ; mulps 0x5eb4(%edx),%xmm4
DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
DB 15,41,97,32 ; movaps %xmm4,0x20(%ecx)
DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx)
- DB 15,40,162,83,94,0,0 ; movaps 0x5e53(%edx),%xmm4
+ DB 15,40,162,196,94,0,0 ; movaps 0x5ec4(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -48866,12 +49342,12 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 3f9b <_sk_load_g8_dst_sse2+0xac>
+ DB 116,50 ; je 411a <_sk_load_g8_dst_sse2+0xac>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3f85 <_sk_load_g8_dst_sse2+0x96>
+ DB 116,19 ; je 4104 <_sk_load_g8_dst_sse2+0x96>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,174 ; jne 3f25 <_sk_load_g8_dst_sse2+0x36>
+ DB 117,174 ; jne 40a4 <_sk_load_g8_dst_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -48880,10 +49356,10 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,138 ; jmp 3f25 <_sk_load_g8_dst_sse2+0x36>
+ DB 235,138 ; jmp 40a4 <_sk_load_g8_dst_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 235,128 ; jmp 3f25 <_sk_load_g8_dst_sse2+0x36>
+ DB 235,128 ; jmp 40a4 <_sk_load_g8_dst_sse2+0x36>
PUBLIC _sk_gather_g8_sse2
_sk_gather_g8_sse2 LABEL PROC
@@ -48921,17 +49397,17 @@ _sk_gather_g8_sse2 LABEL PROC
DB 193,226,8 ; shl $0x8,%edx
DB 9,202 ; or %ecx,%edx
DB 102,15,196,194,0 ; pinsrw $0x0,%edx,%xmm0
- DB 232,0,0,0,0 ; call 4025 <_sk_gather_g8_sse2+0x80>
+ DB 232,0,0,0,0 ; call 41a4 <_sk_gather_g8_sse2+0x80>
DB 89 ; pop %ecx
DB 102,15,196,199,1 ; pinsrw $0x1,%edi,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,129,59,93,0,0 ; mulps 0x5d3b(%ecx),%xmm0
+ DB 15,89,129,172,93,0,0 ; mulps 0x5dac(%ecx),%xmm0
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,153,75,93,0,0 ; movaps 0x5d4b(%ecx),%xmm3
+ DB 15,40,153,188,93,0,0 ; movaps 0x5dbc(%ecx),%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 82 ; push %edx
@@ -48951,7 +49427,7 @@ _sk_load_565_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4070 <_sk_load_565_sse2+0xe>
+ DB 232,0,0,0,0 ; call 41ef <_sk_load_565_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48963,23 +49439,23 @@ _sk_load_565_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,97 ; jne 40ee <_sk_load_565_sse2+0x8c>
+ DB 117,97 ; jne 426d <_sk_load_565_sse2+0x8c>
DB 243,15,126,20,126 ; movq (%esi,%edi,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,130,16,93,0,0 ; movdqa 0x5d10(%edx),%xmm0
+ DB 102,15,111,130,129,93,0,0 ; movdqa 0x5d81(%edx),%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,32,93,0,0 ; mulps 0x5d20(%edx),%xmm0
- DB 102,15,111,138,48,93,0,0 ; movdqa 0x5d30(%edx),%xmm1
+ DB 15,89,130,145,93,0,0 ; mulps 0x5d91(%edx),%xmm0
+ DB 102,15,111,138,161,93,0,0 ; movdqa 0x5da1(%edx),%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,64,93,0,0 ; mulps 0x5d40(%edx),%xmm1
- DB 102,15,219,146,80,93,0,0 ; pand 0x5d50(%edx),%xmm2
+ DB 15,89,138,177,93,0,0 ; mulps 0x5db1(%edx),%xmm1
+ DB 102,15,219,146,193,93,0,0 ; pand 0x5dc1(%edx),%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,96,93,0,0 ; mulps 0x5d60(%edx),%xmm2
+ DB 15,89,146,209,93,0,0 ; mulps 0x5dd1(%edx),%xmm2
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,112,93,0,0 ; movaps 0x5d70(%edx),%xmm3
+ DB 15,40,154,225,93,0,0 ; movaps 0x5de1(%edx),%xmm3
DB 86 ; push %esi
DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
@@ -48991,22 +49467,22 @@ _sk_load_565_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 4124 <_sk_load_565_sse2+0xc2>
+ DB 116,46 ; je 42a3 <_sk_load_565_sse2+0xc2>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 4112 <_sk_load_565_sse2+0xb0>
+ DB 116,19 ; je 4291 <_sk_load_565_sse2+0xb0>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,146 ; jne 4096 <_sk_load_565_sse2+0x34>
+ DB 117,146 ; jne 4215 <_sk_load_565_sse2+0x34>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,15,110,4,126 ; movd (%esi,%edi,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,208 ; movsd %xmm0,%xmm2
- DB 233,114,255,255,255 ; jmp 4096 <_sk_load_565_sse2+0x34>
+ DB 233,114,255,255,255 ; jmp 4215 <_sk_load_565_sse2+0x34>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,214 ; movd %esi,%xmm2
- DB 233,101,255,255,255 ; jmp 4096 <_sk_load_565_sse2+0x34>
+ DB 233,101,255,255,255 ; jmp 4215 <_sk_load_565_sse2+0x34>
PUBLIC _sk_load_565_dst_sse2
_sk_load_565_dst_sse2 LABEL PROC
@@ -49016,7 +49492,7 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 413f <_sk_load_565_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 42be <_sk_load_565_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49028,24 +49504,24 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,113 ; jne 41cd <_sk_load_565_dst_sse2+0x9c>
+ DB 117,113 ; jne 434c <_sk_load_565_dst_sse2+0x9c>
DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,111,170,177,92,0,0 ; movdqa 0x5cb1(%edx),%xmm5
+ DB 102,15,111,170,34,93,0,0 ; movdqa 0x5d22(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,193,92,0,0 ; mulps 0x5cc1(%edx),%xmm5
+ DB 15,89,170,50,93,0,0 ; mulps 0x5d32(%edx),%xmm5
DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
- DB 102,15,111,170,209,92,0,0 ; movdqa 0x5cd1(%edx),%xmm5
+ DB 102,15,111,170,66,93,0,0 ; movdqa 0x5d42(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,225,92,0,0 ; mulps 0x5ce1(%edx),%xmm5
+ DB 15,89,170,82,93,0,0 ; mulps 0x5d52(%edx),%xmm5
DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
- DB 102,15,219,162,241,92,0,0 ; pand 0x5cf1(%edx),%xmm4
+ DB 102,15,219,162,98,93,0,0 ; pand 0x5d62(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,1,93,0,0 ; mulps 0x5d01(%edx),%xmm4
+ DB 15,89,162,114,93,0,0 ; mulps 0x5d72(%edx),%xmm4
DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
- DB 15,40,162,17,93,0,0 ; movaps 0x5d11(%edx),%xmm4
+ DB 15,40,162,130,93,0,0 ; movaps 0x5d82(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -49060,22 +49536,22 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 4203 <_sk_load_565_dst_sse2+0xd2>
+ DB 116,46 ; je 4382 <_sk_load_565_dst_sse2+0xd2>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 41f1 <_sk_load_565_dst_sse2+0xc0>
+ DB 116,19 ; je 4370 <_sk_load_565_dst_sse2+0xc0>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,130 ; jne 4165 <_sk_load_565_dst_sse2+0x34>
+ DB 117,130 ; jne 42e4 <_sk_load_565_dst_sse2+0x34>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,110,44,126 ; movd (%esi,%edi,2),%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,98,255,255,255 ; jmp 4165 <_sk_load_565_dst_sse2+0x34>
+ DB 233,98,255,255,255 ; jmp 42e4 <_sk_load_565_dst_sse2+0x34>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 233,85,255,255,255 ; jmp 4165 <_sk_load_565_dst_sse2+0x34>
+ DB 233,85,255,255,255 ; jmp 42e4 <_sk_load_565_dst_sse2+0x34>
PUBLIC _sk_gather_565_sse2
_sk_gather_565_sse2 LABEL PROC
@@ -49108,25 +49584,25 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,209,2 ; pinsrw $0x2,%ecx,%xmm2
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 15,183,12,74 ; movzwl (%edx,%ecx,2),%ecx
- DB 232,0,0,0,0 ; call 428b <_sk_gather_565_sse2+0x7b>
+ DB 232,0,0,0,0 ; call 440a <_sk_gather_565_sse2+0x7b>
DB 90 ; pop %edx
DB 102,15,196,209,3 ; pinsrw $0x3,%ecx,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,130,213,91,0,0 ; movdqa 0x5bd5(%edx),%xmm0
+ DB 102,15,111,130,70,92,0,0 ; movdqa 0x5c46(%edx),%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,229,91,0,0 ; mulps 0x5be5(%edx),%xmm0
- DB 102,15,111,138,245,91,0,0 ; movdqa 0x5bf5(%edx),%xmm1
+ DB 15,89,130,86,92,0,0 ; mulps 0x5c56(%edx),%xmm0
+ DB 102,15,111,138,102,92,0,0 ; movdqa 0x5c66(%edx),%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,5,92,0,0 ; mulps 0x5c05(%edx),%xmm1
- DB 102,15,219,146,21,92,0,0 ; pand 0x5c15(%edx),%xmm2
+ DB 15,89,138,118,92,0,0 ; mulps 0x5c76(%edx),%xmm1
+ DB 102,15,219,146,134,92,0,0 ; pand 0x5c86(%edx),%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,37,92,0,0 ; mulps 0x5c25(%edx),%xmm2
+ DB 15,89,146,150,92,0,0 ; mulps 0x5c96(%edx),%xmm2
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,53,92,0,0 ; movaps 0x5c35(%edx),%xmm3
+ DB 15,40,154,166,92,0,0 ; movaps 0x5ca6(%edx),%xmm3
DB 81 ; push %ecx
DB 255,117,8 ; pushl 0x8(%ebp)
DB 255,80,4 ; call *0x4(%eax)
@@ -49142,7 +49618,7 @@ _sk_store_565_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 42fe <_sk_store_565_sse2+0xe>
+ DB 232,0,0,0,0 ; call 447d <_sk_store_565_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49152,8 +49628,8 @@ _sk_store_565_sse2 LABEL PROC
DB 1,210 ; add %edx,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,210,91,0,0 ; movaps 0x5bd2(%edi),%xmm4
- DB 15,40,175,226,91,0,0 ; movaps 0x5be2(%edi),%xmm5
+ DB 15,40,167,67,92,0,0 ; movaps 0x5c43(%edi),%xmm4
+ DB 15,40,175,83,92,0,0 ; movaps 0x5c53(%edi),%xmm5
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,89,244 ; mulps %xmm4,%xmm6
@@ -49173,7 +49649,7 @@ _sk_store_565_sse2 LABEL PROC
DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
DB 102,15,126,109,236 ; movd %xmm5,-0x14(%ebp)
DB 133,219 ; test %ebx,%ebx
- DB 117,34 ; jne 4392 <_sk_store_565_sse2+0xa2>
+ DB 117,34 ; jne 4511 <_sk_store_565_sse2+0xa2>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,15,126,235 ; movd %xmm5,%ebx
DB 137,60,114 ; mov %edi,(%edx,%esi,2)
@@ -49193,20 +49669,20 @@ _sk_store_565_sse2 LABEL PROC
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,37 ; je 43c8 <_sk_store_565_sse2+0xd8>
+ DB 116,37 ; je 4547 <_sk_store_565_sse2+0xd8>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,15 ; je 43b7 <_sk_store_565_sse2+0xc7>
+ DB 116,15 ; je 4536 <_sk_store_565_sse2+0xc7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,210 ; jne 437f <_sk_store_565_sse2+0x8f>
+ DB 117,210 ; jne 44fe <_sk_store_565_sse2+0x8f>
DB 102,15,197,252,4 ; pextrw $0x4,%xmm4,%edi
DB 102,137,124,114,4 ; mov %di,0x4(%edx,%esi,2)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
DB 242,15,112,228,232 ; pshuflw $0xe8,%xmm4,%xmm4
DB 102,15,126,36,114 ; movd %xmm4,(%edx,%esi,2)
- DB 235,183 ; jmp 437f <_sk_store_565_sse2+0x8f>
+ DB 235,183 ; jmp 44fe <_sk_store_565_sse2+0x8f>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,137,60,114 ; mov %di,(%edx,%esi,2)
- DB 235,173 ; jmp 437f <_sk_store_565_sse2+0x8f>
+ DB 235,173 ; jmp 44fe <_sk_store_565_sse2+0x8f>
PUBLIC _sk_load_4444_sse2
_sk_load_4444_sse2 LABEL PROC
@@ -49216,7 +49692,7 @@ _sk_load_4444_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 43e0 <_sk_load_4444_sse2+0xe>
+ DB 232,0,0,0,0 ; call 455f <_sk_load_4444_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49228,24 +49704,24 @@ _sk_load_4444_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,112 ; jne 446d <_sk_load_4444_sse2+0x9b>
+ DB 117,112 ; jne 45ec <_sk_load_4444_sse2+0x9b>
DB 243,15,126,28,126 ; movq (%esi,%edi,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,130,16,91,0,0 ; movdqa 0x5b10(%edx),%xmm0
+ DB 102,15,111,130,129,91,0,0 ; movdqa 0x5b81(%edx),%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,32,91,0,0 ; mulps 0x5b20(%edx),%xmm0
- DB 102,15,111,138,48,91,0,0 ; movdqa 0x5b30(%edx),%xmm1
+ DB 15,89,130,145,91,0,0 ; mulps 0x5b91(%edx),%xmm0
+ DB 102,15,111,138,161,91,0,0 ; movdqa 0x5ba1(%edx),%xmm1
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,64,91,0,0 ; mulps 0x5b40(%edx),%xmm1
- DB 102,15,111,146,80,91,0,0 ; movdqa 0x5b50(%edx),%xmm2
+ DB 15,89,138,177,91,0,0 ; mulps 0x5bb1(%edx),%xmm1
+ DB 102,15,111,146,193,91,0,0 ; movdqa 0x5bc1(%edx),%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,96,91,0,0 ; mulps 0x5b60(%edx),%xmm2
- DB 102,15,219,154,112,91,0,0 ; pand 0x5b70(%edx),%xmm3
+ DB 15,89,146,209,91,0,0 ; mulps 0x5bd1(%edx),%xmm2
+ DB 102,15,219,154,225,91,0,0 ; pand 0x5be1(%edx),%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,128,91,0,0 ; mulps 0x5b80(%edx),%xmm3
+ DB 15,89,154,241,91,0,0 ; mulps 0x5bf1(%edx),%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
DB 82 ; push %edx
@@ -49259,22 +49735,22 @@ _sk_load_4444_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 44a3 <_sk_load_4444_sse2+0xd1>
+ DB 116,46 ; je 4622 <_sk_load_4444_sse2+0xd1>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 4491 <_sk_load_4444_sse2+0xbf>
+ DB 116,19 ; je 4610 <_sk_load_4444_sse2+0xbf>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,131 ; jne 4406 <_sk_load_4444_sse2+0x34>
+ DB 117,131 ; jne 4585 <_sk_load_4444_sse2+0x34>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,110,4,126 ; movd (%esi,%edi,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,216 ; movsd %xmm0,%xmm3
- DB 233,99,255,255,255 ; jmp 4406 <_sk_load_4444_sse2+0x34>
+ DB 233,99,255,255,255 ; jmp 4585 <_sk_load_4444_sse2+0x34>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,222 ; movd %esi,%xmm3
- DB 233,86,255,255,255 ; jmp 4406 <_sk_load_4444_sse2+0x34>
+ DB 233,86,255,255,255 ; jmp 4585 <_sk_load_4444_sse2+0x34>
PUBLIC _sk_load_4444_dst_sse2
_sk_load_4444_dst_sse2 LABEL PROC
@@ -49284,7 +49760,7 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 44be <_sk_load_4444_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 463d <_sk_load_4444_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49296,27 +49772,27 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,128,0,0,0 ; jne 455f <_sk_load_4444_dst_sse2+0xaf>
+ DB 15,133,128,0,0,0 ; jne 46de <_sk_load_4444_dst_sse2+0xaf>
DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,111,170,178,90,0,0 ; movdqa 0x5ab2(%edx),%xmm5
+ DB 102,15,111,170,35,91,0,0 ; movdqa 0x5b23(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,194,90,0,0 ; mulps 0x5ac2(%edx),%xmm5
+ DB 15,89,170,51,91,0,0 ; mulps 0x5b33(%edx),%xmm5
DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
- DB 102,15,111,170,210,90,0,0 ; movdqa 0x5ad2(%edx),%xmm5
+ DB 102,15,111,170,67,91,0,0 ; movdqa 0x5b43(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,226,90,0,0 ; mulps 0x5ae2(%edx),%xmm5
+ DB 15,89,170,83,91,0,0 ; mulps 0x5b53(%edx),%xmm5
DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
- DB 102,15,111,170,242,90,0,0 ; movdqa 0x5af2(%edx),%xmm5
+ DB 102,15,111,170,99,91,0,0 ; movdqa 0x5b63(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,2,91,0,0 ; mulps 0x5b02(%edx),%xmm5
+ DB 15,89,170,115,91,0,0 ; mulps 0x5b73(%edx),%xmm5
DB 15,41,105,48 ; movaps %xmm5,0x30(%ecx)
- DB 102,15,219,162,18,91,0,0 ; pand 0x5b12(%edx),%xmm4
+ DB 102,15,219,162,131,91,0,0 ; pand 0x5b83(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,34,91,0,0 ; mulps 0x5b22(%edx),%xmm4
+ DB 15,89,162,147,91,0,0 ; mulps 0x5b93(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -49331,22 +49807,22 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 4599 <_sk_load_4444_dst_sse2+0xe9>
+ DB 116,50 ; je 4718 <_sk_load_4444_dst_sse2+0xe9>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,23 ; je 4587 <_sk_load_4444_dst_sse2+0xd7>
+ DB 116,23 ; je 4706 <_sk_load_4444_dst_sse2+0xd7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,111,255,255,255 ; jne 44e8 <_sk_load_4444_dst_sse2+0x38>
+ DB 15,133,111,255,255,255 ; jne 4667 <_sk_load_4444_dst_sse2+0x38>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,110,44,126 ; movd (%esi,%edi,2),%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,79,255,255,255 ; jmp 44e8 <_sk_load_4444_dst_sse2+0x38>
+ DB 233,79,255,255,255 ; jmp 4667 <_sk_load_4444_dst_sse2+0x38>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 233,66,255,255,255 ; jmp 44e8 <_sk_load_4444_dst_sse2+0x38>
+ DB 233,66,255,255,255 ; jmp 4667 <_sk_load_4444_dst_sse2+0x38>
PUBLIC _sk_gather_4444_sse2
_sk_gather_4444_sse2 LABEL PROC
@@ -49380,25 +49856,25 @@ _sk_gather_4444_sse2 LABEL PROC
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 15,183,12,74 ; movzwl (%edx,%ecx,2),%ecx
DB 102,15,196,217,3 ; pinsrw $0x3,%ecx,%xmm3
- DB 232,0,0,0,0 ; call 4626 <_sk_gather_4444_sse2+0x80>
+ DB 232,0,0,0,0 ; call 47a5 <_sk_gather_4444_sse2+0x80>
DB 89 ; pop %ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,129,202,89,0,0 ; movdqa 0x59ca(%ecx),%xmm0
+ DB 102,15,111,129,59,90,0,0 ; movdqa 0x5a3b(%ecx),%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,129,218,89,0,0 ; mulps 0x59da(%ecx),%xmm0
- DB 102,15,111,137,234,89,0,0 ; movdqa 0x59ea(%ecx),%xmm1
+ DB 15,89,129,75,90,0,0 ; mulps 0x5a4b(%ecx),%xmm0
+ DB 102,15,111,137,91,90,0,0 ; movdqa 0x5a5b(%ecx),%xmm1
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,137,250,89,0,0 ; mulps 0x59fa(%ecx),%xmm1
- DB 102,15,111,145,10,90,0,0 ; movdqa 0x5a0a(%ecx),%xmm2
+ DB 15,89,137,107,90,0,0 ; mulps 0x5a6b(%ecx),%xmm1
+ DB 102,15,111,145,123,90,0,0 ; movdqa 0x5a7b(%ecx),%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,145,26,90,0,0 ; mulps 0x5a1a(%ecx),%xmm2
- DB 102,15,219,153,42,90,0,0 ; pand 0x5a2a(%ecx),%xmm3
+ DB 15,89,145,139,90,0,0 ; mulps 0x5a8b(%ecx),%xmm2
+ DB 102,15,219,153,155,90,0,0 ; pand 0x5a9b(%ecx),%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,153,58,90,0,0 ; mulps 0x5a3a(%ecx),%xmm3
+ DB 15,89,153,171,90,0,0 ; mulps 0x5aab(%ecx),%xmm3
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
DB 81 ; push %ecx
@@ -49416,7 +49892,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 46a3 <_sk_store_4444_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4822 <_sk_store_4444_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49426,7 +49902,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 1,210 ; add %edx,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,205,89,0,0 ; movaps 0x59cd(%edi),%xmm4
+ DB 15,40,167,62,90,0,0 ; movaps 0x5a3e(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -49452,7 +49928,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
DB 102,15,126,109,236 ; movd %xmm5,-0x14(%ebp)
DB 133,219 ; test %ebx,%ebx
- DB 117,34 ; jne 4746 <_sk_store_4444_sse2+0xb1>
+ DB 117,34 ; jne 48c5 <_sk_store_4444_sse2+0xb1>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,15,126,235 ; movd %xmm5,%ebx
DB 137,60,114 ; mov %edi,(%edx,%esi,2)
@@ -49472,20 +49948,20 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,37 ; je 477c <_sk_store_4444_sse2+0xe7>
+ DB 116,37 ; je 48fb <_sk_store_4444_sse2+0xe7>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,15 ; je 476b <_sk_store_4444_sse2+0xd6>
+ DB 116,15 ; je 48ea <_sk_store_4444_sse2+0xd6>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,210 ; jne 4733 <_sk_store_4444_sse2+0x9e>
+ DB 117,210 ; jne 48b2 <_sk_store_4444_sse2+0x9e>
DB 102,15,197,252,4 ; pextrw $0x4,%xmm4,%edi
DB 102,137,124,114,4 ; mov %di,0x4(%edx,%esi,2)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
DB 242,15,112,228,232 ; pshuflw $0xe8,%xmm4,%xmm4
DB 102,15,126,36,114 ; movd %xmm4,(%edx,%esi,2)
- DB 235,183 ; jmp 4733 <_sk_store_4444_sse2+0x9e>
+ DB 235,183 ; jmp 48b2 <_sk_store_4444_sse2+0x9e>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,137,60,114 ; mov %di,(%edx,%esi,2)
- DB 235,173 ; jmp 4733 <_sk_store_4444_sse2+0x9e>
+ DB 235,173 ; jmp 48b2 <_sk_store_4444_sse2+0x9e>
PUBLIC _sk_load_8888_sse2
_sk_load_8888_sse2 LABEL PROC
@@ -49495,7 +49971,7 @@ _sk_load_8888_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4794 <_sk_load_8888_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4913 <_sk_load_8888_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49507,13 +49983,13 @@ _sk_load_8888_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,102 ; jne 4818 <_sk_load_8888_sse2+0x92>
+ DB 117,102 ; jne 4997 <_sk_load_8888_sse2+0x92>
DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3
- DB 102,15,111,146,236,88,0,0 ; movdqa 0x58ec(%edx),%xmm2
+ DB 102,15,111,146,93,89,0,0 ; movdqa 0x595d(%edx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,162,252,88,0,0 ; movaps 0x58fc(%edx),%xmm4
+ DB 15,40,162,109,89,0,0 ; movaps 0x596d(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -49541,18 +50017,18 @@ _sk_load_8888_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,35 ; je 4843 <_sk_load_8888_sse2+0xbd>
+ DB 116,35 ; je 49c2 <_sk_load_8888_sse2+0xbd>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 4839 <_sk_load_8888_sse2+0xb3>
+ DB 116,16 ; je 49b8 <_sk_load_8888_sse2+0xb3>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,137 ; jne 47b7 <_sk_load_8888_sse2+0x31>
+ DB 117,137 ; jne 4936 <_sk_load_8888_sse2+0x31>
DB 102,15,110,68,190,8 ; movd 0x8(%esi,%edi,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,18,28,190 ; movlpd (%esi,%edi,4),%xmm3
- DB 233,116,255,255,255 ; jmp 47b7 <_sk_load_8888_sse2+0x31>
+ DB 233,116,255,255,255 ; jmp 4936 <_sk_load_8888_sse2+0x31>
DB 102,15,110,28,190 ; movd (%esi,%edi,4),%xmm3
- DB 233,106,255,255,255 ; jmp 47b7 <_sk_load_8888_sse2+0x31>
+ DB 233,106,255,255,255 ; jmp 4936 <_sk_load_8888_sse2+0x31>
PUBLIC _sk_load_8888_dst_sse2
_sk_load_8888_dst_sse2 LABEL PROC
@@ -49562,7 +50038,7 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 485b <_sk_load_8888_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 49da <_sk_load_8888_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49574,13 +50050,13 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,118 ; jne 48ef <_sk_load_8888_dst_sse2+0xa2>
+ DB 117,118 ; jne 4a6e <_sk_load_8888_dst_sse2+0xa2>
DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4
- DB 102,15,111,170,69,88,0,0 ; movdqa 0x5845(%edx),%xmm5
+ DB 102,15,111,170,182,88,0,0 ; movdqa 0x58b6(%edx),%xmm5
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,186,85,88,0,0 ; movaps 0x5855(%edx),%xmm7
+ DB 15,40,186,198,88,0,0 ; movaps 0x58c6(%edx),%xmm7
DB 15,89,247 ; mulps %xmm7,%xmm6
DB 15,41,113,16 ; movaps %xmm6,0x10(%ecx)
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
@@ -49612,18 +50088,18 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,39 ; je 491e <_sk_load_8888_dst_sse2+0xd1>
+ DB 116,39 ; je 4a9d <_sk_load_8888_dst_sse2+0xd1>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,20 ; je 4914 <_sk_load_8888_dst_sse2+0xc7>
+ DB 116,20 ; je 4a93 <_sk_load_8888_dst_sse2+0xc7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,117,255,255,255 ; jne 487e <_sk_load_8888_dst_sse2+0x31>
+ DB 15,133,117,255,255,255 ; jne 49fd <_sk_load_8888_dst_sse2+0x31>
DB 102,15,110,100,190,8 ; movd 0x8(%esi,%edi,4),%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,18,36,190 ; movlpd (%esi,%edi,4),%xmm4
- DB 233,96,255,255,255 ; jmp 487e <_sk_load_8888_dst_sse2+0x31>
+ DB 233,96,255,255,255 ; jmp 49fd <_sk_load_8888_dst_sse2+0x31>
DB 102,15,110,36,190 ; movd (%esi,%edi,4),%xmm4
- DB 233,86,255,255,255 ; jmp 487e <_sk_load_8888_dst_sse2+0x31>
+ DB 233,86,255,255,255 ; jmp 49fd <_sk_load_8888_dst_sse2+0x31>
PUBLIC _sk_gather_8888_sse2
_sk_gather_8888_sse2 LABEL PROC
@@ -49655,16 +50131,16 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,15,110,28,138 ; movd (%edx,%ecx,4),%xmm3
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 102,15,110,4,138 ; movd (%edx,%ecx,4),%xmm0
- DB 232,0,0,0,0 ; call 499e <_sk_gather_8888_sse2+0x76>
+ DB 232,0,0,0,0 ; call 4b1d <_sk_gather_8888_sse2+0x76>
DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
- DB 102,15,111,145,34,87,0,0 ; movdqa 0x5722(%ecx),%xmm2
+ DB 102,15,111,145,147,87,0,0 ; movdqa 0x5793(%ecx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,161,50,87,0,0 ; movaps 0x5732(%ecx),%xmm4
+ DB 15,40,161,163,87,0,0 ; movaps 0x57a3(%ecx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -49696,7 +50172,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4a19 <_sk_store_8888_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4b98 <_sk_store_8888_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49706,7 +50182,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 193,226,2 ; shl $0x2,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,199,86,0,0 ; movaps 0x56c7(%edi),%xmm4
+ DB 15,40,167,56,87,0,0 ; movaps 0x5738(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -49726,7 +50202,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 102,15,235,229 ; por %xmm5,%xmm4
DB 102,15,235,230 ; por %xmm6,%xmm4
DB 133,219 ; test %ebx,%ebx
- DB 117,24 ; jne 4a96 <_sk_store_8888_sse2+0x8b>
+ DB 117,24 ; jne 4c15 <_sk_store_8888_sse2+0x8b>
DB 243,15,127,36,178 ; movdqu %xmm4,(%edx,%esi,4)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -49741,17 +50217,17 @@ _sk_store_8888_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,28 ; je 4aba <_sk_store_8888_sse2+0xaf>
+ DB 116,28 ; je 4c39 <_sk_store_8888_sse2+0xaf>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 4ab3 <_sk_store_8888_sse2+0xa8>
+ DB 116,16 ; je 4c32 <_sk_store_8888_sse2+0xa8>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,219 ; jne 4a83 <_sk_store_8888_sse2+0x78>
+ DB 117,219 ; jne 4c02 <_sk_store_8888_sse2+0x78>
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,15,126,108,178,8 ; movd %xmm5,0x8(%edx,%esi,4)
DB 102,15,214,36,178 ; movq %xmm4,(%edx,%esi,4)
- DB 235,201 ; jmp 4a83 <_sk_store_8888_sse2+0x78>
+ DB 235,201 ; jmp 4c02 <_sk_store_8888_sse2+0x78>
DB 102,15,126,36,178 ; movd %xmm4,(%edx,%esi,4)
- DB 235,194 ; jmp 4a83 <_sk_store_8888_sse2+0x78>
+ DB 235,194 ; jmp 4c02 <_sk_store_8888_sse2+0x78>
PUBLIC _sk_load_bgra_sse2
_sk_load_bgra_sse2 LABEL PROC
@@ -49761,7 +50237,7 @@ _sk_load_bgra_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4acf <_sk_load_bgra_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4c4e <_sk_load_bgra_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49773,13 +50249,13 @@ _sk_load_bgra_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,102 ; jne 4b53 <_sk_load_bgra_sse2+0x92>
+ DB 117,102 ; jne 4cd2 <_sk_load_bgra_sse2+0x92>
DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3
- DB 102,15,111,130,33,86,0,0 ; movdqa 0x5621(%edx),%xmm0
+ DB 102,15,111,130,146,86,0,0 ; movdqa 0x5692(%edx),%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 15,40,162,49,86,0,0 ; movaps 0x5631(%edx),%xmm4
+ DB 15,40,162,162,86,0,0 ; movaps 0x56a2(%edx),%xmm4
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -49807,18 +50283,18 @@ _sk_load_bgra_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,35 ; je 4b7e <_sk_load_bgra_sse2+0xbd>
+ DB 116,35 ; je 4cfd <_sk_load_bgra_sse2+0xbd>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 4b74 <_sk_load_bgra_sse2+0xb3>
+ DB 116,16 ; je 4cf3 <_sk_load_bgra_sse2+0xb3>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,137 ; jne 4af2 <_sk_load_bgra_sse2+0x31>
+ DB 117,137 ; jne 4c71 <_sk_load_bgra_sse2+0x31>
DB 102,15,110,68,190,8 ; movd 0x8(%esi,%edi,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,18,28,190 ; movlpd (%esi,%edi,4),%xmm3
- DB 233,116,255,255,255 ; jmp 4af2 <_sk_load_bgra_sse2+0x31>
+ DB 233,116,255,255,255 ; jmp 4c71 <_sk_load_bgra_sse2+0x31>
DB 102,15,110,28,190 ; movd (%esi,%edi,4),%xmm3
- DB 233,106,255,255,255 ; jmp 4af2 <_sk_load_bgra_sse2+0x31>
+ DB 233,106,255,255,255 ; jmp 4c71 <_sk_load_bgra_sse2+0x31>
PUBLIC _sk_load_bgra_dst_sse2
_sk_load_bgra_dst_sse2 LABEL PROC
@@ -49828,7 +50304,7 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4b96 <_sk_load_bgra_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4d15 <_sk_load_bgra_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49840,13 +50316,13 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,118 ; jne 4c2a <_sk_load_bgra_dst_sse2+0xa2>
+ DB 117,118 ; jne 4da9 <_sk_load_bgra_dst_sse2+0xa2>
DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4
- DB 102,15,111,170,122,85,0,0 ; movdqa 0x557a(%edx),%xmm5
+ DB 102,15,111,170,235,85,0,0 ; movdqa 0x55eb(%edx),%xmm5
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,186,138,85,0,0 ; movaps 0x558a(%edx),%xmm7
+ DB 15,40,186,251,85,0,0 ; movaps 0x55fb(%edx),%xmm7
DB 15,89,247 ; mulps %xmm7,%xmm6
DB 15,41,113,48 ; movaps %xmm6,0x30(%ecx)
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
@@ -49878,18 +50354,18 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,39 ; je 4c59 <_sk_load_bgra_dst_sse2+0xd1>
+ DB 116,39 ; je 4dd8 <_sk_load_bgra_dst_sse2+0xd1>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,20 ; je 4c4f <_sk_load_bgra_dst_sse2+0xc7>
+ DB 116,20 ; je 4dce <_sk_load_bgra_dst_sse2+0xc7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,117,255,255,255 ; jne 4bb9 <_sk_load_bgra_dst_sse2+0x31>
+ DB 15,133,117,255,255,255 ; jne 4d38 <_sk_load_bgra_dst_sse2+0x31>
DB 102,15,110,100,190,8 ; movd 0x8(%esi,%edi,4),%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,18,36,190 ; movlpd (%esi,%edi,4),%xmm4
- DB 233,96,255,255,255 ; jmp 4bb9 <_sk_load_bgra_dst_sse2+0x31>
+ DB 233,96,255,255,255 ; jmp 4d38 <_sk_load_bgra_dst_sse2+0x31>
DB 102,15,110,36,190 ; movd (%esi,%edi,4),%xmm4
- DB 233,86,255,255,255 ; jmp 4bb9 <_sk_load_bgra_dst_sse2+0x31>
+ DB 233,86,255,255,255 ; jmp 4d38 <_sk_load_bgra_dst_sse2+0x31>
PUBLIC _sk_gather_bgra_sse2
_sk_gather_bgra_sse2 LABEL PROC
@@ -49921,16 +50397,16 @@ _sk_gather_bgra_sse2 LABEL PROC
DB 102,15,110,28,138 ; movd (%edx,%ecx,4),%xmm3
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 102,15,110,4,138 ; movd (%edx,%ecx,4),%xmm0
- DB 232,0,0,0,0 ; call 4cd9 <_sk_gather_bgra_sse2+0x76>
+ DB 232,0,0,0,0 ; call 4e58 <_sk_gather_bgra_sse2+0x76>
DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
- DB 102,15,111,129,87,84,0,0 ; movdqa 0x5457(%ecx),%xmm0
+ DB 102,15,111,129,200,84,0,0 ; movdqa 0x54c8(%ecx),%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 15,40,161,103,84,0,0 ; movaps 0x5467(%ecx),%xmm4
+ DB 15,40,161,216,84,0,0 ; movaps 0x54d8(%ecx),%xmm4
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -49962,7 +50438,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4d54 <_sk_store_bgra_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4ed3 <_sk_store_bgra_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -49972,7 +50448,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 193,226,2 ; shl $0x2,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,252,83,0,0 ; movaps 0x53fc(%edi),%xmm4
+ DB 15,40,167,109,84,0,0 ; movaps 0x546d(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -49992,7 +50468,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 102,15,235,229 ; por %xmm5,%xmm4
DB 102,15,235,230 ; por %xmm6,%xmm4
DB 133,219 ; test %ebx,%ebx
- DB 117,24 ; jne 4dd1 <_sk_store_bgra_sse2+0x8b>
+ DB 117,24 ; jne 4f50 <_sk_store_bgra_sse2+0x8b>
DB 243,15,127,36,178 ; movdqu %xmm4,(%edx,%esi,4)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -50007,17 +50483,17 @@ _sk_store_bgra_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,28 ; je 4df5 <_sk_store_bgra_sse2+0xaf>
+ DB 116,28 ; je 4f74 <_sk_store_bgra_sse2+0xaf>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 4dee <_sk_store_bgra_sse2+0xa8>
+ DB 116,16 ; je 4f6d <_sk_store_bgra_sse2+0xa8>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,219 ; jne 4dbe <_sk_store_bgra_sse2+0x78>
+ DB 117,219 ; jne 4f3d <_sk_store_bgra_sse2+0x78>
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,15,126,108,178,8 ; movd %xmm5,0x8(%edx,%esi,4)
DB 102,15,214,36,178 ; movq %xmm4,(%edx,%esi,4)
- DB 235,201 ; jmp 4dbe <_sk_store_bgra_sse2+0x78>
+ DB 235,201 ; jmp 4f3d <_sk_store_bgra_sse2+0x78>
DB 102,15,126,36,178 ; movd %xmm4,(%edx,%esi,4)
- DB 235,194 ; jmp 4dbe <_sk_store_bgra_sse2+0x78>
+ DB 235,194 ; jmp 4f3d <_sk_store_bgra_sse2+0x78>
PUBLIC _sk_load_f16_sse2
_sk_load_f16_sse2 LABEL PROC
@@ -50027,7 +50503,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,92 ; sub $0x5c,%esp
- DB 232,0,0,0,0 ; call 4e0a <_sk_load_f16_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4f89 <_sk_load_f16_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50039,7 +50515,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,160,1,0,0 ; jne 4fcc <_sk_load_f16_sse2+0x1d0>
+ DB 15,133,160,1,0,0 ; jne 514b <_sk_load_f16_sse2+0x1d0>
DB 102,15,16,4,254 ; movupd (%esi,%edi,8),%xmm0
DB 243,15,111,76,254,16 ; movdqu 0x10(%esi,%edi,8),%xmm1
DB 102,15,40,216 ; movapd %xmm0,%xmm3
@@ -50067,7 +50543,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,15,126,69,232 ; movd %xmm0,-0x18(%ebp)
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,111,154,86,83,0,0 ; movdqa 0x5356(%edx),%xmm3
+ DB 102,15,111,154,199,83,0,0 ; movdqa 0x53c7(%edx),%xmm3
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,219,227 ; pand %xmm3,%xmm4
DB 102,15,239,204 ; pxor %xmm4,%xmm1
@@ -50100,15 +50576,15 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,114,240,13 ; pslld $0xd,%xmm0
DB 102,15,235,195 ; por %xmm3,%xmm0
- DB 102,15,111,154,102,83,0,0 ; movdqa 0x5366(%edx),%xmm3
+ DB 102,15,111,154,215,83,0,0 ; movdqa 0x53d7(%edx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,254,243 ; paddd %xmm3,%xmm6
DB 102,15,254,235 ; paddd %xmm3,%xmm5
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,154,118,83,0,0 ; movdqa 0x5376(%edx),%xmm3
+ DB 102,15,111,154,231,83,0,0 ; movdqa 0x53e7(%edx),%xmm3
DB 102,15,127,93,184 ; movdqa %xmm3,-0x48(%ebp)
DB 102,15,239,203 ; pxor %xmm3,%xmm1
- DB 102,15,111,154,134,83,0,0 ; movdqa 0x5386(%edx),%xmm3
+ DB 102,15,111,154,247,83,0,0 ; movdqa 0x53f7(%edx),%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
DB 102,15,223,226 ; pandn %xmm2,%xmm4
@@ -50140,12 +50616,12 @@ _sk_load_f16_sse2 LABEL PROC
DB 242,15,16,4,254 ; movsd (%esi,%edi,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,251,1 ; cmp $0x1,%ebx
- DB 15,132,89,254,255,255 ; je 4e37 <_sk_load_f16_sse2+0x3b>
+ DB 15,132,89,254,255,255 ; je 4fb6 <_sk_load_f16_sse2+0x3b>
DB 102,15,22,68,254,8 ; movhpd 0x8(%esi,%edi,8),%xmm0
DB 131,251,3 ; cmp $0x3,%ebx
- DB 15,130,74,254,255,255 ; jb 4e37 <_sk_load_f16_sse2+0x3b>
+ DB 15,130,74,254,255,255 ; jb 4fb6 <_sk_load_f16_sse2+0x3b>
DB 243,15,126,76,254,16 ; movq 0x10(%esi,%edi,8),%xmm1
- DB 233,63,254,255,255 ; jmp 4e37 <_sk_load_f16_sse2+0x3b>
+ DB 233,63,254,255,255 ; jmp 4fb6 <_sk_load_f16_sse2+0x3b>
PUBLIC _sk_load_f16_dst_sse2
_sk_load_f16_dst_sse2 LABEL PROC
@@ -50159,7 +50635,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 15,41,149,120,255,255,255 ; movaps %xmm2,-0x88(%ebp)
DB 102,15,127,77,136 ; movdqa %xmm1,-0x78(%ebp)
DB 15,41,69,152 ; movaps %xmm0,-0x68(%ebp)
- DB 232,0,0,0,0 ; call 5020 <_sk_load_f16_dst_sse2+0x28>
+ DB 232,0,0,0,0 ; call 519f <_sk_load_f16_dst_sse2+0x28>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50171,7 +50647,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,206,1,0,0 ; jne 5210 <_sk_load_f16_dst_sse2+0x218>
+ DB 15,133,206,1,0,0 ; jne 538f <_sk_load_f16_dst_sse2+0x218>
DB 102,15,16,4,254 ; movupd (%esi,%edi,8),%xmm0
DB 243,15,111,76,254,16 ; movdqu 0x10(%esi,%edi,8),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -50199,7 +50675,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,15,126,85,232 ; movd %xmm2,-0x18(%ebp)
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4
- DB 102,15,111,154,128,81,0,0 ; movdqa 0x5180(%edx),%xmm3
+ DB 102,15,111,154,241,81,0,0 ; movdqa 0x51f1(%edx),%xmm3
DB 102,15,111,212 ; movdqa %xmm4,%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 102,15,239,226 ; pxor %xmm2,%xmm4
@@ -50207,13 +50683,13 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,15,111,204 ; movdqa %xmm4,%xmm1
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,15,111,146,160,81,0,0 ; movdqa 0x51a0(%edx),%xmm2
+ DB 102,15,111,146,17,82,0,0 ; movdqa 0x5211(%edx),%xmm2
DB 102,15,127,85,168 ; movdqa %xmm2,-0x58(%ebp)
DB 102,15,239,226 ; pxor %xmm2,%xmm4
- DB 102,15,111,178,176,81,0,0 ; movdqa 0x51b0(%edx),%xmm6
+ DB 102,15,111,178,33,82,0,0 ; movdqa 0x5221(%edx),%xmm6
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
DB 102,15,102,252 ; pcmpgtd %xmm4,%xmm7
- DB 102,15,111,146,144,81,0,0 ; movdqa 0x5190(%edx),%xmm2
+ DB 102,15,111,146,1,82,0,0 ; movdqa 0x5201(%edx),%xmm2
DB 102,15,127,85,184 ; movdqa %xmm2,-0x48(%ebp)
DB 102,15,254,202 ; paddd %xmm2,%xmm1
DB 102,15,223,249 ; pandn %xmm1,%xmm7
@@ -50281,12 +50757,12 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 242,15,16,4,254 ; movsd (%esi,%edi,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,251,1 ; cmp $0x1,%ebx
- DB 15,132,43,254,255,255 ; je 504d <_sk_load_f16_dst_sse2+0x55>
+ DB 15,132,43,254,255,255 ; je 51cc <_sk_load_f16_dst_sse2+0x55>
DB 102,15,22,68,254,8 ; movhpd 0x8(%esi,%edi,8),%xmm0
DB 131,251,3 ; cmp $0x3,%ebx
- DB 15,130,28,254,255,255 ; jb 504d <_sk_load_f16_dst_sse2+0x55>
+ DB 15,130,28,254,255,255 ; jb 51cc <_sk_load_f16_dst_sse2+0x55>
DB 243,15,126,76,254,16 ; movq 0x10(%esi,%edi,8),%xmm1
- DB 233,17,254,255,255 ; jmp 504d <_sk_load_f16_dst_sse2+0x55>
+ DB 233,17,254,255,255 ; jmp 51cc <_sk_load_f16_dst_sse2+0x55>
PUBLIC _sk_gather_f16_sse2
_sk_gather_f16_sse2 LABEL PROC
@@ -50322,7 +50798,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,126,194 ; movd %xmm0,%edx
DB 102,15,110,68,209,4 ; movd 0x4(%ecx,%edx,8),%xmm0
DB 102,15,110,60,209 ; movd (%ecx,%edx,8),%xmm7
- DB 232,0,0,0,0 ; call 52ca <_sk_gather_f16_sse2+0x8e>
+ DB 232,0,0,0,0 ; call 5449 <_sk_gather_f16_sse2+0x8e>
DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,227 ; punpckldq %xmm3,%xmm4
@@ -50355,7 +50831,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,126,69,248 ; movd %xmm0,-0x8(%ebp)
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,111,153,22,79,0,0 ; movdqa 0x4f16(%ecx),%xmm3
+ DB 102,15,111,153,135,79,0,0 ; movdqa 0x4f87(%ecx),%xmm3
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,219,227 ; pand %xmm3,%xmm4
DB 102,15,239,204 ; pxor %xmm4,%xmm1
@@ -50388,15 +50864,15 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,114,240,13 ; pslld $0xd,%xmm0
DB 102,15,235,195 ; por %xmm3,%xmm0
- DB 102,15,111,153,38,79,0,0 ; movdqa 0x4f26(%ecx),%xmm3
+ DB 102,15,111,153,151,79,0,0 ; movdqa 0x4f97(%ecx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,254,243 ; paddd %xmm3,%xmm6
DB 102,15,254,235 ; paddd %xmm3,%xmm5
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,153,54,79,0,0 ; movdqa 0x4f36(%ecx),%xmm3
+ DB 102,15,111,153,167,79,0,0 ; movdqa 0x4fa7(%ecx),%xmm3
DB 102,15,127,93,200 ; movdqa %xmm3,-0x38(%ebp)
DB 102,15,239,203 ; pxor %xmm3,%xmm1
- DB 102,15,111,153,70,79,0,0 ; movdqa 0x4f46(%ecx),%xmm3
+ DB 102,15,111,153,183,79,0,0 ; movdqa 0x4fb7(%ecx),%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
DB 102,15,223,226 ; pandn %xmm2,%xmm4
@@ -50433,20 +50909,20 @@ _sk_store_f16_sse2 LABEL PROC
DB 131,236,80 ; sub $0x50,%esp
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 548d <_sk_store_f16_sse2+0x15>
+ DB 232,0,0,0,0 ; call 560c <_sk_store_f16_sse2+0x15>
DB 88 ; pop %eax
- DB 102,15,111,176,147,77,0,0 ; movdqa 0x4d93(%eax),%xmm6
+ DB 102,15,111,176,4,78,0,0 ; movdqa 0x4e04(%eax),%xmm6
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,15,219,214 ; pand %xmm6,%xmm2
DB 102,15,127,69,200 ; movdqa %xmm0,-0x38(%ebp)
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
DB 102,15,239,234 ; pxor %xmm2,%xmm5
- DB 102,15,111,160,163,77,0,0 ; movdqa 0x4da3(%eax),%xmm4
+ DB 102,15,111,160,20,78,0,0 ; movdqa 0x4e14(%eax),%xmm4
DB 102,15,114,210,16 ; psrld $0x10,%xmm2
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,15,102,197 ; pcmpgtd %xmm5,%xmm0
DB 102,15,114,213,13 ; psrld $0xd,%xmm5
- DB 102,15,111,184,179,77,0,0 ; movdqa 0x4db3(%eax),%xmm7
+ DB 102,15,111,184,36,78,0,0 ; movdqa 0x4e24(%eax),%xmm7
DB 102,15,254,215 ; paddd %xmm7,%xmm2
DB 102,15,127,125,232 ; movdqa %xmm7,-0x18(%ebp)
DB 102,15,254,213 ; paddd %xmm5,%xmm2
@@ -50508,7 +50984,7 @@ _sk_store_f16_sse2 LABEL PROC
DB 3,55 ; add (%edi),%esi
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 133,255 ; test %edi,%edi
- DB 117,53 ; jne 55ff <_sk_store_f16_sse2+0x187>
+ DB 117,53 ; jne 577e <_sk_store_f16_sse2+0x187>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,98,197 ; punpckldq %xmm5,%xmm0
DB 243,15,127,4,214 ; movdqu %xmm0,(%esi,%edx,8)
@@ -50531,13 +51007,13 @@ _sk_store_f16_sse2 LABEL PROC
DB 102,15,98,213 ; punpckldq %xmm5,%xmm2
DB 102,15,214,20,214 ; movq %xmm2,(%esi,%edx,8)
DB 131,255,1 ; cmp $0x1,%edi
- DB 116,208 ; je 55e1 <_sk_store_f16_sse2+0x169>
+ DB 116,208 ; je 5760 <_sk_store_f16_sse2+0x169>
DB 102,15,23,84,214,8 ; movhpd %xmm2,0x8(%esi,%edx,8)
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,197 ; jb 55e1 <_sk_store_f16_sse2+0x169>
+ DB 114,197 ; jb 5760 <_sk_store_f16_sse2+0x169>
DB 102,15,106,205 ; punpckhdq %xmm5,%xmm1
DB 102,15,214,76,214,16 ; movq %xmm1,0x10(%esi,%edx,8)
- DB 235,185 ; jmp 55e1 <_sk_store_f16_sse2+0x169>
+ DB 235,185 ; jmp 5760 <_sk_store_f16_sse2+0x169>
PUBLIC _sk_load_u16_be_sse2
_sk_load_u16_be_sse2 LABEL PROC
@@ -50558,9 +51034,9 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 193,230,2 ; shl $0x2,%esi
DB 133,219 ; test %ebx,%ebx
- DB 232,0,0,0,0 ; call 5653 <_sk_load_u16_be_sse2+0x2b>
+ DB 232,0,0,0,0 ; call 57d2 <_sk_load_u16_be_sse2+0x2b>
DB 90 ; pop %edx
- DB 15,133,11,1,0,0 ; jne 5765 <_sk_load_u16_be_sse2+0x13d>
+ DB 15,133,11,1,0,0 ; jne 58e4 <_sk_load_u16_be_sse2+0x13d>
DB 102,15,16,4,119 ; movupd (%edi,%esi,2),%xmm0
DB 243,15,111,76,119,16 ; movdqu 0x10(%edi,%esi,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -50581,7 +51057,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,162,253,75,0,0 ; movaps 0x4bfd(%edx),%xmm4
+ DB 15,40,162,110,76,0,0 ; movaps 0x4c6e(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,205 ; movdqa %xmm5,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -50631,12 +51107,12 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 242,15,16,4,119 ; movsd (%edi,%esi,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,251,1 ; cmp $0x1,%ebx
- DB 15,132,238,254,255,255 ; je 5665 <_sk_load_u16_be_sse2+0x3d>
+ DB 15,132,238,254,255,255 ; je 57e4 <_sk_load_u16_be_sse2+0x3d>
DB 102,15,22,68,119,8 ; movhpd 0x8(%edi,%esi,2),%xmm0
DB 131,251,3 ; cmp $0x3,%ebx
- DB 15,130,223,254,255,255 ; jb 5665 <_sk_load_u16_be_sse2+0x3d>
+ DB 15,130,223,254,255,255 ; jb 57e4 <_sk_load_u16_be_sse2+0x3d>
DB 243,15,126,76,119,16 ; movq 0x10(%edi,%esi,2),%xmm1
- DB 233,212,254,255,255 ; jmp 5665 <_sk_load_u16_be_sse2+0x3d>
+ DB 233,212,254,255,255 ; jmp 57e4 <_sk_load_u16_be_sse2+0x3d>
PUBLIC _sk_load_rgb_u16_be_sse2
_sk_load_rgb_u16_be_sse2 LABEL PROC
@@ -50656,9 +51132,9 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 3,50 ; add (%edx),%esi
DB 107,25,3 ; imul $0x3,(%ecx),%ebx
DB 133,255 ; test %edi,%edi
- DB 232,0,0,0,0 ; call 57ba <_sk_load_rgb_u16_be_sse2+0x29>
+ DB 232,0,0,0,0 ; call 5939 <_sk_load_rgb_u16_be_sse2+0x29>
DB 90 ; pop %edx
- DB 15,133,240,0,0,0 ; jne 58b1 <_sk_load_rgb_u16_be_sse2+0x120>
+ DB 15,133,240,0,0,0 ; jne 5a30 <_sk_load_rgb_u16_be_sse2+0x120>
DB 243,15,111,20,94 ; movdqu (%esi,%ebx,2),%xmm2
DB 243,15,111,92,94,8 ; movdqu 0x8(%esi,%ebx,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -50683,7 +51159,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,170,166,74,0,0 ; movaps 0x4aa6(%edx),%xmm5
+ DB 15,40,170,23,75,0,0 ; movaps 0x4b17(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 102,15,111,204 ; movdqa %xmm4,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -50709,7 +51185,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,182,74,0,0 ; movaps 0x4ab6(%edx),%xmm3
+ DB 15,40,154,39,75,0,0 ; movaps 0x4b27(%edx),%xmm3
DB 86 ; push %esi
DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
@@ -50723,20 +51199,20 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,15,196,84,94,4,2 ; pinsrw $0x2,0x4(%esi,%ebx,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,255,1 ; cmp $0x1,%edi
- DB 117,13 ; jne 58d3 <_sk_load_rgb_u16_be_sse2+0x142>
+ DB 117,13 ; jne 5a52 <_sk_load_rgb_u16_be_sse2+0x142>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,16,255,255,255 ; jmp 57e3 <_sk_load_rgb_u16_be_sse2+0x52>
+ DB 233,16,255,255,255 ; jmp 5962 <_sk_load_rgb_u16_be_sse2+0x52>
DB 102,15,110,68,94,6 ; movd 0x6(%esi,%ebx,2),%xmm0
DB 102,15,196,68,94,10,2 ; pinsrw $0x2,0xa(%esi,%ebx,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,18 ; jb 58fb <_sk_load_rgb_u16_be_sse2+0x16a>
+ DB 114,18 ; jb 5a7a <_sk_load_rgb_u16_be_sse2+0x16a>
DB 102,15,110,92,94,12 ; movd 0xc(%esi,%ebx,2),%xmm3
DB 102,15,196,92,94,16,2 ; pinsrw $0x2,0x10(%esi,%ebx,2),%xmm3
- DB 233,232,254,255,255 ; jmp 57e3 <_sk_load_rgb_u16_be_sse2+0x52>
+ DB 233,232,254,255,255 ; jmp 5962 <_sk_load_rgb_u16_be_sse2+0x52>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,223,254,255,255 ; jmp 57e3 <_sk_load_rgb_u16_be_sse2+0x52>
+ DB 233,223,254,255,255 ; jmp 5962 <_sk_load_rgb_u16_be_sse2+0x52>
PUBLIC _sk_store_u16_be_sse2
_sk_store_u16_be_sse2 LABEL PROC
@@ -50746,9 +51222,9 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 86 ; push %esi
DB 131,236,16 ; sub $0x10,%esp
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
- DB 232,0,0,0,0 ; call 5915 <_sk_store_u16_be_sse2+0x11>
+ DB 232,0,0,0,0 ; call 5a94 <_sk_store_u16_be_sse2+0x11>
DB 88 ; pop %eax
- DB 15,40,176,107,73,0,0 ; movaps 0x496b(%eax),%xmm6
+ DB 15,40,176,220,73,0,0 ; movaps 0x49dc(%eax),%xmm6
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,89,230 ; mulps %xmm6,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
@@ -50801,7 +51277,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 193,226,2 ; shl $0x2,%edx
DB 133,255 ; test %edi,%edi
- DB 117,45 ; jne 5a17 <_sk_store_u16_be_sse2+0x113>
+ DB 117,45 ; jne 5b96 <_sk_store_u16_be_sse2+0x113>
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
DB 102,15,98,221 ; punpckldq %xmm5,%xmm3
DB 243,15,127,28,86 ; movdqu %xmm3,(%esi,%edx,2)
@@ -50822,13 +51298,13 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 102,15,98,245 ; punpckldq %xmm5,%xmm6
DB 102,15,214,52,86 ; movq %xmm6,(%esi,%edx,2)
DB 131,255,1 ; cmp $0x1,%edi
- DB 116,216 ; je 5a01 <_sk_store_u16_be_sse2+0xfd>
+ DB 116,216 ; je 5b80 <_sk_store_u16_be_sse2+0xfd>
DB 102,15,23,116,86,8 ; movhpd %xmm6,0x8(%esi,%edx,2)
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,205 ; jb 5a01 <_sk_store_u16_be_sse2+0xfd>
+ DB 114,205 ; jb 5b80 <_sk_store_u16_be_sse2+0xfd>
DB 102,15,106,229 ; punpckhdq %xmm5,%xmm4
DB 102,15,214,100,86,16 ; movq %xmm4,0x10(%esi,%edx,2)
- DB 235,193 ; jmp 5a01 <_sk_store_u16_be_sse2+0xfd>
+ DB 235,193 ; jmp 5b80 <_sk_store_u16_be_sse2+0xfd>
PUBLIC _sk_load_f32_sse2
_sk_load_f32_sse2 LABEL PROC
@@ -50849,7 +51325,7 @@ _sk_load_f32_sse2 LABEL PROC
DB 15,16,36,23 ; movups (%edi,%edx,1),%xmm4
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 133,255 ; test %edi,%edi
- DB 117,71 ; jne 5ab7 <_sk_load_f32_sse2+0x77>
+ DB 117,71 ; jne 5c36 <_sk_load_f32_sse2+0x77>
DB 15,16,84,178,16 ; movups 0x10(%edx,%esi,4),%xmm2
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
DB 15,16,68,178,48 ; movups 0x30(%edx,%esi,4),%xmm0
@@ -50877,17 +51353,17 @@ _sk_load_f32_sse2 LABEL PROC
DB 195 ; ret
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 131,255,1 ; cmp $0x1,%edi
- DB 117,8 ; jne 5ac7 <_sk_load_f32_sse2+0x87>
+ DB 117,8 ; jne 5c46 <_sk_load_f32_sse2+0x87>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,210 ; xorps %xmm2,%xmm2
- DB 235,184 ; jmp 5a7f <_sk_load_f32_sse2+0x3f>
+ DB 235,184 ; jmp 5bfe <_sk_load_f32_sse2+0x3f>
DB 15,16,84,178,16 ; movups 0x10(%edx,%esi,4),%xmm2
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,7 ; jb 5ad8 <_sk_load_f32_sse2+0x98>
+ DB 114,7 ; jb 5c57 <_sk_load_f32_sse2+0x98>
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
- DB 235,167 ; jmp 5a7f <_sk_load_f32_sse2+0x3f>
+ DB 235,167 ; jmp 5bfe <_sk_load_f32_sse2+0x3f>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,162 ; jmp 5a7f <_sk_load_f32_sse2+0x3f>
+ DB 235,162 ; jmp 5bfe <_sk_load_f32_sse2+0x3f>
PUBLIC _sk_load_f32_dst_sse2
_sk_load_f32_dst_sse2 LABEL PROC
@@ -50911,7 +51387,7 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 15,16,52,23 ; movups (%edi,%edx,1),%xmm6
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 133,255 ; test %edi,%edi
- DB 117,97 ; jne 5b79 <_sk_load_f32_dst_sse2+0x9c>
+ DB 117,97 ; jne 5cf8 <_sk_load_f32_dst_sse2+0x9c>
DB 15,16,124,178,16 ; movups 0x10(%edx,%esi,4),%xmm7
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
DB 15,16,84,178,48 ; movups 0x30(%edx,%esi,4),%xmm2
@@ -50945,17 +51421,17 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 195 ; ret
DB 15,87,210 ; xorps %xmm2,%xmm2
DB 131,255,1 ; cmp $0x1,%edi
- DB 117,8 ; jne 5b89 <_sk_load_f32_dst_sse2+0xac>
+ DB 117,8 ; jne 5d08 <_sk_load_f32_dst_sse2+0xac>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,158 ; jmp 5b27 <_sk_load_f32_dst_sse2+0x4a>
+ DB 235,158 ; jmp 5ca6 <_sk_load_f32_dst_sse2+0x4a>
DB 15,16,124,178,16 ; movups 0x10(%edx,%esi,4),%xmm7
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,7 ; jb 5b9a <_sk_load_f32_dst_sse2+0xbd>
+ DB 114,7 ; jb 5d19 <_sk_load_f32_dst_sse2+0xbd>
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
- DB 235,141 ; jmp 5b27 <_sk_load_f32_dst_sse2+0x4a>
+ DB 235,141 ; jmp 5ca6 <_sk_load_f32_dst_sse2+0x4a>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,136 ; jmp 5b27 <_sk_load_f32_dst_sse2+0x4a>
+ DB 235,136 ; jmp 5ca6 <_sk_load_f32_dst_sse2+0x4a>
PUBLIC _sk_store_f32_sse2
_sk_store_f32_sse2 LABEL PROC
@@ -50991,7 +51467,7 @@ _sk_store_f32_sse2 LABEL PROC
DB 15,40,238 ; movaps %xmm6,%xmm5
DB 102,15,20,239 ; unpcklpd %xmm7,%xmm5
DB 133,255 ; test %edi,%edi
- DB 117,40 ; jne 5c25 <_sk_store_f32_sse2+0x86>
+ DB 117,40 ; jne 5da4 <_sk_store_f32_sse2+0x86>
DB 102,15,21,247 ; unpckhpd %xmm7,%xmm6
DB 15,17,100,178,16 ; movups %xmm4,0x10(%edx,%esi,4)
DB 102,15,17,108,178,32 ; movupd %xmm5,0x20(%edx,%esi,4)
@@ -51008,12 +51484,12 @@ _sk_store_f32_sse2 LABEL PROC
DB 93 ; pop %ebp
DB 195 ; ret
DB 131,255,1 ; cmp $0x1,%edi
- DB 116,232 ; je 5c12 <_sk_store_f32_sse2+0x73>
+ DB 116,232 ; je 5d91 <_sk_store_f32_sse2+0x73>
DB 15,17,100,178,16 ; movups %xmm4,0x10(%edx,%esi,4)
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,222 ; jb 5c12 <_sk_store_f32_sse2+0x73>
+ DB 114,222 ; jb 5d91 <_sk_store_f32_sse2+0x73>
DB 102,15,17,108,178,32 ; movupd %xmm5,0x20(%edx,%esi,4)
- DB 235,214 ; jmp 5c12 <_sk_store_f32_sse2+0x73>
+ DB 235,214 ; jmp 5d91 <_sk_store_f32_sse2+0x73>
PUBLIC _sk_clamp_x_sse2
_sk_clamp_x_sse2 LABEL PROC
@@ -51068,7 +51544,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5cb9 <_sk_repeat_x_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5e38 <_sk_repeat_x_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -51079,7 +51555,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,15,91,230 ; cvttps2dq %xmm6,%xmm4
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,215,69,0,0 ; andps 0x45d7(%ecx),%xmm6
+ DB 15,84,177,72,70,0,0 ; andps 0x4648(%ecx),%xmm6
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -51104,7 +51580,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5d1f <_sk_repeat_y_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5e9e <_sk_repeat_y_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -51115,7 +51591,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,15,91,230 ; cvttps2dq %xmm6,%xmm4
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,129,69,0,0 ; andps 0x4581(%ecx),%xmm6
+ DB 15,84,177,242,69,0,0 ; andps 0x45f2(%ecx),%xmm6
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -51140,7 +51616,7 @@ _sk_mirror_x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5d85 <_sk_mirror_x_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5f04 <_sk_mirror_x_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -51149,13 +51625,13 @@ _sk_mirror_x_sse2 LABEL PROC
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 243,15,89,177,171,74,0,0 ; mulss 0x4aab(%ecx),%xmm6
+ DB 243,15,89,177,28,75,0,0 ; mulss 0x4b1c(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,43,69,0,0 ; andps 0x452b(%ecx),%xmm6
+ DB 15,84,177,156,69,0,0 ; andps 0x459c(%ecx),%xmm6
DB 15,92,254 ; subps %xmm6,%xmm7
DB 243,15,88,237 ; addss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -51184,7 +51660,7 @@ _sk_mirror_y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5e0a <_sk_mirror_y_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5f89 <_sk_mirror_y_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -51193,13 +51669,13 @@ _sk_mirror_y_sse2 LABEL PROC
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,204 ; subps %xmm4,%xmm1
- DB 243,15,89,177,42,74,0,0 ; mulss 0x4a2a(%ecx),%xmm6
+ DB 243,15,89,177,155,74,0,0 ; mulss 0x4a9b(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,182,68,0,0 ; andps 0x44b6(%ecx),%xmm6
+ DB 15,84,177,39,69,0,0 ; andps 0x4527(%ecx),%xmm6
DB 15,92,254 ; subps %xmm6,%xmm7
DB 243,15,88,237 ; addss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -51228,12 +51704,12 @@ _sk_clamp_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5e8f <_sk_clamp_x_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 600e <_sk_clamp_x_1_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,95,224 ; maxps %xmm0,%xmm4
- DB 15,93,160,65,68,0,0 ; minps 0x4441(%eax),%xmm4
+ DB 15,93,160,178,68,0,0 ; minps 0x44b2(%eax),%xmm4
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
@@ -51249,14 +51725,14 @@ _sk_repeat_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5ebf <_sk_repeat_x_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 603e <_sk_repeat_x_1_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 243,15,91,224 ; cvttps2dq %xmm0,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,194,236,1 ; cmpltps %xmm4,%xmm5
- DB 15,84,168,33,68,0,0 ; andps 0x4421(%eax),%xmm5
+ DB 15,84,168,146,68,0,0 ; andps 0x4492(%eax),%xmm5
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
DB 141,65,4 ; lea 0x4(%ecx),%eax
@@ -51273,17 +51749,17 @@ _sk_mirror_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5efa <_sk_mirror_x_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 6079 <_sk_mirror_x_1_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 15,40,161,246,67,0,0 ; movaps 0x43f6(%ecx),%xmm4
+ DB 15,40,161,103,68,0,0 ; movaps 0x4467(%ecx),%xmm4
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,40,169,6,68,0,0 ; movaps 0x4406(%ecx),%xmm5
+ DB 15,40,169,119,68,0,0 ; movaps 0x4477(%ecx),%xmm5
DB 15,89,232 ; mulps %xmm0,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,194,238,1 ; cmpltps %xmm6,%xmm5
- DB 15,84,169,22,68,0,0 ; andps 0x4416(%ecx),%xmm5
+ DB 15,84,169,135,68,0,0 ; andps 0x4487(%ecx),%xmm5
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,92,245 ; subps %xmm5,%xmm6
DB 15,88,246 ; addps %xmm6,%xmm6
@@ -51306,13 +51782,13 @@ _sk_luminance_to_alpha_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 5f58 <_sk_luminance_to_alpha_sse2+0xe>
+ DB 232,0,0,0,0 ; call 60d7 <_sk_luminance_to_alpha_sse2+0xe>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,89,128,200,67,0,0 ; mulps 0x43c8(%eax),%xmm0
- DB 15,89,136,216,67,0,0 ; mulps 0x43d8(%eax),%xmm1
+ DB 15,89,128,57,68,0,0 ; mulps 0x4439(%eax),%xmm0
+ DB 15,89,136,73,68,0,0 ; mulps 0x4449(%eax),%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,152,232,67,0,0 ; mulps 0x43e8(%eax),%xmm3
+ DB 15,89,152,89,68,0,0 ; mulps 0x4459(%eax),%xmm3
DB 15,88,217 ; addps %xmm1,%xmm3
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -51686,7 +52162,7 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 86 ; push %esi
DB 131,236,60 ; sub $0x3c,%esp
DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
- DB 232,0,0,0,0 ; call 63f5 <_sk_evenly_spaced_gradient_sse2+0x12>
+ DB 232,0,0,0,0 ; call 6574 <_sk_evenly_spaced_gradient_sse2+0x12>
DB 90 ; pop %edx
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,65,4 ; lea 0x4(%ecx),%eax
@@ -51697,12 +52173,12 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 78 ; dec %esi
DB 102,15,110,206 ; movd %esi,%xmm1
DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
- DB 102,15,111,146,91,63,0,0 ; movdqa 0x3f5b(%edx),%xmm2
+ DB 102,15,111,146,204,63,0,0 ; movdqa 0x3fcc(%edx),%xmm2
DB 102,15,219,209 ; pand %xmm1,%xmm2
- DB 102,15,235,146,107,63,0,0 ; por 0x3f6b(%edx),%xmm2
+ DB 102,15,235,146,220,63,0,0 ; por 0x3fdc(%edx),%xmm2
DB 102,15,114,209,16 ; psrld $0x10,%xmm1
- DB 102,15,235,138,123,63,0,0 ; por 0x3f7b(%edx),%xmm1
- DB 15,88,138,139,63,0,0 ; addps 0x3f8b(%edx),%xmm1
+ DB 102,15,235,138,236,63,0,0 ; por 0x3fec(%edx),%xmm1
+ DB 15,88,138,252,63,0,0 ; addps 0x3ffc(%edx),%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1
@@ -51807,18 +52283,18 @@ _sk_gauss_a_to_rgba_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 65ab <_sk_gauss_a_to_rgba_sse2+0xb>
+ DB 232,0,0,0,0 ; call 672a <_sk_gauss_a_to_rgba_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,128,229,61,0,0 ; movaps 0x3de5(%eax),%xmm0
+ DB 15,40,128,86,62,0,0 ; movaps 0x3e56(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,245,61,0,0 ; addps 0x3df5(%eax),%xmm0
+ DB 15,88,128,102,62,0,0 ; addps 0x3e66(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,5,62,0,0 ; addps 0x3e05(%eax),%xmm0
+ DB 15,88,128,118,62,0,0 ; addps 0x3e76(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,21,62,0,0 ; addps 0x3e15(%eax),%xmm0
+ DB 15,88,128,134,62,0,0 ; addps 0x3e86(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,37,62,0,0 ; addps 0x3e25(%eax),%xmm0
+ DB 15,88,128,150,62,0,0 ; addps 0x3e96(%eax),%xmm0
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,200 ; movaps %xmm0,%xmm1
@@ -51839,7 +52315,7 @@ _sk_gradient_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,60 ; sub $0x3c,%esp
- DB 232,0,0,0,0 ; call 6606 <_sk_gradient_sse2+0xe>
+ DB 232,0,0,0,0 ; call 6785 <_sk_gradient_sse2+0xe>
DB 95 ; pop %edi
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
@@ -51848,12 +52324,12 @@ _sk_gradient_sse2 LABEL PROC
DB 139,17 ; mov (%ecx),%edx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,250,2 ; cmp $0x2,%edx
- DB 114,43 ; jb 6648 <_sk_gradient_sse2+0x50>
+ DB 114,43 ; jb 67c7 <_sk_gradient_sse2+0x50>
DB 139,113,36 ; mov 0x24(%ecx),%esi
DB 74 ; dec %edx
DB 131,198,4 ; add $0x4,%esi
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,151,218,61,0,0 ; movaps 0x3dda(%edi),%xmm2
+ DB 15,40,151,75,62,0,0 ; movaps 0x3e4b(%edi),%xmm2
DB 243,15,16,30 ; movss (%esi),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -51861,7 +52337,7 @@ _sk_gradient_sse2 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 131,198,4 ; add $0x4,%esi
DB 74 ; dec %edx
- DB 117,231 ; jne 662f <_sk_gradient_sse2+0x37>
+ DB 117,231 ; jne 67ae <_sk_gradient_sse2+0x37>
DB 102,15,126,202 ; movd %xmm1,%edx
DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
DB 102,15,126,214 ; movd %xmm2,%esi
@@ -52009,7 +52485,7 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 6842 <_sk_xy_to_unit_angle_sse2+0x18>
+ DB 232,0,0,0,0 ; call 69c1 <_sk_xy_to_unit_angle_sse2+0x18>
DB 88 ; pop %eax
DB 15,87,237 ; xorps %xmm5,%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
@@ -52024,30 +52500,30 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 15,94,247 ; divps %xmm7,%xmm6
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,255 ; mulps %xmm7,%xmm7
- DB 15,40,128,174,59,0,0 ; movaps 0x3bae(%eax),%xmm0
+ DB 15,40,128,31,60,0,0 ; movaps 0x3c1f(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,190,59,0,0 ; addps 0x3bbe(%eax),%xmm0
+ DB 15,88,128,47,60,0,0 ; addps 0x3c2f(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,206,59,0,0 ; addps 0x3bce(%eax),%xmm0
+ DB 15,88,128,63,60,0,0 ; addps 0x3c3f(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,222,59,0,0 ; addps 0x3bde(%eax),%xmm0
+ DB 15,88,128,79,60,0,0 ; addps 0x3c4f(%eax),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,194,236,1 ; cmpltps %xmm4,%xmm5
- DB 15,40,176,238,59,0,0 ; movaps 0x3bee(%eax),%xmm6
+ DB 15,40,176,95,60,0,0 ; movaps 0x3c5f(%eax),%xmm6
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,84,245 ; andps %xmm5,%xmm6
DB 15,85,232 ; andnps %xmm0,%xmm5
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,86,238 ; orps %xmm6,%xmm5
DB 15,194,204,1 ; cmpltps %xmm4,%xmm1
- DB 15,40,128,254,59,0,0 ; movaps 0x3bfe(%eax),%xmm0
+ DB 15,40,128,111,60,0,0 ; movaps 0x3c6f(%eax),%xmm0
DB 15,92,197 ; subps %xmm5,%xmm0
DB 15,84,193 ; andps %xmm1,%xmm0
DB 15,85,205 ; andnps %xmm5,%xmm1
DB 15,86,200 ; orps %xmm0,%xmm1
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,194,196,1 ; cmpltps %xmm4,%xmm0
- DB 15,40,168,14,60,0,0 ; movaps 0x3c0e(%eax),%xmm5
+ DB 15,40,168,127,60,0,0 ; movaps 0x3c7f(%eax),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,84,232 ; andps %xmm0,%xmm5
DB 15,85,193 ; andnps %xmm1,%xmm0
@@ -52104,15 +52580,15 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
DB 15,88,240 ; addps %xmm0,%xmm6
- DB 232,0,0,0,0 ; call 695f <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
+ DB 232,0,0,0,0 ; call 6ade <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
DB 90 ; pop %edx
DB 243,15,89,237 ; mulss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,92,245 ; subps %xmm5,%xmm6
DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 15,89,162,1,59,0,0 ; mulps 0x3b01(%edx),%xmm4
- DB 15,89,130,17,59,0,0 ; mulps 0x3b11(%edx),%xmm0
+ DB 15,89,162,114,59,0,0 ; mulps 0x3b72(%edx),%xmm4
+ DB 15,89,130,130,59,0,0 ; mulps 0x3b82(%edx),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
@@ -52120,11 +52596,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 15,81,237 ; sqrtps %xmm5,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,162,33,59,0,0 ; xorps 0x3b21(%edx),%xmm4
+ DB 15,87,162,146,59,0,0 ; xorps 0x3b92(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,89,170,49,59,0,0 ; mulps 0x3b31(%edx),%xmm5
+ DB 15,89,170,162,59,0,0 ; mulps 0x3ba2(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,95,196 ; maxps %xmm4,%xmm0
@@ -52153,15 +52629,15 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
DB 15,88,240 ; addps %xmm0,%xmm6
- DB 232,0,0,0,0 ; call 69fd <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
+ DB 232,0,0,0,0 ; call 6b7c <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
DB 90 ; pop %edx
DB 243,15,89,237 ; mulss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,92,245 ; subps %xmm5,%xmm6
DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 15,89,162,163,58,0,0 ; mulps 0x3aa3(%edx),%xmm4
- DB 15,89,130,179,58,0,0 ; mulps 0x3ab3(%edx),%xmm0
+ DB 15,89,162,20,59,0,0 ; mulps 0x3b14(%edx),%xmm4
+ DB 15,89,130,36,59,0,0 ; mulps 0x3b24(%edx),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
@@ -52169,11 +52645,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 15,81,237 ; sqrtps %xmm5,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,162,195,58,0,0 ; xorps 0x3ac3(%edx),%xmm4
+ DB 15,87,162,52,59,0,0 ; xorps 0x3b34(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,89,170,211,58,0,0 ; mulps 0x3ad3(%edx),%xmm5
+ DB 15,89,170,68,59,0,0 ; mulps 0x3b44(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
@@ -52191,7 +52667,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 6a75 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
+ DB 232,0,0,0,0 ; call 6bf4 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -52200,7 +52676,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,89,169,107,58,0,0 ; mulps 0x3a6b(%ecx),%xmm5
+ DB 15,89,169,220,58,0,0 ; mulps 0x3adc(%ecx),%xmm5
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
@@ -52208,7 +52684,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,15,89,228 ; mulss %xmm4,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,129,123,58,0,0 ; xorps 0x3a7b(%ecx),%xmm0
+ DB 15,87,129,236,58,0,0 ; xorps 0x3aec(%ecx),%xmm0
DB 15,94,197 ; divps %xmm5,%xmm0
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
@@ -52276,16 +52752,16 @@ _sk_save_xy_sse2 LABEL PROC
DB 131,236,24 ; sub $0x18,%esp
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 6b52 <_sk_save_xy_sse2+0x12>
+ DB 232,0,0,0,0 ; call 6cd1 <_sk_save_xy_sse2+0x12>
DB 88 ; pop %eax
- DB 15,40,160,174,57,0,0 ; movaps 0x39ae(%eax),%xmm4
+ DB 15,40,160,31,58,0,0 ; movaps 0x3a1f(%eax),%xmm4
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,88,236 ; addps %xmm4,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
- DB 15,40,144,190,57,0,0 ; movaps 0x39be(%eax),%xmm2
+ DB 15,40,144,47,58,0,0 ; movaps 0x3a2f(%eax),%xmm2
DB 15,84,250 ; andps %xmm2,%xmm7
DB 15,92,247 ; subps %xmm7,%xmm6
DB 15,92,238 ; subps %xmm6,%xmm5
@@ -52356,15 +52832,15 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6c34 <_sk_bilinear_nx_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6db3 <_sk_bilinear_nx_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,236,56,0,0 ; addps 0x38ec(%eax),%xmm0
- DB 15,40,168,252,56,0,0 ; movaps 0x38fc(%eax),%xmm5
+ DB 15,88,128,93,57,0,0 ; addps 0x395d(%eax),%xmm0
+ DB 15,40,168,109,57,0,0 ; movaps 0x396d(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -52383,14 +52859,14 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6c77 <_sk_bilinear_px_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6df6 <_sk_bilinear_px_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,201,56,0,0 ; addps 0x38c9(%eax),%xmm0
+ DB 15,88,128,58,57,0,0 ; addps 0x393a(%eax),%xmm0
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -52408,15 +52884,15 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6cb0 <_sk_bilinear_ny_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6e2f <_sk_bilinear_ny_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,160,56,0,0 ; addps 0x38a0(%eax),%xmm1
- DB 15,40,168,176,56,0,0 ; movaps 0x38b0(%eax),%xmm5
+ DB 15,88,136,17,57,0,0 ; addps 0x3911(%eax),%xmm1
+ DB 15,40,168,33,57,0,0 ; movaps 0x3921(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -52435,14 +52911,14 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6cf4 <_sk_bilinear_py_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6e73 <_sk_bilinear_py_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,124,56,0,0 ; addps 0x387c(%eax),%xmm1
+ DB 15,88,136,237,56,0,0 ; addps 0x38ed(%eax),%xmm1
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -52460,20 +52936,20 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6d2e <_sk_bicubic_n3x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6ead <_sk_bicubic_n3x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,82,56,0,0 ; addps 0x3852(%eax),%xmm0
- DB 15,40,168,98,56,0,0 ; movaps 0x3862(%eax),%xmm5
+ DB 15,88,128,195,56,0,0 ; addps 0x38c3(%eax),%xmm0
+ DB 15,40,168,211,56,0,0 ; movaps 0x38d3(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,89,228 ; mulps %xmm4,%xmm4
- DB 15,89,168,114,56,0,0 ; mulps 0x3872(%eax),%xmm5
- DB 15,88,168,130,56,0,0 ; addps 0x3882(%eax),%xmm5
+ DB 15,89,168,227,56,0,0 ; mulps 0x38e3(%eax),%xmm5
+ DB 15,88,168,243,56,0,0 ; addps 0x38f3(%eax),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -52492,23 +52968,23 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6d88 <_sk_bicubic_n1x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6f07 <_sk_bicubic_n1x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,56,56,0,0 ; addps 0x3838(%eax),%xmm0
- DB 15,40,168,72,56,0,0 ; movaps 0x3848(%eax),%xmm5
+ DB 15,88,128,169,56,0,0 ; addps 0x38a9(%eax),%xmm0
+ DB 15,40,168,185,56,0,0 ; movaps 0x38b9(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,160,88,56,0,0 ; movaps 0x3858(%eax),%xmm4
+ DB 15,40,160,201,56,0,0 ; movaps 0x38c9(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,104,56,0,0 ; addps 0x3868(%eax),%xmm4
+ DB 15,88,160,217,56,0,0 ; addps 0x38d9(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,120,56,0,0 ; addps 0x3878(%eax),%xmm4
+ DB 15,88,160,233,56,0,0 ; addps 0x38e9(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,136,56,0,0 ; addps 0x3888(%eax),%xmm4
+ DB 15,88,160,249,56,0,0 ; addps 0x38f9(%eax),%xmm4
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -52526,22 +53002,22 @@ _sk_bicubic_p1x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6df0 <_sk_bicubic_p1x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6f6f <_sk_bicubic_p1x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
- DB 15,40,160,48,56,0,0 ; movaps 0x3830(%eax),%xmm4
+ DB 15,40,160,161,56,0,0 ; movaps 0x38a1(%eax),%xmm4
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,110,64 ; movups 0x40(%esi),%xmm5
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,40,176,64,56,0,0 ; movaps 0x3840(%eax),%xmm6
+ DB 15,40,176,177,56,0,0 ; movaps 0x38b1(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,80,56,0,0 ; addps 0x3850(%eax),%xmm6
+ DB 15,88,176,193,56,0,0 ; addps 0x38c1(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,96,56,0,0 ; addps 0x3860(%eax),%xmm6
+ DB 15,88,176,209,56,0,0 ; addps 0x38d1(%eax),%xmm6
DB 15,17,182,128,0,0,0 ; movups %xmm6,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -52559,18 +53035,18 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6e4d <_sk_bicubic_p3x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6fcc <_sk_bicubic_p3x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,19,56,0,0 ; addps 0x3813(%eax),%xmm0
+ DB 15,88,128,132,56,0,0 ; addps 0x3884(%eax),%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,89,160,35,56,0,0 ; mulps 0x3823(%eax),%xmm4
- DB 15,88,160,51,56,0,0 ; addps 0x3833(%eax),%xmm4
+ DB 15,89,160,148,56,0,0 ; mulps 0x3894(%eax),%xmm4
+ DB 15,88,160,164,56,0,0 ; addps 0x38a4(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -52589,20 +53065,20 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6e9d <_sk_bicubic_n3y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 701c <_sk_bicubic_n3y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,243,55,0,0 ; addps 0x37f3(%eax),%xmm1
- DB 15,40,168,3,56,0,0 ; movaps 0x3803(%eax),%xmm5
+ DB 15,88,136,100,56,0,0 ; addps 0x3864(%eax),%xmm1
+ DB 15,40,168,116,56,0,0 ; movaps 0x3874(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,89,228 ; mulps %xmm4,%xmm4
- DB 15,89,168,19,56,0,0 ; mulps 0x3813(%eax),%xmm5
- DB 15,88,168,35,56,0,0 ; addps 0x3823(%eax),%xmm5
+ DB 15,89,168,132,56,0,0 ; mulps 0x3884(%eax),%xmm5
+ DB 15,88,168,148,56,0,0 ; addps 0x3894(%eax),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -52621,23 +53097,23 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6ef8 <_sk_bicubic_n1y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 7077 <_sk_bicubic_n1y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,216,55,0,0 ; addps 0x37d8(%eax),%xmm1
- DB 15,40,168,232,55,0,0 ; movaps 0x37e8(%eax),%xmm5
+ DB 15,88,136,73,56,0,0 ; addps 0x3849(%eax),%xmm1
+ DB 15,40,168,89,56,0,0 ; movaps 0x3859(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,160,248,55,0,0 ; movaps 0x37f8(%eax),%xmm4
+ DB 15,40,160,105,56,0,0 ; movaps 0x3869(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,8,56,0,0 ; addps 0x3808(%eax),%xmm4
+ DB 15,88,160,121,56,0,0 ; addps 0x3879(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,24,56,0,0 ; addps 0x3818(%eax),%xmm4
+ DB 15,88,160,137,56,0,0 ; addps 0x3889(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,40,56,0,0 ; addps 0x3828(%eax),%xmm4
+ DB 15,88,160,153,56,0,0 ; addps 0x3899(%eax),%xmm4
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -52655,22 +53131,22 @@ _sk_bicubic_p1y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6f61 <_sk_bicubic_p1y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 70e0 <_sk_bicubic_p1y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
- DB 15,40,160,207,55,0,0 ; movaps 0x37cf(%eax),%xmm4
+ DB 15,40,160,64,56,0,0 ; movaps 0x3840(%eax),%xmm4
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,110,96 ; movups 0x60(%esi),%xmm5
DB 15,88,204 ; addps %xmm4,%xmm1
- DB 15,40,176,223,55,0,0 ; movaps 0x37df(%eax),%xmm6
+ DB 15,40,176,80,56,0,0 ; movaps 0x3850(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,239,55,0,0 ; addps 0x37ef(%eax),%xmm6
+ DB 15,88,176,96,56,0,0 ; addps 0x3860(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,255,55,0,0 ; addps 0x37ff(%eax),%xmm6
+ DB 15,88,176,112,56,0,0 ; addps 0x3870(%eax),%xmm6
DB 15,17,182,160,0,0,0 ; movups %xmm6,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -52688,18 +53164,18 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6fbf <_sk_bicubic_p3y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 713e <_sk_bicubic_p3y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,177,55,0,0 ; addps 0x37b1(%eax),%xmm1
+ DB 15,88,136,34,56,0,0 ; addps 0x3822(%eax),%xmm1
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,89,160,193,55,0,0 ; mulps 0x37c1(%eax),%xmm4
- DB 15,88,160,209,55,0,0 ; addps 0x37d1(%eax),%xmm4
+ DB 15,89,160,50,56,0,0 ; mulps 0x3832(%eax),%xmm4
+ DB 15,88,160,66,56,0,0 ; addps 0x3842(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -52840,7 +53316,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,98,233 ; punpckldq %xmm1,%xmm5
DB 102,15,127,173,104,255,255,255 ; movdqa %xmm5,-0x98(%ebp)
- DB 232,0,0,0,0 ; call 71b3 <_sk_clut_3D_sse2+0xff>
+ DB 232,0,0,0,0 ; call 7332 <_sk_clut_3D_sse2+0xff>
DB 90 ; pop %edx
DB 243,15,91,196 ; cvttps2dq %xmm4,%xmm0
DB 102,15,127,133,232,254,255,255 ; movdqa %xmm0,-0x118(%ebp)
@@ -52849,7 +53325,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,111,205 ; movdqa %xmm5,%xmm1
DB 102,15,254,202 ; paddd %xmm2,%xmm1
- DB 102,15,111,130,253,53,0,0 ; movdqa 0x35fd(%edx),%xmm0
+ DB 102,15,111,130,110,54,0,0 ; movdqa 0x366e(%edx),%xmm0
DB 102,15,127,133,88,255,255,255 ; movdqa %xmm0,-0xa8(%ebp)
DB 102,15,112,225,245 ; pshufd $0xf5,%xmm1,%xmm4
DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
@@ -52873,7 +53349,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,196 ; unpcklps %xmm4,%xmm0
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
- DB 102,15,111,130,13,54,0,0 ; movdqa 0x360d(%edx),%xmm0
+ DB 102,15,111,130,126,54,0,0 ; movdqa 0x367e(%edx),%xmm0
DB 102,15,127,133,72,255,255,255 ; movdqa %xmm0,-0xb8(%ebp)
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,254,224 ; paddd %xmm0,%xmm4
@@ -52891,7 +53367,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,15,16,36,185 ; movss (%ecx,%edi,4),%xmm4
DB 15,20,252 ; unpcklps %xmm4,%xmm7
DB 15,20,248 ; unpcklps %xmm0,%xmm7
- DB 102,15,111,130,29,54,0,0 ; movdqa 0x361d(%edx),%xmm0
+ DB 102,15,111,130,142,54,0,0 ; movdqa 0x368e(%edx),%xmm0
DB 102,15,127,69,216 ; movdqa %xmm0,-0x28(%ebp)
DB 102,15,254,200 ; paddd %xmm0,%xmm1
DB 102,15,112,193,229 ; pshufd $0xe5,%xmm1,%xmm0
@@ -52908,7 +53384,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,15,16,4,177 ; movss (%ecx,%esi,4),%xmm0
DB 15,20,232 ; unpcklps %xmm0,%xmm5
DB 15,20,236 ; unpcklps %xmm4,%xmm5
- DB 15,40,130,237,53,0,0 ; movaps 0x35ed(%edx),%xmm0
+ DB 15,40,130,94,54,0,0 ; movaps 0x365e(%edx),%xmm0
DB 15,88,240 ; addps %xmm0,%xmm6
DB 15,41,117,184 ; movaps %xmm6,-0x48(%ebp)
DB 15,40,141,56,255,255,255 ; movaps -0xc8(%ebp),%xmm1
@@ -53519,7 +53995,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,98,209 ; punpckldq %xmm1,%xmm2
DB 102,15,127,85,168 ; movdqa %xmm2,-0x58(%ebp)
- DB 232,0,0,0,0 ; call 7d29 <_sk_clut_4D_sse2+0x179>
+ DB 232,0,0,0,0 ; call 7ea8 <_sk_clut_4D_sse2+0x179>
DB 89 ; pop %ecx
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,41,165,120,254,255,255 ; movaps %xmm4,-0x188(%ebp)
@@ -53532,7 +54008,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,245 ; paddd %xmm5,%xmm6
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,15,254,206 ; paddd %xmm6,%xmm1
- DB 102,15,111,153,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm3
+ DB 102,15,111,153,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm3
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
@@ -53555,7 +54031,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
- DB 102,15,111,153,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm3
+ DB 102,15,111,153,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm3
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,234,229 ; pshufd $0xe5,%xmm2,%xmm5
@@ -53573,7 +54049,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,215 ; unpcklps %xmm7,%xmm2
DB 15,20,213 ; unpcklps %xmm5,%xmm2
DB 15,41,149,136,254,255,255 ; movaps %xmm2,-0x178(%ebp)
- DB 102,15,254,137,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm1
+ DB 102,15,254,137,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm1
DB 102,15,112,233,229 ; pshufd $0xe5,%xmm1,%xmm5
DB 102,15,126,232 ; movd %xmm5,%eax
DB 102,15,112,233,78 ; pshufd $0x4e,%xmm1,%xmm5
@@ -53589,7 +54065,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,207 ; unpcklps %xmm7,%xmm1
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,41,141,152,254,255,255 ; movaps %xmm1,-0x168(%ebp)
- DB 15,40,185,183,42,0,0 ; movaps 0x2ab7(%ecx),%xmm7
+ DB 15,40,185,40,43,0,0 ; movaps 0x2b28(%ecx),%xmm7
DB 15,88,231 ; addps %xmm7,%xmm4
DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp)
DB 15,40,141,232,254,255,255 ; movaps -0x118(%ebp),%xmm1
@@ -53610,7 +54086,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,127,77,184 ; movdqa %xmm1,-0x48(%ebp)
DB 102,15,254,241 ; paddd %xmm1,%xmm6
DB 102,15,112,254,245 ; pshufd $0xf5,%xmm6,%xmm7
- DB 102,15,111,137,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm1
+ DB 102,15,111,137,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm1
DB 102,15,244,241 ; pmuludq %xmm1,%xmm6
DB 102,15,112,198,232 ; pshufd $0xe8,%xmm6,%xmm0
DB 102,15,244,249 ; pmuludq %xmm1,%xmm7
@@ -53647,7 +54123,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,44,178 ; movss (%edx,%esi,4),%xmm5
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 15,20,217 ; unpcklps %xmm1,%xmm3
- DB 102,15,111,177,231,42,0,0 ; movdqa 0x2ae7(%ecx),%xmm6
+ DB 102,15,111,177,88,43,0,0 ; movdqa 0x2b58(%ecx),%xmm6
DB 102,15,254,198 ; paddd %xmm6,%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
DB 102,15,126,200 ; movd %xmm1,%eax
@@ -53695,7 +54171,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
DB 102,15,254,77,168 ; paddd -0x58(%ebp),%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,129,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm0
+ DB 102,15,111,129,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm0
DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
@@ -53717,7 +54193,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,195 ; unpcklps %xmm3,%xmm0
DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp)
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,111,129,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm0
+ DB 102,15,111,129,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm0
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3
@@ -53753,7 +54229,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,197 ; movdqa %xmm5,%xmm0
DB 102,15,254,69,184 ; paddd -0x48(%ebp),%xmm0
DB 102,15,112,216,245 ; pshufd $0xf5,%xmm0,%xmm3
- DB 102,15,111,137,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm1
+ DB 102,15,111,137,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm1
DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,217 ; pmuludq %xmm1,%xmm3
@@ -53789,7 +54265,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
DB 15,20,224 ; unpcklps %xmm0,%xmm4
DB 15,20,227 ; unpcklps %xmm3,%xmm4
- DB 102,15,111,153,231,42,0,0 ; movdqa 0x2ae7(%ecx),%xmm3
+ DB 102,15,111,153,88,43,0,0 ; movdqa 0x2b58(%ecx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
DB 102,15,126,192 ; movd %xmm0,%eax
@@ -53853,7 +54329,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,197 ; movdqa %xmm5,%xmm0
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,145,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm2
+ DB 102,15,111,145,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm2
DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
@@ -53875,7 +54351,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,214 ; unpcklps %xmm6,%xmm2
DB 15,41,85,136 ; movaps %xmm2,-0x78(%ebp)
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,111,145,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm2
+ DB 102,15,111,145,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm2
DB 102,15,254,202 ; paddd %xmm2,%xmm1
DB 102,15,112,241,229 ; pshufd $0xe5,%xmm1,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
@@ -53908,7 +54384,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,206 ; unpcklps %xmm6,%xmm1
DB 102,15,254,109,184 ; paddd -0x48(%ebp),%xmm5
DB 102,15,112,245,245 ; pshufd $0xf5,%xmm5,%xmm6
- DB 102,15,111,129,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm0
+ DB 102,15,111,129,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm0
DB 102,15,244,232 ; pmuludq %xmm0,%xmm5
DB 102,15,112,253,232 ; pshufd $0xe8,%xmm5,%xmm7
DB 102,15,244,240 ; pmuludq %xmm0,%xmm6
@@ -53944,7 +54420,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
DB 15,20,234 ; unpcklps %xmm2,%xmm5
DB 15,20,238 ; unpcklps %xmm6,%xmm5
- DB 102,15,111,153,231,42,0,0 ; movdqa 0x2ae7(%ecx),%xmm3
+ DB 102,15,111,153,88,43,0,0 ; movdqa 0x2b58(%ecx),%xmm3
DB 102,15,254,251 ; paddd %xmm3,%xmm7
DB 102,15,112,215,229 ; pshufd $0xe5,%xmm7,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
@@ -53978,7 +54454,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,177,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm6
+ DB 102,15,111,177,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm6
DB 102,15,244,198 ; pmuludq %xmm6,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,206 ; pmuludq %xmm6,%xmm1
@@ -54000,7 +54476,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,193 ; unpcklps %xmm1,%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
- DB 102,15,254,137,215,42,0,0 ; paddd 0x2ad7(%ecx),%xmm1
+ DB 102,15,254,137,72,43,0,0 ; paddd 0x2b48(%ecx),%xmm1
DB 102,15,112,241,229 ; pshufd $0xe5,%xmm1,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -54034,7 +54510,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,212 ; movdqa %xmm4,%xmm2
DB 102,15,254,85,184 ; paddd -0x48(%ebp),%xmm2
DB 102,15,112,194,245 ; pshufd $0xf5,%xmm2,%xmm0
- DB 102,15,111,137,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm1
+ DB 102,15,111,137,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm1
DB 102,15,244,209 ; pmuludq %xmm1,%xmm2
DB 102,15,112,226,232 ; pshufd $0xe8,%xmm2,%xmm4
DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
@@ -54055,7 +54531,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,200 ; unpcklps %xmm0,%xmm1
DB 15,20,206 ; unpcklps %xmm6,%xmm1
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
- DB 102,15,254,129,215,42,0,0 ; paddd 0x2ad7(%ecx),%xmm0
+ DB 102,15,254,129,72,43,0,0 ; paddd 0x2b48(%ecx),%xmm0
DB 102,15,112,240,229 ; pshufd $0xe5,%xmm0,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
DB 102,15,112,240,78 ; pshufd $0x4e,%xmm0,%xmm6
@@ -54070,7 +54546,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
DB 15,20,208 ; unpcklps %xmm0,%xmm2
DB 15,20,214 ; unpcklps %xmm6,%xmm2
- DB 102,15,254,161,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm4
+ DB 102,15,254,161,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm4
DB 102,15,112,196,229 ; pshufd $0xe5,%xmm4,%xmm0
DB 102,15,126,192 ; movd %xmm0,%eax
DB 102,15,112,196,78 ; pshufd $0x4e,%xmm4,%xmm0
@@ -54138,7 +54614,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,69,168 ; movdqa -0x58(%ebp),%xmm0
DB 102,15,254,193 ; paddd %xmm1,%xmm0
DB 102,15,112,224,245 ; pshufd $0xf5,%xmm0,%xmm4
- DB 102,15,111,145,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm2
+ DB 102,15,111,145,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm2
DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
DB 102,15,112,216,232 ; pshufd $0xe8,%xmm0,%xmm3
DB 102,15,244,226 ; pmuludq %xmm2,%xmm4
@@ -54161,7 +54637,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,196 ; unpcklps %xmm4,%xmm0
DB 15,41,133,120,255,255,255 ; movaps %xmm0,-0x88(%ebp)
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
- DB 102,15,111,145,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm2
+ DB 102,15,111,145,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm2
DB 102,15,254,226 ; paddd %xmm2,%xmm4
DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
DB 102,15,126,232 ; movd %xmm5,%eax
@@ -54177,7 +54653,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4
DB 15,20,236 ; unpcklps %xmm4,%xmm5
DB 15,20,238 ; unpcklps %xmm6,%xmm5
- DB 102,15,254,153,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm3
+ DB 102,15,254,153,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm3
DB 102,15,112,227,229 ; pshufd $0xe5,%xmm3,%xmm4
DB 102,15,126,224 ; movd %xmm4,%eax
DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
@@ -54229,7 +54705,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,20,223 ; unpcklps %xmm7,%xmm3
- DB 102,15,254,161,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm4
+ DB 102,15,254,161,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm4
DB 102,15,112,212,229 ; pshufd $0xe5,%xmm4,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,15,112,212,78 ; pshufd $0x4e,%xmm4,%xmm2
@@ -54262,7 +54738,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,127,133,56,255,255,255 ; movdqa %xmm0,-0xc8(%ebp)
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,208,245 ; pshufd $0xf5,%xmm0,%xmm2
- DB 102,15,111,137,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm1
+ DB 102,15,111,137,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm1
DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
DB 102,15,112,240,232 ; pshufd $0xe8,%xmm0,%xmm6
DB 102,15,244,209 ; pmuludq %xmm1,%xmm2
@@ -54284,7 +54760,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,194 ; unpcklps %xmm2,%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 102,15,111,214 ; movdqa %xmm6,%xmm2
- DB 102,15,111,153,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm3
+ DB 102,15,111,153,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,234,229 ; pshufd $0xe5,%xmm2,%xmm5
DB 102,15,126,232 ; movd %xmm5,%eax
@@ -54300,7 +54776,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
DB 15,20,234 ; unpcklps %xmm2,%xmm5
DB 15,20,239 ; unpcklps %xmm7,%xmm5
- DB 102,15,254,177,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm6
+ DB 102,15,254,177,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm6
DB 102,15,112,214,229 ; pshufd $0xe5,%xmm6,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,15,112,214,78 ; pshufd $0x4e,%xmm6,%xmm2
@@ -54353,7 +54829,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
DB 15,20,216 ; unpcklps %xmm0,%xmm3
DB 15,20,218 ; unpcklps %xmm2,%xmm3
- DB 102,15,254,185,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm7
+ DB 102,15,254,185,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm7
DB 102,15,112,199,229 ; pshufd $0xe5,%xmm7,%xmm0
DB 102,15,126,192 ; movd %xmm0,%eax
DB 102,15,112,199,78 ; pshufd $0x4e,%xmm7,%xmm0
@@ -54403,7 +54879,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,153,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm3
+ DB 102,15,111,153,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm3
DB 102,15,244,195 ; pmuludq %xmm3,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
@@ -54425,7 +54901,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,193 ; unpcklps %xmm1,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
- DB 102,15,111,177,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm6
+ DB 102,15,111,177,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm6
DB 102,15,254,206 ; paddd %xmm6,%xmm1
DB 102,15,112,217,229 ; pshufd $0xe5,%xmm1,%xmm3
DB 102,15,126,216 ; movd %xmm3,%eax
@@ -54441,7 +54917,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,203 ; unpcklps %xmm3,%xmm1
- DB 102,15,111,185,231,42,0,0 ; movdqa 0x2ae7(%ecx),%xmm7
+ DB 102,15,111,185,88,43,0,0 ; movdqa 0x2b58(%ecx),%xmm7
DB 102,15,254,215 ; paddd %xmm7,%xmm2
DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3
DB 102,15,126,216 ; movd %xmm3,%eax
@@ -54460,7 +54936,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,221 ; movdqa %xmm5,%xmm3
DB 102,15,254,93,184 ; paddd -0x48(%ebp),%xmm3
DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
- DB 102,15,111,129,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm0
+ DB 102,15,111,129,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm0
DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
DB 102,15,244,224 ; pmuludq %xmm0,%xmm4
@@ -54529,7 +55005,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,193 ; paddd %xmm1,%xmm0
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,145,199,42,0,0 ; movdqa 0x2ac7(%ecx),%xmm2
+ DB 102,15,111,145,56,43,0,0 ; movdqa 0x2b38(%ecx),%xmm2
DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
@@ -54552,7 +55028,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,41,93,168 ; movaps %xmm3,-0x58(%ebp)
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,137,215,42,0,0 ; paddd 0x2ad7(%ecx),%xmm1
+ DB 102,15,254,137,72,43,0,0 ; paddd 0x2b48(%ecx),%xmm1
DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
@@ -54568,7 +55044,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,217 ; unpcklps %xmm1,%xmm3
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp)
- DB 102,15,254,129,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm0
+ DB 102,15,254,129,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
DB 102,15,126,200 ; movd %xmm1,%eax
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
@@ -54605,7 +55081,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,60,178 ; movss (%edx,%esi,4),%xmm7
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
- DB 102,15,111,177,215,42,0,0 ; movdqa 0x2ad7(%ecx),%xmm6
+ DB 102,15,111,177,72,43,0,0 ; movdqa 0x2b48(%ecx),%xmm6
DB 102,15,254,242 ; paddd %xmm2,%xmm6
DB 102,15,112,206,229 ; pshufd $0xe5,%xmm6,%xmm1
DB 102,15,126,200 ; movd %xmm1,%eax
@@ -54621,7 +55097,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,52,178 ; movss (%edx,%esi,4),%xmm6
DB 15,20,206 ; unpcklps %xmm6,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,254,145,231,42,0,0 ; paddd 0x2ae7(%ecx),%xmm2
+ DB 102,15,254,145,88,43,0,0 ; paddd 0x2b58(%ecx),%xmm2
DB 102,15,112,242,229 ; pshufd $0xe5,%xmm2,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
DB 102,15,112,242,78 ; pshufd $0x4e,%xmm2,%xmm6
@@ -54691,7 +55167,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 139,117,12 ; mov 0xc(%ebp),%esi
DB 141,86,8 ; lea 0x8(%esi),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,153,247,42,0,0 ; movaps 0x2af7(%ecx),%xmm3
+ DB 15,40,153,104,43,0,0 ; movaps 0x2b68(%ecx),%xmm3
DB 82 ; push %edx
DB 80 ; push %eax
DB 255,86,4 ; call *0x4(%esi)
@@ -54852,16 +55328,22 @@ ALIGN 16
DB 63 ; aas
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
- DB 0,128,191,0,0,128 ; add %al,-0x7fffff41(%eax)
+ DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
+ DB 63 ; aas
+ DB 0,0 ; add %al,(%eax)
+ DB 128,63,0 ; cmpb $0x0,(%edi)
+ DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
DB 191,0,0,128,191 ; mov $0xbf800000,%edi
DB 0,0 ; add %al,(%eax)
- DB 128,191,0,0,224,64,0 ; cmpb $0x0,0x40e00000(%edi)
+ DB 128,191,0,0,128,191,0 ; cmpb $0x0,-0x40800000(%edi)
DB 0,224 ; add %ah,%al
DB 64 ; inc %eax
DB 0,0 ; add %al,(%eax)
- DB 224,64 ; loopne 938c <.literal16+0x1fc>
+ DB 224,64 ; loopne 9518 <.literal16+0x208>
DB 0,0 ; add %al,(%eax)
- DB 224,64 ; loopne 9390 <.literal16+0x200>
+ DB 224,64 ; loopne 951c <.literal16+0x20c>
+ DB 0,0 ; add %al,(%eax)
+ DB 224,64 ; loopne 9520 <.literal16+0x210>
DB 154,153,153,62,154,153,153 ; lcall $0x9999,$0x9a3e9999
DB 62,154,153,153,62,154,153,153 ; ds lcall $0x9999,$0x9a3e9999
DB 62,61,10,23,63,61 ; ds cmp $0x3d3f170a,%eax
@@ -54872,16 +55354,16 @@ ALIGN 16
DB 63 ; aas
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93b1 <.literal16+0x221>
+ DB 225,61 ; loope 9541 <.literal16+0x231>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93b5 <.literal16+0x225>
+ DB 225,61 ; loope 9545 <.literal16+0x235>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93b9 <.literal16+0x229>
+ DB 225,61 ; loope 9549 <.literal16+0x239>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93bd <.literal16+0x22d>
+ DB 225,61 ; loope 954d <.literal16+0x23d>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -54898,16 +55380,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 93f1 <.literal16+0x261>
+ DB 225,61 ; loope 9581 <.literal16+0x271>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93f5 <.literal16+0x265>
+ DB 225,61 ; loope 9585 <.literal16+0x275>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93f9 <.literal16+0x269>
+ DB 225,61 ; loope 9589 <.literal16+0x279>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 93fd <.literal16+0x26d>
+ DB 225,61 ; loope 958d <.literal16+0x27d>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -54924,16 +55406,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 9431 <.literal16+0x2a1>
+ DB 225,61 ; loope 95c1 <.literal16+0x2b1>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9435 <.literal16+0x2a5>
+ DB 225,61 ; loope 95c5 <.literal16+0x2b5>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9439 <.literal16+0x2a9>
+ DB 225,61 ; loope 95c9 <.literal16+0x2b9>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 943d <.literal16+0x2ad>
+ DB 225,61 ; loope 95cd <.literal16+0x2bd>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -54950,16 +55432,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 9471 <.literal16+0x2e1>
+ DB 225,61 ; loope 9601 <.literal16+0x2f1>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9475 <.literal16+0x2e5>
+ DB 225,61 ; loope 9605 <.literal16+0x2f5>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 9479 <.literal16+0x2e9>
+ DB 225,61 ; loope 9609 <.literal16+0x2f9>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 947d <.literal16+0x2ed>
+ DB 225,61 ; loope 960d <.literal16+0x2fd>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -54981,11 +55463,11 @@ ALIGN 16
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%eax)
DB 67 ; inc %ebx
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 94bb <.literal16+0x32b>
+ DB 127,67 ; jg 964b <.literal16+0x33b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 94bf <.literal16+0x32f>
+ DB 127,67 ; jg 964f <.literal16+0x33f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 94c3 <.literal16+0x333>
+ DB 127,67 ; jg 9653 <.literal16+0x343>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -55235,7 +55717,53 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%eax)
DB 128,59,129 ; cmpb $0x81,(%ebx)
- DB 128,128,59,255,0,0,0 ; addb $0x0,0xff3b(%eax)
+ DB 128,128,59,0,248,0,0 ; addb $0x0,0xf8003b(%eax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 8,33 ; or %ah,(%ecx)
+ DB 132,55 ; test %dh,(%edi)
+ DB 8,33 ; or %ah,(%ecx)
+ DB 132,55 ; test %dh,(%edi)
+ DB 8,33 ; or %ah,(%ecx)
+ DB 132,55 ; test %dh,(%edi)
+ DB 8,33 ; or %ah,(%ecx)
+ DB 132,55 ; test %dh,(%edi)
+ DB 224,7 ; loopne 9889 <.literal16+0x579>
+ DB 0,0 ; add %al,(%eax)
+ DB 224,7 ; loopne 988d <.literal16+0x57d>
+ DB 0,0 ; add %al,(%eax)
+ DB 224,7 ; loopne 9891 <.literal16+0x581>
+ DB 0,0 ; add %al,(%eax)
+ DB 224,7 ; loopne 9895 <.literal16+0x585>
+ DB 0,0 ; add %al,(%eax)
+ DB 33,8 ; and %ecx,(%eax)
+ DB 2,58 ; add (%edx),%bh
+ DB 33,8 ; and %ecx,(%eax)
+ DB 2,58 ; add (%edx),%bh
+ DB 33,8 ; and %ecx,(%eax)
+ DB 2,58 ; add (%edx),%bh
+ DB 33,8 ; and %ecx,(%eax)
+ DB 2,58 ; add (%edx),%bh
+ DB 31 ; pop %ds
+ DB 0,0 ; add %al,(%eax)
+ DB 0,31 ; add %bl,(%edi)
+ DB 0,0 ; add %al,(%eax)
+ DB 0,31 ; add %bl,(%edi)
+ DB 0,0 ; add %al,(%eax)
+ DB 0,31 ; add %bl,(%edi)
+ DB 0,0 ; add %al,(%eax)
+ DB 0,8 ; add %cl,(%eax)
+ DB 33,4,61,8,33,4,61 ; and %eax,0x3d042108(,%edi,1)
+ DB 8,33 ; or %ah,(%ecx)
+ DB 4,61 ; add $0x3d,%al
+ DB 8,33 ; or %ah,(%ecx)
+ DB 4,61 ; add $0x3d,%al
+ DB 255,0 ; incl (%eax)
+ DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
@@ -55259,13 +55787,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 9719 <.literal16+0x589>
+ DB 224,7 ; loopne 9909 <.literal16+0x5f9>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 971d <.literal16+0x58d>
+ DB 224,7 ; loopne 990d <.literal16+0x5fd>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9721 <.literal16+0x591>
+ DB 224,7 ; loopne 9911 <.literal16+0x601>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9725 <.literal16+0x595>
+ DB 224,7 ; loopne 9915 <.literal16+0x605>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -55314,11 +55842,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,127,67 ; add %bh,0x43(%edi)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 97db <.literal16+0x64b>
+ DB 127,67 ; jg 99cb <.literal16+0x6bb>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 97df <.literal16+0x64f>
+ DB 127,67 ; jg 99cf <.literal16+0x6bf>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 97e3 <.literal16+0x653>
+ DB 127,67 ; jg 99d3 <.literal16+0x6c3>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%eax)
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%eax)
@@ -55333,16 +55861,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 97d4 <.literal16+0x644>
+ DB 127,0 ; jg 99c4 <.literal16+0x6b4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 97d8 <.literal16+0x648>
+ DB 127,0 ; jg 99c8 <.literal16+0x6b8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 97dc <.literal16+0x64c>
+ DB 127,0 ; jg 99cc <.literal16+0x6bc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 97e0 <.literal16+0x650>
+ DB 127,0 ; jg 99d0 <.literal16+0x6c0>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -55351,7 +55879,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 9865 <.literal16+0x6d5>
+ DB 119,115 ; ja 9a55 <.literal16+0x745>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -55362,7 +55890,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 97c9 <.literal16+0x639>
+ DB 117,191 ; jne 99b9 <.literal16+0x6a9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -55378,7 +55906,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3d806 <_sk_clut_4D_sse2+0xe9a35c56>
+ DB 233,220,63,163,233 ; jmp e9a3d9f6 <_sk_clut_4D_sse2+0xe9a35cc7>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -55433,16 +55961,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 98a4 <.literal16+0x714>
+ DB 127,0 ; jg 9a94 <.literal16+0x784>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 98a8 <.literal16+0x718>
+ DB 127,0 ; jg 9a98 <.literal16+0x788>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 98ac <.literal16+0x71c>
+ DB 127,0 ; jg 9a9c <.literal16+0x78c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 98b0 <.literal16+0x720>
+ DB 127,0 ; jg 9aa0 <.literal16+0x790>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -55451,7 +55979,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 9935 <.literal16+0x7a5>
+ DB 119,115 ; ja 9b25 <.literal16+0x815>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -55462,7 +55990,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 9899 <.literal16+0x709>
+ DB 117,191 ; jne 9a89 <.literal16+0x779>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -55478,7 +56006,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3d8d6 <_sk_clut_4D_sse2+0xe9a35d26>
+ DB 233,220,63,163,233 ; jmp e9a3dac6 <_sk_clut_4D_sse2+0xe9a35d97>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -55533,16 +56061,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 9974 <.literal16+0x7e4>
+ DB 127,0 ; jg 9b64 <.literal16+0x854>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9978 <.literal16+0x7e8>
+ DB 127,0 ; jg 9b68 <.literal16+0x858>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 997c <.literal16+0x7ec>
+ DB 127,0 ; jg 9b6c <.literal16+0x85c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9980 <.literal16+0x7f0>
+ DB 127,0 ; jg 9b70 <.literal16+0x860>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -55551,7 +56079,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 9a05 <.literal16+0x875>
+ DB 119,115 ; ja 9bf5 <.literal16+0x8e5>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -55562,7 +56090,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 9969 <.literal16+0x7d9>
+ DB 117,191 ; jne 9b59 <.literal16+0x849>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -55578,7 +56106,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3d9a6 <_sk_clut_4D_sse2+0xe9a35df6>
+ DB 233,220,63,163,233 ; jmp e9a3db96 <_sk_clut_4D_sse2+0xe9a35e67>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -55633,16 +56161,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 9a44 <.literal16+0x8b4>
+ DB 127,0 ; jg 9c34 <.literal16+0x924>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9a48 <.literal16+0x8b8>
+ DB 127,0 ; jg 9c38 <.literal16+0x928>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9a4c <.literal16+0x8bc>
+ DB 127,0 ; jg 9c3c <.literal16+0x92c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9a50 <.literal16+0x8c0>
+ DB 127,0 ; jg 9c40 <.literal16+0x930>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -55651,7 +56179,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 9ad5 <.literal16+0x945>
+ DB 119,115 ; ja 9cc5 <.literal16+0x9b5>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -55662,7 +56190,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 9a39 <.literal16+0x8a9>
+ DB 117,191 ; jne 9c29 <.literal16+0x919>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -55678,7 +56206,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3da76 <_sk_clut_4D_sse2+0xe9a35ec6>
+ DB 233,220,63,163,233 ; jmp e9a3dc66 <_sk_clut_4D_sse2+0xe9a35f37>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -55733,16 +56261,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 9b14 <.literal16+0x984>
+ DB 127,0 ; jg 9d04 <.literal16+0x9f4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9b18 <.literal16+0x988>
+ DB 127,0 ; jg 9d08 <.literal16+0x9f8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9b1c <.literal16+0x98c>
+ DB 127,0 ; jg 9d0c <.literal16+0x9fc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 9b20 <.literal16+0x990>
+ DB 127,0 ; jg 9d10 <.literal16+0xa00>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -55751,7 +56279,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 9ba5 <.literal16+0xa15>
+ DB 119,115 ; ja 9d95 <.literal16+0xa85>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -55762,7 +56290,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 9b09 <.literal16+0x979>
+ DB 117,191 ; jne 9cf9 <.literal16+0x9e9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -55778,7 +56306,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3db46 <_sk_clut_4D_sse2+0xe9a35f96>
+ DB 233,220,63,163,233 ; jmp e9a3dd36 <_sk_clut_4D_sse2+0xe9a36007>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -55829,13 +56357,13 @@ ALIGN 16
DB 200,66,0,0 ; enter $0x42,$0x0
DB 200,66,0,0 ; enter $0x42,$0x0
DB 200,66,0,0 ; enter $0x42,$0x0
- DB 127,67 ; jg 9c27 <.literal16+0xa97>
+ DB 127,67 ; jg 9e17 <.literal16+0xb07>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9c2b <.literal16+0xa9b>
+ DB 127,67 ; jg 9e1b <.literal16+0xb0b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9c2f <.literal16+0xa9f>
+ DB 127,67 ; jg 9e1f <.literal16+0xb0f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9c33 <.literal16+0xaa3>
+ DB 127,67 ; jg 9e23 <.literal16+0xb13>
DB 0,0 ; add %al,(%eax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%eax)
@@ -55886,16 +56414,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%ebx)
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 9cb3 <.literal16+0xb23>
+ DB 118,63 ; jbe 9ea3 <.literal16+0xb93>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 9cb7 <.literal16+0xb27>
+ DB 118,63 ; jbe 9ea7 <.literal16+0xb97>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 9cbb <.literal16+0xb2b>
+ DB 118,63 ; jbe 9eab <.literal16+0xb9b>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 9cbf <.literal16+0xb2f>
+ DB 118,63 ; jbe 9eaf <.literal16+0xb9f>
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
@@ -55924,11 +56452,11 @@ ALIGN 16
DB 128,59,0 ; cmpb $0x0,(%ebx)
DB 0,127,67 ; add %bh,0x43(%edi)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9d2b <.literal16+0xb9b>
+ DB 127,67 ; jg 9f1b <.literal16+0xc0b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9d2f <.literal16+0xb9f>
+ DB 127,67 ; jg 9f1f <.literal16+0xc0f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 9d33 <.literal16+0xba3>
+ DB 127,67 ; jg 9f23 <.literal16+0xc13>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 0,0 ; add %al,(%eax)
@@ -55990,13 +56518,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 9da9 <.literal16+0xc19>
+ DB 224,7 ; loopne 9f99 <.literal16+0xc89>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9dad <.literal16+0xc1d>
+ DB 224,7 ; loopne 9f9d <.literal16+0xc8d>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9db1 <.literal16+0xc21>
+ DB 224,7 ; loopne 9fa1 <.literal16+0xc91>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9db5 <.literal16+0xc25>
+ DB 224,7 ; loopne 9fa5 <.literal16+0xc95>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -56042,13 +56570,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 9e19 <.literal16+0xc89>
+ DB 224,7 ; loopne a009 <.literal16+0xcf9>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9e1d <.literal16+0xc8d>
+ DB 224,7 ; loopne a00d <.literal16+0xcfd>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9e21 <.literal16+0xc91>
+ DB 224,7 ; loopne a011 <.literal16+0xd01>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9e25 <.literal16+0xc95>
+ DB 224,7 ; loopne a015 <.literal16+0xd05>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -56094,13 +56622,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 9e89 <.literal16+0xcf9>
+ DB 224,7 ; loopne a079 <.literal16+0xd69>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9e8d <.literal16+0xcfd>
+ DB 224,7 ; loopne a07d <.literal16+0xd6d>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9e91 <.literal16+0xd01>
+ DB 224,7 ; loopne a081 <.literal16+0xd71>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 9e95 <.literal16+0xd05>
+ DB 224,7 ; loopne a085 <.literal16+0xd75>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -56142,13 +56670,13 @@ ALIGN 16
DB 248 ; clc
DB 65 ; inc %ecx
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 9f26 <.literal16+0xd96>
+ DB 124,66 ; jl a116 <.literal16+0xe06>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 9f2a <.literal16+0xd9a>
+ DB 124,66 ; jl a11a <.literal16+0xe0a>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 9f2e <.literal16+0xd9e>
+ DB 124,66 ; jl a11e <.literal16+0xe0e>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 9f32 <.literal16+0xda2>
+ DB 124,66 ; jl a122 <.literal16+0xe12>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%eax)
DB 0,240 ; add %dh,%al
@@ -56282,13 +56810,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%eax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo a0b5 <.literal16+0xf25>
+ DB 112,65 ; jo a2a5 <.literal16+0xf95>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo a0b9 <.literal16+0xf29>
+ DB 112,65 ; jo a2a9 <.literal16+0xf99>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo a0bd <.literal16+0xf2d>
+ DB 112,65 ; jo a2ad <.literal16+0xf9d>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo a0c1 <.literal16+0xf31>
+ DB 112,65 ; jo a2b1 <.literal16+0xfa1>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
@@ -56319,11 +56847,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%eax)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a12b <.literal16+0xf9b>
+ DB 127,67 ; jg a31b <.literal16+0x100b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a12f <.literal16+0xf9f>
+ DB 127,67 ; jg a31f <.literal16+0x100f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a133 <.literal16+0xfa3>
+ DB 127,67 ; jg a323 <.literal16+0x1013>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
@@ -56354,11 +56882,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%eax)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a19b <.literal16+0x100b>
+ DB 127,67 ; jg a38b <.literal16+0x107b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a19f <.literal16+0x100f>
+ DB 127,67 ; jg a38f <.literal16+0x107f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg a1a3 <.literal16+0x1013>
+ DB 127,67 ; jg a393 <.literal16+0x1083>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%eax)
DB 0,0 ; add %al,(%eax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%eax)
@@ -56457,13 +56985,13 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 255 ; (bad)
- DB 127,71 ; jg a2cb <.literal16+0x113b>
+ DB 127,71 ; jg a4bb <.literal16+0x11ab>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg a2cf <.literal16+0x113f>
+ DB 127,71 ; jg a4bf <.literal16+0x11af>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg a2d3 <.literal16+0x1143>
+ DB 127,71 ; jg a4c3 <.literal16+0x11b3>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg a2d7 <.literal16+0x1147>
+ DB 127,71 ; jg a4c7 <.literal16+0x11b7>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -56571,7 +57099,7 @@ ALIGN 16
DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js a3dc <.literal16+0x124c>
+ DB 120,57 ; js a5cc <.literal16+0x12bc>
DB 64 ; inc %eax
DB 18,120,57 ; adc 0x39(%eax),%bh
DB 64 ; inc %eax
@@ -56764,11 +57292,11 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,114 ; cmpb $0x72,(%edi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt a5c2 <.literal16+0x1432>
+ DB 62,114,28 ; jb,pt a7b2 <.literal16+0x14a2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a5c6 <.literal16+0x1436>
+ DB 62,114,28 ; jb,pt a7b6 <.literal16+0x14a6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a5ca <.literal16+0x143a>
+ DB 62,114,28 ; jb,pt a7ba <.literal16+0x14aa>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -56847,13 +57375,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%edi)
DB 0,192 ; add %al,%al
DB 63 ; aas
- DB 114,28 ; jb a68e <.literal16+0x14fe>
+ DB 114,28 ; jb a87e <.literal16+0x156e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a692 <.literal16+0x1502>
+ DB 62,114,28 ; jb,pt a882 <.literal16+0x1572>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a696 <.literal16+0x1506>
+ DB 62,114,28 ; jb,pt a886 <.literal16+0x1576>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a69a <.literal16+0x150a>
+ DB 62,114,28 ; jb,pt a88a <.literal16+0x157a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -56874,11 +57402,11 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,114 ; cmpb $0x72,(%edi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt a6d2 <.literal16+0x1542>
+ DB 62,114,28 ; jb,pt a8c2 <.literal16+0x15b2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a6d6 <.literal16+0x1546>
+ DB 62,114,28 ; jb,pt a8c6 <.literal16+0x15b6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a6da <.literal16+0x154a>
+ DB 62,114,28 ; jb,pt a8ca <.literal16+0x15ba>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -56957,13 +57485,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%edi)
DB 0,192 ; add %al,%al
DB 63 ; aas
- DB 114,28 ; jb a79e <.literal16+0x160e>
+ DB 114,28 ; jb a98e <.literal16+0x167e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a7a2 <.literal16+0x1612>
+ DB 62,114,28 ; jb,pt a992 <.literal16+0x1682>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a7a6 <.literal16+0x1616>
+ DB 62,114,28 ; jb,pt a996 <.literal16+0x1686>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt a7aa <.literal16+0x161a>
+ DB 62,114,28 ; jb,pt a99a <.literal16+0x168a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -56973,14 +57501,14 @@ ALIGN 16
DB 170 ; stos %al,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
DB 190,171,170,170,190 ; mov $0xbeaaaaab,%esi
- DB 114,249 ; jb a79b <.literal16+0x160b>
- DB 127,63 ; jg a7e3 <.literal16+0x1653>
- DB 114,249 ; jb a79f <.literal16+0x160f>
- DB 127,63 ; jg a7e7 <.literal16+0x1657>
- DB 114,249 ; jb a7a3 <.literal16+0x1613>
- DB 127,63 ; jg a7eb <.literal16+0x165b>
- DB 114,249 ; jb a7a7 <.literal16+0x1617>
- DB 127,63 ; jg a7ef <.literal16+0x165f>
+ DB 114,249 ; jb a98b <.literal16+0x167b>
+ DB 127,63 ; jg a9d3 <.literal16+0x16c3>
+ DB 114,249 ; jb a98f <.literal16+0x167f>
+ DB 127,63 ; jg a9d7 <.literal16+0x16c7>
+ DB 114,249 ; jb a993 <.literal16+0x1683>
+ DB 127,63 ; jg a9db <.literal16+0x16cb>
+ DB 114,249 ; jb a997 <.literal16+0x1687>
+ DB 127,63 ; jg a9df <.literal16+0x16cf>
DB 3,0 ; add (%eax),%eax
DB 0,0 ; add %al,(%eax)
DB 3,0 ; add (%eax),%eax
@@ -57005,14 +57533,14 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 2,0 ; add (%eax),%al
DB 0,0 ; add %al,(%eax)
- DB 114,249 ; jb a7db <.literal16+0x164b>
- DB 127,63 ; jg a823 <.literal16+0x1693>
- DB 114,249 ; jb a7df <.literal16+0x164f>
- DB 127,63 ; jg a827 <.literal16+0x1697>
- DB 114,249 ; jb a7e3 <.literal16+0x1653>
- DB 127,63 ; jg a82b <.literal16+0x169b>
- DB 114,249 ; jb a7e7 <.literal16+0x1657>
- DB 127,63 ; jg a82f <.literal16+0x169f>
+ DB 114,249 ; jb a9cb <.literal16+0x16bb>
+ DB 127,63 ; jg aa13 <.literal16+0x1703>
+ DB 114,249 ; jb a9cf <.literal16+0x16bf>
+ DB 127,63 ; jg aa17 <.literal16+0x1707>
+ DB 114,249 ; jb a9d3 <.literal16+0x16c3>
+ DB 127,63 ; jg aa1b <.literal16+0x170b>
+ DB 114,249 ; jb a9d7 <.literal16+0x16c7>
+ DB 127,63 ; jg aa1f <.literal16+0x170f>
DB 3,0 ; add (%eax),%eax
DB 0,0 ; add %al,(%eax)
DB 3,0 ; add (%eax),%eax
diff --git a/src/jumper/SkJumper_stages.cpp b/src/jumper/SkJumper_stages.cpp
index 23b756e9ed..29651cab7d 100644
--- a/src/jumper/SkJumper_stages.cpp
+++ b/src/jumper/SkJumper_stages.cpp
@@ -329,7 +329,7 @@ BLEND_MODE(dstover) { return mad(s, inv(da), d); }
BLEND_MODE(modulate) { return s*d; }
BLEND_MODE(multiply) { return s*inv(da) + d*inv(sa) + s*d; }
-BLEND_MODE(plus_) { return s + d; }
+BLEND_MODE(plus_) { return min(s + d, 1.0f); } // We can clamp to either 1 or sa.
BLEND_MODE(screen) { return s + d - s*d; }
BLEND_MODE(xor_) { return s*inv(da) + d*inv(sa); }
#undef BLEND_MODE
@@ -631,8 +631,8 @@ STAGE(to_srgb) {
}
STAGE(rgb_to_hsl) {
- F mx = max(max(r,g), b),
- mn = min(min(r,g), b),
+ F mx = max(r,g,b),
+ mn = min(r,g,b),
d = mx - mn,
d_rcp = 1.0f / d;
@@ -673,6 +673,12 @@ STAGE(hsl_to_rgb) {
b = if_then_else(s == 0, l, hue_to_rgb(h - (1/3.0f)));
}
+// Derive alpha's coverage from rgb coverage and the values of src and dst alpha.
+SI F alpha_coverage_from_rgb_coverage(F a, F da, F cr, F cg, F cb) {
+ return if_then_else(a < da, min(cr,cg,cb)
+ , max(cr,cg,cb));
+}
+
STAGE(scale_1_float) {
auto c = *(const float*)ctx;
@@ -692,6 +698,19 @@ STAGE(scale_u8) {
b = b * c;
a = a * c;
}
+STAGE(scale_565) {
+ auto ptr = ptr_at_xy<const uint16_t>(ctx, x,y);
+
+ F cr,cg,cb;
+ from_565(load<U16>(ptr, tail), &cr, &cg, &cb);
+
+ F ca = alpha_coverage_from_rgb_coverage(a,da, cr,cg,cb);
+
+ r = r * cr;
+ g = g * cg;
+ b = b * cb;
+ a = a * ca;
+}
SI F lerp(F from, F to, F t) {
return mad(to-from, t, from);
@@ -722,10 +741,12 @@ STAGE(lerp_565) {
F cr,cg,cb;
from_565(load<U16>(ptr, tail), &cr, &cg, &cb);
+ F ca = alpha_coverage_from_rgb_coverage(a,da, cr,cg,cb);
+
r = lerp(dr, r, cr);
g = lerp(dg, g, cg);
b = lerp(db, b, cb);
- a = max(lerp(da, a, cr), lerp(da, a, cg), lerp(da, a, cb));
+ a = lerp(da, a, ca);
}
STAGE(load_tables) {
diff --git a/src/jumper/SkJumper_stages_8bit.cpp b/src/jumper/SkJumper_stages_8bit.cpp
index 5ee3417ece..3e119010e4 100644
--- a/src/jumper/SkJumper_stages_8bit.cpp
+++ b/src/jumper/SkJumper_stages_8bit.cpp
@@ -157,6 +157,20 @@ SI V min(V a, V b) {
return if_then_else(a.u8x4 > b.u8x4, b.u8x4, a.u8x4);
}
+SI V saturated_add(V a, V b) {
+ R a_lo, a_hi,
+ b_lo, b_hi;
+ split(a.u8x4, &a_lo, &a_hi);
+ split(b.u8x4, &b_lo, &b_hi);
+#if defined(__AVX2__)
+ return join(_mm256_adds_epu8(a_lo, b_lo),
+ _mm256_adds_epu8(a_hi, b_hi));
+#else
+ return join(_mm_adds_epu8(a_lo, b_lo),
+ _mm_adds_epu8(a_hi, b_hi));
+#endif
+}
+
struct Params {
size_t x,y,tail;
};
@@ -385,6 +399,7 @@ STAGE(modulate) { src = src*dst; }
STAGE(multiply) { src = src*inv(alpha(dst)) + dst*inv(alpha(src)) + src*dst; }
STAGE(screen) { src = src + inv(src)*dst; }
STAGE(xor_) { src = src*inv(alpha(dst)) + dst*inv(alpha(src)); }
+STAGE(plus_) { src = saturated_add(src, dst); }
SI V srcover_alpha(V src, V dst, V rgb) {
V a = src + (dst - dst*alpha(src));
@@ -443,8 +458,6 @@ STAGE(overlay) {
// Missing blendmode specializations:
//
-// plus - tricky due to clamping vs. partial coverage (especially with LCD masks).
-//
// colorburn |
// colordodge > these involve division, which makes them (much) slower than the float stages.
// softlight |