diff options
author | Florin Malita <fmalita@chromium.org> | 2017-06-28 14:46:54 -0400 |
---|---|---|
committer | Skia Commit-Bot <skia-commit-bot@chromium.org> | 2017-06-28 19:15:49 +0000 |
commit | 2e409009fb715400a0d64612c57187465c12790c (patch) | |
tree | c70f520634c129ac32d1f90ff494fa587f632f27 /src | |
parent | c02de0b844fdb04e28e45ed5bbdd5eb0935c42d2 (diff) |
2pt conical stage for focal-pt-on-edge case
When the focal point is on the edge of the end circle, the quadratic
equation devolves to linear. Add a stage to handle this case.
As a complication, this case can produce "degenerate" values:
1) t == NaN
2) R(t) < 0
For these, we're supposed to draw transparent black - which means
overwriting the color from the gradient stage. To support this, build
a 0/1 vector mask in the context, and apply it post-gradient-stage.
Change-Id: Ice4e3243abfd8c784bb810f6c310aed7a4ac7dc8
Reviewed-on: https://skia-review.googlesource.com/21111
Commit-Queue: Florin Malita <fmalita@chromium.org>
Reviewed-by: Mike Klein <mtklein@google.com>
Diffstat (limited to 'src')
-rw-r--r-- | src/core/SkRasterPipeline.h | 3 | ||||
-rw-r--r-- | src/jumper/SkJumper.h | 1 | ||||
-rw-r--r-- | src/jumper/SkJumper_generated.S | 4954 | ||||
-rw-r--r-- | src/jumper/SkJumper_generated_win.S | 3645 | ||||
-rw-r--r-- | src/jumper/SkJumper_stages.cpp | 27 | ||||
-rw-r--r-- | src/shaders/gradients/SkGradientShader.cpp | 9 | ||||
-rw-r--r-- | src/shaders/gradients/SkGradientShaderPriv.h | 5 | ||||
-rw-r--r-- | src/shaders/gradients/SkLinearGradient.cpp | 3 | ||||
-rw-r--r-- | src/shaders/gradients/SkLinearGradient.h | 3 | ||||
-rw-r--r-- | src/shaders/gradients/SkRadialGradient.cpp | 3 | ||||
-rw-r--r-- | src/shaders/gradients/SkRadialGradient.h | 3 | ||||
-rw-r--r-- | src/shaders/gradients/SkSweepGradient.cpp | 3 | ||||
-rw-r--r-- | src/shaders/gradients/SkSweepGradient.h | 3 | ||||
-rw-r--r-- | src/shaders/gradients/SkTwoPointConicalGradient.cpp | 19 | ||||
-rw-r--r-- | src/shaders/gradients/SkTwoPointConicalGradient.h | 3 |
15 files changed, 4721 insertions, 3963 deletions
diff --git a/src/core/SkRasterPipeline.h b/src/core/SkRasterPipeline.h index 96a5faab23..779883d0e0 100644 --- a/src/core/SkRasterPipeline.h +++ b/src/core/SkRasterPipeline.h @@ -107,7 +107,8 @@ struct SkJumper_constants; M(evenly_spaced_2_stop_gradient) \ M(xy_to_unit_angle) \ M(xy_to_radius) \ - M(xy_to_2pt_conical) \ + M(xy_to_2pt_conical_quadratic) M(xy_to_2pt_conical_linear) \ + M(vector_scale) \ M(byte_tables) M(byte_tables_rgb) \ M(rgb_to_hsl) \ M(hsl_to_rgb) diff --git a/src/jumper/SkJumper.h b/src/jumper/SkJumper.h index be43c2e5d3..86dd291641 100644 --- a/src/jumper/SkJumper.h +++ b/src/jumper/SkJumper.h @@ -108,6 +108,7 @@ struct SkJumper_GradientCtx { }; struct SkJumper_2PtConicalCtx { + float fMask[SkJumper_kMaxStride]; float fCoeffA, fInvCoeffA, fR0, diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S index 9d512a3c6b..20dc3fcdfe 100644 --- a/src/jumper/SkJumper_generated.S +++ b/src/jumper/SkJumper_generated.S @@ -4973,27 +4973,25 @@ _sk_xy_to_radius_aarch64: .long 0x6ea1fa00 // fsqrt v0.4s, v16.4s .long 0xd61f00a0 // br x5 -HIDDEN _sk_xy_to_2pt_conical_aarch64 -.globl _sk_xy_to_2pt_conical_aarch64 -FUNCTION(_sk_xy_to_2pt_conical_aarch64) -_sk_xy_to_2pt_conical_aarch64: +HIDDEN _sk_xy_to_2pt_conical_quadratic_aarch64 +.globl _sk_xy_to_2pt_conical_quadratic_aarch64 +FUNCTION(_sk_xy_to_2pt_conical_quadratic_aarch64) +_sk_xy_to_2pt_conical_quadratic_aarch64: .long 0xa8c11428 // ldp x8, x5, [x1], #16 - .long 0x4f04f611 // fmov v17.4s, #-4.000000000000000000e+00 - .long 0xaa0803e9 // mov x9, x8 - .long 0x4ddfc930 // ld1r {v16.4s}, [x9], #4 - .long 0x2d414d12 // ldp s18, s19, [x8, #8] - .long 0x6e31de10 // fmul v16.4s, v16.4s, v17.4s - .long 0x6e21dc31 // fmul v17.4s, v1.4s, v1.4s - .long 0x1e320a73 // fmul s19, s19, s18 - .long 0x1e320a52 // fmul s18, s18, s18 - .long 0x4e20cc11 // fmla v17.4s, v0.4s, v0.4s - .long 0x4e040673 // dup v19.4s, v19.s[0] + .long 0x4f04f614 // fmov v20.4s, #-4.000000000000000000e+00 + .long 0x2d444d10 // ldp s16, s19, [x8, #32] + .long 0x2d454911 // ldp s17, s18, [x8, #40] + .long 0x4f909290 // fmul v16.4s, v20.4s, v16.s[0] + .long 0x6e21dc34 // fmul v20.4s, v1.4s, v1.4s + .long 0x1e310a52 // fmul s18, s18, s17 + .long 0x1e310a31 // fmul s17, s17, s17 + .long 0x4e20cc14 // fmla v20.4s, v0.4s, v0.4s .long 0x4e040652 // dup v18.4s, v18.s[0] - .long 0x4e20d660 // fadd v0.4s, v19.4s, v0.4s - .long 0x4f066413 // movi v19.4s, #0xc0, lsl #24 - .long 0x4eb2d631 // fsub v17.4s, v17.4s, v18.4s - .long 0x6e33dc00 // fmul v0.4s, v0.4s, v19.4s - .long 0xbd400133 // ldr s19, [x9] + .long 0x4e040631 // dup v17.4s, v17.s[0] + .long 0x4e20d640 // fadd v0.4s, v18.4s, v0.4s + .long 0x4eb1d691 // fsub v17.4s, v20.4s, v17.4s + .long 0x4f066412 // movi v18.4s, #0xc0, lsl #24 + .long 0x6e32dc00 // fmul v0.4s, v0.4s, v18.4s .long 0x6e31de10 // fmul v16.4s, v16.4s, v17.4s .long 0x4e20cc10 // fmla v16.4s, v0.4s, v0.4s .long 0x6ea0f811 // fneg v17.4s, v0.4s @@ -5008,6 +5006,56 @@ _sk_xy_to_2pt_conical_aarch64: .long 0x4e30f400 // fmax v0.4s, v0.4s, v16.4s .long 0xd61f00a0 // br x5 +HIDDEN _sk_xy_to_2pt_conical_linear_aarch64 +.globl _sk_xy_to_2pt_conical_linear_aarch64 +FUNCTION(_sk_xy_to_2pt_conical_linear_aarch64) +_sk_xy_to_2pt_conical_linear_aarch64: + .long 0xf9400028 // ldr x8, [x1] + .long 0x6e21dc21 // fmul v1.4s, v1.4s, v1.4s + .long 0x4e20cc01 // fmla v1.4s, v0.4s, v0.4s + .long 0x4f066412 // movi v18.4s, #0xc0, lsl #24 + .long 0x2d454510 // ldp s16, s17, [x8, #40] + .long 0x1e300a33 // fmul s19, s17, s16 + .long 0x4e040673 // dup v19.4s, v19.s[0] + .long 0x4e20d660 // fadd v0.4s, v19.4s, v0.4s + .long 0x1e300a13 // fmul s19, s16, s16 + .long 0x4e040673 // dup v19.4s, v19.s[0] + .long 0x4eb3d421 // fsub v1.4s, v1.4s, v19.4s + .long 0x6e32dc00 // fmul v0.4s, v0.4s, v18.4s + .long 0x6ea0f821 // fneg v1.4s, v1.4s + .long 0x4e040610 // dup v16.4s, v16.s[0] + .long 0x6e20fc20 // fdiv v0.4s, v1.4s, v0.4s + .long 0x4f911010 // fmla v16.4s, v0.4s, v17.s[0] + .long 0x6ea0c801 // fcmge v1.4s, v0.4s, #0.0 + .long 0x4ea0e811 // fcmlt v17.4s, v0.4s, #0.0 + .long 0x4ea11e21 // orr v1.16b, v17.16b, v1.16b + .long 0x4ea0ea10 // fcmlt v16.4s, v16.4s, #0.0 + .long 0x6e205821 // mvn v1.16b, v1.16b + .long 0x0e612a10 // xtn v16.4h, v16.4s + .long 0x0e612821 // xtn v1.4h, v1.4s + .long 0x0ea11e01 // orr v1.8b, v16.8b, v1.8b + .long 0x2f10a421 // uxtl v1.4s, v1.4h + .long 0x4f3f5421 // shl v1.4s, v1.4s, #31 + .long 0x6ea08821 // cmge v1.4s, v1.4s, #0 + .long 0x4f03f610 // fmov v16.4s, #1.000000000000000000e+00 + .long 0x4e211e01 // and v1.16b, v16.16b, v1.16b + .long 0x3d800101 // str q1, [x8] + .long 0xf9400425 // ldr x5, [x1, #8] + .long 0x91004021 // add x1, x1, #0x10 + .long 0xd61f00a0 // br x5 + +HIDDEN _sk_vector_scale_aarch64 +.globl _sk_vector_scale_aarch64 +FUNCTION(_sk_vector_scale_aarch64) +_sk_vector_scale_aarch64: + .long 0xa8c11428 // ldp x8, x5, [x1], #16 + .long 0x3dc00110 // ldr q16, [x8] + .long 0x6e20de00 // fmul v0.4s, v16.4s, v0.4s + .long 0x6e21de01 // fmul v1.4s, v16.4s, v1.4s + .long 0x6e22de02 // fmul v2.4s, v16.4s, v2.4s + .long 0x6e23de03 // fmul v3.4s, v16.4s, v3.4s + .long 0xd61f00a0 // br x5 + HIDDEN _sk_save_xy_aarch64 .globl _sk_save_xy_aarch64 FUNCTION(_sk_save_xy_aarch64) @@ -10434,31 +10482,33 @@ _sk_xy_to_radius_vfp4: .long 0xf3000db1 // vmul.f32 d0, d16, d17 .long 0xe12fff1c // bx ip -HIDDEN _sk_xy_to_2pt_conical_vfp4 -.globl _sk_xy_to_2pt_conical_vfp4 -FUNCTION(_sk_xy_to_2pt_conical_vfp4) -_sk_xy_to_2pt_conical_vfp4: - .long 0xe92d4800 // push {fp, lr} - .long 0xed2d8b04 // vpush {d8-d9} +HIDDEN _sk_xy_to_2pt_conical_quadratic_vfp4 +.globl _sk_xy_to_2pt_conical_quadratic_vfp4 +FUNCTION(_sk_xy_to_2pt_conical_quadratic_vfp4) +_sk_xy_to_2pt_conical_quadratic_vfp4: + .long 0xe92d4010 // push {r4, lr} + .long 0xed2d8b06 // vpush {d8-d10} .long 0xe591e000 // ldr lr, [r1] .long 0xf3410d11 // vmul.f32 d16, d1, d1 .long 0xf3401d10 // vmul.f32 d17, d0, d0 .long 0xe591c004 // ldr ip, [r1, #4] + .long 0xf3c12f10 // vmov.f32 d18, #-4 + .long 0xe28e4020 // add r4, lr, #32 + .long 0xed9e8a0a // vldr s16, [lr, #40] .long 0xf3c44610 // vmov.i32 d20, #-1073741824 + .long 0xed9e9a0b // vldr s18, [lr, #44] .long 0xe2811008 // add r1, r1, #8 - .long 0xed9e8a02 // vldr s16, [lr, #8] - .long 0xed9e9a03 // vldr s18, [lr, #12] + .long 0xee28aa08 // vmul.f32 s20, s16, s16 + .long 0xee298a08 // vmul.f32 s16, s18, s16 .long 0xf2410da0 // vadd.f32 d16, d17, d16 - .long 0xee299a08 // vmul.f32 s18, s18, s16 - .long 0xee288a08 // vmul.f32 s16, s16, s16 - .long 0xf3c11f10 // vmov.f32 d17, #-4 - .long 0xf3f42c09 // vdup.32 d18, d9[0] + .long 0xf3f41c0a // vdup.32 d17, d10[0] .long 0xf3f43c08 // vdup.32 d19, d8[0] - .long 0xf2422d80 // vadd.f32 d18, d18, d0 - .long 0xf2600da3 // vsub.f32 d16, d16, d19 - .long 0xf4ee3c9d // vld1.32 {d19[]}, [lr :32]! - .long 0xf3431db1 // vmul.f32 d17, d19, d17 - .long 0xf3422db4 // vmul.f32 d18, d18, d20 + .long 0xf2600da1 // vsub.f32 d16, d16, d17 + .long 0xf4e41c9f // vld1.32 {d17[]}, [r4 :32] + .long 0xf2433d80 // vadd.f32 d19, d19, d0 + .long 0xf3411db2 // vmul.f32 d17, d17, d18 + .long 0xe28e4024 // add r4, lr, #36 + .long 0xf3432db4 // vmul.f32 d18, d19, d20 .long 0xf3410db0 // vmul.f32 d16, d17, d16 .long 0xf2420cb2 // vfma.f32 d16, d18, d18 .long 0xf3fb15a0 // vrsqrte.f32 d17, d16 @@ -10472,14 +10522,78 @@ _sk_xy_to_2pt_conical_vfp4: .long 0xf3410db0 // vmul.f32 d16, d17, d16 .long 0xf2631da0 // vsub.f32 d17, d19, d16 .long 0xf2600da2 // vsub.f32 d16, d16, d18 - .long 0xf4ee2c9f // vld1.32 {d18[]}, [lr :32] + .long 0xf4e42c9f // vld1.32 {d18[]}, [r4 :32] .long 0xf2c3361f // vmov.i32 d19, #1056964608 .long 0xf3421db1 // vmul.f32 d17, d18, d17 .long 0xf3420db0 // vmul.f32 d16, d18, d16 .long 0xf3411db3 // vmul.f32 d17, d17, d19 .long 0xf3400db3 // vmul.f32 d16, d16, d19 .long 0xf2000fa1 // vmax.f32 d0, d16, d17 - .long 0xecbd8b04 // vpop {d8-d9} + .long 0xecbd8b06 // vpop {d8-d10} + .long 0xe8bd4010 // pop {r4, lr} + .long 0xe12fff1c // bx ip + .long 0xe320f000 // nop {0} + +HIDDEN _sk_xy_to_2pt_conical_linear_vfp4 +.globl _sk_xy_to_2pt_conical_linear_vfp4 +FUNCTION(_sk_xy_to_2pt_conical_linear_vfp4) +_sk_xy_to_2pt_conical_linear_vfp4: + .long 0xe92d4800 // push {fp, lr} + .long 0xed2d8b06 // vpush {d8-d10} + .long 0xe591c000 // ldr ip, [r1] + .long 0xf3410d11 // vmul.f32 d16, d1, d1 + .long 0xf3401d10 // vmul.f32 d17, d0, d0 + .long 0xf3c43610 // vmov.i32 d19, #-1073741824 + .long 0xed9c1a0a // vldr s2, [ip, #40] + .long 0xed9c8a0b // vldr s16, [ip, #44] + .long 0xee21aa01 // vmul.f32 s20, s2, s2 + .long 0xee289a01 // vmul.f32 s18, s16, s2 + .long 0xf2410da0 // vadd.f32 d16, d17, d16 + .long 0xf3f42c0a // vdup.32 d18, d10[0] + .long 0xf3f41c09 // vdup.32 d17, d9[0] + .long 0xf2600da2 // vsub.f32 d16, d16, d18 + .long 0xf2411d80 // vadd.f32 d17, d17, d0 + .long 0xf3b9a7a0 // vneg.f32 d10, d16 + .long 0xf3019db3 // vmul.f32 d9, d17, d19 + .long 0xf3f43c08 // vdup.32 d19, d8[0] + .long 0xf2c00010 // vmov.i32 d16, #0 + .long 0xeeca0aa9 // vdiv.f32 s1, s21, s19 + .long 0xee8a0a09 // vdiv.f32 s0, s20, s18 + .long 0xf3401e20 // vcge.f32 d17, d0, d16 + .long 0xf3602e80 // vcgt.f32 d18, d16, d0 + .long 0xf26211b1 // vorr d17, d18, d17 + .long 0xf3f42c01 // vdup.32 d18, d1[0] + .long 0xf2402c33 // vfma.f32 d18, d0, d19 + .long 0xeddf3b0c // vldr d19, [pc, #48] + .long 0xf3b015a1 // vmvn d1, d17 + .long 0xf3f91622 // vclt.f32 d17, d18, #0 + .long 0xf35011b3 // vbsl d17, d16, d19 + .long 0xf31011b1 // vbsl d1, d16, d17 + .long 0xed8c1b00 // vstr d1, [ip] + .long 0xe281c008 // add ip, r1, #8 + .long 0xe591e004 // ldr lr, [r1, #4] + .long 0xe1a0100c // mov r1, ip + .long 0xe1a0c00e // mov ip, lr + .long 0xecbd8b06 // vpop {d8-d10} + .long 0xe8bd4800 // pop {fp, lr} + .long 0xe12fff1c // bx ip + .long 0xe320f000 // nop {0} + .long 0x3f800000 // .word 0x3f800000 + .long 0x3f800000 // .word 0x3f800000 + +HIDDEN _sk_vector_scale_vfp4 +.globl _sk_vector_scale_vfp4 +FUNCTION(_sk_vector_scale_vfp4) +_sk_vector_scale_vfp4: + .long 0xe92d4800 // push {fp, lr} + .long 0xe591e000 // ldr lr, [r1] + .long 0xe591c004 // ldr ip, [r1, #4] + .long 0xe2811008 // add r1, r1, #8 + .long 0xedde0b00 // vldr d16, [lr] + .long 0xf3000d90 // vmul.f32 d0, d16, d0 + .long 0xf3001d91 // vmul.f32 d1, d16, d1 + .long 0xf3002d92 // vmul.f32 d2, d16, d2 + .long 0xf3003d93 // vmul.f32 d3, d16, d3 .long 0xe8bd4800 // pop {fp, lr} .long 0xe12fff1c // bx ip .long 0xe320f000 // nop {0} @@ -10956,7 +11070,7 @@ _sk_seed_shader_hsw: .byte 197,249,110,194 // vmovd %edx,%xmm0 .byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,137,85,0,0 // vbroadcastss 0x5589(%rip),%ymm1 # 5620 <_sk_callback_hsw+0x141> + .byte 196,226,125,24,13,49,86,0,0 // vbroadcastss 0x5631(%rip),%ymm1 # 56c8 <_sk_callback_hsw+0x143> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0 .byte 197,249,110,209 // vmovd %ecx,%xmm2 @@ -10964,7 +11078,7 @@ _sk_seed_shader_hsw: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,21,105,85,0,0 // vbroadcastss 0x5569(%rip),%ymm2 # 5624 <_sk_callback_hsw+0x145> + .byte 196,226,125,24,21,17,86,0,0 // vbroadcastss 0x5611(%rip),%ymm2 # 56cc <_sk_callback_hsw+0x147> .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 @@ -10983,13 +11097,13 @@ _sk_dither_hsw: .byte 197,121,110,201 // vmovd %ecx,%xmm9 .byte 196,66,125,88,201 // vpbroadcastd %xmm9,%ymm9 .byte 196,65,53,239,200 // vpxor %ymm8,%ymm9,%ymm9 - .byte 196,98,125,88,21,48,85,0,0 // vpbroadcastd 0x5530(%rip),%ymm10 # 5628 <_sk_callback_hsw+0x149> + .byte 196,98,125,88,21,216,85,0,0 // vpbroadcastd 0x55d8(%rip),%ymm10 # 56d0 <_sk_callback_hsw+0x14b> .byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11 .byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11 .byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10 .byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10 - .byte 196,98,125,88,37,21,85,0,0 // vpbroadcastd 0x5515(%rip),%ymm12 # 562c <_sk_callback_hsw+0x14d> - .byte 196,98,125,88,45,16,85,0,0 // vpbroadcastd 0x5510(%rip),%ymm13 # 5630 <_sk_callback_hsw+0x151> + .byte 196,98,125,88,37,189,85,0,0 // vpbroadcastd 0x55bd(%rip),%ymm12 # 56d4 <_sk_callback_hsw+0x14f> + .byte 196,98,125,88,45,184,85,0,0 // vpbroadcastd 0x55b8(%rip),%ymm13 # 56d8 <_sk_callback_hsw+0x153> .byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14 .byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14 .byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13 @@ -11004,8 +11118,8 @@ _sk_dither_hsw: .byte 196,65,61,235,194 // vpor %ymm10,%ymm8,%ymm8 .byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,194,84,0,0 // vbroadcastss 0x54c2(%rip),%ymm9 # 5634 <_sk_callback_hsw+0x155> - .byte 196,98,125,24,21,189,84,0,0 // vbroadcastss 0x54bd(%rip),%ymm10 # 5638 <_sk_callback_hsw+0x159> + .byte 196,98,125,24,13,106,85,0,0 // vbroadcastss 0x556a(%rip),%ymm9 # 56dc <_sk_callback_hsw+0x157> + .byte 196,98,125,24,21,101,85,0,0 // vbroadcastss 0x5565(%rip),%ymm10 # 56e0 <_sk_callback_hsw+0x15b> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 196,98,125,24,0 // vbroadcastss (%rax),%ymm8 .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 @@ -11074,7 +11188,7 @@ HIDDEN _sk_srcatop_hsw FUNCTION(_sk_srcatop_hsw) _sk_srcatop_hsw: .byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0 - .byte 196,98,125,24,5,21,84,0,0 // vbroadcastss 0x5415(%rip),%ymm8 # 563c <_sk_callback_hsw+0x15d> + .byte 196,98,125,24,5,189,84,0,0 // vbroadcastss 0x54bd(%rip),%ymm8 # 56e4 <_sk_callback_hsw+0x15f> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0 .byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1 @@ -11090,7 +11204,7 @@ HIDDEN _sk_dstatop_hsw .globl _sk_dstatop_hsw FUNCTION(_sk_dstatop_hsw) _sk_dstatop_hsw: - .byte 196,98,125,24,5,232,83,0,0 // vbroadcastss 0x53e8(%rip),%ymm8 # 5640 <_sk_callback_hsw+0x161> + .byte 196,98,125,24,5,144,84,0,0 // vbroadcastss 0x5490(%rip),%ymm8 # 56e8 <_sk_callback_hsw+0x163> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0 @@ -11129,7 +11243,7 @@ HIDDEN _sk_srcout_hsw .globl _sk_srcout_hsw FUNCTION(_sk_srcout_hsw) _sk_srcout_hsw: - .byte 196,98,125,24,5,143,83,0,0 // vbroadcastss 0x538f(%rip),%ymm8 # 5644 <_sk_callback_hsw+0x165> + .byte 196,98,125,24,5,55,84,0,0 // vbroadcastss 0x5437(%rip),%ymm8 # 56ec <_sk_callback_hsw+0x167> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -11142,7 +11256,7 @@ HIDDEN _sk_dstout_hsw .globl _sk_dstout_hsw FUNCTION(_sk_dstout_hsw) _sk_dstout_hsw: - .byte 196,226,125,24,5,114,83,0,0 // vbroadcastss 0x5372(%rip),%ymm0 # 5648 <_sk_callback_hsw+0x169> + .byte 196,226,125,24,5,26,84,0,0 // vbroadcastss 0x541a(%rip),%ymm0 # 56f0 <_sk_callback_hsw+0x16b> .byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3 .byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0 .byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1 @@ -11155,7 +11269,7 @@ HIDDEN _sk_srcover_hsw .globl _sk_srcover_hsw FUNCTION(_sk_srcover_hsw) _sk_srcover_hsw: - .byte 196,98,125,24,5,85,83,0,0 // vbroadcastss 0x5355(%rip),%ymm8 # 564c <_sk_callback_hsw+0x16d> + .byte 196,98,125,24,5,253,83,0,0 // vbroadcastss 0x53fd(%rip),%ymm8 # 56f4 <_sk_callback_hsw+0x16f> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0 .byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1 @@ -11168,7 +11282,7 @@ HIDDEN _sk_dstover_hsw .globl _sk_dstover_hsw FUNCTION(_sk_dstover_hsw) _sk_dstover_hsw: - .byte 196,98,125,24,5,52,83,0,0 // vbroadcastss 0x5334(%rip),%ymm8 # 5650 <_sk_callback_hsw+0x171> + .byte 196,98,125,24,5,220,83,0,0 // vbroadcastss 0x53dc(%rip),%ymm8 # 56f8 <_sk_callback_hsw+0x173> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0 .byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1 @@ -11192,7 +11306,7 @@ HIDDEN _sk_multiply_hsw .globl _sk_multiply_hsw FUNCTION(_sk_multiply_hsw) _sk_multiply_hsw: - .byte 196,98,125,24,5,255,82,0,0 // vbroadcastss 0x52ff(%rip),%ymm8 # 5654 <_sk_callback_hsw+0x175> + .byte 196,98,125,24,5,167,83,0,0 // vbroadcastss 0x53a7(%rip),%ymm8 # 56fc <_sk_callback_hsw+0x177> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -11240,7 +11354,7 @@ HIDDEN _sk_xor__hsw .globl _sk_xor__hsw FUNCTION(_sk_xor__hsw) _sk_xor__hsw: - .byte 196,98,125,24,5,122,82,0,0 // vbroadcastss 0x527a(%rip),%ymm8 # 5658 <_sk_callback_hsw+0x179> + .byte 196,98,125,24,5,34,83,0,0 // vbroadcastss 0x5322(%rip),%ymm8 # 5700 <_sk_callback_hsw+0x17b> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -11274,7 +11388,7 @@ _sk_darken_hsw: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,2,82,0,0 // vbroadcastss 0x5202(%rip),%ymm8 # 565c <_sk_callback_hsw+0x17d> + .byte 196,98,125,24,5,170,82,0,0 // vbroadcastss 0x52aa(%rip),%ymm8 # 5704 <_sk_callback_hsw+0x17f> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -11299,7 +11413,7 @@ _sk_lighten_hsw: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,177,81,0,0 // vbroadcastss 0x51b1(%rip),%ymm8 # 5660 <_sk_callback_hsw+0x181> + .byte 196,98,125,24,5,89,82,0,0 // vbroadcastss 0x5259(%rip),%ymm8 # 5708 <_sk_callback_hsw+0x183> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -11327,7 +11441,7 @@ _sk_difference_hsw: .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,84,81,0,0 // vbroadcastss 0x5154(%rip),%ymm8 # 5664 <_sk_callback_hsw+0x185> + .byte 196,98,125,24,5,252,81,0,0 // vbroadcastss 0x51fc(%rip),%ymm8 # 570c <_sk_callback_hsw+0x187> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -11349,7 +11463,7 @@ _sk_exclusion_hsw: .byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,18,81,0,0 // vbroadcastss 0x5112(%rip),%ymm8 # 5668 <_sk_callback_hsw+0x189> + .byte 196,98,125,24,5,186,81,0,0 // vbroadcastss 0x51ba(%rip),%ymm8 # 5710 <_sk_callback_hsw+0x18b> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -11359,7 +11473,7 @@ HIDDEN _sk_colorburn_hsw .globl _sk_colorburn_hsw FUNCTION(_sk_colorburn_hsw) _sk_colorburn_hsw: - .byte 196,98,125,24,5,0,81,0,0 // vbroadcastss 0x5100(%rip),%ymm8 # 566c <_sk_callback_hsw+0x18d> + .byte 196,98,125,24,5,168,81,0,0 // vbroadcastss 0x51a8(%rip),%ymm8 # 5714 <_sk_callback_hsw+0x18f> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11 .byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10 @@ -11417,7 +11531,7 @@ HIDDEN _sk_colordodge_hsw FUNCTION(_sk_colordodge_hsw) _sk_colordodge_hsw: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,13,11,80,0,0 // vbroadcastss 0x500b(%rip),%ymm9 # 5670 <_sk_callback_hsw+0x191> + .byte 196,98,125,24,13,179,80,0,0 // vbroadcastss 0x50b3(%rip),%ymm9 # 5718 <_sk_callback_hsw+0x193> .byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9 @@ -11470,7 +11584,7 @@ HIDDEN _sk_hardlight_hsw .globl _sk_hardlight_hsw FUNCTION(_sk_hardlight_hsw) _sk_hardlight_hsw: - .byte 196,98,125,24,5,44,79,0,0 // vbroadcastss 0x4f2c(%rip),%ymm8 # 5674 <_sk_callback_hsw+0x195> + .byte 196,98,125,24,5,212,79,0,0 // vbroadcastss 0x4fd4(%rip),%ymm8 # 571c <_sk_callback_hsw+0x197> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -11521,7 +11635,7 @@ HIDDEN _sk_overlay_hsw .globl _sk_overlay_hsw FUNCTION(_sk_overlay_hsw) _sk_overlay_hsw: - .byte 196,98,125,24,5,100,78,0,0 // vbroadcastss 0x4e64(%rip),%ymm8 # 5678 <_sk_callback_hsw+0x199> + .byte 196,98,125,24,5,12,79,0,0 // vbroadcastss 0x4f0c(%rip),%ymm8 # 5720 <_sk_callback_hsw+0x19b> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -11582,10 +11696,10 @@ _sk_softlight_hsw: .byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8 .byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8 .byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,29,111,77,0,0 // vbroadcastss 0x4d6f(%rip),%ymm11 # 5680 <_sk_callback_hsw+0x1a1> + .byte 196,98,125,24,29,23,78,0,0 // vbroadcastss 0x4e17(%rip),%ymm11 # 5728 <_sk_callback_hsw+0x1a3> .byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12 .byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8 - .byte 196,98,125,24,37,96,77,0,0 // vbroadcastss 0x4d60(%rip),%ymm12 # 5684 <_sk_callback_hsw+0x1a5> + .byte 196,98,125,24,37,8,78,0,0 // vbroadcastss 0x4e08(%rip),%ymm12 # 572c <_sk_callback_hsw+0x1a7> .byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8 .byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14 .byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14 @@ -11595,7 +11709,7 @@ _sk_softlight_hsw: .byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15 .byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14 .byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15 - .byte 196,98,125,24,5,35,77,0,0 // vbroadcastss 0x4d23(%rip),%ymm8 # 567c <_sk_callback_hsw+0x19d> + .byte 196,98,125,24,5,203,77,0,0 // vbroadcastss 0x4dcb(%rip),%ymm8 # 5724 <_sk_callback_hsw+0x19f> .byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13 .byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0 .byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13 @@ -11708,11 +11822,11 @@ _sk_hue_hsw: .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10 .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10 .byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - .byte 196,98,125,24,53,39,75,0,0 // vbroadcastss 0x4b27(%rip),%ymm14 # 5688 <_sk_callback_hsw+0x1a9> - .byte 196,98,125,24,61,34,75,0,0 // vbroadcastss 0x4b22(%rip),%ymm15 # 568c <_sk_callback_hsw+0x1ad> + .byte 196,98,125,24,53,207,75,0,0 // vbroadcastss 0x4bcf(%rip),%ymm14 # 5730 <_sk_callback_hsw+0x1ab> + .byte 196,98,125,24,61,202,75,0,0 // vbroadcastss 0x4bca(%rip),%ymm15 # 5734 <_sk_callback_hsw+0x1af> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13 - .byte 196,226,125,24,5,19,75,0,0 // vbroadcastss 0x4b13(%rip),%ymm0 # 5690 <_sk_callback_hsw+0x1b1> + .byte 196,226,125,24,5,187,75,0,0 // vbroadcastss 0x4bbb(%rip),%ymm0 # 5738 <_sk_callback_hsw+0x1b3> .byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13 .byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10 .byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -11767,7 +11881,7 @@ _sk_hue_hsw: .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 .byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9 .byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8 - .byte 196,226,125,24,13,0,74,0,0 // vbroadcastss 0x4a00(%rip),%ymm1 # 5694 <_sk_callback_hsw+0x1b5> + .byte 196,226,125,24,13,168,74,0,0 // vbroadcastss 0x4aa8(%rip),%ymm1 # 573c <_sk_callback_hsw+0x1b7> .byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11 @@ -11821,11 +11935,11 @@ _sk_saturation_hsw: .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10 .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10 .byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - .byte 196,98,125,24,53,23,73,0,0 // vbroadcastss 0x4917(%rip),%ymm14 # 5698 <_sk_callback_hsw+0x1b9> - .byte 196,98,125,24,61,18,73,0,0 // vbroadcastss 0x4912(%rip),%ymm15 # 569c <_sk_callback_hsw+0x1bd> + .byte 196,98,125,24,53,191,73,0,0 // vbroadcastss 0x49bf(%rip),%ymm14 # 5740 <_sk_callback_hsw+0x1bb> + .byte 196,98,125,24,61,186,73,0,0 // vbroadcastss 0x49ba(%rip),%ymm15 # 5744 <_sk_callback_hsw+0x1bf> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13 - .byte 196,226,125,24,5,3,73,0,0 // vbroadcastss 0x4903(%rip),%ymm0 # 56a0 <_sk_callback_hsw+0x1c1> + .byte 196,226,125,24,5,171,73,0,0 // vbroadcastss 0x49ab(%rip),%ymm0 # 5748 <_sk_callback_hsw+0x1c3> .byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13 .byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10 .byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -11880,7 +11994,7 @@ _sk_saturation_hsw: .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 .byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9 .byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8 - .byte 196,226,125,24,13,240,71,0,0 // vbroadcastss 0x47f0(%rip),%ymm1 # 56a4 <_sk_callback_hsw+0x1c5> + .byte 196,226,125,24,13,152,72,0,0 // vbroadcastss 0x4898(%rip),%ymm1 # 574c <_sk_callback_hsw+0x1c7> .byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11 @@ -11908,11 +12022,11 @@ _sk_color_hsw: .byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8 .byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10 .byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11 - .byte 196,98,125,24,45,137,71,0,0 // vbroadcastss 0x4789(%rip),%ymm13 # 56a8 <_sk_callback_hsw+0x1c9> - .byte 196,98,125,24,53,132,71,0,0 // vbroadcastss 0x4784(%rip),%ymm14 # 56ac <_sk_callback_hsw+0x1cd> + .byte 196,98,125,24,45,49,72,0,0 // vbroadcastss 0x4831(%rip),%ymm13 # 5750 <_sk_callback_hsw+0x1cb> + .byte 196,98,125,24,53,44,72,0,0 // vbroadcastss 0x482c(%rip),%ymm14 # 5754 <_sk_callback_hsw+0x1cf> .byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12 .byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12 - .byte 196,98,125,24,61,117,71,0,0 // vbroadcastss 0x4775(%rip),%ymm15 # 56b0 <_sk_callback_hsw+0x1d1> + .byte 196,98,125,24,61,29,72,0,0 // vbroadcastss 0x481d(%rip),%ymm15 # 5758 <_sk_callback_hsw+0x1d3> .byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12 .byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9 .byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -11968,7 +12082,7 @@ _sk_color_hsw: .byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1 .byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8 .byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9 - .byte 196,226,125,24,5,87,70,0,0 // vbroadcastss 0x4657(%rip),%ymm0 # 56b4 <_sk_callback_hsw+0x1d5> + .byte 196,226,125,24,5,255,70,0,0 // vbroadcastss 0x46ff(%rip),%ymm0 # 575c <_sk_callback_hsw+0x1d7> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -11996,11 +12110,11 @@ _sk_luminosity_hsw: .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 .byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10 .byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11 - .byte 196,98,125,24,45,240,69,0,0 // vbroadcastss 0x45f0(%rip),%ymm13 # 56b8 <_sk_callback_hsw+0x1d9> - .byte 196,98,125,24,53,235,69,0,0 // vbroadcastss 0x45eb(%rip),%ymm14 # 56bc <_sk_callback_hsw+0x1dd> + .byte 196,98,125,24,45,152,70,0,0 // vbroadcastss 0x4698(%rip),%ymm13 # 5760 <_sk_callback_hsw+0x1db> + .byte 196,98,125,24,53,147,70,0,0 // vbroadcastss 0x4693(%rip),%ymm14 # 5764 <_sk_callback_hsw+0x1df> .byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12 .byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12 - .byte 196,98,125,24,61,220,69,0,0 // vbroadcastss 0x45dc(%rip),%ymm15 # 56c0 <_sk_callback_hsw+0x1e1> + .byte 196,98,125,24,61,132,70,0,0 // vbroadcastss 0x4684(%rip),%ymm15 # 5768 <_sk_callback_hsw+0x1e3> .byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12 .byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9 .byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -12056,7 +12170,7 @@ _sk_luminosity_hsw: .byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1 .byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8 .byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9 - .byte 196,226,125,24,5,190,68,0,0 // vbroadcastss 0x44be(%rip),%ymm0 # 56c4 <_sk_callback_hsw+0x1e5> + .byte 196,226,125,24,5,102,69,0,0 // vbroadcastss 0x4566(%rip),%ymm0 # 576c <_sk_callback_hsw+0x1e7> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -12084,17 +12198,17 @@ _sk_srcover_rgba_8888_hsw: .byte 77,133,192 // test %r8,%r8 .byte 15,133,180,0,0,0 // jne 1315 <_sk_srcover_rgba_8888_hsw+0xcd> .byte 196,193,124,16,58 // vmovups (%r10),%ymm7 - .byte 197,196,84,37,82,72,0,0 // vandps 0x4852(%rip),%ymm7,%ymm4 # 5ac0 <_sk_callback_hsw+0x5e1> + .byte 197,196,84,37,18,73,0,0 // vandps 0x4912(%rip),%ymm7,%ymm4 # 5b80 <_sk_callback_hsw+0x5fb> .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,69,0,45,101,72,0,0 // vpshufb 0x4865(%rip),%ymm7,%ymm5 # 5ae0 <_sk_callback_hsw+0x601> + .byte 196,226,69,0,45,37,73,0,0 // vpshufb 0x4925(%rip),%ymm7,%ymm5 # 5ba0 <_sk_callback_hsw+0x61b> .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 - .byte 196,226,69,0,53,120,72,0,0 // vpshufb 0x4878(%rip),%ymm7,%ymm6 # 5b00 <_sk_callback_hsw+0x621> + .byte 196,226,69,0,53,56,73,0,0 // vpshufb 0x4938(%rip),%ymm7,%ymm6 # 5bc0 <_sk_callback_hsw+0x63b> .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 .byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7 .byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7 - .byte 196,98,125,24,5,42,68,0,0 // vbroadcastss 0x442a(%rip),%ymm8 # 56c8 <_sk_callback_hsw+0x1e9> + .byte 196,98,125,24,5,210,68,0,0 // vbroadcastss 0x44d2(%rip),%ymm8 # 5770 <_sk_callback_hsw+0x1eb> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 - .byte 196,98,125,24,13,33,68,0,0 // vbroadcastss 0x4421(%rip),%ymm9 # 56cc <_sk_callback_hsw+0x1ed> + .byte 196,98,125,24,13,201,68,0,0 // vbroadcastss 0x44c9(%rip),%ymm9 # 5774 <_sk_callback_hsw+0x1ef> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0 .byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1 @@ -12154,7 +12268,7 @@ HIDDEN _sk_clamp_1_hsw .globl _sk_clamp_1_hsw FUNCTION(_sk_clamp_1_hsw) _sk_clamp_1_hsw: - .byte 196,98,125,24,5,70,67,0,0 // vbroadcastss 0x4346(%rip),%ymm8 # 56d0 <_sk_callback_hsw+0x1f1> + .byte 196,98,125,24,5,238,67,0,0 // vbroadcastss 0x43ee(%rip),%ymm8 # 5778 <_sk_callback_hsw+0x1f3> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 @@ -12166,7 +12280,7 @@ HIDDEN _sk_clamp_a_hsw .globl _sk_clamp_a_hsw FUNCTION(_sk_clamp_a_hsw) _sk_clamp_a_hsw: - .byte 196,98,125,24,5,41,67,0,0 // vbroadcastss 0x4329(%rip),%ymm8 # 56d4 <_sk_callback_hsw+0x1f5> + .byte 196,98,125,24,5,209,67,0,0 // vbroadcastss 0x43d1(%rip),%ymm8 # 577c <_sk_callback_hsw+0x1f7> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0 .byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1 @@ -12178,7 +12292,7 @@ HIDDEN _sk_clamp_a_dst_hsw .globl _sk_clamp_a_dst_hsw FUNCTION(_sk_clamp_a_dst_hsw) _sk_clamp_a_dst_hsw: - .byte 196,98,125,24,5,15,67,0,0 // vbroadcastss 0x430f(%rip),%ymm8 # 56d8 <_sk_callback_hsw+0x1f9> + .byte 196,98,125,24,5,183,67,0,0 // vbroadcastss 0x43b7(%rip),%ymm8 # 5780 <_sk_callback_hsw+0x1fb> .byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7 .byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4 .byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5 @@ -12245,7 +12359,7 @@ FUNCTION(_sk_unpremul_hsw) _sk_unpremul_hsw: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9 - .byte 196,98,125,24,21,139,66,0,0 // vbroadcastss 0x428b(%rip),%ymm10 # 56dc <_sk_callback_hsw+0x1fd> + .byte 196,98,125,24,21,51,67,0,0 // vbroadcastss 0x4333(%rip),%ymm10 # 5784 <_sk_callback_hsw+0x1ff> .byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10 .byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 @@ -12258,16 +12372,16 @@ HIDDEN _sk_from_srgb_hsw .globl _sk_from_srgb_hsw FUNCTION(_sk_from_srgb_hsw) _sk_from_srgb_hsw: - .byte 196,98,125,24,5,108,66,0,0 // vbroadcastss 0x426c(%rip),%ymm8 # 56e0 <_sk_callback_hsw+0x201> + .byte 196,98,125,24,5,20,67,0,0 // vbroadcastss 0x4314(%rip),%ymm8 # 5788 <_sk_callback_hsw+0x203> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10 - .byte 196,98,125,24,29,94,66,0,0 // vbroadcastss 0x425e(%rip),%ymm11 # 56e4 <_sk_callback_hsw+0x205> - .byte 196,98,125,24,37,89,66,0,0 // vbroadcastss 0x4259(%rip),%ymm12 # 56e8 <_sk_callback_hsw+0x209> + .byte 196,98,125,24,29,6,67,0,0 // vbroadcastss 0x4306(%rip),%ymm11 # 578c <_sk_callback_hsw+0x207> + .byte 196,98,125,24,37,1,67,0,0 // vbroadcastss 0x4301(%rip),%ymm12 # 5790 <_sk_callback_hsw+0x20b> .byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13 .byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13 - .byte 196,98,125,24,53,74,66,0,0 // vbroadcastss 0x424a(%rip),%ymm14 # 56ec <_sk_callback_hsw+0x20d> + .byte 196,98,125,24,53,242,66,0,0 // vbroadcastss 0x42f2(%rip),%ymm14 # 5794 <_sk_callback_hsw+0x20f> .byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13 - .byte 196,98,125,24,21,64,66,0,0 // vbroadcastss 0x4240(%rip),%ymm10 # 56f0 <_sk_callback_hsw+0x211> + .byte 196,98,125,24,21,232,66,0,0 // vbroadcastss 0x42e8(%rip),%ymm10 # 5798 <_sk_callback_hsw+0x213> .byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0 .byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0 .byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9 @@ -12290,16 +12404,16 @@ HIDDEN _sk_from_srgb_dst_hsw .globl _sk_from_srgb_dst_hsw FUNCTION(_sk_from_srgb_dst_hsw) _sk_from_srgb_dst_hsw: - .byte 196,98,125,24,5,232,65,0,0 // vbroadcastss 0x41e8(%rip),%ymm8 # 56f4 <_sk_callback_hsw+0x215> + .byte 196,98,125,24,5,144,66,0,0 // vbroadcastss 0x4290(%rip),%ymm8 # 579c <_sk_callback_hsw+0x217> .byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9 .byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10 - .byte 196,98,125,24,29,218,65,0,0 // vbroadcastss 0x41da(%rip),%ymm11 # 56f8 <_sk_callback_hsw+0x219> - .byte 196,98,125,24,37,213,65,0,0 // vbroadcastss 0x41d5(%rip),%ymm12 # 56fc <_sk_callback_hsw+0x21d> + .byte 196,98,125,24,29,130,66,0,0 // vbroadcastss 0x4282(%rip),%ymm11 # 57a0 <_sk_callback_hsw+0x21b> + .byte 196,98,125,24,37,125,66,0,0 // vbroadcastss 0x427d(%rip),%ymm12 # 57a4 <_sk_callback_hsw+0x21f> .byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13 .byte 196,66,93,168,235 // vfmadd213ps %ymm11,%ymm4,%ymm13 - .byte 196,98,125,24,53,198,65,0,0 // vbroadcastss 0x41c6(%rip),%ymm14 # 5700 <_sk_callback_hsw+0x221> + .byte 196,98,125,24,53,110,66,0,0 // vbroadcastss 0x426e(%rip),%ymm14 # 57a8 <_sk_callback_hsw+0x223> .byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13 - .byte 196,98,125,24,21,188,65,0,0 // vbroadcastss 0x41bc(%rip),%ymm10 # 5704 <_sk_callback_hsw+0x225> + .byte 196,98,125,24,21,100,66,0,0 // vbroadcastss 0x4264(%rip),%ymm10 # 57ac <_sk_callback_hsw+0x227> .byte 196,193,92,194,226,1 // vcmpltps %ymm10,%ymm4,%ymm4 .byte 196,195,21,74,225,64 // vblendvps %ymm4,%ymm9,%ymm13,%ymm4 .byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9 @@ -12323,19 +12437,19 @@ HIDDEN _sk_to_srgb_hsw FUNCTION(_sk_to_srgb_hsw) _sk_to_srgb_hsw: .byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9 - .byte 196,98,125,24,5,96,65,0,0 // vbroadcastss 0x4160(%rip),%ymm8 # 5708 <_sk_callback_hsw+0x229> + .byte 196,98,125,24,5,8,66,0,0 // vbroadcastss 0x4208(%rip),%ymm8 # 57b0 <_sk_callback_hsw+0x22b> .byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10 - .byte 196,98,125,24,29,86,65,0,0 // vbroadcastss 0x4156(%rip),%ymm11 # 570c <_sk_callback_hsw+0x22d> - .byte 196,98,125,24,37,81,65,0,0 // vbroadcastss 0x4151(%rip),%ymm12 # 5710 <_sk_callback_hsw+0x231> + .byte 196,98,125,24,29,254,65,0,0 // vbroadcastss 0x41fe(%rip),%ymm11 # 57b4 <_sk_callback_hsw+0x22f> + .byte 196,98,125,24,37,249,65,0,0 // vbroadcastss 0x41f9(%rip),%ymm12 # 57b8 <_sk_callback_hsw+0x233> .byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13 .byte 196,66,53,168,235 // vfmadd213ps %ymm11,%ymm9,%ymm13 - .byte 196,98,125,24,53,66,65,0,0 // vbroadcastss 0x4142(%rip),%ymm14 # 5714 <_sk_callback_hsw+0x235> + .byte 196,98,125,24,53,234,65,0,0 // vbroadcastss 0x41ea(%rip),%ymm14 # 57bc <_sk_callback_hsw+0x237> .byte 196,66,53,168,238 // vfmadd213ps %ymm14,%ymm9,%ymm13 - .byte 196,98,125,24,61,56,65,0,0 // vbroadcastss 0x4138(%rip),%ymm15 # 5718 <_sk_callback_hsw+0x239> + .byte 196,98,125,24,61,224,65,0,0 // vbroadcastss 0x41e0(%rip),%ymm15 # 57c0 <_sk_callback_hsw+0x23b> .byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9 .byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9 .byte 196,65,20,89,201 // vmulps %ymm9,%ymm13,%ymm9 - .byte 196,98,125,24,45,36,65,0,0 // vbroadcastss 0x4124(%rip),%ymm13 # 571c <_sk_callback_hsw+0x23d> + .byte 196,98,125,24,45,204,65,0,0 // vbroadcastss 0x41cc(%rip),%ymm13 # 57c4 <_sk_callback_hsw+0x23f> .byte 196,193,124,194,197,1 // vcmpltps %ymm13,%ymm0,%ymm0 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9 @@ -12369,26 +12483,26 @@ _sk_rgb_to_hsl_hsw: .byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9 .byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9 .byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,29,153,64,0,0 // vbroadcastss 0x4099(%rip),%ymm11 # 5720 <_sk_callback_hsw+0x241> + .byte 196,98,125,24,29,65,65,0,0 // vbroadcastss 0x4141(%rip),%ymm11 # 57c8 <_sk_callback_hsw+0x243> .byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11 .byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12 .byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13 - .byte 196,98,125,24,53,134,64,0,0 // vbroadcastss 0x4086(%rip),%ymm14 # 5724 <_sk_callback_hsw+0x245> + .byte 196,98,125,24,53,46,65,0,0 // vbroadcastss 0x412e(%rip),%ymm14 # 57cc <_sk_callback_hsw+0x247> .byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15 .byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13 .byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12 .byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2 .byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13 - .byte 196,98,125,24,53,109,64,0,0 // vbroadcastss 0x406d(%rip),%ymm14 # 572c <_sk_callback_hsw+0x24d> + .byte 196,98,125,24,53,21,65,0,0 // vbroadcastss 0x4115(%rip),%ymm14 # 57d4 <_sk_callback_hsw+0x24f> .byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13 - .byte 196,98,125,24,53,91,64,0,0 // vbroadcastss 0x405b(%rip),%ymm14 # 5728 <_sk_callback_hsw+0x249> + .byte 196,98,125,24,53,3,65,0,0 // vbroadcastss 0x4103(%rip),%ymm14 # 57d0 <_sk_callback_hsw+0x24b> .byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2 .byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1 .byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1 .byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0 .byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0 .byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1 - .byte 196,98,125,24,29,62,64,0,0 // vbroadcastss 0x403e(%rip),%ymm11 # 5734 <_sk_callback_hsw+0x255> + .byte 196,98,125,24,29,230,64,0,0 // vbroadcastss 0x40e6(%rip),%ymm11 # 57dc <_sk_callback_hsw+0x257> .byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2 .byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11 .byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12 @@ -12398,7 +12512,7 @@ _sk_rgb_to_hsl_hsw: .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0 .byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1 - .byte 196,98,125,24,5,1,64,0,0 // vbroadcastss 0x4001(%rip),%ymm8 # 5730 <_sk_callback_hsw+0x251> + .byte 196,98,125,24,5,169,64,0,0 // vbroadcastss 0x40a9(%rip),%ymm8 # 57d8 <_sk_callback_hsw+0x253> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -12415,30 +12529,30 @@ _sk_hsl_to_rgb_hsw: .byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp) .byte 197,252,40,233 // vmovaps %ymm1,%ymm5 .byte 197,252,40,224 // vmovaps %ymm0,%ymm4 - .byte 196,98,125,24,5,206,63,0,0 // vbroadcastss 0x3fce(%rip),%ymm8 # 5738 <_sk_callback_hsw+0x259> + .byte 196,98,125,24,5,118,64,0,0 // vbroadcastss 0x4076(%rip),%ymm8 # 57e0 <_sk_callback_hsw+0x25b> .byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9 .byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10 .byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11 .byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9 .byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10 - .byte 196,98,125,24,13,177,63,0,0 // vbroadcastss 0x3fb1(%rip),%ymm9 # 573c <_sk_callback_hsw+0x25d> + .byte 196,98,125,24,13,89,64,0,0 // vbroadcastss 0x4059(%rip),%ymm9 # 57e4 <_sk_callback_hsw+0x25f> .byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9 - .byte 196,98,125,24,29,167,63,0,0 // vbroadcastss 0x3fa7(%rip),%ymm11 # 5740 <_sk_callback_hsw+0x261> + .byte 196,98,125,24,29,79,64,0,0 // vbroadcastss 0x404f(%rip),%ymm11 # 57e8 <_sk_callback_hsw+0x263> .byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11 .byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12 .byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15 .byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11 - .byte 196,98,125,24,45,145,63,0,0 // vbroadcastss 0x3f91(%rip),%ymm13 # 5748 <_sk_callback_hsw+0x269> + .byte 196,98,125,24,45,57,64,0,0 // vbroadcastss 0x4039(%rip),%ymm13 # 57f0 <_sk_callback_hsw+0x26b> .byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0 - .byte 196,98,125,24,53,135,63,0,0 // vbroadcastss 0x3f87(%rip),%ymm14 # 574c <_sk_callback_hsw+0x26d> + .byte 196,98,125,24,53,47,64,0,0 // vbroadcastss 0x402f(%rip),%ymm14 # 57f4 <_sk_callback_hsw+0x26f> .byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12 .byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12 - .byte 196,226,125,24,29,109,63,0,0 // vbroadcastss 0x3f6d(%rip),%ymm3 # 5744 <_sk_callback_hsw+0x265> + .byte 196,226,125,24,29,21,64,0,0 // vbroadcastss 0x4015(%rip),%ymm3 # 57ec <_sk_callback_hsw+0x267> .byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7 .byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7 .byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12 .byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7 - .byte 196,98,125,24,37,88,63,0,0 // vbroadcastss 0x3f58(%rip),%ymm12 # 5750 <_sk_callback_hsw+0x271> + .byte 196,98,125,24,37,0,64,0,0 // vbroadcastss 0x4000(%rip),%ymm12 # 57f8 <_sk_callback_hsw+0x273> .byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15 .byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0 .byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15 @@ -12454,7 +12568,7 @@ _sk_hsl_to_rgb_hsw: .byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0 .byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7 .byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1 - .byte 196,226,125,24,5,4,63,0,0 // vbroadcastss 0x3f04(%rip),%ymm0 # 5754 <_sk_callback_hsw+0x275> + .byte 196,226,125,24,5,172,63,0,0 // vbroadcastss 0x3fac(%rip),%ymm0 # 57fc <_sk_callback_hsw+0x277> .byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0 .byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 @@ -12504,10 +12618,10 @@ _sk_scale_u8_hsw: .byte 77,133,192 // test %r8,%r8 .byte 117,58 // jne 1931 <_sk_scale_u8_hsw+0x44> .byte 196,66,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm8 - .byte 197,57,219,5,27,69,0,0 // vpand 0x451b(%rip),%xmm8,%xmm8 # 5e20 <_sk_callback_hsw+0x941> + .byte 197,57,219,5,219,69,0,0 // vpand 0x45db(%rip),%xmm8,%xmm8 # 5ee0 <_sk_callback_hsw+0x95b> .byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,64,62,0,0 // vbroadcastss 0x3e40(%rip),%ymm9 # 5758 <_sk_callback_hsw+0x279> + .byte 196,98,125,24,13,232,62,0,0 // vbroadcastss 0x3ee8(%rip),%ymm9 # 5800 <_sk_callback_hsw+0x27b> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -12555,7 +12669,7 @@ _sk_scale_u8_hsw: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 232,255,255,255,221 // callq ffffffffde0019dc <_sk_callback_hsw+0xffffffffddffc4fd> + .byte 232,255,255,255,221 // callq ffffffffde0019dc <_sk_callback_hsw+0xffffffffddffc457> .byte 255 // (bad) .byte 255 // (bad) .byte 255,210 // callq *%rdx @@ -12592,10 +12706,10 @@ _sk_lerp_u8_hsw: .byte 77,133,192 // test %r8,%r8 .byte 117,78 // jne 1a6f <_sk_lerp_u8_hsw+0x58> .byte 196,66,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm8 - .byte 197,57,219,5,1,68,0,0 // vpand 0x4401(%rip),%xmm8,%xmm8 # 5e30 <_sk_callback_hsw+0x951> + .byte 197,57,219,5,193,68,0,0 // vpand 0x44c1(%rip),%xmm8,%xmm8 # 5ef0 <_sk_callback_hsw+0x96b> .byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,26,61,0,0 // vbroadcastss 0x3d1a(%rip),%ymm9 # 575c <_sk_callback_hsw+0x27d> + .byte 196,98,125,24,13,194,61,0,0 // vbroadcastss 0x3dc2(%rip),%ymm9 # 5804 <_sk_callback_hsw+0x27f> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0 @@ -12671,20 +12785,20 @@ _sk_lerp_565_hsw: .byte 15,133,169,0,0,0 // jne 1bdb <_sk_lerp_565_hsw+0xb7> .byte 196,65,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm8 .byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8 - .byte 196,98,125,88,13,26,60,0,0 // vpbroadcastd 0x3c1a(%rip),%ymm9 # 5760 <_sk_callback_hsw+0x281> + .byte 196,98,125,88,13,194,60,0,0 // vpbroadcastd 0x3cc2(%rip),%ymm9 # 5808 <_sk_callback_hsw+0x283> .byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9 .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9 - .byte 196,98,125,24,21,11,60,0,0 // vbroadcastss 0x3c0b(%rip),%ymm10 # 5764 <_sk_callback_hsw+0x285> + .byte 196,98,125,24,21,179,60,0,0 // vbroadcastss 0x3cb3(%rip),%ymm10 # 580c <_sk_callback_hsw+0x287> .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,88,21,1,60,0,0 // vpbroadcastd 0x3c01(%rip),%ymm10 # 5768 <_sk_callback_hsw+0x289> + .byte 196,98,125,88,21,169,60,0,0 // vpbroadcastd 0x3ca9(%rip),%ymm10 # 5810 <_sk_callback_hsw+0x28b> .byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10 .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10 - .byte 196,98,125,24,29,242,59,0,0 // vbroadcastss 0x3bf2(%rip),%ymm11 # 576c <_sk_callback_hsw+0x28d> + .byte 196,98,125,24,29,154,60,0,0 // vbroadcastss 0x3c9a(%rip),%ymm11 # 5814 <_sk_callback_hsw+0x28f> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,88,29,232,59,0,0 // vpbroadcastd 0x3be8(%rip),%ymm11 # 5770 <_sk_callback_hsw+0x291> + .byte 196,98,125,88,29,144,60,0,0 // vpbroadcastd 0x3c90(%rip),%ymm11 # 5818 <_sk_callback_hsw+0x293> .byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,29,217,59,0,0 // vbroadcastss 0x3bd9(%rip),%ymm11 # 5774 <_sk_callback_hsw+0x295> + .byte 196,98,125,24,29,129,60,0,0 // vbroadcastss 0x3c81(%rip),%ymm11 # 581c <_sk_callback_hsw+0x297> .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,226,53,168,196 // vfmadd213ps %ymm4,%ymm9,%ymm0 @@ -12760,21 +12874,21 @@ _sk_load_tables_hsw: .byte 77,133,192 // test %r8,%r8 .byte 117,105 // jne 1cfe <_sk_load_tables_hsw+0x7e> .byte 196,193,124,16,26 // vmovups (%r10),%ymm3 - .byte 197,228,84,13,126,62,0,0 // vandps 0x3e7e(%rip),%ymm3,%ymm1 # 5b20 <_sk_callback_hsw+0x641> + .byte 197,228,84,13,62,63,0,0 // vandps 0x3f3e(%rip),%ymm3,%ymm1 # 5be0 <_sk_callback_hsw+0x65b> .byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8 .byte 72,139,72,8 // mov 0x8(%rax),%rcx .byte 76,139,80,16 // mov 0x10(%rax),%r10 .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2 .byte 196,226,109,146,4,137 // vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0 - .byte 196,226,101,0,21,126,62,0,0 // vpshufb 0x3e7e(%rip),%ymm3,%ymm2 # 5b40 <_sk_callback_hsw+0x661> + .byte 196,226,101,0,21,62,63,0,0 // vpshufb 0x3f3e(%rip),%ymm3,%ymm2 # 5c00 <_sk_callback_hsw+0x67b> .byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9 .byte 196,194,53,146,12,146 // vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1 .byte 72,139,64,24 // mov 0x18(%rax),%rax - .byte 196,98,101,0,13,134,62,0,0 // vpshufb 0x3e86(%rip),%ymm3,%ymm9 # 5b60 <_sk_callback_hsw+0x681> + .byte 196,98,101,0,13,70,63,0,0 // vpshufb 0x3f46(%rip),%ymm3,%ymm9 # 5c20 <_sk_callback_hsw+0x69b> .byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,134,58,0,0 // vbroadcastss 0x3a86(%rip),%ymm8 # 5778 <_sk_callback_hsw+0x299> + .byte 196,98,125,24,5,46,59,0,0 // vbroadcastss 0x3b2e(%rip),%ymm8 # 5820 <_sk_callback_hsw+0x29b> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,137,201 // mov %r9,%rcx @@ -12813,7 +12927,7 @@ _sk_load_tables_u16_be_hsw: .byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1 .byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2 .byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8 - .byte 197,121,111,21,178,64,0,0 // vmovdqa 0x40b2(%rip),%xmm10 # 5e40 <_sk_callback_hsw+0x961> + .byte 197,121,111,21,114,65,0,0 // vmovdqa 0x4172(%rip),%xmm10 # 5f00 <_sk_callback_hsw+0x97b> .byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0 .byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1 .byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11 @@ -12835,7 +12949,7 @@ _sk_load_tables_u16_be_hsw: .byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3 .byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,127,57,0,0 // vbroadcastss 0x397f(%rip),%ymm8 # 577c <_sk_callback_hsw+0x29d> + .byte 196,98,125,24,5,39,58,0,0 // vbroadcastss 0x3a27(%rip),%ymm8 # 5824 <_sk_callback_hsw+0x29f> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -12895,7 +13009,7 @@ _sk_load_tables_rgb_u16_be_hsw: .byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3 .byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2 .byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8 - .byte 197,121,111,13,82,63,0,0 // vmovdqa 0x3f52(%rip),%xmm9 # 5e50 <_sk_callback_hsw+0x971> + .byte 197,121,111,13,18,64,0,0 // vmovdqa 0x4012(%rip),%xmm9 # 5f10 <_sk_callback_hsw+0x98b> .byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0 .byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1 .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3 @@ -12912,7 +13026,7 @@ _sk_load_tables_rgb_u16_be_hsw: .byte 196,98,125,51,194 // vpmovzxwd %xmm2,%ymm8 .byte 196,162,101,146,20,128 // vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,45,56,0,0 // vbroadcastss 0x382d(%rip),%ymm3 # 5780 <_sk_callback_hsw+0x2a1> + .byte 196,226,125,24,29,213,56,0,0 // vbroadcastss 0x38d5(%rip),%ymm3 # 5828 <_sk_callback_hsw+0x2a3> .byte 255,224 // jmpq *%rax .byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0 .byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0 @@ -12953,7 +13067,7 @@ HIDDEN _sk_byte_tables_hsw FUNCTION(_sk_byte_tables_hsw) _sk_byte_tables_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,117,55,0,0 // vbroadcastss 0x3775(%rip),%ymm8 # 5784 <_sk_callback_hsw+0x2a5> + .byte 196,98,125,24,5,29,56,0,0 // vbroadcastss 0x381d(%rip),%ymm8 # 582c <_sk_callback_hsw+0x2a7> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9 .byte 196,65,249,126,201 // vmovq %xmm9,%r9 @@ -13075,7 +13189,7 @@ _sk_byte_tables_hsw: .byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax .byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,26,53,0,0 // vbroadcastss 0x351a(%rip),%ymm8 # 5788 <_sk_callback_hsw+0x2a9> + .byte 196,98,125,24,5,194,53,0,0 // vbroadcastss 0x35c2(%rip),%ymm8 # 5830 <_sk_callback_hsw+0x2ab> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 @@ -13191,7 +13305,7 @@ _sk_byte_tables_rgb_hsw: .byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax .byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,6,51,0,0 // vbroadcastss 0x3306(%rip),%ymm8 # 578c <_sk_callback_hsw+0x2ad> + .byte 196,98,125,24,5,174,51,0,0 // vbroadcastss 0x33ae(%rip),%ymm8 # 5834 <_sk_callback_hsw+0x2af> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 @@ -13290,33 +13404,33 @@ _sk_parametric_r_hsw: .byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10 .byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,224,49,0,0 // vbroadcastss 0x31e0(%rip),%ymm12 # 5790 <_sk_callback_hsw+0x2b1> - .byte 196,98,125,24,45,219,49,0,0 // vbroadcastss 0x31db(%rip),%ymm13 # 5794 <_sk_callback_hsw+0x2b5> + .byte 196,98,125,24,37,136,50,0,0 // vbroadcastss 0x3288(%rip),%ymm12 # 5838 <_sk_callback_hsw+0x2b3> + .byte 196,98,125,24,45,131,50,0,0 // vbroadcastss 0x3283(%rip),%ymm13 # 583c <_sk_callback_hsw+0x2b7> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,209,49,0,0 // vbroadcastss 0x31d1(%rip),%ymm13 # 5798 <_sk_callback_hsw+0x2b9> + .byte 196,98,125,24,45,121,50,0,0 // vbroadcastss 0x3279(%rip),%ymm13 # 5840 <_sk_callback_hsw+0x2bb> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,199,49,0,0 // vbroadcastss 0x31c7(%rip),%ymm13 # 579c <_sk_callback_hsw+0x2bd> + .byte 196,98,125,24,45,111,50,0,0 // vbroadcastss 0x326f(%rip),%ymm13 # 5844 <_sk_callback_hsw+0x2bf> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,189,49,0,0 // vbroadcastss 0x31bd(%rip),%ymm11 # 57a0 <_sk_callback_hsw+0x2c1> + .byte 196,98,125,24,29,101,50,0,0 // vbroadcastss 0x3265(%rip),%ymm11 # 5848 <_sk_callback_hsw+0x2c3> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,179,49,0,0 // vbroadcastss 0x31b3(%rip),%ymm12 # 57a4 <_sk_callback_hsw+0x2c5> + .byte 196,98,125,24,37,91,50,0,0 // vbroadcastss 0x325b(%rip),%ymm12 # 584c <_sk_callback_hsw+0x2c7> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,169,49,0,0 // vbroadcastss 0x31a9(%rip),%ymm12 # 57a8 <_sk_callback_hsw+0x2c9> + .byte 196,98,125,24,37,81,50,0,0 // vbroadcastss 0x3251(%rip),%ymm12 # 5850 <_sk_callback_hsw+0x2cb> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 - .byte 196,98,125,24,29,138,49,0,0 // vbroadcastss 0x318a(%rip),%ymm11 # 57ac <_sk_callback_hsw+0x2cd> + .byte 196,98,125,24,29,50,50,0,0 // vbroadcastss 0x3232(%rip),%ymm11 # 5854 <_sk_callback_hsw+0x2cf> .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,128,49,0,0 // vbroadcastss 0x3180(%rip),%ymm11 # 57b0 <_sk_callback_hsw+0x2d1> + .byte 196,98,125,24,29,40,50,0,0 // vbroadcastss 0x3228(%rip),%ymm11 # 5858 <_sk_callback_hsw+0x2d3> .byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11 - .byte 196,226,125,24,5,118,49,0,0 // vbroadcastss 0x3176(%rip),%ymm0 # 57b4 <_sk_callback_hsw+0x2d5> + .byte 196,226,125,24,5,30,50,0,0 // vbroadcastss 0x321e(%rip),%ymm0 # 585c <_sk_callback_hsw+0x2d7> .byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0 - .byte 196,98,125,24,21,108,49,0,0 // vbroadcastss 0x316c(%rip),%ymm10 # 57b8 <_sk_callback_hsw+0x2d9> + .byte 196,98,125,24,21,20,50,0,0 // vbroadcastss 0x3214(%rip),%ymm10 # 5860 <_sk_callback_hsw+0x2db> .byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0 .byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0 - .byte 196,98,125,24,21,95,49,0,0 // vbroadcastss 0x315f(%rip),%ymm10 # 57bc <_sk_callback_hsw+0x2dd> + .byte 196,98,125,24,21,7,50,0,0 // vbroadcastss 0x3207(%rip),%ymm10 # 5864 <_sk_callback_hsw+0x2df> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -13324,7 +13438,7 @@ _sk_parametric_r_hsw: .byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,54,49,0,0 // vbroadcastss 0x3136(%rip),%ymm8 # 57c0 <_sk_callback_hsw+0x2e1> + .byte 196,98,125,24,5,222,49,0,0 // vbroadcastss 0x31de(%rip),%ymm8 # 5868 <_sk_callback_hsw+0x2e3> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -13344,33 +13458,33 @@ _sk_parametric_g_hsw: .byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10 .byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,238,48,0,0 // vbroadcastss 0x30ee(%rip),%ymm12 # 57c4 <_sk_callback_hsw+0x2e5> - .byte 196,98,125,24,45,233,48,0,0 // vbroadcastss 0x30e9(%rip),%ymm13 # 57c8 <_sk_callback_hsw+0x2e9> + .byte 196,98,125,24,37,150,49,0,0 // vbroadcastss 0x3196(%rip),%ymm12 # 586c <_sk_callback_hsw+0x2e7> + .byte 196,98,125,24,45,145,49,0,0 // vbroadcastss 0x3191(%rip),%ymm13 # 5870 <_sk_callback_hsw+0x2eb> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,223,48,0,0 // vbroadcastss 0x30df(%rip),%ymm13 # 57cc <_sk_callback_hsw+0x2ed> + .byte 196,98,125,24,45,135,49,0,0 // vbroadcastss 0x3187(%rip),%ymm13 # 5874 <_sk_callback_hsw+0x2ef> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,213,48,0,0 // vbroadcastss 0x30d5(%rip),%ymm13 # 57d0 <_sk_callback_hsw+0x2f1> + .byte 196,98,125,24,45,125,49,0,0 // vbroadcastss 0x317d(%rip),%ymm13 # 5878 <_sk_callback_hsw+0x2f3> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,203,48,0,0 // vbroadcastss 0x30cb(%rip),%ymm11 # 57d4 <_sk_callback_hsw+0x2f5> + .byte 196,98,125,24,29,115,49,0,0 // vbroadcastss 0x3173(%rip),%ymm11 # 587c <_sk_callback_hsw+0x2f7> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,193,48,0,0 // vbroadcastss 0x30c1(%rip),%ymm12 # 57d8 <_sk_callback_hsw+0x2f9> + .byte 196,98,125,24,37,105,49,0,0 // vbroadcastss 0x3169(%rip),%ymm12 # 5880 <_sk_callback_hsw+0x2fb> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,183,48,0,0 // vbroadcastss 0x30b7(%rip),%ymm12 # 57dc <_sk_callback_hsw+0x2fd> + .byte 196,98,125,24,37,95,49,0,0 // vbroadcastss 0x315f(%rip),%ymm12 # 5884 <_sk_callback_hsw+0x2ff> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10 .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10 - .byte 196,98,125,24,29,152,48,0,0 // vbroadcastss 0x3098(%rip),%ymm11 # 57e0 <_sk_callback_hsw+0x301> + .byte 196,98,125,24,29,64,49,0,0 // vbroadcastss 0x3140(%rip),%ymm11 # 5888 <_sk_callback_hsw+0x303> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,142,48,0,0 // vbroadcastss 0x308e(%rip),%ymm11 # 57e4 <_sk_callback_hsw+0x305> + .byte 196,98,125,24,29,54,49,0,0 // vbroadcastss 0x3136(%rip),%ymm11 # 588c <_sk_callback_hsw+0x307> .byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11 - .byte 196,226,125,24,13,132,48,0,0 // vbroadcastss 0x3084(%rip),%ymm1 # 57e8 <_sk_callback_hsw+0x309> + .byte 196,226,125,24,13,44,49,0,0 // vbroadcastss 0x312c(%rip),%ymm1 # 5890 <_sk_callback_hsw+0x30b> .byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1 - .byte 196,98,125,24,21,122,48,0,0 // vbroadcastss 0x307a(%rip),%ymm10 # 57ec <_sk_callback_hsw+0x30d> + .byte 196,98,125,24,21,34,49,0,0 // vbroadcastss 0x3122(%rip),%ymm10 # 5894 <_sk_callback_hsw+0x30f> .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1 - .byte 196,98,125,24,21,109,48,0,0 // vbroadcastss 0x306d(%rip),%ymm10 # 57f0 <_sk_callback_hsw+0x311> + .byte 196,98,125,24,21,21,49,0,0 // vbroadcastss 0x3115(%rip),%ymm10 # 5898 <_sk_callback_hsw+0x313> .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -13378,7 +13492,7 @@ _sk_parametric_g_hsw: .byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,5,68,48,0,0 // vbroadcastss 0x3044(%rip),%ymm8 # 57f4 <_sk_callback_hsw+0x315> + .byte 196,98,125,24,5,236,48,0,0 // vbroadcastss 0x30ec(%rip),%ymm8 # 589c <_sk_callback_hsw+0x317> .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -13398,33 +13512,33 @@ _sk_parametric_b_hsw: .byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10 .byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,252,47,0,0 // vbroadcastss 0x2ffc(%rip),%ymm12 # 57f8 <_sk_callback_hsw+0x319> - .byte 196,98,125,24,45,247,47,0,0 // vbroadcastss 0x2ff7(%rip),%ymm13 # 57fc <_sk_callback_hsw+0x31d> + .byte 196,98,125,24,37,164,48,0,0 // vbroadcastss 0x30a4(%rip),%ymm12 # 58a0 <_sk_callback_hsw+0x31b> + .byte 196,98,125,24,45,159,48,0,0 // vbroadcastss 0x309f(%rip),%ymm13 # 58a4 <_sk_callback_hsw+0x31f> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,237,47,0,0 // vbroadcastss 0x2fed(%rip),%ymm13 # 5800 <_sk_callback_hsw+0x321> + .byte 196,98,125,24,45,149,48,0,0 // vbroadcastss 0x3095(%rip),%ymm13 # 58a8 <_sk_callback_hsw+0x323> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,227,47,0,0 // vbroadcastss 0x2fe3(%rip),%ymm13 # 5804 <_sk_callback_hsw+0x325> + .byte 196,98,125,24,45,139,48,0,0 // vbroadcastss 0x308b(%rip),%ymm13 # 58ac <_sk_callback_hsw+0x327> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,217,47,0,0 // vbroadcastss 0x2fd9(%rip),%ymm11 # 5808 <_sk_callback_hsw+0x329> + .byte 196,98,125,24,29,129,48,0,0 // vbroadcastss 0x3081(%rip),%ymm11 # 58b0 <_sk_callback_hsw+0x32b> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,207,47,0,0 // vbroadcastss 0x2fcf(%rip),%ymm12 # 580c <_sk_callback_hsw+0x32d> + .byte 196,98,125,24,37,119,48,0,0 // vbroadcastss 0x3077(%rip),%ymm12 # 58b4 <_sk_callback_hsw+0x32f> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,197,47,0,0 // vbroadcastss 0x2fc5(%rip),%ymm12 # 5810 <_sk_callback_hsw+0x331> + .byte 196,98,125,24,37,109,48,0,0 // vbroadcastss 0x306d(%rip),%ymm12 # 58b8 <_sk_callback_hsw+0x333> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10 .byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10 - .byte 196,98,125,24,29,166,47,0,0 // vbroadcastss 0x2fa6(%rip),%ymm11 # 5814 <_sk_callback_hsw+0x335> + .byte 196,98,125,24,29,78,48,0,0 // vbroadcastss 0x304e(%rip),%ymm11 # 58bc <_sk_callback_hsw+0x337> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,156,47,0,0 // vbroadcastss 0x2f9c(%rip),%ymm11 # 5818 <_sk_callback_hsw+0x339> + .byte 196,98,125,24,29,68,48,0,0 // vbroadcastss 0x3044(%rip),%ymm11 # 58c0 <_sk_callback_hsw+0x33b> .byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11 - .byte 196,226,125,24,21,146,47,0,0 // vbroadcastss 0x2f92(%rip),%ymm2 # 581c <_sk_callback_hsw+0x33d> + .byte 196,226,125,24,21,58,48,0,0 // vbroadcastss 0x303a(%rip),%ymm2 # 58c4 <_sk_callback_hsw+0x33f> .byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2 - .byte 196,98,125,24,21,136,47,0,0 // vbroadcastss 0x2f88(%rip),%ymm10 # 5820 <_sk_callback_hsw+0x341> + .byte 196,98,125,24,21,48,48,0,0 // vbroadcastss 0x3030(%rip),%ymm10 # 58c8 <_sk_callback_hsw+0x343> .byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2 .byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2 - .byte 196,98,125,24,21,123,47,0,0 // vbroadcastss 0x2f7b(%rip),%ymm10 # 5824 <_sk_callback_hsw+0x345> + .byte 196,98,125,24,21,35,48,0,0 // vbroadcastss 0x3023(%rip),%ymm10 # 58cc <_sk_callback_hsw+0x347> .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -13432,7 +13546,7 @@ _sk_parametric_b_hsw: .byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,82,47,0,0 // vbroadcastss 0x2f52(%rip),%ymm8 # 5828 <_sk_callback_hsw+0x349> + .byte 196,98,125,24,5,250,47,0,0 // vbroadcastss 0x2ffa(%rip),%ymm8 # 58d0 <_sk_callback_hsw+0x34b> .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -13452,33 +13566,33 @@ _sk_parametric_a_hsw: .byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10 .byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,10,47,0,0 // vbroadcastss 0x2f0a(%rip),%ymm12 # 582c <_sk_callback_hsw+0x34d> - .byte 196,98,125,24,45,5,47,0,0 // vbroadcastss 0x2f05(%rip),%ymm13 # 5830 <_sk_callback_hsw+0x351> + .byte 196,98,125,24,37,178,47,0,0 // vbroadcastss 0x2fb2(%rip),%ymm12 # 58d4 <_sk_callback_hsw+0x34f> + .byte 196,98,125,24,45,173,47,0,0 // vbroadcastss 0x2fad(%rip),%ymm13 # 58d8 <_sk_callback_hsw+0x353> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,251,46,0,0 // vbroadcastss 0x2efb(%rip),%ymm13 # 5834 <_sk_callback_hsw+0x355> + .byte 196,98,125,24,45,163,47,0,0 // vbroadcastss 0x2fa3(%rip),%ymm13 # 58dc <_sk_callback_hsw+0x357> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,241,46,0,0 // vbroadcastss 0x2ef1(%rip),%ymm13 # 5838 <_sk_callback_hsw+0x359> + .byte 196,98,125,24,45,153,47,0,0 // vbroadcastss 0x2f99(%rip),%ymm13 # 58e0 <_sk_callback_hsw+0x35b> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,231,46,0,0 // vbroadcastss 0x2ee7(%rip),%ymm11 # 583c <_sk_callback_hsw+0x35d> + .byte 196,98,125,24,29,143,47,0,0 // vbroadcastss 0x2f8f(%rip),%ymm11 # 58e4 <_sk_callback_hsw+0x35f> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,221,46,0,0 // vbroadcastss 0x2edd(%rip),%ymm12 # 5840 <_sk_callback_hsw+0x361> + .byte 196,98,125,24,37,133,47,0,0 // vbroadcastss 0x2f85(%rip),%ymm12 # 58e8 <_sk_callback_hsw+0x363> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,211,46,0,0 // vbroadcastss 0x2ed3(%rip),%ymm12 # 5844 <_sk_callback_hsw+0x365> + .byte 196,98,125,24,37,123,47,0,0 // vbroadcastss 0x2f7b(%rip),%ymm12 # 58ec <_sk_callback_hsw+0x367> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10 .byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10 - .byte 196,98,125,24,29,180,46,0,0 // vbroadcastss 0x2eb4(%rip),%ymm11 # 5848 <_sk_callback_hsw+0x369> + .byte 196,98,125,24,29,92,47,0,0 // vbroadcastss 0x2f5c(%rip),%ymm11 # 58f0 <_sk_callback_hsw+0x36b> .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,170,46,0,0 // vbroadcastss 0x2eaa(%rip),%ymm11 # 584c <_sk_callback_hsw+0x36d> + .byte 196,98,125,24,29,82,47,0,0 // vbroadcastss 0x2f52(%rip),%ymm11 # 58f4 <_sk_callback_hsw+0x36f> .byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11 - .byte 196,226,125,24,29,160,46,0,0 // vbroadcastss 0x2ea0(%rip),%ymm3 # 5850 <_sk_callback_hsw+0x371> + .byte 196,226,125,24,29,72,47,0,0 // vbroadcastss 0x2f48(%rip),%ymm3 # 58f8 <_sk_callback_hsw+0x373> .byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3 - .byte 196,98,125,24,21,150,46,0,0 // vbroadcastss 0x2e96(%rip),%ymm10 # 5854 <_sk_callback_hsw+0x375> + .byte 196,98,125,24,21,62,47,0,0 // vbroadcastss 0x2f3e(%rip),%ymm10 # 58fc <_sk_callback_hsw+0x377> .byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3 .byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3 - .byte 196,98,125,24,21,137,46,0,0 // vbroadcastss 0x2e89(%rip),%ymm10 # 5858 <_sk_callback_hsw+0x379> + .byte 196,98,125,24,21,49,47,0,0 // vbroadcastss 0x2f31(%rip),%ymm10 # 5900 <_sk_callback_hsw+0x37b> .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -13486,7 +13600,7 @@ _sk_parametric_a_hsw: .byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3 - .byte 196,98,125,24,5,96,46,0,0 // vbroadcastss 0x2e60(%rip),%ymm8 # 585c <_sk_callback_hsw+0x37d> + .byte 196,98,125,24,5,8,47,0,0 // vbroadcastss 0x2f08(%rip),%ymm8 # 5904 <_sk_callback_hsw+0x37f> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -13495,26 +13609,26 @@ HIDDEN _sk_lab_to_xyz_hsw .globl _sk_lab_to_xyz_hsw FUNCTION(_sk_lab_to_xyz_hsw) _sk_lab_to_xyz_hsw: - .byte 196,98,125,24,5,82,46,0,0 // vbroadcastss 0x2e52(%rip),%ymm8 # 5860 <_sk_callback_hsw+0x381> - .byte 196,98,125,24,13,77,46,0,0 // vbroadcastss 0x2e4d(%rip),%ymm9 # 5864 <_sk_callback_hsw+0x385> - .byte 196,98,125,24,21,72,46,0,0 // vbroadcastss 0x2e48(%rip),%ymm10 # 5868 <_sk_callback_hsw+0x389> + .byte 196,98,125,24,5,250,46,0,0 // vbroadcastss 0x2efa(%rip),%ymm8 # 5908 <_sk_callback_hsw+0x383> + .byte 196,98,125,24,13,245,46,0,0 // vbroadcastss 0x2ef5(%rip),%ymm9 # 590c <_sk_callback_hsw+0x387> + .byte 196,98,125,24,21,240,46,0,0 // vbroadcastss 0x2ef0(%rip),%ymm10 # 5910 <_sk_callback_hsw+0x38b> .byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1 .byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2 - .byte 196,98,125,24,13,57,46,0,0 // vbroadcastss 0x2e39(%rip),%ymm9 # 586c <_sk_callback_hsw+0x38d> + .byte 196,98,125,24,13,225,46,0,0 // vbroadcastss 0x2ee1(%rip),%ymm9 # 5914 <_sk_callback_hsw+0x38f> .byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9 - .byte 196,226,125,24,5,47,46,0,0 // vbroadcastss 0x2e2f(%rip),%ymm0 # 5870 <_sk_callback_hsw+0x391> + .byte 196,226,125,24,5,215,46,0,0 // vbroadcastss 0x2ed7(%rip),%ymm0 # 5918 <_sk_callback_hsw+0x393> .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 - .byte 196,98,125,24,5,38,46,0,0 // vbroadcastss 0x2e26(%rip),%ymm8 # 5874 <_sk_callback_hsw+0x395> + .byte 196,98,125,24,5,206,46,0,0 // vbroadcastss 0x2ece(%rip),%ymm8 # 591c <_sk_callback_hsw+0x397> .byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8 - .byte 196,98,125,24,13,28,46,0,0 // vbroadcastss 0x2e1c(%rip),%ymm9 # 5878 <_sk_callback_hsw+0x399> + .byte 196,98,125,24,13,196,46,0,0 // vbroadcastss 0x2ec4(%rip),%ymm9 # 5920 <_sk_callback_hsw+0x39b> .byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9 .byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 - .byte 196,226,125,24,21,9,46,0,0 // vbroadcastss 0x2e09(%rip),%ymm2 # 587c <_sk_callback_hsw+0x39d> + .byte 196,226,125,24,21,177,46,0,0 // vbroadcastss 0x2eb1(%rip),%ymm2 # 5924 <_sk_callback_hsw+0x39f> .byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10 - .byte 196,98,125,24,29,255,45,0,0 // vbroadcastss 0x2dff(%rip),%ymm11 # 5880 <_sk_callback_hsw+0x3a1> + .byte 196,98,125,24,29,167,46,0,0 // vbroadcastss 0x2ea7(%rip),%ymm11 # 5928 <_sk_callback_hsw+0x3a3> .byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8 - .byte 196,98,125,24,37,245,45,0,0 // vbroadcastss 0x2df5(%rip),%ymm12 # 5884 <_sk_callback_hsw+0x3a5> + .byte 196,98,125,24,37,157,46,0,0 // vbroadcastss 0x2e9d(%rip),%ymm12 # 592c <_sk_callback_hsw+0x3a7> .byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8 .byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8 .byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1 @@ -13529,9 +13643,9 @@ _sk_lab_to_xyz_hsw: .byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9 .byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9 .byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2 - .byte 196,226,125,24,5,170,45,0,0 // vbroadcastss 0x2daa(%rip),%ymm0 # 5888 <_sk_callback_hsw+0x3a9> + .byte 196,226,125,24,5,82,46,0,0 // vbroadcastss 0x2e52(%rip),%ymm0 # 5930 <_sk_callback_hsw+0x3ab> .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,161,45,0,0 // vbroadcastss 0x2da1(%rip),%ymm8 # 588c <_sk_callback_hsw+0x3ad> + .byte 196,98,125,24,5,73,46,0,0 // vbroadcastss 0x2e49(%rip),%ymm8 # 5934 <_sk_callback_hsw+0x3af> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -13545,10 +13659,10 @@ _sk_load_a8_hsw: .byte 77,133,192 // test %r8,%r8 .byte 117,52 // jne 2b32 <_sk_load_a8_hsw+0x3e> .byte 196,194,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm0 - .byte 197,249,219,5,84,51,0,0 // vpand 0x3354(%rip),%xmm0,%xmm0 # 5e60 <_sk_callback_hsw+0x981> + .byte 197,249,219,5,20,52,0,0 // vpand 0x3414(%rip),%xmm0,%xmm0 # 5f20 <_sk_callback_hsw+0x99b> .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,114,45,0,0 // vbroadcastss 0x2d72(%rip),%ymm1 # 5890 <_sk_callback_hsw+0x3b1> + .byte 196,226,125,24,13,26,46,0,0 // vbroadcastss 0x2e1a(%rip),%ymm1 # 5938 <_sk_callback_hsw+0x3b3> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -13617,10 +13731,10 @@ _sk_load_a8_dst_hsw: .byte 77,133,192 // test %r8,%r8 .byte 117,52 // jne 2c22 <_sk_load_a8_dst_hsw+0x3e> .byte 196,194,121,48,36,19 // vpmovzxbw (%r11,%rdx,1),%xmm4 - .byte 197,217,219,37,116,50,0,0 // vpand 0x3274(%rip),%xmm4,%xmm4 # 5e70 <_sk_callback_hsw+0x991> + .byte 197,217,219,37,52,51,0,0 // vpand 0x3334(%rip),%xmm4,%xmm4 # 5f30 <_sk_callback_hsw+0x9ab> .byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,134,44,0,0 // vbroadcastss 0x2c86(%rip),%ymm5 # 5894 <_sk_callback_hsw+0x3b5> + .byte 196,226,125,24,45,46,45,0,0 // vbroadcastss 0x2d2e(%rip),%ymm5 # 593c <_sk_callback_hsw+0x3b7> .byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 @@ -13720,7 +13834,7 @@ _sk_gather_a8_hsw: .byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,14,43,0,0 // vbroadcastss 0x2b0e(%rip),%ymm1 # 5898 <_sk_callback_hsw+0x3b9> + .byte 196,226,125,24,13,182,43,0,0 // vbroadcastss 0x2bb6(%rip),%ymm1 # 5940 <_sk_callback_hsw+0x3bb> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -13734,7 +13848,7 @@ FUNCTION(_sk_store_a8_hsw) _sk_store_a8_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 - .byte 196,98,125,24,5,240,42,0,0 // vbroadcastss 0x2af0(%rip),%ymm8 # 589c <_sk_callback_hsw+0x3bd> + .byte 196,98,125,24,5,152,43,0,0 // vbroadcastss 0x2b98(%rip),%ymm8 # 5944 <_sk_callback_hsw+0x3bf> .byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8 .byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8 .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 @@ -13759,13 +13873,13 @@ _sk_store_a8_hsw: .byte 196,67,121,20,4,19,0 // vpextrb $0x0,%xmm8,(%r11,%rdx,1) .byte 235,202 // jmp 2dd1 <_sk_store_a8_hsw+0x33> .byte 196,67,121,20,68,19,2,4 // vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1) - .byte 196,98,57,0,5,104,48,0,0 // vpshufb 0x3068(%rip),%xmm8,%xmm8 # 5e80 <_sk_callback_hsw+0x9a1> + .byte 196,98,57,0,5,40,49,0,0 // vpshufb 0x3128(%rip),%xmm8,%xmm8 # 5f40 <_sk_callback_hsw+0x9bb> .byte 196,67,121,21,4,19,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,1) .byte 235,176 // jmp 2dd1 <_sk_store_a8_hsw+0x33> .byte 196,67,121,20,68,19,6,12 // vpextrb $0xc,%xmm8,0x6(%r11,%rdx,1) .byte 196,67,121,20,68,19,5,10 // vpextrb $0xa,%xmm8,0x5(%r11,%rdx,1) .byte 196,67,121,20,68,19,4,8 // vpextrb $0x8,%xmm8,0x4(%r11,%rdx,1) - .byte 196,98,57,0,5,78,48,0,0 // vpshufb 0x304e(%rip),%xmm8,%xmm8 # 5e90 <_sk_callback_hsw+0x9b1> + .byte 196,98,57,0,5,14,49,0,0 // vpshufb 0x310e(%rip),%xmm8,%xmm8 # 5f50 <_sk_callback_hsw+0x9cb> .byte 196,65,121,126,4,19 // vmovd %xmm8,(%r11,%rdx,1) .byte 235,135 // jmp 2dd1 <_sk_store_a8_hsw+0x33> .byte 102,144 // xchg %ax,%ax @@ -13798,13 +13912,13 @@ _sk_load_g8_hsw: .byte 77,133,192 // test %r8,%r8 .byte 117,57 // jne 2eab <_sk_load_g8_hsw+0x43> .byte 196,194,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm0 - .byte 197,249,219,5,32,48,0,0 // vpand 0x3020(%rip),%xmm0,%xmm0 # 5ea0 <_sk_callback_hsw+0x9c1> + .byte 197,249,219,5,224,48,0,0 // vpand 0x30e0(%rip),%xmm0,%xmm0 # 5f60 <_sk_callback_hsw+0x9db> .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,14,42,0,0 // vbroadcastss 0x2a0e(%rip),%ymm1 # 58a0 <_sk_callback_hsw+0x3c1> + .byte 196,226,125,24,13,182,42,0,0 // vbroadcastss 0x2ab6(%rip),%ymm1 # 5948 <_sk_callback_hsw+0x3c3> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,3,42,0,0 // vbroadcastss 0x2a03(%rip),%ymm3 # 58a4 <_sk_callback_hsw+0x3c5> + .byte 196,226,125,24,29,171,42,0,0 // vbroadcastss 0x2aab(%rip),%ymm3 # 594c <_sk_callback_hsw+0x3c7> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 255,224 // jmpq *%rax @@ -13871,13 +13985,13 @@ _sk_load_g8_dst_hsw: .byte 77,133,192 // test %r8,%r8 .byte 117,57 // jne 2fa3 <_sk_load_g8_dst_hsw+0x43> .byte 196,194,121,48,36,19 // vpmovzxbw (%r11,%rdx,1),%xmm4 - .byte 197,217,219,37,56,47,0,0 // vpand 0x2f38(%rip),%xmm4,%xmm4 # 5eb0 <_sk_callback_hsw+0x9d1> + .byte 197,217,219,37,248,47,0,0 // vpand 0x2ff8(%rip),%xmm4,%xmm4 # 5f70 <_sk_callback_hsw+0x9eb> .byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,30,41,0,0 // vbroadcastss 0x291e(%rip),%ymm5 # 58a8 <_sk_callback_hsw+0x3c9> + .byte 196,226,125,24,45,198,41,0,0 // vbroadcastss 0x29c6(%rip),%ymm5 # 5950 <_sk_callback_hsw+0x3cb> .byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,61,19,41,0,0 // vbroadcastss 0x2913(%rip),%ymm7 # 58ac <_sk_callback_hsw+0x3cd> + .byte 196,226,125,24,61,187,41,0,0 // vbroadcastss 0x29bb(%rip),%ymm7 # 5954 <_sk_callback_hsw+0x3cf> .byte 197,252,40,236 // vmovaps %ymm4,%ymm5 .byte 197,252,40,244 // vmovaps %ymm4,%ymm6 .byte 255,224 // jmpq *%rax @@ -13975,10 +14089,10 @@ _sk_gather_g8_hsw: .byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,162,39,0,0 // vbroadcastss 0x27a2(%rip),%ymm1 # 58b0 <_sk_callback_hsw+0x3d1> + .byte 196,226,125,24,13,74,40,0,0 // vbroadcastss 0x284a(%rip),%ymm1 # 5958 <_sk_callback_hsw+0x3d3> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,151,39,0,0 // vbroadcastss 0x2797(%rip),%ymm3 # 58b4 <_sk_callback_hsw+0x3d5> + .byte 196,226,125,24,29,63,40,0,0 // vbroadcastss 0x283f(%rip),%ymm3 # 595c <_sk_callback_hsw+0x3d7> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 255,224 // jmpq *%rax @@ -14026,14 +14140,14 @@ _sk_gather_i8_hsw: .byte 73,139,65,8 // mov 0x8(%r9),%rax .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,226,117,144,28,128 // vpgatherdd %ymm1,(%rax,%ymm0,4),%ymm3 - .byte 197,229,219,5,163,41,0,0 // vpand 0x29a3(%rip),%ymm3,%ymm0 # 5b80 <_sk_callback_hsw+0x6a1> + .byte 197,229,219,5,99,42,0,0 // vpand 0x2a63(%rip),%ymm3,%ymm0 # 5c40 <_sk_callback_hsw+0x6bb> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,206,38,0,0 // vbroadcastss 0x26ce(%rip),%ymm8 # 58b8 <_sk_callback_hsw+0x3d9> + .byte 196,98,125,24,5,118,39,0,0 // vbroadcastss 0x2776(%rip),%ymm8 # 5960 <_sk_callback_hsw+0x3db> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,226,101,0,13,168,41,0,0 // vpshufb 0x29a8(%rip),%ymm3,%ymm1 # 5ba0 <_sk_callback_hsw+0x6c1> + .byte 196,226,101,0,13,104,42,0,0 // vpshufb 0x2a68(%rip),%ymm3,%ymm1 # 5c60 <_sk_callback_hsw+0x6db> .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,226,101,0,21,182,41,0,0 // vpshufb 0x29b6(%rip),%ymm3,%ymm2 # 5bc0 <_sk_callback_hsw+0x6e1> + .byte 196,226,101,0,21,118,42,0,0 // vpshufb 0x2a76(%rip),%ymm3,%ymm2 # 5c80 <_sk_callback_hsw+0x6fb> .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -14053,23 +14167,23 @@ _sk_load_565_hsw: .byte 117,114 // jne 32a2 <_sk_load_565_hsw+0x7c> .byte 196,193,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm0 .byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2 - .byte 196,226,125,88,5,120,38,0,0 // vpbroadcastd 0x2678(%rip),%ymm0 # 58bc <_sk_callback_hsw+0x3dd> + .byte 196,226,125,88,5,32,39,0,0 // vpbroadcastd 0x2720(%rip),%ymm0 # 5964 <_sk_callback_hsw+0x3df> .byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,107,38,0,0 // vbroadcastss 0x266b(%rip),%ymm1 # 58c0 <_sk_callback_hsw+0x3e1> + .byte 196,226,125,24,13,19,39,0,0 // vbroadcastss 0x2713(%rip),%ymm1 # 5968 <_sk_callback_hsw+0x3e3> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,98,38,0,0 // vpbroadcastd 0x2662(%rip),%ymm1 # 58c4 <_sk_callback_hsw+0x3e5> + .byte 196,226,125,88,13,10,39,0,0 // vpbroadcastd 0x270a(%rip),%ymm1 # 596c <_sk_callback_hsw+0x3e7> .byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,85,38,0,0 // vbroadcastss 0x2655(%rip),%ymm3 # 58c8 <_sk_callback_hsw+0x3e9> + .byte 196,226,125,24,29,253,38,0,0 // vbroadcastss 0x26fd(%rip),%ymm3 # 5970 <_sk_callback_hsw+0x3eb> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,88,29,76,38,0,0 // vpbroadcastd 0x264c(%rip),%ymm3 # 58cc <_sk_callback_hsw+0x3ed> + .byte 196,226,125,88,29,244,38,0,0 // vpbroadcastd 0x26f4(%rip),%ymm3 # 5974 <_sk_callback_hsw+0x3ef> .byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,63,38,0,0 // vbroadcastss 0x263f(%rip),%ymm3 # 58d0 <_sk_callback_hsw+0x3f1> + .byte 196,226,125,24,29,231,38,0,0 // vbroadcastss 0x26e7(%rip),%ymm3 # 5978 <_sk_callback_hsw+0x3f3> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,52,38,0,0 // vbroadcastss 0x2634(%rip),%ymm3 # 58d4 <_sk_callback_hsw+0x3f5> + .byte 196,226,125,24,29,220,38,0,0 // vbroadcastss 0x26dc(%rip),%ymm3 # 597c <_sk_callback_hsw+0x3f7> .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,7 // and $0x7,%r9b @@ -14127,23 +14241,23 @@ _sk_load_565_dst_hsw: .byte 117,114 // jne 33bc <_sk_load_565_dst_hsw+0x7c> .byte 196,193,122,111,36,83 // vmovdqu (%r11,%rdx,2),%xmm4 .byte 196,226,125,51,244 // vpmovzxwd %xmm4,%ymm6 - .byte 196,226,125,88,37,122,37,0,0 // vpbroadcastd 0x257a(%rip),%ymm4 # 58d8 <_sk_callback_hsw+0x3f9> + .byte 196,226,125,88,37,34,38,0,0 // vpbroadcastd 0x2622(%rip),%ymm4 # 5980 <_sk_callback_hsw+0x3fb> .byte 197,205,219,228 // vpand %ymm4,%ymm6,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,109,37,0,0 // vbroadcastss 0x256d(%rip),%ymm5 # 58dc <_sk_callback_hsw+0x3fd> + .byte 196,226,125,24,45,21,38,0,0 // vbroadcastss 0x2615(%rip),%ymm5 # 5984 <_sk_callback_hsw+0x3ff> .byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4 - .byte 196,226,125,88,45,100,37,0,0 // vpbroadcastd 0x2564(%rip),%ymm5 # 58e0 <_sk_callback_hsw+0x401> + .byte 196,226,125,88,45,12,38,0,0 // vpbroadcastd 0x260c(%rip),%ymm5 # 5988 <_sk_callback_hsw+0x403> .byte 197,205,219,237 // vpand %ymm5,%ymm6,%ymm5 .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 - .byte 196,226,125,24,61,87,37,0,0 // vbroadcastss 0x2557(%rip),%ymm7 # 58e4 <_sk_callback_hsw+0x405> + .byte 196,226,125,24,61,255,37,0,0 // vbroadcastss 0x25ff(%rip),%ymm7 # 598c <_sk_callback_hsw+0x407> .byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5 - .byte 196,226,125,88,61,78,37,0,0 // vpbroadcastd 0x254e(%rip),%ymm7 # 58e8 <_sk_callback_hsw+0x409> + .byte 196,226,125,88,61,246,37,0,0 // vpbroadcastd 0x25f6(%rip),%ymm7 # 5990 <_sk_callback_hsw+0x40b> .byte 197,205,219,247 // vpand %ymm7,%ymm6,%ymm6 .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 - .byte 196,226,125,24,61,65,37,0,0 // vbroadcastss 0x2541(%rip),%ymm7 # 58ec <_sk_callback_hsw+0x40d> + .byte 196,226,125,24,61,233,37,0,0 // vbroadcastss 0x25e9(%rip),%ymm7 # 5994 <_sk_callback_hsw+0x40f> .byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,61,54,37,0,0 // vbroadcastss 0x2536(%rip),%ymm7 # 58f0 <_sk_callback_hsw+0x411> + .byte 196,226,125,24,61,222,37,0,0 // vbroadcastss 0x25de(%rip),%ymm7 # 5998 <_sk_callback_hsw+0x413> .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,7 // and $0x7,%r9b @@ -14231,23 +14345,23 @@ _sk_gather_565_hsw: .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2 - .byte 196,226,125,88,5,235,35,0,0 // vpbroadcastd 0x23eb(%rip),%ymm0 # 58f4 <_sk_callback_hsw+0x415> + .byte 196,226,125,88,5,147,36,0,0 // vpbroadcastd 0x2493(%rip),%ymm0 # 599c <_sk_callback_hsw+0x417> .byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,222,35,0,0 // vbroadcastss 0x23de(%rip),%ymm1 # 58f8 <_sk_callback_hsw+0x419> + .byte 196,226,125,24,13,134,36,0,0 // vbroadcastss 0x2486(%rip),%ymm1 # 59a0 <_sk_callback_hsw+0x41b> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,213,35,0,0 // vpbroadcastd 0x23d5(%rip),%ymm1 # 58fc <_sk_callback_hsw+0x41d> + .byte 196,226,125,88,13,125,36,0,0 // vpbroadcastd 0x247d(%rip),%ymm1 # 59a4 <_sk_callback_hsw+0x41f> .byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,200,35,0,0 // vbroadcastss 0x23c8(%rip),%ymm3 # 5900 <_sk_callback_hsw+0x421> + .byte 196,226,125,24,29,112,36,0,0 // vbroadcastss 0x2470(%rip),%ymm3 # 59a8 <_sk_callback_hsw+0x423> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,88,29,191,35,0,0 // vpbroadcastd 0x23bf(%rip),%ymm3 # 5904 <_sk_callback_hsw+0x425> + .byte 196,226,125,88,29,103,36,0,0 // vpbroadcastd 0x2467(%rip),%ymm3 # 59ac <_sk_callback_hsw+0x427> .byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,178,35,0,0 // vbroadcastss 0x23b2(%rip),%ymm3 # 5908 <_sk_callback_hsw+0x429> + .byte 196,226,125,24,29,90,36,0,0 // vbroadcastss 0x245a(%rip),%ymm3 # 59b0 <_sk_callback_hsw+0x42b> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,167,35,0,0 // vbroadcastss 0x23a7(%rip),%ymm3 # 590c <_sk_callback_hsw+0x42d> + .byte 196,226,125,24,29,79,36,0,0 // vbroadcastss 0x244f(%rip),%ymm3 # 59b4 <_sk_callback_hsw+0x42f> .byte 255,224 // jmpq *%rax HIDDEN _sk_store_565_hsw @@ -14256,11 +14370,11 @@ FUNCTION(_sk_store_565_hsw) _sk_store_565_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 - .byte 196,98,125,24,5,155,35,0,0 // vbroadcastss 0x239b(%rip),%ymm8 # 5910 <_sk_callback_hsw+0x431> + .byte 196,98,125,24,5,67,36,0,0 // vbroadcastss 0x2443(%rip),%ymm8 # 59b8 <_sk_callback_hsw+0x433> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9 - .byte 196,98,125,24,21,134,35,0,0 // vbroadcastss 0x2386(%rip),%ymm10 # 5914 <_sk_callback_hsw+0x435> + .byte 196,98,125,24,21,46,36,0,0 // vbroadcastss 0x242e(%rip),%ymm10 # 59bc <_sk_callback_hsw+0x437> .byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10 .byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10 .byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10 @@ -14330,25 +14444,25 @@ _sk_load_4444_hsw: .byte 15,133,138,0,0,0 // jne 36e0 <_sk_load_4444_hsw+0x98> .byte 196,193,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm0 .byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3 - .byte 196,226,125,88,5,174,34,0,0 // vpbroadcastd 0x22ae(%rip),%ymm0 # 5918 <_sk_callback_hsw+0x439> + .byte 196,226,125,88,5,86,35,0,0 // vpbroadcastd 0x2356(%rip),%ymm0 # 59c0 <_sk_callback_hsw+0x43b> .byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,161,34,0,0 // vbroadcastss 0x22a1(%rip),%ymm1 # 591c <_sk_callback_hsw+0x43d> + .byte 196,226,125,24,13,73,35,0,0 // vbroadcastss 0x2349(%rip),%ymm1 # 59c4 <_sk_callback_hsw+0x43f> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,152,34,0,0 // vpbroadcastd 0x2298(%rip),%ymm1 # 5920 <_sk_callback_hsw+0x441> + .byte 196,226,125,88,13,64,35,0,0 // vpbroadcastd 0x2340(%rip),%ymm1 # 59c8 <_sk_callback_hsw+0x443> .byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,139,34,0,0 // vbroadcastss 0x228b(%rip),%ymm2 # 5924 <_sk_callback_hsw+0x445> + .byte 196,226,125,24,21,51,35,0,0 // vbroadcastss 0x2333(%rip),%ymm2 # 59cc <_sk_callback_hsw+0x447> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,88,21,130,34,0,0 // vpbroadcastd 0x2282(%rip),%ymm2 # 5928 <_sk_callback_hsw+0x449> + .byte 196,226,125,88,21,42,35,0,0 // vpbroadcastd 0x232a(%rip),%ymm2 # 59d0 <_sk_callback_hsw+0x44b> .byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,117,34,0,0 // vbroadcastss 0x2275(%rip),%ymm8 # 592c <_sk_callback_hsw+0x44d> + .byte 196,98,125,24,5,29,35,0,0 // vbroadcastss 0x231d(%rip),%ymm8 # 59d4 <_sk_callback_hsw+0x44f> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,88,5,107,34,0,0 // vpbroadcastd 0x226b(%rip),%ymm8 # 5930 <_sk_callback_hsw+0x451> + .byte 196,98,125,88,5,19,35,0,0 // vpbroadcastd 0x2313(%rip),%ymm8 # 59d8 <_sk_callback_hsw+0x453> .byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,93,34,0,0 // vbroadcastss 0x225d(%rip),%ymm8 # 5934 <_sk_callback_hsw+0x455> + .byte 196,98,125,24,5,5,35,0,0 // vbroadcastss 0x2305(%rip),%ymm8 # 59dc <_sk_callback_hsw+0x457> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -14407,25 +14521,25 @@ _sk_load_4444_dst_hsw: .byte 15,133,138,0,0,0 // jne 3818 <_sk_load_4444_dst_hsw+0x98> .byte 196,193,122,111,36,83 // vmovdqu (%r11,%rdx,2),%xmm4 .byte 196,226,125,51,252 // vpmovzxwd %xmm4,%ymm7 - .byte 196,226,125,88,37,150,33,0,0 // vpbroadcastd 0x2196(%rip),%ymm4 # 5938 <_sk_callback_hsw+0x459> + .byte 196,226,125,88,37,62,34,0,0 // vpbroadcastd 0x223e(%rip),%ymm4 # 59e0 <_sk_callback_hsw+0x45b> .byte 197,197,219,228 // vpand %ymm4,%ymm7,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,137,33,0,0 // vbroadcastss 0x2189(%rip),%ymm5 # 593c <_sk_callback_hsw+0x45d> + .byte 196,226,125,24,45,49,34,0,0 // vbroadcastss 0x2231(%rip),%ymm5 # 59e4 <_sk_callback_hsw+0x45f> .byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4 - .byte 196,226,125,88,45,128,33,0,0 // vpbroadcastd 0x2180(%rip),%ymm5 # 5940 <_sk_callback_hsw+0x461> + .byte 196,226,125,88,45,40,34,0,0 // vpbroadcastd 0x2228(%rip),%ymm5 # 59e8 <_sk_callback_hsw+0x463> .byte 197,197,219,237 // vpand %ymm5,%ymm7,%ymm5 .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 - .byte 196,226,125,24,53,115,33,0,0 // vbroadcastss 0x2173(%rip),%ymm6 # 5944 <_sk_callback_hsw+0x465> + .byte 196,226,125,24,53,27,34,0,0 // vbroadcastss 0x221b(%rip),%ymm6 # 59ec <_sk_callback_hsw+0x467> .byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5 - .byte 196,226,125,88,53,106,33,0,0 // vpbroadcastd 0x216a(%rip),%ymm6 # 5948 <_sk_callback_hsw+0x469> + .byte 196,226,125,88,53,18,34,0,0 // vpbroadcastd 0x2212(%rip),%ymm6 # 59f0 <_sk_callback_hsw+0x46b> .byte 197,197,219,246 // vpand %ymm6,%ymm7,%ymm6 .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 - .byte 196,98,125,24,5,93,33,0,0 // vbroadcastss 0x215d(%rip),%ymm8 # 594c <_sk_callback_hsw+0x46d> + .byte 196,98,125,24,5,5,34,0,0 // vbroadcastss 0x2205(%rip),%ymm8 # 59f4 <_sk_callback_hsw+0x46f> .byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6 - .byte 196,98,125,88,5,83,33,0,0 // vpbroadcastd 0x2153(%rip),%ymm8 # 5950 <_sk_callback_hsw+0x471> + .byte 196,98,125,88,5,251,33,0,0 // vpbroadcastd 0x21fb(%rip),%ymm8 # 59f8 <_sk_callback_hsw+0x473> .byte 196,193,69,219,248 // vpand %ymm8,%ymm7,%ymm7 .byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7 - .byte 196,98,125,24,5,69,33,0,0 // vbroadcastss 0x2145(%rip),%ymm8 # 5954 <_sk_callback_hsw+0x475> + .byte 196,98,125,24,5,237,33,0,0 // vbroadcastss 0x21ed(%rip),%ymm8 # 59fc <_sk_callback_hsw+0x477> .byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -14515,25 +14629,25 @@ _sk_gather_4444_hsw: .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3 - .byte 196,226,125,88,5,239,31,0,0 // vpbroadcastd 0x1fef(%rip),%ymm0 # 5958 <_sk_callback_hsw+0x479> + .byte 196,226,125,88,5,151,32,0,0 // vpbroadcastd 0x2097(%rip),%ymm0 # 5a00 <_sk_callback_hsw+0x47b> .byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,226,31,0,0 // vbroadcastss 0x1fe2(%rip),%ymm1 # 595c <_sk_callback_hsw+0x47d> + .byte 196,226,125,24,13,138,32,0,0 // vbroadcastss 0x208a(%rip),%ymm1 # 5a04 <_sk_callback_hsw+0x47f> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,217,31,0,0 // vpbroadcastd 0x1fd9(%rip),%ymm1 # 5960 <_sk_callback_hsw+0x481> + .byte 196,226,125,88,13,129,32,0,0 // vpbroadcastd 0x2081(%rip),%ymm1 # 5a08 <_sk_callback_hsw+0x483> .byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,204,31,0,0 // vbroadcastss 0x1fcc(%rip),%ymm2 # 5964 <_sk_callback_hsw+0x485> + .byte 196,226,125,24,21,116,32,0,0 // vbroadcastss 0x2074(%rip),%ymm2 # 5a0c <_sk_callback_hsw+0x487> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,88,21,195,31,0,0 // vpbroadcastd 0x1fc3(%rip),%ymm2 # 5968 <_sk_callback_hsw+0x489> + .byte 196,226,125,88,21,107,32,0,0 // vpbroadcastd 0x206b(%rip),%ymm2 # 5a10 <_sk_callback_hsw+0x48b> .byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,182,31,0,0 // vbroadcastss 0x1fb6(%rip),%ymm8 # 596c <_sk_callback_hsw+0x48d> + .byte 196,98,125,24,5,94,32,0,0 // vbroadcastss 0x205e(%rip),%ymm8 # 5a14 <_sk_callback_hsw+0x48f> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,88,5,172,31,0,0 // vpbroadcastd 0x1fac(%rip),%ymm8 # 5970 <_sk_callback_hsw+0x491> + .byte 196,98,125,88,5,84,32,0,0 // vpbroadcastd 0x2054(%rip),%ymm8 # 5a18 <_sk_callback_hsw+0x493> .byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,158,31,0,0 // vbroadcastss 0x1f9e(%rip),%ymm8 # 5974 <_sk_callback_hsw+0x495> + .byte 196,98,125,24,5,70,32,0,0 // vbroadcastss 0x2046(%rip),%ymm8 # 5a1c <_sk_callback_hsw+0x497> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -14544,7 +14658,7 @@ FUNCTION(_sk_store_4444_hsw) _sk_store_4444_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 - .byte 196,98,125,24,5,139,31,0,0 // vbroadcastss 0x1f8b(%rip),%ymm8 # 5978 <_sk_callback_hsw+0x499> + .byte 196,98,125,24,5,51,32,0,0 // vbroadcastss 0x2033(%rip),%ymm8 # 5a20 <_sk_callback_hsw+0x49b> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9 @@ -14622,14 +14736,14 @@ _sk_load_8888_hsw: .byte 77,133,192 // test %r8,%r8 .byte 117,88 // jne 3b39 <_sk_load_8888_hsw+0x6d> .byte 196,193,124,16,26 // vmovups (%r10),%ymm3 - .byte 197,228,84,5,242,32,0,0 // vandps 0x20f2(%rip),%ymm3,%ymm0 # 5be0 <_sk_callback_hsw+0x701> + .byte 197,228,84,5,178,33,0,0 // vandps 0x21b2(%rip),%ymm3,%ymm0 # 5ca0 <_sk_callback_hsw+0x71b> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,129,30,0,0 // vbroadcastss 0x1e81(%rip),%ymm8 # 597c <_sk_callback_hsw+0x49d> + .byte 196,98,125,24,5,41,31,0,0 // vbroadcastss 0x1f29(%rip),%ymm8 # 5a24 <_sk_callback_hsw+0x49f> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,226,101,0,13,247,32,0,0 // vpshufb 0x20f7(%rip),%ymm3,%ymm1 # 5c00 <_sk_callback_hsw+0x721> + .byte 196,226,101,0,13,183,33,0,0 // vpshufb 0x21b7(%rip),%ymm3,%ymm1 # 5cc0 <_sk_callback_hsw+0x73b> .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,226,101,0,21,5,33,0,0 // vpshufb 0x2105(%rip),%ymm3,%ymm2 # 5c20 <_sk_callback_hsw+0x741> + .byte 196,226,101,0,21,197,33,0,0 // vpshufb 0x21c5(%rip),%ymm3,%ymm2 # 5ce0 <_sk_callback_hsw+0x75b> .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -14659,14 +14773,14 @@ _sk_load_8888_dst_hsw: .byte 77,133,192 // test %r8,%r8 .byte 117,88 // jne 3bcc <_sk_load_8888_dst_hsw+0x6d> .byte 196,193,124,16,58 // vmovups (%r10),%ymm7 - .byte 197,196,84,37,191,32,0,0 // vandps 0x20bf(%rip),%ymm7,%ymm4 # 5c40 <_sk_callback_hsw+0x761> + .byte 197,196,84,37,127,33,0,0 // vandps 0x217f(%rip),%ymm7,%ymm4 # 5d00 <_sk_callback_hsw+0x77b> .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,98,125,24,5,242,29,0,0 // vbroadcastss 0x1df2(%rip),%ymm8 # 5980 <_sk_callback_hsw+0x4a1> + .byte 196,98,125,24,5,154,30,0,0 // vbroadcastss 0x1e9a(%rip),%ymm8 # 5a28 <_sk_callback_hsw+0x4a3> .byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4 - .byte 196,226,69,0,45,196,32,0,0 // vpshufb 0x20c4(%rip),%ymm7,%ymm5 # 5c60 <_sk_callback_hsw+0x781> + .byte 196,226,69,0,45,132,33,0,0 // vpshufb 0x2184(%rip),%ymm7,%ymm5 # 5d20 <_sk_callback_hsw+0x79b> .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 .byte 196,193,84,89,232 // vmulps %ymm8,%ymm5,%ymm5 - .byte 196,226,69,0,53,210,32,0,0 // vpshufb 0x20d2(%rip),%ymm7,%ymm6 # 5c80 <_sk_callback_hsw+0x7a1> + .byte 196,226,69,0,53,146,33,0,0 // vpshufb 0x2192(%rip),%ymm7,%ymm6 # 5d40 <_sk_callback_hsw+0x7bb> .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 .byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6 .byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7 @@ -14698,14 +14812,14 @@ _sk_gather_8888_hsw: .byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3 - .byte 197,229,219,5,128,32,0,0 // vpand 0x2080(%rip),%ymm3,%ymm0 # 5ca0 <_sk_callback_hsw+0x7c1> + .byte 197,229,219,5,64,33,0,0 // vpand 0x2140(%rip),%ymm3,%ymm0 # 5d60 <_sk_callback_hsw+0x7db> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,87,29,0,0 // vbroadcastss 0x1d57(%rip),%ymm8 # 5984 <_sk_callback_hsw+0x4a5> + .byte 196,98,125,24,5,255,29,0,0 // vbroadcastss 0x1dff(%rip),%ymm8 # 5a2c <_sk_callback_hsw+0x4a7> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,226,101,0,13,133,32,0,0 // vpshufb 0x2085(%rip),%ymm3,%ymm1 # 5cc0 <_sk_callback_hsw+0x7e1> + .byte 196,226,101,0,13,69,33,0,0 // vpshufb 0x2145(%rip),%ymm3,%ymm1 # 5d80 <_sk_callback_hsw+0x7fb> .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,226,101,0,21,147,32,0,0 // vpshufb 0x2093(%rip),%ymm3,%ymm2 # 5ce0 <_sk_callback_hsw+0x801> + .byte 196,226,101,0,21,83,33,0,0 // vpshufb 0x2153(%rip),%ymm3,%ymm2 # 5da0 <_sk_callback_hsw+0x81b> .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -14722,7 +14836,7 @@ _sk_store_8888_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 76,3,16 // add (%rax),%r10 - .byte 196,98,125,24,5,7,29,0,0 // vbroadcastss 0x1d07(%rip),%ymm8 # 5988 <_sk_callback_hsw+0x4a9> + .byte 196,98,125,24,5,175,29,0,0 // vbroadcastss 0x1daf(%rip),%ymm8 # 5a30 <_sk_callback_hsw+0x4ab> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10 @@ -14764,14 +14878,14 @@ _sk_load_bgra_hsw: .byte 77,133,192 // test %r8,%r8 .byte 117,88 // jne 3d6e <_sk_load_bgra_hsw+0x6d> .byte 196,193,124,16,26 // vmovups (%r10),%ymm3 - .byte 197,228,84,5,221,31,0,0 // vandps 0x1fdd(%rip),%ymm3,%ymm0 # 5d00 <_sk_callback_hsw+0x821> + .byte 197,228,84,5,157,32,0,0 // vandps 0x209d(%rip),%ymm3,%ymm0 # 5dc0 <_sk_callback_hsw+0x83b> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,92,28,0,0 // vbroadcastss 0x1c5c(%rip),%ymm8 # 598c <_sk_callback_hsw+0x4ad> + .byte 196,98,125,24,5,4,29,0,0 // vbroadcastss 0x1d04(%rip),%ymm8 # 5a34 <_sk_callback_hsw+0x4af> .byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2 - .byte 196,226,101,0,5,226,31,0,0 // vpshufb 0x1fe2(%rip),%ymm3,%ymm0 # 5d20 <_sk_callback_hsw+0x841> + .byte 196,226,101,0,5,162,32,0,0 // vpshufb 0x20a2(%rip),%ymm3,%ymm0 # 5de0 <_sk_callback_hsw+0x85b> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 .byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1 - .byte 196,226,101,0,5,240,31,0,0 // vpshufb 0x1ff0(%rip),%ymm3,%ymm0 # 5d40 <_sk_callback_hsw+0x861> + .byte 196,226,101,0,5,176,32,0,0 // vpshufb 0x20b0(%rip),%ymm3,%ymm0 # 5e00 <_sk_callback_hsw+0x87b> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -14801,14 +14915,14 @@ _sk_load_bgra_dst_hsw: .byte 77,133,192 // test %r8,%r8 .byte 117,88 // jne 3e01 <_sk_load_bgra_dst_hsw+0x6d> .byte 196,193,124,16,58 // vmovups (%r10),%ymm7 - .byte 197,196,84,37,170,31,0,0 // vandps 0x1faa(%rip),%ymm7,%ymm4 # 5d60 <_sk_callback_hsw+0x881> + .byte 197,196,84,37,106,32,0,0 // vandps 0x206a(%rip),%ymm7,%ymm4 # 5e20 <_sk_callback_hsw+0x89b> .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,98,125,24,5,205,27,0,0 // vbroadcastss 0x1bcd(%rip),%ymm8 # 5990 <_sk_callback_hsw+0x4b1> + .byte 196,98,125,24,5,117,28,0,0 // vbroadcastss 0x1c75(%rip),%ymm8 # 5a38 <_sk_callback_hsw+0x4b3> .byte 196,193,92,89,240 // vmulps %ymm8,%ymm4,%ymm6 - .byte 196,226,69,0,37,175,31,0,0 // vpshufb 0x1faf(%rip),%ymm7,%ymm4 # 5d80 <_sk_callback_hsw+0x8a1> + .byte 196,226,69,0,37,111,32,0,0 // vpshufb 0x206f(%rip),%ymm7,%ymm4 # 5e40 <_sk_callback_hsw+0x8bb> .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 .byte 196,193,92,89,232 // vmulps %ymm8,%ymm4,%ymm5 - .byte 196,226,69,0,37,189,31,0,0 // vpshufb 0x1fbd(%rip),%ymm7,%ymm4 # 5da0 <_sk_callback_hsw+0x8c1> + .byte 196,226,69,0,37,125,32,0,0 // vpshufb 0x207d(%rip),%ymm7,%ymm4 # 5e60 <_sk_callback_hsw+0x8db> .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 .byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4 .byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7 @@ -14840,14 +14954,14 @@ _sk_gather_bgra_hsw: .byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3 - .byte 197,229,219,5,107,31,0,0 // vpand 0x1f6b(%rip),%ymm3,%ymm0 # 5dc0 <_sk_callback_hsw+0x8e1> + .byte 197,229,219,5,43,32,0,0 // vpand 0x202b(%rip),%ymm3,%ymm0 # 5e80 <_sk_callback_hsw+0x8fb> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,50,27,0,0 // vbroadcastss 0x1b32(%rip),%ymm8 # 5994 <_sk_callback_hsw+0x4b5> + .byte 196,98,125,24,5,218,27,0,0 // vbroadcastss 0x1bda(%rip),%ymm8 # 5a3c <_sk_callback_hsw+0x4b7> .byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2 - .byte 196,226,101,0,5,112,31,0,0 // vpshufb 0x1f70(%rip),%ymm3,%ymm0 # 5de0 <_sk_callback_hsw+0x901> + .byte 196,226,101,0,5,48,32,0,0 // vpshufb 0x2030(%rip),%ymm3,%ymm0 # 5ea0 <_sk_callback_hsw+0x91b> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 .byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1 - .byte 196,226,101,0,5,126,31,0,0 // vpshufb 0x1f7e(%rip),%ymm3,%ymm0 # 5e00 <_sk_callback_hsw+0x921> + .byte 196,226,101,0,5,62,32,0,0 // vpshufb 0x203e(%rip),%ymm3,%ymm0 # 5ec0 <_sk_callback_hsw+0x93b> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -14864,7 +14978,7 @@ _sk_store_bgra_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 76,3,16 // add (%rax),%r10 - .byte 196,98,125,24,5,226,26,0,0 // vbroadcastss 0x1ae2(%rip),%ymm8 # 5998 <_sk_callback_hsw+0x4b9> + .byte 196,98,125,24,5,138,27,0,0 // vbroadcastss 0x1b8a(%rip),%ymm8 # 5a40 <_sk_callback_hsw+0x4bb> .byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10 @@ -15118,7 +15232,7 @@ _sk_load_u16_be_hsw: .byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0 .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,21,249,22,0,0 // vbroadcastss 0x16f9(%rip),%ymm10 # 599c <_sk_callback_hsw+0x4bd> + .byte 196,98,125,24,21,161,23,0,0 // vbroadcastss 0x17a1(%rip),%ymm10 # 5a44 <_sk_callback_hsw+0x4bf> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -15202,7 +15316,7 @@ _sk_load_rgb_u16_be_hsw: .byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0 .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,21,138,21,0,0 // vbroadcastss 0x158a(%rip),%ymm10 # 59a0 <_sk_callback_hsw+0x4c1> + .byte 196,98,125,24,21,50,22,0,0 // vbroadcastss 0x1632(%rip),%ymm10 # 5a48 <_sk_callback_hsw+0x4c3> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -15219,7 +15333,7 @@ _sk_load_rgb_u16_be_hsw: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,62,21,0,0 // vbroadcastss 0x153e(%rip),%ymm3 # 59a4 <_sk_callback_hsw+0x4c5> + .byte 196,226,125,24,29,230,21,0,0 // vbroadcastss 0x15e6(%rip),%ymm3 # 5a4c <_sk_callback_hsw+0x4c7> .byte 255,224 // jmpq *%rax .byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0 .byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0 @@ -15262,7 +15376,7 @@ _sk_store_u16_be_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax - .byte 196,98,125,24,5,123,20,0,0 // vbroadcastss 0x147b(%rip),%ymm8 # 59a8 <_sk_callback_hsw+0x4c9> + .byte 196,98,125,24,5,35,21,0,0 // vbroadcastss 0x1523(%rip),%ymm8 # 5a50 <_sk_callback_hsw+0x4cb> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10 @@ -15549,7 +15663,7 @@ _sk_mirror_x_hsw: .byte 196,65,124,92,218 // vsubps %ymm10,%ymm0,%ymm11 .byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0 .byte 196,98,125,24,192 // vbroadcastss %xmm0,%ymm8 - .byte 197,178,89,5,73,16,0,0 // vmulss 0x1049(%rip),%xmm9,%xmm0 # 59ac <_sk_callback_hsw+0x4cd> + .byte 197,178,89,5,241,16,0,0 // vmulss 0x10f1(%rip),%xmm9,%xmm0 # 5a54 <_sk_callback_hsw+0x4cf> .byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0 .byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0 .byte 196,227,125,8,192,1 // vroundps $0x1,%ymm0,%ymm0 @@ -15575,7 +15689,7 @@ _sk_mirror_y_hsw: .byte 196,65,116,92,218 // vsubps %ymm10,%ymm1,%ymm11 .byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1 .byte 196,98,125,24,193 // vbroadcastss %xmm1,%ymm8 - .byte 197,178,89,13,237,15,0,0 // vmulss 0xfed(%rip),%xmm9,%xmm1 # 59b0 <_sk_callback_hsw+0x4d1> + .byte 197,178,89,13,149,16,0,0 // vmulss 0x1095(%rip),%xmm9,%xmm1 # 5a58 <_sk_callback_hsw+0x4d3> .byte 196,226,125,24,201 // vbroadcastss %xmm1,%ymm1 .byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1 .byte 196,227,125,8,201,1 // vroundps $0x1,%ymm1,%ymm1 @@ -15596,7 +15710,7 @@ FUNCTION(_sk_clamp_x_1_hsw) _sk_clamp_x_1_hsw: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,166,15,0,0 // vbroadcastss 0xfa6(%rip),%ymm8 # 59b4 <_sk_callback_hsw+0x4d5> + .byte 196,98,125,24,5,78,16,0,0 // vbroadcastss 0x104e(%rip),%ymm8 # 5a5c <_sk_callback_hsw+0x4d7> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -15614,9 +15728,9 @@ HIDDEN _sk_mirror_x_1_hsw .globl _sk_mirror_x_1_hsw FUNCTION(_sk_mirror_x_1_hsw) _sk_mirror_x_1_hsw: - .byte 196,98,125,24,5,137,15,0,0 // vbroadcastss 0xf89(%rip),%ymm8 # 59b8 <_sk_callback_hsw+0x4d9> + .byte 196,98,125,24,5,49,16,0,0 // vbroadcastss 0x1031(%rip),%ymm8 # 5a60 <_sk_callback_hsw+0x4db> .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,13,127,15,0,0 // vbroadcastss 0xf7f(%rip),%ymm9 # 59bc <_sk_callback_hsw+0x4dd> + .byte 196,98,125,24,13,39,16,0,0 // vbroadcastss 0x1027(%rip),%ymm9 # 5a64 <_sk_callback_hsw+0x4df> .byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9 .byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9 .byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9 @@ -15632,11 +15746,11 @@ HIDDEN _sk_luminance_to_alpha_hsw .globl _sk_luminance_to_alpha_hsw FUNCTION(_sk_luminance_to_alpha_hsw) _sk_luminance_to_alpha_hsw: - .byte 196,226,125,24,29,79,15,0,0 // vbroadcastss 0xf4f(%rip),%ymm3 # 59c0 <_sk_callback_hsw+0x4e1> - .byte 196,98,125,24,5,74,15,0,0 // vbroadcastss 0xf4a(%rip),%ymm8 # 59c4 <_sk_callback_hsw+0x4e5> + .byte 196,226,125,24,29,247,15,0,0 // vbroadcastss 0xff7(%rip),%ymm3 # 5a68 <_sk_callback_hsw+0x4e3> + .byte 196,98,125,24,5,242,15,0,0 // vbroadcastss 0xff2(%rip),%ymm8 # 5a6c <_sk_callback_hsw+0x4e7> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 .byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1 - .byte 196,226,125,24,29,59,15,0,0 // vbroadcastss 0xf3b(%rip),%ymm3 # 59c8 <_sk_callback_hsw+0x4e9> + .byte 196,226,125,24,29,227,15,0,0 // vbroadcastss 0xfe3(%rip),%ymm3 # 5a70 <_sk_callback_hsw+0x4eb> .byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -15876,14 +15990,14 @@ HIDDEN _sk_gauss_a_to_rgba_hsw .globl _sk_gauss_a_to_rgba_hsw FUNCTION(_sk_gauss_a_to_rgba_hsw) _sk_gauss_a_to_rgba_hsw: - .byte 196,226,125,24,5,131,11,0,0 // vbroadcastss 0xb83(%rip),%ymm0 # 59cc <_sk_callback_hsw+0x4ed> - .byte 196,226,125,24,13,126,11,0,0 // vbroadcastss 0xb7e(%rip),%ymm1 # 59d0 <_sk_callback_hsw+0x4f1> + .byte 196,226,125,24,5,43,12,0,0 // vbroadcastss 0xc2b(%rip),%ymm0 # 5a74 <_sk_callback_hsw+0x4ef> + .byte 196,226,125,24,13,38,12,0,0 // vbroadcastss 0xc26(%rip),%ymm1 # 5a78 <_sk_callback_hsw+0x4f3> .byte 196,226,101,168,200 // vfmadd213ps %ymm0,%ymm3,%ymm1 - .byte 196,226,125,24,5,116,11,0,0 // vbroadcastss 0xb74(%rip),%ymm0 # 59d4 <_sk_callback_hsw+0x4f5> + .byte 196,226,125,24,5,28,12,0,0 // vbroadcastss 0xc1c(%rip),%ymm0 # 5a7c <_sk_callback_hsw+0x4f7> .byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0 - .byte 196,226,125,24,13,106,11,0,0 // vbroadcastss 0xb6a(%rip),%ymm1 # 59d8 <_sk_callback_hsw+0x4f9> + .byte 196,226,125,24,13,18,12,0,0 // vbroadcastss 0xc12(%rip),%ymm1 # 5a80 <_sk_callback_hsw+0x4fb> .byte 196,226,101,184,200 // vfmadd231ps %ymm0,%ymm3,%ymm1 - .byte 196,226,125,24,5,96,11,0,0 // vbroadcastss 0xb60(%rip),%ymm0 # 59dc <_sk_callback_hsw+0x4fd> + .byte 196,226,125,24,5,8,12,0,0 // vbroadcastss 0xc08(%rip),%ymm0 # 5a84 <_sk_callback_hsw+0x4ff> .byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 @@ -15902,7 +16016,7 @@ _sk_gradient_hsw: .byte 76,139,80,72 // mov 0x48(%rax),%r10 .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 65,187,1,0,0,0 // mov $0x1,%r11d - .byte 196,226,125,24,21,41,11,0,0 // vbroadcastss 0xb29(%rip),%ymm2 # 59e0 <_sk_callback_hsw+0x501> + .byte 196,226,125,24,21,209,11,0,0 // vbroadcastss 0xbd1(%rip),%ymm2 # 5a88 <_sk_callback_hsw+0x503> .byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9 .byte 196,130,125,24,28,154 // vbroadcastss (%r10,%r11,4),%ymm3 .byte 197,228,194,216,2 // vcmpleps %ymm0,%ymm3,%ymm3 @@ -15997,24 +16111,24 @@ _sk_xy_to_unit_angle_hsw: .byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12 .byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11 .byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12 - .byte 196,98,125,24,45,168,9,0,0 // vbroadcastss 0x9a8(%rip),%ymm13 # 59e4 <_sk_callback_hsw+0x505> - .byte 196,98,125,24,53,163,9,0,0 // vbroadcastss 0x9a3(%rip),%ymm14 # 59e8 <_sk_callback_hsw+0x509> + .byte 196,98,125,24,45,80,10,0,0 // vbroadcastss 0xa50(%rip),%ymm13 # 5a8c <_sk_callback_hsw+0x507> + .byte 196,98,125,24,53,75,10,0,0 // vbroadcastss 0xa4b(%rip),%ymm14 # 5a90 <_sk_callback_hsw+0x50b> .byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14 - .byte 196,98,125,24,45,153,9,0,0 // vbroadcastss 0x999(%rip),%ymm13 # 59ec <_sk_callback_hsw+0x50d> + .byte 196,98,125,24,45,65,10,0,0 // vbroadcastss 0xa41(%rip),%ymm13 # 5a94 <_sk_callback_hsw+0x50f> .byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13 - .byte 196,98,125,24,53,143,9,0,0 // vbroadcastss 0x98f(%rip),%ymm14 # 59f0 <_sk_callback_hsw+0x511> + .byte 196,98,125,24,53,55,10,0,0 // vbroadcastss 0xa37(%rip),%ymm14 # 5a98 <_sk_callback_hsw+0x513> .byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14 .byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11 .byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,122,9,0,0 // vbroadcastss 0x97a(%rip),%ymm10 # 59f4 <_sk_callback_hsw+0x515> + .byte 196,98,125,24,21,34,10,0,0 // vbroadcastss 0xa22(%rip),%ymm10 # 5a9c <_sk_callback_hsw+0x517> .byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10 .byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9 .byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,21,100,9,0,0 // vbroadcastss 0x964(%rip),%ymm10 # 59f8 <_sk_callback_hsw+0x519> + .byte 196,98,125,24,21,12,10,0,0 // vbroadcastss 0xa0c(%rip),%ymm10 # 5aa0 <_sk_callback_hsw+0x51b> .byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9 - .byte 196,98,125,24,21,78,9,0,0 // vbroadcastss 0x94e(%rip),%ymm10 # 59fc <_sk_callback_hsw+0x51d> + .byte 196,98,125,24,21,246,9,0,0 // vbroadcastss 0x9f6(%rip),%ymm10 # 5aa4 <_sk_callback_hsw+0x51f> .byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10 .byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0 .byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9 @@ -16032,34 +16146,34 @@ _sk_xy_to_radius_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax -HIDDEN _sk_xy_to_2pt_conical_hsw -.globl _sk_xy_to_2pt_conical_hsw -FUNCTION(_sk_xy_to_2pt_conical_hsw) -_sk_xy_to_2pt_conical_hsw: +HIDDEN _sk_xy_to_2pt_conical_quadratic_hsw +.globl _sk_xy_to_2pt_conical_quadratic_hsw +FUNCTION(_sk_xy_to_2pt_conical_quadratic_hsw) +_sk_xy_to_2pt_conical_quadratic_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,0 // vbroadcastss (%rax),%ymm8 - .byte 197,122,16,72,8 // vmovss 0x8(%rax),%xmm9 - .byte 197,50,89,80,12 // vmulss 0xc(%rax),%xmm9,%xmm10 + .byte 196,98,125,24,64,32 // vbroadcastss 0x20(%rax),%ymm8 + .byte 197,122,16,72,40 // vmovss 0x28(%rax),%xmm9 + .byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10 .byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10 .byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10 - .byte 196,98,125,24,29,3,9,0,0 // vbroadcastss 0x903(%rip),%ymm11 # 5a00 <_sk_callback_hsw+0x521> + .byte 196,98,125,24,29,170,9,0,0 // vbroadcastss 0x9aa(%rip),%ymm11 # 5aa8 <_sk_callback_hsw+0x523> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 .byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11 .byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11 .byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0 .byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0 .byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0 - .byte 196,98,125,24,13,226,8,0,0 // vbroadcastss 0x8e2(%rip),%ymm9 # 5a04 <_sk_callback_hsw+0x525> + .byte 196,98,125,24,13,137,9,0,0 // vbroadcastss 0x989(%rip),%ymm9 # 5aac <_sk_callback_hsw+0x527> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0 .byte 197,252,81,192 // vsqrtps %ymm0,%ymm0 - .byte 196,98,125,24,64,4 // vbroadcastss 0x4(%rax),%ymm8 - .byte 196,98,125,24,13,197,8,0,0 // vbroadcastss 0x8c5(%rip),%ymm9 # 5a08 <_sk_callback_hsw+0x529> + .byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8 + .byte 196,98,125,24,13,108,9,0,0 // vbroadcastss 0x96c(%rip),%ymm9 # 5ab0 <_sk_callback_hsw+0x52b> .byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 .byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10 - .byte 196,98,125,24,29,177,8,0,0 // vbroadcastss 0x8b1(%rip),%ymm11 # 5a0c <_sk_callback_hsw+0x52d> + .byte 196,98,125,24,29,88,9,0,0 // vbroadcastss 0x958(%rip),%ymm11 # 5ab4 <_sk_callback_hsw+0x52f> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 .byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 @@ -16068,12 +16182,58 @@ _sk_xy_to_2pt_conical_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax +HIDDEN _sk_xy_to_2pt_conical_linear_hsw +.globl _sk_xy_to_2pt_conical_linear_hsw +FUNCTION(_sk_xy_to_2pt_conical_linear_hsw) +_sk_xy_to_2pt_conical_linear_hsw: + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 197,122,16,64,40 // vmovss 0x28(%rax),%xmm8 + .byte 197,122,16,72,44 // vmovss 0x2c(%rax),%xmm9 + .byte 196,65,50,89,208 // vmulss %xmm8,%xmm9,%xmm10 + .byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10 + .byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10 + .byte 196,98,125,24,29,31,9,0,0 // vbroadcastss 0x91f(%rip),%ymm11 # 5ab8 <_sk_callback_hsw+0x533> + .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 + .byte 197,244,89,201 // vmulps %ymm1,%ymm1,%ymm1 + .byte 196,226,125,184,200 // vfmadd231ps %ymm0,%ymm0,%ymm1 + .byte 196,193,58,89,192 // vmulss %xmm8,%xmm8,%xmm0 + .byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0 + .byte 197,244,92,192 // vsubps %ymm0,%ymm1,%ymm0 + .byte 196,226,125,24,13,254,8,0,0 // vbroadcastss 0x8fe(%rip),%ymm1 # 5abc <_sk_callback_hsw+0x537> + .byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0 + .byte 196,193,124,94,194 // vdivps %ymm10,%ymm0,%ymm0 + .byte 196,194,125,24,201 // vbroadcastss %xmm9,%ymm1 + .byte 196,66,125,24,192 // vbroadcastss %xmm8,%ymm8 + .byte 196,98,125,184,193 // vfmadd231ps %ymm1,%ymm0,%ymm8 + .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 + .byte 197,60,194,193,1 // vcmpltps %ymm1,%ymm8,%ymm8 + .byte 196,98,125,24,13,216,8,0,0 // vbroadcastss 0x8d8(%rip),%ymm9 # 5ac0 <_sk_callback_hsw+0x53b> + .byte 196,99,53,74,193,128 // vblendvps %ymm8,%ymm1,%ymm9,%ymm8 + .byte 197,124,194,201,3 // vcmpunordps %ymm1,%ymm0,%ymm9 + .byte 196,227,61,74,201,144 // vblendvps %ymm9,%ymm1,%ymm8,%ymm1 + .byte 197,252,17,8 // vmovups %ymm1,(%rax) + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + +HIDDEN _sk_vector_scale_hsw +.globl _sk_vector_scale_hsw +FUNCTION(_sk_vector_scale_hsw) +_sk_vector_scale_hsw: + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 197,124,16,0 // vmovups (%rax),%ymm8 + .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 + .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 + .byte 197,188,89,210 // vmulps %ymm2,%ymm8,%ymm2 + .byte 197,188,89,219 // vmulps %ymm3,%ymm8,%ymm3 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + HIDDEN _sk_save_xy_hsw .globl _sk_save_xy_hsw FUNCTION(_sk_save_xy_hsw) _sk_save_xy_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,144,8,0,0 // vbroadcastss 0x890(%rip),%ymm8 # 5a10 <_sk_callback_hsw+0x531> + .byte 196,98,125,24,5,158,8,0,0 // vbroadcastss 0x89e(%rip),%ymm8 # 5ac4 <_sk_callback_hsw+0x53f> .byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9 .byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 @@ -16107,9 +16267,9 @@ HIDDEN _sk_bilinear_nx_hsw FUNCTION(_sk_bilinear_nx_hsw) _sk_bilinear_nx_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,36,8,0,0 // vbroadcastss 0x824(%rip),%ymm0 # 5a14 <_sk_callback_hsw+0x535> + .byte 196,226,125,24,5,50,8,0,0 // vbroadcastss 0x832(%rip),%ymm0 # 5ac8 <_sk_callback_hsw+0x543> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,27,8,0,0 // vbroadcastss 0x81b(%rip),%ymm8 # 5a18 <_sk_callback_hsw+0x539> + .byte 196,98,125,24,5,41,8,0,0 // vbroadcastss 0x829(%rip),%ymm8 # 5acc <_sk_callback_hsw+0x547> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -16120,7 +16280,7 @@ HIDDEN _sk_bilinear_px_hsw FUNCTION(_sk_bilinear_px_hsw) _sk_bilinear_px_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,3,8,0,0 // vbroadcastss 0x803(%rip),%ymm0 # 5a1c <_sk_callback_hsw+0x53d> + .byte 196,226,125,24,5,17,8,0,0 // vbroadcastss 0x811(%rip),%ymm0 # 5ad0 <_sk_callback_hsw+0x54b> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -16132,9 +16292,9 @@ HIDDEN _sk_bilinear_ny_hsw FUNCTION(_sk_bilinear_ny_hsw) _sk_bilinear_ny_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,231,7,0,0 // vbroadcastss 0x7e7(%rip),%ymm1 # 5a20 <_sk_callback_hsw+0x541> + .byte 196,226,125,24,13,245,7,0,0 // vbroadcastss 0x7f5(%rip),%ymm1 # 5ad4 <_sk_callback_hsw+0x54f> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,221,7,0,0 // vbroadcastss 0x7dd(%rip),%ymm8 # 5a24 <_sk_callback_hsw+0x545> + .byte 196,98,125,24,5,235,7,0,0 // vbroadcastss 0x7eb(%rip),%ymm8 # 5ad8 <_sk_callback_hsw+0x553> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -16145,7 +16305,7 @@ HIDDEN _sk_bilinear_py_hsw FUNCTION(_sk_bilinear_py_hsw) _sk_bilinear_py_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,197,7,0,0 // vbroadcastss 0x7c5(%rip),%ymm1 # 5a28 <_sk_callback_hsw+0x549> + .byte 196,226,125,24,13,211,7,0,0 // vbroadcastss 0x7d3(%rip),%ymm1 # 5adc <_sk_callback_hsw+0x557> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -16157,13 +16317,13 @@ HIDDEN _sk_bicubic_n3x_hsw FUNCTION(_sk_bicubic_n3x_hsw) _sk_bicubic_n3x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,168,7,0,0 // vbroadcastss 0x7a8(%rip),%ymm0 # 5a2c <_sk_callback_hsw+0x54d> + .byte 196,226,125,24,5,182,7,0,0 // vbroadcastss 0x7b6(%rip),%ymm0 # 5ae0 <_sk_callback_hsw+0x55b> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,159,7,0,0 // vbroadcastss 0x79f(%rip),%ymm8 # 5a30 <_sk_callback_hsw+0x551> + .byte 196,98,125,24,5,173,7,0,0 // vbroadcastss 0x7ad(%rip),%ymm8 # 5ae4 <_sk_callback_hsw+0x55f> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,144,7,0,0 // vbroadcastss 0x790(%rip),%ymm10 # 5a34 <_sk_callback_hsw+0x555> - .byte 196,98,125,24,29,139,7,0,0 // vbroadcastss 0x78b(%rip),%ymm11 # 5a38 <_sk_callback_hsw+0x559> + .byte 196,98,125,24,21,158,7,0,0 // vbroadcastss 0x79e(%rip),%ymm10 # 5ae8 <_sk_callback_hsw+0x563> + .byte 196,98,125,24,29,153,7,0,0 // vbroadcastss 0x799(%rip),%ymm11 # 5aec <_sk_callback_hsw+0x567> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -16175,16 +16335,16 @@ HIDDEN _sk_bicubic_n1x_hsw FUNCTION(_sk_bicubic_n1x_hsw) _sk_bicubic_n1x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,110,7,0,0 // vbroadcastss 0x76e(%rip),%ymm0 # 5a3c <_sk_callback_hsw+0x55d> + .byte 196,226,125,24,5,124,7,0,0 // vbroadcastss 0x77c(%rip),%ymm0 # 5af0 <_sk_callback_hsw+0x56b> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,101,7,0,0 // vbroadcastss 0x765(%rip),%ymm8 # 5a40 <_sk_callback_hsw+0x561> + .byte 196,98,125,24,5,115,7,0,0 // vbroadcastss 0x773(%rip),%ymm8 # 5af4 <_sk_callback_hsw+0x56f> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,91,7,0,0 // vbroadcastss 0x75b(%rip),%ymm9 # 5a44 <_sk_callback_hsw+0x565> - .byte 196,98,125,24,21,86,7,0,0 // vbroadcastss 0x756(%rip),%ymm10 # 5a48 <_sk_callback_hsw+0x569> + .byte 196,98,125,24,13,105,7,0,0 // vbroadcastss 0x769(%rip),%ymm9 # 5af8 <_sk_callback_hsw+0x573> + .byte 196,98,125,24,21,100,7,0,0 // vbroadcastss 0x764(%rip),%ymm10 # 5afc <_sk_callback_hsw+0x577> .byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,13,76,7,0,0 // vbroadcastss 0x74c(%rip),%ymm9 # 5a4c <_sk_callback_hsw+0x56d> + .byte 196,98,125,24,13,90,7,0,0 // vbroadcastss 0x75a(%rip),%ymm9 # 5b00 <_sk_callback_hsw+0x57b> .byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9 - .byte 196,98,125,24,21,66,7,0,0 // vbroadcastss 0x742(%rip),%ymm10 # 5a50 <_sk_callback_hsw+0x571> + .byte 196,98,125,24,21,80,7,0,0 // vbroadcastss 0x750(%rip),%ymm10 # 5b04 <_sk_callback_hsw+0x57f> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -16195,14 +16355,14 @@ HIDDEN _sk_bicubic_p1x_hsw FUNCTION(_sk_bicubic_p1x_hsw) _sk_bicubic_p1x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,42,7,0,0 // vbroadcastss 0x72a(%rip),%ymm8 # 5a54 <_sk_callback_hsw+0x575> + .byte 196,98,125,24,5,56,7,0,0 // vbroadcastss 0x738(%rip),%ymm8 # 5b08 <_sk_callback_hsw+0x583> .byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0 .byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9 - .byte 196,98,125,24,21,28,7,0,0 // vbroadcastss 0x71c(%rip),%ymm10 # 5a58 <_sk_callback_hsw+0x579> - .byte 196,98,125,24,29,23,7,0,0 // vbroadcastss 0x717(%rip),%ymm11 # 5a5c <_sk_callback_hsw+0x57d> + .byte 196,98,125,24,21,42,7,0,0 // vbroadcastss 0x72a(%rip),%ymm10 # 5b0c <_sk_callback_hsw+0x587> + .byte 196,98,125,24,29,37,7,0,0 // vbroadcastss 0x725(%rip),%ymm11 # 5b10 <_sk_callback_hsw+0x58b> .byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11 .byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11 - .byte 196,98,125,24,5,8,7,0,0 // vbroadcastss 0x708(%rip),%ymm8 # 5a60 <_sk_callback_hsw+0x581> + .byte 196,98,125,24,5,22,7,0,0 // vbroadcastss 0x716(%rip),%ymm8 # 5b14 <_sk_callback_hsw+0x58f> .byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -16213,12 +16373,12 @@ HIDDEN _sk_bicubic_p3x_hsw FUNCTION(_sk_bicubic_p3x_hsw) _sk_bicubic_p3x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,240,6,0,0 // vbroadcastss 0x6f0(%rip),%ymm0 # 5a64 <_sk_callback_hsw+0x585> + .byte 196,226,125,24,5,254,6,0,0 // vbroadcastss 0x6fe(%rip),%ymm0 # 5b18 <_sk_callback_hsw+0x593> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,221,6,0,0 // vbroadcastss 0x6dd(%rip),%ymm10 # 5a68 <_sk_callback_hsw+0x589> - .byte 196,98,125,24,29,216,6,0,0 // vbroadcastss 0x6d8(%rip),%ymm11 # 5a6c <_sk_callback_hsw+0x58d> + .byte 196,98,125,24,21,235,6,0,0 // vbroadcastss 0x6eb(%rip),%ymm10 # 5b1c <_sk_callback_hsw+0x597> + .byte 196,98,125,24,29,230,6,0,0 // vbroadcastss 0x6e6(%rip),%ymm11 # 5b20 <_sk_callback_hsw+0x59b> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -16230,13 +16390,13 @@ HIDDEN _sk_bicubic_n3y_hsw FUNCTION(_sk_bicubic_n3y_hsw) _sk_bicubic_n3y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,187,6,0,0 // vbroadcastss 0x6bb(%rip),%ymm1 # 5a70 <_sk_callback_hsw+0x591> + .byte 196,226,125,24,13,201,6,0,0 // vbroadcastss 0x6c9(%rip),%ymm1 # 5b24 <_sk_callback_hsw+0x59f> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,177,6,0,0 // vbroadcastss 0x6b1(%rip),%ymm8 # 5a74 <_sk_callback_hsw+0x595> + .byte 196,98,125,24,5,191,6,0,0 // vbroadcastss 0x6bf(%rip),%ymm8 # 5b28 <_sk_callback_hsw+0x5a3> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,162,6,0,0 // vbroadcastss 0x6a2(%rip),%ymm10 # 5a78 <_sk_callback_hsw+0x599> - .byte 196,98,125,24,29,157,6,0,0 // vbroadcastss 0x69d(%rip),%ymm11 # 5a7c <_sk_callback_hsw+0x59d> + .byte 196,98,125,24,21,176,6,0,0 // vbroadcastss 0x6b0(%rip),%ymm10 # 5b2c <_sk_callback_hsw+0x5a7> + .byte 196,98,125,24,29,171,6,0,0 // vbroadcastss 0x6ab(%rip),%ymm11 # 5b30 <_sk_callback_hsw+0x5ab> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -16248,16 +16408,16 @@ HIDDEN _sk_bicubic_n1y_hsw FUNCTION(_sk_bicubic_n1y_hsw) _sk_bicubic_n1y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,128,6,0,0 // vbroadcastss 0x680(%rip),%ymm1 # 5a80 <_sk_callback_hsw+0x5a1> + .byte 196,226,125,24,13,142,6,0,0 // vbroadcastss 0x68e(%rip),%ymm1 # 5b34 <_sk_callback_hsw+0x5af> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,118,6,0,0 // vbroadcastss 0x676(%rip),%ymm8 # 5a84 <_sk_callback_hsw+0x5a5> + .byte 196,98,125,24,5,132,6,0,0 // vbroadcastss 0x684(%rip),%ymm8 # 5b38 <_sk_callback_hsw+0x5b3> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,108,6,0,0 // vbroadcastss 0x66c(%rip),%ymm9 # 5a88 <_sk_callback_hsw+0x5a9> - .byte 196,98,125,24,21,103,6,0,0 // vbroadcastss 0x667(%rip),%ymm10 # 5a8c <_sk_callback_hsw+0x5ad> + .byte 196,98,125,24,13,122,6,0,0 // vbroadcastss 0x67a(%rip),%ymm9 # 5b3c <_sk_callback_hsw+0x5b7> + .byte 196,98,125,24,21,117,6,0,0 // vbroadcastss 0x675(%rip),%ymm10 # 5b40 <_sk_callback_hsw+0x5bb> .byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,13,93,6,0,0 // vbroadcastss 0x65d(%rip),%ymm9 # 5a90 <_sk_callback_hsw+0x5b1> + .byte 196,98,125,24,13,107,6,0,0 // vbroadcastss 0x66b(%rip),%ymm9 # 5b44 <_sk_callback_hsw+0x5bf> .byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9 - .byte 196,98,125,24,21,83,6,0,0 // vbroadcastss 0x653(%rip),%ymm10 # 5a94 <_sk_callback_hsw+0x5b5> + .byte 196,98,125,24,21,97,6,0,0 // vbroadcastss 0x661(%rip),%ymm10 # 5b48 <_sk_callback_hsw+0x5c3> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -16268,14 +16428,14 @@ HIDDEN _sk_bicubic_p1y_hsw FUNCTION(_sk_bicubic_p1y_hsw) _sk_bicubic_p1y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,59,6,0,0 // vbroadcastss 0x63b(%rip),%ymm8 # 5a98 <_sk_callback_hsw+0x5b9> + .byte 196,98,125,24,5,73,6,0,0 // vbroadcastss 0x649(%rip),%ymm8 # 5b4c <_sk_callback_hsw+0x5c7> .byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1 .byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9 - .byte 196,98,125,24,21,44,6,0,0 // vbroadcastss 0x62c(%rip),%ymm10 # 5a9c <_sk_callback_hsw+0x5bd> - .byte 196,98,125,24,29,39,6,0,0 // vbroadcastss 0x627(%rip),%ymm11 # 5aa0 <_sk_callback_hsw+0x5c1> + .byte 196,98,125,24,21,58,6,0,0 // vbroadcastss 0x63a(%rip),%ymm10 # 5b50 <_sk_callback_hsw+0x5cb> + .byte 196,98,125,24,29,53,6,0,0 // vbroadcastss 0x635(%rip),%ymm11 # 5b54 <_sk_callback_hsw+0x5cf> .byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11 .byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11 - .byte 196,98,125,24,5,24,6,0,0 // vbroadcastss 0x618(%rip),%ymm8 # 5aa4 <_sk_callback_hsw+0x5c5> + .byte 196,98,125,24,5,38,6,0,0 // vbroadcastss 0x626(%rip),%ymm8 # 5b58 <_sk_callback_hsw+0x5d3> .byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -16286,12 +16446,12 @@ HIDDEN _sk_bicubic_p3y_hsw FUNCTION(_sk_bicubic_p3y_hsw) _sk_bicubic_p3y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,0,6,0,0 // vbroadcastss 0x600(%rip),%ymm1 # 5aa8 <_sk_callback_hsw+0x5c9> + .byte 196,226,125,24,13,14,6,0,0 // vbroadcastss 0x60e(%rip),%ymm1 # 5b5c <_sk_callback_hsw+0x5d7> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,236,5,0,0 // vbroadcastss 0x5ec(%rip),%ymm10 # 5aac <_sk_callback_hsw+0x5cd> - .byte 196,98,125,24,29,231,5,0,0 // vbroadcastss 0x5e7(%rip),%ymm11 # 5ab0 <_sk_callback_hsw+0x5d1> + .byte 196,98,125,24,21,250,5,0,0 // vbroadcastss 0x5fa(%rip),%ymm10 # 5b60 <_sk_callback_hsw+0x5db> + .byte 196,98,125,24,29,245,5,0,0 // vbroadcastss 0x5f5(%rip),%ymm11 # 5b64 <_sk_callback_hsw+0x5df> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -16421,25 +16581,25 @@ BALIGN4 .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 56d1 <.literal4+0xb1> + .byte 71,225,61 // rex.RXB loope 5779 <.literal4+0xb1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 56e1 <.literal4+0xc1> + .byte 71,225,61 // rex.RXB loope 5789 <.literal4+0xc1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 56f1 <.literal4+0xd1> + .byte 71,225,61 // rex.RXB loope 5799 <.literal4+0xd1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 5701 <.literal4+0xe1> + .byte 71,225,61 // rex.RXB loope 57a9 <.literal4+0xe1> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax) @@ -16501,7 +16661,7 @@ BALIGN4 .byte 190,129,128,128,59 // mov $0x3b808081,%esi .byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 5771 <.literal4+0x151> + .byte 224,7 // loopne 5819 <.literal4+0x151> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -16517,10 +16677,10 @@ BALIGN4 .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) .byte 0,52,255 // add %dh,(%rdi,%rdi,8) .byte 255 // (bad) - .byte 127,0 // jg 5798 <.literal4+0x178> + .byte 127,0 // jg 5840 <.literal4+0x178> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5811 <.literal4+0x1f1> + .byte 119,115 // ja 58b9 <.literal4+0x1f1> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -16534,10 +16694,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 57cc <.literal4+0x1ac> + .byte 127,0 // jg 5874 <.literal4+0x1ac> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5845 <.literal4+0x225> + .byte 119,115 // ja 58ed <.literal4+0x225> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -16551,10 +16711,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5800 <.literal4+0x1e0> + .byte 127,0 // jg 58a8 <.literal4+0x1e0> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5879 <.literal4+0x259> + .byte 119,115 // ja 5921 <.literal4+0x259> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -16568,10 +16728,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5834 <.literal4+0x214> + .byte 127,0 // jg 58dc <.literal4+0x214> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 58ad <.literal4+0x28d> + .byte 119,115 // ja 5955 <.literal4+0x28d> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -16584,7 +16744,7 @@ BALIGN4 .byte 0,75,0 // add %cl,0x0(%rbx) .byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax) .byte 66,0,0 // rex.X add %al,(%rax) - .byte 127,67 // jg 58ab <.literal4+0x28b> + .byte 127,67 // jg 5953 <.literal4+0x28b> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -16596,7 +16756,7 @@ BALIGN4 .byte 190,80,128,3,62 // mov $0x3e038050,%esi .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 58cb <.literal4+0x2ab> + .byte 118,63 // jbe 5973 <.literal4+0x2ab> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,0 // cmpb $0x0,(%rbx) @@ -16611,7 +16771,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 58cd <.literal4+0x2ad> + .byte 224,7 // loopne 5975 <.literal4+0x2ad> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -16623,7 +16783,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 58e9 <.literal4+0x2c9> + .byte 224,7 // loopne 5991 <.literal4+0x2c9> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -16635,7 +16795,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 5905 <.literal4+0x2e5> + .byte 224,7 // loopne 59ad <.literal4+0x2e5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -16646,7 +16806,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 595a <.literal4+0x33a> + .byte 124,66 // jl 5a02 <.literal4+0x33a> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax) @@ -16672,7 +16832,7 @@ BALIGN4 .byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax) .byte 0,0 // add %al,(%rax) .byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax) - .byte 112,65 // jo 59bd <.literal4+0x39d> + .byte 112,65 // jo 5a65 <.literal4+0x39d> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,127,67 // add %bh,0x43(%rdi) @@ -16686,7 +16846,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 255 // (bad) - .byte 127,71 // jg 59f3 <.literal4+0x3d3> + .byte 127,71 // jg 5a9b <.literal4+0x3d3> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -16727,6 +16887,10 @@ BALIGN4 .byte 128,0,0 // addb $0x0,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) + .byte 0,192 // add %al,%al + .byte 0,0 // add %al,(%rax) + .byte 0,128,0,0,128,63 // add %al,0x3f800000(%rax) + .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,191,0,0,128,63 // add %bh,0x3f800000(%rdi) @@ -16804,16 +16968,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005ae8 <_sk_callback_hsw+0xa000609> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005ba8 <_sk_callback_hsw+0xa000623> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005af0 <_sk_callback_hsw+0x12000611> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005bb0 <_sk_callback_hsw+0x1200062b> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005af8 <_sk_callback_hsw+0x1a000619> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005bb8 <_sk_callback_hsw+0x1a000633> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005b00 <_sk_callback_hsw+0x3000621> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005bc0 <_sk_callback_hsw+0x300063b> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -16856,16 +17020,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005b48 <_sk_callback_hsw+0xa000669> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005c08 <_sk_callback_hsw+0xa000683> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005b50 <_sk_callback_hsw+0x12000671> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005c10 <_sk_callback_hsw+0x1200068b> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005b58 <_sk_callback_hsw+0x1a000679> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005c18 <_sk_callback_hsw+0x1a000693> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005b60 <_sk_callback_hsw+0x3000681> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005c20 <_sk_callback_hsw+0x300069b> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -16908,16 +17072,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005ba8 <_sk_callback_hsw+0xa0006c9> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005c68 <_sk_callback_hsw+0xa0006e3> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005bb0 <_sk_callback_hsw+0x120006d1> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005c70 <_sk_callback_hsw+0x120006eb> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005bb8 <_sk_callback_hsw+0x1a0006d9> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005c78 <_sk_callback_hsw+0x1a0006f3> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005bc0 <_sk_callback_hsw+0x30006e1> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005c80 <_sk_callback_hsw+0x30006fb> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -16960,16 +17124,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005c08 <_sk_callback_hsw+0xa000729> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005cc8 <_sk_callback_hsw+0xa000743> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005c10 <_sk_callback_hsw+0x12000731> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005cd0 <_sk_callback_hsw+0x1200074b> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005c18 <_sk_callback_hsw+0x1a000739> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005cd8 <_sk_callback_hsw+0x1a000753> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005c20 <_sk_callback_hsw+0x3000741> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005ce0 <_sk_callback_hsw+0x300075b> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -17012,16 +17176,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005c68 <_sk_callback_hsw+0xa000789> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005d28 <_sk_callback_hsw+0xa0007a3> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005c70 <_sk_callback_hsw+0x12000791> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005d30 <_sk_callback_hsw+0x120007ab> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005c78 <_sk_callback_hsw+0x1a000799> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005d38 <_sk_callback_hsw+0x1a0007b3> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005c80 <_sk_callback_hsw+0x30007a1> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005d40 <_sk_callback_hsw+0x30007bb> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -17064,16 +17228,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005cc8 <_sk_callback_hsw+0xa0007e9> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005d88 <_sk_callback_hsw+0xa000803> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005cd0 <_sk_callback_hsw+0x120007f1> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005d90 <_sk_callback_hsw+0x1200080b> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005cd8 <_sk_callback_hsw+0x1a0007f9> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005d98 <_sk_callback_hsw+0x1a000813> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005ce0 <_sk_callback_hsw+0x3000801> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005da0 <_sk_callback_hsw+0x300081b> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -17116,16 +17280,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005d28 <_sk_callback_hsw+0xa000849> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005de8 <_sk_callback_hsw+0xa000863> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005d30 <_sk_callback_hsw+0x12000851> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005df0 <_sk_callback_hsw+0x1200086b> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005d38 <_sk_callback_hsw+0x1a000859> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005df8 <_sk_callback_hsw+0x1a000873> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005d40 <_sk_callback_hsw+0x3000861> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005e00 <_sk_callback_hsw+0x300087b> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -17168,16 +17332,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005d88 <_sk_callback_hsw+0xa0008a9> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005e48 <_sk_callback_hsw+0xa0008c3> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005d90 <_sk_callback_hsw+0x120008b1> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005e50 <_sk_callback_hsw+0x120008cb> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005d98 <_sk_callback_hsw+0x1a0008b9> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005e58 <_sk_callback_hsw+0x1a0008d3> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005da0 <_sk_callback_hsw+0x30008c1> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005e60 <_sk_callback_hsw+0x30008db> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -17220,16 +17384,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005de8 <_sk_callback_hsw+0xa000909> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005ea8 <_sk_callback_hsw+0xa000923> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005df0 <_sk_callback_hsw+0x12000911> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005eb0 <_sk_callback_hsw+0x1200092b> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005df8 <_sk_callback_hsw+0x1a000919> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005eb8 <_sk_callback_hsw+0x1a000933> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005e00 <_sk_callback_hsw+0x3000921> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005ec0 <_sk_callback_hsw+0x300093b> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -17406,7 +17570,7 @@ _sk_seed_shader_avx: .byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,107,118,0,0 // vbroadcastss 0x766b(%rip),%ymm1 # 7708 <_sk_callback_avx+0x144> + .byte 196,226,125,24,13,51,119,0,0 // vbroadcastss 0x7733(%rip),%ymm1 # 77d0 <_sk_callback_avx+0x141> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0 .byte 197,249,110,209 // vmovd %ecx,%xmm2 @@ -17415,7 +17579,7 @@ _sk_seed_shader_avx: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,21,69,118,0,0 // vbroadcastss 0x7645(%rip),%ymm2 # 770c <_sk_callback_avx+0x148> + .byte 196,226,125,24,21,13,119,0,0 // vbroadcastss 0x770d(%rip),%ymm2 # 77d4 <_sk_callback_avx+0x145> .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 @@ -17439,7 +17603,7 @@ _sk_dither_avx: .byte 196,65,121,112,201,0 // vpshufd $0x0,%xmm9,%xmm9 .byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9 .byte 196,65,52,87,208 // vxorps %ymm8,%ymm9,%ymm10 - .byte 196,98,125,24,29,238,117,0,0 // vbroadcastss 0x75ee(%rip),%ymm11 # 7710 <_sk_callback_avx+0x14c> + .byte 196,98,125,24,29,182,118,0,0 // vbroadcastss 0x76b6(%rip),%ymm11 # 77d8 <_sk_callback_avx+0x149> .byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9 .byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12 .byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9 @@ -17450,8 +17614,8 @@ _sk_dither_avx: .byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11 .byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11 .byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11 - .byte 196,98,125,24,37,175,117,0,0 // vbroadcastss 0x75af(%rip),%ymm12 # 7714 <_sk_callback_avx+0x150> - .byte 196,98,125,24,45,170,117,0,0 // vbroadcastss 0x75aa(%rip),%ymm13 # 7718 <_sk_callback_avx+0x154> + .byte 196,98,125,24,37,119,118,0,0 // vbroadcastss 0x7677(%rip),%ymm12 # 77dc <_sk_callback_avx+0x14d> + .byte 196,98,125,24,45,114,118,0,0 // vbroadcastss 0x7672(%rip),%ymm13 # 77e0 <_sk_callback_avx+0x151> .byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14 .byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15 .byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14 @@ -17478,9 +17642,9 @@ _sk_dither_avx: .byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8 .byte 196,65,60,86,194 // vorps %ymm10,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,21,117,0,0 // vbroadcastss 0x7515(%rip),%ymm9 # 771c <_sk_callback_avx+0x158> + .byte 196,98,125,24,13,221,117,0,0 // vbroadcastss 0x75dd(%rip),%ymm9 # 77e4 <_sk_callback_avx+0x155> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,11,117,0,0 // vbroadcastss 0x750b(%rip),%ymm9 # 7720 <_sk_callback_avx+0x15c> + .byte 196,98,125,24,13,211,117,0,0 // vbroadcastss 0x75d3(%rip),%ymm9 # 77e8 <_sk_callback_avx+0x159> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 196,98,125,24,8 // vbroadcastss (%rax),%ymm9 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 @@ -17549,7 +17713,7 @@ HIDDEN _sk_srcatop_avx FUNCTION(_sk_srcatop_avx) _sk_srcatop_avx: .byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0 - .byte 196,98,125,24,5,99,116,0,0 // vbroadcastss 0x7463(%rip),%ymm8 # 7724 <_sk_callback_avx+0x160> + .byte 196,98,125,24,5,43,117,0,0 // vbroadcastss 0x752b(%rip),%ymm8 # 77ec <_sk_callback_avx+0x15d> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -17570,7 +17734,7 @@ HIDDEN _sk_dstatop_avx FUNCTION(_sk_dstatop_avx) _sk_dstatop_avx: .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 - .byte 196,98,125,24,13,37,116,0,0 // vbroadcastss 0x7425(%rip),%ymm9 # 7728 <_sk_callback_avx+0x164> + .byte 196,98,125,24,13,237,116,0,0 // vbroadcastss 0x74ed(%rip),%ymm9 # 77f0 <_sk_callback_avx+0x161> .byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0 @@ -17612,7 +17776,7 @@ HIDDEN _sk_srcout_avx .globl _sk_srcout_avx FUNCTION(_sk_srcout_avx) _sk_srcout_avx: - .byte 196,98,125,24,5,196,115,0,0 // vbroadcastss 0x73c4(%rip),%ymm8 # 772c <_sk_callback_avx+0x168> + .byte 196,98,125,24,5,140,116,0,0 // vbroadcastss 0x748c(%rip),%ymm8 # 77f4 <_sk_callback_avx+0x165> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -17625,7 +17789,7 @@ HIDDEN _sk_dstout_avx .globl _sk_dstout_avx FUNCTION(_sk_dstout_avx) _sk_dstout_avx: - .byte 196,226,125,24,5,167,115,0,0 // vbroadcastss 0x73a7(%rip),%ymm0 # 7730 <_sk_callback_avx+0x16c> + .byte 196,226,125,24,5,111,116,0,0 // vbroadcastss 0x746f(%rip),%ymm0 # 77f8 <_sk_callback_avx+0x169> .byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3 .byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0 .byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1 @@ -17638,7 +17802,7 @@ HIDDEN _sk_srcover_avx .globl _sk_srcover_avx FUNCTION(_sk_srcover_avx) _sk_srcover_avx: - .byte 196,98,125,24,5,138,115,0,0 // vbroadcastss 0x738a(%rip),%ymm8 # 7734 <_sk_callback_avx+0x170> + .byte 196,98,125,24,5,82,116,0,0 // vbroadcastss 0x7452(%rip),%ymm8 # 77fc <_sk_callback_avx+0x16d> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -17655,7 +17819,7 @@ HIDDEN _sk_dstover_avx .globl _sk_dstover_avx FUNCTION(_sk_dstover_avx) _sk_dstover_avx: - .byte 196,98,125,24,5,93,115,0,0 // vbroadcastss 0x735d(%rip),%ymm8 # 7738 <_sk_callback_avx+0x174> + .byte 196,98,125,24,5,37,116,0,0 // vbroadcastss 0x7425(%rip),%ymm8 # 7800 <_sk_callback_avx+0x171> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0 @@ -17683,7 +17847,7 @@ HIDDEN _sk_multiply_avx .globl _sk_multiply_avx FUNCTION(_sk_multiply_avx) _sk_multiply_avx: - .byte 196,98,125,24,5,28,115,0,0 // vbroadcastss 0x731c(%rip),%ymm8 # 773c <_sk_callback_avx+0x178> + .byte 196,98,125,24,5,228,115,0,0 // vbroadcastss 0x73e4(%rip),%ymm8 # 7804 <_sk_callback_avx+0x175> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -17743,7 +17907,7 @@ HIDDEN _sk_xor__avx .globl _sk_xor__avx FUNCTION(_sk_xor__avx) _sk_xor__avx: - .byte 196,98,125,24,5,107,114,0,0 // vbroadcastss 0x726b(%rip),%ymm8 # 7740 <_sk_callback_avx+0x17c> + .byte 196,98,125,24,5,51,115,0,0 // vbroadcastss 0x7333(%rip),%ymm8 # 7808 <_sk_callback_avx+0x179> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -17780,7 +17944,7 @@ _sk_darken_avx: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,235,113,0,0 // vbroadcastss 0x71eb(%rip),%ymm8 # 7744 <_sk_callback_avx+0x180> + .byte 196,98,125,24,5,179,114,0,0 // vbroadcastss 0x72b3(%rip),%ymm8 # 780c <_sk_callback_avx+0x17d> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -17806,7 +17970,7 @@ _sk_lighten_avx: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,151,113,0,0 // vbroadcastss 0x7197(%rip),%ymm8 # 7748 <_sk_callback_avx+0x184> + .byte 196,98,125,24,5,95,114,0,0 // vbroadcastss 0x725f(%rip),%ymm8 # 7810 <_sk_callback_avx+0x181> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -17835,7 +17999,7 @@ _sk_difference_avx: .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,55,113,0,0 // vbroadcastss 0x7137(%rip),%ymm8 # 774c <_sk_callback_avx+0x188> + .byte 196,98,125,24,5,255,113,0,0 // vbroadcastss 0x71ff(%rip),%ymm8 # 7814 <_sk_callback_avx+0x185> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -17858,7 +18022,7 @@ _sk_exclusion_avx: .byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,242,112,0,0 // vbroadcastss 0x70f2(%rip),%ymm8 # 7750 <_sk_callback_avx+0x18c> + .byte 196,98,125,24,5,186,113,0,0 // vbroadcastss 0x71ba(%rip),%ymm8 # 7818 <_sk_callback_avx+0x189> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -17869,7 +18033,7 @@ HIDDEN _sk_colorburn_avx .globl _sk_colorburn_avx FUNCTION(_sk_colorburn_avx) _sk_colorburn_avx: - .byte 196,98,125,24,5,221,112,0,0 // vbroadcastss 0x70dd(%rip),%ymm8 # 7754 <_sk_callback_avx+0x190> + .byte 196,98,125,24,5,165,113,0,0 // vbroadcastss 0x71a5(%rip),%ymm8 # 781c <_sk_callback_avx+0x18d> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11 .byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10 @@ -17931,7 +18095,7 @@ HIDDEN _sk_colordodge_avx FUNCTION(_sk_colordodge_avx) _sk_colordodge_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,13,217,111,0,0 // vbroadcastss 0x6fd9(%rip),%ymm9 # 7758 <_sk_callback_avx+0x194> + .byte 196,98,125,24,13,161,112,0,0 // vbroadcastss 0x70a1(%rip),%ymm9 # 7820 <_sk_callback_avx+0x191> .byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9 @@ -17988,7 +18152,7 @@ HIDDEN _sk_hardlight_avx .globl _sk_hardlight_avx FUNCTION(_sk_hardlight_avx) _sk_hardlight_avx: - .byte 196,98,125,24,5,235,110,0,0 // vbroadcastss 0x6eeb(%rip),%ymm8 # 775c <_sk_callback_avx+0x198> + .byte 196,98,125,24,5,179,111,0,0 // vbroadcastss 0x6fb3(%rip),%ymm8 # 7824 <_sk_callback_avx+0x195> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -18043,7 +18207,7 @@ HIDDEN _sk_overlay_avx .globl _sk_overlay_avx FUNCTION(_sk_overlay_avx) _sk_overlay_avx: - .byte 196,98,125,24,5,20,110,0,0 // vbroadcastss 0x6e14(%rip),%ymm8 # 7760 <_sk_callback_avx+0x19c> + .byte 196,98,125,24,5,220,110,0,0 // vbroadcastss 0x6edc(%rip),%ymm8 # 7828 <_sk_callback_avx+0x199> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -18109,10 +18273,10 @@ _sk_softlight_avx: .byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8 .byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11 .byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8 - .byte 196,98,125,24,29,11,109,0,0 // vbroadcastss 0x6d0b(%rip),%ymm11 # 7768 <_sk_callback_avx+0x1a4> + .byte 196,98,125,24,29,211,109,0,0 // vbroadcastss 0x6dd3(%rip),%ymm11 # 7830 <_sk_callback_avx+0x1a1> .byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13 .byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8 - .byte 196,98,125,24,45,252,108,0,0 // vbroadcastss 0x6cfc(%rip),%ymm13 # 776c <_sk_callback_avx+0x1a8> + .byte 196,98,125,24,45,196,109,0,0 // vbroadcastss 0x6dc4(%rip),%ymm13 # 7834 <_sk_callback_avx+0x1a5> .byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14 .byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8 .byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14 @@ -18123,7 +18287,7 @@ _sk_softlight_avx: .byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15 .byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14 .byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15 - .byte 196,98,125,24,5,186,108,0,0 // vbroadcastss 0x6cba(%rip),%ymm8 # 7764 <_sk_callback_avx+0x1a0> + .byte 196,98,125,24,5,130,109,0,0 // vbroadcastss 0x6d82(%rip),%ymm8 # 782c <_sk_callback_avx+0x19d> .byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12 .byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0 .byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12 @@ -18250,12 +18414,12 @@ _sk_hue_avx: .byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11 .byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11 .byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - .byte 196,98,125,24,53,137,106,0,0 // vbroadcastss 0x6a89(%rip),%ymm14 # 7770 <_sk_callback_avx+0x1ac> + .byte 196,98,125,24,53,81,107,0,0 // vbroadcastss 0x6b51(%rip),%ymm14 # 7838 <_sk_callback_avx+0x1a9> .byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11 - .byte 196,98,125,24,61,127,106,0,0 // vbroadcastss 0x6a7f(%rip),%ymm15 # 7774 <_sk_callback_avx+0x1b0> + .byte 196,98,125,24,61,71,107,0,0 // vbroadcastss 0x6b47(%rip),%ymm15 # 783c <_sk_callback_avx+0x1ad> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 - .byte 196,226,125,24,5,112,106,0,0 // vbroadcastss 0x6a70(%rip),%ymm0 # 7778 <_sk_callback_avx+0x1b4> + .byte 196,226,125,24,5,56,107,0,0 // vbroadcastss 0x6b38(%rip),%ymm0 # 7840 <_sk_callback_avx+0x1b1> .byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 .byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13 @@ -18316,7 +18480,7 @@ _sk_hue_avx: .byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10 .byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,73,105,0,0 // vbroadcastss 0x6949(%rip),%ymm8 # 777c <_sk_callback_avx+0x1b8> + .byte 196,98,125,24,5,17,106,0,0 // vbroadcastss 0x6a11(%rip),%ymm8 # 7844 <_sk_callback_avx+0x1b5> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -18373,12 +18537,12 @@ _sk_saturation_avx: .byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11 .byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11 .byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - .byte 196,98,125,24,53,87,104,0,0 // vbroadcastss 0x6857(%rip),%ymm14 # 7780 <_sk_callback_avx+0x1bc> + .byte 196,98,125,24,53,31,105,0,0 // vbroadcastss 0x691f(%rip),%ymm14 # 7848 <_sk_callback_avx+0x1b9> .byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11 - .byte 196,98,125,24,61,77,104,0,0 // vbroadcastss 0x684d(%rip),%ymm15 # 7784 <_sk_callback_avx+0x1c0> + .byte 196,98,125,24,61,21,105,0,0 // vbroadcastss 0x6915(%rip),%ymm15 # 784c <_sk_callback_avx+0x1bd> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 - .byte 196,226,125,24,5,62,104,0,0 // vbroadcastss 0x683e(%rip),%ymm0 # 7788 <_sk_callback_avx+0x1c4> + .byte 196,226,125,24,5,6,105,0,0 // vbroadcastss 0x6906(%rip),%ymm0 # 7850 <_sk_callback_avx+0x1c1> .byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 .byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13 @@ -18439,7 +18603,7 @@ _sk_saturation_avx: .byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10 .byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,23,103,0,0 // vbroadcastss 0x6717(%rip),%ymm8 # 778c <_sk_callback_avx+0x1c8> + .byte 196,98,125,24,5,223,103,0,0 // vbroadcastss 0x67df(%rip),%ymm8 # 7854 <_sk_callback_avx+0x1c5> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -18468,12 +18632,12 @@ _sk_color_avx: .byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp) .byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8 .byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9 - .byte 196,98,125,24,45,173,102,0,0 // vbroadcastss 0x66ad(%rip),%ymm13 # 7790 <_sk_callback_avx+0x1cc> + .byte 196,98,125,24,45,117,103,0,0 // vbroadcastss 0x6775(%rip),%ymm13 # 7858 <_sk_callback_avx+0x1c9> .byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10 - .byte 196,98,125,24,53,163,102,0,0 // vbroadcastss 0x66a3(%rip),%ymm14 # 7794 <_sk_callback_avx+0x1d0> + .byte 196,98,125,24,53,107,103,0,0 // vbroadcastss 0x676b(%rip),%ymm14 # 785c <_sk_callback_avx+0x1cd> .byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11 .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,61,148,102,0,0 // vbroadcastss 0x6694(%rip),%ymm15 # 7798 <_sk_callback_avx+0x1d4> + .byte 196,98,125,24,61,92,103,0,0 // vbroadcastss 0x675c(%rip),%ymm15 # 7860 <_sk_callback_avx+0x1d1> .byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11 .byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0 .byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11 @@ -18536,7 +18700,7 @@ _sk_color_avx: .byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9 .byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0 .byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8 - .byte 196,226,125,24,5,91,101,0,0 // vbroadcastss 0x655b(%rip),%ymm0 # 779c <_sk_callback_avx+0x1d8> + .byte 196,226,125,24,5,35,102,0,0 // vbroadcastss 0x6623(%rip),%ymm0 # 7864 <_sk_callback_avx+0x1d5> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -18566,12 +18730,12 @@ _sk_luminosity_avx: .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 .byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9 - .byte 196,98,125,24,45,237,100,0,0 // vbroadcastss 0x64ed(%rip),%ymm13 # 77a0 <_sk_callback_avx+0x1dc> + .byte 196,98,125,24,45,181,101,0,0 // vbroadcastss 0x65b5(%rip),%ymm13 # 7868 <_sk_callback_avx+0x1d9> .byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10 - .byte 196,98,125,24,53,227,100,0,0 // vbroadcastss 0x64e3(%rip),%ymm14 # 77a4 <_sk_callback_avx+0x1e0> + .byte 196,98,125,24,53,171,101,0,0 // vbroadcastss 0x65ab(%rip),%ymm14 # 786c <_sk_callback_avx+0x1dd> .byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11 .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,61,212,100,0,0 // vbroadcastss 0x64d4(%rip),%ymm15 # 77a8 <_sk_callback_avx+0x1e4> + .byte 196,98,125,24,61,156,101,0,0 // vbroadcastss 0x659c(%rip),%ymm15 # 7870 <_sk_callback_avx+0x1e1> .byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11 .byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0 .byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11 @@ -18634,7 +18798,7 @@ _sk_luminosity_avx: .byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9 .byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0 .byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8 - .byte 196,226,125,24,5,155,99,0,0 // vbroadcastss 0x639b(%rip),%ymm0 # 77ac <_sk_callback_avx+0x1e8> + .byte 196,226,125,24,5,99,100,0,0 // vbroadcastss 0x6463(%rip),%ymm0 # 7874 <_sk_callback_avx+0x1e5> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -18665,7 +18829,7 @@ _sk_srcover_rgba_8888_avx: .byte 77,133,192 // test %r8,%r8 .byte 15,133,43,1,0,0 // jne 15a0 <_sk_srcover_rgba_8888_avx+0x144> .byte 196,193,124,16,58 // vmovups (%r10),%ymm7 - .byte 197,124,40,13,254,104,0,0 // vmovaps 0x68fe(%rip),%ymm9 # 7d80 <_sk_callback_avx+0x7bc> + .byte 197,124,40,13,222,105,0,0 // vmovaps 0x69de(%rip),%ymm9 # 7e60 <_sk_callback_avx+0x7d1> .byte 196,193,68,84,225 // vandps %ymm9,%ymm7,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 .byte 197,209,114,215,8 // vpsrld $0x8,%xmm7,%xmm5 @@ -18683,9 +18847,9 @@ _sk_srcover_rgba_8888_avx: .byte 196,193,65,114,208,24 // vpsrld $0x18,%xmm8,%xmm7 .byte 196,227,53,24,255,1 // vinsertf128 $0x1,%xmm7,%ymm9,%ymm7 .byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7 - .byte 196,98,125,24,5,205,98,0,0 // vbroadcastss 0x62cd(%rip),%ymm8 # 77b0 <_sk_callback_avx+0x1ec> + .byte 196,98,125,24,5,149,99,0,0 // vbroadcastss 0x6395(%rip),%ymm8 # 7878 <_sk_callback_avx+0x1e9> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 - .byte 196,98,125,24,13,196,98,0,0 // vbroadcastss 0x62c4(%rip),%ymm9 # 77b4 <_sk_callback_avx+0x1f0> + .byte 196,98,125,24,13,140,99,0,0 // vbroadcastss 0x638c(%rip),%ymm9 # 787c <_sk_callback_avx+0x1ed> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 197,60,89,212 // vmulps %ymm4,%ymm8,%ymm10 .byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0 @@ -18730,9 +18894,9 @@ _sk_srcover_rgba_8888_avx: .byte 72,211,232 // shr %cl,%rax .byte 196,225,249,110,224 // vmovq %rax,%xmm4 .byte 196,226,121,48,228 // vpmovzxbw %xmm4,%xmm4 - .byte 196,226,89,0,45,24,102,0,0 // vpshufb 0x6618(%rip),%xmm4,%xmm5 # 7be0 <_sk_callback_avx+0x61c> + .byte 196,226,89,0,45,232,102,0,0 // vpshufb 0x66e8(%rip),%xmm4,%xmm5 # 7cb0 <_sk_callback_avx+0x621> .byte 196,226,121,33,237 // vpmovsxbd %xmm5,%xmm5 - .byte 196,226,89,0,37,26,102,0,0 // vpshufb 0x661a(%rip),%xmm4,%xmm4 # 7bf0 <_sk_callback_avx+0x62c> + .byte 196,226,89,0,37,234,102,0,0 // vpshufb 0x66ea(%rip),%xmm4,%xmm4 # 7cc0 <_sk_callback_avx+0x631> .byte 196,226,121,33,228 // vpmovsxbd %xmm4,%xmm4 .byte 196,227,85,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm4 .byte 196,194,93,44,58 // vmaskmovps (%r10),%ymm4,%ymm7 @@ -18744,9 +18908,9 @@ _sk_srcover_rgba_8888_avx: .byte 72,211,232 // shr %cl,%rax .byte 196,97,249,110,200 // vmovq %rax,%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 - .byte 196,98,49,0,21,205,101,0,0 // vpshufb 0x65cd(%rip),%xmm9,%xmm10 # 7be0 <_sk_callback_avx+0x61c> + .byte 196,98,49,0,21,157,102,0,0 // vpshufb 0x669d(%rip),%xmm9,%xmm10 # 7cb0 <_sk_callback_avx+0x621> .byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10 - .byte 196,98,49,0,13,207,101,0,0 // vpshufb 0x65cf(%rip),%xmm9,%xmm9 # 7bf0 <_sk_callback_avx+0x62c> + .byte 196,98,49,0,13,159,102,0,0 // vpshufb 0x669f(%rip),%xmm9,%xmm9 # 7cc0 <_sk_callback_avx+0x631> .byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9 .byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 .byte 196,66,53,46,2 // vmaskmovps %ymm8,%ymm9,(%r10) @@ -18768,7 +18932,7 @@ HIDDEN _sk_clamp_1_avx .globl _sk_clamp_1_avx FUNCTION(_sk_clamp_1_avx) _sk_clamp_1_avx: - .byte 196,98,125,24,5,92,97,0,0 // vbroadcastss 0x615c(%rip),%ymm8 # 77b8 <_sk_callback_avx+0x1f4> + .byte 196,98,125,24,5,36,98,0,0 // vbroadcastss 0x6224(%rip),%ymm8 # 7880 <_sk_callback_avx+0x1f1> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 @@ -18780,7 +18944,7 @@ HIDDEN _sk_clamp_a_avx .globl _sk_clamp_a_avx FUNCTION(_sk_clamp_a_avx) _sk_clamp_a_avx: - .byte 196,98,125,24,5,63,97,0,0 // vbroadcastss 0x613f(%rip),%ymm8 # 77bc <_sk_callback_avx+0x1f8> + .byte 196,98,125,24,5,7,98,0,0 // vbroadcastss 0x6207(%rip),%ymm8 # 7884 <_sk_callback_avx+0x1f5> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0 .byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1 @@ -18792,7 +18956,7 @@ HIDDEN _sk_clamp_a_dst_avx .globl _sk_clamp_a_dst_avx FUNCTION(_sk_clamp_a_dst_avx) _sk_clamp_a_dst_avx: - .byte 196,98,125,24,5,37,97,0,0 // vbroadcastss 0x6125(%rip),%ymm8 # 77c0 <_sk_callback_avx+0x1fc> + .byte 196,98,125,24,5,237,97,0,0 // vbroadcastss 0x61ed(%rip),%ymm8 # 7888 <_sk_callback_avx+0x1f9> .byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7 .byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4 .byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5 @@ -18859,7 +19023,7 @@ FUNCTION(_sk_unpremul_avx) _sk_unpremul_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9 - .byte 196,98,125,24,21,161,96,0,0 // vbroadcastss 0x60a1(%rip),%ymm10 # 77c4 <_sk_callback_avx+0x200> + .byte 196,98,125,24,21,105,97,0,0 // vbroadcastss 0x6169(%rip),%ymm10 # 788c <_sk_callback_avx+0x1fd> .byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10 .byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 @@ -18872,17 +19036,17 @@ HIDDEN _sk_from_srgb_avx .globl _sk_from_srgb_avx FUNCTION(_sk_from_srgb_avx) _sk_from_srgb_avx: - .byte 196,98,125,24,5,130,96,0,0 // vbroadcastss 0x6082(%rip),%ymm8 # 77c8 <_sk_callback_avx+0x204> + .byte 196,98,125,24,5,74,97,0,0 // vbroadcastss 0x614a(%rip),%ymm8 # 7890 <_sk_callback_avx+0x201> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10 - .byte 196,98,125,24,29,116,96,0,0 // vbroadcastss 0x6074(%rip),%ymm11 # 77cc <_sk_callback_avx+0x208> + .byte 196,98,125,24,29,60,97,0,0 // vbroadcastss 0x613c(%rip),%ymm11 # 7894 <_sk_callback_avx+0x205> .byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12 - .byte 196,98,125,24,45,106,96,0,0 // vbroadcastss 0x606a(%rip),%ymm13 # 77d0 <_sk_callback_avx+0x20c> + .byte 196,98,125,24,45,50,97,0,0 // vbroadcastss 0x6132(%rip),%ymm13 # 7898 <_sk_callback_avx+0x209> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,91,96,0,0 // vbroadcastss 0x605b(%rip),%ymm12 # 77d4 <_sk_callback_avx+0x210> + .byte 196,98,125,24,37,35,97,0,0 // vbroadcastss 0x6123(%rip),%ymm12 # 789c <_sk_callback_avx+0x20d> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,53,81,96,0,0 // vbroadcastss 0x6051(%rip),%ymm14 # 77d8 <_sk_callback_avx+0x214> + .byte 196,98,125,24,53,25,97,0,0 // vbroadcastss 0x6119(%rip),%ymm14 # 78a0 <_sk_callback_avx+0x211> .byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0 .byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0 .byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9 @@ -18908,17 +19072,17 @@ HIDDEN _sk_from_srgb_dst_avx .globl _sk_from_srgb_dst_avx FUNCTION(_sk_from_srgb_dst_avx) _sk_from_srgb_dst_avx: - .byte 196,98,125,24,5,234,95,0,0 // vbroadcastss 0x5fea(%rip),%ymm8 # 77dc <_sk_callback_avx+0x218> + .byte 196,98,125,24,5,178,96,0,0 // vbroadcastss 0x60b2(%rip),%ymm8 # 78a4 <_sk_callback_avx+0x215> .byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9 .byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10 - .byte 196,98,125,24,29,220,95,0,0 // vbroadcastss 0x5fdc(%rip),%ymm11 # 77e0 <_sk_callback_avx+0x21c> + .byte 196,98,125,24,29,164,96,0,0 // vbroadcastss 0x60a4(%rip),%ymm11 # 78a8 <_sk_callback_avx+0x219> .byte 196,65,92,89,227 // vmulps %ymm11,%ymm4,%ymm12 - .byte 196,98,125,24,45,210,95,0,0 // vbroadcastss 0x5fd2(%rip),%ymm13 # 77e4 <_sk_callback_avx+0x220> + .byte 196,98,125,24,45,154,96,0,0 // vbroadcastss 0x609a(%rip),%ymm13 # 78ac <_sk_callback_avx+0x21d> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,195,95,0,0 // vbroadcastss 0x5fc3(%rip),%ymm12 # 77e8 <_sk_callback_avx+0x224> + .byte 196,98,125,24,37,139,96,0,0 // vbroadcastss 0x608b(%rip),%ymm12 # 78b0 <_sk_callback_avx+0x221> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,53,185,95,0,0 // vbroadcastss 0x5fb9(%rip),%ymm14 # 77ec <_sk_callback_avx+0x228> + .byte 196,98,125,24,53,129,96,0,0 // vbroadcastss 0x6081(%rip),%ymm14 # 78b4 <_sk_callback_avx+0x225> .byte 196,193,92,194,230,1 // vcmpltps %ymm14,%ymm4,%ymm4 .byte 196,195,45,74,225,64 // vblendvps %ymm4,%ymm9,%ymm10,%ymm4 .byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9 @@ -18945,20 +19109,20 @@ HIDDEN _sk_to_srgb_avx FUNCTION(_sk_to_srgb_avx) _sk_to_srgb_avx: .byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9 - .byte 196,98,125,24,5,78,95,0,0 // vbroadcastss 0x5f4e(%rip),%ymm8 # 77f0 <_sk_callback_avx+0x22c> + .byte 196,98,125,24,5,22,96,0,0 // vbroadcastss 0x6016(%rip),%ymm8 # 78b8 <_sk_callback_avx+0x229> .byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10 - .byte 196,98,125,24,29,68,95,0,0 // vbroadcastss 0x5f44(%rip),%ymm11 # 77f4 <_sk_callback_avx+0x230> + .byte 196,98,125,24,29,12,96,0,0 // vbroadcastss 0x600c(%rip),%ymm11 # 78bc <_sk_callback_avx+0x22d> .byte 196,65,52,89,227 // vmulps %ymm11,%ymm9,%ymm12 - .byte 196,98,125,24,45,58,95,0,0 // vbroadcastss 0x5f3a(%rip),%ymm13 # 77f8 <_sk_callback_avx+0x234> + .byte 196,98,125,24,45,2,96,0,0 // vbroadcastss 0x6002(%rip),%ymm13 # 78c0 <_sk_callback_avx+0x231> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,52,89,228 // vmulps %ymm12,%ymm9,%ymm12 - .byte 196,98,125,24,53,43,95,0,0 // vbroadcastss 0x5f2b(%rip),%ymm14 # 77fc <_sk_callback_avx+0x238> + .byte 196,98,125,24,53,243,95,0,0 // vbroadcastss 0x5ff3(%rip),%ymm14 # 78c4 <_sk_callback_avx+0x235> .byte 196,65,28,88,230 // vaddps %ymm14,%ymm12,%ymm12 - .byte 196,98,125,24,61,33,95,0,0 // vbroadcastss 0x5f21(%rip),%ymm15 # 7800 <_sk_callback_avx+0x23c> + .byte 196,98,125,24,61,233,95,0,0 // vbroadcastss 0x5fe9(%rip),%ymm15 # 78c8 <_sk_callback_avx+0x239> .byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9 .byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9 .byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9 - .byte 196,98,125,24,37,13,95,0,0 // vbroadcastss 0x5f0d(%rip),%ymm12 # 7804 <_sk_callback_avx+0x240> + .byte 196,98,125,24,37,213,95,0,0 // vbroadcastss 0x5fd5(%rip),%ymm12 # 78cc <_sk_callback_avx+0x23d> .byte 196,193,124,194,196,1 // vcmpltps %ymm12,%ymm0,%ymm0 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9 @@ -18995,7 +19159,7 @@ _sk_rgb_to_hsl_avx: .byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9 .byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9 .byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,29,115,94,0,0 // vbroadcastss 0x5e73(%rip),%ymm11 # 7808 <_sk_callback_avx+0x244> + .byte 196,98,125,24,29,59,95,0,0 // vbroadcastss 0x5f3b(%rip),%ymm11 # 78d0 <_sk_callback_avx+0x241> .byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11 .byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12 .byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12 @@ -19005,19 +19169,19 @@ _sk_rgb_to_hsl_avx: .byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2 .byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1 .byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,76,94,0,0 // vbroadcastss 0x5e4c(%rip),%ymm11 # 7814 <_sk_callback_avx+0x250> + .byte 196,98,125,24,29,20,95,0,0 // vbroadcastss 0x5f14(%rip),%ymm11 # 78dc <_sk_callback_avx+0x24d> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,58,94,0,0 // vbroadcastss 0x5e3a(%rip),%ymm11 # 7810 <_sk_callback_avx+0x24c> + .byte 196,98,125,24,29,2,95,0,0 // vbroadcastss 0x5f02(%rip),%ymm11 # 78d8 <_sk_callback_avx+0x249> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,34,94,0,0 // vbroadcastss 0x5e22(%rip),%ymm2 # 780c <_sk_callback_avx+0x248> + .byte 196,226,125,24,21,234,94,0,0 // vbroadcastss 0x5eea(%rip),%ymm2 # 78d4 <_sk_callback_avx+0x245> .byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14 .byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2 .byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0 .byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2 .byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0 .byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1 - .byte 196,98,125,24,37,9,94,0,0 // vbroadcastss 0x5e09(%rip),%ymm12 # 781c <_sk_callback_avx+0x258> + .byte 196,98,125,24,37,209,94,0,0 // vbroadcastss 0x5ed1(%rip),%ymm12 # 78e4 <_sk_callback_avx+0x255> .byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2 .byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12 .byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11 @@ -19027,7 +19191,7 @@ _sk_rgb_to_hsl_avx: .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0 .byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1 - .byte 196,98,125,24,5,204,93,0,0 // vbroadcastss 0x5dcc(%rip),%ymm8 # 7818 <_sk_callback_avx+0x254> + .byte 196,98,125,24,5,148,94,0,0 // vbroadcastss 0x5e94(%rip),%ymm8 # 78e0 <_sk_callback_avx+0x251> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -19044,7 +19208,7 @@ _sk_hsl_to_rgb_avx: .byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp) .byte 197,252,40,225 // vmovaps %ymm1,%ymm4 .byte 197,252,40,216 // vmovaps %ymm0,%ymm3 - .byte 196,98,125,24,5,153,93,0,0 // vbroadcastss 0x5d99(%rip),%ymm8 # 7820 <_sk_callback_avx+0x25c> + .byte 196,98,125,24,5,97,94,0,0 // vbroadcastss 0x5e61(%rip),%ymm8 # 78e8 <_sk_callback_avx+0x259> .byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9 .byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10 .byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11 @@ -19052,23 +19216,23 @@ _sk_hsl_to_rgb_avx: .byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10 .byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,29,115,93,0,0 // vbroadcastss 0x5d73(%rip),%ymm11 # 7824 <_sk_callback_avx+0x260> + .byte 196,98,125,24,29,59,94,0,0 // vbroadcastss 0x5e3b(%rip),%ymm11 # 78ec <_sk_callback_avx+0x25d> .byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11 .byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12 .byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15 .byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11 - .byte 196,98,125,24,37,93,93,0,0 // vbroadcastss 0x5d5d(%rip),%ymm12 # 782c <_sk_callback_avx+0x268> + .byte 196,98,125,24,37,37,94,0,0 // vbroadcastss 0x5e25(%rip),%ymm12 # 78f4 <_sk_callback_avx+0x265> .byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0 - .byte 196,98,125,24,45,83,93,0,0 // vbroadcastss 0x5d53(%rip),%ymm13 # 7830 <_sk_callback_avx+0x26c> + .byte 196,98,125,24,45,27,94,0,0 // vbroadcastss 0x5e1b(%rip),%ymm13 # 78f8 <_sk_callback_avx+0x269> .byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14 .byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14 .byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14 - .byte 196,226,125,24,13,52,93,0,0 // vbroadcastss 0x5d34(%rip),%ymm1 # 7828 <_sk_callback_avx+0x264> + .byte 196,226,125,24,13,252,93,0,0 // vbroadcastss 0x5dfc(%rip),%ymm1 # 78f0 <_sk_callback_avx+0x261> .byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7 .byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7 .byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14 .byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7 - .byte 196,98,125,24,53,31,93,0,0 // vbroadcastss 0x5d1f(%rip),%ymm14 # 7834 <_sk_callback_avx+0x270> + .byte 196,98,125,24,53,231,93,0,0 // vbroadcastss 0x5de7(%rip),%ymm14 # 78fc <_sk_callback_avx+0x26d> .byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15 .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -19087,7 +19251,7 @@ _sk_hsl_to_rgb_avx: .byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6 .byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6 .byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5 - .byte 196,226,125,24,5,193,92,0,0 // vbroadcastss 0x5cc1(%rip),%ymm0 # 7838 <_sk_callback_avx+0x274> + .byte 196,226,125,24,5,137,93,0,0 // vbroadcastss 0x5d89(%rip),%ymm0 # 7900 <_sk_callback_avx+0x271> .byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0 .byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3 .byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0 @@ -19139,13 +19303,13 @@ _sk_scale_u8_avx: .byte 77,133,192 // test %r8,%r8 .byte 117,74 // jne 1c6e <_sk_scale_u8_avx+0x54> .byte 196,66,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm8 - .byte 197,57,219,5,206,95,0,0 // vpand 0x5fce(%rip),%xmm8,%xmm8 # 7c00 <_sk_callback_avx+0x63c> + .byte 197,57,219,5,158,96,0,0 // vpand 0x609e(%rip),%xmm8,%xmm8 # 7cd0 <_sk_callback_avx+0x641> .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9 .byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8 .byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,231,91,0,0 // vbroadcastss 0x5be7(%rip),%ymm9 # 783c <_sk_callback_avx+0x278> + .byte 196,98,125,24,13,175,92,0,0 // vbroadcastss 0x5caf(%rip),%ymm9 # 7904 <_sk_callback_avx+0x275> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -19194,7 +19358,7 @@ _sk_scale_u8_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,222 // jmpq ffffffffdf001d18 <_sk_callback_avx+0xffffffffdeffa754> + .byte 233,255,255,255,222 // jmpq ffffffffdf001d18 <_sk_callback_avx+0xffffffffdeffa689> .byte 255 // (bad) .byte 255 // (bad) .byte 255,211 // callq *%rbx @@ -19235,13 +19399,13 @@ _sk_lerp_u8_avx: .byte 77,133,192 // test %r8,%r8 .byte 117,110 // jne 1ddb <_sk_lerp_u8_avx+0x78> .byte 196,66,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm8 - .byte 197,57,219,5,149,94,0,0 // vpand 0x5e95(%rip),%xmm8,%xmm8 # 7c10 <_sk_callback_avx+0x64c> + .byte 197,57,219,5,101,95,0,0 // vpand 0x5f65(%rip),%xmm8,%xmm8 # 7ce0 <_sk_callback_avx+0x651> .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9 .byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8 .byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,162,90,0,0 // vbroadcastss 0x5aa2(%rip),%ymm9 # 7840 <_sk_callback_avx+0x27c> + .byte 196,98,125,24,13,106,91,0,0 // vbroadcastss 0x5b6a(%rip),%ymm9 # 7908 <_sk_callback_avx+0x279> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 @@ -19297,7 +19461,7 @@ _sk_lerp_u8_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,222 // jmpq ffffffffdf001e88 <_sk_callback_avx+0xffffffffdeffa8c4> + .byte 233,255,255,255,222 // jmpq ffffffffdf001e88 <_sk_callback_avx+0xffffffffdeffa7f9> .byte 255 // (bad) .byte 255 // (bad) .byte 255,211 // callq *%rbx @@ -19321,20 +19485,20 @@ _sk_lerp_565_avx: .byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9 .byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8 .byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,126,89,0,0 // vbroadcastss 0x597e(%rip),%ymm9 # 7844 <_sk_callback_avx+0x280> + .byte 196,98,125,24,13,70,90,0,0 // vbroadcastss 0x5a46(%rip),%ymm9 # 790c <_sk_callback_avx+0x27d> .byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9 .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9 - .byte 196,98,125,24,21,111,89,0,0 // vbroadcastss 0x596f(%rip),%ymm10 # 7848 <_sk_callback_avx+0x284> + .byte 196,98,125,24,21,55,90,0,0 // vbroadcastss 0x5a37(%rip),%ymm10 # 7910 <_sk_callback_avx+0x281> .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,101,89,0,0 // vbroadcastss 0x5965(%rip),%ymm10 # 784c <_sk_callback_avx+0x288> + .byte 196,98,125,24,21,45,90,0,0 // vbroadcastss 0x5a2d(%rip),%ymm10 # 7914 <_sk_callback_avx+0x285> .byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10 .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10 - .byte 196,98,125,24,29,86,89,0,0 // vbroadcastss 0x5956(%rip),%ymm11 # 7850 <_sk_callback_avx+0x28c> + .byte 196,98,125,24,29,30,90,0,0 // vbroadcastss 0x5a1e(%rip),%ymm11 # 7918 <_sk_callback_avx+0x289> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,29,76,89,0,0 // vbroadcastss 0x594c(%rip),%ymm11 # 7854 <_sk_callback_avx+0x290> + .byte 196,98,125,24,29,20,90,0,0 // vbroadcastss 0x5a14(%rip),%ymm11 # 791c <_sk_callback_avx+0x28d> .byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,29,61,89,0,0 // vbroadcastss 0x593d(%rip),%ymm11 # 7858 <_sk_callback_avx+0x294> + .byte 196,98,125,24,29,5,90,0,0 // vbroadcastss 0x5a05(%rip),%ymm11 # 7920 <_sk_callback_avx+0x291> .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 @@ -19414,7 +19578,7 @@ _sk_load_tables_avx: .byte 77,133,192 // test %r8,%r8 .byte 15,133,248,1,0,0 // jne 2230 <_sk_load_tables_avx+0x218> .byte 196,65,124,16,18 // vmovups (%r10),%ymm10 - .byte 197,124,40,13,91,93,0,0 // vmovaps 0x5d5b(%rip),%ymm9 # 7da0 <_sk_callback_avx+0x7dc> + .byte 197,124,40,13,59,94,0,0 // vmovaps 0x5e3b(%rip),%ymm9 # 7e80 <_sk_callback_avx+0x7f1> .byte 196,193,44,84,201 // vandps %ymm9,%ymm10,%ymm1 .byte 196,227,125,25,200,1 // vextractf128 $0x1,%ymm1,%xmm0 .byte 196,193,249,126,195 // vmovq %xmm0,%r11 @@ -19506,7 +19670,7 @@ _sk_load_tables_avx: .byte 196,193,65,114,208,24 // vpsrld $0x18,%xmm8,%xmm7 .byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,226,125,24,61,62,86,0,0 // vbroadcastss 0x563e(%rip),%ymm7 # 785c <_sk_callback_avx+0x298> + .byte 196,226,125,24,61,6,87,0,0 // vbroadcastss 0x5706(%rip),%ymm7 # 7924 <_sk_callback_avx+0x295> .byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,137,201 // mov %r9,%rcx @@ -19520,9 +19684,9 @@ _sk_load_tables_avx: .byte 73,211,235 // shr %cl,%r11 .byte 196,193,249,110,195 // vmovq %r11,%xmm0 .byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0 - .byte 196,226,121,0,13,200,89,0,0 // vpshufb 0x59c8(%rip),%xmm0,%xmm1 # 7c20 <_sk_callback_avx+0x65c> + .byte 196,226,121,0,13,152,90,0,0 // vpshufb 0x5a98(%rip),%xmm0,%xmm1 # 7cf0 <_sk_callback_avx+0x661> .byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1 - .byte 196,226,121,0,5,202,89,0,0 // vpshufb 0x59ca(%rip),%xmm0,%xmm0 # 7c30 <_sk_callback_avx+0x66c> + .byte 196,226,121,0,5,154,90,0,0 // vpshufb 0x5a9a(%rip),%xmm0,%xmm0 # 7d00 <_sk_callback_avx+0x671> .byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 196,66,125,44,18 // vmaskmovps (%r10),%ymm0,%ymm10 @@ -19552,7 +19716,7 @@ _sk_load_tables_u16_be_avx: .byte 197,113,105,219 // vpunpckhwd %xmm3,%xmm1,%xmm11 .byte 197,177,108,200 // vpunpcklqdq %xmm0,%xmm9,%xmm1 .byte 197,49,109,224 // vpunpckhqdq %xmm0,%xmm9,%xmm12 - .byte 197,121,111,21,92,89,0,0 // vmovdqa 0x595c(%rip),%xmm10 # 7c40 <_sk_callback_avx+0x67c> + .byte 197,121,111,21,44,90,0,0 // vmovdqa 0x5a2c(%rip),%xmm10 # 7d10 <_sk_callback_avx+0x681> .byte 196,193,113,219,202 // vpand %xmm10,%xmm1,%xmm1 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 196,193,113,105,209 // vpunpckhwd %xmm9,%xmm1,%xmm2 @@ -19650,7 +19814,7 @@ _sk_load_tables_u16_be_avx: .byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3 .byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,226,125,24,61,131,83,0,0 // vbroadcastss 0x5383(%rip),%ymm7 # 7860 <_sk_callback_avx+0x29c> + .byte 196,226,125,24,61,75,84,0,0 // vbroadcastss 0x544b(%rip),%ymm7 # 7928 <_sk_callback_avx+0x299> .byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7 @@ -19713,7 +19877,7 @@ _sk_load_tables_rgb_u16_be_avx: .byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3 .byte 197,57,109,218 // vpunpckhqdq %xmm2,%xmm8,%xmm11 .byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8 - .byte 197,121,111,13,97,86,0,0 // vmovdqa 0x5661(%rip),%xmm9 # 7c50 <_sk_callback_avx+0x68c> + .byte 197,121,111,13,49,87,0,0 // vmovdqa 0x5731(%rip),%xmm9 # 7d20 <_sk_callback_avx+0x691> .byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0 .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10 .byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1 @@ -19803,7 +19967,7 @@ _sk_load_tables_rgb_u16_be_avx: .byte 196,195,105,33,211,48 // vinsertps $0x30,%xmm11,%xmm2,%xmm2 .byte 196,227,109,24,211,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,166,80,0,0 // vbroadcastss 0x50a6(%rip),%ymm3 # 7864 <_sk_callback_avx+0x2a0> + .byte 196,226,125,24,29,110,81,0,0 // vbroadcastss 0x516e(%rip),%ymm3 # 792c <_sk_callback_avx+0x29d> .byte 197,252,16,116,36,168 // vmovups -0x58(%rsp),%ymm6 .byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7 .byte 255,224 // jmpq *%rax @@ -19846,7 +20010,7 @@ HIDDEN _sk_byte_tables_avx FUNCTION(_sk_byte_tables_avx) _sk_byte_tables_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,226,79,0,0 // vbroadcastss 0x4fe2(%rip),%ymm8 # 7868 <_sk_callback_avx+0x2a4> + .byte 196,98,125,24,5,170,80,0,0 // vbroadcastss 0x50aa(%rip),%ymm8 # 7930 <_sk_callback_avx+0x2a1> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9 .byte 196,65,249,126,201 // vmovq %xmm9,%r9 @@ -19965,7 +20129,7 @@ _sk_byte_tables_avx: .byte 196,194,121,49,204 // vpmovzxbd %xmm12,%xmm1 .byte 196,194,121,49,213 // vpmovzxbd %xmm13,%xmm2 .byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1 - .byte 196,98,125,24,13,140,77,0,0 // vbroadcastss 0x4d8c(%rip),%ymm9 # 786c <_sk_callback_avx+0x2a8> + .byte 196,98,125,24,13,84,78,0,0 // vbroadcastss 0x4e54(%rip),%ymm9 # 7934 <_sk_callback_avx+0x2a5> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1 @@ -20081,7 +20245,7 @@ _sk_byte_tables_rgb_avx: .byte 196,194,121,49,203 // vpmovzxbd %xmm11,%xmm1 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,109,75,0,0 // vbroadcastss 0x4b6d(%rip),%ymm9 # 7870 <_sk_callback_avx+0x2ac> + .byte 196,98,125,24,13,53,76,0,0 // vbroadcastss 0x4c35(%rip),%ymm9 # 7938 <_sk_callback_avx+0x2a9> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,194,121,49,202 // vpmovzxbd %xmm10,%xmm1 .byte 196,194,121,49,212 // vpmovzxbd %xmm12,%xmm2 @@ -20286,36 +20450,36 @@ _sk_parametric_r_avx: .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11 - .byte 196,98,125,24,37,26,72,0,0 // vbroadcastss 0x481a(%rip),%ymm12 # 7874 <_sk_callback_avx+0x2b0> + .byte 196,98,125,24,37,226,72,0,0 // vbroadcastss 0x48e2(%rip),%ymm12 # 793c <_sk_callback_avx+0x2ad> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,16,72,0,0 // vbroadcastss 0x4810(%rip),%ymm12 # 7878 <_sk_callback_avx+0x2b4> + .byte 196,98,125,24,37,216,72,0,0 // vbroadcastss 0x48d8(%rip),%ymm12 # 7940 <_sk_callback_avx+0x2b1> .byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,6,72,0,0 // vbroadcastss 0x4806(%rip),%ymm12 # 787c <_sk_callback_avx+0x2b8> + .byte 196,98,125,24,37,206,72,0,0 // vbroadcastss 0x48ce(%rip),%ymm12 # 7944 <_sk_callback_avx+0x2b5> .byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,252,71,0,0 // vbroadcastss 0x47fc(%rip),%ymm12 # 7880 <_sk_callback_avx+0x2bc> + .byte 196,98,125,24,37,196,72,0,0 // vbroadcastss 0x48c4(%rip),%ymm12 # 7948 <_sk_callback_avx+0x2b9> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,242,71,0,0 // vbroadcastss 0x47f2(%rip),%ymm12 # 7884 <_sk_callback_avx+0x2c0> + .byte 196,98,125,24,37,186,72,0,0 // vbroadcastss 0x48ba(%rip),%ymm12 # 794c <_sk_callback_avx+0x2bd> .byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,227,71,0,0 // vbroadcastss 0x47e3(%rip),%ymm12 # 7888 <_sk_callback_avx+0x2c4> + .byte 196,98,125,24,37,171,72,0,0 // vbroadcastss 0x48ab(%rip),%ymm12 # 7950 <_sk_callback_avx+0x2c1> .byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,217,71,0,0 // vbroadcastss 0x47d9(%rip),%ymm12 # 788c <_sk_callback_avx+0x2c8> + .byte 196,98,125,24,37,161,72,0,0 // vbroadcastss 0x48a1(%rip),%ymm12 # 7954 <_sk_callback_avx+0x2c5> .byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0 .byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0 .byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0 .byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 - .byte 196,98,125,24,29,189,71,0,0 // vbroadcastss 0x47bd(%rip),%ymm11 # 7890 <_sk_callback_avx+0x2cc> + .byte 196,98,125,24,29,133,72,0,0 // vbroadcastss 0x4885(%rip),%ymm11 # 7958 <_sk_callback_avx+0x2c9> .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,179,71,0,0 // vbroadcastss 0x47b3(%rip),%ymm11 # 7894 <_sk_callback_avx+0x2d0> + .byte 196,98,125,24,29,123,72,0,0 // vbroadcastss 0x487b(%rip),%ymm11 # 795c <_sk_callback_avx+0x2cd> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,164,71,0,0 // vbroadcastss 0x47a4(%rip),%ymm11 # 7898 <_sk_callback_avx+0x2d4> + .byte 196,98,125,24,29,108,72,0,0 // vbroadcastss 0x486c(%rip),%ymm11 # 7960 <_sk_callback_avx+0x2d1> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,154,71,0,0 // vbroadcastss 0x479a(%rip),%ymm11 # 789c <_sk_callback_avx+0x2d8> + .byte 196,98,125,24,29,98,72,0,0 // vbroadcastss 0x4862(%rip),%ymm11 # 7964 <_sk_callback_avx+0x2d5> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0 - .byte 196,98,125,24,21,139,71,0,0 // vbroadcastss 0x478b(%rip),%ymm10 # 78a0 <_sk_callback_avx+0x2dc> + .byte 196,98,125,24,21,83,72,0,0 // vbroadcastss 0x4853(%rip),%ymm10 # 7968 <_sk_callback_avx+0x2d9> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -20323,7 +20487,7 @@ _sk_parametric_r_avx: .byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,98,71,0,0 // vbroadcastss 0x4762(%rip),%ymm8 # 78a4 <_sk_callback_avx+0x2e0> + .byte 196,98,125,24,5,42,72,0,0 // vbroadcastss 0x482a(%rip),%ymm8 # 796c <_sk_callback_avx+0x2dd> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -20345,36 +20509,36 @@ _sk_parametric_g_avx: .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11 - .byte 196,98,125,24,37,19,71,0,0 // vbroadcastss 0x4713(%rip),%ymm12 # 78a8 <_sk_callback_avx+0x2e4> + .byte 196,98,125,24,37,219,71,0,0 // vbroadcastss 0x47db(%rip),%ymm12 # 7970 <_sk_callback_avx+0x2e1> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,9,71,0,0 // vbroadcastss 0x4709(%rip),%ymm12 # 78ac <_sk_callback_avx+0x2e8> + .byte 196,98,125,24,37,209,71,0,0 // vbroadcastss 0x47d1(%rip),%ymm12 # 7974 <_sk_callback_avx+0x2e5> .byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,255,70,0,0 // vbroadcastss 0x46ff(%rip),%ymm12 # 78b0 <_sk_callback_avx+0x2ec> + .byte 196,98,125,24,37,199,71,0,0 // vbroadcastss 0x47c7(%rip),%ymm12 # 7978 <_sk_callback_avx+0x2e9> .byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,245,70,0,0 // vbroadcastss 0x46f5(%rip),%ymm12 # 78b4 <_sk_callback_avx+0x2f0> + .byte 196,98,125,24,37,189,71,0,0 // vbroadcastss 0x47bd(%rip),%ymm12 # 797c <_sk_callback_avx+0x2ed> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,235,70,0,0 // vbroadcastss 0x46eb(%rip),%ymm12 # 78b8 <_sk_callback_avx+0x2f4> + .byte 196,98,125,24,37,179,71,0,0 // vbroadcastss 0x47b3(%rip),%ymm12 # 7980 <_sk_callback_avx+0x2f1> .byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,220,70,0,0 // vbroadcastss 0x46dc(%rip),%ymm12 # 78bc <_sk_callback_avx+0x2f8> + .byte 196,98,125,24,37,164,71,0,0 // vbroadcastss 0x47a4(%rip),%ymm12 # 7984 <_sk_callback_avx+0x2f5> .byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,210,70,0,0 // vbroadcastss 0x46d2(%rip),%ymm12 # 78c0 <_sk_callback_avx+0x2fc> + .byte 196,98,125,24,37,154,71,0,0 // vbroadcastss 0x479a(%rip),%ymm12 # 7988 <_sk_callback_avx+0x2f9> .byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1 .byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1 .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1 .byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10 .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10 - .byte 196,98,125,24,29,182,70,0,0 // vbroadcastss 0x46b6(%rip),%ymm11 # 78c4 <_sk_callback_avx+0x300> + .byte 196,98,125,24,29,126,71,0,0 // vbroadcastss 0x477e(%rip),%ymm11 # 798c <_sk_callback_avx+0x2fd> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,172,70,0,0 // vbroadcastss 0x46ac(%rip),%ymm11 # 78c8 <_sk_callback_avx+0x304> + .byte 196,98,125,24,29,116,71,0,0 // vbroadcastss 0x4774(%rip),%ymm11 # 7990 <_sk_callback_avx+0x301> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,157,70,0,0 // vbroadcastss 0x469d(%rip),%ymm11 # 78cc <_sk_callback_avx+0x308> + .byte 196,98,125,24,29,101,71,0,0 // vbroadcastss 0x4765(%rip),%ymm11 # 7994 <_sk_callback_avx+0x305> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,147,70,0,0 // vbroadcastss 0x4693(%rip),%ymm11 # 78d0 <_sk_callback_avx+0x30c> + .byte 196,98,125,24,29,91,71,0,0 // vbroadcastss 0x475b(%rip),%ymm11 # 7998 <_sk_callback_avx+0x309> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1 - .byte 196,98,125,24,21,132,70,0,0 // vbroadcastss 0x4684(%rip),%ymm10 # 78d4 <_sk_callback_avx+0x310> + .byte 196,98,125,24,21,76,71,0,0 // vbroadcastss 0x474c(%rip),%ymm10 # 799c <_sk_callback_avx+0x30d> .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -20382,7 +20546,7 @@ _sk_parametric_g_avx: .byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,5,91,70,0,0 // vbroadcastss 0x465b(%rip),%ymm8 # 78d8 <_sk_callback_avx+0x314> + .byte 196,98,125,24,5,35,71,0,0 // vbroadcastss 0x4723(%rip),%ymm8 # 79a0 <_sk_callback_avx+0x311> .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -20404,36 +20568,36 @@ _sk_parametric_b_avx: .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11 - .byte 196,98,125,24,37,12,70,0,0 // vbroadcastss 0x460c(%rip),%ymm12 # 78dc <_sk_callback_avx+0x318> + .byte 196,98,125,24,37,212,70,0,0 // vbroadcastss 0x46d4(%rip),%ymm12 # 79a4 <_sk_callback_avx+0x315> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,2,70,0,0 // vbroadcastss 0x4602(%rip),%ymm12 # 78e0 <_sk_callback_avx+0x31c> + .byte 196,98,125,24,37,202,70,0,0 // vbroadcastss 0x46ca(%rip),%ymm12 # 79a8 <_sk_callback_avx+0x319> .byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,248,69,0,0 // vbroadcastss 0x45f8(%rip),%ymm12 # 78e4 <_sk_callback_avx+0x320> + .byte 196,98,125,24,37,192,70,0,0 // vbroadcastss 0x46c0(%rip),%ymm12 # 79ac <_sk_callback_avx+0x31d> .byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,238,69,0,0 // vbroadcastss 0x45ee(%rip),%ymm12 # 78e8 <_sk_callback_avx+0x324> + .byte 196,98,125,24,37,182,70,0,0 // vbroadcastss 0x46b6(%rip),%ymm12 # 79b0 <_sk_callback_avx+0x321> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,228,69,0,0 // vbroadcastss 0x45e4(%rip),%ymm12 # 78ec <_sk_callback_avx+0x328> + .byte 196,98,125,24,37,172,70,0,0 // vbroadcastss 0x46ac(%rip),%ymm12 # 79b4 <_sk_callback_avx+0x325> .byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,213,69,0,0 // vbroadcastss 0x45d5(%rip),%ymm12 # 78f0 <_sk_callback_avx+0x32c> + .byte 196,98,125,24,37,157,70,0,0 // vbroadcastss 0x469d(%rip),%ymm12 # 79b8 <_sk_callback_avx+0x329> .byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,203,69,0,0 // vbroadcastss 0x45cb(%rip),%ymm12 # 78f4 <_sk_callback_avx+0x330> + .byte 196,98,125,24,37,147,70,0,0 // vbroadcastss 0x4693(%rip),%ymm12 # 79bc <_sk_callback_avx+0x32d> .byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2 .byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10 .byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10 - .byte 196,98,125,24,29,175,69,0,0 // vbroadcastss 0x45af(%rip),%ymm11 # 78f8 <_sk_callback_avx+0x334> + .byte 196,98,125,24,29,119,70,0,0 // vbroadcastss 0x4677(%rip),%ymm11 # 79c0 <_sk_callback_avx+0x331> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,165,69,0,0 // vbroadcastss 0x45a5(%rip),%ymm11 # 78fc <_sk_callback_avx+0x338> + .byte 196,98,125,24,29,109,70,0,0 // vbroadcastss 0x466d(%rip),%ymm11 # 79c4 <_sk_callback_avx+0x335> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,150,69,0,0 // vbroadcastss 0x4596(%rip),%ymm11 # 7900 <_sk_callback_avx+0x33c> + .byte 196,98,125,24,29,94,70,0,0 // vbroadcastss 0x465e(%rip),%ymm11 # 79c8 <_sk_callback_avx+0x339> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,140,69,0,0 // vbroadcastss 0x458c(%rip),%ymm11 # 7904 <_sk_callback_avx+0x340> + .byte 196,98,125,24,29,84,70,0,0 // vbroadcastss 0x4654(%rip),%ymm11 # 79cc <_sk_callback_avx+0x33d> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2 - .byte 196,98,125,24,21,125,69,0,0 // vbroadcastss 0x457d(%rip),%ymm10 # 7908 <_sk_callback_avx+0x344> + .byte 196,98,125,24,21,69,70,0,0 // vbroadcastss 0x4645(%rip),%ymm10 # 79d0 <_sk_callback_avx+0x341> .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -20441,7 +20605,7 @@ _sk_parametric_b_avx: .byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,84,69,0,0 // vbroadcastss 0x4554(%rip),%ymm8 # 790c <_sk_callback_avx+0x348> + .byte 196,98,125,24,5,28,70,0,0 // vbroadcastss 0x461c(%rip),%ymm8 # 79d4 <_sk_callback_avx+0x345> .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -20463,36 +20627,36 @@ _sk_parametric_a_avx: .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11 - .byte 196,98,125,24,37,5,69,0,0 // vbroadcastss 0x4505(%rip),%ymm12 # 7910 <_sk_callback_avx+0x34c> + .byte 196,98,125,24,37,205,69,0,0 // vbroadcastss 0x45cd(%rip),%ymm12 # 79d8 <_sk_callback_avx+0x349> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,251,68,0,0 // vbroadcastss 0x44fb(%rip),%ymm12 # 7914 <_sk_callback_avx+0x350> + .byte 196,98,125,24,37,195,69,0,0 // vbroadcastss 0x45c3(%rip),%ymm12 # 79dc <_sk_callback_avx+0x34d> .byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,241,68,0,0 // vbroadcastss 0x44f1(%rip),%ymm12 # 7918 <_sk_callback_avx+0x354> + .byte 196,98,125,24,37,185,69,0,0 // vbroadcastss 0x45b9(%rip),%ymm12 # 79e0 <_sk_callback_avx+0x351> .byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,231,68,0,0 // vbroadcastss 0x44e7(%rip),%ymm12 # 791c <_sk_callback_avx+0x358> + .byte 196,98,125,24,37,175,69,0,0 // vbroadcastss 0x45af(%rip),%ymm12 # 79e4 <_sk_callback_avx+0x355> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,221,68,0,0 // vbroadcastss 0x44dd(%rip),%ymm12 # 7920 <_sk_callback_avx+0x35c> + .byte 196,98,125,24,37,165,69,0,0 // vbroadcastss 0x45a5(%rip),%ymm12 # 79e8 <_sk_callback_avx+0x359> .byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,206,68,0,0 // vbroadcastss 0x44ce(%rip),%ymm12 # 7924 <_sk_callback_avx+0x360> + .byte 196,98,125,24,37,150,69,0,0 // vbroadcastss 0x4596(%rip),%ymm12 # 79ec <_sk_callback_avx+0x35d> .byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,196,68,0,0 // vbroadcastss 0x44c4(%rip),%ymm12 # 7928 <_sk_callback_avx+0x364> + .byte 196,98,125,24,37,140,69,0,0 // vbroadcastss 0x458c(%rip),%ymm12 # 79f0 <_sk_callback_avx+0x361> .byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3 .byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3 .byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3 .byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10 .byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10 - .byte 196,98,125,24,29,168,68,0,0 // vbroadcastss 0x44a8(%rip),%ymm11 # 792c <_sk_callback_avx+0x368> + .byte 196,98,125,24,29,112,69,0,0 // vbroadcastss 0x4570(%rip),%ymm11 # 79f4 <_sk_callback_avx+0x365> .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,158,68,0,0 // vbroadcastss 0x449e(%rip),%ymm11 # 7930 <_sk_callback_avx+0x36c> + .byte 196,98,125,24,29,102,69,0,0 // vbroadcastss 0x4566(%rip),%ymm11 # 79f8 <_sk_callback_avx+0x369> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,143,68,0,0 // vbroadcastss 0x448f(%rip),%ymm11 # 7934 <_sk_callback_avx+0x370> + .byte 196,98,125,24,29,87,69,0,0 // vbroadcastss 0x4557(%rip),%ymm11 # 79fc <_sk_callback_avx+0x36d> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,133,68,0,0 // vbroadcastss 0x4485(%rip),%ymm11 # 7938 <_sk_callback_avx+0x374> + .byte 196,98,125,24,29,77,69,0,0 // vbroadcastss 0x454d(%rip),%ymm11 # 7a00 <_sk_callback_avx+0x371> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3 - .byte 196,98,125,24,21,118,68,0,0 // vbroadcastss 0x4476(%rip),%ymm10 # 793c <_sk_callback_avx+0x378> + .byte 196,98,125,24,21,62,69,0,0 // vbroadcastss 0x453e(%rip),%ymm10 # 7a04 <_sk_callback_avx+0x375> .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -20500,7 +20664,7 @@ _sk_parametric_a_avx: .byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3 - .byte 196,98,125,24,5,77,68,0,0 // vbroadcastss 0x444d(%rip),%ymm8 # 7940 <_sk_callback_avx+0x37c> + .byte 196,98,125,24,5,21,69,0,0 // vbroadcastss 0x4515(%rip),%ymm8 # 7a08 <_sk_callback_avx+0x379> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -20509,31 +20673,31 @@ HIDDEN _sk_lab_to_xyz_avx .globl _sk_lab_to_xyz_avx FUNCTION(_sk_lab_to_xyz_avx) _sk_lab_to_xyz_avx: - .byte 196,98,125,24,5,63,68,0,0 // vbroadcastss 0x443f(%rip),%ymm8 # 7944 <_sk_callback_avx+0x380> + .byte 196,98,125,24,5,7,69,0,0 // vbroadcastss 0x4507(%rip),%ymm8 # 7a0c <_sk_callback_avx+0x37d> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,53,68,0,0 // vbroadcastss 0x4435(%rip),%ymm8 # 7948 <_sk_callback_avx+0x384> + .byte 196,98,125,24,5,253,68,0,0 // vbroadcastss 0x44fd(%rip),%ymm8 # 7a10 <_sk_callback_avx+0x381> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,13,43,68,0,0 // vbroadcastss 0x442b(%rip),%ymm9 # 794c <_sk_callback_avx+0x388> + .byte 196,98,125,24,13,243,68,0,0 // vbroadcastss 0x44f3(%rip),%ymm9 # 7a14 <_sk_callback_avx+0x385> .byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2 - .byte 196,98,125,24,5,23,68,0,0 // vbroadcastss 0x4417(%rip),%ymm8 # 7950 <_sk_callback_avx+0x38c> + .byte 196,98,125,24,5,223,68,0,0 // vbroadcastss 0x44df(%rip),%ymm8 # 7a18 <_sk_callback_avx+0x389> .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,13,68,0,0 // vbroadcastss 0x440d(%rip),%ymm8 # 7954 <_sk_callback_avx+0x390> + .byte 196,98,125,24,5,213,68,0,0 // vbroadcastss 0x44d5(%rip),%ymm8 # 7a1c <_sk_callback_avx+0x38d> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,3,68,0,0 // vbroadcastss 0x4403(%rip),%ymm8 # 7958 <_sk_callback_avx+0x394> + .byte 196,98,125,24,5,203,68,0,0 // vbroadcastss 0x44cb(%rip),%ymm8 # 7a20 <_sk_callback_avx+0x391> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 .byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1 - .byte 196,98,125,24,5,245,67,0,0 // vbroadcastss 0x43f5(%rip),%ymm8 # 795c <_sk_callback_avx+0x398> + .byte 196,98,125,24,5,189,68,0,0 // vbroadcastss 0x44bd(%rip),%ymm8 # 7a24 <_sk_callback_avx+0x395> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2 .byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8 .byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8 - .byte 196,98,125,24,13,222,67,0,0 // vbroadcastss 0x43de(%rip),%ymm9 # 7960 <_sk_callback_avx+0x39c> + .byte 196,98,125,24,13,166,68,0,0 // vbroadcastss 0x44a6(%rip),%ymm9 # 7a28 <_sk_callback_avx+0x399> .byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10 - .byte 196,98,125,24,29,211,67,0,0 // vbroadcastss 0x43d3(%rip),%ymm11 # 7964 <_sk_callback_avx+0x3a0> + .byte 196,98,125,24,29,155,68,0,0 // vbroadcastss 0x449b(%rip),%ymm11 # 7a2c <_sk_callback_avx+0x39d> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,37,201,67,0,0 // vbroadcastss 0x43c9(%rip),%ymm12 # 7968 <_sk_callback_avx+0x3a4> + .byte 196,98,125,24,37,145,68,0,0 // vbroadcastss 0x4491(%rip),%ymm12 # 7a30 <_sk_callback_avx+0x3a1> .byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1 .byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8 .byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1 @@ -20548,9 +20712,9 @@ _sk_lab_to_xyz_avx: .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2 .byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2 - .byte 196,226,125,24,5,127,67,0,0 // vbroadcastss 0x437f(%rip),%ymm0 # 796c <_sk_callback_avx+0x3a8> + .byte 196,226,125,24,5,71,68,0,0 // vbroadcastss 0x4447(%rip),%ymm0 # 7a34 <_sk_callback_avx+0x3a5> .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,118,67,0,0 // vbroadcastss 0x4376(%rip),%ymm8 # 7970 <_sk_callback_avx+0x3ac> + .byte 196,98,125,24,5,62,68,0,0 // vbroadcastss 0x443e(%rip),%ymm8 # 7a38 <_sk_callback_avx+0x3a9> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -20564,13 +20728,13 @@ _sk_load_a8_avx: .byte 77,133,192 // test %r8,%r8 .byte 117,66 // jne 364f <_sk_load_a8_avx+0x4c> .byte 196,194,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm0 - .byte 197,249,219,5,69,70,0,0 // vpand 0x4645(%rip),%xmm0,%xmm0 # 7c60 <_sk_callback_avx+0x69c> + .byte 197,249,219,5,21,71,0,0 // vpand 0x4715(%rip),%xmm0,%xmm0 # 7d30 <_sk_callback_avx+0x6a1> .byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1 .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,57,67,0,0 // vbroadcastss 0x4339(%rip),%ymm1 # 7974 <_sk_callback_avx+0x3b0> + .byte 196,226,125,24,13,1,68,0,0 // vbroadcastss 0x4401(%rip),%ymm1 # 7a3c <_sk_callback_avx+0x3ad> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -20640,13 +20804,13 @@ _sk_load_a8_dst_avx: .byte 77,133,192 // test %r8,%r8 .byte 117,66 // jne 3750 <_sk_load_a8_dst_avx+0x4c> .byte 196,194,121,48,36,19 // vpmovzxbw (%r11,%rdx,1),%xmm4 - .byte 197,217,219,37,84,69,0,0 // vpand 0x4554(%rip),%xmm4,%xmm4 # 7c70 <_sk_callback_avx+0x6ac> + .byte 197,217,219,37,36,70,0,0 // vpand 0x4624(%rip),%xmm4,%xmm4 # 7d40 <_sk_callback_avx+0x6b1> .byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5 .byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5 .byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4 .byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,60,66,0,0 // vbroadcastss 0x423c(%rip),%ymm5 # 7978 <_sk_callback_avx+0x3b4> + .byte 196,226,125,24,45,4,67,0,0 // vbroadcastss 0x4304(%rip),%ymm5 # 7a40 <_sk_callback_avx+0x3b1> .byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 @@ -20694,7 +20858,7 @@ _sk_load_a8_dst_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 232,255,255,255,221 // callq ffffffffde0037f8 <_sk_callback_avx+0xffffffffddffc234> + .byte 232,255,255,255,221 // callq ffffffffde0037f8 <_sk_callback_avx+0xffffffffddffc169> .byte 255 // (bad) .byte 255 // (bad) .byte 255,210 // callq *%rdx @@ -20749,7 +20913,7 @@ _sk_gather_a8_avx: .byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,172,64,0,0 // vbroadcastss 0x40ac(%rip),%ymm1 # 797c <_sk_callback_avx+0x3b8> + .byte 196,226,125,24,13,116,65,0,0 // vbroadcastss 0x4174(%rip),%ymm1 # 7a44 <_sk_callback_avx+0x3b5> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -20763,7 +20927,7 @@ FUNCTION(_sk_store_a8_avx) _sk_store_a8_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 - .byte 196,98,125,24,5,142,64,0,0 // vbroadcastss 0x408e(%rip),%ymm8 # 7980 <_sk_callback_avx+0x3bc> + .byte 196,98,125,24,5,86,65,0,0 // vbroadcastss 0x4156(%rip),%ymm8 # 7a48 <_sk_callback_avx+0x3b9> .byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8 .byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8 .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 @@ -20788,13 +20952,13 @@ _sk_store_a8_avx: .byte 196,67,121,20,4,19,0 // vpextrb $0x0,%xmm8,(%r11,%rdx,1) .byte 235,202 // jmp 3917 <_sk_store_a8_avx+0x33> .byte 196,67,121,20,68,19,2,4 // vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1) - .byte 196,98,57,0,5,34,67,0,0 // vpshufb 0x4322(%rip),%xmm8,%xmm8 # 7c80 <_sk_callback_avx+0x6bc> + .byte 196,98,57,0,5,242,67,0,0 // vpshufb 0x43f2(%rip),%xmm8,%xmm8 # 7d50 <_sk_callback_avx+0x6c1> .byte 196,67,121,21,4,19,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,1) .byte 235,176 // jmp 3917 <_sk_store_a8_avx+0x33> .byte 196,67,121,20,68,19,6,12 // vpextrb $0xc,%xmm8,0x6(%r11,%rdx,1) .byte 196,67,121,20,68,19,5,10 // vpextrb $0xa,%xmm8,0x5(%r11,%rdx,1) .byte 196,67,121,20,68,19,4,8 // vpextrb $0x8,%xmm8,0x4(%r11,%rdx,1) - .byte 196,98,57,0,5,8,67,0,0 // vpshufb 0x4308(%rip),%xmm8,%xmm8 # 7c90 <_sk_callback_avx+0x6cc> + .byte 196,98,57,0,5,216,67,0,0 // vpshufb 0x43d8(%rip),%xmm8,%xmm8 # 7d60 <_sk_callback_avx+0x6d1> .byte 196,65,121,126,4,19 // vmovd %xmm8,(%r11,%rdx,1) .byte 235,135 // jmp 3917 <_sk_store_a8_avx+0x33> .byte 180,255 // mov $0xff,%ah @@ -20826,16 +20990,16 @@ _sk_load_g8_avx: .byte 77,133,192 // test %r8,%r8 .byte 117,71 // jne 39fd <_sk_load_g8_avx+0x51> .byte 196,194,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm0 - .byte 197,249,219,5,220,66,0,0 // vpand 0x42dc(%rip),%xmm0,%xmm0 # 7ca0 <_sk_callback_avx+0x6dc> + .byte 197,249,219,5,172,67,0,0 // vpand 0x43ac(%rip),%xmm0,%xmm0 # 7d70 <_sk_callback_avx+0x6e1> .byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1 .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,160,63,0,0 // vbroadcastss 0x3fa0(%rip),%ymm1 # 7984 <_sk_callback_avx+0x3c0> + .byte 196,226,125,24,13,104,64,0,0 // vbroadcastss 0x4068(%rip),%ymm1 # 7a4c <_sk_callback_avx+0x3bd> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,149,63,0,0 // vbroadcastss 0x3f95(%rip),%ymm3 # 7988 <_sk_callback_avx+0x3c4> + .byte 196,226,125,24,29,93,64,0,0 // vbroadcastss 0x405d(%rip),%ymm3 # 7a50 <_sk_callback_avx+0x3c1> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 255,224 // jmpq *%rax @@ -20880,7 +21044,7 @@ _sk_load_g8_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,222 // jmpq ffffffffdf003aa4 <_sk_callback_avx+0xffffffffdeffc4e0> + .byte 233,255,255,255,222 // jmpq ffffffffdf003aa4 <_sk_callback_avx+0xffffffffdeffc415> .byte 255 // (bad) .byte 255 // (bad) .byte 255,211 // callq *%rbx @@ -20900,16 +21064,16 @@ _sk_load_g8_dst_avx: .byte 77,133,192 // test %r8,%r8 .byte 117,71 // jne 3b01 <_sk_load_g8_dst_avx+0x51> .byte 196,194,121,48,36,19 // vpmovzxbw (%r11,%rdx,1),%xmm4 - .byte 197,217,219,37,232,65,0,0 // vpand 0x41e8(%rip),%xmm4,%xmm4 # 7cb0 <_sk_callback_avx+0x6ec> + .byte 197,217,219,37,184,66,0,0 // vpand 0x42b8(%rip),%xmm4,%xmm4 # 7d80 <_sk_callback_avx+0x6f1> .byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5 .byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5 .byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4 .byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,164,62,0,0 // vbroadcastss 0x3ea4(%rip),%ymm5 # 798c <_sk_callback_avx+0x3c8> + .byte 196,226,125,24,45,108,63,0,0 // vbroadcastss 0x3f6c(%rip),%ymm5 # 7a54 <_sk_callback_avx+0x3c5> .byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,61,153,62,0,0 // vbroadcastss 0x3e99(%rip),%ymm7 # 7990 <_sk_callback_avx+0x3cc> + .byte 196,226,125,24,61,97,63,0,0 // vbroadcastss 0x3f61(%rip),%ymm7 # 7a58 <_sk_callback_avx+0x3c9> .byte 197,252,40,236 // vmovaps %ymm4,%ymm5 .byte 197,252,40,244 // vmovaps %ymm4,%ymm6 .byte 255,224 // jmpq *%rax @@ -20954,7 +21118,7 @@ _sk_load_g8_dst_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,222 // jmpq ffffffffdf003ba8 <_sk_callback_avx+0xffffffffdeffc5e4> + .byte 233,255,255,255,222 // jmpq ffffffffdf003ba8 <_sk_callback_avx+0xffffffffdeffc519> .byte 255 // (bad) .byte 255 // (bad) .byte 255,211 // callq *%rbx @@ -21009,10 +21173,10 @@ _sk_gather_g8_avx: .byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,20,61,0,0 // vbroadcastss 0x3d14(%rip),%ymm1 # 7994 <_sk_callback_avx+0x3d0> + .byte 196,226,125,24,13,220,61,0,0 // vbroadcastss 0x3ddc(%rip),%ymm1 # 7a5c <_sk_callback_avx+0x3cd> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,9,61,0,0 // vbroadcastss 0x3d09(%rip),%ymm3 # 7998 <_sk_callback_avx+0x3d4> + .byte 196,226,125,24,29,209,61,0,0 // vbroadcastss 0x3dd1(%rip),%ymm3 # 7a60 <_sk_callback_avx+0x3d1> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 255,224 // jmpq *%rax @@ -21084,10 +21248,10 @@ _sk_gather_i8_avx: .byte 72,193,235,30 // shr $0x1e,%rbx .byte 196,195,121,34,28,27,3 // vpinsrd $0x3,(%r11,%rbx,1),%xmm0,%xmm3 .byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - .byte 197,124,40,21,248,63,0,0 // vmovaps 0x3ff8(%rip),%ymm10 # 7dc0 <_sk_callback_avx+0x7fc> + .byte 197,124,40,21,216,64,0,0 // vmovaps 0x40d8(%rip),%ymm10 # 7ea0 <_sk_callback_avx+0x811> .byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,194,59,0,0 // vbroadcastss 0x3bc2(%rip),%ymm9 # 799c <_sk_callback_avx+0x3d8> + .byte 196,98,125,24,13,138,60,0,0 // vbroadcastss 0x3c8a(%rip),%ymm9 # 7a64 <_sk_callback_avx+0x3d5> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1 .byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2 @@ -21123,23 +21287,23 @@ _sk_load_565_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - .byte 196,226,125,24,5,52,59,0,0 // vbroadcastss 0x3b34(%rip),%ymm0 # 79a0 <_sk_callback_avx+0x3dc> + .byte 196,226,125,24,5,252,59,0,0 // vbroadcastss 0x3bfc(%rip),%ymm0 # 7a68 <_sk_callback_avx+0x3d9> .byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,39,59,0,0 // vbroadcastss 0x3b27(%rip),%ymm1 # 79a4 <_sk_callback_avx+0x3e0> + .byte 196,226,125,24,13,239,59,0,0 // vbroadcastss 0x3bef(%rip),%ymm1 # 7a6c <_sk_callback_avx+0x3dd> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,30,59,0,0 // vbroadcastss 0x3b1e(%rip),%ymm1 # 79a8 <_sk_callback_avx+0x3e4> + .byte 196,226,125,24,13,230,59,0,0 // vbroadcastss 0x3be6(%rip),%ymm1 # 7a70 <_sk_callback_avx+0x3e1> .byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,17,59,0,0 // vbroadcastss 0x3b11(%rip),%ymm3 # 79ac <_sk_callback_avx+0x3e8> + .byte 196,226,125,24,29,217,59,0,0 // vbroadcastss 0x3bd9(%rip),%ymm3 # 7a74 <_sk_callback_avx+0x3e5> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,24,29,8,59,0,0 // vbroadcastss 0x3b08(%rip),%ymm3 # 79b0 <_sk_callback_avx+0x3ec> + .byte 196,226,125,24,29,208,59,0,0 // vbroadcastss 0x3bd0(%rip),%ymm3 # 7a78 <_sk_callback_avx+0x3e9> .byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,251,58,0,0 // vbroadcastss 0x3afb(%rip),%ymm3 # 79b4 <_sk_callback_avx+0x3f0> + .byte 196,226,125,24,29,195,59,0,0 // vbroadcastss 0x3bc3(%rip),%ymm3 # 7a7c <_sk_callback_avx+0x3ed> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,240,58,0,0 // vbroadcastss 0x3af0(%rip),%ymm3 # 79b8 <_sk_callback_avx+0x3f4> + .byte 196,226,125,24,29,184,59,0,0 // vbroadcastss 0x3bb8(%rip),%ymm3 # 7a80 <_sk_callback_avx+0x3f1> .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,7 // and $0x7,%r9b @@ -21200,23 +21364,23 @@ _sk_load_565_dst_avx: .byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5 .byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4 .byte 196,227,93,24,245,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm6 - .byte 196,226,125,24,37,32,58,0,0 // vbroadcastss 0x3a20(%rip),%ymm4 # 79bc <_sk_callback_avx+0x3f8> + .byte 196,226,125,24,37,232,58,0,0 // vbroadcastss 0x3ae8(%rip),%ymm4 # 7a84 <_sk_callback_avx+0x3f5> .byte 197,204,84,228 // vandps %ymm4,%ymm6,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,19,58,0,0 // vbroadcastss 0x3a13(%rip),%ymm5 # 79c0 <_sk_callback_avx+0x3fc> + .byte 196,226,125,24,45,219,58,0,0 // vbroadcastss 0x3adb(%rip),%ymm5 # 7a88 <_sk_callback_avx+0x3f9> .byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4 - .byte 196,226,125,24,45,10,58,0,0 // vbroadcastss 0x3a0a(%rip),%ymm5 # 79c4 <_sk_callback_avx+0x400> + .byte 196,226,125,24,45,210,58,0,0 // vbroadcastss 0x3ad2(%rip),%ymm5 # 7a8c <_sk_callback_avx+0x3fd> .byte 197,204,84,237 // vandps %ymm5,%ymm6,%ymm5 .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 - .byte 196,226,125,24,61,253,57,0,0 // vbroadcastss 0x39fd(%rip),%ymm7 # 79c8 <_sk_callback_avx+0x404> + .byte 196,226,125,24,61,197,58,0,0 // vbroadcastss 0x3ac5(%rip),%ymm7 # 7a90 <_sk_callback_avx+0x401> .byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5 - .byte 196,226,125,24,61,244,57,0,0 // vbroadcastss 0x39f4(%rip),%ymm7 # 79cc <_sk_callback_avx+0x408> + .byte 196,226,125,24,61,188,58,0,0 // vbroadcastss 0x3abc(%rip),%ymm7 # 7a94 <_sk_callback_avx+0x405> .byte 197,204,84,247 // vandps %ymm7,%ymm6,%ymm6 .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 - .byte 196,226,125,24,61,231,57,0,0 // vbroadcastss 0x39e7(%rip),%ymm7 # 79d0 <_sk_callback_avx+0x40c> + .byte 196,226,125,24,61,175,58,0,0 // vbroadcastss 0x3aaf(%rip),%ymm7 # 7a98 <_sk_callback_avx+0x409> .byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,61,220,57,0,0 // vbroadcastss 0x39dc(%rip),%ymm7 # 79d4 <_sk_callback_avx+0x410> + .byte 196,226,125,24,61,164,58,0,0 // vbroadcastss 0x3aa4(%rip),%ymm7 # 7a9c <_sk_callback_avx+0x40d> .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,7 // and $0x7,%r9b @@ -21312,23 +21476,23 @@ _sk_gather_565_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - .byte 196,226,125,24,5,106,56,0,0 // vbroadcastss 0x386a(%rip),%ymm0 # 79d8 <_sk_callback_avx+0x414> + .byte 196,226,125,24,5,50,57,0,0 // vbroadcastss 0x3932(%rip),%ymm0 # 7aa0 <_sk_callback_avx+0x411> .byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,93,56,0,0 // vbroadcastss 0x385d(%rip),%ymm1 # 79dc <_sk_callback_avx+0x418> + .byte 196,226,125,24,13,37,57,0,0 // vbroadcastss 0x3925(%rip),%ymm1 # 7aa4 <_sk_callback_avx+0x415> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,84,56,0,0 // vbroadcastss 0x3854(%rip),%ymm1 # 79e0 <_sk_callback_avx+0x41c> + .byte 196,226,125,24,13,28,57,0,0 // vbroadcastss 0x391c(%rip),%ymm1 # 7aa8 <_sk_callback_avx+0x419> .byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,71,56,0,0 // vbroadcastss 0x3847(%rip),%ymm3 # 79e4 <_sk_callback_avx+0x420> + .byte 196,226,125,24,29,15,57,0,0 // vbroadcastss 0x390f(%rip),%ymm3 # 7aac <_sk_callback_avx+0x41d> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,24,29,62,56,0,0 // vbroadcastss 0x383e(%rip),%ymm3 # 79e8 <_sk_callback_avx+0x424> + .byte 196,226,125,24,29,6,57,0,0 // vbroadcastss 0x3906(%rip),%ymm3 # 7ab0 <_sk_callback_avx+0x421> .byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,49,56,0,0 // vbroadcastss 0x3831(%rip),%ymm3 # 79ec <_sk_callback_avx+0x428> + .byte 196,226,125,24,29,249,56,0,0 // vbroadcastss 0x38f9(%rip),%ymm3 # 7ab4 <_sk_callback_avx+0x425> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,38,56,0,0 // vbroadcastss 0x3826(%rip),%ymm3 # 79f0 <_sk_callback_avx+0x42c> + .byte 196,226,125,24,29,238,56,0,0 // vbroadcastss 0x38ee(%rip),%ymm3 # 7ab8 <_sk_callback_avx+0x429> .byte 255,224 // jmpq *%rax HIDDEN _sk_store_565_avx @@ -21337,14 +21501,14 @@ FUNCTION(_sk_store_565_avx) _sk_store_565_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 - .byte 196,98,125,24,5,26,56,0,0 // vbroadcastss 0x381a(%rip),%ymm8 # 79f4 <_sk_callback_avx+0x430> + .byte 196,98,125,24,5,226,56,0,0 // vbroadcastss 0x38e2(%rip),%ymm8 # 7abc <_sk_callback_avx+0x42d> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10 .byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9 .byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9 .byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 - .byte 196,98,125,24,21,243,55,0,0 // vbroadcastss 0x37f3(%rip),%ymm10 # 79f8 <_sk_callback_avx+0x434> + .byte 196,98,125,24,21,187,56,0,0 // vbroadcastss 0x38bb(%rip),%ymm10 # 7ac0 <_sk_callback_avx+0x431> .byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10 .byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10 .byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11 @@ -21418,25 +21582,25 @@ _sk_load_4444_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - .byte 196,226,125,24,5,252,54,0,0 // vbroadcastss 0x36fc(%rip),%ymm0 # 79fc <_sk_callback_avx+0x438> + .byte 196,226,125,24,5,196,55,0,0 // vbroadcastss 0x37c4(%rip),%ymm0 # 7ac4 <_sk_callback_avx+0x435> .byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,239,54,0,0 // vbroadcastss 0x36ef(%rip),%ymm1 # 7a00 <_sk_callback_avx+0x43c> + .byte 196,226,125,24,13,183,55,0,0 // vbroadcastss 0x37b7(%rip),%ymm1 # 7ac8 <_sk_callback_avx+0x439> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,230,54,0,0 // vbroadcastss 0x36e6(%rip),%ymm1 # 7a04 <_sk_callback_avx+0x440> + .byte 196,226,125,24,13,174,55,0,0 // vbroadcastss 0x37ae(%rip),%ymm1 # 7acc <_sk_callback_avx+0x43d> .byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,217,54,0,0 // vbroadcastss 0x36d9(%rip),%ymm2 # 7a08 <_sk_callback_avx+0x444> + .byte 196,226,125,24,21,161,55,0,0 // vbroadcastss 0x37a1(%rip),%ymm2 # 7ad0 <_sk_callback_avx+0x441> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,208,54,0,0 // vbroadcastss 0x36d0(%rip),%ymm2 # 7a0c <_sk_callback_avx+0x448> + .byte 196,226,125,24,21,152,55,0,0 // vbroadcastss 0x3798(%rip),%ymm2 # 7ad4 <_sk_callback_avx+0x445> .byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,195,54,0,0 // vbroadcastss 0x36c3(%rip),%ymm8 # 7a10 <_sk_callback_avx+0x44c> + .byte 196,98,125,24,5,139,55,0,0 // vbroadcastss 0x378b(%rip),%ymm8 # 7ad8 <_sk_callback_avx+0x449> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,185,54,0,0 // vbroadcastss 0x36b9(%rip),%ymm8 # 7a14 <_sk_callback_avx+0x450> + .byte 196,98,125,24,5,129,55,0,0 // vbroadcastss 0x3781(%rip),%ymm8 # 7adc <_sk_callback_avx+0x44d> .byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,171,54,0,0 // vbroadcastss 0x36ab(%rip),%ymm8 # 7a18 <_sk_callback_avx+0x454> + .byte 196,98,125,24,5,115,55,0,0 // vbroadcastss 0x3773(%rip),%ymm8 # 7ae0 <_sk_callback_avx+0x451> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -21499,25 +21663,25 @@ _sk_load_4444_dst_avx: .byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5 .byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4 .byte 196,227,93,24,253,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm7 - .byte 196,226,125,24,37,212,53,0,0 // vbroadcastss 0x35d4(%rip),%ymm4 # 7a1c <_sk_callback_avx+0x458> + .byte 196,226,125,24,37,156,54,0,0 // vbroadcastss 0x369c(%rip),%ymm4 # 7ae4 <_sk_callback_avx+0x455> .byte 197,196,84,228 // vandps %ymm4,%ymm7,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,125,24,45,199,53,0,0 // vbroadcastss 0x35c7(%rip),%ymm5 # 7a20 <_sk_callback_avx+0x45c> + .byte 196,226,125,24,45,143,54,0,0 // vbroadcastss 0x368f(%rip),%ymm5 # 7ae8 <_sk_callback_avx+0x459> .byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4 - .byte 196,226,125,24,45,190,53,0,0 // vbroadcastss 0x35be(%rip),%ymm5 # 7a24 <_sk_callback_avx+0x460> + .byte 196,226,125,24,45,134,54,0,0 // vbroadcastss 0x3686(%rip),%ymm5 # 7aec <_sk_callback_avx+0x45d> .byte 197,196,84,237 // vandps %ymm5,%ymm7,%ymm5 .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 - .byte 196,226,125,24,53,177,53,0,0 // vbroadcastss 0x35b1(%rip),%ymm6 # 7a28 <_sk_callback_avx+0x464> + .byte 196,226,125,24,53,121,54,0,0 // vbroadcastss 0x3679(%rip),%ymm6 # 7af0 <_sk_callback_avx+0x461> .byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5 - .byte 196,226,125,24,53,168,53,0,0 // vbroadcastss 0x35a8(%rip),%ymm6 # 7a2c <_sk_callback_avx+0x468> + .byte 196,226,125,24,53,112,54,0,0 // vbroadcastss 0x3670(%rip),%ymm6 # 7af4 <_sk_callback_avx+0x465> .byte 197,196,84,246 // vandps %ymm6,%ymm7,%ymm6 .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 - .byte 196,98,125,24,5,155,53,0,0 // vbroadcastss 0x359b(%rip),%ymm8 # 7a30 <_sk_callback_avx+0x46c> + .byte 196,98,125,24,5,99,54,0,0 // vbroadcastss 0x3663(%rip),%ymm8 # 7af8 <_sk_callback_avx+0x469> .byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6 - .byte 196,98,125,24,5,145,53,0,0 // vbroadcastss 0x3591(%rip),%ymm8 # 7a34 <_sk_callback_avx+0x470> + .byte 196,98,125,24,5,89,54,0,0 // vbroadcastss 0x3659(%rip),%ymm8 # 7afc <_sk_callback_avx+0x46d> .byte 196,193,68,84,248 // vandps %ymm8,%ymm7,%ymm7 .byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7 - .byte 196,98,125,24,5,131,53,0,0 // vbroadcastss 0x3583(%rip),%ymm8 # 7a38 <_sk_callback_avx+0x474> + .byte 196,98,125,24,5,75,54,0,0 // vbroadcastss 0x364b(%rip),%ymm8 # 7b00 <_sk_callback_avx+0x471> .byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -21615,25 +21779,25 @@ _sk_gather_4444_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - .byte 196,226,125,24,5,10,52,0,0 // vbroadcastss 0x340a(%rip),%ymm0 # 7a3c <_sk_callback_avx+0x478> + .byte 196,226,125,24,5,210,52,0,0 // vbroadcastss 0x34d2(%rip),%ymm0 # 7b04 <_sk_callback_avx+0x475> .byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,253,51,0,0 // vbroadcastss 0x33fd(%rip),%ymm1 # 7a40 <_sk_callback_avx+0x47c> + .byte 196,226,125,24,13,197,52,0,0 // vbroadcastss 0x34c5(%rip),%ymm1 # 7b08 <_sk_callback_avx+0x479> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,244,51,0,0 // vbroadcastss 0x33f4(%rip),%ymm1 # 7a44 <_sk_callback_avx+0x480> + .byte 196,226,125,24,13,188,52,0,0 // vbroadcastss 0x34bc(%rip),%ymm1 # 7b0c <_sk_callback_avx+0x47d> .byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,231,51,0,0 // vbroadcastss 0x33e7(%rip),%ymm2 # 7a48 <_sk_callback_avx+0x484> + .byte 196,226,125,24,21,175,52,0,0 // vbroadcastss 0x34af(%rip),%ymm2 # 7b10 <_sk_callback_avx+0x481> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,222,51,0,0 // vbroadcastss 0x33de(%rip),%ymm2 # 7a4c <_sk_callback_avx+0x488> + .byte 196,226,125,24,21,166,52,0,0 // vbroadcastss 0x34a6(%rip),%ymm2 # 7b14 <_sk_callback_avx+0x485> .byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,209,51,0,0 // vbroadcastss 0x33d1(%rip),%ymm8 # 7a50 <_sk_callback_avx+0x48c> + .byte 196,98,125,24,5,153,52,0,0 // vbroadcastss 0x3499(%rip),%ymm8 # 7b18 <_sk_callback_avx+0x489> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,199,51,0,0 // vbroadcastss 0x33c7(%rip),%ymm8 # 7a54 <_sk_callback_avx+0x490> + .byte 196,98,125,24,5,143,52,0,0 // vbroadcastss 0x348f(%rip),%ymm8 # 7b1c <_sk_callback_avx+0x48d> .byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,185,51,0,0 // vbroadcastss 0x33b9(%rip),%ymm8 # 7a58 <_sk_callback_avx+0x494> + .byte 196,98,125,24,5,129,52,0,0 // vbroadcastss 0x3481(%rip),%ymm8 # 7b20 <_sk_callback_avx+0x491> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -21644,7 +21808,7 @@ FUNCTION(_sk_store_4444_avx) _sk_store_4444_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 - .byte 196,98,125,24,5,166,51,0,0 // vbroadcastss 0x33a6(%rip),%ymm8 # 7a5c <_sk_callback_avx+0x498> + .byte 196,98,125,24,5,110,52,0,0 // vbroadcastss 0x346e(%rip),%ymm8 # 7b24 <_sk_callback_avx+0x495> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10 @@ -21712,7 +21876,7 @@ _sk_store_4444_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 232,255,255,255,224 // callq ffffffffe10047c4 <_sk_callback_avx+0xffffffffe0ffd200> + .byte 232,255,255,255,224 // callq ffffffffe10047c4 <_sk_callback_avx+0xffffffffe0ffd135> .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -21728,10 +21892,10 @@ _sk_load_8888_avx: .byte 77,133,192 // test %r8,%r8 .byte 15,133,137,0,0,0 // jne 486a <_sk_load_8888_avx+0xa2> .byte 196,193,124,16,26 // vmovups (%r10),%ymm3 - .byte 197,124,40,21,242,53,0,0 // vmovaps 0x35f2(%rip),%ymm10 # 7de0 <_sk_callback_avx+0x81c> + .byte 197,124,40,21,210,54,0,0 // vmovaps 0x36d2(%rip),%ymm10 # 7ec0 <_sk_callback_avx+0x831> .byte 196,193,100,84,194 // vandps %ymm10,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,96,50,0,0 // vbroadcastss 0x3260(%rip),%ymm8 # 7a60 <_sk_callback_avx+0x49c> + .byte 196,98,125,24,5,40,51,0,0 // vbroadcastss 0x3328(%rip),%ymm8 # 7b28 <_sk_callback_avx+0x499> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1 .byte 196,195,125,25,217,1 // vextractf128 $0x1,%ymm3,%xmm9 @@ -21761,9 +21925,9 @@ _sk_load_8888_avx: .byte 72,211,232 // shr %cl,%rax .byte 196,225,249,110,192 // vmovq %rax,%xmm0 .byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0 - .byte 196,226,121,0,13,46,52,0,0 // vpshufb 0x342e(%rip),%xmm0,%xmm1 # 7cc0 <_sk_callback_avx+0x6fc> + .byte 196,226,121,0,13,254,52,0,0 // vpshufb 0x34fe(%rip),%xmm0,%xmm1 # 7d90 <_sk_callback_avx+0x701> .byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1 - .byte 196,226,121,0,5,48,52,0,0 // vpshufb 0x3430(%rip),%xmm0,%xmm0 # 7cd0 <_sk_callback_avx+0x70c> + .byte 196,226,121,0,5,0,53,0,0 // vpshufb 0x3500(%rip),%xmm0,%xmm0 # 7da0 <_sk_callback_avx+0x711> .byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 196,194,125,44,26 // vmaskmovps (%r10),%ymm0,%ymm3 @@ -21780,10 +21944,10 @@ _sk_load_8888_dst_avx: .byte 77,133,192 // test %r8,%r8 .byte 15,133,137,0,0,0 // jne 4957 <_sk_load_8888_dst_avx+0xa2> .byte 196,193,124,16,58 // vmovups (%r10),%ymm7 - .byte 197,124,40,21,37,53,0,0 // vmovaps 0x3525(%rip),%ymm10 # 7e00 <_sk_callback_avx+0x83c> + .byte 197,124,40,21,5,54,0,0 // vmovaps 0x3605(%rip),%ymm10 # 7ee0 <_sk_callback_avx+0x851> .byte 196,193,68,84,226 // vandps %ymm10,%ymm7,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,98,125,24,5,119,49,0,0 // vbroadcastss 0x3177(%rip),%ymm8 # 7a64 <_sk_callback_avx+0x4a0> + .byte 196,98,125,24,5,63,50,0,0 // vbroadcastss 0x323f(%rip),%ymm8 # 7b2c <_sk_callback_avx+0x49d> .byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4 .byte 197,209,114,215,8 // vpsrld $0x8,%xmm7,%xmm5 .byte 196,195,125,25,249,1 // vextractf128 $0x1,%ymm7,%xmm9 @@ -21813,9 +21977,9 @@ _sk_load_8888_dst_avx: .byte 72,211,232 // shr %cl,%rax .byte 196,225,249,110,224 // vmovq %rax,%xmm4 .byte 196,226,121,48,228 // vpmovzxbw %xmm4,%xmm4 - .byte 196,226,89,0,45,97,51,0,0 // vpshufb 0x3361(%rip),%xmm4,%xmm5 # 7ce0 <_sk_callback_avx+0x71c> + .byte 196,226,89,0,45,49,52,0,0 // vpshufb 0x3431(%rip),%xmm4,%xmm5 # 7db0 <_sk_callback_avx+0x721> .byte 196,226,121,33,237 // vpmovsxbd %xmm5,%xmm5 - .byte 196,226,89,0,37,99,51,0,0 // vpshufb 0x3363(%rip),%xmm4,%xmm4 # 7cf0 <_sk_callback_avx+0x72c> + .byte 196,226,89,0,37,51,52,0,0 // vpshufb 0x3433(%rip),%xmm4,%xmm4 # 7dc0 <_sk_callback_avx+0x731> .byte 196,226,121,33,228 // vpmovsxbd %xmm4,%xmm4 .byte 196,227,85,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm4 .byte 196,194,93,44,58 // vmaskmovps (%r10),%ymm4,%ymm7 @@ -21858,10 +22022,10 @@ _sk_gather_8888_avx: .byte 73,193,234,32 // shr $0x20,%r10 .byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3 .byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - .byte 197,124,40,21,211,51,0,0 // vmovaps 0x33d3(%rip),%ymm10 # 7e20 <_sk_callback_avx+0x85c> + .byte 197,124,40,21,179,52,0,0 // vmovaps 0x34b3(%rip),%ymm10 # 7f00 <_sk_callback_avx+0x871> .byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,9,48,0,0 // vbroadcastss 0x3009(%rip),%ymm9 # 7a68 <_sk_callback_avx+0x4a4> + .byte 196,98,125,24,13,209,48,0,0 // vbroadcastss 0x30d1(%rip),%ymm9 # 7b30 <_sk_callback_avx+0x4a1> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1 .byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2 @@ -21891,7 +22055,7 @@ _sk_store_8888_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 76,3,16 // add (%rax),%r10 - .byte 196,98,125,24,5,147,47,0,0 // vbroadcastss 0x2f93(%rip),%ymm8 # 7a6c <_sk_callback_avx+0x4a8> + .byte 196,98,125,24,5,91,48,0,0 // vbroadcastss 0x305b(%rip),%ymm8 # 7b34 <_sk_callback_avx+0x4a5> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10 @@ -21928,9 +22092,9 @@ _sk_store_8888_avx: .byte 72,211,232 // shr %cl,%rax .byte 196,97,249,110,200 // vmovq %rax,%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 - .byte 196,98,49,0,21,111,49,0,0 // vpshufb 0x316f(%rip),%xmm9,%xmm10 # 7d00 <_sk_callback_avx+0x73c> + .byte 196,98,49,0,21,63,50,0,0 // vpshufb 0x323f(%rip),%xmm9,%xmm10 # 7dd0 <_sk_callback_avx+0x741> .byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10 - .byte 196,98,49,0,13,113,49,0,0 // vpshufb 0x3171(%rip),%xmm9,%xmm9 # 7d10 <_sk_callback_avx+0x74c> + .byte 196,98,49,0,13,65,50,0,0 // vpshufb 0x3241(%rip),%xmm9,%xmm9 # 7de0 <_sk_callback_avx+0x751> .byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9 .byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 .byte 196,66,53,46,2 // vmaskmovps %ymm8,%ymm9,(%r10) @@ -21947,10 +22111,10 @@ _sk_load_bgra_avx: .byte 77,133,192 // test %r8,%r8 .byte 15,133,137,0,0,0 // jne 4c53 <_sk_load_bgra_avx+0xa2> .byte 196,193,124,16,26 // vmovups (%r10),%ymm3 - .byte 197,124,40,21,105,50,0,0 // vmovaps 0x3269(%rip),%ymm10 # 7e40 <_sk_callback_avx+0x87c> + .byte 197,124,40,21,73,51,0,0 // vmovaps 0x3349(%rip),%ymm10 # 7f20 <_sk_callback_avx+0x891> .byte 196,193,100,84,202 // vandps %ymm10,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,98,125,24,5,135,46,0,0 // vbroadcastss 0x2e87(%rip),%ymm8 # 7a70 <_sk_callback_avx+0x4ac> + .byte 196,98,125,24,5,79,47,0,0 // vbroadcastss 0x2f4f(%rip),%ymm8 # 7b38 <_sk_callback_avx+0x4a9> .byte 196,193,116,89,208 // vmulps %ymm8,%ymm1,%ymm2 .byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1 .byte 196,195,125,25,217,1 // vextractf128 $0x1,%ymm3,%xmm9 @@ -21980,9 +22144,9 @@ _sk_load_bgra_avx: .byte 72,211,232 // shr %cl,%rax .byte 196,225,249,110,192 // vmovq %rax,%xmm0 .byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0 - .byte 196,226,121,0,13,165,48,0,0 // vpshufb 0x30a5(%rip),%xmm0,%xmm1 # 7d20 <_sk_callback_avx+0x75c> + .byte 196,226,121,0,13,117,49,0,0 // vpshufb 0x3175(%rip),%xmm0,%xmm1 # 7df0 <_sk_callback_avx+0x761> .byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1 - .byte 196,226,121,0,5,167,48,0,0 // vpshufb 0x30a7(%rip),%xmm0,%xmm0 # 7d30 <_sk_callback_avx+0x76c> + .byte 196,226,121,0,5,119,49,0,0 // vpshufb 0x3177(%rip),%xmm0,%xmm0 # 7e00 <_sk_callback_avx+0x771> .byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 196,194,125,44,26 // vmaskmovps (%r10),%ymm0,%ymm3 @@ -21999,10 +22163,10 @@ _sk_load_bgra_dst_avx: .byte 77,133,192 // test %r8,%r8 .byte 15,133,137,0,0,0 // jne 4d40 <_sk_load_bgra_dst_avx+0xa2> .byte 196,193,124,16,58 // vmovups (%r10),%ymm7 - .byte 197,124,40,21,156,49,0,0 // vmovaps 0x319c(%rip),%ymm10 # 7e60 <_sk_callback_avx+0x89c> + .byte 197,124,40,21,124,50,0,0 // vmovaps 0x327c(%rip),%ymm10 # 7f40 <_sk_callback_avx+0x8b1> .byte 196,193,68,84,234 // vandps %ymm10,%ymm7,%ymm5 .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 - .byte 196,98,125,24,5,158,45,0,0 // vbroadcastss 0x2d9e(%rip),%ymm8 # 7a74 <_sk_callback_avx+0x4b0> + .byte 196,98,125,24,5,102,46,0,0 // vbroadcastss 0x2e66(%rip),%ymm8 # 7b3c <_sk_callback_avx+0x4ad> .byte 196,193,84,89,240 // vmulps %ymm8,%ymm5,%ymm6 .byte 197,209,114,215,8 // vpsrld $0x8,%xmm7,%xmm5 .byte 196,195,125,25,249,1 // vextractf128 $0x1,%ymm7,%xmm9 @@ -22032,9 +22196,9 @@ _sk_load_bgra_dst_avx: .byte 72,211,232 // shr %cl,%rax .byte 196,225,249,110,224 // vmovq %rax,%xmm4 .byte 196,226,121,48,228 // vpmovzxbw %xmm4,%xmm4 - .byte 196,226,89,0,45,216,47,0,0 // vpshufb 0x2fd8(%rip),%xmm4,%xmm5 # 7d40 <_sk_callback_avx+0x77c> + .byte 196,226,89,0,45,168,48,0,0 // vpshufb 0x30a8(%rip),%xmm4,%xmm5 # 7e10 <_sk_callback_avx+0x781> .byte 196,226,121,33,237 // vpmovsxbd %xmm5,%xmm5 - .byte 196,226,89,0,37,218,47,0,0 // vpshufb 0x2fda(%rip),%xmm4,%xmm4 # 7d50 <_sk_callback_avx+0x78c> + .byte 196,226,89,0,37,170,48,0,0 // vpshufb 0x30aa(%rip),%xmm4,%xmm4 # 7e20 <_sk_callback_avx+0x791> .byte 196,226,121,33,228 // vpmovsxbd %xmm4,%xmm4 .byte 196,227,85,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm4 .byte 196,194,93,44,58 // vmaskmovps (%r10),%ymm4,%ymm7 @@ -22077,10 +22241,10 @@ _sk_gather_bgra_avx: .byte 73,193,234,32 // shr $0x20,%r10 .byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3 .byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - .byte 197,124,40,13,74,48,0,0 // vmovaps 0x304a(%rip),%ymm9 # 7e80 <_sk_callback_avx+0x8bc> + .byte 197,124,40,13,42,49,0,0 // vmovaps 0x312a(%rip),%ymm9 # 7f60 <_sk_callback_avx+0x8d1> .byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,21,48,44,0,0 // vbroadcastss 0x2c30(%rip),%ymm10 # 7a78 <_sk_callback_avx+0x4b4> + .byte 196,98,125,24,21,248,44,0,0 // vbroadcastss 0x2cf8(%rip),%ymm10 # 7b40 <_sk_callback_avx+0x4b1> .byte 196,193,124,89,210 // vmulps %ymm10,%ymm0,%ymm2 .byte 196,193,121,114,208,8 // vpsrld $0x8,%xmm8,%xmm0 .byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1 @@ -22110,7 +22274,7 @@ _sk_store_bgra_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 76,3,16 // add (%rax),%r10 - .byte 196,98,125,24,5,186,43,0,0 // vbroadcastss 0x2bba(%rip),%ymm8 # 7a7c <_sk_callback_avx+0x4b8> + .byte 196,98,125,24,5,130,44,0,0 // vbroadcastss 0x2c82(%rip),%ymm8 # 7b44 <_sk_callback_avx+0x4b5> .byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10 @@ -22147,9 +22311,9 @@ _sk_store_bgra_avx: .byte 72,211,232 // shr %cl,%rax .byte 196,97,249,110,200 // vmovq %rax,%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 - .byte 196,98,49,0,21,230,45,0,0 // vpshufb 0x2de6(%rip),%xmm9,%xmm10 # 7d60 <_sk_callback_avx+0x79c> + .byte 196,98,49,0,21,182,46,0,0 // vpshufb 0x2eb6(%rip),%xmm9,%xmm10 # 7e30 <_sk_callback_avx+0x7a1> .byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10 - .byte 196,98,49,0,13,232,45,0,0 // vpshufb 0x2de8(%rip),%xmm9,%xmm9 # 7d70 <_sk_callback_avx+0x7ac> + .byte 196,98,49,0,13,184,46,0,0 // vpshufb 0x2eb8(%rip),%xmm9,%xmm9 # 7e40 <_sk_callback_avx+0x7b1> .byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9 .byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 .byte 196,66,53,46,2 // vmaskmovps %ymm8,%ymm9,(%r10) @@ -22185,13 +22349,13 @@ _sk_load_f16_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 - .byte 196,98,125,24,37,99,42,0,0 // vbroadcastss 0x2a63(%rip),%ymm12 # 7a80 <_sk_callback_avx+0x4bc> + .byte 196,98,125,24,37,43,43,0,0 // vbroadcastss 0x2b2b(%rip),%ymm12 # 7b48 <_sk_callback_avx+0x4b9> .byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1 .byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0 .byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14 - .byte 196,98,121,24,29,79,42,0,0 // vbroadcastss 0x2a4f(%rip),%xmm11 # 7a84 <_sk_callback_avx+0x4c0> + .byte 196,98,121,24,29,23,43,0,0 // vbroadcastss 0x2b17(%rip),%xmm11 # 7b4c <_sk_callback_avx+0x4bd> .byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3 - .byte 196,98,121,24,45,69,42,0,0 // vbroadcastss 0x2a45(%rip),%xmm13 # 7a88 <_sk_callback_avx+0x4c4> + .byte 196,98,121,24,45,13,43,0,0 // vbroadcastss 0x2b0d(%rip),%xmm13 # 7b50 <_sk_callback_avx+0x4c1> .byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3 .byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10 .byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -22205,7 +22369,7 @@ _sk_load_f16_avx: .byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 .byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0 .byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1 - .byte 196,226,121,24,29,251,41,0,0 // vbroadcastss 0x29fb(%rip),%xmm3 # 7a8c <_sk_callback_avx+0x4c8> + .byte 196,226,121,24,29,195,42,0,0 // vbroadcastss 0x2ac3(%rip),%xmm3 # 7b54 <_sk_callback_avx+0x4c5> .byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1 .byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 @@ -22352,13 +22516,13 @@ _sk_load_f16_dst_avx: .byte 197,217,105,232 // vpunpckhwd %xmm0,%xmm4,%xmm5 .byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4 .byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 - .byte 196,98,125,24,37,71,39,0,0 // vbroadcastss 0x2747(%rip),%ymm12 # 7a90 <_sk_callback_avx+0x4cc> + .byte 196,98,125,24,37,15,40,0,0 // vbroadcastss 0x280f(%rip),%ymm12 # 7b58 <_sk_callback_avx+0x4c9> .byte 196,193,92,84,236 // vandps %ymm12,%ymm4,%ymm5 .byte 197,220,87,229 // vxorps %ymm5,%ymm4,%ymm4 .byte 196,195,125,25,230,1 // vextractf128 $0x1,%ymm4,%xmm14 - .byte 196,98,121,24,29,51,39,0,0 // vbroadcastss 0x2733(%rip),%xmm11 # 7a94 <_sk_callback_avx+0x4d0> + .byte 196,98,121,24,29,251,39,0,0 // vbroadcastss 0x27fb(%rip),%xmm11 # 7b5c <_sk_callback_avx+0x4cd> .byte 196,193,8,87,251 // vxorps %xmm11,%xmm14,%xmm7 - .byte 196,98,121,24,45,41,39,0,0 // vbroadcastss 0x2729(%rip),%xmm13 # 7a98 <_sk_callback_avx+0x4d4> + .byte 196,98,121,24,45,241,39,0,0 // vbroadcastss 0x27f1(%rip),%xmm13 # 7b60 <_sk_callback_avx+0x4d1> .byte 197,145,102,255 // vpcmpgtd %xmm7,%xmm13,%xmm7 .byte 196,65,88,87,211 // vxorps %xmm11,%xmm4,%xmm10 .byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -22372,7 +22536,7 @@ _sk_load_f16_dst_avx: .byte 196,227,93,24,231,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm4 .byte 197,220,86,229 // vorps %ymm5,%ymm4,%ymm4 .byte 196,227,125,25,229,1 // vextractf128 $0x1,%ymm4,%xmm5 - .byte 196,226,121,24,61,223,38,0,0 // vbroadcastss 0x26df(%rip),%xmm7 # 7a9c <_sk_callback_avx+0x4d8> + .byte 196,226,121,24,61,167,39,0,0 // vbroadcastss 0x27a7(%rip),%xmm7 # 7b64 <_sk_callback_avx+0x4d5> .byte 197,209,254,239 // vpaddd %xmm7,%xmm5,%xmm5 .byte 197,217,254,231 // vpaddd %xmm7,%xmm4,%xmm4 .byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 @@ -22548,13 +22712,13 @@ _sk_gather_f16_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 - .byte 196,98,125,24,37,164,35,0,0 // vbroadcastss 0x23a4(%rip),%ymm12 # 7aa0 <_sk_callback_avx+0x4dc> + .byte 196,98,125,24,37,108,36,0,0 // vbroadcastss 0x246c(%rip),%ymm12 # 7b68 <_sk_callback_avx+0x4d9> .byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1 .byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0 .byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14 - .byte 196,98,121,24,29,144,35,0,0 // vbroadcastss 0x2390(%rip),%xmm11 # 7aa4 <_sk_callback_avx+0x4e0> + .byte 196,98,121,24,29,88,36,0,0 // vbroadcastss 0x2458(%rip),%xmm11 # 7b6c <_sk_callback_avx+0x4dd> .byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3 - .byte 196,98,121,24,45,134,35,0,0 // vbroadcastss 0x2386(%rip),%xmm13 # 7aa8 <_sk_callback_avx+0x4e4> + .byte 196,98,121,24,45,78,36,0,0 // vbroadcastss 0x244e(%rip),%xmm13 # 7b70 <_sk_callback_avx+0x4e1> .byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3 .byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10 .byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -22568,7 +22732,7 @@ _sk_gather_f16_avx: .byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 .byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0 .byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1 - .byte 196,226,121,24,29,60,35,0,0 // vbroadcastss 0x233c(%rip),%xmm3 # 7aac <_sk_callback_avx+0x4e8> + .byte 196,226,121,24,29,4,36,0,0 // vbroadcastss 0x2404(%rip),%xmm3 # 7b74 <_sk_callback_avx+0x4e5> .byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1 .byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 @@ -22668,12 +22832,12 @@ _sk_store_f16_avx: .byte 197,252,17,52,36 // vmovups %ymm6,(%rsp) .byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp) .byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp) - .byte 196,98,125,24,13,92,33,0,0 // vbroadcastss 0x215c(%rip),%ymm9 # 7ab0 <_sk_callback_avx+0x4ec> + .byte 196,98,125,24,13,36,34,0,0 // vbroadcastss 0x2224(%rip),%ymm9 # 7b78 <_sk_callback_avx+0x4e9> .byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10 .byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp) .byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11 .byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12 - .byte 196,98,121,24,5,65,33,0,0 // vbroadcastss 0x2141(%rip),%xmm8 # 7ab4 <_sk_callback_avx+0x4f0> + .byte 196,98,121,24,5,9,34,0,0 // vbroadcastss 0x2209(%rip),%xmm8 # 7b7c <_sk_callback_avx+0x4ed> .byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13 .byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14 .byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13 @@ -22683,7 +22847,7 @@ _sk_store_f16_avx: .byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14 .byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11 .byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12 - .byte 196,98,125,24,21,8,33,0,0 // vbroadcastss 0x2108(%rip),%ymm10 # 7ab8 <_sk_callback_avx+0x4f4> + .byte 196,98,125,24,21,208,33,0,0 // vbroadcastss 0x21d0(%rip),%ymm10 # 7b80 <_sk_callback_avx+0x4f1> .byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14 .byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15 .byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12 @@ -22828,7 +22992,7 @@ _sk_load_u16_be_avx: .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,29,96,30,0,0 // vbroadcastss 0x1e60(%rip),%ymm11 # 7abc <_sk_callback_avx+0x4f8> + .byte 196,98,125,24,29,40,31,0,0 // vbroadcastss 0x1f28(%rip),%ymm11 # 7b84 <_sk_callback_avx+0x4f5> .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -22921,7 +23085,7 @@ _sk_load_rgb_u16_be_avx: .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,29,192,28,0,0 // vbroadcastss 0x1cc0(%rip),%ymm11 # 7ac0 <_sk_callback_avx+0x4fc> + .byte 196,98,125,24,29,136,29,0,0 // vbroadcastss 0x1d88(%rip),%ymm11 # 7b88 <_sk_callback_avx+0x4f9> .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -22942,7 +23106,7 @@ _sk_load_rgb_u16_be_avx: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,93,28,0,0 // vbroadcastss 0x1c5d(%rip),%ymm3 # 7ac4 <_sk_callback_avx+0x500> + .byte 196,226,125,24,29,37,29,0,0 // vbroadcastss 0x1d25(%rip),%ymm3 # 7b8c <_sk_callback_avx+0x4fd> .byte 255,224 // jmpq *%rax .byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0 .byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0 @@ -22985,7 +23149,7 @@ _sk_store_u16_be_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax - .byte 196,98,125,24,5,154,27,0,0 // vbroadcastss 0x1b9a(%rip),%ymm8 # 7ac8 <_sk_callback_avx+0x504> + .byte 196,98,125,24,5,98,28,0,0 // vbroadcastss 0x1c62(%rip),%ymm8 # 7b90 <_sk_callback_avx+0x501> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10 @@ -23286,7 +23450,7 @@ _sk_mirror_x_avx: .byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0 .byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0 .byte 196,99,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm8 - .byte 197,178,89,5,11,23,0,0 // vmulss 0x170b(%rip),%xmm9,%xmm0 # 7acc <_sk_callback_avx+0x508> + .byte 197,178,89,5,211,23,0,0 // vmulss 0x17d3(%rip),%xmm9,%xmm0 # 7b94 <_sk_callback_avx+0x505> .byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 .byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0 @@ -23319,7 +23483,7 @@ _sk_mirror_y_avx: .byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1 .byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1 .byte 196,99,117,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm8 - .byte 197,178,89,13,134,22,0,0 // vmulss 0x1686(%rip),%xmm9,%xmm1 # 7ad0 <_sk_callback_avx+0x50c> + .byte 197,178,89,13,78,23,0,0 // vmulss 0x174e(%rip),%xmm9,%xmm1 # 7b98 <_sk_callback_avx+0x509> .byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1 .byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1 .byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1 @@ -23345,7 +23509,7 @@ FUNCTION(_sk_clamp_x_1_avx) _sk_clamp_x_1_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,36,22,0,0 // vbroadcastss 0x1624(%rip),%ymm8 # 7ad4 <_sk_callback_avx+0x510> + .byte 196,98,125,24,5,236,22,0,0 // vbroadcastss 0x16ec(%rip),%ymm8 # 7b9c <_sk_callback_avx+0x50d> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -23363,9 +23527,9 @@ HIDDEN _sk_mirror_x_1_avx .globl _sk_mirror_x_1_avx FUNCTION(_sk_mirror_x_1_avx) _sk_mirror_x_1_avx: - .byte 196,98,125,24,5,7,22,0,0 // vbroadcastss 0x1607(%rip),%ymm8 # 7ad8 <_sk_callback_avx+0x514> + .byte 196,98,125,24,5,207,22,0,0 // vbroadcastss 0x16cf(%rip),%ymm8 # 7ba0 <_sk_callback_avx+0x511> .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,13,253,21,0,0 // vbroadcastss 0x15fd(%rip),%ymm9 # 7adc <_sk_callback_avx+0x518> + .byte 196,98,125,24,13,197,22,0,0 // vbroadcastss 0x16c5(%rip),%ymm9 # 7ba4 <_sk_callback_avx+0x515> .byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9 .byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9 .byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9 @@ -23381,12 +23545,12 @@ HIDDEN _sk_luminance_to_alpha_avx .globl _sk_luminance_to_alpha_avx FUNCTION(_sk_luminance_to_alpha_avx) _sk_luminance_to_alpha_avx: - .byte 196,226,125,24,29,205,21,0,0 // vbroadcastss 0x15cd(%rip),%ymm3 # 7ae0 <_sk_callback_avx+0x51c> + .byte 196,226,125,24,29,149,22,0,0 // vbroadcastss 0x1695(%rip),%ymm3 # 7ba8 <_sk_callback_avx+0x519> .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,29,196,21,0,0 // vbroadcastss 0x15c4(%rip),%ymm3 # 7ae4 <_sk_callback_avx+0x520> + .byte 196,226,125,24,29,140,22,0,0 // vbroadcastss 0x168c(%rip),%ymm3 # 7bac <_sk_callback_avx+0x51d> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,183,21,0,0 // vbroadcastss 0x15b7(%rip),%ymm1 # 7ae8 <_sk_callback_avx+0x524> + .byte 196,226,125,24,13,127,22,0,0 // vbroadcastss 0x167f(%rip),%ymm1 # 7bb0 <_sk_callback_avx+0x521> .byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1 .byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -23766,18 +23930,18 @@ HIDDEN _sk_gauss_a_to_rgba_avx .globl _sk_gauss_a_to_rgba_avx FUNCTION(_sk_gauss_a_to_rgba_avx) _sk_gauss_a_to_rgba_avx: - .byte 196,226,125,24,5,230,14,0,0 // vbroadcastss 0xee6(%rip),%ymm0 # 7aec <_sk_callback_avx+0x528> + .byte 196,226,125,24,5,174,15,0,0 // vbroadcastss 0xfae(%rip),%ymm0 # 7bb4 <_sk_callback_avx+0x525> .byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0 - .byte 196,226,125,24,13,221,14,0,0 // vbroadcastss 0xedd(%rip),%ymm1 # 7af0 <_sk_callback_avx+0x52c> + .byte 196,226,125,24,13,165,15,0,0 // vbroadcastss 0xfa5(%rip),%ymm1 # 7bb8 <_sk_callback_avx+0x529> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,13,208,14,0,0 // vbroadcastss 0xed0(%rip),%ymm1 # 7af4 <_sk_callback_avx+0x530> + .byte 196,226,125,24,13,152,15,0,0 // vbroadcastss 0xf98(%rip),%ymm1 # 7bbc <_sk_callback_avx+0x52d> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,13,195,14,0,0 // vbroadcastss 0xec3(%rip),%ymm1 # 7af8 <_sk_callback_avx+0x534> + .byte 196,226,125,24,13,139,15,0,0 // vbroadcastss 0xf8b(%rip),%ymm1 # 7bc0 <_sk_callback_avx+0x531> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,13,182,14,0,0 // vbroadcastss 0xeb6(%rip),%ymm1 # 7afc <_sk_callback_avx+0x538> + .byte 196,226,125,24,13,126,15,0,0 // vbroadcastss 0xf7e(%rip),%ymm1 # 7bc4 <_sk_callback_avx+0x535> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 @@ -23805,7 +23969,7 @@ _sk_gradient_avx: .byte 73,255,201 // dec %r9 .byte 72,131,195,4 // add $0x4,%rbx .byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9 - .byte 196,98,125,24,21,110,14,0,0 // vbroadcastss 0xe6e(%rip),%ymm10 # 7b00 <_sk_callback_avx+0x53c> + .byte 196,98,125,24,21,54,15,0,0 // vbroadcastss 0xf36(%rip),%ymm10 # 7bc8 <_sk_callback_avx+0x539> .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 196,98,125,24,3 // vbroadcastss (%rbx),%ymm8 .byte 197,60,194,192,2 // vcmpleps %ymm0,%ymm8,%ymm8 @@ -24000,27 +24164,27 @@ _sk_xy_to_unit_angle_avx: .byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12 .byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11 .byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12 - .byte 196,98,125,24,45,100,10,0,0 // vbroadcastss 0xa64(%rip),%ymm13 # 7b04 <_sk_callback_avx+0x540> + .byte 196,98,125,24,45,44,11,0,0 // vbroadcastss 0xb2c(%rip),%ymm13 # 7bcc <_sk_callback_avx+0x53d> .byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13 - .byte 196,98,125,24,53,90,10,0,0 // vbroadcastss 0xa5a(%rip),%ymm14 # 7b08 <_sk_callback_avx+0x544> + .byte 196,98,125,24,53,34,11,0,0 // vbroadcastss 0xb22(%rip),%ymm14 # 7bd0 <_sk_callback_avx+0x541> .byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13 .byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13 - .byte 196,98,125,24,53,75,10,0,0 // vbroadcastss 0xa4b(%rip),%ymm14 # 7b0c <_sk_callback_avx+0x548> + .byte 196,98,125,24,53,19,11,0,0 // vbroadcastss 0xb13(%rip),%ymm14 # 7bd4 <_sk_callback_avx+0x545> .byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13 .byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12 - .byte 196,98,125,24,45,60,10,0,0 // vbroadcastss 0xa3c(%rip),%ymm13 # 7b10 <_sk_callback_avx+0x54c> + .byte 196,98,125,24,45,4,11,0,0 // vbroadcastss 0xb04(%rip),%ymm13 # 7bd8 <_sk_callback_avx+0x549> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 .byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,39,10,0,0 // vbroadcastss 0xa27(%rip),%ymm10 # 7b14 <_sk_callback_avx+0x550> + .byte 196,98,125,24,21,239,10,0,0 // vbroadcastss 0xaef(%rip),%ymm10 # 7bdc <_sk_callback_avx+0x54d> .byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10 .byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9 .byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,21,17,10,0,0 // vbroadcastss 0xa11(%rip),%ymm10 # 7b18 <_sk_callback_avx+0x554> + .byte 196,98,125,24,21,217,10,0,0 // vbroadcastss 0xad9(%rip),%ymm10 # 7be0 <_sk_callback_avx+0x551> .byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9 - .byte 196,98,125,24,21,251,9,0,0 // vbroadcastss 0x9fb(%rip),%ymm10 # 7b1c <_sk_callback_avx+0x558> + .byte 196,98,125,24,21,195,10,0,0 // vbroadcastss 0xac3(%rip),%ymm10 # 7be4 <_sk_callback_avx+0x555> .byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10 .byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0 .byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9 @@ -24039,18 +24203,18 @@ _sk_xy_to_radius_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax -HIDDEN _sk_xy_to_2pt_conical_avx -.globl _sk_xy_to_2pt_conical_avx -FUNCTION(_sk_xy_to_2pt_conical_avx) -_sk_xy_to_2pt_conical_avx: +HIDDEN _sk_xy_to_2pt_conical_quadratic_avx +.globl _sk_xy_to_2pt_conical_quadratic_avx +FUNCTION(_sk_xy_to_2pt_conical_quadratic_avx) +_sk_xy_to_2pt_conical_quadratic_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,0 // vbroadcastss (%rax),%ymm8 - .byte 197,122,16,72,8 // vmovss 0x8(%rax),%xmm9 - .byte 197,50,89,80,12 // vmulss 0xc(%rax),%xmm9,%xmm10 + .byte 196,98,125,24,64,32 // vbroadcastss 0x20(%rax),%ymm8 + .byte 197,122,16,72,40 // vmovss 0x28(%rax),%xmm9 + .byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10 .byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10 .byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10 .byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10 - .byte 196,98,125,24,29,166,9,0,0 // vbroadcastss 0x9a6(%rip),%ymm11 # 7b20 <_sk_callback_avx+0x55c> + .byte 196,98,125,24,29,109,10,0,0 // vbroadcastss 0xa6d(%rip),%ymm11 # 7be8 <_sk_callback_avx+0x559> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 .byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0 .byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11 @@ -24059,18 +24223,18 @@ _sk_xy_to_2pt_conical_avx: .byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 .byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0 - .byte 196,98,125,24,13,122,9,0,0 // vbroadcastss 0x97a(%rip),%ymm9 # 7b24 <_sk_callback_avx+0x560> + .byte 196,98,125,24,13,65,10,0,0 // vbroadcastss 0xa41(%rip),%ymm9 # 7bec <_sk_callback_avx+0x55d> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8 .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 .byte 197,252,81,192 // vsqrtps %ymm0,%ymm0 - .byte 196,98,125,24,64,4 // vbroadcastss 0x4(%rax),%ymm8 - .byte 196,98,125,24,13,88,9,0,0 // vbroadcastss 0x958(%rip),%ymm9 # 7b28 <_sk_callback_avx+0x564> + .byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8 + .byte 196,98,125,24,13,31,10,0,0 // vbroadcastss 0xa1f(%rip),%ymm9 # 7bf0 <_sk_callback_avx+0x561> .byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 .byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10 - .byte 196,98,125,24,29,68,9,0,0 // vbroadcastss 0x944(%rip),%ymm11 # 7b2c <_sk_callback_avx+0x568> + .byte 196,98,125,24,29,11,10,0,0 // vbroadcastss 0xa0b(%rip),%ymm11 # 7bf4 <_sk_callback_avx+0x565> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 .byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 @@ -24079,12 +24243,64 @@ _sk_xy_to_2pt_conical_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax +HIDDEN _sk_xy_to_2pt_conical_linear_avx +.globl _sk_xy_to_2pt_conical_linear_avx +FUNCTION(_sk_xy_to_2pt_conical_linear_avx) +_sk_xy_to_2pt_conical_linear_avx: + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 197,122,16,64,40 // vmovss 0x28(%rax),%xmm8 + .byte 197,122,16,72,44 // vmovss 0x2c(%rax),%xmm9 + .byte 196,65,50,89,208 // vmulss %xmm8,%xmm9,%xmm10 + .byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10 + .byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10 + .byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10 + .byte 196,98,125,24,29,203,9,0,0 // vbroadcastss 0x9cb(%rip),%ymm11 # 7bf8 <_sk_callback_avx+0x569> + .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 + .byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0 + .byte 197,244,89,201 // vmulps %ymm1,%ymm1,%ymm1 + .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 + .byte 196,193,58,89,200 // vmulss %xmm8,%xmm8,%xmm1 + .byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1 + .byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1 + .byte 197,252,92,193 // vsubps %ymm1,%ymm0,%ymm0 + .byte 196,226,125,24,13,160,9,0,0 // vbroadcastss 0x9a0(%rip),%ymm1 # 7bfc <_sk_callback_avx+0x56d> + .byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0 + .byte 196,193,124,94,194 // vdivps %ymm10,%ymm0,%ymm0 + .byte 196,193,121,112,201,0 // vpshufd $0x0,%xmm9,%xmm1 + .byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1 + .byte 196,65,121,112,192,0 // vpshufd $0x0,%xmm8,%xmm8 + .byte 196,67,61,24,192,1 // vinsertf128 $0x1,%xmm8,%ymm8,%ymm8 + .byte 197,244,89,200 // vmulps %ymm0,%ymm1,%ymm1 + .byte 197,188,88,201 // vaddps %ymm1,%ymm8,%ymm1 + .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 + .byte 196,193,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm1 + .byte 196,98,125,24,13,103,9,0,0 // vbroadcastss 0x967(%rip),%ymm9 # 7c00 <_sk_callback_avx+0x571> + .byte 196,195,53,74,200,16 // vblendvps %ymm1,%ymm8,%ymm9,%ymm1 + .byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9 + .byte 196,195,117,74,200,144 // vblendvps %ymm9,%ymm8,%ymm1,%ymm1 + .byte 197,252,17,8 // vmovups %ymm1,(%rax) + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + +HIDDEN _sk_vector_scale_avx +.globl _sk_vector_scale_avx +FUNCTION(_sk_vector_scale_avx) +_sk_vector_scale_avx: + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 197,124,16,0 // vmovups (%rax),%ymm8 + .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 + .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 + .byte 197,188,89,210 // vmulps %ymm2,%ymm8,%ymm2 + .byte 197,188,89,219 // vmulps %ymm3,%ymm8,%ymm3 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + HIDDEN _sk_save_xy_avx .globl _sk_save_xy_avx FUNCTION(_sk_save_xy_avx) _sk_save_xy_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,35,9,0,0 // vbroadcastss 0x923(%rip),%ymm8 # 7b30 <_sk_callback_avx+0x56c> + .byte 196,98,125,24,5,44,9,0,0 // vbroadcastss 0x92c(%rip),%ymm8 # 7c04 <_sk_callback_avx+0x575> .byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9 .byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 @@ -24121,9 +24337,9 @@ HIDDEN _sk_bilinear_nx_avx FUNCTION(_sk_bilinear_nx_avx) _sk_bilinear_nx_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,175,8,0,0 // vbroadcastss 0x8af(%rip),%ymm0 # 7b34 <_sk_callback_avx+0x570> + .byte 196,226,125,24,5,184,8,0,0 // vbroadcastss 0x8b8(%rip),%ymm0 # 7c08 <_sk_callback_avx+0x579> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,166,8,0,0 // vbroadcastss 0x8a6(%rip),%ymm8 # 7b38 <_sk_callback_avx+0x574> + .byte 196,98,125,24,5,175,8,0,0 // vbroadcastss 0x8af(%rip),%ymm8 # 7c0c <_sk_callback_avx+0x57d> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -24134,7 +24350,7 @@ HIDDEN _sk_bilinear_px_avx FUNCTION(_sk_bilinear_px_avx) _sk_bilinear_px_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,142,8,0,0 // vbroadcastss 0x88e(%rip),%ymm0 # 7b3c <_sk_callback_avx+0x578> + .byte 196,226,125,24,5,151,8,0,0 // vbroadcastss 0x897(%rip),%ymm0 # 7c10 <_sk_callback_avx+0x581> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -24146,9 +24362,9 @@ HIDDEN _sk_bilinear_ny_avx FUNCTION(_sk_bilinear_ny_avx) _sk_bilinear_ny_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,114,8,0,0 // vbroadcastss 0x872(%rip),%ymm1 # 7b40 <_sk_callback_avx+0x57c> + .byte 196,226,125,24,13,123,8,0,0 // vbroadcastss 0x87b(%rip),%ymm1 # 7c14 <_sk_callback_avx+0x585> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,104,8,0,0 // vbroadcastss 0x868(%rip),%ymm8 # 7b44 <_sk_callback_avx+0x580> + .byte 196,98,125,24,5,113,8,0,0 // vbroadcastss 0x871(%rip),%ymm8 # 7c18 <_sk_callback_avx+0x589> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -24159,7 +24375,7 @@ HIDDEN _sk_bilinear_py_avx FUNCTION(_sk_bilinear_py_avx) _sk_bilinear_py_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,80,8,0,0 // vbroadcastss 0x850(%rip),%ymm1 # 7b48 <_sk_callback_avx+0x584> + .byte 196,226,125,24,13,89,8,0,0 // vbroadcastss 0x859(%rip),%ymm1 # 7c1c <_sk_callback_avx+0x58d> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -24171,14 +24387,14 @@ HIDDEN _sk_bicubic_n3x_avx FUNCTION(_sk_bicubic_n3x_avx) _sk_bicubic_n3x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,51,8,0,0 // vbroadcastss 0x833(%rip),%ymm0 # 7b4c <_sk_callback_avx+0x588> + .byte 196,226,125,24,5,60,8,0,0 // vbroadcastss 0x83c(%rip),%ymm0 # 7c20 <_sk_callback_avx+0x591> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,42,8,0,0 // vbroadcastss 0x82a(%rip),%ymm8 # 7b50 <_sk_callback_avx+0x58c> + .byte 196,98,125,24,5,51,8,0,0 // vbroadcastss 0x833(%rip),%ymm8 # 7c24 <_sk_callback_avx+0x595> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,27,8,0,0 // vbroadcastss 0x81b(%rip),%ymm10 # 7b54 <_sk_callback_avx+0x590> + .byte 196,98,125,24,21,36,8,0,0 // vbroadcastss 0x824(%rip),%ymm10 # 7c28 <_sk_callback_avx+0x599> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,17,8,0,0 // vbroadcastss 0x811(%rip),%ymm10 # 7b58 <_sk_callback_avx+0x594> + .byte 196,98,125,24,21,26,8,0,0 // vbroadcastss 0x81a(%rip),%ymm10 # 7c2c <_sk_callback_avx+0x59d> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -24190,19 +24406,19 @@ HIDDEN _sk_bicubic_n1x_avx FUNCTION(_sk_bicubic_n1x_avx) _sk_bicubic_n1x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,244,7,0,0 // vbroadcastss 0x7f4(%rip),%ymm0 # 7b5c <_sk_callback_avx+0x598> + .byte 196,226,125,24,5,253,7,0,0 // vbroadcastss 0x7fd(%rip),%ymm0 # 7c30 <_sk_callback_avx+0x5a1> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,235,7,0,0 // vbroadcastss 0x7eb(%rip),%ymm8 # 7b60 <_sk_callback_avx+0x59c> + .byte 196,98,125,24,5,244,7,0,0 // vbroadcastss 0x7f4(%rip),%ymm8 # 7c34 <_sk_callback_avx+0x5a5> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,225,7,0,0 // vbroadcastss 0x7e1(%rip),%ymm9 # 7b64 <_sk_callback_avx+0x5a0> + .byte 196,98,125,24,13,234,7,0,0 // vbroadcastss 0x7ea(%rip),%ymm9 # 7c38 <_sk_callback_avx+0x5a9> .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,215,7,0,0 // vbroadcastss 0x7d7(%rip),%ymm10 # 7b68 <_sk_callback_avx+0x5a4> + .byte 196,98,125,24,21,224,7,0,0 // vbroadcastss 0x7e0(%rip),%ymm10 # 7c3c <_sk_callback_avx+0x5ad> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,200,7,0,0 // vbroadcastss 0x7c8(%rip),%ymm10 # 7b6c <_sk_callback_avx+0x5a8> + .byte 196,98,125,24,21,209,7,0,0 // vbroadcastss 0x7d1(%rip),%ymm10 # 7c40 <_sk_callback_avx+0x5b1> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,185,7,0,0 // vbroadcastss 0x7b9(%rip),%ymm9 # 7b70 <_sk_callback_avx+0x5ac> + .byte 196,98,125,24,13,194,7,0,0 // vbroadcastss 0x7c2(%rip),%ymm9 # 7c44 <_sk_callback_avx+0x5b5> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -24213,17 +24429,17 @@ HIDDEN _sk_bicubic_p1x_avx FUNCTION(_sk_bicubic_p1x_avx) _sk_bicubic_p1x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,161,7,0,0 // vbroadcastss 0x7a1(%rip),%ymm8 # 7b74 <_sk_callback_avx+0x5b0> + .byte 196,98,125,24,5,170,7,0,0 // vbroadcastss 0x7aa(%rip),%ymm8 # 7c48 <_sk_callback_avx+0x5b9> .byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0 .byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9 - .byte 196,98,125,24,21,147,7,0,0 // vbroadcastss 0x793(%rip),%ymm10 # 7b78 <_sk_callback_avx+0x5b4> + .byte 196,98,125,24,21,156,7,0,0 // vbroadcastss 0x79c(%rip),%ymm10 # 7c4c <_sk_callback_avx+0x5bd> .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 - .byte 196,98,125,24,29,137,7,0,0 // vbroadcastss 0x789(%rip),%ymm11 # 7b7c <_sk_callback_avx+0x5b8> + .byte 196,98,125,24,29,146,7,0,0 // vbroadcastss 0x792(%rip),%ymm11 # 7c50 <_sk_callback_avx+0x5c1> .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 .byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 - .byte 196,98,125,24,13,112,7,0,0 // vbroadcastss 0x770(%rip),%ymm9 # 7b80 <_sk_callback_avx+0x5bc> + .byte 196,98,125,24,13,121,7,0,0 // vbroadcastss 0x779(%rip),%ymm9 # 7c54 <_sk_callback_avx+0x5c5> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -24234,13 +24450,13 @@ HIDDEN _sk_bicubic_p3x_avx FUNCTION(_sk_bicubic_p3x_avx) _sk_bicubic_p3x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,88,7,0,0 // vbroadcastss 0x758(%rip),%ymm0 # 7b84 <_sk_callback_avx+0x5c0> + .byte 196,226,125,24,5,97,7,0,0 // vbroadcastss 0x761(%rip),%ymm0 # 7c58 <_sk_callback_avx+0x5c9> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,69,7,0,0 // vbroadcastss 0x745(%rip),%ymm10 # 7b88 <_sk_callback_avx+0x5c4> + .byte 196,98,125,24,21,78,7,0,0 // vbroadcastss 0x74e(%rip),%ymm10 # 7c5c <_sk_callback_avx+0x5cd> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,59,7,0,0 // vbroadcastss 0x73b(%rip),%ymm10 # 7b8c <_sk_callback_avx+0x5c8> + .byte 196,98,125,24,21,68,7,0,0 // vbroadcastss 0x744(%rip),%ymm10 # 7c60 <_sk_callback_avx+0x5d1> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -24252,14 +24468,14 @@ HIDDEN _sk_bicubic_n3y_avx FUNCTION(_sk_bicubic_n3y_avx) _sk_bicubic_n3y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,30,7,0,0 // vbroadcastss 0x71e(%rip),%ymm1 # 7b90 <_sk_callback_avx+0x5cc> + .byte 196,226,125,24,13,39,7,0,0 // vbroadcastss 0x727(%rip),%ymm1 # 7c64 <_sk_callback_avx+0x5d5> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,20,7,0,0 // vbroadcastss 0x714(%rip),%ymm8 # 7b94 <_sk_callback_avx+0x5d0> + .byte 196,98,125,24,5,29,7,0,0 // vbroadcastss 0x71d(%rip),%ymm8 # 7c68 <_sk_callback_avx+0x5d9> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,5,7,0,0 // vbroadcastss 0x705(%rip),%ymm10 # 7b98 <_sk_callback_avx+0x5d4> + .byte 196,98,125,24,21,14,7,0,0 // vbroadcastss 0x70e(%rip),%ymm10 # 7c6c <_sk_callback_avx+0x5dd> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,251,6,0,0 // vbroadcastss 0x6fb(%rip),%ymm10 # 7b9c <_sk_callback_avx+0x5d8> + .byte 196,98,125,24,21,4,7,0,0 // vbroadcastss 0x704(%rip),%ymm10 # 7c70 <_sk_callback_avx+0x5e1> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -24271,19 +24487,19 @@ HIDDEN _sk_bicubic_n1y_avx FUNCTION(_sk_bicubic_n1y_avx) _sk_bicubic_n1y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,222,6,0,0 // vbroadcastss 0x6de(%rip),%ymm1 # 7ba0 <_sk_callback_avx+0x5dc> + .byte 196,226,125,24,13,231,6,0,0 // vbroadcastss 0x6e7(%rip),%ymm1 # 7c74 <_sk_callback_avx+0x5e5> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,212,6,0,0 // vbroadcastss 0x6d4(%rip),%ymm8 # 7ba4 <_sk_callback_avx+0x5e0> + .byte 196,98,125,24,5,221,6,0,0 // vbroadcastss 0x6dd(%rip),%ymm8 # 7c78 <_sk_callback_avx+0x5e9> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,202,6,0,0 // vbroadcastss 0x6ca(%rip),%ymm9 # 7ba8 <_sk_callback_avx+0x5e4> + .byte 196,98,125,24,13,211,6,0,0 // vbroadcastss 0x6d3(%rip),%ymm9 # 7c7c <_sk_callback_avx+0x5ed> .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,192,6,0,0 // vbroadcastss 0x6c0(%rip),%ymm10 # 7bac <_sk_callback_avx+0x5e8> + .byte 196,98,125,24,21,201,6,0,0 // vbroadcastss 0x6c9(%rip),%ymm10 # 7c80 <_sk_callback_avx+0x5f1> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,177,6,0,0 // vbroadcastss 0x6b1(%rip),%ymm10 # 7bb0 <_sk_callback_avx+0x5ec> + .byte 196,98,125,24,21,186,6,0,0 // vbroadcastss 0x6ba(%rip),%ymm10 # 7c84 <_sk_callback_avx+0x5f5> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,162,6,0,0 // vbroadcastss 0x6a2(%rip),%ymm9 # 7bb4 <_sk_callback_avx+0x5f0> + .byte 196,98,125,24,13,171,6,0,0 // vbroadcastss 0x6ab(%rip),%ymm9 # 7c88 <_sk_callback_avx+0x5f9> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -24294,17 +24510,17 @@ HIDDEN _sk_bicubic_p1y_avx FUNCTION(_sk_bicubic_p1y_avx) _sk_bicubic_p1y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,138,6,0,0 // vbroadcastss 0x68a(%rip),%ymm8 # 7bb8 <_sk_callback_avx+0x5f4> + .byte 196,98,125,24,5,147,6,0,0 // vbroadcastss 0x693(%rip),%ymm8 # 7c8c <_sk_callback_avx+0x5fd> .byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1 .byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9 - .byte 196,98,125,24,21,123,6,0,0 // vbroadcastss 0x67b(%rip),%ymm10 # 7bbc <_sk_callback_avx+0x5f8> + .byte 196,98,125,24,21,132,6,0,0 // vbroadcastss 0x684(%rip),%ymm10 # 7c90 <_sk_callback_avx+0x601> .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 - .byte 196,98,125,24,29,113,6,0,0 // vbroadcastss 0x671(%rip),%ymm11 # 7bc0 <_sk_callback_avx+0x5fc> + .byte 196,98,125,24,29,122,6,0,0 // vbroadcastss 0x67a(%rip),%ymm11 # 7c94 <_sk_callback_avx+0x605> .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 .byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 - .byte 196,98,125,24,13,88,6,0,0 // vbroadcastss 0x658(%rip),%ymm9 # 7bc4 <_sk_callback_avx+0x600> + .byte 196,98,125,24,13,97,6,0,0 // vbroadcastss 0x661(%rip),%ymm9 # 7c98 <_sk_callback_avx+0x609> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -24315,13 +24531,13 @@ HIDDEN _sk_bicubic_p3y_avx FUNCTION(_sk_bicubic_p3y_avx) _sk_bicubic_p3y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,64,6,0,0 // vbroadcastss 0x640(%rip),%ymm1 # 7bc8 <_sk_callback_avx+0x604> + .byte 196,226,125,24,13,73,6,0,0 // vbroadcastss 0x649(%rip),%ymm1 # 7c9c <_sk_callback_avx+0x60d> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,44,6,0,0 // vbroadcastss 0x62c(%rip),%ymm10 # 7bcc <_sk_callback_avx+0x608> + .byte 196,98,125,24,21,53,6,0,0 // vbroadcastss 0x635(%rip),%ymm10 # 7ca0 <_sk_callback_avx+0x611> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,34,6,0,0 // vbroadcastss 0x622(%rip),%ymm10 # 7bd0 <_sk_callback_avx+0x60c> + .byte 196,98,125,24,21,43,6,0,0 // vbroadcastss 0x62b(%rip),%ymm10 # 7ca4 <_sk_callback_avx+0x615> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -24451,25 +24667,25 @@ BALIGN4 .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 77b9 <.literal4+0xb1> + .byte 71,225,61 // rex.RXB loope 7881 <.literal4+0xb1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 77c9 <.literal4+0xc1> + .byte 71,225,61 // rex.RXB loope 7891 <.literal4+0xc1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 77d9 <.literal4+0xd1> + .byte 71,225,61 // rex.RXB loope 78a1 <.literal4+0xd1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 77e9 <.literal4+0xe1> + .byte 71,225,61 // rex.RXB loope 78b1 <.literal4+0xe1> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax) @@ -24533,7 +24749,7 @@ BALIGN4 .byte 190,129,128,128,59 // mov $0x3b808081,%esi .byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 7855 <.literal4+0x14d> + .byte 224,7 // loopne 791d <.literal4+0x14d> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -24549,10 +24765,10 @@ BALIGN4 .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) .byte 0,52,255 // add %dh,(%rdi,%rdi,8) .byte 255 // (bad) - .byte 127,0 // jg 787c <.literal4+0x174> + .byte 127,0 // jg 7944 <.literal4+0x174> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 78f5 <.literal4+0x1ed> + .byte 119,115 // ja 79bd <.literal4+0x1ed> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -24566,10 +24782,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 78b0 <.literal4+0x1a8> + .byte 127,0 // jg 7978 <.literal4+0x1a8> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 7929 <.literal4+0x221> + .byte 119,115 // ja 79f1 <.literal4+0x221> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -24583,10 +24799,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 78e4 <.literal4+0x1dc> + .byte 127,0 // jg 79ac <.literal4+0x1dc> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 795d <.literal4+0x255> + .byte 119,115 // ja 7a25 <.literal4+0x255> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -24600,10 +24816,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 7918 <.literal4+0x210> + .byte 127,0 // jg 79e0 <.literal4+0x210> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 7991 <.literal4+0x289> + .byte 119,115 // ja 7a59 <.literal4+0x289> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -24616,7 +24832,7 @@ BALIGN4 .byte 0,75,0 // add %cl,0x0(%rbx) .byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax) .byte 66,0,0 // rex.X add %al,(%rax) - .byte 127,67 // jg 798f <.literal4+0x287> + .byte 127,67 // jg 7a57 <.literal4+0x287> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -24628,7 +24844,7 @@ BALIGN4 .byte 190,80,128,3,62 // mov $0x3e038050,%esi .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 79af <.literal4+0x2a7> + .byte 118,63 // jbe 7a77 <.literal4+0x2a7> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,0 // cmpb $0x0,(%rbx) @@ -24643,7 +24859,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 79b1 <.literal4+0x2a9> + .byte 224,7 // loopne 7a79 <.literal4+0x2a9> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -24655,7 +24871,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 79cd <.literal4+0x2c5> + .byte 224,7 // loopne 7a95 <.literal4+0x2c5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -24667,7 +24883,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 79e9 <.literal4+0x2e1> + .byte 224,7 // loopne 7ab1 <.literal4+0x2e1> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -24678,7 +24894,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 7a3e <.literal4+0x336> + .byte 124,66 // jl 7b06 <.literal4+0x336> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax) @@ -24704,7 +24920,7 @@ BALIGN4 .byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax) .byte 0,0 // add %al,(%rax) .byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax) - .byte 112,65 // jo 7aa1 <.literal4+0x399> + .byte 112,65 // jo 7b69 <.literal4+0x399> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,127,67 // add %bh,0x43(%rdi) @@ -24730,7 +24946,7 @@ BALIGN4 .byte 0,128,55,0,0,128 // add %al,-0x7fffffc9(%rax) .byte 63 // (bad) .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 7b13 <.literal4+0x40b> + .byte 127,71 // jg 7bdb <.literal4+0x40b> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -24772,6 +24988,10 @@ BALIGN4 .byte 128,0,0 // addb $0x0,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) + .byte 0,192 // add %al,%al + .byte 0,0 // add %al,(%rax) + .byte 0,128,0,0,128,63 // add %al,0x3f800000(%rax) + .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,191,0,0,128,63 // add %bh,0x3f800000(%rdi) @@ -25267,7 +25487,7 @@ _sk_seed_shader_sse41: .byte 102,15,110,194 // movd %edx,%xmm0 .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0 .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 - .byte 15,40,21,223,89,0,0 // movaps 0x59df(%rip),%xmm2 # 5a80 <_sk_callback_sse41+0xfa> + .byte 15,40,21,143,90,0,0 // movaps 0x5a8f(%rip),%xmm2 # 5b30 <_sk_callback_sse41+0xf9> .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,16,7 // movups (%rdi),%xmm0 .byte 15,88,193 // addps %xmm1,%xmm0 @@ -25276,7 +25496,7 @@ _sk_seed_shader_sse41: .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,21,206,89,0,0 // movaps 0x59ce(%rip),%xmm2 # 5a90 <_sk_callback_sse41+0x10a> + .byte 15,40,21,126,90,0,0 // movaps 0x5a7e(%rip),%xmm2 # 5b40 <_sk_callback_sse41+0x109> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,87,237 // xorps %xmm5,%xmm5 @@ -25296,14 +25516,14 @@ _sk_dither_sse41: .byte 102,68,15,110,193 // movd %ecx,%xmm8 .byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8 .byte 102,69,15,239,193 // pxor %xmm9,%xmm8 - .byte 102,68,15,111,21,156,89,0,0 // movdqa 0x599c(%rip),%xmm10 # 5aa0 <_sk_callback_sse41+0x11a> + .byte 102,68,15,111,21,76,90,0,0 // movdqa 0x5a4c(%rip),%xmm10 # 5b50 <_sk_callback_sse41+0x119> .byte 102,69,15,111,216 // movdqa %xmm8,%xmm11 .byte 102,69,15,219,218 // pand %xmm10,%xmm11 .byte 102,65,15,114,243,5 // pslld $0x5,%xmm11 .byte 102,69,15,219,209 // pand %xmm9,%xmm10 .byte 102,65,15,114,242,4 // pslld $0x4,%xmm10 - .byte 102,68,15,111,37,136,89,0,0 // movdqa 0x5988(%rip),%xmm12 # 5ab0 <_sk_callback_sse41+0x12a> - .byte 102,68,15,111,45,143,89,0,0 // movdqa 0x598f(%rip),%xmm13 # 5ac0 <_sk_callback_sse41+0x13a> + .byte 102,68,15,111,37,56,90,0,0 // movdqa 0x5a38(%rip),%xmm12 # 5b60 <_sk_callback_sse41+0x129> + .byte 102,68,15,111,45,63,90,0,0 // movdqa 0x5a3f(%rip),%xmm13 # 5b70 <_sk_callback_sse41+0x139> .byte 102,69,15,111,240 // movdqa %xmm8,%xmm14 .byte 102,69,15,219,245 // pand %xmm13,%xmm14 .byte 102,65,15,114,246,2 // pslld $0x2,%xmm14 @@ -25319,8 +25539,8 @@ _sk_dither_sse41: .byte 102,69,15,235,245 // por %xmm13,%xmm14 .byte 102,69,15,235,240 // por %xmm8,%xmm14 .byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8 - .byte 68,15,89,5,74,89,0,0 // mulps 0x594a(%rip),%xmm8 # 5ad0 <_sk_callback_sse41+0x14a> - .byte 68,15,88,5,82,89,0,0 // addps 0x5952(%rip),%xmm8 # 5ae0 <_sk_callback_sse41+0x15a> + .byte 68,15,89,5,250,89,0,0 // mulps 0x59fa(%rip),%xmm8 # 5b80 <_sk_callback_sse41+0x149> + .byte 68,15,88,5,2,90,0,0 // addps 0x5a02(%rip),%xmm8 # 5b90 <_sk_callback_sse41+0x159> .byte 243,68,15,16,16 // movss (%rax),%xmm10 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 @@ -25397,7 +25617,7 @@ HIDDEN _sk_srcatop_sse41 FUNCTION(_sk_srcatop_sse41) _sk_srcatop_sse41: .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 68,15,40,5,172,88,0,0 // movaps 0x58ac(%rip),%xmm8 # 5af0 <_sk_callback_sse41+0x16a> + .byte 68,15,40,5,92,89,0,0 // movaps 0x595c(%rip),%xmm8 # 5ba0 <_sk_callback_sse41+0x169> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -25422,7 +25642,7 @@ FUNCTION(_sk_dstatop_sse41) _sk_dstatop_sse41: .byte 68,15,40,195 // movaps %xmm3,%xmm8 .byte 68,15,89,196 // mulps %xmm4,%xmm8 - .byte 68,15,40,13,111,88,0,0 // movaps 0x586f(%rip),%xmm9 # 5b00 <_sk_callback_sse41+0x17a> + .byte 68,15,40,13,31,89,0,0 // movaps 0x591f(%rip),%xmm9 # 5bb0 <_sk_callback_sse41+0x179> .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 @@ -25469,7 +25689,7 @@ HIDDEN _sk_srcout_sse41 .globl _sk_srcout_sse41 FUNCTION(_sk_srcout_sse41) _sk_srcout_sse41: - .byte 68,15,40,5,19,88,0,0 // movaps 0x5813(%rip),%xmm8 # 5b10 <_sk_callback_sse41+0x18a> + .byte 68,15,40,5,195,88,0,0 // movaps 0x58c3(%rip),%xmm8 # 5bc0 <_sk_callback_sse41+0x189> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 @@ -25482,7 +25702,7 @@ HIDDEN _sk_dstout_sse41 .globl _sk_dstout_sse41 FUNCTION(_sk_dstout_sse41) _sk_dstout_sse41: - .byte 68,15,40,5,3,88,0,0 // movaps 0x5803(%rip),%xmm8 # 5b20 <_sk_callback_sse41+0x19a> + .byte 68,15,40,5,179,88,0,0 // movaps 0x58b3(%rip),%xmm8 # 5bd0 <_sk_callback_sse41+0x199> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 @@ -25499,7 +25719,7 @@ HIDDEN _sk_srcover_sse41 .globl _sk_srcover_sse41 FUNCTION(_sk_srcover_sse41) _sk_srcover_sse41: - .byte 68,15,40,5,230,87,0,0 // movaps 0x57e6(%rip),%xmm8 # 5b30 <_sk_callback_sse41+0x1aa> + .byte 68,15,40,5,150,88,0,0 // movaps 0x5896(%rip),%xmm8 # 5be0 <_sk_callback_sse41+0x1a9> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -25519,7 +25739,7 @@ HIDDEN _sk_dstover_sse41 .globl _sk_dstover_sse41 FUNCTION(_sk_dstover_sse41) _sk_dstover_sse41: - .byte 68,15,40,5,186,87,0,0 // movaps 0x57ba(%rip),%xmm8 # 5b40 <_sk_callback_sse41+0x1ba> + .byte 68,15,40,5,106,88,0,0 // movaps 0x586a(%rip),%xmm8 # 5bf0 <_sk_callback_sse41+0x1b9> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -25547,7 +25767,7 @@ HIDDEN _sk_multiply_sse41 .globl _sk_multiply_sse41 FUNCTION(_sk_multiply_sse41) _sk_multiply_sse41: - .byte 68,15,40,5,142,87,0,0 // movaps 0x578e(%rip),%xmm8 # 5b50 <_sk_callback_sse41+0x1ca> + .byte 68,15,40,5,62,88,0,0 // movaps 0x583e(%rip),%xmm8 # 5c00 <_sk_callback_sse41+0x1c9> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 69,15,40,209 // movaps %xmm9,%xmm10 @@ -25622,7 +25842,7 @@ HIDDEN _sk_xor__sse41 FUNCTION(_sk_xor__sse41) _sk_xor__sse41: .byte 68,15,40,195 // movaps %xmm3,%xmm8 - .byte 15,40,29,195,86,0,0 // movaps 0x56c3(%rip),%xmm3 # 5b60 <_sk_callback_sse41+0x1da> + .byte 15,40,29,115,87,0,0 // movaps 0x5773(%rip),%xmm3 # 5c10 <_sk_callback_sse41+0x1d9> .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 @@ -25670,7 +25890,7 @@ _sk_darken_sse41: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,95,209 // maxps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,46,86,0,0 // movaps 0x562e(%rip),%xmm2 # 5b70 <_sk_callback_sse41+0x1ea> + .byte 15,40,21,222,86,0,0 // movaps 0x56de(%rip),%xmm2 # 5c20 <_sk_callback_sse41+0x1e9> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -25704,7 +25924,7 @@ _sk_lighten_sse41: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,211,85,0,0 // movaps 0x55d3(%rip),%xmm2 # 5b80 <_sk_callback_sse41+0x1fa> + .byte 15,40,21,131,86,0,0 // movaps 0x5683(%rip),%xmm2 # 5c30 <_sk_callback_sse41+0x1f9> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -25741,7 +25961,7 @@ _sk_difference_sse41: .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,109,85,0,0 // movaps 0x556d(%rip),%xmm2 # 5b90 <_sk_callback_sse41+0x20a> + .byte 15,40,21,29,86,0,0 // movaps 0x561d(%rip),%xmm2 # 5c40 <_sk_callback_sse41+0x209> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -25769,7 +25989,7 @@ _sk_exclusion_sse41: .byte 15,89,214 // mulps %xmm6,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,45,85,0,0 // movaps 0x552d(%rip),%xmm2 # 5ba0 <_sk_callback_sse41+0x21a> + .byte 15,40,21,221,85,0,0 // movaps 0x55dd(%rip),%xmm2 # 5c50 <_sk_callback_sse41+0x219> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -25782,7 +26002,7 @@ HIDDEN _sk_colorburn_sse41 FUNCTION(_sk_colorburn_sse41) _sk_colorburn_sse41: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,21,32,85,0,0 // movaps 0x5520(%rip),%xmm10 # 5bb0 <_sk_callback_sse41+0x22a> + .byte 68,15,40,21,208,85,0,0 // movaps 0x55d0(%rip),%xmm10 # 5c60 <_sk_callback_sse41+0x229> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 69,15,40,203 // movaps %xmm11,%xmm9 @@ -25864,7 +26084,7 @@ HIDDEN _sk_colordodge_sse41 FUNCTION(_sk_colordodge_sse41) _sk_colordodge_sse41: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,21,254,83,0,0 // movaps 0x53fe(%rip),%xmm10 # 5bc0 <_sk_callback_sse41+0x23a> + .byte 68,15,40,21,174,84,0,0 // movaps 0x54ae(%rip),%xmm10 # 5c70 <_sk_callback_sse41+0x239> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 69,15,40,227 // movaps %xmm11,%xmm12 @@ -25946,7 +26166,7 @@ _sk_hardlight_sse41: .byte 15,40,244 // movaps %xmm4,%xmm6 .byte 15,40,227 // movaps %xmm3,%xmm4 .byte 68,15,40,200 // movaps %xmm0,%xmm9 - .byte 68,15,40,21,215,82,0,0 // movaps 0x52d7(%rip),%xmm10 # 5bd0 <_sk_callback_sse41+0x24a> + .byte 68,15,40,21,135,83,0,0 // movaps 0x5387(%rip),%xmm10 # 5c80 <_sk_callback_sse41+0x249> .byte 65,15,40,234 // movaps %xmm10,%xmm5 .byte 15,92,239 // subps %xmm7,%xmm5 .byte 15,40,197 // movaps %xmm5,%xmm0 @@ -26029,7 +26249,7 @@ FUNCTION(_sk_overlay_sse41) _sk_overlay_sse41: .byte 68,15,40,201 // movaps %xmm1,%xmm9 .byte 68,15,40,240 // movaps %xmm0,%xmm14 - .byte 68,15,40,21,188,81,0,0 // movaps 0x51bc(%rip),%xmm10 # 5be0 <_sk_callback_sse41+0x25a> + .byte 68,15,40,21,108,82,0,0 // movaps 0x526c(%rip),%xmm10 # 5c90 <_sk_callback_sse41+0x259> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 65,15,40,195 // movaps %xmm11,%xmm0 @@ -26114,7 +26334,7 @@ _sk_softlight_sse41: .byte 15,40,198 // movaps %xmm6,%xmm0 .byte 15,94,199 // divps %xmm7,%xmm0 .byte 65,15,84,193 // andps %xmm9,%xmm0 - .byte 15,40,13,147,80,0,0 // movaps 0x5093(%rip),%xmm1 # 5bf0 <_sk_callback_sse41+0x26a> + .byte 15,40,13,67,81,0,0 // movaps 0x5143(%rip),%xmm1 # 5ca0 <_sk_callback_sse41+0x269> .byte 68,15,40,209 // movaps %xmm1,%xmm10 .byte 68,15,92,208 // subps %xmm0,%xmm10 .byte 68,15,40,240 // movaps %xmm0,%xmm14 @@ -26127,10 +26347,10 @@ _sk_softlight_sse41: .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,89,210 // mulps %xmm2,%xmm2 .byte 15,88,208 // addps %xmm0,%xmm2 - .byte 68,15,40,45,113,80,0,0 // movaps 0x5071(%rip),%xmm13 # 5c00 <_sk_callback_sse41+0x27a> + .byte 68,15,40,45,33,81,0,0 // movaps 0x5121(%rip),%xmm13 # 5cb0 <_sk_callback_sse41+0x279> .byte 69,15,88,245 // addps %xmm13,%xmm14 .byte 68,15,89,242 // mulps %xmm2,%xmm14 - .byte 68,15,40,37,113,80,0,0 // movaps 0x5071(%rip),%xmm12 # 5c10 <_sk_callback_sse41+0x28a> + .byte 68,15,40,37,33,81,0,0 // movaps 0x5121(%rip),%xmm12 # 5cc0 <_sk_callback_sse41+0x289> .byte 69,15,89,252 // mulps %xmm12,%xmm15 .byte 69,15,88,254 // addps %xmm14,%xmm15 .byte 15,40,198 // movaps %xmm6,%xmm0 @@ -26316,12 +26536,12 @@ _sk_hue_sse41: .byte 68,15,84,208 // andps %xmm0,%xmm10 .byte 15,84,200 // andps %xmm0,%xmm1 .byte 68,15,84,232 // andps %xmm0,%xmm13 - .byte 15,40,5,220,77,0,0 // movaps 0x4ddc(%rip),%xmm0 # 5c20 <_sk_callback_sse41+0x29a> + .byte 15,40,5,140,78,0,0 // movaps 0x4e8c(%rip),%xmm0 # 5cd0 <_sk_callback_sse41+0x299> .byte 68,15,89,224 // mulps %xmm0,%xmm12 - .byte 15,40,21,225,77,0,0 // movaps 0x4de1(%rip),%xmm2 # 5c30 <_sk_callback_sse41+0x2aa> + .byte 15,40,21,145,78,0,0 // movaps 0x4e91(%rip),%xmm2 # 5ce0 <_sk_callback_sse41+0x2a9> .byte 15,89,250 // mulps %xmm2,%xmm7 .byte 65,15,88,252 // addps %xmm12,%xmm7 - .byte 68,15,40,53,226,77,0,0 // movaps 0x4de2(%rip),%xmm14 # 5c40 <_sk_callback_sse41+0x2ba> + .byte 68,15,40,53,146,78,0,0 // movaps 0x4e92(%rip),%xmm14 # 5cf0 <_sk_callback_sse41+0x2b9> .byte 68,15,40,252 // movaps %xmm4,%xmm15 .byte 69,15,89,254 // mulps %xmm14,%xmm15 .byte 68,15,88,255 // addps %xmm7,%xmm15 @@ -26404,7 +26624,7 @@ _sk_hue_sse41: .byte 65,15,88,214 // addps %xmm14,%xmm2 .byte 15,40,196 // movaps %xmm4,%xmm0 .byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1 - .byte 68,15,40,13,166,76,0,0 // movaps 0x4ca6(%rip),%xmm9 # 5c50 <_sk_callback_sse41+0x2ca> + .byte 68,15,40,13,86,77,0,0 // movaps 0x4d56(%rip),%xmm9 # 5d00 <_sk_callback_sse41+0x2c9> .byte 65,15,40,225 // movaps %xmm9,%xmm4 .byte 15,92,229 // subps %xmm5,%xmm4 .byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0 @@ -26498,14 +26718,14 @@ _sk_saturation_sse41: .byte 68,15,84,215 // andps %xmm7,%xmm10 .byte 68,15,84,223 // andps %xmm7,%xmm11 .byte 68,15,84,199 // andps %xmm7,%xmm8 - .byte 15,40,21,96,75,0,0 // movaps 0x4b60(%rip),%xmm2 # 5c60 <_sk_callback_sse41+0x2da> + .byte 15,40,21,16,76,0,0 // movaps 0x4c10(%rip),%xmm2 # 5d10 <_sk_callback_sse41+0x2d9> .byte 15,40,221 // movaps %xmm5,%xmm3 .byte 15,89,218 // mulps %xmm2,%xmm3 - .byte 15,40,13,99,75,0,0 // movaps 0x4b63(%rip),%xmm1 # 5c70 <_sk_callback_sse41+0x2ea> + .byte 15,40,13,19,76,0,0 // movaps 0x4c13(%rip),%xmm1 # 5d20 <_sk_callback_sse41+0x2e9> .byte 15,40,254 // movaps %xmm6,%xmm7 .byte 15,89,249 // mulps %xmm1,%xmm7 .byte 15,88,251 // addps %xmm3,%xmm7 - .byte 68,15,40,45,98,75,0,0 // movaps 0x4b62(%rip),%xmm13 # 5c80 <_sk_callback_sse41+0x2fa> + .byte 68,15,40,45,18,76,0,0 // movaps 0x4c12(%rip),%xmm13 # 5d30 <_sk_callback_sse41+0x2f9> .byte 69,15,89,245 // mulps %xmm13,%xmm14 .byte 68,15,88,247 // addps %xmm7,%xmm14 .byte 65,15,40,218 // movaps %xmm10,%xmm3 @@ -26586,7 +26806,7 @@ _sk_saturation_sse41: .byte 65,15,88,253 // addps %xmm13,%xmm7 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11 - .byte 68,15,40,13,40,74,0,0 // movaps 0x4a28(%rip),%xmm9 # 5c90 <_sk_callback_sse41+0x30a> + .byte 68,15,40,13,216,74,0,0 // movaps 0x4ad8(%rip),%xmm9 # 5d40 <_sk_callback_sse41+0x309> .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 68,15,92,204 // subps %xmm4,%xmm9 .byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7 @@ -26641,14 +26861,14 @@ _sk_color_sse41: .byte 15,40,231 // movaps %xmm7,%xmm4 .byte 68,15,89,244 // mulps %xmm4,%xmm14 .byte 15,89,204 // mulps %xmm4,%xmm1 - .byte 68,15,40,13,115,73,0,0 // movaps 0x4973(%rip),%xmm9 # 5ca0 <_sk_callback_sse41+0x31a> + .byte 68,15,40,13,35,74,0,0 // movaps 0x4a23(%rip),%xmm9 # 5d50 <_sk_callback_sse41+0x319> .byte 65,15,40,250 // movaps %xmm10,%xmm7 .byte 65,15,89,249 // mulps %xmm9,%xmm7 - .byte 68,15,40,21,115,73,0,0 // movaps 0x4973(%rip),%xmm10 # 5cb0 <_sk_callback_sse41+0x32a> + .byte 68,15,40,21,35,74,0,0 // movaps 0x4a23(%rip),%xmm10 # 5d60 <_sk_callback_sse41+0x329> .byte 65,15,40,219 // movaps %xmm11,%xmm3 .byte 65,15,89,218 // mulps %xmm10,%xmm3 .byte 15,88,223 // addps %xmm7,%xmm3 - .byte 68,15,40,29,112,73,0,0 // movaps 0x4970(%rip),%xmm11 # 5cc0 <_sk_callback_sse41+0x33a> + .byte 68,15,40,29,32,74,0,0 // movaps 0x4a20(%rip),%xmm11 # 5d70 <_sk_callback_sse41+0x339> .byte 69,15,40,236 // movaps %xmm12,%xmm13 .byte 69,15,89,235 // mulps %xmm11,%xmm13 .byte 68,15,88,235 // addps %xmm3,%xmm13 @@ -26733,7 +26953,7 @@ _sk_color_sse41: .byte 65,15,88,251 // addps %xmm11,%xmm7 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1 - .byte 68,15,40,13,44,72,0,0 // movaps 0x482c(%rip),%xmm9 # 5cd0 <_sk_callback_sse41+0x34a> + .byte 68,15,40,13,220,72,0,0 // movaps 0x48dc(%rip),%xmm9 # 5d80 <_sk_callback_sse41+0x349> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,92,196 // subps %xmm4,%xmm0 .byte 68,15,89,192 // mulps %xmm0,%xmm8 @@ -26785,13 +27005,13 @@ _sk_luminosity_sse41: .byte 69,15,89,216 // mulps %xmm8,%xmm11 .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,89,205 // mulps %xmm5,%xmm9 - .byte 68,15,40,5,132,71,0,0 // movaps 0x4784(%rip),%xmm8 # 5ce0 <_sk_callback_sse41+0x35a> + .byte 68,15,40,5,52,72,0,0 // movaps 0x4834(%rip),%xmm8 # 5d90 <_sk_callback_sse41+0x359> .byte 65,15,89,192 // mulps %xmm8,%xmm0 - .byte 68,15,40,21,136,71,0,0 // movaps 0x4788(%rip),%xmm10 # 5cf0 <_sk_callback_sse41+0x36a> + .byte 68,15,40,21,56,72,0,0 // movaps 0x4838(%rip),%xmm10 # 5da0 <_sk_callback_sse41+0x369> .byte 15,40,233 // movaps %xmm1,%xmm5 .byte 65,15,89,234 // mulps %xmm10,%xmm5 .byte 15,88,232 // addps %xmm0,%xmm5 - .byte 68,15,40,37,134,71,0,0 // movaps 0x4786(%rip),%xmm12 # 5d00 <_sk_callback_sse41+0x37a> + .byte 68,15,40,37,54,72,0,0 // movaps 0x4836(%rip),%xmm12 # 5db0 <_sk_callback_sse41+0x379> .byte 68,15,40,242 // movaps %xmm2,%xmm14 .byte 69,15,89,244 // mulps %xmm12,%xmm14 .byte 68,15,88,245 // addps %xmm5,%xmm14 @@ -26876,7 +27096,7 @@ _sk_luminosity_sse41: .byte 65,15,88,244 // addps %xmm12,%xmm6 .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9 - .byte 15,40,5,60,70,0,0 // movaps 0x463c(%rip),%xmm0 # 5d10 <_sk_callback_sse41+0x38a> + .byte 15,40,5,236,70,0,0 // movaps 0x46ec(%rip),%xmm0 # 5dc0 <_sk_callback_sse41+0x389> .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,92,215 // subps %xmm7,%xmm2 .byte 15,89,226 // mulps %xmm2,%xmm4 @@ -26919,20 +27139,20 @@ _sk_srcover_rgba_8888_sse41: .byte 15,133,217,0,0,0 // jne 1828 <_sk_srcover_rgba_8888_sse41+0xe7> .byte 243,15,111,60,144 // movdqu (%rax,%rdx,4),%xmm7 .byte 77,133,192 // test %r8,%r8 - .byte 102,15,111,37,193,69,0,0 // movdqa 0x45c1(%rip),%xmm4 # 5d20 <_sk_callback_sse41+0x39a> + .byte 102,15,111,37,113,70,0,0 // movdqa 0x4671(%rip),%xmm4 # 5dd0 <_sk_callback_sse41+0x399> .byte 102,15,219,231 // pand %xmm7,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 .byte 102,15,111,239 // movdqa %xmm7,%xmm5 - .byte 102,15,56,0,45,189,69,0,0 // pshufb 0x45bd(%rip),%xmm5 # 5d30 <_sk_callback_sse41+0x3aa> + .byte 102,15,56,0,45,109,70,0,0 // pshufb 0x466d(%rip),%xmm5 # 5de0 <_sk_callback_sse41+0x3a9> .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 .byte 102,15,111,247 // movdqa %xmm7,%xmm6 - .byte 102,15,56,0,53,189,69,0,0 // pshufb 0x45bd(%rip),%xmm6 # 5d40 <_sk_callback_sse41+0x3ba> + .byte 102,15,56,0,53,109,70,0,0 // pshufb 0x466d(%rip),%xmm6 # 5df0 <_sk_callback_sse41+0x3b9> .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 102,15,114,215,24 // psrld $0x18,%xmm7 .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 - .byte 68,15,40,5,186,69,0,0 // movaps 0x45ba(%rip),%xmm8 # 5d50 <_sk_callback_sse41+0x3ca> + .byte 68,15,40,5,106,70,0,0 // movaps 0x466a(%rip),%xmm8 # 5e00 <_sk_callback_sse41+0x3c9> .byte 68,15,92,195 // subps %xmm3,%xmm8 - .byte 68,15,40,37,190,69,0,0 // movaps 0x45be(%rip),%xmm12 # 5d60 <_sk_callback_sse41+0x3da> + .byte 68,15,40,37,110,70,0,0 // movaps 0x466e(%rip),%xmm12 # 5e10 <_sk_callback_sse41+0x3d9> .byte 65,15,89,196 // mulps %xmm12,%xmm0 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -27012,7 +27232,7 @@ HIDDEN _sk_clamp_1_sse41 .globl _sk_clamp_1_sse41 FUNCTION(_sk_clamp_1_sse41) _sk_clamp_1_sse41: - .byte 68,15,40,5,176,68,0,0 // movaps 0x44b0(%rip),%xmm8 # 5d70 <_sk_callback_sse41+0x3ea> + .byte 68,15,40,5,96,69,0,0 // movaps 0x4560(%rip),%xmm8 # 5e20 <_sk_callback_sse41+0x3e9> .byte 65,15,93,192 // minps %xmm8,%xmm0 .byte 65,15,93,200 // minps %xmm8,%xmm1 .byte 65,15,93,208 // minps %xmm8,%xmm2 @@ -27024,7 +27244,7 @@ HIDDEN _sk_clamp_a_sse41 .globl _sk_clamp_a_sse41 FUNCTION(_sk_clamp_a_sse41) _sk_clamp_a_sse41: - .byte 15,93,29,165,68,0,0 // minps 0x44a5(%rip),%xmm3 # 5d80 <_sk_callback_sse41+0x3fa> + .byte 15,93,29,85,69,0,0 // minps 0x4555(%rip),%xmm3 # 5e30 <_sk_callback_sse41+0x3f9> .byte 15,93,195 // minps %xmm3,%xmm0 .byte 15,93,203 // minps %xmm3,%xmm1 .byte 15,93,211 // minps %xmm3,%xmm2 @@ -27035,7 +27255,7 @@ HIDDEN _sk_clamp_a_dst_sse41 .globl _sk_clamp_a_dst_sse41 FUNCTION(_sk_clamp_a_dst_sse41) _sk_clamp_a_dst_sse41: - .byte 15,93,61,161,68,0,0 // minps 0x44a1(%rip),%xmm7 # 5d90 <_sk_callback_sse41+0x40a> + .byte 15,93,61,81,69,0,0 // minps 0x4551(%rip),%xmm7 # 5e40 <_sk_callback_sse41+0x409> .byte 15,93,231 // minps %xmm7,%xmm4 .byte 15,93,239 // minps %xmm7,%xmm5 .byte 15,93,247 // minps %xmm7,%xmm6 @@ -27103,7 +27323,7 @@ HIDDEN _sk_unpremul_sse41 FUNCTION(_sk_unpremul_sse41) _sk_unpremul_sse41: .byte 69,15,87,192 // xorps %xmm8,%xmm8 - .byte 68,15,40,13,60,68,0,0 // movaps 0x443c(%rip),%xmm9 # 5da0 <_sk_callback_sse41+0x41a> + .byte 68,15,40,13,236,68,0,0 // movaps 0x44ec(%rip),%xmm9 # 5e50 <_sk_callback_sse41+0x419> .byte 68,15,94,203 // divps %xmm3,%xmm9 .byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8 .byte 69,15,84,193 // andps %xmm9,%xmm8 @@ -27117,20 +27337,20 @@ HIDDEN _sk_from_srgb_sse41 .globl _sk_from_srgb_sse41 FUNCTION(_sk_from_srgb_sse41) _sk_from_srgb_sse41: - .byte 68,15,40,29,39,68,0,0 // movaps 0x4427(%rip),%xmm11 # 5db0 <_sk_callback_sse41+0x42a> + .byte 68,15,40,29,215,68,0,0 // movaps 0x44d7(%rip),%xmm11 # 5e60 <_sk_callback_sse41+0x429> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 .byte 68,15,40,208 // movaps %xmm0,%xmm10 .byte 69,15,89,210 // mulps %xmm10,%xmm10 - .byte 68,15,40,37,31,68,0,0 // movaps 0x441f(%rip),%xmm12 # 5dc0 <_sk_callback_sse41+0x43a> + .byte 68,15,40,37,207,68,0,0 // movaps 0x44cf(%rip),%xmm12 # 5e70 <_sk_callback_sse41+0x439> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,196 // mulps %xmm12,%xmm8 - .byte 68,15,40,45,31,68,0,0 // movaps 0x441f(%rip),%xmm13 # 5dd0 <_sk_callback_sse41+0x44a> + .byte 68,15,40,45,207,68,0,0 // movaps 0x44cf(%rip),%xmm13 # 5e80 <_sk_callback_sse41+0x449> .byte 69,15,88,197 // addps %xmm13,%xmm8 .byte 69,15,89,194 // mulps %xmm10,%xmm8 - .byte 68,15,40,53,31,68,0,0 // movaps 0x441f(%rip),%xmm14 # 5de0 <_sk_callback_sse41+0x45a> + .byte 68,15,40,53,207,68,0,0 // movaps 0x44cf(%rip),%xmm14 # 5e90 <_sk_callback_sse41+0x459> .byte 69,15,88,198 // addps %xmm14,%xmm8 - .byte 68,15,40,61,35,68,0,0 // movaps 0x4423(%rip),%xmm15 # 5df0 <_sk_callback_sse41+0x46a> + .byte 68,15,40,61,211,68,0,0 // movaps 0x44d3(%rip),%xmm15 # 5ea0 <_sk_callback_sse41+0x469> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 68,15,40,209 // movaps %xmm1,%xmm10 @@ -27167,19 +27387,19 @@ FUNCTION(_sk_from_srgb_dst_sse41) _sk_from_srgb_dst_sse41: .byte 68,15,40,204 // movaps %xmm4,%xmm9 .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,29,174,67,0,0 // movaps 0x43ae(%rip),%xmm11 # 5e00 <_sk_callback_sse41+0x47a> + .byte 68,15,40,29,94,68,0,0 // movaps 0x445e(%rip),%xmm11 # 5eb0 <_sk_callback_sse41+0x479> .byte 69,15,40,209 // movaps %xmm9,%xmm10 .byte 69,15,89,211 // mulps %xmm11,%xmm10 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 - .byte 68,15,40,37,167,67,0,0 // movaps 0x43a7(%rip),%xmm12 # 5e10 <_sk_callback_sse41+0x48a> + .byte 68,15,40,37,87,68,0,0 // movaps 0x4457(%rip),%xmm12 # 5ec0 <_sk_callback_sse41+0x489> .byte 65,15,89,228 // mulps %xmm12,%xmm4 - .byte 68,15,40,45,171,67,0,0 // movaps 0x43ab(%rip),%xmm13 # 5e20 <_sk_callback_sse41+0x49a> + .byte 68,15,40,45,91,68,0,0 // movaps 0x445b(%rip),%xmm13 # 5ed0 <_sk_callback_sse41+0x499> .byte 65,15,88,229 // addps %xmm13,%xmm4 .byte 15,89,224 // mulps %xmm0,%xmm4 - .byte 68,15,40,53,172,67,0,0 // movaps 0x43ac(%rip),%xmm14 # 5e30 <_sk_callback_sse41+0x4aa> + .byte 68,15,40,53,92,68,0,0 // movaps 0x445c(%rip),%xmm14 # 5ee0 <_sk_callback_sse41+0x4a9> .byte 65,15,88,230 // addps %xmm14,%xmm4 - .byte 68,15,40,61,176,67,0,0 // movaps 0x43b0(%rip),%xmm15 # 5e40 <_sk_callback_sse41+0x4ba> + .byte 68,15,40,61,96,68,0,0 // movaps 0x4460(%rip),%xmm15 # 5ef0 <_sk_callback_sse41+0x4b9> .byte 69,15,194,207,1 // cmpltps %xmm15,%xmm9 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 102,65,15,56,20,226 // blendvps %xmm0,%xmm10,%xmm4 @@ -27223,22 +27443,22 @@ _sk_to_srgb_sse41: .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 68,15,82,192 // rsqrtps %xmm0,%xmm8 - .byte 68,15,40,29,36,67,0,0 // movaps 0x4324(%rip),%xmm11 # 5e50 <_sk_callback_sse41+0x4ca> + .byte 68,15,40,29,212,67,0,0 // movaps 0x43d4(%rip),%xmm11 # 5f00 <_sk_callback_sse41+0x4c9> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 - .byte 68,15,40,37,36,67,0,0 // movaps 0x4324(%rip),%xmm12 # 5e60 <_sk_callback_sse41+0x4da> + .byte 68,15,40,37,212,67,0,0 // movaps 0x43d4(%rip),%xmm12 # 5f10 <_sk_callback_sse41+0x4d9> .byte 69,15,40,248 // movaps %xmm8,%xmm15 .byte 69,15,89,252 // mulps %xmm12,%xmm15 - .byte 68,15,40,21,36,67,0,0 // movaps 0x4324(%rip),%xmm10 # 5e70 <_sk_callback_sse41+0x4ea> + .byte 68,15,40,21,212,67,0,0 // movaps 0x43d4(%rip),%xmm10 # 5f20 <_sk_callback_sse41+0x4e9> .byte 69,15,88,250 // addps %xmm10,%xmm15 .byte 69,15,89,248 // mulps %xmm8,%xmm15 - .byte 68,15,40,45,36,67,0,0 // movaps 0x4324(%rip),%xmm13 # 5e80 <_sk_callback_sse41+0x4fa> + .byte 68,15,40,45,212,67,0,0 // movaps 0x43d4(%rip),%xmm13 # 5f30 <_sk_callback_sse41+0x4f9> .byte 69,15,88,253 // addps %xmm13,%xmm15 - .byte 68,15,40,53,40,67,0,0 // movaps 0x4328(%rip),%xmm14 # 5e90 <_sk_callback_sse41+0x50a> + .byte 68,15,40,53,216,67,0,0 // movaps 0x43d8(%rip),%xmm14 # 5f40 <_sk_callback_sse41+0x509> .byte 69,15,88,198 // addps %xmm14,%xmm8 .byte 69,15,83,192 // rcpps %xmm8,%xmm8 .byte 69,15,89,199 // mulps %xmm15,%xmm8 - .byte 68,15,40,61,36,67,0,0 // movaps 0x4324(%rip),%xmm15 # 5ea0 <_sk_callback_sse41+0x51a> + .byte 68,15,40,61,212,67,0,0 // movaps 0x43d4(%rip),%xmm15 # 5f50 <_sk_callback_sse41+0x519> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 68,15,82,202 // rsqrtps %xmm2,%xmm9 @@ -27291,7 +27511,7 @@ _sk_rgb_to_hsl_sse41: .byte 68,15,93,226 // minps %xmm2,%xmm12 .byte 65,15,40,203 // movaps %xmm11,%xmm1 .byte 65,15,92,204 // subps %xmm12,%xmm1 - .byte 68,15,40,53,113,66,0,0 // movaps 0x4271(%rip),%xmm14 # 5eb0 <_sk_callback_sse41+0x52a> + .byte 68,15,40,53,33,67,0,0 // movaps 0x4321(%rip),%xmm14 # 5f60 <_sk_callback_sse41+0x529> .byte 68,15,94,241 // divps %xmm1,%xmm14 .byte 69,15,40,211 // movaps %xmm11,%xmm10 .byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10 @@ -27300,27 +27520,27 @@ _sk_rgb_to_hsl_sse41: .byte 65,15,89,198 // mulps %xmm14,%xmm0 .byte 69,15,40,249 // movaps %xmm9,%xmm15 .byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15 - .byte 68,15,84,61,88,66,0,0 // andps 0x4258(%rip),%xmm15 # 5ec0 <_sk_callback_sse41+0x53a> + .byte 68,15,84,61,8,67,0,0 // andps 0x4308(%rip),%xmm15 # 5f70 <_sk_callback_sse41+0x539> .byte 68,15,88,248 // addps %xmm0,%xmm15 .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0 .byte 65,15,92,208 // subps %xmm8,%xmm2 .byte 65,15,89,214 // mulps %xmm14,%xmm2 - .byte 68,15,40,45,75,66,0,0 // movaps 0x424b(%rip),%xmm13 # 5ed0 <_sk_callback_sse41+0x54a> + .byte 68,15,40,45,251,66,0,0 // movaps 0x42fb(%rip),%xmm13 # 5f80 <_sk_callback_sse41+0x549> .byte 65,15,88,213 // addps %xmm13,%xmm2 .byte 69,15,92,193 // subps %xmm9,%xmm8 .byte 69,15,89,198 // mulps %xmm14,%xmm8 - .byte 68,15,88,5,71,66,0,0 // addps 0x4247(%rip),%xmm8 # 5ee0 <_sk_callback_sse41+0x55a> + .byte 68,15,88,5,247,66,0,0 // addps 0x42f7(%rip),%xmm8 # 5f90 <_sk_callback_sse41+0x559> .byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8 - .byte 68,15,89,5,63,66,0,0 // mulps 0x423f(%rip),%xmm8 # 5ef0 <_sk_callback_sse41+0x56a> + .byte 68,15,89,5,239,66,0,0 // mulps 0x42ef(%rip),%xmm8 # 5fa0 <_sk_callback_sse41+0x569> .byte 69,15,40,203 // movaps %xmm11,%xmm9 .byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9 .byte 69,15,84,193 // andps %xmm9,%xmm8 .byte 69,15,92,235 // subps %xmm11,%xmm13 .byte 69,15,88,220 // addps %xmm12,%xmm11 - .byte 15,40,5,51,66,0,0 // movaps 0x4233(%rip),%xmm0 # 5f00 <_sk_callback_sse41+0x57a> + .byte 15,40,5,227,66,0,0 // movaps 0x42e3(%rip),%xmm0 # 5fb0 <_sk_callback_sse41+0x579> .byte 65,15,40,211 // movaps %xmm11,%xmm2 .byte 15,89,208 // mulps %xmm0,%xmm2 .byte 15,194,194,1 // cmpltps %xmm2,%xmm0 @@ -27342,7 +27562,7 @@ _sk_hsl_to_rgb_sse41: .byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp) .byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp) .byte 68,15,40,208 // movaps %xmm0,%xmm10 - .byte 68,15,40,13,249,65,0,0 // movaps 0x41f9(%rip),%xmm9 # 5f10 <_sk_callback_sse41+0x58a> + .byte 68,15,40,13,169,66,0,0 // movaps 0x42a9(%rip),%xmm9 # 5fc0 <_sk_callback_sse41+0x589> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,194,194,2 // cmpleps %xmm2,%xmm0 .byte 15,40,217 // movaps %xmm1,%xmm3 @@ -27355,19 +27575,19 @@ _sk_hsl_to_rgb_sse41: .byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp) .byte 69,15,88,192 // addps %xmm8,%xmm8 .byte 68,15,92,197 // subps %xmm5,%xmm8 - .byte 68,15,40,53,212,65,0,0 // movaps 0x41d4(%rip),%xmm14 # 5f20 <_sk_callback_sse41+0x59a> + .byte 68,15,40,53,132,66,0,0 // movaps 0x4284(%rip),%xmm14 # 5fd0 <_sk_callback_sse41+0x599> .byte 69,15,88,242 // addps %xmm10,%xmm14 .byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0 .byte 68,15,92,240 // subps %xmm0,%xmm14 - .byte 68,15,40,29,205,65,0,0 // movaps 0x41cd(%rip),%xmm11 # 5f30 <_sk_callback_sse41+0x5aa> + .byte 68,15,40,29,125,66,0,0 // movaps 0x427d(%rip),%xmm11 # 5fe0 <_sk_callback_sse41+0x5a9> .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 15,40,245 // movaps %xmm5,%xmm6 .byte 65,15,92,240 // subps %xmm8,%xmm6 - .byte 15,40,61,198,65,0,0 // movaps 0x41c6(%rip),%xmm7 # 5f40 <_sk_callback_sse41+0x5ba> + .byte 15,40,61,118,66,0,0 // movaps 0x4276(%rip),%xmm7 # 5ff0 <_sk_callback_sse41+0x5b9> .byte 69,15,40,238 // movaps %xmm14,%xmm13 .byte 68,15,89,239 // mulps %xmm7,%xmm13 - .byte 15,40,29,199,65,0,0 // movaps 0x41c7(%rip),%xmm3 # 5f50 <_sk_callback_sse41+0x5ca> + .byte 15,40,29,119,66,0,0 // movaps 0x4277(%rip),%xmm3 # 6000 <_sk_callback_sse41+0x5c9> .byte 68,15,40,227 // movaps %xmm3,%xmm12 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 68,15,89,230 // mulps %xmm6,%xmm12 @@ -27377,7 +27597,7 @@ _sk_hsl_to_rgb_sse41: .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 68,15,40,253 // movaps %xmm5,%xmm15 .byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15 - .byte 68,15,40,37,166,65,0,0 // movaps 0x41a6(%rip),%xmm12 # 5f60 <_sk_callback_sse41+0x5da> + .byte 68,15,40,37,86,66,0,0 // movaps 0x4256(%rip),%xmm12 # 6010 <_sk_callback_sse41+0x5d9> .byte 65,15,40,196 // movaps %xmm12,%xmm0 .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 68,15,89,238 // mulps %xmm6,%xmm13 @@ -27411,7 +27631,7 @@ _sk_hsl_to_rgb_sse41: .byte 65,15,40,198 // movaps %xmm14,%xmm0 .byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2 .byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1 - .byte 68,15,88,21,30,65,0,0 // addps 0x411e(%rip),%xmm10 # 5f70 <_sk_callback_sse41+0x5ea> + .byte 68,15,88,21,206,65,0,0 // addps 0x41ce(%rip),%xmm10 # 6020 <_sk_callback_sse41+0x5e9> .byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0 .byte 68,15,92,208 // subps %xmm0,%xmm10 .byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11 @@ -27464,9 +27684,9 @@ _sk_scale_u8_sse41: .byte 77,133,192 // test %r8,%r8 .byte 117,52 // jne 1f2b <_sk_scale_u8_sse41+0x3e> .byte 102,69,15,56,49,4,18 // pmovzxbd (%r10,%rdx,1),%xmm8 - .byte 102,68,15,219,5,121,64,0,0 // pand 0x4079(%rip),%xmm8 # 5f80 <_sk_callback_sse41+0x5fa> + .byte 102,68,15,219,5,41,65,0,0 // pand 0x4129(%rip),%xmm8 # 6030 <_sk_callback_sse41+0x5f9> .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,125,64,0,0 // mulps 0x407d(%rip),%xmm8 # 5f90 <_sk_callback_sse41+0x60a> + .byte 68,15,89,5,45,65,0,0 // mulps 0x412d(%rip),%xmm8 # 6040 <_sk_callback_sse41+0x609> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 @@ -27526,9 +27746,9 @@ _sk_lerp_u8_sse41: .byte 77,133,192 // test %r8,%r8 .byte 117,72 // jne 200c <_sk_lerp_u8_sse41+0x52> .byte 102,69,15,56,49,4,18 // pmovzxbd (%r10,%rdx,1),%xmm8 - .byte 102,68,15,219,5,204,63,0,0 // pand 0x3fcc(%rip),%xmm8 # 5fa0 <_sk_callback_sse41+0x61a> + .byte 102,68,15,219,5,124,64,0,0 // pand 0x407c(%rip),%xmm8 # 6050 <_sk_callback_sse41+0x619> .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,208,63,0,0 // mulps 0x3fd0(%rip),%xmm8 # 5fb0 <_sk_callback_sse41+0x62a> + .byte 68,15,89,5,128,64,0,0 // mulps 0x4080(%rip),%xmm8 # 6060 <_sk_callback_sse41+0x629> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -27573,17 +27793,17 @@ _sk_lerp_565_sse41: .byte 77,133,192 // test %r8,%r8 .byte 15,133,152,0,0,0 // jne 210c <_sk_lerp_565_sse41+0xa6> .byte 102,69,15,56,51,20,82 // pmovzxwd (%r10,%rdx,2),%xmm10 - .byte 102,68,15,111,5,60,63,0,0 // movdqa 0x3f3c(%rip),%xmm8 # 5fc0 <_sk_callback_sse41+0x63a> + .byte 102,68,15,111,5,236,63,0,0 // movdqa 0x3fec(%rip),%xmm8 # 6070 <_sk_callback_sse41+0x639> .byte 102,69,15,219,194 // pand %xmm10,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,59,63,0,0 // mulps 0x3f3b(%rip),%xmm8 # 5fd0 <_sk_callback_sse41+0x64a> - .byte 102,68,15,111,13,66,63,0,0 // movdqa 0x3f42(%rip),%xmm9 # 5fe0 <_sk_callback_sse41+0x65a> + .byte 68,15,89,5,235,63,0,0 // mulps 0x3feb(%rip),%xmm8 # 6080 <_sk_callback_sse41+0x649> + .byte 102,68,15,111,13,242,63,0,0 // movdqa 0x3ff2(%rip),%xmm9 # 6090 <_sk_callback_sse41+0x659> .byte 102,69,15,219,202 // pand %xmm10,%xmm9 .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9 - .byte 68,15,89,13,65,63,0,0 // mulps 0x3f41(%rip),%xmm9 # 5ff0 <_sk_callback_sse41+0x66a> - .byte 102,68,15,219,21,72,63,0,0 // pand 0x3f48(%rip),%xmm10 # 6000 <_sk_callback_sse41+0x67a> + .byte 68,15,89,13,241,63,0,0 // mulps 0x3ff1(%rip),%xmm9 # 60a0 <_sk_callback_sse41+0x669> + .byte 102,68,15,219,21,248,63,0,0 // pand 0x3ff8(%rip),%xmm10 # 60b0 <_sk_callback_sse41+0x679> .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 - .byte 68,15,89,21,76,63,0,0 // mulps 0x3f4c(%rip),%xmm10 # 6010 <_sk_callback_sse41+0x68a> + .byte 68,15,89,21,252,63,0,0 // mulps 0x3ffc(%rip),%xmm10 # 60c0 <_sk_callback_sse41+0x689> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -27637,7 +27857,7 @@ _sk_load_tables_sse41: .byte 65,87 // push %r15 .byte 65,86 // push %r14 .byte 83 // push %rbx - .byte 102,15,111,5,153,62,0,0 // movdqa 0x3e99(%rip),%xmm0 # 6020 <_sk_callback_sse41+0x69a> + .byte 102,15,111,5,73,63,0,0 // movdqa 0x3f49(%rip),%xmm0 # 60d0 <_sk_callback_sse41+0x699> .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9 .byte 102,73,15,126,194 // movq %xmm0,%r10 @@ -27652,7 +27872,7 @@ _sk_load_tables_sse41: .byte 102,66,15,58,33,4,179,32 // insertps $0x20,(%rbx,%r14,4),%xmm0 .byte 102,66,15,58,33,4,11,48 // insertps $0x30,(%rbx,%r9,1),%xmm0 .byte 102,65,15,111,200 // movdqa %xmm8,%xmm1 - .byte 102,15,56,0,13,84,62,0,0 // pshufb 0x3e54(%rip),%xmm1 # 6030 <_sk_callback_sse41+0x6aa> + .byte 102,15,56,0,13,4,63,0,0 // pshufb 0x3f04(%rip),%xmm1 # 60e0 <_sk_callback_sse41+0x6a9> .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,203 // movq %xmm1,%rbx .byte 68,15,182,211 // movzbl %bl,%r10d @@ -27667,7 +27887,7 @@ _sk_load_tables_sse41: .byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1 .byte 76,139,72,24 // mov 0x18(%rax),%r9 .byte 102,65,15,111,208 // movdqa %xmm8,%xmm2 - .byte 102,15,56,0,21,16,62,0,0 // pshufb 0x3e10(%rip),%xmm2 # 6040 <_sk_callback_sse41+0x6ba> + .byte 102,15,56,0,21,192,62,0,0 // pshufb 0x3ec0(%rip),%xmm2 # 60f0 <_sk_callback_sse41+0x6b9> .byte 102,72,15,58,22,211,1 // pextrq $0x1,%xmm2,%rbx .byte 102,72,15,126,208 // movq %xmm2,%rax .byte 68,15,182,208 // movzbl %al,%r10d @@ -27682,7 +27902,7 @@ _sk_load_tables_sse41: .byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2 .byte 102,65,15,114,208,24 // psrld $0x18,%xmm8 .byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3 - .byte 15,89,29,205,61,0,0 // mulps 0x3dcd(%rip),%xmm3 # 6050 <_sk_callback_sse41+0x6ca> + .byte 15,89,29,125,62,0,0 // mulps 0x3e7d(%rip),%xmm3 # 6100 <_sk_callback_sse41+0x6c9> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 65,94 // pop %r14 @@ -27725,7 +27945,7 @@ _sk_load_tables_u16_be_sse41: .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 - .byte 102,68,15,111,5,59,61,0,0 // movdqa 0x3d3b(%rip),%xmm8 # 6060 <_sk_callback_sse41+0x6da> + .byte 102,68,15,111,5,235,61,0,0 // movdqa 0x3deb(%rip),%xmm8 # 6110 <_sk_callback_sse41+0x6d9> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 @@ -27743,7 +27963,7 @@ _sk_load_tables_u16_be_sse41: .byte 102,15,58,33,194,32 // insertps $0x20,%xmm2,%xmm0 .byte 243,66,15,16,20,11 // movss (%rbx,%r9,1),%xmm2 .byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0 - .byte 102,15,56,0,13,234,60,0,0 // pshufb 0x3cea(%rip),%xmm1 # 6070 <_sk_callback_sse41+0x6ea> + .byte 102,15,56,0,13,154,61,0,0 // pshufb 0x3d9a(%rip),%xmm1 # 6120 <_sk_callback_sse41+0x6e9> .byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1 .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,203 // movq %xmm1,%rbx @@ -27779,7 +27999,7 @@ _sk_load_tables_u16_be_sse41: .byte 102,65,15,235,216 // por %xmm8,%xmm3 .byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,56,60,0,0 // mulps 0x3c38(%rip),%xmm3 # 6080 <_sk_callback_sse41+0x6fa> + .byte 15,89,29,232,60,0,0 // mulps 0x3ce8(%rip),%xmm3 # 6130 <_sk_callback_sse41+0x6f9> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 65,94 // pop %r14 @@ -27821,7 +28041,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9 .byte 102,15,111,202 // movdqa %xmm2,%xmm1 .byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1 - .byte 102,68,15,111,5,173,59,0,0 // movdqa 0x3bad(%rip),%xmm8 # 6090 <_sk_callback_sse41+0x70a> + .byte 102,68,15,111,5,93,60,0,0 // movdqa 0x3c5d(%rip),%xmm8 # 6140 <_sk_callback_sse41+0x709> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 @@ -27839,7 +28059,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 102,15,58,33,195,32 // insertps $0x20,%xmm3,%xmm0 .byte 243,66,15,16,28,11 // movss (%rbx,%r9,1),%xmm3 .byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0 - .byte 102,15,56,0,13,92,59,0,0 // pshufb 0x3b5c(%rip),%xmm1 # 60a0 <_sk_callback_sse41+0x71a> + .byte 102,15,56,0,13,12,60,0,0 // pshufb 0x3c0c(%rip),%xmm1 # 6150 <_sk_callback_sse41+0x719> .byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1 .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,203 // movq %xmm1,%rbx @@ -27870,7 +28090,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 243,65,15,16,28,25 // movss (%r9,%rbx,1),%xmm3 .byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,199,58,0,0 // movaps 0x3ac7(%rip),%xmm3 # 60b0 <_sk_callback_sse41+0x72a> + .byte 15,40,29,119,59,0,0 // movaps 0x3b77(%rip),%xmm3 # 6160 <_sk_callback_sse41+0x729> .byte 91 // pop %rbx .byte 65,94 // pop %r14 .byte 65,95 // pop %r15 @@ -27904,7 +28124,7 @@ _sk_byte_tables_sse41: .byte 65,84 // push %r12 .byte 83 // push %rbx .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,95,58,0,0 // movaps 0x3a5f(%rip),%xmm8 # 60c0 <_sk_callback_sse41+0x73a> + .byte 68,15,40,5,15,59,0,0 // movaps 0x3b0f(%rip),%xmm8 # 6170 <_sk_callback_sse41+0x739> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9 @@ -27923,7 +28143,7 @@ _sk_byte_tables_sse41: .byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,13,16,58,0,0 // movaps 0x3a10(%rip),%xmm9 # 60d0 <_sk_callback_sse41+0x74a> + .byte 68,15,40,13,192,58,0,0 // movaps 0x3ac0(%rip),%xmm9 # 6180 <_sk_callback_sse41+0x749> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -28019,7 +28239,7 @@ _sk_byte_tables_rgb_sse41: .byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,13,136,56,0,0 // movaps 0x3888(%rip),%xmm9 # 60e0 <_sk_callback_sse41+0x75a> + .byte 68,15,40,13,56,57,0,0 // movaps 0x3938(%rip),%xmm9 # 6190 <_sk_callback_sse41+0x759> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -28206,31 +28426,31 @@ _sk_parametric_r_sse41: .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8 - .byte 68,15,89,5,208,53,0,0 // mulps 0x35d0(%rip),%xmm8 # 60f0 <_sk_callback_sse41+0x76a> - .byte 68,15,84,21,216,53,0,0 // andps 0x35d8(%rip),%xmm10 # 6100 <_sk_callback_sse41+0x77a> - .byte 68,15,86,21,224,53,0,0 // orps 0x35e0(%rip),%xmm10 # 6110 <_sk_callback_sse41+0x78a> - .byte 68,15,88,5,232,53,0,0 // addps 0x35e8(%rip),%xmm8 # 6120 <_sk_callback_sse41+0x79a> - .byte 68,15,40,37,240,53,0,0 // movaps 0x35f0(%rip),%xmm12 # 6130 <_sk_callback_sse41+0x7aa> + .byte 68,15,89,5,128,54,0,0 // mulps 0x3680(%rip),%xmm8 # 61a0 <_sk_callback_sse41+0x769> + .byte 68,15,84,21,136,54,0,0 // andps 0x3688(%rip),%xmm10 # 61b0 <_sk_callback_sse41+0x779> + .byte 68,15,86,21,144,54,0,0 // orps 0x3690(%rip),%xmm10 # 61c0 <_sk_callback_sse41+0x789> + .byte 68,15,88,5,152,54,0,0 // addps 0x3698(%rip),%xmm8 # 61d0 <_sk_callback_sse41+0x799> + .byte 68,15,40,37,160,54,0,0 // movaps 0x36a0(%rip),%xmm12 # 61e0 <_sk_callback_sse41+0x7a9> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,196 // subps %xmm12,%xmm8 - .byte 68,15,88,21,240,53,0,0 // addps 0x35f0(%rip),%xmm10 # 6140 <_sk_callback_sse41+0x7ba> - .byte 68,15,40,37,248,53,0,0 // movaps 0x35f8(%rip),%xmm12 # 6150 <_sk_callback_sse41+0x7ca> + .byte 68,15,88,21,160,54,0,0 // addps 0x36a0(%rip),%xmm10 # 61f0 <_sk_callback_sse41+0x7b9> + .byte 68,15,40,37,168,54,0,0 // movaps 0x36a8(%rip),%xmm12 # 6200 <_sk_callback_sse41+0x7c9> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,196 // subps %xmm12,%xmm8 .byte 69,15,89,195 // mulps %xmm11,%xmm8 .byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10 .byte 69,15,40,216 // movaps %xmm8,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,5,229,53,0,0 // addps 0x35e5(%rip),%xmm8 # 6160 <_sk_callback_sse41+0x7da> - .byte 68,15,40,21,237,53,0,0 // movaps 0x35ed(%rip),%xmm10 # 6170 <_sk_callback_sse41+0x7ea> + .byte 68,15,88,5,149,54,0,0 // addps 0x3695(%rip),%xmm8 # 6210 <_sk_callback_sse41+0x7d9> + .byte 68,15,40,21,157,54,0,0 // movaps 0x369d(%rip),%xmm10 # 6220 <_sk_callback_sse41+0x7e9> .byte 69,15,89,211 // mulps %xmm11,%xmm10 .byte 69,15,92,194 // subps %xmm10,%xmm8 - .byte 68,15,40,21,237,53,0,0 // movaps 0x35ed(%rip),%xmm10 # 6180 <_sk_callback_sse41+0x7fa> + .byte 68,15,40,21,157,54,0,0 // movaps 0x369d(%rip),%xmm10 # 6230 <_sk_callback_sse41+0x7f9> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 68,15,40,29,241,53,0,0 // movaps 0x35f1(%rip),%xmm11 # 6190 <_sk_callback_sse41+0x80a> + .byte 68,15,40,29,161,54,0,0 // movaps 0x36a1(%rip),%xmm11 # 6240 <_sk_callback_sse41+0x809> .byte 69,15,94,218 // divps %xmm10,%xmm11 .byte 69,15,88,216 // addps %xmm8,%xmm11 - .byte 68,15,89,29,241,53,0,0 // mulps 0x35f1(%rip),%xmm11 # 61a0 <_sk_callback_sse41+0x81a> + .byte 68,15,89,29,161,54,0,0 // mulps 0x36a1(%rip),%xmm11 # 6250 <_sk_callback_sse41+0x819> .byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10 .byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 @@ -28238,7 +28458,7 @@ _sk_parametric_r_sse41: .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 68,15,95,192 // maxps %xmm0,%xmm8 - .byte 68,15,93,5,216,53,0,0 // minps 0x35d8(%rip),%xmm8 # 61b0 <_sk_callback_sse41+0x82a> + .byte 68,15,93,5,136,54,0,0 // minps 0x3688(%rip),%xmm8 # 6260 <_sk_callback_sse41+0x829> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -28268,31 +28488,31 @@ _sk_parametric_g_sse41: .byte 68,15,88,217 // addps %xmm1,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,121,53,0,0 // mulps 0x3579(%rip),%xmm12 # 61c0 <_sk_callback_sse41+0x83a> - .byte 68,15,84,29,129,53,0,0 // andps 0x3581(%rip),%xmm11 # 61d0 <_sk_callback_sse41+0x84a> - .byte 68,15,86,29,137,53,0,0 // orps 0x3589(%rip),%xmm11 # 61e0 <_sk_callback_sse41+0x85a> - .byte 68,15,88,37,145,53,0,0 // addps 0x3591(%rip),%xmm12 # 61f0 <_sk_callback_sse41+0x86a> - .byte 15,40,13,154,53,0,0 // movaps 0x359a(%rip),%xmm1 # 6200 <_sk_callback_sse41+0x87a> + .byte 68,15,89,37,41,54,0,0 // mulps 0x3629(%rip),%xmm12 # 6270 <_sk_callback_sse41+0x839> + .byte 68,15,84,29,49,54,0,0 // andps 0x3631(%rip),%xmm11 # 6280 <_sk_callback_sse41+0x849> + .byte 68,15,86,29,57,54,0,0 // orps 0x3639(%rip),%xmm11 # 6290 <_sk_callback_sse41+0x859> + .byte 68,15,88,37,65,54,0,0 // addps 0x3641(%rip),%xmm12 # 62a0 <_sk_callback_sse41+0x869> + .byte 15,40,13,74,54,0,0 // movaps 0x364a(%rip),%xmm1 # 62b0 <_sk_callback_sse41+0x879> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 - .byte 68,15,88,29,154,53,0,0 // addps 0x359a(%rip),%xmm11 # 6210 <_sk_callback_sse41+0x88a> - .byte 15,40,13,163,53,0,0 // movaps 0x35a3(%rip),%xmm1 # 6220 <_sk_callback_sse41+0x89a> + .byte 68,15,88,29,74,54,0,0 // addps 0x364a(%rip),%xmm11 # 62c0 <_sk_callback_sse41+0x889> + .byte 15,40,13,83,54,0,0 // movaps 0x3653(%rip),%xmm1 # 62d0 <_sk_callback_sse41+0x899> .byte 65,15,94,203 // divps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,144,53,0,0 // addps 0x3590(%rip),%xmm12 # 6230 <_sk_callback_sse41+0x8aa> - .byte 15,40,13,153,53,0,0 // movaps 0x3599(%rip),%xmm1 # 6240 <_sk_callback_sse41+0x8ba> + .byte 68,15,88,37,64,54,0,0 // addps 0x3640(%rip),%xmm12 # 62e0 <_sk_callback_sse41+0x8a9> + .byte 15,40,13,73,54,0,0 // movaps 0x3649(%rip),%xmm1 # 62f0 <_sk_callback_sse41+0x8b9> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 - .byte 68,15,40,21,153,53,0,0 // movaps 0x3599(%rip),%xmm10 # 6250 <_sk_callback_sse41+0x8ca> + .byte 68,15,40,21,73,54,0,0 // movaps 0x3649(%rip),%xmm10 # 6300 <_sk_callback_sse41+0x8c9> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,13,158,53,0,0 // movaps 0x359e(%rip),%xmm1 # 6260 <_sk_callback_sse41+0x8da> + .byte 15,40,13,78,54,0,0 // movaps 0x364e(%rip),%xmm1 # 6310 <_sk_callback_sse41+0x8d9> .byte 65,15,94,202 // divps %xmm10,%xmm1 .byte 65,15,88,204 // addps %xmm12,%xmm1 - .byte 15,89,13,159,53,0,0 // mulps 0x359f(%rip),%xmm1 # 6270 <_sk_callback_sse41+0x8ea> + .byte 15,89,13,79,54,0,0 // mulps 0x364f(%rip),%xmm1 # 6320 <_sk_callback_sse41+0x8e9> .byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10 .byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1 .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1 @@ -28300,7 +28520,7 @@ _sk_parametric_g_sse41: .byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,200 // maxps %xmm0,%xmm1 - .byte 15,93,13,138,53,0,0 // minps 0x358a(%rip),%xmm1 # 6280 <_sk_callback_sse41+0x8fa> + .byte 15,93,13,58,54,0,0 // minps 0x363a(%rip),%xmm1 # 6330 <_sk_callback_sse41+0x8f9> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -28330,31 +28550,31 @@ _sk_parametric_b_sse41: .byte 68,15,88,218 // addps %xmm2,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,43,53,0,0 // mulps 0x352b(%rip),%xmm12 # 6290 <_sk_callback_sse41+0x90a> - .byte 68,15,84,29,51,53,0,0 // andps 0x3533(%rip),%xmm11 # 62a0 <_sk_callback_sse41+0x91a> - .byte 68,15,86,29,59,53,0,0 // orps 0x353b(%rip),%xmm11 # 62b0 <_sk_callback_sse41+0x92a> - .byte 68,15,88,37,67,53,0,0 // addps 0x3543(%rip),%xmm12 # 62c0 <_sk_callback_sse41+0x93a> - .byte 15,40,21,76,53,0,0 // movaps 0x354c(%rip),%xmm2 # 62d0 <_sk_callback_sse41+0x94a> + .byte 68,15,89,37,219,53,0,0 // mulps 0x35db(%rip),%xmm12 # 6340 <_sk_callback_sse41+0x909> + .byte 68,15,84,29,227,53,0,0 // andps 0x35e3(%rip),%xmm11 # 6350 <_sk_callback_sse41+0x919> + .byte 68,15,86,29,235,53,0,0 // orps 0x35eb(%rip),%xmm11 # 6360 <_sk_callback_sse41+0x929> + .byte 68,15,88,37,243,53,0,0 // addps 0x35f3(%rip),%xmm12 # 6370 <_sk_callback_sse41+0x939> + .byte 15,40,21,252,53,0,0 // movaps 0x35fc(%rip),%xmm2 # 6380 <_sk_callback_sse41+0x949> .byte 65,15,89,211 // mulps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 - .byte 68,15,88,29,76,53,0,0 // addps 0x354c(%rip),%xmm11 # 62e0 <_sk_callback_sse41+0x95a> - .byte 15,40,21,85,53,0,0 // movaps 0x3555(%rip),%xmm2 # 62f0 <_sk_callback_sse41+0x96a> + .byte 68,15,88,29,252,53,0,0 // addps 0x35fc(%rip),%xmm11 # 6390 <_sk_callback_sse41+0x959> + .byte 15,40,21,5,54,0,0 // movaps 0x3605(%rip),%xmm2 # 63a0 <_sk_callback_sse41+0x969> .byte 65,15,94,211 // divps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,66,53,0,0 // addps 0x3542(%rip),%xmm12 # 6300 <_sk_callback_sse41+0x97a> - .byte 15,40,21,75,53,0,0 // movaps 0x354b(%rip),%xmm2 # 6310 <_sk_callback_sse41+0x98a> + .byte 68,15,88,37,242,53,0,0 // addps 0x35f2(%rip),%xmm12 # 63b0 <_sk_callback_sse41+0x979> + .byte 15,40,21,251,53,0,0 // movaps 0x35fb(%rip),%xmm2 # 63c0 <_sk_callback_sse41+0x989> .byte 65,15,89,211 // mulps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 - .byte 68,15,40,21,75,53,0,0 // movaps 0x354b(%rip),%xmm10 # 6320 <_sk_callback_sse41+0x99a> + .byte 68,15,40,21,251,53,0,0 // movaps 0x35fb(%rip),%xmm10 # 63d0 <_sk_callback_sse41+0x999> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,21,80,53,0,0 // movaps 0x3550(%rip),%xmm2 # 6330 <_sk_callback_sse41+0x9aa> + .byte 15,40,21,0,54,0,0 // movaps 0x3600(%rip),%xmm2 # 63e0 <_sk_callback_sse41+0x9a9> .byte 65,15,94,210 // divps %xmm10,%xmm2 .byte 65,15,88,212 // addps %xmm12,%xmm2 - .byte 15,89,21,81,53,0,0 // mulps 0x3551(%rip),%xmm2 # 6340 <_sk_callback_sse41+0x9ba> + .byte 15,89,21,1,54,0,0 // mulps 0x3601(%rip),%xmm2 # 63f0 <_sk_callback_sse41+0x9b9> .byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10 .byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2 .byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2 @@ -28362,7 +28582,7 @@ _sk_parametric_b_sse41: .byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,208 // maxps %xmm0,%xmm2 - .byte 15,93,21,60,53,0,0 // minps 0x353c(%rip),%xmm2 # 6350 <_sk_callback_sse41+0x9ca> + .byte 15,93,21,236,53,0,0 // minps 0x35ec(%rip),%xmm2 # 6400 <_sk_callback_sse41+0x9c9> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -28392,31 +28612,31 @@ _sk_parametric_a_sse41: .byte 68,15,88,219 // addps %xmm3,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,221,52,0,0 // mulps 0x34dd(%rip),%xmm12 # 6360 <_sk_callback_sse41+0x9da> - .byte 68,15,84,29,229,52,0,0 // andps 0x34e5(%rip),%xmm11 # 6370 <_sk_callback_sse41+0x9ea> - .byte 68,15,86,29,237,52,0,0 // orps 0x34ed(%rip),%xmm11 # 6380 <_sk_callback_sse41+0x9fa> - .byte 68,15,88,37,245,52,0,0 // addps 0x34f5(%rip),%xmm12 # 6390 <_sk_callback_sse41+0xa0a> - .byte 15,40,29,254,52,0,0 // movaps 0x34fe(%rip),%xmm3 # 63a0 <_sk_callback_sse41+0xa1a> + .byte 68,15,89,37,141,53,0,0 // mulps 0x358d(%rip),%xmm12 # 6410 <_sk_callback_sse41+0x9d9> + .byte 68,15,84,29,149,53,0,0 // andps 0x3595(%rip),%xmm11 # 6420 <_sk_callback_sse41+0x9e9> + .byte 68,15,86,29,157,53,0,0 // orps 0x359d(%rip),%xmm11 # 6430 <_sk_callback_sse41+0x9f9> + .byte 68,15,88,37,165,53,0,0 // addps 0x35a5(%rip),%xmm12 # 6440 <_sk_callback_sse41+0xa09> + .byte 15,40,29,174,53,0,0 // movaps 0x35ae(%rip),%xmm3 # 6450 <_sk_callback_sse41+0xa19> .byte 65,15,89,219 // mulps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 - .byte 68,15,88,29,254,52,0,0 // addps 0x34fe(%rip),%xmm11 # 63b0 <_sk_callback_sse41+0xa2a> - .byte 15,40,29,7,53,0,0 // movaps 0x3507(%rip),%xmm3 # 63c0 <_sk_callback_sse41+0xa3a> + .byte 68,15,88,29,174,53,0,0 // addps 0x35ae(%rip),%xmm11 # 6460 <_sk_callback_sse41+0xa29> + .byte 15,40,29,183,53,0,0 // movaps 0x35b7(%rip),%xmm3 # 6470 <_sk_callback_sse41+0xa39> .byte 65,15,94,219 // divps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,244,52,0,0 // addps 0x34f4(%rip),%xmm12 # 63d0 <_sk_callback_sse41+0xa4a> - .byte 15,40,29,253,52,0,0 // movaps 0x34fd(%rip),%xmm3 # 63e0 <_sk_callback_sse41+0xa5a> + .byte 68,15,88,37,164,53,0,0 // addps 0x35a4(%rip),%xmm12 # 6480 <_sk_callback_sse41+0xa49> + .byte 15,40,29,173,53,0,0 // movaps 0x35ad(%rip),%xmm3 # 6490 <_sk_callback_sse41+0xa59> .byte 65,15,89,219 // mulps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 - .byte 68,15,40,21,253,52,0,0 // movaps 0x34fd(%rip),%xmm10 # 63f0 <_sk_callback_sse41+0xa6a> + .byte 68,15,40,21,173,53,0,0 // movaps 0x35ad(%rip),%xmm10 # 64a0 <_sk_callback_sse41+0xa69> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,29,2,53,0,0 // movaps 0x3502(%rip),%xmm3 # 6400 <_sk_callback_sse41+0xa7a> + .byte 15,40,29,178,53,0,0 // movaps 0x35b2(%rip),%xmm3 # 64b0 <_sk_callback_sse41+0xa79> .byte 65,15,94,218 // divps %xmm10,%xmm3 .byte 65,15,88,220 // addps %xmm12,%xmm3 - .byte 15,89,29,3,53,0,0 // mulps 0x3503(%rip),%xmm3 # 6410 <_sk_callback_sse41+0xa8a> + .byte 15,89,29,179,53,0,0 // mulps 0x35b3(%rip),%xmm3 # 64c0 <_sk_callback_sse41+0xa89> .byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10 .byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 @@ -28424,7 +28644,7 @@ _sk_parametric_a_sse41: .byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,216 // maxps %xmm0,%xmm3 - .byte 15,93,29,238,52,0,0 // minps 0x34ee(%rip),%xmm3 # 6420 <_sk_callback_sse41+0xa9a> + .byte 15,93,29,158,53,0,0 // minps 0x359e(%rip),%xmm3 # 64d0 <_sk_callback_sse41+0xa99> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -28434,29 +28654,29 @@ HIDDEN _sk_lab_to_xyz_sse41 FUNCTION(_sk_lab_to_xyz_sse41) _sk_lab_to_xyz_sse41: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,89,5,234,52,0,0 // mulps 0x34ea(%rip),%xmm8 # 6430 <_sk_callback_sse41+0xaaa> - .byte 68,15,40,13,242,52,0,0 // movaps 0x34f2(%rip),%xmm9 # 6440 <_sk_callback_sse41+0xaba> + .byte 68,15,89,5,154,53,0,0 // mulps 0x359a(%rip),%xmm8 # 64e0 <_sk_callback_sse41+0xaa9> + .byte 68,15,40,13,162,53,0,0 // movaps 0x35a2(%rip),%xmm9 # 64f0 <_sk_callback_sse41+0xab9> .byte 65,15,89,201 // mulps %xmm9,%xmm1 - .byte 15,40,5,247,52,0,0 // movaps 0x34f7(%rip),%xmm0 # 6450 <_sk_callback_sse41+0xaca> + .byte 15,40,5,167,53,0,0 // movaps 0x35a7(%rip),%xmm0 # 6500 <_sk_callback_sse41+0xac9> .byte 15,88,200 // addps %xmm0,%xmm1 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 15,88,208 // addps %xmm0,%xmm2 - .byte 68,15,88,5,245,52,0,0 // addps 0x34f5(%rip),%xmm8 # 6460 <_sk_callback_sse41+0xada> - .byte 68,15,89,5,253,52,0,0 // mulps 0x34fd(%rip),%xmm8 # 6470 <_sk_callback_sse41+0xaea> - .byte 15,89,13,6,53,0,0 // mulps 0x3506(%rip),%xmm1 # 6480 <_sk_callback_sse41+0xafa> + .byte 68,15,88,5,165,53,0,0 // addps 0x35a5(%rip),%xmm8 # 6510 <_sk_callback_sse41+0xad9> + .byte 68,15,89,5,173,53,0,0 // mulps 0x35ad(%rip),%xmm8 # 6520 <_sk_callback_sse41+0xae9> + .byte 15,89,13,182,53,0,0 // mulps 0x35b6(%rip),%xmm1 # 6530 <_sk_callback_sse41+0xaf9> .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 15,89,21,11,53,0,0 // mulps 0x350b(%rip),%xmm2 # 6490 <_sk_callback_sse41+0xb0a> + .byte 15,89,21,187,53,0,0 // mulps 0x35bb(%rip),%xmm2 # 6540 <_sk_callback_sse41+0xb09> .byte 69,15,40,208 // movaps %xmm8,%xmm10 .byte 68,15,92,210 // subps %xmm2,%xmm10 .byte 68,15,40,217 // movaps %xmm1,%xmm11 .byte 69,15,89,219 // mulps %xmm11,%xmm11 .byte 68,15,89,217 // mulps %xmm1,%xmm11 - .byte 68,15,40,13,255,52,0,0 // movaps 0x34ff(%rip),%xmm9 # 64a0 <_sk_callback_sse41+0xb1a> + .byte 68,15,40,13,175,53,0,0 // movaps 0x35af(%rip),%xmm9 # 6550 <_sk_callback_sse41+0xb19> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0 - .byte 15,40,21,255,52,0,0 // movaps 0x34ff(%rip),%xmm2 # 64b0 <_sk_callback_sse41+0xb2a> + .byte 15,40,21,175,53,0,0 // movaps 0x35af(%rip),%xmm2 # 6560 <_sk_callback_sse41+0xb29> .byte 15,88,202 // addps %xmm2,%xmm1 - .byte 68,15,40,37,4,53,0,0 // movaps 0x3504(%rip),%xmm12 # 64c0 <_sk_callback_sse41+0xb3a> + .byte 68,15,40,37,180,53,0,0 // movaps 0x35b4(%rip),%xmm12 # 6570 <_sk_callback_sse41+0xb39> .byte 65,15,89,204 // mulps %xmm12,%xmm1 .byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1 .byte 69,15,40,216 // movaps %xmm8,%xmm11 @@ -28475,8 +28695,8 @@ _sk_lab_to_xyz_sse41: .byte 65,15,89,212 // mulps %xmm12,%xmm2 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2 - .byte 15,89,13,189,52,0,0 // mulps 0x34bd(%rip),%xmm1 # 64d0 <_sk_callback_sse41+0xb4a> - .byte 15,89,21,198,52,0,0 // mulps 0x34c6(%rip),%xmm2 # 64e0 <_sk_callback_sse41+0xb5a> + .byte 15,89,13,109,53,0,0 // mulps 0x356d(%rip),%xmm1 # 6580 <_sk_callback_sse41+0xb49> + .byte 15,89,21,118,53,0,0 // mulps 0x3576(%rip),%xmm2 # 6590 <_sk_callback_sse41+0xb59> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 65,15,40,200 // movaps %xmm8,%xmm1 @@ -28491,9 +28711,9 @@ _sk_load_a8_sse41: .byte 77,133,192 // test %r8,%r8 .byte 117,39 // jne 3056 <_sk_load_a8_sse41+0x31> .byte 102,65,15,56,49,4,18 // pmovzxbd (%r10,%rdx,1),%xmm0 - .byte 102,15,219,5,178,52,0,0 // pand 0x34b2(%rip),%xmm0 # 64f0 <_sk_callback_sse41+0xb6a> + .byte 102,15,219,5,98,53,0,0 // pand 0x3562(%rip),%xmm0 # 65a0 <_sk_callback_sse41+0xb69> .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,184,52,0,0 // mulps 0x34b8(%rip),%xmm3 # 6500 <_sk_callback_sse41+0xb7a> + .byte 15,89,29,104,53,0,0 // mulps 0x3568(%rip),%xmm3 # 65b0 <_sk_callback_sse41+0xb79> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -28529,9 +28749,9 @@ _sk_load_a8_dst_sse41: .byte 77,133,192 // test %r8,%r8 .byte 117,39 // jne 30d4 <_sk_load_a8_dst_sse41+0x31> .byte 102,65,15,56,49,36,18 // pmovzxbd (%r10,%rdx,1),%xmm4 - .byte 102,15,219,37,84,52,0,0 // pand 0x3454(%rip),%xmm4 # 6510 <_sk_callback_sse41+0xb8a> + .byte 102,15,219,37,4,53,0,0 // pand 0x3504(%rip),%xmm4 # 65c0 <_sk_callback_sse41+0xb89> .byte 15,91,252 // cvtdq2ps %xmm4,%xmm7 - .byte 15,89,61,90,52,0,0 // mulps 0x345a(%rip),%xmm7 # 6520 <_sk_callback_sse41+0xb9a> + .byte 15,89,61,10,53,0,0 // mulps 0x350a(%rip),%xmm7 # 65d0 <_sk_callback_sse41+0xb99> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 102,15,239,237 // pxor %xmm5,%xmm5 @@ -28585,7 +28805,7 @@ _sk_gather_a8_sse41: .byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,159,51,0,0 // mulps 0x339f(%rip),%xmm3 # 6530 <_sk_callback_sse41+0xbaa> + .byte 15,89,29,79,52,0,0 // mulps 0x344f(%rip),%xmm3 # 65e0 <_sk_callback_sse41+0xba9> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -28599,7 +28819,7 @@ FUNCTION(_sk_store_a8_sse41) _sk_store_a8_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 68,15,40,5,146,51,0,0 // movaps 0x3392(%rip),%xmm8 # 6540 <_sk_callback_sse41+0xbba> + .byte 68,15,40,5,66,52,0,0 // movaps 0x3442(%rip),%xmm8 # 65f0 <_sk_callback_sse41+0xbb9> .byte 68,15,89,195 // mulps %xmm3,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 .byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8 @@ -28620,7 +28840,7 @@ _sk_store_a8_sse41: .byte 65,128,249,3 // cmp $0x3,%r9b .byte 117,221 // jne 31d0 <_sk_store_a8_sse41+0x2f> .byte 102,69,15,58,20,68,18,2,8 // pextrb $0x8,%xmm8,0x2(%r10,%rdx,1) - .byte 102,68,15,56,0,5,74,51,0,0 // pshufb 0x334a(%rip),%xmm8 # 6550 <_sk_callback_sse41+0xbca> + .byte 102,68,15,56,0,5,250,51,0,0 // pshufb 0x33fa(%rip),%xmm8 # 6600 <_sk_callback_sse41+0xbc9> .byte 102,69,15,58,21,4,18,0 // pextrw $0x0,%xmm8,(%r10,%rdx,1) .byte 235,192 // jmp 31d0 <_sk_store_a8_sse41+0x2f> .byte 102,69,15,58,20,4,18,0 // pextrb $0x0,%xmm8,(%r10,%rdx,1) @@ -28635,11 +28855,11 @@ _sk_load_g8_sse41: .byte 77,133,192 // test %r8,%r8 .byte 117,42 // jne 324e <_sk_load_g8_sse41+0x34> .byte 102,65,15,56,49,4,18 // pmovzxbd (%r10,%rdx,1),%xmm0 - .byte 102,15,219,5,45,51,0,0 // pand 0x332d(%rip),%xmm0 # 6560 <_sk_callback_sse41+0xbda> + .byte 102,15,219,5,221,51,0,0 // pand 0x33dd(%rip),%xmm0 # 6610 <_sk_callback_sse41+0xbd9> .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,51,51,0,0 // mulps 0x3333(%rip),%xmm0 # 6570 <_sk_callback_sse41+0xbea> + .byte 15,89,5,227,51,0,0 // mulps 0x33e3(%rip),%xmm0 # 6620 <_sk_callback_sse41+0xbe9> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,58,51,0,0 // movaps 0x333a(%rip),%xmm3 # 6580 <_sk_callback_sse41+0xbfa> + .byte 15,40,29,234,51,0,0 // movaps 0x33ea(%rip),%xmm3 # 6630 <_sk_callback_sse41+0xbf9> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,224 // jmpq *%rax @@ -28673,11 +28893,11 @@ _sk_load_g8_dst_sse41: .byte 77,133,192 // test %r8,%r8 .byte 117,42 // jne 32cf <_sk_load_g8_dst_sse41+0x34> .byte 102,65,15,56,49,36,18 // pmovzxbd (%r10,%rdx,1),%xmm4 - .byte 102,15,219,37,220,50,0,0 // pand 0x32dc(%rip),%xmm4 # 6590 <_sk_callback_sse41+0xc0a> + .byte 102,15,219,37,140,51,0,0 // pand 0x338c(%rip),%xmm4 # 6640 <_sk_callback_sse41+0xc09> .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,37,226,50,0,0 // mulps 0x32e2(%rip),%xmm4 # 65a0 <_sk_callback_sse41+0xc1a> + .byte 15,89,37,146,51,0,0 // mulps 0x3392(%rip),%xmm4 # 6650 <_sk_callback_sse41+0xc19> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,61,233,50,0,0 // movaps 0x32e9(%rip),%xmm7 # 65b0 <_sk_callback_sse41+0xc2a> + .byte 15,40,61,153,51,0,0 // movaps 0x3399(%rip),%xmm7 # 6660 <_sk_callback_sse41+0xc29> .byte 15,40,236 // movaps %xmm4,%xmm5 .byte 15,40,244 // movaps %xmm4,%xmm6 .byte 255,224 // jmpq *%rax @@ -28729,9 +28949,9 @@ _sk_gather_g8_sse41: .byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,52,50,0,0 // mulps 0x3234(%rip),%xmm0 # 65c0 <_sk_callback_sse41+0xc3a> + .byte 15,89,5,228,50,0,0 // mulps 0x32e4(%rip),%xmm0 # 6670 <_sk_callback_sse41+0xc39> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,59,50,0,0 // movaps 0x323b(%rip),%xmm3 # 65d0 <_sk_callback_sse41+0xc4a> + .byte 15,40,29,235,50,0,0 // movaps 0x32eb(%rip),%xmm3 # 6680 <_sk_callback_sse41+0xc49> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 91 // pop %rbx @@ -28779,17 +28999,17 @@ _sk_gather_i8_sse41: .byte 102,15,58,34,28,24,1 // pinsrd $0x1,(%rax,%rbx,1),%xmm3 .byte 102,66,15,58,34,28,152,2 // pinsrd $0x2,(%rax,%r11,4),%xmm3 .byte 102,66,15,58,34,28,16,3 // pinsrd $0x3,(%rax,%r10,1),%xmm3 - .byte 102,15,111,5,142,49,0,0 // movdqa 0x318e(%rip),%xmm0 # 65e0 <_sk_callback_sse41+0xc5a> + .byte 102,15,111,5,62,50,0,0 // movdqa 0x323e(%rip),%xmm0 # 6690 <_sk_callback_sse41+0xc59> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,143,49,0,0 // movaps 0x318f(%rip),%xmm8 # 65f0 <_sk_callback_sse41+0xc6a> + .byte 68,15,40,5,63,50,0,0 // movaps 0x323f(%rip),%xmm8 # 66a0 <_sk_callback_sse41+0xc69> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 - .byte 102,15,56,0,13,142,49,0,0 // pshufb 0x318e(%rip),%xmm1 # 6600 <_sk_callback_sse41+0xc7a> + .byte 102,15,56,0,13,62,50,0,0 // pshufb 0x323e(%rip),%xmm1 # 66b0 <_sk_callback_sse41+0xc79> .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,211 // movdqa %xmm3,%xmm2 - .byte 102,15,56,0,21,138,49,0,0 // pshufb 0x318a(%rip),%xmm2 # 6610 <_sk_callback_sse41+0xc8a> + .byte 102,15,56,0,21,58,50,0,0 // pshufb 0x323a(%rip),%xmm2 # 66c0 <_sk_callback_sse41+0xc89> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -28809,19 +29029,19 @@ _sk_load_565_sse41: .byte 77,133,192 // test %r8,%r8 .byte 117,80 // jne 34fa <_sk_load_565_sse41+0x5a> .byte 102,65,15,56,51,20,82 // pmovzxwd (%r10,%rdx,2),%xmm2 - .byte 102,15,111,5,103,49,0,0 // movdqa 0x3167(%rip),%xmm0 # 6620 <_sk_callback_sse41+0xc9a> + .byte 102,15,111,5,23,50,0,0 // movdqa 0x3217(%rip),%xmm0 # 66d0 <_sk_callback_sse41+0xc99> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,105,49,0,0 // mulps 0x3169(%rip),%xmm0 # 6630 <_sk_callback_sse41+0xcaa> - .byte 102,15,111,13,113,49,0,0 // movdqa 0x3171(%rip),%xmm1 # 6640 <_sk_callback_sse41+0xcba> + .byte 15,89,5,25,50,0,0 // mulps 0x3219(%rip),%xmm0 # 66e0 <_sk_callback_sse41+0xca9> + .byte 102,15,111,13,33,50,0,0 // movdqa 0x3221(%rip),%xmm1 # 66f0 <_sk_callback_sse41+0xcb9> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,115,49,0,0 // mulps 0x3173(%rip),%xmm1 # 6650 <_sk_callback_sse41+0xcca> - .byte 102,15,219,21,123,49,0,0 // pand 0x317b(%rip),%xmm2 # 6660 <_sk_callback_sse41+0xcda> + .byte 15,89,13,35,50,0,0 // mulps 0x3223(%rip),%xmm1 # 6700 <_sk_callback_sse41+0xcc9> + .byte 102,15,219,21,43,50,0,0 // pand 0x322b(%rip),%xmm2 # 6710 <_sk_callback_sse41+0xcd9> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,129,49,0,0 // mulps 0x3181(%rip),%xmm2 # 6670 <_sk_callback_sse41+0xcea> + .byte 15,89,21,49,50,0,0 // mulps 0x3231(%rip),%xmm2 # 6720 <_sk_callback_sse41+0xce9> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,136,49,0,0 // movaps 0x3188(%rip),%xmm3 # 6680 <_sk_callback_sse41+0xcfa> + .byte 15,40,29,56,50,0,0 // movaps 0x3238(%rip),%xmm3 # 6730 <_sk_callback_sse41+0xcf9> .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b @@ -28852,19 +29072,19 @@ _sk_load_565_dst_sse41: .byte 77,133,192 // test %r8,%r8 .byte 117,80 // jne 35a4 <_sk_load_565_dst_sse41+0x5a> .byte 102,65,15,56,51,52,82 // pmovzxwd (%r10,%rdx,2),%xmm6 - .byte 102,15,111,37,45,49,0,0 // movdqa 0x312d(%rip),%xmm4 # 6690 <_sk_callback_sse41+0xd0a> + .byte 102,15,111,37,221,49,0,0 // movdqa 0x31dd(%rip),%xmm4 # 6740 <_sk_callback_sse41+0xd09> .byte 102,15,219,230 // pand %xmm6,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,37,47,49,0,0 // mulps 0x312f(%rip),%xmm4 # 66a0 <_sk_callback_sse41+0xd1a> - .byte 102,15,111,45,55,49,0,0 // movdqa 0x3137(%rip),%xmm5 # 66b0 <_sk_callback_sse41+0xd2a> + .byte 15,89,37,223,49,0,0 // mulps 0x31df(%rip),%xmm4 # 6750 <_sk_callback_sse41+0xd19> + .byte 102,15,111,45,231,49,0,0 // movdqa 0x31e7(%rip),%xmm5 # 6760 <_sk_callback_sse41+0xd29> .byte 102,15,219,238 // pand %xmm6,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,45,57,49,0,0 // mulps 0x3139(%rip),%xmm5 # 66c0 <_sk_callback_sse41+0xd3a> - .byte 102,15,219,53,65,49,0,0 // pand 0x3141(%rip),%xmm6 # 66d0 <_sk_callback_sse41+0xd4a> + .byte 15,89,45,233,49,0,0 // mulps 0x31e9(%rip),%xmm5 # 6770 <_sk_callback_sse41+0xd39> + .byte 102,15,219,53,241,49,0,0 // pand 0x31f1(%rip),%xmm6 # 6780 <_sk_callback_sse41+0xd49> .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,89,53,71,49,0,0 // mulps 0x3147(%rip),%xmm6 # 66e0 <_sk_callback_sse41+0xd5a> + .byte 15,89,53,247,49,0,0 // mulps 0x31f7(%rip),%xmm6 # 6790 <_sk_callback_sse41+0xd59> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,61,78,49,0,0 // movaps 0x314e(%rip),%xmm7 # 66f0 <_sk_callback_sse41+0xd6a> + .byte 15,40,61,254,49,0,0 // movaps 0x31fe(%rip),%xmm7 # 67a0 <_sk_callback_sse41+0xd69> .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b @@ -28912,19 +29132,19 @@ _sk_gather_565_sse41: .byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax .byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0 .byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2 - .byte 102,15,111,5,162,48,0,0 // movdqa 0x30a2(%rip),%xmm0 # 6700 <_sk_callback_sse41+0xd7a> + .byte 102,15,111,5,82,49,0,0 // movdqa 0x3152(%rip),%xmm0 # 67b0 <_sk_callback_sse41+0xd79> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,164,48,0,0 // mulps 0x30a4(%rip),%xmm0 # 6710 <_sk_callback_sse41+0xd8a> - .byte 102,15,111,13,172,48,0,0 // movdqa 0x30ac(%rip),%xmm1 # 6720 <_sk_callback_sse41+0xd9a> + .byte 15,89,5,84,49,0,0 // mulps 0x3154(%rip),%xmm0 # 67c0 <_sk_callback_sse41+0xd89> + .byte 102,15,111,13,92,49,0,0 // movdqa 0x315c(%rip),%xmm1 # 67d0 <_sk_callback_sse41+0xd99> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,174,48,0,0 // mulps 0x30ae(%rip),%xmm1 # 6730 <_sk_callback_sse41+0xdaa> - .byte 102,15,219,21,182,48,0,0 // pand 0x30b6(%rip),%xmm2 # 6740 <_sk_callback_sse41+0xdba> + .byte 15,89,13,94,49,0,0 // mulps 0x315e(%rip),%xmm1 # 67e0 <_sk_callback_sse41+0xda9> + .byte 102,15,219,21,102,49,0,0 // pand 0x3166(%rip),%xmm2 # 67f0 <_sk_callback_sse41+0xdb9> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,188,48,0,0 // mulps 0x30bc(%rip),%xmm2 # 6750 <_sk_callback_sse41+0xdca> + .byte 15,89,21,108,49,0,0 // mulps 0x316c(%rip),%xmm2 # 6800 <_sk_callback_sse41+0xdc9> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,195,48,0,0 // movaps 0x30c3(%rip),%xmm3 # 6760 <_sk_callback_sse41+0xdda> + .byte 15,40,29,115,49,0,0 // movaps 0x3173(%rip),%xmm3 # 6810 <_sk_callback_sse41+0xdd9> .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax @@ -28934,12 +29154,12 @@ FUNCTION(_sk_store_565_sse41) _sk_store_565_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,195,48,0,0 // movaps 0x30c3(%rip),%xmm8 # 6770 <_sk_callback_sse41+0xdea> + .byte 68,15,40,5,115,49,0,0 // movaps 0x3173(%rip),%xmm8 # 6820 <_sk_callback_sse41+0xde9> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 .byte 102,65,15,114,241,11 // pslld $0xb,%xmm9 - .byte 68,15,40,21,184,48,0,0 // movaps 0x30b8(%rip),%xmm10 # 6780 <_sk_callback_sse41+0xdfa> + .byte 68,15,40,21,104,49,0,0 // movaps 0x3168(%rip),%xmm10 # 6830 <_sk_callback_sse41+0xdf9> .byte 68,15,89,209 // mulps %xmm1,%xmm10 .byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10 .byte 102,65,15,114,242,5 // pslld $0x5,%xmm10 @@ -28978,21 +29198,21 @@ _sk_load_4444_sse41: .byte 77,133,192 // test %r8,%r8 .byte 117,95 // jne 37a8 <_sk_load_4444_sse41+0x69> .byte 102,65,15,56,51,28,82 // pmovzxwd (%r10,%rdx,2),%xmm3 - .byte 102,15,111,5,56,48,0,0 // movdqa 0x3038(%rip),%xmm0 # 6790 <_sk_callback_sse41+0xe0a> + .byte 102,15,111,5,232,48,0,0 // movdqa 0x30e8(%rip),%xmm0 # 6840 <_sk_callback_sse41+0xe09> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,58,48,0,0 // mulps 0x303a(%rip),%xmm0 # 67a0 <_sk_callback_sse41+0xe1a> - .byte 102,15,111,13,66,48,0,0 // movdqa 0x3042(%rip),%xmm1 # 67b0 <_sk_callback_sse41+0xe2a> + .byte 15,89,5,234,48,0,0 // mulps 0x30ea(%rip),%xmm0 # 6850 <_sk_callback_sse41+0xe19> + .byte 102,15,111,13,242,48,0,0 // movdqa 0x30f2(%rip),%xmm1 # 6860 <_sk_callback_sse41+0xe29> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,68,48,0,0 // mulps 0x3044(%rip),%xmm1 # 67c0 <_sk_callback_sse41+0xe3a> - .byte 102,15,111,21,76,48,0,0 // movdqa 0x304c(%rip),%xmm2 # 67d0 <_sk_callback_sse41+0xe4a> + .byte 15,89,13,244,48,0,0 // mulps 0x30f4(%rip),%xmm1 # 6870 <_sk_callback_sse41+0xe39> + .byte 102,15,111,21,252,48,0,0 // movdqa 0x30fc(%rip),%xmm2 # 6880 <_sk_callback_sse41+0xe49> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,78,48,0,0 // mulps 0x304e(%rip),%xmm2 # 67e0 <_sk_callback_sse41+0xe5a> - .byte 102,15,219,29,86,48,0,0 // pand 0x3056(%rip),%xmm3 # 67f0 <_sk_callback_sse41+0xe6a> + .byte 15,89,21,254,48,0,0 // mulps 0x30fe(%rip),%xmm2 # 6890 <_sk_callback_sse41+0xe59> + .byte 102,15,219,29,6,49,0,0 // pand 0x3106(%rip),%xmm3 # 68a0 <_sk_callback_sse41+0xe69> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,92,48,0,0 // mulps 0x305c(%rip),%xmm3 # 6800 <_sk_callback_sse41+0xe7a> + .byte 15,89,29,12,49,0,0 // mulps 0x310c(%rip),%xmm3 # 68b0 <_sk_callback_sse41+0xe79> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d @@ -29024,21 +29244,21 @@ _sk_load_4444_dst_sse41: .byte 77,133,192 // test %r8,%r8 .byte 117,95 // jne 3861 <_sk_load_4444_dst_sse41+0x69> .byte 102,65,15,56,51,60,82 // pmovzxwd (%r10,%rdx,2),%xmm7 - .byte 102,15,111,37,255,47,0,0 // movdqa 0x2fff(%rip),%xmm4 # 6810 <_sk_callback_sse41+0xe8a> + .byte 102,15,111,37,175,48,0,0 // movdqa 0x30af(%rip),%xmm4 # 68c0 <_sk_callback_sse41+0xe89> .byte 102,15,219,231 // pand %xmm7,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,37,1,48,0,0 // mulps 0x3001(%rip),%xmm4 # 6820 <_sk_callback_sse41+0xe9a> - .byte 102,15,111,45,9,48,0,0 // movdqa 0x3009(%rip),%xmm5 # 6830 <_sk_callback_sse41+0xeaa> + .byte 15,89,37,177,48,0,0 // mulps 0x30b1(%rip),%xmm4 # 68d0 <_sk_callback_sse41+0xe99> + .byte 102,15,111,45,185,48,0,0 // movdqa 0x30b9(%rip),%xmm5 # 68e0 <_sk_callback_sse41+0xea9> .byte 102,15,219,239 // pand %xmm7,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,45,11,48,0,0 // mulps 0x300b(%rip),%xmm5 # 6840 <_sk_callback_sse41+0xeba> - .byte 102,15,111,53,19,48,0,0 // movdqa 0x3013(%rip),%xmm6 # 6850 <_sk_callback_sse41+0xeca> + .byte 15,89,45,187,48,0,0 // mulps 0x30bb(%rip),%xmm5 # 68f0 <_sk_callback_sse41+0xeb9> + .byte 102,15,111,53,195,48,0,0 // movdqa 0x30c3(%rip),%xmm6 # 6900 <_sk_callback_sse41+0xec9> .byte 102,15,219,247 // pand %xmm7,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,89,53,21,48,0,0 // mulps 0x3015(%rip),%xmm6 # 6860 <_sk_callback_sse41+0xeda> - .byte 102,15,219,61,29,48,0,0 // pand 0x301d(%rip),%xmm7 # 6870 <_sk_callback_sse41+0xeea> + .byte 15,89,53,197,48,0,0 // mulps 0x30c5(%rip),%xmm6 # 6910 <_sk_callback_sse41+0xed9> + .byte 102,15,219,61,205,48,0,0 // pand 0x30cd(%rip),%xmm7 # 6920 <_sk_callback_sse41+0xee9> .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 - .byte 15,89,61,35,48,0,0 // mulps 0x3023(%rip),%xmm7 # 6880 <_sk_callback_sse41+0xefa> + .byte 15,89,61,211,48,0,0 // mulps 0x30d3(%rip),%xmm7 # 6930 <_sk_callback_sse41+0xef9> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d @@ -29087,21 +29307,21 @@ _sk_gather_4444_sse41: .byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax .byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0 .byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3 - .byte 102,15,111,5,117,47,0,0 // movdqa 0x2f75(%rip),%xmm0 # 6890 <_sk_callback_sse41+0xf0a> + .byte 102,15,111,5,37,48,0,0 // movdqa 0x3025(%rip),%xmm0 # 6940 <_sk_callback_sse41+0xf09> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,119,47,0,0 // mulps 0x2f77(%rip),%xmm0 # 68a0 <_sk_callback_sse41+0xf1a> - .byte 102,15,111,13,127,47,0,0 // movdqa 0x2f7f(%rip),%xmm1 # 68b0 <_sk_callback_sse41+0xf2a> + .byte 15,89,5,39,48,0,0 // mulps 0x3027(%rip),%xmm0 # 6950 <_sk_callback_sse41+0xf19> + .byte 102,15,111,13,47,48,0,0 // movdqa 0x302f(%rip),%xmm1 # 6960 <_sk_callback_sse41+0xf29> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,129,47,0,0 // mulps 0x2f81(%rip),%xmm1 # 68c0 <_sk_callback_sse41+0xf3a> - .byte 102,15,111,21,137,47,0,0 // movdqa 0x2f89(%rip),%xmm2 # 68d0 <_sk_callback_sse41+0xf4a> + .byte 15,89,13,49,48,0,0 // mulps 0x3031(%rip),%xmm1 # 6970 <_sk_callback_sse41+0xf39> + .byte 102,15,111,21,57,48,0,0 // movdqa 0x3039(%rip),%xmm2 # 6980 <_sk_callback_sse41+0xf49> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,139,47,0,0 // mulps 0x2f8b(%rip),%xmm2 # 68e0 <_sk_callback_sse41+0xf5a> - .byte 102,15,219,29,147,47,0,0 // pand 0x2f93(%rip),%xmm3 # 68f0 <_sk_callback_sse41+0xf6a> + .byte 15,89,21,59,48,0,0 // mulps 0x303b(%rip),%xmm2 # 6990 <_sk_callback_sse41+0xf59> + .byte 102,15,219,29,67,48,0,0 // pand 0x3043(%rip),%xmm3 # 69a0 <_sk_callback_sse41+0xf69> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,153,47,0,0 // mulps 0x2f99(%rip),%xmm3 # 6900 <_sk_callback_sse41+0xf7a> + .byte 15,89,29,73,48,0,0 // mulps 0x3049(%rip),%xmm3 # 69b0 <_sk_callback_sse41+0xf79> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax @@ -29112,7 +29332,7 @@ FUNCTION(_sk_store_4444_sse41) _sk_store_4444_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,151,47,0,0 // movaps 0x2f97(%rip),%xmm8 # 6910 <_sk_callback_sse41+0xf8a> + .byte 68,15,40,5,71,48,0,0 // movaps 0x3047(%rip),%xmm8 # 69c0 <_sk_callback_sse41+0xf89> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -29161,17 +29381,17 @@ _sk_load_8888_sse41: .byte 77,133,192 // test %r8,%r8 .byte 117,88 // jne 3a81 <_sk_load_8888_sse41+0x62> .byte 243,15,111,28,144 // movdqu (%rax,%rdx,4),%xmm3 - .byte 102,15,111,5,234,46,0,0 // movdqa 0x2eea(%rip),%xmm0 # 6920 <_sk_callback_sse41+0xf9a> + .byte 102,15,111,5,154,47,0,0 // movdqa 0x2f9a(%rip),%xmm0 # 69d0 <_sk_callback_sse41+0xf99> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,235,46,0,0 // movaps 0x2eeb(%rip),%xmm8 # 6930 <_sk_callback_sse41+0xfaa> + .byte 68,15,40,5,155,47,0,0 // movaps 0x2f9b(%rip),%xmm8 # 69e0 <_sk_callback_sse41+0xfa9> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 - .byte 102,15,56,0,13,234,46,0,0 // pshufb 0x2eea(%rip),%xmm1 # 6940 <_sk_callback_sse41+0xfba> + .byte 102,15,56,0,13,154,47,0,0 // pshufb 0x2f9a(%rip),%xmm1 # 69f0 <_sk_callback_sse41+0xfb9> .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,211 // movdqa %xmm3,%xmm2 - .byte 102,15,56,0,21,230,46,0,0 // pshufb 0x2ee6(%rip),%xmm2 # 6950 <_sk_callback_sse41+0xfca> + .byte 102,15,56,0,21,150,47,0,0 // pshufb 0x2f96(%rip),%xmm2 # 6a00 <_sk_callback_sse41+0xfc9> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -29205,17 +29425,17 @@ _sk_load_8888_dst_sse41: .byte 77,133,192 // test %r8,%r8 .byte 117,88 // jne 3b25 <_sk_load_8888_dst_sse41+0x62> .byte 243,15,111,60,144 // movdqu (%rax,%rdx,4),%xmm7 - .byte 102,15,111,37,134,46,0,0 // movdqa 0x2e86(%rip),%xmm4 # 6960 <_sk_callback_sse41+0xfda> + .byte 102,15,111,37,54,47,0,0 // movdqa 0x2f36(%rip),%xmm4 # 6a10 <_sk_callback_sse41+0xfd9> .byte 102,15,219,231 // pand %xmm7,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 68,15,40,5,135,46,0,0 // movaps 0x2e87(%rip),%xmm8 # 6970 <_sk_callback_sse41+0xfea> + .byte 68,15,40,5,55,47,0,0 // movaps 0x2f37(%rip),%xmm8 # 6a20 <_sk_callback_sse41+0xfe9> .byte 65,15,89,224 // mulps %xmm8,%xmm4 .byte 102,15,111,239 // movdqa %xmm7,%xmm5 - .byte 102,15,56,0,45,134,46,0,0 // pshufb 0x2e86(%rip),%xmm5 # 6980 <_sk_callback_sse41+0xffa> + .byte 102,15,56,0,45,54,47,0,0 // pshufb 0x2f36(%rip),%xmm5 # 6a30 <_sk_callback_sse41+0xff9> .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 .byte 65,15,89,232 // mulps %xmm8,%xmm5 .byte 102,15,111,247 // movdqa %xmm7,%xmm6 - .byte 102,15,56,0,53,130,46,0,0 // pshufb 0x2e82(%rip),%xmm6 # 6990 <_sk_callback_sse41+0x100a> + .byte 102,15,56,0,53,50,47,0,0 // pshufb 0x2f32(%rip),%xmm6 # 6a40 <_sk_callback_sse41+0x1009> .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 65,15,89,240 // mulps %xmm8,%xmm6 .byte 102,15,114,215,24 // psrld $0x18,%xmm7 @@ -29263,17 +29483,17 @@ _sk_gather_8888_sse41: .byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3 .byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3 .byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3 - .byte 102,15,111,5,216,45,0,0 // movdqa 0x2dd8(%rip),%xmm0 # 69a0 <_sk_callback_sse41+0x101a> + .byte 102,15,111,5,136,46,0,0 // movdqa 0x2e88(%rip),%xmm0 # 6a50 <_sk_callback_sse41+0x1019> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,217,45,0,0 // movaps 0x2dd9(%rip),%xmm8 # 69b0 <_sk_callback_sse41+0x102a> + .byte 68,15,40,5,137,46,0,0 // movaps 0x2e89(%rip),%xmm8 # 6a60 <_sk_callback_sse41+0x1029> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 - .byte 102,15,56,0,13,216,45,0,0 // pshufb 0x2dd8(%rip),%xmm1 # 69c0 <_sk_callback_sse41+0x103a> + .byte 102,15,56,0,13,136,46,0,0 // pshufb 0x2e88(%rip),%xmm1 # 6a70 <_sk_callback_sse41+0x1039> .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,211 // movdqa %xmm3,%xmm2 - .byte 102,15,56,0,21,212,45,0,0 // pshufb 0x2dd4(%rip),%xmm2 # 69d0 <_sk_callback_sse41+0x104a> + .byte 102,15,56,0,21,132,46,0,0 // pshufb 0x2e84(%rip),%xmm2 # 6a80 <_sk_callback_sse41+0x1049> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -29289,7 +29509,7 @@ FUNCTION(_sk_store_8888_sse41) _sk_store_8888_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,191,45,0,0 // movaps 0x2dbf(%rip),%xmm8 # 69e0 <_sk_callback_sse41+0x105a> + .byte 68,15,40,5,111,46,0,0 // movaps 0x2e6f(%rip),%xmm8 # 6a90 <_sk_callback_sse41+0x1059> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -29335,17 +29555,17 @@ _sk_load_bgra_sse41: .byte 77,133,192 // test %r8,%r8 .byte 117,88 // jne 3d15 <_sk_load_bgra_sse41+0x62> .byte 243,15,111,28,144 // movdqu (%rax,%rdx,4),%xmm3 - .byte 102,15,111,5,38,45,0,0 // movdqa 0x2d26(%rip),%xmm0 # 69f0 <_sk_callback_sse41+0x106a> + .byte 102,15,111,5,214,45,0,0 // movdqa 0x2dd6(%rip),%xmm0 # 6aa0 <_sk_callback_sse41+0x1069> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,208 // cvtdq2ps %xmm0,%xmm2 - .byte 68,15,40,5,39,45,0,0 // movaps 0x2d27(%rip),%xmm8 # 6a00 <_sk_callback_sse41+0x107a> + .byte 68,15,40,5,215,45,0,0 // movaps 0x2dd7(%rip),%xmm8 # 6ab0 <_sk_callback_sse41+0x1079> .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,111,195 // movdqa %xmm3,%xmm0 - .byte 102,15,56,0,5,38,45,0,0 // pshufb 0x2d26(%rip),%xmm0 # 6a10 <_sk_callback_sse41+0x108a> + .byte 102,15,56,0,5,214,45,0,0 // pshufb 0x2dd6(%rip),%xmm0 # 6ac0 <_sk_callback_sse41+0x1089> .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,195 // movdqa %xmm3,%xmm0 - .byte 102,15,56,0,5,34,45,0,0 // pshufb 0x2d22(%rip),%xmm0 # 6a20 <_sk_callback_sse41+0x109a> + .byte 102,15,56,0,5,210,45,0,0 // pshufb 0x2dd2(%rip),%xmm0 # 6ad0 <_sk_callback_sse41+0x1099> .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -29379,17 +29599,17 @@ _sk_load_bgra_dst_sse41: .byte 77,133,192 // test %r8,%r8 .byte 117,88 // jne 3db9 <_sk_load_bgra_dst_sse41+0x62> .byte 243,15,111,60,144 // movdqu (%rax,%rdx,4),%xmm7 - .byte 102,15,111,37,194,44,0,0 // movdqa 0x2cc2(%rip),%xmm4 # 6a30 <_sk_callback_sse41+0x10aa> + .byte 102,15,111,37,114,45,0,0 // movdqa 0x2d72(%rip),%xmm4 # 6ae0 <_sk_callback_sse41+0x10a9> .byte 102,15,219,231 // pand %xmm7,%xmm4 .byte 15,91,244 // cvtdq2ps %xmm4,%xmm6 - .byte 68,15,40,5,195,44,0,0 // movaps 0x2cc3(%rip),%xmm8 # 6a40 <_sk_callback_sse41+0x10ba> + .byte 68,15,40,5,115,45,0,0 // movaps 0x2d73(%rip),%xmm8 # 6af0 <_sk_callback_sse41+0x10b9> .byte 65,15,89,240 // mulps %xmm8,%xmm6 .byte 102,15,111,231 // movdqa %xmm7,%xmm4 - .byte 102,15,56,0,37,194,44,0,0 // pshufb 0x2cc2(%rip),%xmm4 # 6a50 <_sk_callback_sse41+0x10ca> + .byte 102,15,56,0,37,114,45,0,0 // pshufb 0x2d72(%rip),%xmm4 # 6b00 <_sk_callback_sse41+0x10c9> .byte 15,91,236 // cvtdq2ps %xmm4,%xmm5 .byte 65,15,89,232 // mulps %xmm8,%xmm5 .byte 102,15,111,231 // movdqa %xmm7,%xmm4 - .byte 102,15,56,0,37,190,44,0,0 // pshufb 0x2cbe(%rip),%xmm4 # 6a60 <_sk_callback_sse41+0x10da> + .byte 102,15,56,0,37,110,45,0,0 // pshufb 0x2d6e(%rip),%xmm4 # 6b10 <_sk_callback_sse41+0x10d9> .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 .byte 65,15,89,224 // mulps %xmm8,%xmm4 .byte 102,15,114,215,24 // psrld $0x18,%xmm7 @@ -29437,17 +29657,17 @@ _sk_gather_bgra_sse41: .byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3 .byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3 .byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3 - .byte 102,15,111,5,20,44,0,0 // movdqa 0x2c14(%rip),%xmm0 # 6a70 <_sk_callback_sse41+0x10ea> + .byte 102,15,111,5,196,44,0,0 // movdqa 0x2cc4(%rip),%xmm0 # 6b20 <_sk_callback_sse41+0x10e9> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,208 // cvtdq2ps %xmm0,%xmm2 - .byte 68,15,40,5,21,44,0,0 // movaps 0x2c15(%rip),%xmm8 # 6a80 <_sk_callback_sse41+0x10fa> + .byte 68,15,40,5,197,44,0,0 // movaps 0x2cc5(%rip),%xmm8 # 6b30 <_sk_callback_sse41+0x10f9> .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,111,195 // movdqa %xmm3,%xmm0 - .byte 102,15,56,0,5,20,44,0,0 // pshufb 0x2c14(%rip),%xmm0 # 6a90 <_sk_callback_sse41+0x110a> + .byte 102,15,56,0,5,196,44,0,0 // pshufb 0x2cc4(%rip),%xmm0 # 6b40 <_sk_callback_sse41+0x1109> .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,195 // movdqa %xmm3,%xmm0 - .byte 102,15,56,0,5,16,44,0,0 // pshufb 0x2c10(%rip),%xmm0 # 6aa0 <_sk_callback_sse41+0x111a> + .byte 102,15,56,0,5,192,44,0,0 // pshufb 0x2cc0(%rip),%xmm0 # 6b50 <_sk_callback_sse41+0x1119> .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -29463,7 +29683,7 @@ FUNCTION(_sk_store_bgra_sse41) _sk_store_bgra_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,251,43,0,0 // movaps 0x2bfb(%rip),%xmm8 # 6ab0 <_sk_callback_sse41+0x112a> + .byte 68,15,40,5,171,44,0,0 // movaps 0x2cab(%rip),%xmm8 # 6b60 <_sk_callback_sse41+0x1129> .byte 68,15,40,202 // movaps %xmm2,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -29517,18 +29737,18 @@ _sk_load_f16_sse41: .byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 .byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1 - .byte 102,68,15,111,5,52,43,0,0 // movdqa 0x2b34(%rip),%xmm8 # 6ac0 <_sk_callback_sse41+0x113a> + .byte 102,68,15,111,5,228,43,0,0 // movdqa 0x2be4(%rip),%xmm8 # 6b70 <_sk_callback_sse41+0x1139> .byte 102,15,111,209 // movdqa %xmm1,%xmm2 .byte 102,65,15,219,208 // pand %xmm8,%xmm2 .byte 102,15,239,202 // pxor %xmm2,%xmm1 - .byte 102,15,111,29,47,43,0,0 // movdqa 0x2b2f(%rip),%xmm3 # 6ad0 <_sk_callback_sse41+0x114a> + .byte 102,15,111,29,223,43,0,0 // movdqa 0x2bdf(%rip),%xmm3 # 6b80 <_sk_callback_sse41+0x1149> .byte 102,15,114,242,16 // pslld $0x10,%xmm2 .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0 .byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0 .byte 102,15,114,241,13 // pslld $0xd,%xmm1 .byte 102,15,235,202 // por %xmm2,%xmm1 - .byte 102,68,15,111,21,27,43,0,0 // movdqa 0x2b1b(%rip),%xmm10 # 6ae0 <_sk_callback_sse41+0x115a> + .byte 102,68,15,111,21,203,43,0,0 // movdqa 0x2bcb(%rip),%xmm10 # 6b90 <_sk_callback_sse41+0x1159> .byte 102,65,15,254,202 // paddd %xmm10,%xmm1 .byte 102,15,219,193 // pand %xmm1,%xmm0 .byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11 @@ -29599,18 +29819,18 @@ _sk_load_f16_dst_sse41: .byte 102,68,15,97,220 // punpcklwd %xmm4,%xmm11 .byte 102,68,15,105,204 // punpckhwd %xmm4,%xmm9 .byte 102,65,15,56,51,235 // pmovzxwd %xmm11,%xmm5 - .byte 102,68,15,111,5,227,41,0,0 // movdqa 0x29e3(%rip),%xmm8 # 6af0 <_sk_callback_sse41+0x116a> + .byte 102,68,15,111,5,147,42,0,0 // movdqa 0x2a93(%rip),%xmm8 # 6ba0 <_sk_callback_sse41+0x1169> .byte 102,15,111,245 // movdqa %xmm5,%xmm6 .byte 102,65,15,219,240 // pand %xmm8,%xmm6 .byte 102,15,239,238 // pxor %xmm6,%xmm5 - .byte 102,15,111,61,222,41,0,0 // movdqa 0x29de(%rip),%xmm7 # 6b00 <_sk_callback_sse41+0x117a> + .byte 102,15,111,61,142,42,0,0 // movdqa 0x2a8e(%rip),%xmm7 # 6bb0 <_sk_callback_sse41+0x1179> .byte 102,15,114,246,16 // pslld $0x10,%xmm6 .byte 102,15,111,229 // movdqa %xmm5,%xmm4 .byte 102,15,56,63,231 // pmaxud %xmm7,%xmm4 .byte 102,15,118,229 // pcmpeqd %xmm5,%xmm4 .byte 102,15,114,245,13 // pslld $0xd,%xmm5 .byte 102,15,235,238 // por %xmm6,%xmm5 - .byte 102,68,15,111,21,202,41,0,0 // movdqa 0x29ca(%rip),%xmm10 # 6b10 <_sk_callback_sse41+0x118a> + .byte 102,68,15,111,21,122,42,0,0 // movdqa 0x2a7a(%rip),%xmm10 # 6bc0 <_sk_callback_sse41+0x1189> .byte 102,65,15,254,234 // paddd %xmm10,%xmm5 .byte 102,15,219,229 // pand %xmm5,%xmm4 .byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11 @@ -29696,18 +29916,18 @@ _sk_gather_f16_sse41: .byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11 .byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9 .byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1 - .byte 102,68,15,111,5,80,40,0,0 // movdqa 0x2850(%rip),%xmm8 # 6b20 <_sk_callback_sse41+0x119a> + .byte 102,68,15,111,5,0,41,0,0 // movdqa 0x2900(%rip),%xmm8 # 6bd0 <_sk_callback_sse41+0x1199> .byte 102,15,111,209 // movdqa %xmm1,%xmm2 .byte 102,65,15,219,208 // pand %xmm8,%xmm2 .byte 102,15,239,202 // pxor %xmm2,%xmm1 - .byte 102,15,111,29,75,40,0,0 // movdqa 0x284b(%rip),%xmm3 # 6b30 <_sk_callback_sse41+0x11aa> + .byte 102,15,111,29,251,40,0,0 // movdqa 0x28fb(%rip),%xmm3 # 6be0 <_sk_callback_sse41+0x11a9> .byte 102,15,114,242,16 // pslld $0x10,%xmm2 .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0 .byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0 .byte 102,15,114,241,13 // pslld $0xd,%xmm1 .byte 102,15,235,202 // por %xmm2,%xmm1 - .byte 102,68,15,111,21,55,40,0,0 // movdqa 0x2837(%rip),%xmm10 # 6b40 <_sk_callback_sse41+0x11ba> + .byte 102,68,15,111,21,231,40,0,0 // movdqa 0x28e7(%rip),%xmm10 # 6bf0 <_sk_callback_sse41+0x11b9> .byte 102,65,15,254,202 // paddd %xmm10,%xmm1 .byte 102,15,219,193 // pand %xmm1,%xmm0 .byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11 @@ -29756,17 +29976,17 @@ FUNCTION(_sk_store_f16_sse41) _sk_store_f16_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 102,68,15,111,21,108,39,0,0 // movdqa 0x276c(%rip),%xmm10 # 6b50 <_sk_callback_sse41+0x11ca> + .byte 102,68,15,111,21,28,40,0,0 // movdqa 0x281c(%rip),%xmm10 # 6c00 <_sk_callback_sse41+0x11c9> .byte 102,68,15,111,216 // movdqa %xmm0,%xmm11 .byte 102,69,15,219,218 // pand %xmm10,%xmm11 .byte 102,68,15,111,232 // movdqa %xmm0,%xmm13 .byte 102,69,15,239,235 // pxor %xmm11,%xmm13 - .byte 102,68,15,111,13,95,39,0,0 // movdqa 0x275f(%rip),%xmm9 # 6b60 <_sk_callback_sse41+0x11da> + .byte 102,68,15,111,13,15,40,0,0 // movdqa 0x280f(%rip),%xmm9 # 6c10 <_sk_callback_sse41+0x11d9> .byte 102,65,15,114,211,16 // psrld $0x10,%xmm11 .byte 102,69,15,111,193 // movdqa %xmm9,%xmm8 .byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8 .byte 102,65,15,114,213,13 // psrld $0xd,%xmm13 - .byte 102,68,15,111,37,80,39,0,0 // movdqa 0x2750(%rip),%xmm12 # 6b70 <_sk_callback_sse41+0x11ea> + .byte 102,68,15,111,37,0,40,0,0 // movdqa 0x2800(%rip),%xmm12 # 6c20 <_sk_callback_sse41+0x11e9> .byte 102,69,15,235,220 // por %xmm12,%xmm11 .byte 102,69,15,254,221 // paddd %xmm13,%xmm11 .byte 102,69,15,223,195 // pandn %xmm11,%xmm8 @@ -29850,7 +30070,7 @@ _sk_load_u16_be_sse41: .byte 102,15,235,200 // por %xmm0,%xmm1 .byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,225,37,0,0 // movaps 0x25e1(%rip),%xmm8 # 6b80 <_sk_callback_sse41+0x11fa> + .byte 68,15,40,5,145,38,0,0 // movaps 0x2691(%rip),%xmm8 # 6c30 <_sk_callback_sse41+0x11f9> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -29917,7 +30137,7 @@ _sk_load_rgb_u16_be_sse41: .byte 102,15,235,200 // por %xmm0,%xmm1 .byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,217,36,0,0 // movaps 0x24d9(%rip),%xmm8 # 6b90 <_sk_callback_sse41+0x120a> + .byte 68,15,40,5,137,37,0,0 // movaps 0x2589(%rip),%xmm8 # 6c40 <_sk_callback_sse41+0x1209> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -29934,7 +30154,7 @@ _sk_load_rgb_u16_be_sse41: .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,160,36,0,0 // movaps 0x24a0(%rip),%xmm3 # 6ba0 <_sk_callback_sse41+0x121a> + .byte 15,40,29,80,37,0,0 // movaps 0x2550(%rip),%xmm3 # 6c50 <_sk_callback_sse41+0x1219> .byte 255,224 // jmpq *%rax .byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2 .byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2 @@ -29963,7 +30183,7 @@ _sk_store_u16_be_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax - .byte 68,15,40,21,58,36,0,0 // movaps 0x243a(%rip),%xmm10 # 6bb0 <_sk_callback_sse41+0x122a> + .byte 68,15,40,21,234,36,0,0 // movaps 0x24ea(%rip),%xmm10 # 6c60 <_sk_callback_sse41+0x1229> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,194 // mulps %xmm10,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 @@ -30223,7 +30443,7 @@ _sk_mirror_x_sse41: .byte 65,15,92,194 // subps %xmm10,%xmm0 .byte 243,69,15,88,192 // addss %xmm8,%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 - .byte 243,68,15,89,13,187,36,0,0 // mulss 0x24bb(%rip),%xmm9 # 6fc0 <_sk_callback_sse41+0x163a> + .byte 243,68,15,89,13,155,37,0,0 // mulss 0x259b(%rip),%xmm9 # 70a0 <_sk_callback_sse41+0x1669> .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 .byte 68,15,89,200 // mulps %xmm0,%xmm9 .byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9 @@ -30251,7 +30471,7 @@ _sk_mirror_y_sse41: .byte 65,15,92,202 // subps %xmm10,%xmm1 .byte 243,69,15,88,192 // addss %xmm8,%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 - .byte 243,68,15,89,13,88,36,0,0 // mulss 0x2458(%rip),%xmm9 # 6fc4 <_sk_callback_sse41+0x163e> + .byte 243,68,15,89,13,56,37,0,0 // mulss 0x2538(%rip),%xmm9 # 70a4 <_sk_callback_sse41+0x166d> .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 .byte 68,15,89,201 // mulps %xmm1,%xmm9 .byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9 @@ -30273,7 +30493,7 @@ FUNCTION(_sk_clamp_x_1_sse41) _sk_clamp_x_1_sse41: .byte 69,15,87,192 // xorps %xmm8,%xmm8 .byte 68,15,95,192 // maxps %xmm0,%xmm8 - .byte 68,15,93,5,10,32,0,0 // minps 0x200a(%rip),%xmm8 # 6bc0 <_sk_callback_sse41+0x123a> + .byte 68,15,93,5,186,32,0,0 // minps 0x20ba(%rip),%xmm8 # 6c70 <_sk_callback_sse41+0x1239> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -30291,9 +30511,9 @@ HIDDEN _sk_mirror_x_1_sse41 .globl _sk_mirror_x_1_sse41 FUNCTION(_sk_mirror_x_1_sse41) _sk_mirror_x_1_sse41: - .byte 68,15,40,5,251,31,0,0 // movaps 0x1ffb(%rip),%xmm8 # 6bd0 <_sk_callback_sse41+0x124a> + .byte 68,15,40,5,171,32,0,0 // movaps 0x20ab(%rip),%xmm8 # 6c80 <_sk_callback_sse41+0x1249> .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,13,255,31,0,0 // movaps 0x1fff(%rip),%xmm9 # 6be0 <_sk_callback_sse41+0x125a> + .byte 68,15,40,13,175,32,0,0 // movaps 0x20af(%rip),%xmm9 # 6c90 <_sk_callback_sse41+0x1259> .byte 68,15,89,200 // mulps %xmm0,%xmm9 .byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9 .byte 69,15,88,201 // addps %xmm9,%xmm9 @@ -30310,10 +30530,10 @@ HIDDEN _sk_luminance_to_alpha_sse41 FUNCTION(_sk_luminance_to_alpha_sse41) _sk_luminance_to_alpha_sse41: .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 15,89,5,222,31,0,0 // mulps 0x1fde(%rip),%xmm0 # 6bf0 <_sk_callback_sse41+0x126a> - .byte 15,89,13,231,31,0,0 // mulps 0x1fe7(%rip),%xmm1 # 6c00 <_sk_callback_sse41+0x127a> + .byte 15,89,5,142,32,0,0 // mulps 0x208e(%rip),%xmm0 # 6ca0 <_sk_callback_sse41+0x1269> + .byte 15,89,13,151,32,0,0 // mulps 0x2097(%rip),%xmm1 # 6cb0 <_sk_callback_sse41+0x1279> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,29,237,31,0,0 // mulps 0x1fed(%rip),%xmm3 # 6c10 <_sk_callback_sse41+0x128a> + .byte 15,89,29,157,32,0,0 // mulps 0x209d(%rip),%xmm3 # 6cc0 <_sk_callback_sse41+0x1289> .byte 15,88,217 // addps %xmm1,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 @@ -30684,15 +30904,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse41 .globl _sk_gauss_a_to_rgba_sse41 FUNCTION(_sk_gauss_a_to_rgba_sse41) _sk_gauss_a_to_rgba_sse41: - .byte 15,40,5,252,25,0,0 // movaps 0x19fc(%rip),%xmm0 # 6c20 <_sk_callback_sse41+0x129a> + .byte 15,40,5,172,26,0,0 // movaps 0x1aac(%rip),%xmm0 # 6cd0 <_sk_callback_sse41+0x1299> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,2,26,0,0 // addps 0x1a02(%rip),%xmm0 # 6c30 <_sk_callback_sse41+0x12aa> + .byte 15,88,5,178,26,0,0 // addps 0x1ab2(%rip),%xmm0 # 6ce0 <_sk_callback_sse41+0x12a9> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,8,26,0,0 // addps 0x1a08(%rip),%xmm0 # 6c40 <_sk_callback_sse41+0x12ba> + .byte 15,88,5,184,26,0,0 // addps 0x1ab8(%rip),%xmm0 # 6cf0 <_sk_callback_sse41+0x12b9> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,14,26,0,0 // addps 0x1a0e(%rip),%xmm0 # 6c50 <_sk_callback_sse41+0x12ca> + .byte 15,88,5,190,26,0,0 // addps 0x1abe(%rip),%xmm0 # 6d00 <_sk_callback_sse41+0x12c9> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,20,26,0,0 // addps 0x1a14(%rip),%xmm0 # 6c60 <_sk_callback_sse41+0x12da> + .byte 15,88,5,196,26,0,0 // addps 0x1ac4(%rip),%xmm0 # 6d10 <_sk_callback_sse41+0x12d9> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 @@ -30715,7 +30935,7 @@ _sk_gradient_sse41: .byte 73,255,201 // dec %r9 .byte 72,131,195,4 // add $0x4,%rbx .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 15,40,21,237,25,0,0 // movaps 0x19ed(%rip),%xmm2 # 6c70 <_sk_callback_sse41+0x12ea> + .byte 15,40,21,157,26,0,0 // movaps 0x1a9d(%rip),%xmm2 # 6d20 <_sk_callback_sse41+0x12e9> .byte 243,15,16,27 // movss (%rbx),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 @@ -30853,26 +31073,26 @@ _sk_xy_to_unit_angle_sse41: .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,40,236 // movaps %xmm12,%xmm13 .byte 69,15,89,237 // mulps %xmm13,%xmm13 - .byte 68,15,40,21,142,23,0,0 // movaps 0x178e(%rip),%xmm10 # 6c80 <_sk_callback_sse41+0x12fa> + .byte 68,15,40,21,62,24,0,0 // movaps 0x183e(%rip),%xmm10 # 6d30 <_sk_callback_sse41+0x12f9> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,146,23,0,0 // addps 0x1792(%rip),%xmm10 # 6c90 <_sk_callback_sse41+0x130a> + .byte 68,15,88,21,66,24,0,0 // addps 0x1842(%rip),%xmm10 # 6d40 <_sk_callback_sse41+0x1309> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,150,23,0,0 // addps 0x1796(%rip),%xmm10 # 6ca0 <_sk_callback_sse41+0x131a> + .byte 68,15,88,21,70,24,0,0 // addps 0x1846(%rip),%xmm10 # 6d50 <_sk_callback_sse41+0x1319> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,154,23,0,0 // addps 0x179a(%rip),%xmm10 # 6cb0 <_sk_callback_sse41+0x132a> + .byte 68,15,88,21,74,24,0,0 // addps 0x184a(%rip),%xmm10 # 6d60 <_sk_callback_sse41+0x1329> .byte 69,15,89,212 // mulps %xmm12,%xmm10 .byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0 - .byte 68,15,40,29,153,23,0,0 // movaps 0x1799(%rip),%xmm11 # 6cc0 <_sk_callback_sse41+0x133a> + .byte 68,15,40,29,73,24,0,0 // movaps 0x1849(%rip),%xmm11 # 6d70 <_sk_callback_sse41+0x1339> .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10 .byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9 - .byte 68,15,40,29,146,23,0,0 // movaps 0x1792(%rip),%xmm11 # 6cd0 <_sk_callback_sse41+0x134a> + .byte 68,15,40,29,66,24,0,0 // movaps 0x1842(%rip),%xmm11 # 6d80 <_sk_callback_sse41+0x1349> .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10 .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0 - .byte 68,15,40,13,132,23,0,0 // movaps 0x1784(%rip),%xmm9 # 6ce0 <_sk_callback_sse41+0x135a> + .byte 68,15,40,13,52,24,0,0 // movaps 0x1834(%rip),%xmm9 # 6d90 <_sk_callback_sse41+0x1359> .byte 69,15,92,202 // subps %xmm10,%xmm9 .byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10 .byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8 @@ -30893,20 +31113,20 @@ _sk_xy_to_radius_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax -HIDDEN _sk_xy_to_2pt_conical_sse41 -.globl _sk_xy_to_2pt_conical_sse41 -FUNCTION(_sk_xy_to_2pt_conical_sse41) -_sk_xy_to_2pt_conical_sse41: +HIDDEN _sk_xy_to_2pt_conical_quadratic_sse41 +.globl _sk_xy_to_2pt_conical_quadratic_sse41 +FUNCTION(_sk_xy_to_2pt_conical_quadratic_sse41) +_sk_xy_to_2pt_conical_quadratic_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 243,68,15,16,16 // movss (%rax),%xmm10 - .byte 243,68,15,16,72,4 // movss 0x4(%rax),%xmm9 + .byte 243,68,15,16,80,32 // movss 0x20(%rax),%xmm10 + .byte 243,68,15,16,72,36 // movss 0x24(%rax),%xmm9 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 - .byte 243,68,15,16,88,8 // movss 0x8(%rax),%xmm11 - .byte 243,68,15,16,64,12 // movss 0xc(%rax),%xmm8 + .byte 243,68,15,16,88,40 // movss 0x28(%rax),%xmm11 + .byte 243,68,15,16,64,44 // movss 0x2c(%rax),%xmm8 .byte 243,69,15,89,195 // mulss %xmm11,%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 .byte 68,15,88,192 // addps %xmm0,%xmm8 - .byte 68,15,89,5,46,23,0,0 // mulps 0x172e(%rip),%xmm8 # 6cf0 <_sk_callback_sse41+0x136a> + .byte 68,15,89,5,221,23,0,0 // mulps 0x17dd(%rip),%xmm8 # 6da0 <_sk_callback_sse41+0x1369> .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 @@ -30914,7 +31134,7 @@ _sk_xy_to_2pt_conical_sse41: .byte 243,69,15,89,219 // mulss %xmm11,%xmm11 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,92,227 // subps %xmm11,%xmm12 - .byte 68,15,89,21,25,23,0,0 // mulps 0x1719(%rip),%xmm10 # 6d00 <_sk_callback_sse41+0x137a> + .byte 68,15,89,21,200,23,0,0 // mulps 0x17c8(%rip),%xmm10 # 6db0 <_sk_callback_sse41+0x1379> .byte 69,15,89,212 // mulps %xmm12,%xmm10 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 @@ -30923,9 +31143,9 @@ _sk_xy_to_2pt_conical_sse41: .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 65,15,92,192 // subps %xmm8,%xmm0 - .byte 68,15,87,5,1,23,0,0 // xorps 0x1701(%rip),%xmm8 # 6d10 <_sk_callback_sse41+0x138a> + .byte 68,15,87,5,176,23,0,0 // xorps 0x17b0(%rip),%xmm8 # 6dc0 <_sk_callback_sse41+0x1389> .byte 65,15,89,193 // mulps %xmm9,%xmm0 - .byte 68,15,40,29,5,23,0,0 // movaps 0x1705(%rip),%xmm11 # 6d20 <_sk_callback_sse41+0x139a> + .byte 68,15,40,29,180,23,0,0 // movaps 0x17b4(%rip),%xmm11 # 6dd0 <_sk_callback_sse41+0x1399> .byte 65,15,89,195 // mulps %xmm11,%xmm0 .byte 69,15,92,194 // subps %xmm10,%xmm8 .byte 69,15,89,193 // mulps %xmm9,%xmm8 @@ -30934,12 +31154,64 @@ _sk_xy_to_2pt_conical_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax +HIDDEN _sk_xy_to_2pt_conical_linear_sse41 +.globl _sk_xy_to_2pt_conical_linear_sse41 +FUNCTION(_sk_xy_to_2pt_conical_linear_sse41) +_sk_xy_to_2pt_conical_linear_sse41: + .byte 68,15,40,192 // movaps %xmm0,%xmm8 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 243,68,15,16,72,40 // movss 0x28(%rax),%xmm9 + .byte 243,15,16,64,44 // movss 0x2c(%rax),%xmm0 + .byte 68,15,40,208 // movaps %xmm0,%xmm10 + .byte 243,69,15,89,209 // mulss %xmm9,%xmm10 + .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 + .byte 69,15,88,208 // addps %xmm8,%xmm10 + .byte 68,15,89,21,129,23,0,0 // mulps 0x1781(%rip),%xmm10 # 6de0 <_sk_callback_sse41+0x13a9> + .byte 69,15,89,192 // mulps %xmm8,%xmm8 + .byte 15,89,201 // mulps %xmm1,%xmm1 + .byte 65,15,88,200 // addps %xmm8,%xmm1 + .byte 69,15,40,193 // movaps %xmm9,%xmm8 + .byte 243,69,15,89,192 // mulss %xmm8,%xmm8 + .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 + .byte 65,15,92,200 // subps %xmm8,%xmm1 + .byte 15,87,13,109,23,0,0 // xorps 0x176d(%rip),%xmm1 # 6df0 <_sk_callback_sse41+0x13b9> + .byte 65,15,94,202 // divps %xmm10,%xmm1 + .byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0 + .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 + .byte 15,89,193 // mulps %xmm1,%xmm0 + .byte 65,15,88,193 // addps %xmm9,%xmm0 + .byte 69,15,87,201 // xorps %xmm9,%xmm9 + .byte 65,15,194,193,1 // cmpltps %xmm9,%xmm0 + .byte 68,15,40,193 // movaps %xmm1,%xmm8 + .byte 69,15,194,193,3 // cmpunordps %xmm9,%xmm8 + .byte 65,15,86,192 // orps %xmm8,%xmm0 + .byte 68,15,40,5,75,23,0,0 // movaps 0x174b(%rip),%xmm8 # 6e00 <_sk_callback_sse41+0x13c9> + .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 + .byte 68,15,17,0 // movups %xmm8,(%rax) + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 15,40,193 // movaps %xmm1,%xmm0 + .byte 65,15,40,200 // movaps %xmm8,%xmm1 + .byte 255,224 // jmpq *%rax + +HIDDEN _sk_vector_scale_sse41 +.globl _sk_vector_scale_sse41 +FUNCTION(_sk_vector_scale_sse41) +_sk_vector_scale_sse41: + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 68,15,16,0 // movups (%rax),%xmm8 + .byte 65,15,89,192 // mulps %xmm8,%xmm0 + .byte 65,15,89,200 // mulps %xmm8,%xmm1 + .byte 65,15,89,208 // mulps %xmm8,%xmm2 + .byte 65,15,89,216 // mulps %xmm8,%xmm3 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + HIDDEN _sk_save_xy_sse41 .globl _sk_save_xy_sse41 FUNCTION(_sk_save_xy_sse41) _sk_save_xy_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,243,22,0,0 // movaps 0x16f3(%rip),%xmm8 # 6d30 <_sk_callback_sse41+0x13aa> + .byte 68,15,40,5,34,23,0,0 // movaps 0x1722(%rip),%xmm8 # 6e10 <_sk_callback_sse41+0x13d9> .byte 15,17,0 // movups %xmm0,(%rax) .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,88,200 // addps %xmm8,%xmm9 @@ -30983,8 +31255,8 @@ _sk_bilinear_nx_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,117,22,0,0 // addps 0x1675(%rip),%xmm0 # 6d40 <_sk_callback_sse41+0x13ba> - .byte 68,15,40,13,125,22,0,0 // movaps 0x167d(%rip),%xmm9 # 6d50 <_sk_callback_sse41+0x13ca> + .byte 15,88,5,164,22,0,0 // addps 0x16a4(%rip),%xmm0 # 6e20 <_sk_callback_sse41+0x13e9> + .byte 68,15,40,13,172,22,0,0 // movaps 0x16ac(%rip),%xmm9 # 6e30 <_sk_callback_sse41+0x13f9> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -30997,7 +31269,7 @@ _sk_bilinear_px_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,108,22,0,0 // addps 0x166c(%rip),%xmm0 # 6d60 <_sk_callback_sse41+0x13da> + .byte 15,88,5,155,22,0,0 // addps 0x169b(%rip),%xmm0 # 6e40 <_sk_callback_sse41+0x1409> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -31009,8 +31281,8 @@ _sk_bilinear_ny_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,94,22,0,0 // addps 0x165e(%rip),%xmm1 # 6d70 <_sk_callback_sse41+0x13ea> - .byte 68,15,40,13,102,22,0,0 // movaps 0x1666(%rip),%xmm9 # 6d80 <_sk_callback_sse41+0x13fa> + .byte 15,88,13,141,22,0,0 // addps 0x168d(%rip),%xmm1 # 6e50 <_sk_callback_sse41+0x1419> + .byte 68,15,40,13,149,22,0,0 // movaps 0x1695(%rip),%xmm9 # 6e60 <_sk_callback_sse41+0x1429> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -31023,7 +31295,7 @@ _sk_bilinear_py_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,84,22,0,0 // addps 0x1654(%rip),%xmm1 # 6d90 <_sk_callback_sse41+0x140a> + .byte 15,88,13,131,22,0,0 // addps 0x1683(%rip),%xmm1 # 6e70 <_sk_callback_sse41+0x1439> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -31035,13 +31307,13 @@ _sk_bicubic_n3x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,71,22,0,0 // addps 0x1647(%rip),%xmm0 # 6da0 <_sk_callback_sse41+0x141a> - .byte 68,15,40,13,79,22,0,0 // movaps 0x164f(%rip),%xmm9 # 6db0 <_sk_callback_sse41+0x142a> + .byte 15,88,5,118,22,0,0 // addps 0x1676(%rip),%xmm0 # 6e80 <_sk_callback_sse41+0x1449> + .byte 68,15,40,13,126,22,0,0 // movaps 0x167e(%rip),%xmm9 # 6e90 <_sk_callback_sse41+0x1459> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,75,22,0,0 // mulps 0x164b(%rip),%xmm9 # 6dc0 <_sk_callback_sse41+0x143a> - .byte 68,15,88,13,83,22,0,0 // addps 0x1653(%rip),%xmm9 # 6dd0 <_sk_callback_sse41+0x144a> + .byte 68,15,89,13,122,22,0,0 // mulps 0x167a(%rip),%xmm9 # 6ea0 <_sk_callback_sse41+0x1469> + .byte 68,15,88,13,130,22,0,0 // addps 0x1682(%rip),%xmm9 # 6eb0 <_sk_callback_sse41+0x1479> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -31054,16 +31326,16 @@ _sk_bicubic_n1x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,66,22,0,0 // addps 0x1642(%rip),%xmm0 # 6de0 <_sk_callback_sse41+0x145a> - .byte 68,15,40,13,74,22,0,0 // movaps 0x164a(%rip),%xmm9 # 6df0 <_sk_callback_sse41+0x146a> + .byte 15,88,5,113,22,0,0 // addps 0x1671(%rip),%xmm0 # 6ec0 <_sk_callback_sse41+0x1489> + .byte 68,15,40,13,121,22,0,0 // movaps 0x1679(%rip),%xmm9 # 6ed0 <_sk_callback_sse41+0x1499> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,78,22,0,0 // movaps 0x164e(%rip),%xmm8 # 6e00 <_sk_callback_sse41+0x147a> + .byte 68,15,40,5,125,22,0,0 // movaps 0x167d(%rip),%xmm8 # 6ee0 <_sk_callback_sse41+0x14a9> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,82,22,0,0 // addps 0x1652(%rip),%xmm8 # 6e10 <_sk_callback_sse41+0x148a> + .byte 68,15,88,5,129,22,0,0 // addps 0x1681(%rip),%xmm8 # 6ef0 <_sk_callback_sse41+0x14b9> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,86,22,0,0 // addps 0x1656(%rip),%xmm8 # 6e20 <_sk_callback_sse41+0x149a> + .byte 68,15,88,5,133,22,0,0 // addps 0x1685(%rip),%xmm8 # 6f00 <_sk_callback_sse41+0x14c9> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,90,22,0,0 // addps 0x165a(%rip),%xmm8 # 6e30 <_sk_callback_sse41+0x14aa> + .byte 68,15,88,5,137,22,0,0 // addps 0x1689(%rip),%xmm8 # 6f10 <_sk_callback_sse41+0x14d9> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -31073,17 +31345,17 @@ HIDDEN _sk_bicubic_p1x_sse41 FUNCTION(_sk_bicubic_p1x_sse41) _sk_bicubic_p1x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,84,22,0,0 // movaps 0x1654(%rip),%xmm8 # 6e40 <_sk_callback_sse41+0x14ba> + .byte 68,15,40,5,131,22,0,0 // movaps 0x1683(%rip),%xmm8 # 6f20 <_sk_callback_sse41+0x14e9> .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,21,80,22,0,0 // movaps 0x1650(%rip),%xmm10 # 6e50 <_sk_callback_sse41+0x14ca> + .byte 68,15,40,21,127,22,0,0 // movaps 0x167f(%rip),%xmm10 # 6f30 <_sk_callback_sse41+0x14f9> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,84,22,0,0 // addps 0x1654(%rip),%xmm10 # 6e60 <_sk_callback_sse41+0x14da> + .byte 68,15,88,21,131,22,0,0 // addps 0x1683(%rip),%xmm10 # 6f40 <_sk_callback_sse41+0x1509> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,80,22,0,0 // addps 0x1650(%rip),%xmm10 # 6e70 <_sk_callback_sse41+0x14ea> + .byte 68,15,88,21,127,22,0,0 // addps 0x167f(%rip),%xmm10 # 6f50 <_sk_callback_sse41+0x1519> .byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -31095,11 +31367,11 @@ _sk_bicubic_p3x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,67,22,0,0 // addps 0x1643(%rip),%xmm0 # 6e80 <_sk_callback_sse41+0x14fa> + .byte 15,88,5,114,22,0,0 // addps 0x1672(%rip),%xmm0 # 6f60 <_sk_callback_sse41+0x1529> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,67,22,0,0 // mulps 0x1643(%rip),%xmm8 # 6e90 <_sk_callback_sse41+0x150a> - .byte 68,15,88,5,75,22,0,0 // addps 0x164b(%rip),%xmm8 # 6ea0 <_sk_callback_sse41+0x151a> + .byte 68,15,89,5,114,22,0,0 // mulps 0x1672(%rip),%xmm8 # 6f70 <_sk_callback_sse41+0x1539> + .byte 68,15,88,5,122,22,0,0 // addps 0x167a(%rip),%xmm8 # 6f80 <_sk_callback_sse41+0x1549> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -31112,13 +31384,13 @@ _sk_bicubic_n3y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,57,22,0,0 // addps 0x1639(%rip),%xmm1 # 6eb0 <_sk_callback_sse41+0x152a> - .byte 68,15,40,13,65,22,0,0 // movaps 0x1641(%rip),%xmm9 # 6ec0 <_sk_callback_sse41+0x153a> + .byte 15,88,13,104,22,0,0 // addps 0x1668(%rip),%xmm1 # 6f90 <_sk_callback_sse41+0x1559> + .byte 68,15,40,13,112,22,0,0 // movaps 0x1670(%rip),%xmm9 # 6fa0 <_sk_callback_sse41+0x1569> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,61,22,0,0 // mulps 0x163d(%rip),%xmm9 # 6ed0 <_sk_callback_sse41+0x154a> - .byte 68,15,88,13,69,22,0,0 // addps 0x1645(%rip),%xmm9 # 6ee0 <_sk_callback_sse41+0x155a> + .byte 68,15,89,13,108,22,0,0 // mulps 0x166c(%rip),%xmm9 # 6fb0 <_sk_callback_sse41+0x1579> + .byte 68,15,88,13,116,22,0,0 // addps 0x1674(%rip),%xmm9 # 6fc0 <_sk_callback_sse41+0x1589> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -31131,16 +31403,16 @@ _sk_bicubic_n1y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,51,22,0,0 // addps 0x1633(%rip),%xmm1 # 6ef0 <_sk_callback_sse41+0x156a> - .byte 68,15,40,13,59,22,0,0 // movaps 0x163b(%rip),%xmm9 # 6f00 <_sk_callback_sse41+0x157a> + .byte 15,88,13,98,22,0,0 // addps 0x1662(%rip),%xmm1 # 6fd0 <_sk_callback_sse41+0x1599> + .byte 68,15,40,13,106,22,0,0 // movaps 0x166a(%rip),%xmm9 # 6fe0 <_sk_callback_sse41+0x15a9> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,63,22,0,0 // movaps 0x163f(%rip),%xmm8 # 6f10 <_sk_callback_sse41+0x158a> + .byte 68,15,40,5,110,22,0,0 // movaps 0x166e(%rip),%xmm8 # 6ff0 <_sk_callback_sse41+0x15b9> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,67,22,0,0 // addps 0x1643(%rip),%xmm8 # 6f20 <_sk_callback_sse41+0x159a> + .byte 68,15,88,5,114,22,0,0 // addps 0x1672(%rip),%xmm8 # 7000 <_sk_callback_sse41+0x15c9> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,71,22,0,0 // addps 0x1647(%rip),%xmm8 # 6f30 <_sk_callback_sse41+0x15aa> + .byte 68,15,88,5,118,22,0,0 // addps 0x1676(%rip),%xmm8 # 7010 <_sk_callback_sse41+0x15d9> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,75,22,0,0 // addps 0x164b(%rip),%xmm8 # 6f40 <_sk_callback_sse41+0x15ba> + .byte 68,15,88,5,122,22,0,0 // addps 0x167a(%rip),%xmm8 # 7020 <_sk_callback_sse41+0x15e9> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -31150,17 +31422,17 @@ HIDDEN _sk_bicubic_p1y_sse41 FUNCTION(_sk_bicubic_p1y_sse41) _sk_bicubic_p1y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,69,22,0,0 // movaps 0x1645(%rip),%xmm8 # 6f50 <_sk_callback_sse41+0x15ca> + .byte 68,15,40,5,116,22,0,0 // movaps 0x1674(%rip),%xmm8 # 7030 <_sk_callback_sse41+0x15f9> .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9 .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 68,15,40,21,64,22,0,0 // movaps 0x1640(%rip),%xmm10 # 6f60 <_sk_callback_sse41+0x15da> + .byte 68,15,40,21,111,22,0,0 // movaps 0x166f(%rip),%xmm10 # 7040 <_sk_callback_sse41+0x1609> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,68,22,0,0 // addps 0x1644(%rip),%xmm10 # 6f70 <_sk_callback_sse41+0x15ea> + .byte 68,15,88,21,115,22,0,0 // addps 0x1673(%rip),%xmm10 # 7050 <_sk_callback_sse41+0x1619> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,64,22,0,0 // addps 0x1640(%rip),%xmm10 # 6f80 <_sk_callback_sse41+0x15fa> + .byte 68,15,88,21,111,22,0,0 // addps 0x166f(%rip),%xmm10 # 7060 <_sk_callback_sse41+0x1629> .byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -31172,11 +31444,11 @@ _sk_bicubic_p3y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,50,22,0,0 // addps 0x1632(%rip),%xmm1 # 6f90 <_sk_callback_sse41+0x160a> + .byte 15,88,13,97,22,0,0 // addps 0x1661(%rip),%xmm1 # 7070 <_sk_callback_sse41+0x1639> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,50,22,0,0 // mulps 0x1632(%rip),%xmm8 # 6fa0 <_sk_callback_sse41+0x161a> - .byte 68,15,88,5,58,22,0,0 // addps 0x163a(%rip),%xmm8 # 6fb0 <_sk_callback_sse41+0x162a> + .byte 68,15,89,5,97,22,0,0 // mulps 0x1661(%rip),%xmm8 # 7080 <_sk_callback_sse41+0x1649> + .byte 68,15,88,5,105,22,0,0 // addps 0x1669(%rip),%xmm8 # 7090 <_sk_callback_sse41+0x1659> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -31406,11 +31678,11 @@ BALIGN16 .byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%rdi) .byte 0,224 // add %ah,%al .byte 64,0,0 // add %al,(%rax) - .byte 224,64 // loopne 5c58 <.literal16+0x1d8> + .byte 224,64 // loopne 5d08 <.literal16+0x1d8> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 5c5c <.literal16+0x1dc> + .byte 224,64 // loopne 5d0c <.literal16+0x1dc> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 5c60 <.literal16+0x1e0> + .byte 224,64 // loopne 5d10 <.literal16+0x1e0> .byte 154 // (bad) .byte 153 // cltd .byte 153 // cltd @@ -31430,13 +31702,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5c81 <.literal16+0x201> + .byte 71,225,61 // rex.RXB loope 5d31 <.literal16+0x201> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5c85 <.literal16+0x205> + .byte 71,225,61 // rex.RXB loope 5d35 <.literal16+0x205> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5c89 <.literal16+0x209> + .byte 71,225,61 // rex.RXB loope 5d39 <.literal16+0x209> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5c8d <.literal16+0x20d> + .byte 71,225,61 // rex.RXB loope 5d3d <.literal16+0x20d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -31461,13 +31733,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5cc1 <.literal16+0x241> + .byte 71,225,61 // rex.RXB loope 5d71 <.literal16+0x241> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5cc5 <.literal16+0x245> + .byte 71,225,61 // rex.RXB loope 5d75 <.literal16+0x245> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5cc9 <.literal16+0x249> + .byte 71,225,61 // rex.RXB loope 5d79 <.literal16+0x249> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5ccd <.literal16+0x24d> + .byte 71,225,61 // rex.RXB loope 5d7d <.literal16+0x24d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -31492,13 +31764,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5d01 <.literal16+0x281> + .byte 71,225,61 // rex.RXB loope 5db1 <.literal16+0x281> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5d05 <.literal16+0x285> + .byte 71,225,61 // rex.RXB loope 5db5 <.literal16+0x285> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5d09 <.literal16+0x289> + .byte 71,225,61 // rex.RXB loope 5db9 <.literal16+0x289> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5d0d <.literal16+0x28d> + .byte 71,225,61 // rex.RXB loope 5dbd <.literal16+0x28d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -31523,13 +31795,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5d41 <.literal16+0x2c1> + .byte 71,225,61 // rex.RXB loope 5df1 <.literal16+0x2c1> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5d45 <.literal16+0x2c5> + .byte 71,225,61 // rex.RXB loope 5df5 <.literal16+0x2c5> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5d49 <.literal16+0x2c9> + .byte 71,225,61 // rex.RXB loope 5df9 <.literal16+0x2c9> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5d4d <.literal16+0x2cd> + .byte 71,225,61 // rex.RXB loope 5dfd <.literal16+0x2cd> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -31546,10 +31818,10 @@ BALIGN16 .byte 0,1 // add %al,(%rcx) .byte 255 // (bad) .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005d38 <_sk_callback_sse41+0xa0003b2> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005de8 <_sk_callback_sse41+0xa0003b1> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005d40 <_sk_callback_sse41+0x30003ba> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005df0 <_sk_callback_sse41+0x30003b9> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -31568,11 +31840,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax) .byte 67,0,0 // rex.XB add %al,(%r8) - .byte 127,67 // jg 5dab <.literal16+0x32b> + .byte 127,67 // jg 5e5b <.literal16+0x32b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5daf <.literal16+0x32f> + .byte 127,67 // jg 5e5f <.literal16+0x32f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5db3 <.literal16+0x333> + .byte 127,67 // jg 5e63 <.literal16+0x333> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -31854,13 +32126,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 5fe9 <.literal16+0x569> + .byte 224,7 // loopne 6099 <.literal16+0x569> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5fed <.literal16+0x56d> + .byte 224,7 // loopne 609d <.literal16+0x56d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5ff1 <.literal16+0x571> + .byte 224,7 // loopne 60a1 <.literal16+0x571> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5ff5 <.literal16+0x575> + .byte 224,7 // loopne 60a5 <.literal16+0x575> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -31894,10 +32166,10 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006038 <_sk_callback_sse41+0xa0006b2> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0060e8 <_sk_callback_sse41+0xa0006b1> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006040 <_sk_callback_sse41+0x30006ba> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30060f0 <_sk_callback_sse41+0x30006b9> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -31952,11 +32224,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 610b <.literal16+0x68b> + .byte 127,67 // jg 61bb <.literal16+0x68b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 610f <.literal16+0x68f> + .byte 127,67 // jg 61bf <.literal16+0x68f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6113 <.literal16+0x693> + .byte 127,67 // jg 61c3 <.literal16+0x693> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax) @@ -31971,16 +32243,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 6104 <.literal16+0x684> + .byte 127,0 // jg 61b4 <.literal16+0x684> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 6108 <.literal16+0x688> + .byte 127,0 // jg 61b8 <.literal16+0x688> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 610c <.literal16+0x68c> + .byte 127,0 // jg 61bc <.literal16+0x68c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 6110 <.literal16+0x690> + .byte 127,0 // jg 61c0 <.literal16+0x690> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -31989,7 +32261,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6195 <.literal16+0x715> + .byte 119,115 // ja 6245 <.literal16+0x715> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -32000,7 +32272,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 60f9 <.literal16+0x679> + .byte 117,191 // jne 61a9 <.literal16+0x679> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -32012,7 +32284,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3a13a <_sk_callback_sse41+0xffffffffe9a347b4> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3a1ea <_sk_callback_sse41+0xffffffffe9a347b3> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -32067,16 +32339,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 61d4 <.literal16+0x754> + .byte 127,0 // jg 6284 <.literal16+0x754> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 61d8 <.literal16+0x758> + .byte 127,0 // jg 6288 <.literal16+0x758> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 61dc <.literal16+0x75c> + .byte 127,0 // jg 628c <.literal16+0x75c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 61e0 <.literal16+0x760> + .byte 127,0 // jg 6290 <.literal16+0x760> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -32085,7 +32357,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6265 <.literal16+0x7e5> + .byte 119,115 // ja 6315 <.literal16+0x7e5> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -32096,7 +32368,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 61c9 <.literal16+0x749> + .byte 117,191 // jne 6279 <.literal16+0x749> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -32108,7 +32380,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3a20a <_sk_callback_sse41+0xffffffffe9a34884> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3a2ba <_sk_callback_sse41+0xffffffffe9a34883> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -32163,16 +32435,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 62a4 <.literal16+0x824> + .byte 127,0 // jg 6354 <.literal16+0x824> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 62a8 <.literal16+0x828> + .byte 127,0 // jg 6358 <.literal16+0x828> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 62ac <.literal16+0x82c> + .byte 127,0 // jg 635c <.literal16+0x82c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 62b0 <.literal16+0x830> + .byte 127,0 // jg 6360 <.literal16+0x830> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -32181,7 +32453,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6335 <.literal16+0x8b5> + .byte 119,115 // ja 63e5 <.literal16+0x8b5> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -32192,7 +32464,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 6299 <.literal16+0x819> + .byte 117,191 // jne 6349 <.literal16+0x819> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -32204,7 +32476,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3a2da <_sk_callback_sse41+0xffffffffe9a34954> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3a38a <_sk_callback_sse41+0xffffffffe9a34953> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -32259,16 +32531,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 6374 <.literal16+0x8f4> + .byte 127,0 // jg 6424 <.literal16+0x8f4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 6378 <.literal16+0x8f8> + .byte 127,0 // jg 6428 <.literal16+0x8f8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 637c <.literal16+0x8fc> + .byte 127,0 // jg 642c <.literal16+0x8fc> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 6380 <.literal16+0x900> + .byte 127,0 // jg 6430 <.literal16+0x900> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -32277,7 +32549,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6405 <.literal16+0x985> + .byte 119,115 // ja 64b5 <.literal16+0x985> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -32288,7 +32560,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 6369 <.literal16+0x8e9> + .byte 117,191 // jne 6419 <.literal16+0x8e9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -32300,7 +32572,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3a3aa <_sk_callback_sse41+0xffffffffe9a34a24> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3a45a <_sk_callback_sse41+0xffffffffe9a34a23> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -32351,13 +32623,13 @@ BALIGN16 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 - .byte 127,67 // jg 6487 <.literal16+0xa07> + .byte 127,67 // jg 6537 <.literal16+0xa07> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 648b <.literal16+0xa0b> + .byte 127,67 // jg 653b <.literal16+0xa0b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 648f <.literal16+0xa0f> + .byte 127,67 // jg 653f <.literal16+0xa0f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6493 <.literal16+0xa13> + .byte 127,67 // jg 6543 <.literal16+0xa13> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -32404,16 +32676,16 @@ BALIGN16 .byte 128,3,62 // addb $0x3e,(%rbx) .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 6513 <.literal16+0xa93> + .byte 118,63 // jbe 65c3 <.literal16+0xa93> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 6517 <.literal16+0xa97> + .byte 118,63 // jbe 65c7 <.literal16+0xa97> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 651b <.literal16+0xa9b> + .byte 118,63 // jbe 65cb <.literal16+0xa9b> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 651f <.literal16+0xa9f> + .byte 118,63 // jbe 65cf <.literal16+0xa9f> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) @@ -32442,11 +32714,11 @@ BALIGN16 .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 658b <.literal16+0xb0b> + .byte 127,67 // jg 663b <.literal16+0xb0b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 658f <.literal16+0xb0f> + .byte 127,67 // jg 663f <.literal16+0xb0f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6593 <.literal16+0xb13> + .byte 127,67 // jg 6643 <.literal16+0xb13> .byte 0,4,0 // add %al,(%rax,%rax,1) .byte 0,0 // add %al,(%rax) .byte 0,0 // add %al,(%rax) @@ -32504,7 +32776,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006610 <_sk_callback_sse41+0x3000c8a> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30066c0 <_sk_callback_sse41+0x3000c89> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -32533,13 +32805,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 6649 <.literal16+0xbc9> + .byte 224,7 // loopne 66f9 <.literal16+0xbc9> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 664d <.literal16+0xbcd> + .byte 224,7 // loopne 66fd <.literal16+0xbcd> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6651 <.literal16+0xbd1> + .byte 224,7 // loopne 6701 <.literal16+0xbd1> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6655 <.literal16+0xbd5> + .byte 224,7 // loopne 6705 <.literal16+0xbd5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -32585,13 +32857,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 66b9 <.literal16+0xc39> + .byte 224,7 // loopne 6769 <.literal16+0xc39> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 66bd <.literal16+0xc3d> + .byte 224,7 // loopne 676d <.literal16+0xc3d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 66c1 <.literal16+0xc41> + .byte 224,7 // loopne 6771 <.literal16+0xc41> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 66c5 <.literal16+0xc45> + .byte 224,7 // loopne 6775 <.literal16+0xc45> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -32637,13 +32909,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 6729 <.literal16+0xca9> + .byte 224,7 // loopne 67d9 <.literal16+0xca9> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 672d <.literal16+0xcad> + .byte 224,7 // loopne 67dd <.literal16+0xcad> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6731 <.literal16+0xcb1> + .byte 224,7 // loopne 67e1 <.literal16+0xcb1> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6735 <.literal16+0xcb5> + .byte 224,7 // loopne 67e5 <.literal16+0xcb5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -32681,13 +32953,13 @@ BALIGN16 .byte 65,0,0 // add %al,(%r8) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 67c6 <.literal16+0xd46> + .byte 124,66 // jl 6876 <.literal16+0xd46> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 67ca <.literal16+0xd4a> + .byte 124,66 // jl 687a <.literal16+0xd4a> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 67ce <.literal16+0xd4e> + .byte 124,66 // jl 687e <.literal16+0xd4e> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 67d2 <.literal16+0xd52> + .byte 124,66 // jl 6882 <.literal16+0xd52> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 0,240 // add %dh,%al @@ -32821,13 +33093,13 @@ BALIGN16 .byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax) .byte 61,137,136,136,61 // cmp $0x3d888889,%eax .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 6955 <.literal16+0xed5> + .byte 112,65 // jo 6a05 <.literal16+0xed5> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 6959 <.literal16+0xed9> + .byte 112,65 // jo 6a09 <.literal16+0xed9> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 695d <.literal16+0xedd> + .byte 112,65 // jo 6a0d <.literal16+0xedd> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 6961 <.literal16+0xee1> + .byte 112,65 // jo 6a11 <.literal16+0xee1> .byte 255,0 // incl (%rax) .byte 0,0 // add %al,(%rax) .byte 255,0 // incl (%rax) @@ -32842,7 +33114,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006950 <_sk_callback_sse41+0x3000fca> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006a00 <_sk_callback_sse41+0x3000fc9> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -32869,7 +33141,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006990 <_sk_callback_sse41+0x300100a> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006a40 <_sk_callback_sse41+0x3001009> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -32896,7 +33168,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30069d0 <_sk_callback_sse41+0x300104a> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006a80 <_sk_callback_sse41+0x3001049> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -32911,11 +33183,11 @@ BALIGN16 .byte 255,0 // incl (%rax) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6a2b <.literal16+0xfab> + .byte 127,67 // jg 6adb <.literal16+0xfab> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6a2f <.literal16+0xfaf> + .byte 127,67 // jg 6adf <.literal16+0xfaf> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6a33 <.literal16+0xfb3> + .byte 127,67 // jg 6ae3 <.literal16+0xfb3> .byte 255,0 // incl (%rax) .byte 0,0 // add %al,(%rax) .byte 255,0 // incl (%rax) @@ -32930,7 +33202,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006a20 <_sk_callback_sse41+0x300109a> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006ad0 <_sk_callback_sse41+0x3001099> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -32957,7 +33229,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006a60 <_sk_callback_sse41+0x30010da> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006b10 <_sk_callback_sse41+0x30010d9> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -32984,7 +33256,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006aa0 <_sk_callback_sse41+0x300111a> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006b50 <_sk_callback_sse41+0x3001119> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -32999,11 +33271,11 @@ BALIGN16 .byte 255,0 // incl (%rax) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6afb <.literal16+0x107b> + .byte 127,67 // jg 6bab <.literal16+0x107b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6aff <.literal16+0x107f> + .byte 127,67 // jg 6baf <.literal16+0x107f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6b03 <.literal16+0x1083> + .byte 127,67 // jg 6bb3 <.literal16+0x1083> .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) .byte 0,0 // add %al,(%rax) .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) @@ -33098,13 +33370,13 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 255 // (bad) - .byte 127,71 // jg 6bfb <.literal16+0x117b> + .byte 127,71 // jg 6cab <.literal16+0x117b> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 6bff <.literal16+0x117f> + .byte 127,71 // jg 6caf <.literal16+0x117f> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 6c03 <.literal16+0x1183> + .byte 127,71 // jg 6cb3 <.literal16+0x1183> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 6c07 <.literal16+0x1187> + .byte 127,71 // jg 6cb7 <.literal16+0x1187> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -33150,10 +33422,10 @@ BALIGN16 .byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax .byte 152 // cwtl .byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx) - .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc07d3a <_sk_callback_sse41+0x2dc023b4> + .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc07dea <_sk_callback_sse41+0x2dc023b3> .byte 17,192 // adc %eax,%eax .byte 45,16,17,192,18 // sub $0x12c01110,%eax - .byte 120,57 // js 6c6c <.literal16+0x11ec> + .byte 120,57 // js 6d1c <.literal16+0x11ec> .byte 64,18,120,57 // adc 0x39(%rax),%dil .byte 64,18,120,57 // adc 0x39(%rax),%dil .byte 64,18,120,57 // adc 0x39(%rax),%dil @@ -33244,7 +33516,25 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) - .byte 0,63 // add %bh,(%rdi) + .byte 0,192 // add %al,%al + .byte 0,0 // add %al,(%rax) + .byte 0,192 // add %al,%al + .byte 0,0 // add %al,(%rax) + .byte 0,192 // add %al,%al + .byte 0,0 // add %al,(%rax) + .byte 0,192 // add %al,%al + .byte 0,0 // add %al,(%rax) + .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) + .byte 0,0 // add %al,(%rax) + .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) + .byte 0,0 // add %al,(%rax) + .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) + .byte 63 // (bad) + .byte 0,0 // add %al,(%rax) + .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,0 // add %al,(%rax) + .byte 63 // (bad) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -33298,11 +33588,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 6de2 <.literal16+0x1362> + .byte 62,114,28 // jb,pt 6ec2 <.literal16+0x1392> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6de6 <.literal16+0x1366> + .byte 62,114,28 // jb,pt 6ec6 <.literal16+0x1396> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6dea <.literal16+0x136a> + .byte 62,114,28 // jb,pt 6eca <.literal16+0x139a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -33346,7 +33636,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63fc75 <_sk_callback_sse41+0x3d63a2ef> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63fd55 <_sk_callback_sse41+0x3d63a31e> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -33372,7 +33662,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63fcb5 <_sk_callback_sse41+0x3d63a32f> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63fd95 <_sk_callback_sse41+0x3d63a35e> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -33381,13 +33671,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 6eae <.literal16+0x142e> + .byte 114,28 // jb 6f8e <.literal16+0x145e> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6eb2 <.literal16+0x1432> + .byte 62,114,28 // jb,pt 6f92 <.literal16+0x1462> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6eb6 <.literal16+0x1436> + .byte 62,114,28 // jb,pt 6f96 <.literal16+0x1466> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6eba <.literal16+0x143a> + .byte 62,114,28 // jb,pt 6f9a <.literal16+0x146a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -33408,11 +33698,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 6ef2 <.literal16+0x1472> + .byte 62,114,28 // jb,pt 6fd2 <.literal16+0x14a2> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6ef6 <.literal16+0x1476> + .byte 62,114,28 // jb,pt 6fd6 <.literal16+0x14a6> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6efa <.literal16+0x147a> + .byte 62,114,28 // jb,pt 6fda <.literal16+0x14aa> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -33456,7 +33746,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63fd85 <_sk_callback_sse41+0x3d63a3ff> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63fe65 <_sk_callback_sse41+0x3d63a42e> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -33482,7 +33772,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63fdc5 <_sk_callback_sse41+0x3d63a43f> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63fea5 <_sk_callback_sse41+0x3d63a46e> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -33491,13 +33781,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 6fbe <.literal16+0x153e> + .byte 114,28 // jb 709e <.literal16+0x156e> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6fc2 <_sk_callback_sse41+0x163c> + .byte 62,114,28 // jb,pt 70a2 <_sk_callback_sse41+0x166b> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6fc6 <_sk_callback_sse41+0x1640> + .byte 62,114,28 // jb,pt 70a6 <_sk_callback_sse41+0x166f> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6fca <_sk_callback_sse41+0x1644> + .byte 62,114,28 // jb,pt 70aa <_sk_callback_sse41+0x1673> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -33589,7 +33879,7 @@ _sk_seed_shader_sse2: .byte 102,15,110,194 // movd %edx,%xmm0 .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0 .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 - .byte 15,40,21,15,95,0,0 // movaps 0x5f0f(%rip),%xmm2 # 5fb0 <_sk_callback_sse2+0xfd> + .byte 15,40,21,175,95,0,0 // movaps 0x5faf(%rip),%xmm2 # 6050 <_sk_callback_sse2+0xfc> .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,16,7 // movups (%rdi),%xmm0 .byte 15,88,193 // addps %xmm1,%xmm0 @@ -33598,7 +33888,7 @@ _sk_seed_shader_sse2: .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,21,254,94,0,0 // movaps 0x5efe(%rip),%xmm2 # 5fc0 <_sk_callback_sse2+0x10d> + .byte 15,40,21,158,95,0,0 // movaps 0x5f9e(%rip),%xmm2 # 6060 <_sk_callback_sse2+0x10c> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,87,237 // xorps %xmm5,%xmm5 @@ -33618,14 +33908,14 @@ _sk_dither_sse2: .byte 102,68,15,110,193 // movd %ecx,%xmm8 .byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8 .byte 102,69,15,239,193 // pxor %xmm9,%xmm8 - .byte 102,68,15,111,21,204,94,0,0 // movdqa 0x5ecc(%rip),%xmm10 # 5fd0 <_sk_callback_sse2+0x11d> + .byte 102,68,15,111,21,108,95,0,0 // movdqa 0x5f6c(%rip),%xmm10 # 6070 <_sk_callback_sse2+0x11c> .byte 102,69,15,111,216 // movdqa %xmm8,%xmm11 .byte 102,69,15,219,218 // pand %xmm10,%xmm11 .byte 102,65,15,114,243,5 // pslld $0x5,%xmm11 .byte 102,69,15,219,209 // pand %xmm9,%xmm10 .byte 102,65,15,114,242,4 // pslld $0x4,%xmm10 - .byte 102,68,15,111,37,184,94,0,0 // movdqa 0x5eb8(%rip),%xmm12 # 5fe0 <_sk_callback_sse2+0x12d> - .byte 102,68,15,111,45,191,94,0,0 // movdqa 0x5ebf(%rip),%xmm13 # 5ff0 <_sk_callback_sse2+0x13d> + .byte 102,68,15,111,37,88,95,0,0 // movdqa 0x5f58(%rip),%xmm12 # 6080 <_sk_callback_sse2+0x12c> + .byte 102,68,15,111,45,95,95,0,0 // movdqa 0x5f5f(%rip),%xmm13 # 6090 <_sk_callback_sse2+0x13c> .byte 102,69,15,111,240 // movdqa %xmm8,%xmm14 .byte 102,69,15,219,245 // pand %xmm13,%xmm14 .byte 102,65,15,114,246,2 // pslld $0x2,%xmm14 @@ -33641,8 +33931,8 @@ _sk_dither_sse2: .byte 102,69,15,235,245 // por %xmm13,%xmm14 .byte 102,69,15,235,240 // por %xmm8,%xmm14 .byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8 - .byte 68,15,89,5,122,94,0,0 // mulps 0x5e7a(%rip),%xmm8 # 6000 <_sk_callback_sse2+0x14d> - .byte 68,15,88,5,130,94,0,0 // addps 0x5e82(%rip),%xmm8 # 6010 <_sk_callback_sse2+0x15d> + .byte 68,15,89,5,26,95,0,0 // mulps 0x5f1a(%rip),%xmm8 # 60a0 <_sk_callback_sse2+0x14c> + .byte 68,15,88,5,34,95,0,0 // addps 0x5f22(%rip),%xmm8 # 60b0 <_sk_callback_sse2+0x15c> .byte 243,68,15,16,16 // movss (%rax),%xmm10 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 @@ -33719,7 +34009,7 @@ HIDDEN _sk_srcatop_sse2 FUNCTION(_sk_srcatop_sse2) _sk_srcatop_sse2: .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 68,15,40,5,220,93,0,0 // movaps 0x5ddc(%rip),%xmm8 # 6020 <_sk_callback_sse2+0x16d> + .byte 68,15,40,5,124,94,0,0 // movaps 0x5e7c(%rip),%xmm8 # 60c0 <_sk_callback_sse2+0x16c> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -33744,7 +34034,7 @@ FUNCTION(_sk_dstatop_sse2) _sk_dstatop_sse2: .byte 68,15,40,195 // movaps %xmm3,%xmm8 .byte 68,15,89,196 // mulps %xmm4,%xmm8 - .byte 68,15,40,13,159,93,0,0 // movaps 0x5d9f(%rip),%xmm9 # 6030 <_sk_callback_sse2+0x17d> + .byte 68,15,40,13,63,94,0,0 // movaps 0x5e3f(%rip),%xmm9 # 60d0 <_sk_callback_sse2+0x17c> .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 @@ -33791,7 +34081,7 @@ HIDDEN _sk_srcout_sse2 .globl _sk_srcout_sse2 FUNCTION(_sk_srcout_sse2) _sk_srcout_sse2: - .byte 68,15,40,5,67,93,0,0 // movaps 0x5d43(%rip),%xmm8 # 6040 <_sk_callback_sse2+0x18d> + .byte 68,15,40,5,227,93,0,0 // movaps 0x5de3(%rip),%xmm8 # 60e0 <_sk_callback_sse2+0x18c> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 @@ -33804,7 +34094,7 @@ HIDDEN _sk_dstout_sse2 .globl _sk_dstout_sse2 FUNCTION(_sk_dstout_sse2) _sk_dstout_sse2: - .byte 68,15,40,5,51,93,0,0 // movaps 0x5d33(%rip),%xmm8 # 6050 <_sk_callback_sse2+0x19d> + .byte 68,15,40,5,211,93,0,0 // movaps 0x5dd3(%rip),%xmm8 # 60f0 <_sk_callback_sse2+0x19c> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 @@ -33821,7 +34111,7 @@ HIDDEN _sk_srcover_sse2 .globl _sk_srcover_sse2 FUNCTION(_sk_srcover_sse2) _sk_srcover_sse2: - .byte 68,15,40,5,22,93,0,0 // movaps 0x5d16(%rip),%xmm8 # 6060 <_sk_callback_sse2+0x1ad> + .byte 68,15,40,5,182,93,0,0 // movaps 0x5db6(%rip),%xmm8 # 6100 <_sk_callback_sse2+0x1ac> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -33841,7 +34131,7 @@ HIDDEN _sk_dstover_sse2 .globl _sk_dstover_sse2 FUNCTION(_sk_dstover_sse2) _sk_dstover_sse2: - .byte 68,15,40,5,234,92,0,0 // movaps 0x5cea(%rip),%xmm8 # 6070 <_sk_callback_sse2+0x1bd> + .byte 68,15,40,5,138,93,0,0 // movaps 0x5d8a(%rip),%xmm8 # 6110 <_sk_callback_sse2+0x1bc> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -33869,7 +34159,7 @@ HIDDEN _sk_multiply_sse2 .globl _sk_multiply_sse2 FUNCTION(_sk_multiply_sse2) _sk_multiply_sse2: - .byte 68,15,40,5,190,92,0,0 // movaps 0x5cbe(%rip),%xmm8 # 6080 <_sk_callback_sse2+0x1cd> + .byte 68,15,40,5,94,93,0,0 // movaps 0x5d5e(%rip),%xmm8 # 6120 <_sk_callback_sse2+0x1cc> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 69,15,40,209 // movaps %xmm9,%xmm10 @@ -33944,7 +34234,7 @@ HIDDEN _sk_xor__sse2 FUNCTION(_sk_xor__sse2) _sk_xor__sse2: .byte 68,15,40,195 // movaps %xmm3,%xmm8 - .byte 15,40,29,243,91,0,0 // movaps 0x5bf3(%rip),%xmm3 # 6090 <_sk_callback_sse2+0x1dd> + .byte 15,40,29,147,92,0,0 // movaps 0x5c93(%rip),%xmm3 # 6130 <_sk_callback_sse2+0x1dc> .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 @@ -33992,7 +34282,7 @@ _sk_darken_sse2: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,95,209 // maxps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,94,91,0,0 // movaps 0x5b5e(%rip),%xmm2 # 60a0 <_sk_callback_sse2+0x1ed> + .byte 15,40,21,254,91,0,0 // movaps 0x5bfe(%rip),%xmm2 # 6140 <_sk_callback_sse2+0x1ec> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -34026,7 +34316,7 @@ _sk_lighten_sse2: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,3,91,0,0 // movaps 0x5b03(%rip),%xmm2 # 60b0 <_sk_callback_sse2+0x1fd> + .byte 15,40,21,163,91,0,0 // movaps 0x5ba3(%rip),%xmm2 # 6150 <_sk_callback_sse2+0x1fc> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -34063,7 +34353,7 @@ _sk_difference_sse2: .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,157,90,0,0 // movaps 0x5a9d(%rip),%xmm2 # 60c0 <_sk_callback_sse2+0x20d> + .byte 15,40,21,61,91,0,0 // movaps 0x5b3d(%rip),%xmm2 # 6160 <_sk_callback_sse2+0x20c> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -34091,7 +34381,7 @@ _sk_exclusion_sse2: .byte 15,89,214 // mulps %xmm6,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,93,90,0,0 // movaps 0x5a5d(%rip),%xmm2 # 60d0 <_sk_callback_sse2+0x21d> + .byte 15,40,21,253,90,0,0 // movaps 0x5afd(%rip),%xmm2 # 6170 <_sk_callback_sse2+0x21c> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -34104,7 +34394,7 @@ HIDDEN _sk_colorburn_sse2 FUNCTION(_sk_colorburn_sse2) _sk_colorburn_sse2: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,21,80,90,0,0 // movaps 0x5a50(%rip),%xmm10 # 60e0 <_sk_callback_sse2+0x22d> + .byte 68,15,40,21,240,90,0,0 // movaps 0x5af0(%rip),%xmm10 # 6180 <_sk_callback_sse2+0x22c> .byte 69,15,40,202 // movaps %xmm10,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 69,15,40,217 // movaps %xmm9,%xmm11 @@ -34198,7 +34488,7 @@ HIDDEN _sk_colordodge_sse2 FUNCTION(_sk_colordodge_sse2) _sk_colordodge_sse2: .byte 68,15,40,200 // movaps %xmm0,%xmm9 - .byte 68,15,40,21,6,89,0,0 // movaps 0x5906(%rip),%xmm10 # 60f0 <_sk_callback_sse2+0x23d> + .byte 68,15,40,21,166,89,0,0 // movaps 0x59a6(%rip),%xmm10 # 6190 <_sk_callback_sse2+0x23c> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 69,15,40,227 // movaps %xmm11,%xmm12 @@ -34292,7 +34582,7 @@ _sk_hardlight_sse2: .byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp) .byte 15,40,245 // movaps %xmm5,%xmm6 .byte 15,40,236 // movaps %xmm4,%xmm5 - .byte 68,15,40,29,187,87,0,0 // movaps 0x57bb(%rip),%xmm11 # 6100 <_sk_callback_sse2+0x24d> + .byte 68,15,40,29,91,88,0,0 // movaps 0x585b(%rip),%xmm11 # 61a0 <_sk_callback_sse2+0x24c> .byte 69,15,40,211 // movaps %xmm11,%xmm10 .byte 68,15,92,215 // subps %xmm7,%xmm10 .byte 69,15,40,194 // movaps %xmm10,%xmm8 @@ -34380,7 +34670,7 @@ FUNCTION(_sk_overlay_sse2) _sk_overlay_sse2: .byte 68,15,40,193 // movaps %xmm1,%xmm8 .byte 68,15,40,232 // movaps %xmm0,%xmm13 - .byte 68,15,40,13,137,86,0,0 // movaps 0x5689(%rip),%xmm9 # 6110 <_sk_callback_sse2+0x25d> + .byte 68,15,40,13,41,87,0,0 // movaps 0x5729(%rip),%xmm9 # 61b0 <_sk_callback_sse2+0x25c> .byte 69,15,40,209 // movaps %xmm9,%xmm10 .byte 68,15,92,215 // subps %xmm7,%xmm10 .byte 69,15,40,218 // movaps %xmm10,%xmm11 @@ -34471,7 +34761,7 @@ _sk_softlight_sse2: .byte 68,15,40,213 // movaps %xmm5,%xmm10 .byte 68,15,94,215 // divps %xmm7,%xmm10 .byte 69,15,84,212 // andps %xmm12,%xmm10 - .byte 68,15,40,13,70,85,0,0 // movaps 0x5546(%rip),%xmm9 # 6120 <_sk_callback_sse2+0x26d> + .byte 68,15,40,13,230,85,0,0 // movaps 0x55e6(%rip),%xmm9 # 61c0 <_sk_callback_sse2+0x26c> .byte 69,15,40,249 // movaps %xmm9,%xmm15 .byte 69,15,92,250 // subps %xmm10,%xmm15 .byte 69,15,40,218 // movaps %xmm10,%xmm11 @@ -34484,10 +34774,10 @@ _sk_softlight_sse2: .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 65,15,88,194 // addps %xmm10,%xmm0 - .byte 68,15,40,53,32,85,0,0 // movaps 0x5520(%rip),%xmm14 # 6130 <_sk_callback_sse2+0x27d> + .byte 68,15,40,53,192,85,0,0 // movaps 0x55c0(%rip),%xmm14 # 61d0 <_sk_callback_sse2+0x27c> .byte 69,15,88,222 // addps %xmm14,%xmm11 .byte 68,15,89,216 // mulps %xmm0,%xmm11 - .byte 68,15,40,21,32,85,0,0 // movaps 0x5520(%rip),%xmm10 # 6140 <_sk_callback_sse2+0x28d> + .byte 68,15,40,21,192,85,0,0 // movaps 0x55c0(%rip),%xmm10 # 61e0 <_sk_callback_sse2+0x28c> .byte 69,15,89,234 // mulps %xmm10,%xmm13 .byte 69,15,88,235 // addps %xmm11,%xmm13 .byte 15,88,228 // addps %xmm4,%xmm4 @@ -34632,7 +34922,7 @@ _sk_hue_sse2: .byte 68,15,40,209 // movaps %xmm1,%xmm10 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 68,15,89,211 // mulps %xmm3,%xmm10 - .byte 68,15,40,5,99,83,0,0 // movaps 0x5363(%rip),%xmm8 # 6180 <_sk_callback_sse2+0x2cd> + .byte 68,15,40,5,3,84,0,0 // movaps 0x5403(%rip),%xmm8 # 6220 <_sk_callback_sse2+0x2cc> .byte 69,15,40,216 // movaps %xmm8,%xmm11 .byte 15,40,207 // movaps %xmm7,%xmm1 .byte 68,15,92,217 // subps %xmm1,%xmm11 @@ -34680,12 +34970,12 @@ _sk_hue_sse2: .byte 69,15,84,206 // andps %xmm14,%xmm9 .byte 69,15,84,214 // andps %xmm14,%xmm10 .byte 65,15,84,214 // andps %xmm14,%xmm2 - .byte 68,15,40,61,112,82,0,0 // movaps 0x5270(%rip),%xmm15 # 6150 <_sk_callback_sse2+0x29d> + .byte 68,15,40,61,16,83,0,0 // movaps 0x5310(%rip),%xmm15 # 61f0 <_sk_callback_sse2+0x29c> .byte 65,15,89,231 // mulps %xmm15,%xmm4 - .byte 15,40,5,117,82,0,0 // movaps 0x5275(%rip),%xmm0 # 6160 <_sk_callback_sse2+0x2ad> + .byte 15,40,5,21,83,0,0 // movaps 0x5315(%rip),%xmm0 # 6200 <_sk_callback_sse2+0x2ac> .byte 15,89,240 // mulps %xmm0,%xmm6 .byte 15,88,244 // addps %xmm4,%xmm6 - .byte 68,15,40,53,119,82,0,0 // movaps 0x5277(%rip),%xmm14 # 6170 <_sk_callback_sse2+0x2bd> + .byte 68,15,40,53,23,83,0,0 // movaps 0x5317(%rip),%xmm14 # 6210 <_sk_callback_sse2+0x2bc> .byte 68,15,40,239 // movaps %xmm7,%xmm13 .byte 69,15,89,238 // mulps %xmm14,%xmm13 .byte 68,15,88,238 // addps %xmm6,%xmm13 @@ -34863,14 +35153,14 @@ _sk_saturation_sse2: .byte 68,15,84,211 // andps %xmm3,%xmm10 .byte 68,15,84,203 // andps %xmm3,%xmm9 .byte 15,84,195 // andps %xmm3,%xmm0 - .byte 68,15,40,5,9,80,0,0 // movaps 0x5009(%rip),%xmm8 # 6190 <_sk_callback_sse2+0x2dd> + .byte 68,15,40,5,169,80,0,0 // movaps 0x50a9(%rip),%xmm8 # 6230 <_sk_callback_sse2+0x2dc> .byte 15,40,214 // movaps %xmm6,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 - .byte 15,40,13,11,80,0,0 // movaps 0x500b(%rip),%xmm1 # 61a0 <_sk_callback_sse2+0x2ed> + .byte 15,40,13,171,80,0,0 // movaps 0x50ab(%rip),%xmm1 # 6240 <_sk_callback_sse2+0x2ec> .byte 15,40,221 // movaps %xmm5,%xmm3 .byte 15,89,217 // mulps %xmm1,%xmm3 .byte 15,88,218 // addps %xmm2,%xmm3 - .byte 68,15,40,37,10,80,0,0 // movaps 0x500a(%rip),%xmm12 # 61b0 <_sk_callback_sse2+0x2fd> + .byte 68,15,40,37,170,80,0,0 // movaps 0x50aa(%rip),%xmm12 # 6250 <_sk_callback_sse2+0x2fc> .byte 69,15,89,236 // mulps %xmm12,%xmm13 .byte 68,15,88,235 // addps %xmm3,%xmm13 .byte 65,15,40,210 // movaps %xmm10,%xmm2 @@ -34915,7 +35205,7 @@ _sk_saturation_sse2: .byte 15,40,223 // movaps %xmm7,%xmm3 .byte 15,40,236 // movaps %xmm4,%xmm5 .byte 15,89,221 // mulps %xmm5,%xmm3 - .byte 68,15,40,5,111,79,0,0 // movaps 0x4f6f(%rip),%xmm8 # 61c0 <_sk_callback_sse2+0x30d> + .byte 68,15,40,5,15,80,0,0 // movaps 0x500f(%rip),%xmm8 # 6260 <_sk_callback_sse2+0x30c> .byte 65,15,40,224 // movaps %xmm8,%xmm4 .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 15,88,253 // addps %xmm5,%xmm7 @@ -35016,14 +35306,14 @@ _sk_color_sse2: .byte 68,15,40,213 // movaps %xmm5,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 .byte 65,15,40,208 // movaps %xmm8,%xmm2 - .byte 68,15,40,45,13,78,0,0 // movaps 0x4e0d(%rip),%xmm13 # 61d0 <_sk_callback_sse2+0x31d> + .byte 68,15,40,45,173,78,0,0 // movaps 0x4ead(%rip),%xmm13 # 6270 <_sk_callback_sse2+0x31c> .byte 68,15,40,198 // movaps %xmm6,%xmm8 .byte 69,15,89,197 // mulps %xmm13,%xmm8 - .byte 68,15,40,53,13,78,0,0 // movaps 0x4e0d(%rip),%xmm14 # 61e0 <_sk_callback_sse2+0x32d> + .byte 68,15,40,53,173,78,0,0 // movaps 0x4ead(%rip),%xmm14 # 6280 <_sk_callback_sse2+0x32c> .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,89,198 // mulps %xmm14,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,29,9,78,0,0 // movaps 0x4e09(%rip),%xmm11 # 61f0 <_sk_callback_sse2+0x33d> + .byte 68,15,40,29,169,78,0,0 // movaps 0x4ea9(%rip),%xmm11 # 6290 <_sk_callback_sse2+0x33c> .byte 69,15,89,227 // mulps %xmm11,%xmm12 .byte 68,15,88,224 // addps %xmm0,%xmm12 .byte 65,15,40,193 // movaps %xmm9,%xmm0 @@ -35031,7 +35321,7 @@ _sk_color_sse2: .byte 69,15,40,250 // movaps %xmm10,%xmm15 .byte 69,15,89,254 // mulps %xmm14,%xmm15 .byte 68,15,88,248 // addps %xmm0,%xmm15 - .byte 68,15,40,5,245,77,0,0 // movaps 0x4df5(%rip),%xmm8 # 6200 <_sk_callback_sse2+0x34d> + .byte 68,15,40,5,149,78,0,0 // movaps 0x4e95(%rip),%xmm8 # 62a0 <_sk_callback_sse2+0x34c> .byte 65,15,40,224 // movaps %xmm8,%xmm4 .byte 15,92,226 // subps %xmm2,%xmm4 .byte 15,89,252 // mulps %xmm4,%xmm7 @@ -35167,15 +35457,15 @@ _sk_luminosity_sse2: .byte 68,15,40,205 // movaps %xmm5,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 .byte 15,89,222 // mulps %xmm6,%xmm3 - .byte 68,15,40,37,12,76,0,0 // movaps 0x4c0c(%rip),%xmm12 # 6210 <_sk_callback_sse2+0x35d> + .byte 68,15,40,37,172,76,0,0 // movaps 0x4cac(%rip),%xmm12 # 62b0 <_sk_callback_sse2+0x35c> .byte 68,15,40,199 // movaps %xmm7,%xmm8 .byte 69,15,89,196 // mulps %xmm12,%xmm8 - .byte 68,15,40,45,12,76,0,0 // movaps 0x4c0c(%rip),%xmm13 # 6220 <_sk_callback_sse2+0x36d> + .byte 68,15,40,45,172,76,0,0 // movaps 0x4cac(%rip),%xmm13 # 62c0 <_sk_callback_sse2+0x36c> .byte 68,15,40,241 // movaps %xmm1,%xmm14 .byte 69,15,89,245 // mulps %xmm13,%xmm14 .byte 69,15,88,240 // addps %xmm8,%xmm14 - .byte 68,15,40,29,8,76,0,0 // movaps 0x4c08(%rip),%xmm11 # 6230 <_sk_callback_sse2+0x37d> - .byte 68,15,40,5,16,76,0,0 // movaps 0x4c10(%rip),%xmm8 # 6240 <_sk_callback_sse2+0x38d> + .byte 68,15,40,29,168,76,0,0 // movaps 0x4ca8(%rip),%xmm11 # 62d0 <_sk_callback_sse2+0x37c> + .byte 68,15,40,5,176,76,0,0 // movaps 0x4cb0(%rip),%xmm8 # 62e0 <_sk_callback_sse2+0x38c> .byte 69,15,40,248 // movaps %xmm8,%xmm15 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 68,15,92,248 // subps %xmm0,%xmm15 @@ -35314,7 +35604,7 @@ _sk_srcover_rgba_8888_sse2: .byte 15,133,227,0,0,0 // jne 1908 <_sk_srcover_rgba_8888_sse2+0xf1> .byte 243,68,15,111,4,144 // movdqu (%rax,%rdx,4),%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 102,15,111,53,26,74,0,0 // movdqa 0x4a1a(%rip),%xmm6 # 6250 <_sk_callback_sse2+0x39d> + .byte 102,15,111,53,186,74,0,0 // movdqa 0x4aba(%rip),%xmm6 # 62f0 <_sk_callback_sse2+0x39c> .byte 102,65,15,111,224 // movdqa %xmm8,%xmm4 .byte 102,15,219,230 // pand %xmm6,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 @@ -35328,9 +35618,9 @@ _sk_srcover_rgba_8888_sse2: .byte 15,91,247 // cvtdq2ps %xmm7,%xmm6 .byte 102,65,15,114,208,24 // psrld $0x18,%xmm8 .byte 65,15,91,248 // cvtdq2ps %xmm8,%xmm7 - .byte 68,15,40,5,234,73,0,0 // movaps 0x49ea(%rip),%xmm8 # 6260 <_sk_callback_sse2+0x3ad> + .byte 68,15,40,5,138,74,0,0 // movaps 0x4a8a(%rip),%xmm8 # 6300 <_sk_callback_sse2+0x3ac> .byte 68,15,92,195 // subps %xmm3,%xmm8 - .byte 68,15,40,37,238,73,0,0 // movaps 0x49ee(%rip),%xmm12 # 6270 <_sk_callback_sse2+0x3bd> + .byte 68,15,40,37,142,74,0,0 // movaps 0x4a8e(%rip),%xmm12 # 6310 <_sk_callback_sse2+0x3bc> .byte 65,15,89,196 // mulps %xmm12,%xmm0 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -35410,7 +35700,7 @@ HIDDEN _sk_clamp_1_sse2 .globl _sk_clamp_1_sse2 FUNCTION(_sk_clamp_1_sse2) _sk_clamp_1_sse2: - .byte 68,15,40,5,223,72,0,0 // movaps 0x48df(%rip),%xmm8 # 6280 <_sk_callback_sse2+0x3cd> + .byte 68,15,40,5,127,73,0,0 // movaps 0x497f(%rip),%xmm8 # 6320 <_sk_callback_sse2+0x3cc> .byte 65,15,93,192 // minps %xmm8,%xmm0 .byte 65,15,93,200 // minps %xmm8,%xmm1 .byte 65,15,93,208 // minps %xmm8,%xmm2 @@ -35422,7 +35712,7 @@ HIDDEN _sk_clamp_a_sse2 .globl _sk_clamp_a_sse2 FUNCTION(_sk_clamp_a_sse2) _sk_clamp_a_sse2: - .byte 15,93,29,212,72,0,0 // minps 0x48d4(%rip),%xmm3 # 6290 <_sk_callback_sse2+0x3dd> + .byte 15,93,29,116,73,0,0 // minps 0x4974(%rip),%xmm3 # 6330 <_sk_callback_sse2+0x3dc> .byte 15,93,195 // minps %xmm3,%xmm0 .byte 15,93,203 // minps %xmm3,%xmm1 .byte 15,93,211 // minps %xmm3,%xmm2 @@ -35433,7 +35723,7 @@ HIDDEN _sk_clamp_a_dst_sse2 .globl _sk_clamp_a_dst_sse2 FUNCTION(_sk_clamp_a_dst_sse2) _sk_clamp_a_dst_sse2: - .byte 15,93,61,208,72,0,0 // minps 0x48d0(%rip),%xmm7 # 62a0 <_sk_callback_sse2+0x3ed> + .byte 15,93,61,112,73,0,0 // minps 0x4970(%rip),%xmm7 # 6340 <_sk_callback_sse2+0x3ec> .byte 15,93,231 // minps %xmm7,%xmm4 .byte 15,93,239 // minps %xmm7,%xmm5 .byte 15,93,247 // minps %xmm7,%xmm6 @@ -35501,7 +35791,7 @@ HIDDEN _sk_unpremul_sse2 FUNCTION(_sk_unpremul_sse2) _sk_unpremul_sse2: .byte 69,15,87,192 // xorps %xmm8,%xmm8 - .byte 68,15,40,13,107,72,0,0 // movaps 0x486b(%rip),%xmm9 # 62b0 <_sk_callback_sse2+0x3fd> + .byte 68,15,40,13,11,73,0,0 // movaps 0x490b(%rip),%xmm9 # 6350 <_sk_callback_sse2+0x3fc> .byte 68,15,94,203 // divps %xmm3,%xmm9 .byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8 .byte 69,15,84,193 // andps %xmm9,%xmm8 @@ -35515,20 +35805,20 @@ HIDDEN _sk_from_srgb_sse2 .globl _sk_from_srgb_sse2 FUNCTION(_sk_from_srgb_sse2) _sk_from_srgb_sse2: - .byte 68,15,40,5,86,72,0,0 // movaps 0x4856(%rip),%xmm8 # 62c0 <_sk_callback_sse2+0x40d> + .byte 68,15,40,5,246,72,0,0 // movaps 0x48f6(%rip),%xmm8 # 6360 <_sk_callback_sse2+0x40c> .byte 68,15,40,232 // movaps %xmm0,%xmm13 .byte 69,15,89,232 // mulps %xmm8,%xmm13 .byte 68,15,40,216 // movaps %xmm0,%xmm11 .byte 69,15,89,219 // mulps %xmm11,%xmm11 - .byte 68,15,40,13,78,72,0,0 // movaps 0x484e(%rip),%xmm9 # 62d0 <_sk_callback_sse2+0x41d> + .byte 68,15,40,13,238,72,0,0 // movaps 0x48ee(%rip),%xmm9 # 6370 <_sk_callback_sse2+0x41c> .byte 68,15,40,240 // movaps %xmm0,%xmm14 .byte 69,15,89,241 // mulps %xmm9,%xmm14 - .byte 68,15,40,21,78,72,0,0 // movaps 0x484e(%rip),%xmm10 # 62e0 <_sk_callback_sse2+0x42d> + .byte 68,15,40,21,238,72,0,0 // movaps 0x48ee(%rip),%xmm10 # 6380 <_sk_callback_sse2+0x42c> .byte 69,15,88,242 // addps %xmm10,%xmm14 .byte 69,15,89,243 // mulps %xmm11,%xmm14 - .byte 68,15,40,29,78,72,0,0 // movaps 0x484e(%rip),%xmm11 # 62f0 <_sk_callback_sse2+0x43d> + .byte 68,15,40,29,238,72,0,0 // movaps 0x48ee(%rip),%xmm11 # 6390 <_sk_callback_sse2+0x43c> .byte 69,15,88,243 // addps %xmm11,%xmm14 - .byte 68,15,40,37,82,72,0,0 // movaps 0x4852(%rip),%xmm12 # 6300 <_sk_callback_sse2+0x44d> + .byte 68,15,40,37,242,72,0,0 // movaps 0x48f2(%rip),%xmm12 # 63a0 <_sk_callback_sse2+0x44c> .byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0 .byte 68,15,84,232 // andps %xmm0,%xmm13 .byte 65,15,85,198 // andnps %xmm14,%xmm0 @@ -35564,20 +35854,20 @@ HIDDEN _sk_from_srgb_dst_sse2 .globl _sk_from_srgb_dst_sse2 FUNCTION(_sk_from_srgb_dst_sse2) _sk_from_srgb_dst_sse2: - .byte 68,15,40,5,227,71,0,0 // movaps 0x47e3(%rip),%xmm8 # 6310 <_sk_callback_sse2+0x45d> + .byte 68,15,40,5,131,72,0,0 // movaps 0x4883(%rip),%xmm8 # 63b0 <_sk_callback_sse2+0x45c> .byte 68,15,40,236 // movaps %xmm4,%xmm13 .byte 69,15,89,232 // mulps %xmm8,%xmm13 .byte 68,15,40,220 // movaps %xmm4,%xmm11 .byte 69,15,89,219 // mulps %xmm11,%xmm11 - .byte 68,15,40,13,219,71,0,0 // movaps 0x47db(%rip),%xmm9 # 6320 <_sk_callback_sse2+0x46d> + .byte 68,15,40,13,123,72,0,0 // movaps 0x487b(%rip),%xmm9 # 63c0 <_sk_callback_sse2+0x46c> .byte 68,15,40,244 // movaps %xmm4,%xmm14 .byte 69,15,89,241 // mulps %xmm9,%xmm14 - .byte 68,15,40,21,219,71,0,0 // movaps 0x47db(%rip),%xmm10 # 6330 <_sk_callback_sse2+0x47d> + .byte 68,15,40,21,123,72,0,0 // movaps 0x487b(%rip),%xmm10 # 63d0 <_sk_callback_sse2+0x47c> .byte 69,15,88,242 // addps %xmm10,%xmm14 .byte 69,15,89,243 // mulps %xmm11,%xmm14 - .byte 68,15,40,29,219,71,0,0 // movaps 0x47db(%rip),%xmm11 # 6340 <_sk_callback_sse2+0x48d> + .byte 68,15,40,29,123,72,0,0 // movaps 0x487b(%rip),%xmm11 # 63e0 <_sk_callback_sse2+0x48c> .byte 69,15,88,243 // addps %xmm11,%xmm14 - .byte 68,15,40,37,223,71,0,0 // movaps 0x47df(%rip),%xmm12 # 6350 <_sk_callback_sse2+0x49d> + .byte 68,15,40,37,127,72,0,0 // movaps 0x487f(%rip),%xmm12 # 63f0 <_sk_callback_sse2+0x49c> .byte 65,15,194,228,1 // cmpltps %xmm12,%xmm4 .byte 68,15,84,236 // andps %xmm4,%xmm13 .byte 65,15,85,230 // andnps %xmm14,%xmm4 @@ -35614,22 +35904,22 @@ HIDDEN _sk_to_srgb_sse2 FUNCTION(_sk_to_srgb_sse2) _sk_to_srgb_sse2: .byte 68,15,82,232 // rsqrtps %xmm0,%xmm13 - .byte 68,15,40,5,108,71,0,0 // movaps 0x476c(%rip),%xmm8 # 6360 <_sk_callback_sse2+0x4ad> + .byte 68,15,40,5,12,72,0,0 // movaps 0x480c(%rip),%xmm8 # 6400 <_sk_callback_sse2+0x4ac> .byte 68,15,40,240 // movaps %xmm0,%xmm14 .byte 69,15,89,240 // mulps %xmm8,%xmm14 - .byte 68,15,40,13,108,71,0,0 // movaps 0x476c(%rip),%xmm9 # 6370 <_sk_callback_sse2+0x4bd> + .byte 68,15,40,13,12,72,0,0 // movaps 0x480c(%rip),%xmm9 # 6410 <_sk_callback_sse2+0x4bc> .byte 69,15,40,253 // movaps %xmm13,%xmm15 .byte 69,15,89,249 // mulps %xmm9,%xmm15 - .byte 68,15,40,21,108,71,0,0 // movaps 0x476c(%rip),%xmm10 # 6380 <_sk_callback_sse2+0x4cd> + .byte 68,15,40,21,12,72,0,0 // movaps 0x480c(%rip),%xmm10 # 6420 <_sk_callback_sse2+0x4cc> .byte 69,15,88,250 // addps %xmm10,%xmm15 .byte 69,15,89,253 // mulps %xmm13,%xmm15 - .byte 68,15,40,29,108,71,0,0 // movaps 0x476c(%rip),%xmm11 # 6390 <_sk_callback_sse2+0x4dd> + .byte 68,15,40,29,12,72,0,0 // movaps 0x480c(%rip),%xmm11 # 6430 <_sk_callback_sse2+0x4dc> .byte 69,15,88,251 // addps %xmm11,%xmm15 - .byte 68,15,40,37,112,71,0,0 // movaps 0x4770(%rip),%xmm12 # 63a0 <_sk_callback_sse2+0x4ed> + .byte 68,15,40,37,16,72,0,0 // movaps 0x4810(%rip),%xmm12 # 6440 <_sk_callback_sse2+0x4ec> .byte 69,15,88,236 // addps %xmm12,%xmm13 .byte 69,15,83,237 // rcpps %xmm13,%xmm13 .byte 69,15,89,239 // mulps %xmm15,%xmm13 - .byte 68,15,40,61,108,71,0,0 // movaps 0x476c(%rip),%xmm15 # 63b0 <_sk_callback_sse2+0x4fd> + .byte 68,15,40,61,12,72,0,0 // movaps 0x480c(%rip),%xmm15 # 6450 <_sk_callback_sse2+0x4fc> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 68,15,84,240 // andps %xmm0,%xmm14 .byte 65,15,85,197 // andnps %xmm13,%xmm0 @@ -35679,7 +35969,7 @@ _sk_rgb_to_hsl_sse2: .byte 68,15,93,218 // minps %xmm2,%xmm11 .byte 65,15,40,202 // movaps %xmm10,%xmm1 .byte 65,15,92,203 // subps %xmm11,%xmm1 - .byte 68,15,40,45,197,70,0,0 // movaps 0x46c5(%rip),%xmm13 # 63c0 <_sk_callback_sse2+0x50d> + .byte 68,15,40,45,101,71,0,0 // movaps 0x4765(%rip),%xmm13 # 6460 <_sk_callback_sse2+0x50c> .byte 68,15,94,233 // divps %xmm1,%xmm13 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0 @@ -35688,30 +35978,30 @@ _sk_rgb_to_hsl_sse2: .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,40,241 // movaps %xmm9,%xmm14 .byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14 - .byte 68,15,84,53,171,70,0,0 // andps 0x46ab(%rip),%xmm14 # 63d0 <_sk_callback_sse2+0x51d> + .byte 68,15,84,53,75,71,0,0 // andps 0x474b(%rip),%xmm14 # 6470 <_sk_callback_sse2+0x51c> .byte 69,15,88,244 // addps %xmm12,%xmm14 .byte 69,15,40,250 // movaps %xmm10,%xmm15 .byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15 .byte 65,15,92,208 // subps %xmm8,%xmm2 .byte 65,15,89,213 // mulps %xmm13,%xmm2 - .byte 68,15,40,37,158,70,0,0 // movaps 0x469e(%rip),%xmm12 # 63e0 <_sk_callback_sse2+0x52d> + .byte 68,15,40,37,62,71,0,0 // movaps 0x473e(%rip),%xmm12 # 6480 <_sk_callback_sse2+0x52c> .byte 65,15,88,212 // addps %xmm12,%xmm2 .byte 69,15,92,193 // subps %xmm9,%xmm8 .byte 69,15,89,197 // mulps %xmm13,%xmm8 - .byte 68,15,88,5,154,70,0,0 // addps 0x469a(%rip),%xmm8 # 63f0 <_sk_callback_sse2+0x53d> + .byte 68,15,88,5,58,71,0,0 // addps 0x473a(%rip),%xmm8 # 6490 <_sk_callback_sse2+0x53c> .byte 65,15,84,215 // andps %xmm15,%xmm2 .byte 69,15,85,248 // andnps %xmm8,%xmm15 .byte 68,15,86,250 // orps %xmm2,%xmm15 .byte 68,15,84,240 // andps %xmm0,%xmm14 .byte 65,15,85,199 // andnps %xmm15,%xmm0 .byte 65,15,86,198 // orps %xmm14,%xmm0 - .byte 15,89,5,139,70,0,0 // mulps 0x468b(%rip),%xmm0 # 6400 <_sk_callback_sse2+0x54d> + .byte 15,89,5,43,71,0,0 // mulps 0x472b(%rip),%xmm0 # 64a0 <_sk_callback_sse2+0x54c> .byte 69,15,40,194 // movaps %xmm10,%xmm8 .byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8 .byte 65,15,84,192 // andps %xmm8,%xmm0 .byte 69,15,92,226 // subps %xmm10,%xmm12 .byte 69,15,88,211 // addps %xmm11,%xmm10 - .byte 68,15,40,13,126,70,0,0 // movaps 0x467e(%rip),%xmm9 # 6410 <_sk_callback_sse2+0x55d> + .byte 68,15,40,13,30,71,0,0 // movaps 0x471e(%rip),%xmm9 # 64b0 <_sk_callback_sse2+0x55c> .byte 65,15,40,210 // movaps %xmm10,%xmm2 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9 @@ -35735,7 +36025,7 @@ _sk_hsl_to_rgb_sse2: .byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp) .byte 68,15,40,218 // movaps %xmm2,%xmm11 .byte 15,40,240 // movaps %xmm0,%xmm6 - .byte 68,15,40,13,61,70,0,0 // movaps 0x463d(%rip),%xmm9 # 6420 <_sk_callback_sse2+0x56d> + .byte 68,15,40,13,221,70,0,0 // movaps 0x46dd(%rip),%xmm9 # 64c0 <_sk_callback_sse2+0x56c> .byte 69,15,40,209 // movaps %xmm9,%xmm10 .byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10 .byte 15,40,193 // movaps %xmm1,%xmm0 @@ -35752,28 +36042,28 @@ _sk_hsl_to_rgb_sse2: .byte 69,15,88,211 // addps %xmm11,%xmm10 .byte 69,15,88,219 // addps %xmm11,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 15,40,5,6,70,0,0 // movaps 0x4606(%rip),%xmm0 # 6430 <_sk_callback_sse2+0x57d> + .byte 15,40,5,166,70,0,0 // movaps 0x46a6(%rip),%xmm0 # 64d0 <_sk_callback_sse2+0x57c> .byte 15,88,198 // addps %xmm6,%xmm0 .byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,40,216 // movaps %xmm0,%xmm3 .byte 15,194,217,1 // cmpltps %xmm1,%xmm3 - .byte 15,84,29,254,69,0,0 // andps 0x45fe(%rip),%xmm3 # 6440 <_sk_callback_sse2+0x58d> + .byte 15,84,29,158,70,0,0 // andps 0x469e(%rip),%xmm3 # 64e0 <_sk_callback_sse2+0x58c> .byte 15,92,203 // subps %xmm3,%xmm1 .byte 15,92,193 // subps %xmm1,%xmm0 - .byte 68,15,40,45,0,70,0,0 // movaps 0x4600(%rip),%xmm13 # 6450 <_sk_callback_sse2+0x59d> + .byte 68,15,40,45,160,70,0,0 // movaps 0x46a0(%rip),%xmm13 # 64f0 <_sk_callback_sse2+0x59c> .byte 69,15,40,197 // movaps %xmm13,%xmm8 .byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8 .byte 69,15,40,242 // movaps %xmm10,%xmm14 .byte 69,15,92,243 // subps %xmm11,%xmm14 .byte 65,15,40,217 // movaps %xmm9,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 - .byte 15,40,21,16,70,0,0 // movaps 0x4610(%rip),%xmm2 # 6480 <_sk_callback_sse2+0x5cd> + .byte 15,40,21,176,70,0,0 // movaps 0x46b0(%rip),%xmm2 # 6520 <_sk_callback_sse2+0x5cc> .byte 68,15,40,250 // movaps %xmm2,%xmm15 .byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15 - .byte 15,40,13,224,69,0,0 // movaps 0x45e0(%rip),%xmm1 # 6460 <_sk_callback_sse2+0x5ad> + .byte 15,40,13,128,70,0,0 // movaps 0x4680(%rip),%xmm1 # 6500 <_sk_callback_sse2+0x5ac> .byte 15,89,193 // mulps %xmm1,%xmm0 - .byte 15,40,45,230,69,0,0 // movaps 0x45e6(%rip),%xmm5 # 6470 <_sk_callback_sse2+0x5bd> + .byte 15,40,45,134,70,0,0 // movaps 0x4686(%rip),%xmm5 # 6510 <_sk_callback_sse2+0x5bc> .byte 15,40,229 // movaps %xmm5,%xmm4 .byte 15,92,224 // subps %xmm0,%xmm4 .byte 65,15,89,230 // mulps %xmm14,%xmm4 @@ -35796,7 +36086,7 @@ _sk_hsl_to_rgb_sse2: .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,222 // movaps %xmm6,%xmm3 .byte 15,194,216,1 // cmpltps %xmm0,%xmm3 - .byte 15,84,29,91,69,0,0 // andps 0x455b(%rip),%xmm3 # 6440 <_sk_callback_sse2+0x58d> + .byte 15,84,29,251,69,0,0 // andps 0x45fb(%rip),%xmm3 # 64e0 <_sk_callback_sse2+0x58c> .byte 15,92,195 // subps %xmm3,%xmm0 .byte 68,15,40,230 // movaps %xmm6,%xmm12 .byte 68,15,92,224 // subps %xmm0,%xmm12 @@ -35826,12 +36116,12 @@ _sk_hsl_to_rgb_sse2: .byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7 .byte 15,40,231 // movaps %xmm7,%xmm4 .byte 15,85,227 // andnps %xmm3,%xmm4 - .byte 15,88,53,51,69,0,0 // addps 0x4533(%rip),%xmm6 # 6490 <_sk_callback_sse2+0x5dd> + .byte 15,88,53,211,69,0,0 // addps 0x45d3(%rip),%xmm6 # 6530 <_sk_callback_sse2+0x5dc> .byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,222 // movaps %xmm6,%xmm3 .byte 15,194,216,1 // cmpltps %xmm0,%xmm3 - .byte 15,84,29,206,68,0,0 // andps 0x44ce(%rip),%xmm3 # 6440 <_sk_callback_sse2+0x58d> + .byte 15,84,29,110,69,0,0 // andps 0x456e(%rip),%xmm3 # 64e0 <_sk_callback_sse2+0x58c> .byte 15,92,195 // subps %xmm3,%xmm0 .byte 15,92,240 // subps %xmm0,%xmm6 .byte 15,89,206 // mulps %xmm6,%xmm1 @@ -35895,9 +36185,9 @@ _sk_scale_u8_sse2: .byte 102,69,15,110,4,18 // movd (%r10,%rdx,1),%xmm8 .byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8 .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8 - .byte 102,68,15,219,5,95,68,0,0 // pand 0x445f(%rip),%xmm8 # 64a0 <_sk_callback_sse2+0x5ed> + .byte 102,68,15,219,5,255,68,0,0 // pand 0x44ff(%rip),%xmm8 # 6540 <_sk_callback_sse2+0x5ec> .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,99,68,0,0 // mulps 0x4463(%rip),%xmm8 # 64b0 <_sk_callback_sse2+0x5fd> + .byte 68,15,89,5,3,69,0,0 // mulps 0x4503(%rip),%xmm8 # 6550 <_sk_callback_sse2+0x5fc> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 @@ -35960,9 +36250,9 @@ _sk_lerp_u8_sse2: .byte 102,69,15,110,4,18 // movd (%r10,%rdx,1),%xmm8 .byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8 .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8 - .byte 102,68,15,219,5,167,67,0,0 // pand 0x43a7(%rip),%xmm8 # 64c0 <_sk_callback_sse2+0x60d> + .byte 102,68,15,219,5,71,68,0,0 // pand 0x4447(%rip),%xmm8 # 6560 <_sk_callback_sse2+0x60c> .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,171,67,0,0 // mulps 0x43ab(%rip),%xmm8 # 64d0 <_sk_callback_sse2+0x61d> + .byte 68,15,89,5,75,68,0,0 // mulps 0x444b(%rip),%xmm8 # 6570 <_sk_callback_sse2+0x61c> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -36009,17 +36299,17 @@ _sk_lerp_565_sse2: .byte 15,133,156,0,0,0 // jne 2257 <_sk_lerp_565_sse2+0xaa> .byte 243,69,15,126,12,82 // movq (%r10,%rdx,2),%xmm9 .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9 - .byte 102,68,15,111,5,17,67,0,0 // movdqa 0x4311(%rip),%xmm8 # 64e0 <_sk_callback_sse2+0x62d> + .byte 102,68,15,111,5,177,67,0,0 // movdqa 0x43b1(%rip),%xmm8 # 6580 <_sk_callback_sse2+0x62c> .byte 102,69,15,219,193 // pand %xmm9,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,16,67,0,0 // mulps 0x4310(%rip),%xmm8 # 64f0 <_sk_callback_sse2+0x63d> - .byte 102,68,15,111,21,23,67,0,0 // movdqa 0x4317(%rip),%xmm10 # 6500 <_sk_callback_sse2+0x64d> + .byte 68,15,89,5,176,67,0,0 // mulps 0x43b0(%rip),%xmm8 # 6590 <_sk_callback_sse2+0x63c> + .byte 102,68,15,111,21,183,67,0,0 // movdqa 0x43b7(%rip),%xmm10 # 65a0 <_sk_callback_sse2+0x64c> .byte 102,69,15,219,209 // pand %xmm9,%xmm10 .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 - .byte 68,15,89,21,22,67,0,0 // mulps 0x4316(%rip),%xmm10 # 6510 <_sk_callback_sse2+0x65d> - .byte 102,68,15,219,13,29,67,0,0 // pand 0x431d(%rip),%xmm9 # 6520 <_sk_callback_sse2+0x66d> + .byte 68,15,89,21,182,67,0,0 // mulps 0x43b6(%rip),%xmm10 # 65b0 <_sk_callback_sse2+0x65c> + .byte 102,68,15,219,13,189,67,0,0 // pand 0x43bd(%rip),%xmm9 # 65c0 <_sk_callback_sse2+0x66c> .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9 - .byte 68,15,89,13,33,67,0,0 // mulps 0x4321(%rip),%xmm9 # 6530 <_sk_callback_sse2+0x67d> + .byte 68,15,89,13,193,67,0,0 // mulps 0x43c1(%rip),%xmm9 # 65d0 <_sk_callback_sse2+0x67c> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -36073,7 +36363,7 @@ _sk_load_tables_sse2: .byte 65,87 // push %r15 .byte 65,86 // push %r14 .byte 83 // push %rbx - .byte 102,68,15,111,5,112,66,0,0 // movdqa 0x4270(%rip),%xmm8 # 6540 <_sk_callback_sse2+0x68d> + .byte 102,68,15,111,5,16,67,0,0 // movdqa 0x4310(%rip),%xmm8 # 65e0 <_sk_callback_sse2+0x68c> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 @@ -36129,7 +36419,7 @@ _sk_load_tables_sse2: .byte 65,15,20,208 // unpcklps %xmm8,%xmm2 .byte 102,65,15,114,209,24 // psrld $0x18,%xmm9 .byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3 - .byte 15,89,29,121,65,0,0 // mulps 0x4179(%rip),%xmm3 # 6550 <_sk_callback_sse2+0x69d> + .byte 15,89,29,25,66,0,0 // mulps 0x4219(%rip),%xmm3 # 65f0 <_sk_callback_sse2+0x69c> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 65,94 // pop %r14 @@ -36171,7 +36461,7 @@ _sk_load_tables_u16_be_sse2: .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 - .byte 102,68,15,111,21,238,64,0,0 // movdqa 0x40ee(%rip),%xmm10 # 6560 <_sk_callback_sse2+0x6ad> + .byte 102,68,15,111,21,142,65,0,0 // movdqa 0x418e(%rip),%xmm10 # 6600 <_sk_callback_sse2+0x6ac> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,194 // pand %xmm10,%xmm0 .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 @@ -36233,7 +36523,7 @@ _sk_load_tables_u16_be_sse2: .byte 102,65,15,235,217 // por %xmm9,%xmm3 .byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,217,63,0,0 // mulps 0x3fd9(%rip),%xmm3 # 6570 <_sk_callback_sse2+0x6bd> + .byte 15,89,29,121,64,0,0 // mulps 0x4079(%rip),%xmm3 # 6610 <_sk_callback_sse2+0x6bc> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 65,94 // pop %r14 @@ -36276,7 +36566,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10 .byte 102,65,15,111,195 // movdqa %xmm11,%xmm0 .byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0 - .byte 102,68,15,111,5,72,63,0,0 // movdqa 0x3f48(%rip),%xmm8 # 6580 <_sk_callback_sse2+0x6cd> + .byte 102,68,15,111,5,232,63,0,0 // movdqa 0x3fe8(%rip),%xmm8 # 6620 <_sk_callback_sse2+0x6cc> .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 @@ -36332,7 +36622,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 15,20,211 // unpcklps %xmm3,%xmm2 .byte 65,15,20,208 // unpcklps %xmm8,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,83,62,0,0 // movaps 0x3e53(%rip),%xmm3 # 6590 <_sk_callback_sse2+0x6dd> + .byte 15,40,29,243,62,0,0 // movaps 0x3ef3(%rip),%xmm3 # 6630 <_sk_callback_sse2+0x6dc> .byte 91 // pop %rbx .byte 65,94 // pop %r14 .byte 65,95 // pop %r15 @@ -36366,7 +36656,7 @@ _sk_byte_tables_sse2: .byte 65,86 // push %r14 .byte 83 // push %rbx .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,236,61,0,0 // movaps 0x3dec(%rip),%xmm8 # 65a0 <_sk_callback_sse2+0x6ed> + .byte 68,15,40,5,140,62,0,0 // movaps 0x3e8c(%rip),%xmm8 # 6640 <_sk_callback_sse2+0x6ec> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 102,73,15,126,193 // movq %xmm0,%r9 @@ -36394,7 +36684,7 @@ _sk_byte_tables_sse2: .byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0 .byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,21,134,61,0,0 // movaps 0x3d86(%rip),%xmm10 # 65b0 <_sk_callback_sse2+0x6fd> + .byte 68,15,40,21,38,62,0,0 // movaps 0x3e26(%rip),%xmm10 # 6650 <_sk_callback_sse2+0x6fc> .byte 65,15,89,194 // mulps %xmm10,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -36515,7 +36805,7 @@ _sk_byte_tables_rgb_sse2: .byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0 .byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,21,206,59,0,0 // movaps 0x3bce(%rip),%xmm10 # 65c0 <_sk_callback_sse2+0x70d> + .byte 68,15,40,21,110,60,0,0 // movaps 0x3c6e(%rip),%xmm10 # 6660 <_sk_callback_sse2+0x70c> .byte 65,15,89,194 // mulps %xmm10,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -36722,15 +37012,15 @@ _sk_parametric_r_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,2,57,0,0 // mulps 0x3902(%rip),%xmm9 # 65d0 <_sk_callback_sse2+0x71d> - .byte 68,15,84,21,10,57,0,0 // andps 0x390a(%rip),%xmm10 # 65e0 <_sk_callback_sse2+0x72d> - .byte 68,15,86,21,18,57,0,0 // orps 0x3912(%rip),%xmm10 # 65f0 <_sk_callback_sse2+0x73d> - .byte 68,15,88,13,26,57,0,0 // addps 0x391a(%rip),%xmm9 # 6600 <_sk_callback_sse2+0x74d> - .byte 68,15,40,37,34,57,0,0 // movaps 0x3922(%rip),%xmm12 # 6610 <_sk_callback_sse2+0x75d> + .byte 68,15,89,13,162,57,0,0 // mulps 0x39a2(%rip),%xmm9 # 6670 <_sk_callback_sse2+0x71c> + .byte 68,15,84,21,170,57,0,0 // andps 0x39aa(%rip),%xmm10 # 6680 <_sk_callback_sse2+0x72c> + .byte 68,15,86,21,178,57,0,0 // orps 0x39b2(%rip),%xmm10 # 6690 <_sk_callback_sse2+0x73c> + .byte 68,15,88,13,186,57,0,0 // addps 0x39ba(%rip),%xmm9 # 66a0 <_sk_callback_sse2+0x74c> + .byte 68,15,40,37,194,57,0,0 // movaps 0x39c2(%rip),%xmm12 # 66b0 <_sk_callback_sse2+0x75c> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,34,57,0,0 // addps 0x3922(%rip),%xmm10 # 6620 <_sk_callback_sse2+0x76d> - .byte 68,15,40,37,42,57,0,0 // movaps 0x392a(%rip),%xmm12 # 6630 <_sk_callback_sse2+0x77d> + .byte 68,15,88,21,194,57,0,0 // addps 0x39c2(%rip),%xmm10 # 66c0 <_sk_callback_sse2+0x76c> + .byte 68,15,40,37,202,57,0,0 // movaps 0x39ca(%rip),%xmm12 # 66d0 <_sk_callback_sse2+0x77c> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -36738,22 +37028,22 @@ _sk_parametric_r_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,20,57,0,0 // movaps 0x3914(%rip),%xmm10 # 6640 <_sk_callback_sse2+0x78d> + .byte 68,15,40,21,180,57,0,0 // movaps 0x39b4(%rip),%xmm10 # 66e0 <_sk_callback_sse2+0x78c> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,8,57,0,0 // addps 0x3908(%rip),%xmm9 # 6650 <_sk_callback_sse2+0x79d> - .byte 68,15,40,37,16,57,0,0 // movaps 0x3910(%rip),%xmm12 # 6660 <_sk_callback_sse2+0x7ad> + .byte 68,15,88,13,168,57,0,0 // addps 0x39a8(%rip),%xmm9 # 66f0 <_sk_callback_sse2+0x79c> + .byte 68,15,40,37,176,57,0,0 // movaps 0x39b0(%rip),%xmm12 # 6700 <_sk_callback_sse2+0x7ac> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,16,57,0,0 // movaps 0x3910(%rip),%xmm12 # 6670 <_sk_callback_sse2+0x7bd> + .byte 68,15,40,37,176,57,0,0 // movaps 0x39b0(%rip),%xmm12 # 6710 <_sk_callback_sse2+0x7bc> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,20,57,0,0 // movaps 0x3914(%rip),%xmm13 # 6680 <_sk_callback_sse2+0x7cd> + .byte 68,15,40,45,180,57,0,0 // movaps 0x39b4(%rip),%xmm13 # 6720 <_sk_callback_sse2+0x7cc> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,20,57,0,0 // mulps 0x3914(%rip),%xmm13 # 6690 <_sk_callback_sse2+0x7dd> + .byte 68,15,89,45,180,57,0,0 // mulps 0x39b4(%rip),%xmm13 # 6730 <_sk_callback_sse2+0x7dc> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -36789,15 +37079,15 @@ _sk_parametric_g_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,148,56,0,0 // mulps 0x3894(%rip),%xmm9 # 66a0 <_sk_callback_sse2+0x7ed> - .byte 68,15,84,21,156,56,0,0 // andps 0x389c(%rip),%xmm10 # 66b0 <_sk_callback_sse2+0x7fd> - .byte 68,15,86,21,164,56,0,0 // orps 0x38a4(%rip),%xmm10 # 66c0 <_sk_callback_sse2+0x80d> - .byte 68,15,88,13,172,56,0,0 // addps 0x38ac(%rip),%xmm9 # 66d0 <_sk_callback_sse2+0x81d> - .byte 68,15,40,37,180,56,0,0 // movaps 0x38b4(%rip),%xmm12 # 66e0 <_sk_callback_sse2+0x82d> + .byte 68,15,89,13,52,57,0,0 // mulps 0x3934(%rip),%xmm9 # 6740 <_sk_callback_sse2+0x7ec> + .byte 68,15,84,21,60,57,0,0 // andps 0x393c(%rip),%xmm10 # 6750 <_sk_callback_sse2+0x7fc> + .byte 68,15,86,21,68,57,0,0 // orps 0x3944(%rip),%xmm10 # 6760 <_sk_callback_sse2+0x80c> + .byte 68,15,88,13,76,57,0,0 // addps 0x394c(%rip),%xmm9 # 6770 <_sk_callback_sse2+0x81c> + .byte 68,15,40,37,84,57,0,0 // movaps 0x3954(%rip),%xmm12 # 6780 <_sk_callback_sse2+0x82c> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,180,56,0,0 // addps 0x38b4(%rip),%xmm10 # 66f0 <_sk_callback_sse2+0x83d> - .byte 68,15,40,37,188,56,0,0 // movaps 0x38bc(%rip),%xmm12 # 6700 <_sk_callback_sse2+0x84d> + .byte 68,15,88,21,84,57,0,0 // addps 0x3954(%rip),%xmm10 # 6790 <_sk_callback_sse2+0x83c> + .byte 68,15,40,37,92,57,0,0 // movaps 0x395c(%rip),%xmm12 # 67a0 <_sk_callback_sse2+0x84c> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -36805,22 +37095,22 @@ _sk_parametric_g_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,166,56,0,0 // movaps 0x38a6(%rip),%xmm10 # 6710 <_sk_callback_sse2+0x85d> + .byte 68,15,40,21,70,57,0,0 // movaps 0x3946(%rip),%xmm10 # 67b0 <_sk_callback_sse2+0x85c> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,154,56,0,0 // addps 0x389a(%rip),%xmm9 # 6720 <_sk_callback_sse2+0x86d> - .byte 68,15,40,37,162,56,0,0 // movaps 0x38a2(%rip),%xmm12 # 6730 <_sk_callback_sse2+0x87d> + .byte 68,15,88,13,58,57,0,0 // addps 0x393a(%rip),%xmm9 # 67c0 <_sk_callback_sse2+0x86c> + .byte 68,15,40,37,66,57,0,0 // movaps 0x3942(%rip),%xmm12 # 67d0 <_sk_callback_sse2+0x87c> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,162,56,0,0 // movaps 0x38a2(%rip),%xmm12 # 6740 <_sk_callback_sse2+0x88d> + .byte 68,15,40,37,66,57,0,0 // movaps 0x3942(%rip),%xmm12 # 67e0 <_sk_callback_sse2+0x88c> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,166,56,0,0 // movaps 0x38a6(%rip),%xmm13 # 6750 <_sk_callback_sse2+0x89d> + .byte 68,15,40,45,70,57,0,0 // movaps 0x3946(%rip),%xmm13 # 67f0 <_sk_callback_sse2+0x89c> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,166,56,0,0 // mulps 0x38a6(%rip),%xmm13 # 6760 <_sk_callback_sse2+0x8ad> + .byte 68,15,89,45,70,57,0,0 // mulps 0x3946(%rip),%xmm13 # 6800 <_sk_callback_sse2+0x8ac> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -36856,15 +37146,15 @@ _sk_parametric_b_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,38,56,0,0 // mulps 0x3826(%rip),%xmm9 # 6770 <_sk_callback_sse2+0x8bd> - .byte 68,15,84,21,46,56,0,0 // andps 0x382e(%rip),%xmm10 # 6780 <_sk_callback_sse2+0x8cd> - .byte 68,15,86,21,54,56,0,0 // orps 0x3836(%rip),%xmm10 # 6790 <_sk_callback_sse2+0x8dd> - .byte 68,15,88,13,62,56,0,0 // addps 0x383e(%rip),%xmm9 # 67a0 <_sk_callback_sse2+0x8ed> - .byte 68,15,40,37,70,56,0,0 // movaps 0x3846(%rip),%xmm12 # 67b0 <_sk_callback_sse2+0x8fd> + .byte 68,15,89,13,198,56,0,0 // mulps 0x38c6(%rip),%xmm9 # 6810 <_sk_callback_sse2+0x8bc> + .byte 68,15,84,21,206,56,0,0 // andps 0x38ce(%rip),%xmm10 # 6820 <_sk_callback_sse2+0x8cc> + .byte 68,15,86,21,214,56,0,0 // orps 0x38d6(%rip),%xmm10 # 6830 <_sk_callback_sse2+0x8dc> + .byte 68,15,88,13,222,56,0,0 // addps 0x38de(%rip),%xmm9 # 6840 <_sk_callback_sse2+0x8ec> + .byte 68,15,40,37,230,56,0,0 // movaps 0x38e6(%rip),%xmm12 # 6850 <_sk_callback_sse2+0x8fc> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,70,56,0,0 // addps 0x3846(%rip),%xmm10 # 67c0 <_sk_callback_sse2+0x90d> - .byte 68,15,40,37,78,56,0,0 // movaps 0x384e(%rip),%xmm12 # 67d0 <_sk_callback_sse2+0x91d> + .byte 68,15,88,21,230,56,0,0 // addps 0x38e6(%rip),%xmm10 # 6860 <_sk_callback_sse2+0x90c> + .byte 68,15,40,37,238,56,0,0 // movaps 0x38ee(%rip),%xmm12 # 6870 <_sk_callback_sse2+0x91c> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -36872,22 +37162,22 @@ _sk_parametric_b_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,56,56,0,0 // movaps 0x3838(%rip),%xmm10 # 67e0 <_sk_callback_sse2+0x92d> + .byte 68,15,40,21,216,56,0,0 // movaps 0x38d8(%rip),%xmm10 # 6880 <_sk_callback_sse2+0x92c> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,44,56,0,0 // addps 0x382c(%rip),%xmm9 # 67f0 <_sk_callback_sse2+0x93d> - .byte 68,15,40,37,52,56,0,0 // movaps 0x3834(%rip),%xmm12 # 6800 <_sk_callback_sse2+0x94d> + .byte 68,15,88,13,204,56,0,0 // addps 0x38cc(%rip),%xmm9 # 6890 <_sk_callback_sse2+0x93c> + .byte 68,15,40,37,212,56,0,0 // movaps 0x38d4(%rip),%xmm12 # 68a0 <_sk_callback_sse2+0x94c> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,52,56,0,0 // movaps 0x3834(%rip),%xmm12 # 6810 <_sk_callback_sse2+0x95d> + .byte 68,15,40,37,212,56,0,0 // movaps 0x38d4(%rip),%xmm12 # 68b0 <_sk_callback_sse2+0x95c> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,56,56,0,0 // movaps 0x3838(%rip),%xmm13 # 6820 <_sk_callback_sse2+0x96d> + .byte 68,15,40,45,216,56,0,0 // movaps 0x38d8(%rip),%xmm13 # 68c0 <_sk_callback_sse2+0x96c> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,56,56,0,0 // mulps 0x3838(%rip),%xmm13 # 6830 <_sk_callback_sse2+0x97d> + .byte 68,15,89,45,216,56,0,0 // mulps 0x38d8(%rip),%xmm13 # 68d0 <_sk_callback_sse2+0x97c> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -36923,15 +37213,15 @@ _sk_parametric_a_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,184,55,0,0 // mulps 0x37b8(%rip),%xmm9 # 6840 <_sk_callback_sse2+0x98d> - .byte 68,15,84,21,192,55,0,0 // andps 0x37c0(%rip),%xmm10 # 6850 <_sk_callback_sse2+0x99d> - .byte 68,15,86,21,200,55,0,0 // orps 0x37c8(%rip),%xmm10 # 6860 <_sk_callback_sse2+0x9ad> - .byte 68,15,88,13,208,55,0,0 // addps 0x37d0(%rip),%xmm9 # 6870 <_sk_callback_sse2+0x9bd> - .byte 68,15,40,37,216,55,0,0 // movaps 0x37d8(%rip),%xmm12 # 6880 <_sk_callback_sse2+0x9cd> + .byte 68,15,89,13,88,56,0,0 // mulps 0x3858(%rip),%xmm9 # 68e0 <_sk_callback_sse2+0x98c> + .byte 68,15,84,21,96,56,0,0 // andps 0x3860(%rip),%xmm10 # 68f0 <_sk_callback_sse2+0x99c> + .byte 68,15,86,21,104,56,0,0 // orps 0x3868(%rip),%xmm10 # 6900 <_sk_callback_sse2+0x9ac> + .byte 68,15,88,13,112,56,0,0 // addps 0x3870(%rip),%xmm9 # 6910 <_sk_callback_sse2+0x9bc> + .byte 68,15,40,37,120,56,0,0 // movaps 0x3878(%rip),%xmm12 # 6920 <_sk_callback_sse2+0x9cc> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,216,55,0,0 // addps 0x37d8(%rip),%xmm10 # 6890 <_sk_callback_sse2+0x9dd> - .byte 68,15,40,37,224,55,0,0 // movaps 0x37e0(%rip),%xmm12 # 68a0 <_sk_callback_sse2+0x9ed> + .byte 68,15,88,21,120,56,0,0 // addps 0x3878(%rip),%xmm10 # 6930 <_sk_callback_sse2+0x9dc> + .byte 68,15,40,37,128,56,0,0 // movaps 0x3880(%rip),%xmm12 # 6940 <_sk_callback_sse2+0x9ec> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -36939,22 +37229,22 @@ _sk_parametric_a_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,202,55,0,0 // movaps 0x37ca(%rip),%xmm10 # 68b0 <_sk_callback_sse2+0x9fd> + .byte 68,15,40,21,106,56,0,0 // movaps 0x386a(%rip),%xmm10 # 6950 <_sk_callback_sse2+0x9fc> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,190,55,0,0 // addps 0x37be(%rip),%xmm9 # 68c0 <_sk_callback_sse2+0xa0d> - .byte 68,15,40,37,198,55,0,0 // movaps 0x37c6(%rip),%xmm12 # 68d0 <_sk_callback_sse2+0xa1d> + .byte 68,15,88,13,94,56,0,0 // addps 0x385e(%rip),%xmm9 # 6960 <_sk_callback_sse2+0xa0c> + .byte 68,15,40,37,102,56,0,0 // movaps 0x3866(%rip),%xmm12 # 6970 <_sk_callback_sse2+0xa1c> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,198,55,0,0 // movaps 0x37c6(%rip),%xmm12 # 68e0 <_sk_callback_sse2+0xa2d> + .byte 68,15,40,37,102,56,0,0 // movaps 0x3866(%rip),%xmm12 # 6980 <_sk_callback_sse2+0xa2c> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,202,55,0,0 // movaps 0x37ca(%rip),%xmm13 # 68f0 <_sk_callback_sse2+0xa3d> + .byte 68,15,40,45,106,56,0,0 // movaps 0x386a(%rip),%xmm13 # 6990 <_sk_callback_sse2+0xa3c> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,202,55,0,0 // mulps 0x37ca(%rip),%xmm13 # 6900 <_sk_callback_sse2+0xa4d> + .byte 68,15,89,45,106,56,0,0 // mulps 0x386a(%rip),%xmm13 # 69a0 <_sk_callback_sse2+0xa4c> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -36971,29 +37261,29 @@ HIDDEN _sk_lab_to_xyz_sse2 .globl _sk_lab_to_xyz_sse2 FUNCTION(_sk_lab_to_xyz_sse2) _sk_lab_to_xyz_sse2: - .byte 15,89,5,167,55,0,0 // mulps 0x37a7(%rip),%xmm0 # 6910 <_sk_callback_sse2+0xa5d> - .byte 68,15,40,5,175,55,0,0 // movaps 0x37af(%rip),%xmm8 # 6920 <_sk_callback_sse2+0xa6d> + .byte 15,89,5,71,56,0,0 // mulps 0x3847(%rip),%xmm0 # 69b0 <_sk_callback_sse2+0xa5c> + .byte 68,15,40,5,79,56,0,0 // movaps 0x384f(%rip),%xmm8 # 69c0 <_sk_callback_sse2+0xa6c> .byte 65,15,89,200 // mulps %xmm8,%xmm1 - .byte 68,15,40,13,179,55,0,0 // movaps 0x37b3(%rip),%xmm9 # 6930 <_sk_callback_sse2+0xa7d> + .byte 68,15,40,13,83,56,0,0 // movaps 0x3853(%rip),%xmm9 # 69d0 <_sk_callback_sse2+0xa7c> .byte 65,15,88,201 // addps %xmm9,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 65,15,88,209 // addps %xmm9,%xmm2 - .byte 15,88,5,176,55,0,0 // addps 0x37b0(%rip),%xmm0 # 6940 <_sk_callback_sse2+0xa8d> - .byte 15,89,5,185,55,0,0 // mulps 0x37b9(%rip),%xmm0 # 6950 <_sk_callback_sse2+0xa9d> - .byte 15,89,13,194,55,0,0 // mulps 0x37c2(%rip),%xmm1 # 6960 <_sk_callback_sse2+0xaad> + .byte 15,88,5,80,56,0,0 // addps 0x3850(%rip),%xmm0 # 69e0 <_sk_callback_sse2+0xa8c> + .byte 15,89,5,89,56,0,0 // mulps 0x3859(%rip),%xmm0 # 69f0 <_sk_callback_sse2+0xa9c> + .byte 15,89,13,98,56,0,0 // mulps 0x3862(%rip),%xmm1 # 6a00 <_sk_callback_sse2+0xaac> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,21,200,55,0,0 // mulps 0x37c8(%rip),%xmm2 # 6970 <_sk_callback_sse2+0xabd> + .byte 15,89,21,104,56,0,0 // mulps 0x3868(%rip),%xmm2 # 6a10 <_sk_callback_sse2+0xabc> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 68,15,92,202 // subps %xmm2,%xmm9 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 .byte 68,15,89,225 // mulps %xmm1,%xmm12 - .byte 15,40,21,189,55,0,0 // movaps 0x37bd(%rip),%xmm2 # 6980 <_sk_callback_sse2+0xacd> + .byte 15,40,21,93,56,0,0 // movaps 0x385d(%rip),%xmm2 # 6a20 <_sk_callback_sse2+0xacc> .byte 68,15,40,194 // movaps %xmm2,%xmm8 .byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8 - .byte 68,15,40,21,188,55,0,0 // movaps 0x37bc(%rip),%xmm10 # 6990 <_sk_callback_sse2+0xadd> + .byte 68,15,40,21,92,56,0,0 // movaps 0x385c(%rip),%xmm10 # 6a30 <_sk_callback_sse2+0xadc> .byte 65,15,88,202 // addps %xmm10,%xmm1 - .byte 68,15,40,29,192,55,0,0 // movaps 0x37c0(%rip),%xmm11 # 69a0 <_sk_callback_sse2+0xaed> + .byte 68,15,40,29,96,56,0,0 // movaps 0x3860(%rip),%xmm11 # 6a40 <_sk_callback_sse2+0xaec> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 69,15,84,224 // andps %xmm8,%xmm12 .byte 68,15,85,193 // andnps %xmm1,%xmm8 @@ -37017,8 +37307,8 @@ _sk_lab_to_xyz_sse2: .byte 15,84,194 // andps %xmm2,%xmm0 .byte 65,15,85,209 // andnps %xmm9,%xmm2 .byte 15,86,208 // orps %xmm0,%xmm2 - .byte 68,15,89,5,112,55,0,0 // mulps 0x3770(%rip),%xmm8 # 69b0 <_sk_callback_sse2+0xafd> - .byte 15,89,21,121,55,0,0 // mulps 0x3779(%rip),%xmm2 # 69c0 <_sk_callback_sse2+0xb0d> + .byte 68,15,89,5,16,56,0,0 // mulps 0x3810(%rip),%xmm8 # 6a50 <_sk_callback_sse2+0xafc> + .byte 15,89,21,25,56,0,0 // mulps 0x3819(%rip),%xmm2 # 6a60 <_sk_callback_sse2+0xb0c> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -37034,9 +37324,9 @@ _sk_load_a8_sse2: .byte 102,65,15,110,4,18 // movd (%r10,%rdx,1),%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 - .byte 102,15,219,5,97,55,0,0 // pand 0x3761(%rip),%xmm0 # 69d0 <_sk_callback_sse2+0xb1d> + .byte 102,15,219,5,1,56,0,0 // pand 0x3801(%rip),%xmm0 # 6a70 <_sk_callback_sse2+0xb1c> .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,103,55,0,0 // mulps 0x3767(%rip),%xmm3 # 69e0 <_sk_callback_sse2+0xb2d> + .byte 15,89,29,7,56,0,0 // mulps 0x3807(%rip),%xmm3 # 6a80 <_sk_callback_sse2+0xb2c> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 @@ -37075,9 +37365,9 @@ _sk_load_a8_dst_sse2: .byte 102,65,15,110,36,18 // movd (%r10,%rdx,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,219,37,251,54,0,0 // pand 0x36fb(%rip),%xmm4 # 69f0 <_sk_callback_sse2+0xb3d> + .byte 102,15,219,37,155,55,0,0 // pand 0x379b(%rip),%xmm4 # 6a90 <_sk_callback_sse2+0xb3c> .byte 15,91,252 // cvtdq2ps %xmm4,%xmm7 - .byte 15,89,61,1,55,0,0 // mulps 0x3701(%rip),%xmm7 # 6a00 <_sk_callback_sse2+0xb4d> + .byte 15,89,61,161,55,0,0 // mulps 0x37a1(%rip),%xmm7 # 6aa0 <_sk_callback_sse2+0xb4c> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 102,15,87,237 // xorpd %xmm5,%xmm5 @@ -37145,7 +37435,7 @@ _sk_gather_a8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,34,54,0,0 // mulps 0x3622(%rip),%xmm3 # 6a10 <_sk_callback_sse2+0xb5d> + .byte 15,89,29,194,54,0,0 // mulps 0x36c2(%rip),%xmm3 # 6ab0 <_sk_callback_sse2+0xb5c> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -37160,7 +37450,7 @@ FUNCTION(_sk_store_a8_sse2) _sk_store_a8_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 68,15,40,5,20,54,0,0 // movaps 0x3614(%rip),%xmm8 # 6a20 <_sk_callback_sse2+0xb6d> + .byte 68,15,40,5,180,54,0,0 // movaps 0x36b4(%rip),%xmm8 # 6ac0 <_sk_callback_sse2+0xb6c> .byte 68,15,89,195 // mulps %xmm3,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 .byte 102,65,15,114,240,16 // pslld $0x10,%xmm8 @@ -37186,7 +37476,7 @@ _sk_store_a8_sse2: .byte 102,68,15,127,68,36,232 // movdqa %xmm8,-0x18(%rsp) .byte 138,68,36,240 // mov -0x10(%rsp),%al .byte 65,136,68,18,2 // mov %al,0x2(%r10,%rdx,1) - .byte 102,68,15,219,5,183,53,0,0 // pand 0x35b7(%rip),%xmm8 # 6a30 <_sk_callback_sse2+0xb7d> + .byte 102,68,15,219,5,87,54,0,0 // pand 0x3657(%rip),%xmm8 # 6ad0 <_sk_callback_sse2+0xb7c> .byte 102,69,15,103,192 // packuswb %xmm8,%xmm8 .byte 102,69,15,103,192 // packuswb %xmm8,%xmm8 .byte 102,68,15,126,192 // movd %xmm8,%eax @@ -37208,11 +37498,11 @@ _sk_load_g8_sse2: .byte 102,65,15,110,4,18 // movd (%r10,%rdx,1),%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 - .byte 102,15,219,5,128,53,0,0 // pand 0x3580(%rip),%xmm0 # 6a40 <_sk_callback_sse2+0xb8d> + .byte 102,15,219,5,32,54,0,0 // pand 0x3620(%rip),%xmm0 # 6ae0 <_sk_callback_sse2+0xb8c> .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,134,53,0,0 // mulps 0x3586(%rip),%xmm0 # 6a50 <_sk_callback_sse2+0xb9d> + .byte 15,89,5,38,54,0,0 // mulps 0x3626(%rip),%xmm0 # 6af0 <_sk_callback_sse2+0xb9c> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,141,53,0,0 // movaps 0x358d(%rip),%xmm3 # 6a60 <_sk_callback_sse2+0xbad> + .byte 15,40,29,45,54,0,0 // movaps 0x362d(%rip),%xmm3 # 6b00 <_sk_callback_sse2+0xbac> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,224 // jmpq *%rax @@ -37249,11 +37539,11 @@ _sk_load_g8_dst_sse2: .byte 102,65,15,110,36,18 // movd (%r10,%rdx,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,219,37,39,53,0,0 // pand 0x3527(%rip),%xmm4 # 6a70 <_sk_callback_sse2+0xbbd> + .byte 102,15,219,37,199,53,0,0 // pand 0x35c7(%rip),%xmm4 # 6b10 <_sk_callback_sse2+0xbbc> .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,37,45,53,0,0 // mulps 0x352d(%rip),%xmm4 # 6a80 <_sk_callback_sse2+0xbcd> + .byte 15,89,37,205,53,0,0 // mulps 0x35cd(%rip),%xmm4 # 6b20 <_sk_callback_sse2+0xbcc> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,61,52,53,0,0 // movaps 0x3534(%rip),%xmm7 # 6a90 <_sk_callback_sse2+0xbdd> + .byte 15,40,61,212,53,0,0 // movaps 0x35d4(%rip),%xmm7 # 6b30 <_sk_callback_sse2+0xbdc> .byte 15,40,236 // movaps %xmm4,%xmm5 .byte 15,40,244 // movaps %xmm4,%xmm6 .byte 255,224 // jmpq *%rax @@ -37319,9 +37609,9 @@ _sk_gather_g8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,91,52,0,0 // mulps 0x345b(%rip),%xmm0 # 6aa0 <_sk_callback_sse2+0xbed> + .byte 15,89,5,251,52,0,0 // mulps 0x34fb(%rip),%xmm0 # 6b40 <_sk_callback_sse2+0xbec> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,98,52,0,0 // movaps 0x3462(%rip),%xmm3 # 6ab0 <_sk_callback_sse2+0xbfd> + .byte 15,40,29,2,53,0,0 // movaps 0x3502(%rip),%xmm3 # 6b50 <_sk_callback_sse2+0xbfc> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 91 // pop %rbx @@ -37389,11 +37679,11 @@ _sk_gather_i8_sse2: .byte 102,66,15,110,76,149,0 // movd 0x0(%rbp,%r10,4),%xmm1 .byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9 .byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9 - .byte 102,15,111,21,123,51,0,0 // movdqa 0x337b(%rip),%xmm2 # 6ac0 <_sk_callback_sse2+0xc0d> + .byte 102,15,111,21,27,52,0,0 // movdqa 0x341b(%rip),%xmm2 # 6b60 <_sk_callback_sse2+0xc0c> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,119,51,0,0 // movaps 0x3377(%rip),%xmm8 # 6ad0 <_sk_callback_sse2+0xc1d> + .byte 68,15,40,5,23,52,0,0 // movaps 0x3417(%rip),%xmm8 # 6b70 <_sk_callback_sse2+0xc1c> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -37424,19 +37714,19 @@ _sk_load_565_sse2: .byte 117,83 // jne 37fa <_sk_load_565_sse2+0x5d> .byte 243,65,15,126,20,82 // movq (%r10,%rdx,2),%xmm2 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,5,39,51,0,0 // movdqa 0x3327(%rip),%xmm0 # 6ae0 <_sk_callback_sse2+0xc2d> + .byte 102,15,111,5,199,51,0,0 // movdqa 0x33c7(%rip),%xmm0 # 6b80 <_sk_callback_sse2+0xc2c> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,41,51,0,0 // mulps 0x3329(%rip),%xmm0 # 6af0 <_sk_callback_sse2+0xc3d> - .byte 102,15,111,13,49,51,0,0 // movdqa 0x3331(%rip),%xmm1 # 6b00 <_sk_callback_sse2+0xc4d> + .byte 15,89,5,201,51,0,0 // mulps 0x33c9(%rip),%xmm0 # 6b90 <_sk_callback_sse2+0xc3c> + .byte 102,15,111,13,209,51,0,0 // movdqa 0x33d1(%rip),%xmm1 # 6ba0 <_sk_callback_sse2+0xc4c> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,51,51,0,0 // mulps 0x3333(%rip),%xmm1 # 6b10 <_sk_callback_sse2+0xc5d> - .byte 102,15,219,21,59,51,0,0 // pand 0x333b(%rip),%xmm2 # 6b20 <_sk_callback_sse2+0xc6d> + .byte 15,89,13,211,51,0,0 // mulps 0x33d3(%rip),%xmm1 # 6bb0 <_sk_callback_sse2+0xc5c> + .byte 102,15,219,21,219,51,0,0 // pand 0x33db(%rip),%xmm2 # 6bc0 <_sk_callback_sse2+0xc6c> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,65,51,0,0 // mulps 0x3341(%rip),%xmm2 # 6b30 <_sk_callback_sse2+0xc7d> + .byte 15,89,21,225,51,0,0 // mulps 0x33e1(%rip),%xmm2 # 6bd0 <_sk_callback_sse2+0xc7c> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,72,51,0,0 // movaps 0x3348(%rip),%xmm3 # 6b40 <_sk_callback_sse2+0xc8d> + .byte 15,40,29,232,51,0,0 // movaps 0x33e8(%rip),%xmm3 # 6be0 <_sk_callback_sse2+0xc8c> .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b @@ -37468,19 +37758,19 @@ _sk_load_565_dst_sse2: .byte 117,83 // jne 38a4 <_sk_load_565_dst_sse2+0x5d> .byte 243,65,15,126,52,82 // movq (%r10,%rdx,2),%xmm6 .byte 102,15,97,240 // punpcklwd %xmm0,%xmm6 - .byte 102,15,111,37,237,50,0,0 // movdqa 0x32ed(%rip),%xmm4 # 6b50 <_sk_callback_sse2+0xc9d> + .byte 102,15,111,37,141,51,0,0 // movdqa 0x338d(%rip),%xmm4 # 6bf0 <_sk_callback_sse2+0xc9c> .byte 102,15,219,230 // pand %xmm6,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,37,239,50,0,0 // mulps 0x32ef(%rip),%xmm4 # 6b60 <_sk_callback_sse2+0xcad> - .byte 102,15,111,45,247,50,0,0 // movdqa 0x32f7(%rip),%xmm5 # 6b70 <_sk_callback_sse2+0xcbd> + .byte 15,89,37,143,51,0,0 // mulps 0x338f(%rip),%xmm4 # 6c00 <_sk_callback_sse2+0xcac> + .byte 102,15,111,45,151,51,0,0 // movdqa 0x3397(%rip),%xmm5 # 6c10 <_sk_callback_sse2+0xcbc> .byte 102,15,219,238 // pand %xmm6,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,45,249,50,0,0 // mulps 0x32f9(%rip),%xmm5 # 6b80 <_sk_callback_sse2+0xccd> - .byte 102,15,219,53,1,51,0,0 // pand 0x3301(%rip),%xmm6 # 6b90 <_sk_callback_sse2+0xcdd> + .byte 15,89,45,153,51,0,0 // mulps 0x3399(%rip),%xmm5 # 6c20 <_sk_callback_sse2+0xccc> + .byte 102,15,219,53,161,51,0,0 // pand 0x33a1(%rip),%xmm6 # 6c30 <_sk_callback_sse2+0xcdc> .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,89,53,7,51,0,0 // mulps 0x3307(%rip),%xmm6 # 6ba0 <_sk_callback_sse2+0xced> + .byte 15,89,53,167,51,0,0 // mulps 0x33a7(%rip),%xmm6 # 6c40 <_sk_callback_sse2+0xcec> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,61,14,51,0,0 // movaps 0x330e(%rip),%xmm7 # 6bb0 <_sk_callback_sse2+0xcfd> + .byte 15,40,61,174,51,0,0 // movaps 0x33ae(%rip),%xmm7 # 6c50 <_sk_callback_sse2+0xcfc> .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b @@ -37535,19 +37825,19 @@ _sk_gather_565_sse2: .byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,5,73,50,0,0 // movdqa 0x3249(%rip),%xmm0 # 6bc0 <_sk_callback_sse2+0xd0d> + .byte 102,15,111,5,233,50,0,0 // movdqa 0x32e9(%rip),%xmm0 # 6c60 <_sk_callback_sse2+0xd0c> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,75,50,0,0 // mulps 0x324b(%rip),%xmm0 # 6bd0 <_sk_callback_sse2+0xd1d> - .byte 102,15,111,13,83,50,0,0 // movdqa 0x3253(%rip),%xmm1 # 6be0 <_sk_callback_sse2+0xd2d> + .byte 15,89,5,235,50,0,0 // mulps 0x32eb(%rip),%xmm0 # 6c70 <_sk_callback_sse2+0xd1c> + .byte 102,15,111,13,243,50,0,0 // movdqa 0x32f3(%rip),%xmm1 # 6c80 <_sk_callback_sse2+0xd2c> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,85,50,0,0 // mulps 0x3255(%rip),%xmm1 # 6bf0 <_sk_callback_sse2+0xd3d> - .byte 102,15,219,21,93,50,0,0 // pand 0x325d(%rip),%xmm2 # 6c00 <_sk_callback_sse2+0xd4d> + .byte 15,89,13,245,50,0,0 // mulps 0x32f5(%rip),%xmm1 # 6c90 <_sk_callback_sse2+0xd3c> + .byte 102,15,219,21,253,50,0,0 // pand 0x32fd(%rip),%xmm2 # 6ca0 <_sk_callback_sse2+0xd4c> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,99,50,0,0 // mulps 0x3263(%rip),%xmm2 # 6c10 <_sk_callback_sse2+0xd5d> + .byte 15,89,21,3,51,0,0 // mulps 0x3303(%rip),%xmm2 # 6cb0 <_sk_callback_sse2+0xd5c> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,106,50,0,0 // movaps 0x326a(%rip),%xmm3 # 6c20 <_sk_callback_sse2+0xd6d> + .byte 15,40,29,10,51,0,0 // movaps 0x330a(%rip),%xmm3 # 6cc0 <_sk_callback_sse2+0xd6c> .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax @@ -37557,12 +37847,12 @@ FUNCTION(_sk_store_565_sse2) _sk_store_565_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 68,15,40,5,106,50,0,0 // movaps 0x326a(%rip),%xmm8 # 6c30 <_sk_callback_sse2+0xd7d> + .byte 68,15,40,5,10,51,0,0 // movaps 0x330a(%rip),%xmm8 # 6cd0 <_sk_callback_sse2+0xd7c> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 .byte 102,65,15,114,241,11 // pslld $0xb,%xmm9 - .byte 68,15,40,21,95,50,0,0 // movaps 0x325f(%rip),%xmm10 # 6c40 <_sk_callback_sse2+0xd8d> + .byte 68,15,40,21,255,50,0,0 // movaps 0x32ff(%rip),%xmm10 # 6ce0 <_sk_callback_sse2+0xd8c> .byte 68,15,89,209 // mulps %xmm1,%xmm10 .byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10 .byte 102,65,15,114,242,5 // pslld $0x5,%xmm10 @@ -37606,21 +37896,21 @@ _sk_load_4444_sse2: .byte 117,98 // jne 3ad3 <_sk_load_4444_sse2+0x6c> .byte 243,65,15,126,28,82 // movq (%r10,%rdx,2),%xmm3 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,5,205,49,0,0 // movdqa 0x31cd(%rip),%xmm0 # 6c50 <_sk_callback_sse2+0xd9d> + .byte 102,15,111,5,109,50,0,0 // movdqa 0x326d(%rip),%xmm0 # 6cf0 <_sk_callback_sse2+0xd9c> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,207,49,0,0 // mulps 0x31cf(%rip),%xmm0 # 6c60 <_sk_callback_sse2+0xdad> - .byte 102,15,111,13,215,49,0,0 // movdqa 0x31d7(%rip),%xmm1 # 6c70 <_sk_callback_sse2+0xdbd> + .byte 15,89,5,111,50,0,0 // mulps 0x326f(%rip),%xmm0 # 6d00 <_sk_callback_sse2+0xdac> + .byte 102,15,111,13,119,50,0,0 // movdqa 0x3277(%rip),%xmm1 # 6d10 <_sk_callback_sse2+0xdbc> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,217,49,0,0 // mulps 0x31d9(%rip),%xmm1 # 6c80 <_sk_callback_sse2+0xdcd> - .byte 102,15,111,21,225,49,0,0 // movdqa 0x31e1(%rip),%xmm2 # 6c90 <_sk_callback_sse2+0xddd> + .byte 15,89,13,121,50,0,0 // mulps 0x3279(%rip),%xmm1 # 6d20 <_sk_callback_sse2+0xdcc> + .byte 102,15,111,21,129,50,0,0 // movdqa 0x3281(%rip),%xmm2 # 6d30 <_sk_callback_sse2+0xddc> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,227,49,0,0 // mulps 0x31e3(%rip),%xmm2 # 6ca0 <_sk_callback_sse2+0xded> - .byte 102,15,219,29,235,49,0,0 // pand 0x31eb(%rip),%xmm3 # 6cb0 <_sk_callback_sse2+0xdfd> + .byte 15,89,21,131,50,0,0 // mulps 0x3283(%rip),%xmm2 # 6d40 <_sk_callback_sse2+0xdec> + .byte 102,15,219,29,139,50,0,0 // pand 0x328b(%rip),%xmm3 # 6d50 <_sk_callback_sse2+0xdfc> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,241,49,0,0 // mulps 0x31f1(%rip),%xmm3 # 6cc0 <_sk_callback_sse2+0xe0d> + .byte 15,89,29,145,50,0,0 // mulps 0x3291(%rip),%xmm3 # 6d60 <_sk_callback_sse2+0xe0c> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d @@ -37653,21 +37943,21 @@ _sk_load_4444_dst_sse2: .byte 117,98 // jne 3b8c <_sk_load_4444_dst_sse2+0x6c> .byte 243,65,15,126,60,82 // movq (%r10,%rdx,2),%xmm7 .byte 102,15,97,248 // punpcklwd %xmm0,%xmm7 - .byte 102,15,111,37,148,49,0,0 // movdqa 0x3194(%rip),%xmm4 # 6cd0 <_sk_callback_sse2+0xe1d> + .byte 102,15,111,37,52,50,0,0 // movdqa 0x3234(%rip),%xmm4 # 6d70 <_sk_callback_sse2+0xe1c> .byte 102,15,219,231 // pand %xmm7,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,37,150,49,0,0 // mulps 0x3196(%rip),%xmm4 # 6ce0 <_sk_callback_sse2+0xe2d> - .byte 102,15,111,45,158,49,0,0 // movdqa 0x319e(%rip),%xmm5 # 6cf0 <_sk_callback_sse2+0xe3d> + .byte 15,89,37,54,50,0,0 // mulps 0x3236(%rip),%xmm4 # 6d80 <_sk_callback_sse2+0xe2c> + .byte 102,15,111,45,62,50,0,0 // movdqa 0x323e(%rip),%xmm5 # 6d90 <_sk_callback_sse2+0xe3c> .byte 102,15,219,239 // pand %xmm7,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,45,160,49,0,0 // mulps 0x31a0(%rip),%xmm5 # 6d00 <_sk_callback_sse2+0xe4d> - .byte 102,15,111,53,168,49,0,0 // movdqa 0x31a8(%rip),%xmm6 # 6d10 <_sk_callback_sse2+0xe5d> + .byte 15,89,45,64,50,0,0 // mulps 0x3240(%rip),%xmm5 # 6da0 <_sk_callback_sse2+0xe4c> + .byte 102,15,111,53,72,50,0,0 // movdqa 0x3248(%rip),%xmm6 # 6db0 <_sk_callback_sse2+0xe5c> .byte 102,15,219,247 // pand %xmm7,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,89,53,170,49,0,0 // mulps 0x31aa(%rip),%xmm6 # 6d20 <_sk_callback_sse2+0xe6d> - .byte 102,15,219,61,178,49,0,0 // pand 0x31b2(%rip),%xmm7 # 6d30 <_sk_callback_sse2+0xe7d> + .byte 15,89,53,74,50,0,0 // mulps 0x324a(%rip),%xmm6 # 6dc0 <_sk_callback_sse2+0xe6c> + .byte 102,15,219,61,82,50,0,0 // pand 0x3252(%rip),%xmm7 # 6dd0 <_sk_callback_sse2+0xe7c> .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 - .byte 15,89,61,184,49,0,0 // mulps 0x31b8(%rip),%xmm7 # 6d40 <_sk_callback_sse2+0xe8d> + .byte 15,89,61,88,50,0,0 // mulps 0x3258(%rip),%xmm7 # 6de0 <_sk_callback_sse2+0xe8c> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d @@ -37723,21 +38013,21 @@ _sk_gather_4444_sse2: .byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,5,241,48,0,0 // movdqa 0x30f1(%rip),%xmm0 # 6d50 <_sk_callback_sse2+0xe9d> + .byte 102,15,111,5,145,49,0,0 // movdqa 0x3191(%rip),%xmm0 # 6df0 <_sk_callback_sse2+0xe9c> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,243,48,0,0 // mulps 0x30f3(%rip),%xmm0 # 6d60 <_sk_callback_sse2+0xead> - .byte 102,15,111,13,251,48,0,0 // movdqa 0x30fb(%rip),%xmm1 # 6d70 <_sk_callback_sse2+0xebd> + .byte 15,89,5,147,49,0,0 // mulps 0x3193(%rip),%xmm0 # 6e00 <_sk_callback_sse2+0xeac> + .byte 102,15,111,13,155,49,0,0 // movdqa 0x319b(%rip),%xmm1 # 6e10 <_sk_callback_sse2+0xebc> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,253,48,0,0 // mulps 0x30fd(%rip),%xmm1 # 6d80 <_sk_callback_sse2+0xecd> - .byte 102,15,111,21,5,49,0,0 // movdqa 0x3105(%rip),%xmm2 # 6d90 <_sk_callback_sse2+0xedd> + .byte 15,89,13,157,49,0,0 // mulps 0x319d(%rip),%xmm1 # 6e20 <_sk_callback_sse2+0xecc> + .byte 102,15,111,21,165,49,0,0 // movdqa 0x31a5(%rip),%xmm2 # 6e30 <_sk_callback_sse2+0xedc> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,7,49,0,0 // mulps 0x3107(%rip),%xmm2 # 6da0 <_sk_callback_sse2+0xeed> - .byte 102,15,219,29,15,49,0,0 // pand 0x310f(%rip),%xmm3 # 6db0 <_sk_callback_sse2+0xefd> + .byte 15,89,21,167,49,0,0 // mulps 0x31a7(%rip),%xmm2 # 6e40 <_sk_callback_sse2+0xeec> + .byte 102,15,219,29,175,49,0,0 // pand 0x31af(%rip),%xmm3 # 6e50 <_sk_callback_sse2+0xefc> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,21,49,0,0 // mulps 0x3115(%rip),%xmm3 # 6dc0 <_sk_callback_sse2+0xf0d> + .byte 15,89,29,181,49,0,0 // mulps 0x31b5(%rip),%xmm3 # 6e60 <_sk_callback_sse2+0xf0c> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax @@ -37748,7 +38038,7 @@ FUNCTION(_sk_store_4444_sse2) _sk_store_4444_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 68,15,40,5,19,49,0,0 // movaps 0x3113(%rip),%xmm8 # 6dd0 <_sk_callback_sse2+0xf1d> + .byte 68,15,40,5,179,49,0,0 // movaps 0x31b3(%rip),%xmm8 # 6e70 <_sk_callback_sse2+0xf1c> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -37801,11 +38091,11 @@ _sk_load_8888_sse2: .byte 77,133,192 // test %r8,%r8 .byte 117,98 // jne 3dde <_sk_load_8888_sse2+0x6c> .byte 243,68,15,111,12,144 // movdqu (%rax,%rdx,4),%xmm9 - .byte 102,15,111,21,86,48,0,0 // movdqa 0x3056(%rip),%xmm2 # 6de0 <_sk_callback_sse2+0xf2d> + .byte 102,15,111,21,246,48,0,0 // movdqa 0x30f6(%rip),%xmm2 # 6e80 <_sk_callback_sse2+0xf2c> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,82,48,0,0 // movaps 0x3052(%rip),%xmm8 # 6df0 <_sk_callback_sse2+0xf3d> + .byte 68,15,40,5,242,48,0,0 // movaps 0x30f2(%rip),%xmm8 # 6e90 <_sk_callback_sse2+0xf3c> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -37847,11 +38137,11 @@ _sk_load_8888_dst_sse2: .byte 77,133,192 // test %r8,%r8 .byte 117,98 // jne 3e8a <_sk_load_8888_dst_sse2+0x6c> .byte 243,68,15,111,12,144 // movdqu (%rax,%rdx,4),%xmm9 - .byte 102,15,111,53,202,47,0,0 // movdqa 0x2fca(%rip),%xmm6 # 6e00 <_sk_callback_sse2+0xf4d> + .byte 102,15,111,53,106,48,0,0 // movdqa 0x306a(%rip),%xmm6 # 6ea0 <_sk_callback_sse2+0xf4c> .byte 102,65,15,111,225 // movdqa %xmm9,%xmm4 .byte 102,15,219,230 // pand %xmm6,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 68,15,40,5,198,47,0,0 // movaps 0x2fc6(%rip),%xmm8 # 6e10 <_sk_callback_sse2+0xf5d> + .byte 68,15,40,5,102,48,0,0 // movaps 0x3066(%rip),%xmm8 # 6eb0 <_sk_callback_sse2+0xf5c> .byte 65,15,89,224 // mulps %xmm8,%xmm4 .byte 102,65,15,111,233 // movdqa %xmm9,%xmm5 .byte 102,15,114,213,8 // psrld $0x8,%xmm5 @@ -37916,11 +38206,11 @@ _sk_gather_8888_sse2: .byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1 .byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9 .byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9 - .byte 102,15,111,21,212,46,0,0 // movdqa 0x2ed4(%rip),%xmm2 # 6e20 <_sk_callback_sse2+0xf6d> + .byte 102,15,111,21,116,47,0,0 // movdqa 0x2f74(%rip),%xmm2 # 6ec0 <_sk_callback_sse2+0xf6c> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,208,46,0,0 // movaps 0x2ed0(%rip),%xmm8 # 6e30 <_sk_callback_sse2+0xf7d> + .byte 68,15,40,5,112,47,0,0 // movaps 0x2f70(%rip),%xmm8 # 6ed0 <_sk_callback_sse2+0xf7c> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -37945,7 +38235,7 @@ FUNCTION(_sk_store_8888_sse2) _sk_store_8888_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,146,46,0,0 // movaps 0x2e92(%rip),%xmm8 # 6e40 <_sk_callback_sse2+0xf8d> + .byte 68,15,40,5,50,47,0,0 // movaps 0x2f32(%rip),%xmm8 # 6ee0 <_sk_callback_sse2+0xf8c> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -37992,11 +38282,11 @@ _sk_load_bgra_sse2: .byte 77,133,192 // test %r8,%r8 .byte 117,98 // jne 40b0 <_sk_load_bgra_sse2+0x6c> .byte 243,68,15,111,12,144 // movdqu (%rax,%rdx,4),%xmm9 - .byte 102,15,111,5,244,45,0,0 // movdqa 0x2df4(%rip),%xmm0 # 6e50 <_sk_callback_sse2+0xf9d> + .byte 102,15,111,5,148,46,0,0 // movdqa 0x2e94(%rip),%xmm0 # 6ef0 <_sk_callback_sse2+0xf9c> .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,219,200 // pand %xmm0,%xmm1 .byte 15,91,209 // cvtdq2ps %xmm1,%xmm2 - .byte 68,15,40,5,240,45,0,0 // movaps 0x2df0(%rip),%xmm8 # 6e60 <_sk_callback_sse2+0xfad> + .byte 68,15,40,5,144,46,0,0 // movaps 0x2e90(%rip),%xmm8 # 6f00 <_sk_callback_sse2+0xfac> .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -38038,11 +38328,11 @@ _sk_load_bgra_dst_sse2: .byte 77,133,192 // test %r8,%r8 .byte 117,98 // jne 415c <_sk_load_bgra_dst_sse2+0x6c> .byte 243,68,15,111,12,144 // movdqu (%rax,%rdx,4),%xmm9 - .byte 102,15,111,37,104,45,0,0 // movdqa 0x2d68(%rip),%xmm4 # 6e70 <_sk_callback_sse2+0xfbd> + .byte 102,15,111,37,8,46,0,0 // movdqa 0x2e08(%rip),%xmm4 # 6f10 <_sk_callback_sse2+0xfbc> .byte 102,65,15,111,233 // movdqa %xmm9,%xmm5 .byte 102,15,219,236 // pand %xmm4,%xmm5 .byte 15,91,245 // cvtdq2ps %xmm5,%xmm6 - .byte 68,15,40,5,100,45,0,0 // movaps 0x2d64(%rip),%xmm8 # 6e80 <_sk_callback_sse2+0xfcd> + .byte 68,15,40,5,4,46,0,0 // movaps 0x2e04(%rip),%xmm8 # 6f20 <_sk_callback_sse2+0xfcc> .byte 65,15,89,240 // mulps %xmm8,%xmm6 .byte 102,65,15,111,233 // movdqa %xmm9,%xmm5 .byte 102,15,114,213,8 // psrld $0x8,%xmm5 @@ -38107,11 +38397,11 @@ _sk_gather_bgra_sse2: .byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1 .byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9 .byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9 - .byte 102,15,111,5,114,44,0,0 // movdqa 0x2c72(%rip),%xmm0 # 6e90 <_sk_callback_sse2+0xfdd> + .byte 102,15,111,5,18,45,0,0 // movdqa 0x2d12(%rip),%xmm0 # 6f30 <_sk_callback_sse2+0xfdc> .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,219,200 // pand %xmm0,%xmm1 .byte 15,91,209 // cvtdq2ps %xmm1,%xmm2 - .byte 68,15,40,5,110,44,0,0 // movaps 0x2c6e(%rip),%xmm8 # 6ea0 <_sk_callback_sse2+0xfed> + .byte 68,15,40,5,14,45,0,0 // movaps 0x2d0e(%rip),%xmm8 # 6f40 <_sk_callback_sse2+0xfec> .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -38136,7 +38426,7 @@ FUNCTION(_sk_store_bgra_sse2) _sk_store_bgra_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,48,44,0,0 // movaps 0x2c30(%rip),%xmm8 # 6eb0 <_sk_callback_sse2+0xffd> + .byte 68,15,40,5,208,44,0,0 // movaps 0x2cd0(%rip),%xmm8 # 6f50 <_sk_callback_sse2+0xffc> .byte 68,15,40,202 // movaps %xmm2,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -38193,7 +38483,7 @@ _sk_load_f16_sse2: .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 .byte 102,65,15,111,206 // movdqa %xmm14,%xmm1 .byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1 - .byte 102,68,15,111,13,92,43,0,0 // movdqa 0x2b5c(%rip),%xmm9 # 6ec0 <_sk_callback_sse2+0x100d> + .byte 102,68,15,111,13,252,43,0,0 // movdqa 0x2bfc(%rip),%xmm9 # 6f60 <_sk_callback_sse2+0x100c> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,193 // pand %xmm9,%xmm0 .byte 102,15,239,200 // pxor %xmm0,%xmm1 @@ -38201,11 +38491,11 @@ _sk_load_f16_sse2: .byte 102,68,15,111,233 // movdqa %xmm1,%xmm13 .byte 102,65,15,114,245,13 // pslld $0xd,%xmm13 .byte 102,68,15,235,232 // por %xmm0,%xmm13 - .byte 102,68,15,111,29,65,43,0,0 // movdqa 0x2b41(%rip),%xmm11 # 6ed0 <_sk_callback_sse2+0x101d> + .byte 102,68,15,111,29,225,43,0,0 // movdqa 0x2be1(%rip),%xmm11 # 6f70 <_sk_callback_sse2+0x101c> .byte 102,69,15,254,235 // paddd %xmm11,%xmm13 - .byte 102,68,15,111,37,67,43,0,0 // movdqa 0x2b43(%rip),%xmm12 # 6ee0 <_sk_callback_sse2+0x102d> + .byte 102,68,15,111,37,227,43,0,0 // movdqa 0x2be3(%rip),%xmm12 # 6f80 <_sk_callback_sse2+0x102c> .byte 102,65,15,239,204 // pxor %xmm12,%xmm1 - .byte 102,15,111,29,70,43,0,0 // movdqa 0x2b46(%rip),%xmm3 # 6ef0 <_sk_callback_sse2+0x103d> + .byte 102,15,111,29,230,43,0,0 // movdqa 0x2be6(%rip),%xmm3 # 6f90 <_sk_callback_sse2+0x103c> .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0 .byte 102,65,15,223,197 // pandn %xmm13,%xmm0 @@ -38284,7 +38574,7 @@ _sk_load_f16_dst_sse2: .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 .byte 102,65,15,111,238 // movdqa %xmm14,%xmm5 .byte 102,65,15,97,234 // punpcklwd %xmm10,%xmm5 - .byte 102,68,15,111,13,243,41,0,0 // movdqa 0x29f3(%rip),%xmm9 # 6f00 <_sk_callback_sse2+0x104d> + .byte 102,68,15,111,13,147,42,0,0 // movdqa 0x2a93(%rip),%xmm9 # 6fa0 <_sk_callback_sse2+0x104c> .byte 102,15,111,229 // movdqa %xmm5,%xmm4 .byte 102,65,15,219,225 // pand %xmm9,%xmm4 .byte 102,15,239,236 // pxor %xmm4,%xmm5 @@ -38292,11 +38582,11 @@ _sk_load_f16_dst_sse2: .byte 102,68,15,111,237 // movdqa %xmm5,%xmm13 .byte 102,65,15,114,245,13 // pslld $0xd,%xmm13 .byte 102,68,15,235,236 // por %xmm4,%xmm13 - .byte 102,68,15,111,29,216,41,0,0 // movdqa 0x29d8(%rip),%xmm11 # 6f10 <_sk_callback_sse2+0x105d> + .byte 102,68,15,111,29,120,42,0,0 // movdqa 0x2a78(%rip),%xmm11 # 6fb0 <_sk_callback_sse2+0x105c> .byte 102,69,15,254,235 // paddd %xmm11,%xmm13 - .byte 102,68,15,111,37,218,41,0,0 // movdqa 0x29da(%rip),%xmm12 # 6f20 <_sk_callback_sse2+0x106d> + .byte 102,68,15,111,37,122,42,0,0 // movdqa 0x2a7a(%rip),%xmm12 # 6fc0 <_sk_callback_sse2+0x106c> .byte 102,65,15,239,236 // pxor %xmm12,%xmm5 - .byte 102,15,111,61,221,41,0,0 // movdqa 0x29dd(%rip),%xmm7 # 6f30 <_sk_callback_sse2+0x107d> + .byte 102,15,111,61,125,42,0,0 // movdqa 0x2a7d(%rip),%xmm7 # 6fd0 <_sk_callback_sse2+0x107c> .byte 102,15,111,231 // movdqa %xmm7,%xmm4 .byte 102,15,102,229 // pcmpgtd %xmm5,%xmm4 .byte 102,65,15,223,229 // pandn %xmm13,%xmm4 @@ -38396,7 +38686,7 @@ _sk_gather_f16_sse2: .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 .byte 102,65,15,111,206 // movdqa %xmm14,%xmm1 .byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1 - .byte 102,68,15,111,13,47,40,0,0 // movdqa 0x282f(%rip),%xmm9 # 6f40 <_sk_callback_sse2+0x108d> + .byte 102,68,15,111,13,207,40,0,0 // movdqa 0x28cf(%rip),%xmm9 # 6fe0 <_sk_callback_sse2+0x108c> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,193 // pand %xmm9,%xmm0 .byte 102,15,239,200 // pxor %xmm0,%xmm1 @@ -38404,11 +38694,11 @@ _sk_gather_f16_sse2: .byte 102,68,15,111,233 // movdqa %xmm1,%xmm13 .byte 102,65,15,114,245,13 // pslld $0xd,%xmm13 .byte 102,68,15,235,232 // por %xmm0,%xmm13 - .byte 102,68,15,111,29,20,40,0,0 // movdqa 0x2814(%rip),%xmm11 # 6f50 <_sk_callback_sse2+0x109d> + .byte 102,68,15,111,29,180,40,0,0 // movdqa 0x28b4(%rip),%xmm11 # 6ff0 <_sk_callback_sse2+0x109c> .byte 102,69,15,254,235 // paddd %xmm11,%xmm13 - .byte 102,68,15,111,37,22,40,0,0 // movdqa 0x2816(%rip),%xmm12 # 6f60 <_sk_callback_sse2+0x10ad> + .byte 102,68,15,111,37,182,40,0,0 // movdqa 0x28b6(%rip),%xmm12 # 7000 <_sk_callback_sse2+0x10ac> .byte 102,65,15,239,204 // pxor %xmm12,%xmm1 - .byte 102,15,111,29,25,40,0,0 // movdqa 0x2819(%rip),%xmm3 # 6f70 <_sk_callback_sse2+0x10bd> + .byte 102,15,111,29,185,40,0,0 // movdqa 0x28b9(%rip),%xmm3 # 7010 <_sk_callback_sse2+0x10bc> .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0 .byte 102,65,15,223,197 // pandn %xmm13,%xmm0 @@ -38462,17 +38752,17 @@ FUNCTION(_sk_store_f16_sse2) _sk_store_f16_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 102,68,15,111,21,64,39,0,0 // movdqa 0x2740(%rip),%xmm10 # 6f80 <_sk_callback_sse2+0x10cd> + .byte 102,68,15,111,21,224,39,0,0 // movdqa 0x27e0(%rip),%xmm10 # 7020 <_sk_callback_sse2+0x10cc> .byte 102,68,15,111,224 // movdqa %xmm0,%xmm12 .byte 102,69,15,219,226 // pand %xmm10,%xmm12 .byte 102,68,15,111,232 // movdqa %xmm0,%xmm13 .byte 102,69,15,239,236 // pxor %xmm12,%xmm13 - .byte 102,68,15,111,13,51,39,0,0 // movdqa 0x2733(%rip),%xmm9 # 6f90 <_sk_callback_sse2+0x10dd> + .byte 102,68,15,111,13,211,39,0,0 // movdqa 0x27d3(%rip),%xmm9 # 7030 <_sk_callback_sse2+0x10dc> .byte 102,65,15,114,212,16 // psrld $0x10,%xmm12 .byte 102,69,15,111,193 // movdqa %xmm9,%xmm8 .byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8 .byte 102,65,15,114,213,13 // psrld $0xd,%xmm13 - .byte 102,68,15,111,29,36,39,0,0 // movdqa 0x2724(%rip),%xmm11 # 6fa0 <_sk_callback_sse2+0x10ed> + .byte 102,68,15,111,29,196,39,0,0 // movdqa 0x27c4(%rip),%xmm11 # 7040 <_sk_callback_sse2+0x10ec> .byte 102,69,15,235,227 // por %xmm11,%xmm12 .byte 102,69,15,254,229 // paddd %xmm13,%xmm12 .byte 102,65,15,114,244,16 // pslld $0x10,%xmm12 @@ -38565,7 +38855,7 @@ _sk_load_u16_be_sse2: .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1 .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0 - .byte 68,15,40,5,132,37,0,0 // movaps 0x2584(%rip),%xmm8 # 6fb0 <_sk_callback_sse2+0x10fd> + .byte 68,15,40,5,36,38,0,0 // movaps 0x2624(%rip),%xmm8 # 7050 <_sk_callback_sse2+0x10fc> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -38634,7 +38924,7 @@ _sk_load_rgb_u16_be_sse2: .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,65,15,97,200 // punpcklwd %xmm8,%xmm1 .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0 - .byte 68,15,40,13,115,36,0,0 // movaps 0x2473(%rip),%xmm9 # 6fc0 <_sk_callback_sse2+0x110d> + .byte 68,15,40,13,19,37,0,0 // movaps 0x2513(%rip),%xmm9 # 7060 <_sk_callback_sse2+0x110c> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -38651,7 +38941,7 @@ _sk_load_rgb_u16_be_sse2: .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,58,36,0,0 // movaps 0x243a(%rip),%xmm3 # 6fd0 <_sk_callback_sse2+0x111d> + .byte 15,40,29,218,36,0,0 // movaps 0x24da(%rip),%xmm3 # 7070 <_sk_callback_sse2+0x111c> .byte 255,224 // jmpq *%rax .byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2 .byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2 @@ -38680,7 +38970,7 @@ _sk_store_u16_be_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax - .byte 68,15,40,21,212,35,0,0 // movaps 0x23d4(%rip),%xmm10 # 6fe0 <_sk_callback_sse2+0x112d> + .byte 68,15,40,21,116,36,0,0 // movaps 0x2474(%rip),%xmm10 # 7080 <_sk_callback_sse2+0x112c> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,194 // mulps %xmm10,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 @@ -38910,7 +39200,7 @@ _sk_repeat_x_sse2: .byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10 .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,84,13,162,32,0,0 // andps 0x20a2(%rip),%xmm9 # 6ff0 <_sk_callback_sse2+0x113d> + .byte 68,15,84,13,66,33,0,0 // andps 0x2142(%rip),%xmm9 # 7090 <_sk_callback_sse2+0x113c> .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 .byte 69,15,89,208 // mulps %xmm8,%xmm10 @@ -38933,7 +39223,7 @@ _sk_repeat_y_sse2: .byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10 .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,84,13,99,32,0,0 // andps 0x2063(%rip),%xmm9 # 7000 <_sk_callback_sse2+0x114d> + .byte 68,15,84,13,3,33,0,0 // andps 0x2103(%rip),%xmm9 # 70a0 <_sk_callback_sse2+0x114c> .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 .byte 69,15,89,208 // mulps %xmm8,%xmm10 @@ -38956,13 +39246,13 @@ _sk_mirror_x_sse2: .byte 65,15,92,192 // subps %xmm8,%xmm0 .byte 243,69,15,88,201 // addss %xmm9,%xmm9 .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 - .byte 243,68,15,89,21,115,36,0,0 // mulss 0x2473(%rip),%xmm10 # 7460 <_sk_callback_sse2+0x15ad> + .byte 243,68,15,89,21,67,37,0,0 // mulss 0x2543(%rip),%xmm10 # 7530 <_sk_callback_sse2+0x15dc> .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 68,15,89,208 // mulps %xmm0,%xmm10 .byte 243,69,15,91,218 // cvttps2dq %xmm10,%xmm11 .byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11 .byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10 - .byte 68,15,84,21,4,32,0,0 // andps 0x2004(%rip),%xmm10 # 7010 <_sk_callback_sse2+0x115d> + .byte 68,15,84,21,164,32,0,0 // andps 0x20a4(%rip),%xmm10 # 70b0 <_sk_callback_sse2+0x115c> .byte 69,15,87,228 // xorps %xmm12,%xmm12 .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 69,15,89,217 // mulps %xmm9,%xmm11 @@ -38988,13 +39278,13 @@ _sk_mirror_y_sse2: .byte 65,15,92,200 // subps %xmm8,%xmm1 .byte 243,69,15,88,201 // addss %xmm9,%xmm9 .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 - .byte 243,68,15,89,21,253,35,0,0 // mulss 0x23fd(%rip),%xmm10 # 7464 <_sk_callback_sse2+0x15b1> + .byte 243,68,15,89,21,205,36,0,0 // mulss 0x24cd(%rip),%xmm10 # 7534 <_sk_callback_sse2+0x15e0> .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 68,15,89,209 // mulps %xmm1,%xmm10 .byte 243,69,15,91,218 // cvttps2dq %xmm10,%xmm11 .byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11 .byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10 - .byte 68,15,84,21,154,31,0,0 // andps 0x1f9a(%rip),%xmm10 # 7020 <_sk_callback_sse2+0x116d> + .byte 68,15,84,21,58,32,0,0 // andps 0x203a(%rip),%xmm10 # 70c0 <_sk_callback_sse2+0x116c> .byte 69,15,87,228 // xorps %xmm12,%xmm12 .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 69,15,89,217 // mulps %xmm9,%xmm11 @@ -39014,7 +39304,7 @@ FUNCTION(_sk_clamp_x_1_sse2) _sk_clamp_x_1_sse2: .byte 69,15,87,192 // xorps %xmm8,%xmm8 .byte 68,15,95,192 // maxps %xmm0,%xmm8 - .byte 68,15,93,5,108,31,0,0 // minps 0x1f6c(%rip),%xmm8 # 7030 <_sk_callback_sse2+0x117d> + .byte 68,15,93,5,12,32,0,0 // minps 0x200c(%rip),%xmm8 # 70d0 <_sk_callback_sse2+0x117c> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -39027,7 +39317,7 @@ _sk_repeat_x_1_sse2: .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9 - .byte 68,15,84,13,90,31,0,0 // andps 0x1f5a(%rip),%xmm9 # 7040 <_sk_callback_sse2+0x118d> + .byte 68,15,84,13,250,31,0,0 // andps 0x1ffa(%rip),%xmm9 # 70e0 <_sk_callback_sse2+0x118c> .byte 69,15,92,193 // subps %xmm9,%xmm8 .byte 65,15,92,192 // subps %xmm8,%xmm0 .byte 72,173 // lods %ds:(%rsi),%rax @@ -39037,14 +39327,14 @@ HIDDEN _sk_mirror_x_1_sse2 .globl _sk_mirror_x_1_sse2 FUNCTION(_sk_mirror_x_1_sse2) _sk_mirror_x_1_sse2: - .byte 68,15,40,5,86,31,0,0 // movaps 0x1f56(%rip),%xmm8 # 7050 <_sk_callback_sse2+0x119d> + .byte 68,15,40,5,246,31,0,0 // movaps 0x1ff6(%rip),%xmm8 # 70f0 <_sk_callback_sse2+0x119c> .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,13,90,31,0,0 // movaps 0x1f5a(%rip),%xmm9 # 7060 <_sk_callback_sse2+0x11ad> + .byte 68,15,40,13,250,31,0,0 // movaps 0x1ffa(%rip),%xmm9 # 7100 <_sk_callback_sse2+0x11ac> .byte 68,15,89,200 // mulps %xmm0,%xmm9 .byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10 .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,84,13,80,31,0,0 // andps 0x1f50(%rip),%xmm9 # 7070 <_sk_callback_sse2+0x11bd> + .byte 68,15,84,13,240,31,0,0 // andps 0x1ff0(%rip),%xmm9 # 7110 <_sk_callback_sse2+0x11bc> .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,88,210 // addps %xmm10,%xmm10 @@ -39060,10 +39350,10 @@ HIDDEN _sk_luminance_to_alpha_sse2 FUNCTION(_sk_luminance_to_alpha_sse2) _sk_luminance_to_alpha_sse2: .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 15,89,5,54,31,0,0 // mulps 0x1f36(%rip),%xmm0 # 7080 <_sk_callback_sse2+0x11cd> - .byte 15,89,13,63,31,0,0 // mulps 0x1f3f(%rip),%xmm1 # 7090 <_sk_callback_sse2+0x11dd> + .byte 15,89,5,214,31,0,0 // mulps 0x1fd6(%rip),%xmm0 # 7120 <_sk_callback_sse2+0x11cc> + .byte 15,89,13,223,31,0,0 // mulps 0x1fdf(%rip),%xmm1 # 7130 <_sk_callback_sse2+0x11dc> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,29,69,31,0,0 // mulps 0x1f45(%rip),%xmm3 # 70a0 <_sk_callback_sse2+0x11ed> + .byte 15,89,29,229,31,0,0 // mulps 0x1fe5(%rip),%xmm3 # 7140 <_sk_callback_sse2+0x11ec> .byte 15,88,217 // addps %xmm1,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 @@ -39441,15 +39731,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse2 .globl _sk_gauss_a_to_rgba_sse2 FUNCTION(_sk_gauss_a_to_rgba_sse2) _sk_gauss_a_to_rgba_sse2: - .byte 15,40,5,120,25,0,0 // movaps 0x1978(%rip),%xmm0 # 70b0 <_sk_callback_sse2+0x11fd> + .byte 15,40,5,24,26,0,0 // movaps 0x1a18(%rip),%xmm0 # 7150 <_sk_callback_sse2+0x11fc> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,126,25,0,0 // addps 0x197e(%rip),%xmm0 # 70c0 <_sk_callback_sse2+0x120d> + .byte 15,88,5,30,26,0,0 // addps 0x1a1e(%rip),%xmm0 # 7160 <_sk_callback_sse2+0x120c> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,132,25,0,0 // addps 0x1984(%rip),%xmm0 # 70d0 <_sk_callback_sse2+0x121d> + .byte 15,88,5,36,26,0,0 // addps 0x1a24(%rip),%xmm0 # 7170 <_sk_callback_sse2+0x121c> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,138,25,0,0 // addps 0x198a(%rip),%xmm0 # 70e0 <_sk_callback_sse2+0x122d> + .byte 15,88,5,42,26,0,0 // addps 0x1a2a(%rip),%xmm0 # 7180 <_sk_callback_sse2+0x122c> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,144,25,0,0 // addps 0x1990(%rip),%xmm0 # 70f0 <_sk_callback_sse2+0x123d> + .byte 15,88,5,48,26,0,0 // addps 0x1a30(%rip),%xmm0 # 7190 <_sk_callback_sse2+0x123c> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 @@ -39472,7 +39762,7 @@ _sk_gradient_sse2: .byte 73,255,201 // dec %r9 .byte 72,131,195,4 // add $0x4,%rbx .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 15,40,21,105,25,0,0 // movaps 0x1969(%rip),%xmm2 # 7100 <_sk_callback_sse2+0x124d> + .byte 15,40,21,9,26,0,0 // movaps 0x1a09(%rip),%xmm2 # 71a0 <_sk_callback_sse2+0x124c> .byte 243,15,16,27 // movss (%rbx),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 @@ -39619,29 +39909,29 @@ _sk_xy_to_unit_angle_sse2: .byte 69,15,94,220 // divps %xmm12,%xmm11 .byte 69,15,40,227 // movaps %xmm11,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 - .byte 68,15,40,45,42,23,0,0 // movaps 0x172a(%rip),%xmm13 # 7110 <_sk_callback_sse2+0x125d> + .byte 68,15,40,45,202,23,0,0 // movaps 0x17ca(%rip),%xmm13 # 71b0 <_sk_callback_sse2+0x125c> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,46,23,0,0 // addps 0x172e(%rip),%xmm13 # 7120 <_sk_callback_sse2+0x126d> + .byte 68,15,88,45,206,23,0,0 // addps 0x17ce(%rip),%xmm13 # 71c0 <_sk_callback_sse2+0x126c> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,50,23,0,0 // addps 0x1732(%rip),%xmm13 # 7130 <_sk_callback_sse2+0x127d> + .byte 68,15,88,45,210,23,0,0 // addps 0x17d2(%rip),%xmm13 # 71d0 <_sk_callback_sse2+0x127c> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,54,23,0,0 // addps 0x1736(%rip),%xmm13 # 7140 <_sk_callback_sse2+0x128d> + .byte 68,15,88,45,214,23,0,0 // addps 0x17d6(%rip),%xmm13 # 71e0 <_sk_callback_sse2+0x128c> .byte 69,15,89,235 // mulps %xmm11,%xmm13 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,40,21,53,23,0,0 // movaps 0x1735(%rip),%xmm10 # 7150 <_sk_callback_sse2+0x129d> + .byte 68,15,40,21,213,23,0,0 // movaps 0x17d5(%rip),%xmm10 # 71f0 <_sk_callback_sse2+0x129c> .byte 69,15,92,213 // subps %xmm13,%xmm10 .byte 69,15,84,209 // andps %xmm9,%xmm10 .byte 69,15,85,205 // andnps %xmm13,%xmm9 .byte 69,15,86,202 // orps %xmm10,%xmm9 .byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8 - .byte 68,15,40,21,40,23,0,0 // movaps 0x1728(%rip),%xmm10 # 7160 <_sk_callback_sse2+0x12ad> + .byte 68,15,40,21,200,23,0,0 // movaps 0x17c8(%rip),%xmm10 # 7200 <_sk_callback_sse2+0x12ac> .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,84,208 // andps %xmm8,%xmm10 .byte 69,15,85,193 // andnps %xmm9,%xmm8 .byte 69,15,86,194 // orps %xmm10,%xmm8 .byte 68,15,40,201 // movaps %xmm1,%xmm9 .byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9 - .byte 68,15,40,21,23,23,0,0 // movaps 0x1717(%rip),%xmm10 # 7170 <_sk_callback_sse2+0x12bd> + .byte 68,15,40,21,183,23,0,0 // movaps 0x17b7(%rip),%xmm10 # 7210 <_sk_callback_sse2+0x12bc> .byte 69,15,92,208 // subps %xmm8,%xmm10 .byte 69,15,84,209 // andps %xmm9,%xmm10 .byte 69,15,85,200 // andnps %xmm8,%xmm9 @@ -39663,20 +39953,20 @@ _sk_xy_to_radius_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax -HIDDEN _sk_xy_to_2pt_conical_sse2 -.globl _sk_xy_to_2pt_conical_sse2 -FUNCTION(_sk_xy_to_2pt_conical_sse2) -_sk_xy_to_2pt_conical_sse2: +HIDDEN _sk_xy_to_2pt_conical_quadratic_sse2 +.globl _sk_xy_to_2pt_conical_quadratic_sse2 +FUNCTION(_sk_xy_to_2pt_conical_quadratic_sse2) +_sk_xy_to_2pt_conical_quadratic_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 243,68,15,16,16 // movss (%rax),%xmm10 - .byte 243,68,15,16,72,4 // movss 0x4(%rax),%xmm9 + .byte 243,68,15,16,80,32 // movss 0x20(%rax),%xmm10 + .byte 243,68,15,16,72,36 // movss 0x24(%rax),%xmm9 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 - .byte 243,68,15,16,88,8 // movss 0x8(%rax),%xmm11 - .byte 243,68,15,16,64,12 // movss 0xc(%rax),%xmm8 + .byte 243,68,15,16,88,40 // movss 0x28(%rax),%xmm11 + .byte 243,68,15,16,64,44 // movss 0x2c(%rax),%xmm8 .byte 243,69,15,89,195 // mulss %xmm11,%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 .byte 68,15,88,192 // addps %xmm0,%xmm8 - .byte 68,15,89,5,191,22,0,0 // mulps 0x16bf(%rip),%xmm8 # 7180 <_sk_callback_sse2+0x12cd> + .byte 68,15,89,5,94,23,0,0 // mulps 0x175e(%rip),%xmm8 # 7220 <_sk_callback_sse2+0x12cc> .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 @@ -39684,7 +39974,7 @@ _sk_xy_to_2pt_conical_sse2: .byte 243,69,15,89,219 // mulss %xmm11,%xmm11 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,92,227 // subps %xmm11,%xmm12 - .byte 68,15,89,21,170,22,0,0 // mulps 0x16aa(%rip),%xmm10 # 7190 <_sk_callback_sse2+0x12dd> + .byte 68,15,89,21,73,23,0,0 // mulps 0x1749(%rip),%xmm10 # 7230 <_sk_callback_sse2+0x12dc> .byte 69,15,89,212 // mulps %xmm12,%xmm10 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 @@ -39693,9 +39983,9 @@ _sk_xy_to_2pt_conical_sse2: .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 65,15,92,192 // subps %xmm8,%xmm0 - .byte 68,15,87,5,146,22,0,0 // xorps 0x1692(%rip),%xmm8 # 71a0 <_sk_callback_sse2+0x12ed> + .byte 68,15,87,5,49,23,0,0 // xorps 0x1731(%rip),%xmm8 # 7240 <_sk_callback_sse2+0x12ec> .byte 65,15,89,193 // mulps %xmm9,%xmm0 - .byte 68,15,40,29,150,22,0,0 // movaps 0x1696(%rip),%xmm11 # 71b0 <_sk_callback_sse2+0x12fd> + .byte 68,15,40,29,53,23,0,0 // movaps 0x1735(%rip),%xmm11 # 7250 <_sk_callback_sse2+0x12fc> .byte 65,15,89,195 // mulps %xmm11,%xmm0 .byte 69,15,92,194 // subps %xmm10,%xmm8 .byte 69,15,89,193 // mulps %xmm9,%xmm8 @@ -39704,12 +39994,61 @@ _sk_xy_to_2pt_conical_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax +HIDDEN _sk_xy_to_2pt_conical_linear_sse2 +.globl _sk_xy_to_2pt_conical_linear_sse2 +FUNCTION(_sk_xy_to_2pt_conical_linear_sse2) +_sk_xy_to_2pt_conical_linear_sse2: + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 243,68,15,16,64,40 // movss 0x28(%rax),%xmm8 + .byte 243,68,15,16,72,44 // movss 0x2c(%rax),%xmm9 + .byte 69,15,40,209 // movaps %xmm9,%xmm10 + .byte 243,69,15,89,208 // mulss %xmm8,%xmm10 + .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 + .byte 68,15,88,208 // addps %xmm0,%xmm10 + .byte 68,15,89,21,5,23,0,0 // mulps 0x1705(%rip),%xmm10 # 7260 <_sk_callback_sse2+0x130c> + .byte 15,89,192 // mulps %xmm0,%xmm0 + .byte 15,89,201 // mulps %xmm1,%xmm1 + .byte 15,88,200 // addps %xmm0,%xmm1 + .byte 65,15,40,192 // movaps %xmm8,%xmm0 + .byte 243,15,89,192 // mulss %xmm0,%xmm0 + .byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0 + .byte 15,92,200 // subps %xmm0,%xmm1 + .byte 15,87,13,246,22,0,0 // xorps 0x16f6(%rip),%xmm1 # 7270 <_sk_callback_sse2+0x131c> + .byte 65,15,94,202 // divps %xmm10,%xmm1 + .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 + .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 + .byte 68,15,89,201 // mulps %xmm1,%xmm9 + .byte 69,15,88,200 // addps %xmm8,%xmm9 + .byte 69,15,87,192 // xorps %xmm8,%xmm8 + .byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9 + .byte 68,15,194,193,3 // cmpunordps %xmm1,%xmm8 + .byte 69,15,86,193 // orps %xmm9,%xmm8 + .byte 68,15,85,5,214,22,0,0 // andnps 0x16d6(%rip),%xmm8 # 7280 <_sk_callback_sse2+0x132c> + .byte 68,15,17,0 // movups %xmm8,(%rax) + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 15,40,193 // movaps %xmm1,%xmm0 + .byte 65,15,40,200 // movaps %xmm8,%xmm1 + .byte 255,224 // jmpq *%rax + +HIDDEN _sk_vector_scale_sse2 +.globl _sk_vector_scale_sse2 +FUNCTION(_sk_vector_scale_sse2) +_sk_vector_scale_sse2: + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 68,15,16,0 // movups (%rax),%xmm8 + .byte 65,15,89,192 // mulps %xmm8,%xmm0 + .byte 65,15,89,200 // mulps %xmm8,%xmm1 + .byte 65,15,89,208 // mulps %xmm8,%xmm2 + .byte 65,15,89,216 // mulps %xmm8,%xmm3 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + HIDDEN _sk_save_xy_sse2 .globl _sk_save_xy_sse2 FUNCTION(_sk_save_xy_sse2) _sk_save_xy_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,132,22,0,0 // movaps 0x1684(%rip),%xmm8 # 71c0 <_sk_callback_sse2+0x130d> + .byte 68,15,40,5,179,22,0,0 // movaps 0x16b3(%rip),%xmm8 # 7290 <_sk_callback_sse2+0x133c> .byte 15,17,0 // movups %xmm0,(%rax) .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,88,200 // addps %xmm8,%xmm9 @@ -39717,7 +40056,7 @@ _sk_save_xy_sse2: .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,40,217 // movaps %xmm9,%xmm11 .byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11 - .byte 68,15,40,37,111,22,0,0 // movaps 0x166f(%rip),%xmm12 # 71d0 <_sk_callback_sse2+0x131d> + .byte 68,15,40,37,158,22,0,0 // movaps 0x169e(%rip),%xmm12 # 72a0 <_sk_callback_sse2+0x134c> .byte 69,15,84,220 // andps %xmm12,%xmm11 .byte 69,15,92,211 // subps %xmm11,%xmm10 .byte 69,15,92,202 // subps %xmm10,%xmm9 @@ -39764,8 +40103,8 @@ _sk_bilinear_nx_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,232,21,0,0 // addps 0x15e8(%rip),%xmm0 # 71e0 <_sk_callback_sse2+0x132d> - .byte 68,15,40,13,240,21,0,0 // movaps 0x15f0(%rip),%xmm9 # 71f0 <_sk_callback_sse2+0x133d> + .byte 15,88,5,23,22,0,0 // addps 0x1617(%rip),%xmm0 # 72b0 <_sk_callback_sse2+0x135c> + .byte 68,15,40,13,31,22,0,0 // movaps 0x161f(%rip),%xmm9 # 72c0 <_sk_callback_sse2+0x136c> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -39778,7 +40117,7 @@ _sk_bilinear_px_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,223,21,0,0 // addps 0x15df(%rip),%xmm0 # 7200 <_sk_callback_sse2+0x134d> + .byte 15,88,5,14,22,0,0 // addps 0x160e(%rip),%xmm0 # 72d0 <_sk_callback_sse2+0x137c> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -39790,8 +40129,8 @@ _sk_bilinear_ny_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,209,21,0,0 // addps 0x15d1(%rip),%xmm1 # 7210 <_sk_callback_sse2+0x135d> - .byte 68,15,40,13,217,21,0,0 // movaps 0x15d9(%rip),%xmm9 # 7220 <_sk_callback_sse2+0x136d> + .byte 15,88,13,0,22,0,0 // addps 0x1600(%rip),%xmm1 # 72e0 <_sk_callback_sse2+0x138c> + .byte 68,15,40,13,8,22,0,0 // movaps 0x1608(%rip),%xmm9 # 72f0 <_sk_callback_sse2+0x139c> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -39804,7 +40143,7 @@ _sk_bilinear_py_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,199,21,0,0 // addps 0x15c7(%rip),%xmm1 # 7230 <_sk_callback_sse2+0x137d> + .byte 15,88,13,246,21,0,0 // addps 0x15f6(%rip),%xmm1 # 7300 <_sk_callback_sse2+0x13ac> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -39816,13 +40155,13 @@ _sk_bicubic_n3x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,186,21,0,0 // addps 0x15ba(%rip),%xmm0 # 7240 <_sk_callback_sse2+0x138d> - .byte 68,15,40,13,194,21,0,0 // movaps 0x15c2(%rip),%xmm9 # 7250 <_sk_callback_sse2+0x139d> + .byte 15,88,5,233,21,0,0 // addps 0x15e9(%rip),%xmm0 # 7310 <_sk_callback_sse2+0x13bc> + .byte 68,15,40,13,241,21,0,0 // movaps 0x15f1(%rip),%xmm9 # 7320 <_sk_callback_sse2+0x13cc> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,190,21,0,0 // mulps 0x15be(%rip),%xmm9 # 7260 <_sk_callback_sse2+0x13ad> - .byte 68,15,88,13,198,21,0,0 // addps 0x15c6(%rip),%xmm9 # 7270 <_sk_callback_sse2+0x13bd> + .byte 68,15,89,13,237,21,0,0 // mulps 0x15ed(%rip),%xmm9 # 7330 <_sk_callback_sse2+0x13dc> + .byte 68,15,88,13,245,21,0,0 // addps 0x15f5(%rip),%xmm9 # 7340 <_sk_callback_sse2+0x13ec> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -39835,16 +40174,16 @@ _sk_bicubic_n1x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,181,21,0,0 // addps 0x15b5(%rip),%xmm0 # 7280 <_sk_callback_sse2+0x13cd> - .byte 68,15,40,13,189,21,0,0 // movaps 0x15bd(%rip),%xmm9 # 7290 <_sk_callback_sse2+0x13dd> + .byte 15,88,5,228,21,0,0 // addps 0x15e4(%rip),%xmm0 # 7350 <_sk_callback_sse2+0x13fc> + .byte 68,15,40,13,236,21,0,0 // movaps 0x15ec(%rip),%xmm9 # 7360 <_sk_callback_sse2+0x140c> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,193,21,0,0 // movaps 0x15c1(%rip),%xmm8 # 72a0 <_sk_callback_sse2+0x13ed> + .byte 68,15,40,5,240,21,0,0 // movaps 0x15f0(%rip),%xmm8 # 7370 <_sk_callback_sse2+0x141c> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,197,21,0,0 // addps 0x15c5(%rip),%xmm8 # 72b0 <_sk_callback_sse2+0x13fd> + .byte 68,15,88,5,244,21,0,0 // addps 0x15f4(%rip),%xmm8 # 7380 <_sk_callback_sse2+0x142c> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,201,21,0,0 // addps 0x15c9(%rip),%xmm8 # 72c0 <_sk_callback_sse2+0x140d> + .byte 68,15,88,5,248,21,0,0 // addps 0x15f8(%rip),%xmm8 # 7390 <_sk_callback_sse2+0x143c> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,205,21,0,0 // addps 0x15cd(%rip),%xmm8 # 72d0 <_sk_callback_sse2+0x141d> + .byte 68,15,88,5,252,21,0,0 // addps 0x15fc(%rip),%xmm8 # 73a0 <_sk_callback_sse2+0x144c> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -39854,17 +40193,17 @@ HIDDEN _sk_bicubic_p1x_sse2 FUNCTION(_sk_bicubic_p1x_sse2) _sk_bicubic_p1x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,199,21,0,0 // movaps 0x15c7(%rip),%xmm8 # 72e0 <_sk_callback_sse2+0x142d> + .byte 68,15,40,5,246,21,0,0 // movaps 0x15f6(%rip),%xmm8 # 73b0 <_sk_callback_sse2+0x145c> .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,21,195,21,0,0 // movaps 0x15c3(%rip),%xmm10 # 72f0 <_sk_callback_sse2+0x143d> + .byte 68,15,40,21,242,21,0,0 // movaps 0x15f2(%rip),%xmm10 # 73c0 <_sk_callback_sse2+0x146c> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,199,21,0,0 // addps 0x15c7(%rip),%xmm10 # 7300 <_sk_callback_sse2+0x144d> + .byte 68,15,88,21,246,21,0,0 // addps 0x15f6(%rip),%xmm10 # 73d0 <_sk_callback_sse2+0x147c> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,195,21,0,0 // addps 0x15c3(%rip),%xmm10 # 7310 <_sk_callback_sse2+0x145d> + .byte 68,15,88,21,242,21,0,0 // addps 0x15f2(%rip),%xmm10 # 73e0 <_sk_callback_sse2+0x148c> .byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -39876,11 +40215,11 @@ _sk_bicubic_p3x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,182,21,0,0 // addps 0x15b6(%rip),%xmm0 # 7320 <_sk_callback_sse2+0x146d> + .byte 15,88,5,229,21,0,0 // addps 0x15e5(%rip),%xmm0 # 73f0 <_sk_callback_sse2+0x149c> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,182,21,0,0 // mulps 0x15b6(%rip),%xmm8 # 7330 <_sk_callback_sse2+0x147d> - .byte 68,15,88,5,190,21,0,0 // addps 0x15be(%rip),%xmm8 # 7340 <_sk_callback_sse2+0x148d> + .byte 68,15,89,5,229,21,0,0 // mulps 0x15e5(%rip),%xmm8 # 7400 <_sk_callback_sse2+0x14ac> + .byte 68,15,88,5,237,21,0,0 // addps 0x15ed(%rip),%xmm8 # 7410 <_sk_callback_sse2+0x14bc> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -39893,13 +40232,13 @@ _sk_bicubic_n3y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,172,21,0,0 // addps 0x15ac(%rip),%xmm1 # 7350 <_sk_callback_sse2+0x149d> - .byte 68,15,40,13,180,21,0,0 // movaps 0x15b4(%rip),%xmm9 # 7360 <_sk_callback_sse2+0x14ad> + .byte 15,88,13,219,21,0,0 // addps 0x15db(%rip),%xmm1 # 7420 <_sk_callback_sse2+0x14cc> + .byte 68,15,40,13,227,21,0,0 // movaps 0x15e3(%rip),%xmm9 # 7430 <_sk_callback_sse2+0x14dc> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,176,21,0,0 // mulps 0x15b0(%rip),%xmm9 # 7370 <_sk_callback_sse2+0x14bd> - .byte 68,15,88,13,184,21,0,0 // addps 0x15b8(%rip),%xmm9 # 7380 <_sk_callback_sse2+0x14cd> + .byte 68,15,89,13,223,21,0,0 // mulps 0x15df(%rip),%xmm9 # 7440 <_sk_callback_sse2+0x14ec> + .byte 68,15,88,13,231,21,0,0 // addps 0x15e7(%rip),%xmm9 # 7450 <_sk_callback_sse2+0x14fc> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -39912,16 +40251,16 @@ _sk_bicubic_n1y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,166,21,0,0 // addps 0x15a6(%rip),%xmm1 # 7390 <_sk_callback_sse2+0x14dd> - .byte 68,15,40,13,174,21,0,0 // movaps 0x15ae(%rip),%xmm9 # 73a0 <_sk_callback_sse2+0x14ed> + .byte 15,88,13,213,21,0,0 // addps 0x15d5(%rip),%xmm1 # 7460 <_sk_callback_sse2+0x150c> + .byte 68,15,40,13,221,21,0,0 // movaps 0x15dd(%rip),%xmm9 # 7470 <_sk_callback_sse2+0x151c> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,178,21,0,0 // movaps 0x15b2(%rip),%xmm8 # 73b0 <_sk_callback_sse2+0x14fd> + .byte 68,15,40,5,225,21,0,0 // movaps 0x15e1(%rip),%xmm8 # 7480 <_sk_callback_sse2+0x152c> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,182,21,0,0 // addps 0x15b6(%rip),%xmm8 # 73c0 <_sk_callback_sse2+0x150d> + .byte 68,15,88,5,229,21,0,0 // addps 0x15e5(%rip),%xmm8 # 7490 <_sk_callback_sse2+0x153c> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,186,21,0,0 // addps 0x15ba(%rip),%xmm8 # 73d0 <_sk_callback_sse2+0x151d> + .byte 68,15,88,5,233,21,0,0 // addps 0x15e9(%rip),%xmm8 # 74a0 <_sk_callback_sse2+0x154c> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,190,21,0,0 // addps 0x15be(%rip),%xmm8 # 73e0 <_sk_callback_sse2+0x152d> + .byte 68,15,88,5,237,21,0,0 // addps 0x15ed(%rip),%xmm8 # 74b0 <_sk_callback_sse2+0x155c> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -39931,17 +40270,17 @@ HIDDEN _sk_bicubic_p1y_sse2 FUNCTION(_sk_bicubic_p1y_sse2) _sk_bicubic_p1y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,184,21,0,0 // movaps 0x15b8(%rip),%xmm8 # 73f0 <_sk_callback_sse2+0x153d> + .byte 68,15,40,5,231,21,0,0 // movaps 0x15e7(%rip),%xmm8 # 74c0 <_sk_callback_sse2+0x156c> .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9 .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 68,15,40,21,179,21,0,0 // movaps 0x15b3(%rip),%xmm10 # 7400 <_sk_callback_sse2+0x154d> + .byte 68,15,40,21,226,21,0,0 // movaps 0x15e2(%rip),%xmm10 # 74d0 <_sk_callback_sse2+0x157c> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,183,21,0,0 // addps 0x15b7(%rip),%xmm10 # 7410 <_sk_callback_sse2+0x155d> + .byte 68,15,88,21,230,21,0,0 // addps 0x15e6(%rip),%xmm10 # 74e0 <_sk_callback_sse2+0x158c> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,179,21,0,0 // addps 0x15b3(%rip),%xmm10 # 7420 <_sk_callback_sse2+0x156d> + .byte 68,15,88,21,226,21,0,0 // addps 0x15e2(%rip),%xmm10 # 74f0 <_sk_callback_sse2+0x159c> .byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -39953,11 +40292,11 @@ _sk_bicubic_p3y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,165,21,0,0 // addps 0x15a5(%rip),%xmm1 # 7430 <_sk_callback_sse2+0x157d> + .byte 15,88,13,212,21,0,0 // addps 0x15d4(%rip),%xmm1 # 7500 <_sk_callback_sse2+0x15ac> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,165,21,0,0 // mulps 0x15a5(%rip),%xmm8 # 7440 <_sk_callback_sse2+0x158d> - .byte 68,15,88,5,173,21,0,0 // addps 0x15ad(%rip),%xmm8 # 7450 <_sk_callback_sse2+0x159d> + .byte 68,15,89,5,212,21,0,0 // mulps 0x15d4(%rip),%xmm8 # 7510 <_sk_callback_sse2+0x15bc> + .byte 68,15,88,5,220,21,0,0 // addps 0x15dc(%rip),%xmm8 # 7520 <_sk_callback_sse2+0x15cc> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -40187,11 +40526,11 @@ BALIGN16 .byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%rdi) .byte 0,224 // add %ah,%al .byte 64,0,0 // add %al,(%rax) - .byte 224,64 // loopne 6188 <.literal16+0x1d8> + .byte 224,64 // loopne 6228 <.literal16+0x1d8> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 618c <.literal16+0x1dc> + .byte 224,64 // loopne 622c <.literal16+0x1dc> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 6190 <.literal16+0x1e0> + .byte 224,64 // loopne 6230 <.literal16+0x1e0> .byte 154 // (bad) .byte 153 // cltd .byte 153 // cltd @@ -40211,13 +40550,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 61b1 <.literal16+0x201> + .byte 71,225,61 // rex.RXB loope 6251 <.literal16+0x201> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 61b5 <.literal16+0x205> + .byte 71,225,61 // rex.RXB loope 6255 <.literal16+0x205> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 61b9 <.literal16+0x209> + .byte 71,225,61 // rex.RXB loope 6259 <.literal16+0x209> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 61bd <.literal16+0x20d> + .byte 71,225,61 // rex.RXB loope 625d <.literal16+0x20d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -40242,13 +40581,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 61f1 <.literal16+0x241> + .byte 71,225,61 // rex.RXB loope 6291 <.literal16+0x241> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 61f5 <.literal16+0x245> + .byte 71,225,61 // rex.RXB loope 6295 <.literal16+0x245> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 61f9 <.literal16+0x249> + .byte 71,225,61 // rex.RXB loope 6299 <.literal16+0x249> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 61fd <.literal16+0x24d> + .byte 71,225,61 // rex.RXB loope 629d <.literal16+0x24d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -40273,13 +40612,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 6231 <.literal16+0x281> + .byte 71,225,61 // rex.RXB loope 62d1 <.literal16+0x281> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 6235 <.literal16+0x285> + .byte 71,225,61 // rex.RXB loope 62d5 <.literal16+0x285> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 6239 <.literal16+0x289> + .byte 71,225,61 // rex.RXB loope 62d9 <.literal16+0x289> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 623d <.literal16+0x28d> + .byte 71,225,61 // rex.RXB loope 62dd <.literal16+0x28d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -40304,13 +40643,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 6271 <.literal16+0x2c1> + .byte 71,225,61 // rex.RXB loope 6311 <.literal16+0x2c1> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 6275 <.literal16+0x2c5> + .byte 71,225,61 // rex.RXB loope 6315 <.literal16+0x2c5> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 6279 <.literal16+0x2c9> + .byte 71,225,61 // rex.RXB loope 6319 <.literal16+0x2c9> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 627d <.literal16+0x2cd> + .byte 71,225,61 // rex.RXB loope 631d <.literal16+0x2cd> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -40331,11 +40670,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax) .byte 67,0,0 // rex.XB add %al,(%r8) - .byte 127,67 // jg 62bb <.literal16+0x30b> + .byte 127,67 // jg 635b <.literal16+0x30b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 62bf <.literal16+0x30f> + .byte 127,67 // jg 635f <.literal16+0x30f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 62c3 <.literal16+0x313> + .byte 127,67 // jg 6363 <.literal16+0x313> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -40622,13 +40961,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 6509 <.literal16+0x559> + .byte 224,7 // loopne 65a9 <.literal16+0x559> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 650d <.literal16+0x55d> + .byte 224,7 // loopne 65ad <.literal16+0x55d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6511 <.literal16+0x561> + .byte 224,7 // loopne 65b1 <.literal16+0x561> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6515 <.literal16+0x565> + .byte 224,7 // loopne 65b5 <.literal16+0x565> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -40693,11 +41032,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 65eb <.literal16+0x63b> + .byte 127,67 // jg 668b <.literal16+0x63b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 65ef <.literal16+0x63f> + .byte 127,67 // jg 668f <.literal16+0x63f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 65f3 <.literal16+0x643> + .byte 127,67 // jg 6693 <.literal16+0x643> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax) @@ -40712,16 +41051,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 65e4 <.literal16+0x634> + .byte 127,0 // jg 6684 <.literal16+0x634> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 65e8 <.literal16+0x638> + .byte 127,0 // jg 6688 <.literal16+0x638> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 65ec <.literal16+0x63c> + .byte 127,0 // jg 668c <.literal16+0x63c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 65f0 <.literal16+0x640> + .byte 127,0 // jg 6690 <.literal16+0x640> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -40730,7 +41069,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6675 <.literal16+0x6c5> + .byte 119,115 // ja 6715 <.literal16+0x6c5> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -40741,7 +41080,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 65d9 <.literal16+0x629> + .byte 117,191 // jne 6679 <.literal16+0x629> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -40753,7 +41092,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3a61a <_sk_callback_sse2+0xffffffffe9a34767> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3a6ba <_sk_callback_sse2+0xffffffffe9a34766> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -40807,16 +41146,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 66b4 <.literal16+0x704> + .byte 127,0 // jg 6754 <.literal16+0x704> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 66b8 <.literal16+0x708> + .byte 127,0 // jg 6758 <.literal16+0x708> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 66bc <.literal16+0x70c> + .byte 127,0 // jg 675c <.literal16+0x70c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 66c0 <.literal16+0x710> + .byte 127,0 // jg 6760 <.literal16+0x710> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -40825,7 +41164,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6745 <.literal16+0x795> + .byte 119,115 // ja 67e5 <.literal16+0x795> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -40836,7 +41175,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 66a9 <.literal16+0x6f9> + .byte 117,191 // jne 6749 <.literal16+0x6f9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -40848,7 +41187,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3a6ea <_sk_callback_sse2+0xffffffffe9a34837> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3a78a <_sk_callback_sse2+0xffffffffe9a34836> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -40902,16 +41241,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 6784 <.literal16+0x7d4> + .byte 127,0 // jg 6824 <.literal16+0x7d4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 6788 <.literal16+0x7d8> + .byte 127,0 // jg 6828 <.literal16+0x7d8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 678c <.literal16+0x7dc> + .byte 127,0 // jg 682c <.literal16+0x7dc> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 6790 <.literal16+0x7e0> + .byte 127,0 // jg 6830 <.literal16+0x7e0> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -40920,7 +41259,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6815 <.literal16+0x865> + .byte 119,115 // ja 68b5 <.literal16+0x865> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -40931,7 +41270,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 6779 <.literal16+0x7c9> + .byte 117,191 // jne 6819 <.literal16+0x7c9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -40943,7 +41282,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3a7ba <_sk_callback_sse2+0xffffffffe9a34907> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3a85a <_sk_callback_sse2+0xffffffffe9a34906> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -40997,16 +41336,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 6854 <.literal16+0x8a4> + .byte 127,0 // jg 68f4 <.literal16+0x8a4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 6858 <.literal16+0x8a8> + .byte 127,0 // jg 68f8 <.literal16+0x8a8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 685c <.literal16+0x8ac> + .byte 127,0 // jg 68fc <.literal16+0x8ac> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 6860 <.literal16+0x8b0> + .byte 127,0 // jg 6900 <.literal16+0x8b0> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -41015,7 +41354,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 68e5 <.literal16+0x935> + .byte 119,115 // ja 6985 <.literal16+0x935> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -41026,7 +41365,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 6849 <.literal16+0x899> + .byte 117,191 // jne 68e9 <.literal16+0x899> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -41038,7 +41377,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3a88a <_sk_callback_sse2+0xffffffffe9a349d7> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3a92a <_sk_callback_sse2+0xffffffffe9a349d6> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -41088,13 +41427,13 @@ BALIGN16 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 - .byte 127,67 // jg 6967 <.literal16+0x9b7> + .byte 127,67 // jg 6a07 <.literal16+0x9b7> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 696b <.literal16+0x9bb> + .byte 127,67 // jg 6a0b <.literal16+0x9bb> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 696f <.literal16+0x9bf> + .byte 127,67 // jg 6a0f <.literal16+0x9bf> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6973 <.literal16+0x9c3> + .byte 127,67 // jg 6a13 <.literal16+0x9c3> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -41141,16 +41480,16 @@ BALIGN16 .byte 128,3,62 // addb $0x3e,(%rbx) .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 69f3 <.literal16+0xa43> + .byte 118,63 // jbe 6a93 <.literal16+0xa43> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 69f7 <.literal16+0xa47> + .byte 118,63 // jbe 6a97 <.literal16+0xa47> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 69fb <.literal16+0xa4b> + .byte 118,63 // jbe 6a9b <.literal16+0xa4b> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 69ff <.literal16+0xa4f> + .byte 118,63 // jbe 6a9f <.literal16+0xa4f> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) @@ -41179,11 +41518,11 @@ BALIGN16 .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6a6b <.literal16+0xabb> + .byte 127,67 // jg 6b0b <.literal16+0xabb> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6a6f <.literal16+0xabf> + .byte 127,67 // jg 6b0f <.literal16+0xabf> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6a73 <.literal16+0xac3> + .byte 127,67 // jg 6b13 <.literal16+0xac3> .byte 255,0 // incl (%rax) .byte 0,0 // add %al,(%rax) .byte 255,0 // incl (%rax) @@ -41254,13 +41593,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 6b09 <.literal16+0xb59> + .byte 224,7 // loopne 6ba9 <.literal16+0xb59> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6b0d <.literal16+0xb5d> + .byte 224,7 // loopne 6bad <.literal16+0xb5d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6b11 <.literal16+0xb61> + .byte 224,7 // loopne 6bb1 <.literal16+0xb61> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6b15 <.literal16+0xb65> + .byte 224,7 // loopne 6bb5 <.literal16+0xb65> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -41306,13 +41645,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 6b79 <.literal16+0xbc9> + .byte 224,7 // loopne 6c19 <.literal16+0xbc9> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6b7d <.literal16+0xbcd> + .byte 224,7 // loopne 6c1d <.literal16+0xbcd> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6b81 <.literal16+0xbd1> + .byte 224,7 // loopne 6c21 <.literal16+0xbd1> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6b85 <.literal16+0xbd5> + .byte 224,7 // loopne 6c25 <.literal16+0xbd5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -41358,13 +41697,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 6be9 <.literal16+0xc39> + .byte 224,7 // loopne 6c89 <.literal16+0xc39> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6bed <.literal16+0xc3d> + .byte 224,7 // loopne 6c8d <.literal16+0xc3d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6bf1 <.literal16+0xc41> + .byte 224,7 // loopne 6c91 <.literal16+0xc41> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6bf5 <.literal16+0xc45> + .byte 224,7 // loopne 6c95 <.literal16+0xc45> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -41402,13 +41741,13 @@ BALIGN16 .byte 65,0,0 // add %al,(%r8) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 6c86 <.literal16+0xcd6> + .byte 124,66 // jl 6d26 <.literal16+0xcd6> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 6c8a <.literal16+0xcda> + .byte 124,66 // jl 6d2a <.literal16+0xcda> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 6c8e <.literal16+0xcde> + .byte 124,66 // jl 6d2e <.literal16+0xcde> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 6c92 <.literal16+0xce2> + .byte 124,66 // jl 6d32 <.literal16+0xce2> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 0,240 // add %dh,%al @@ -41542,13 +41881,13 @@ BALIGN16 .byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax) .byte 61,137,136,136,61 // cmp $0x3d888889,%eax .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 6e15 <.literal16+0xe65> + .byte 112,65 // jo 6eb5 <.literal16+0xe65> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 6e19 <.literal16+0xe69> + .byte 112,65 // jo 6eb9 <.literal16+0xe69> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 6e1d <.literal16+0xe6d> + .byte 112,65 // jo 6ebd <.literal16+0xe6d> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 6e21 <.literal16+0xe71> + .byte 112,65 // jo 6ec1 <.literal16+0xe71> .byte 255,0 // incl (%rax) .byte 0,0 // add %al,(%rax) .byte 255,0 // incl (%rax) @@ -41579,11 +41918,11 @@ BALIGN16 .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%rax) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6e8b <.literal16+0xedb> + .byte 127,67 // jg 6f2b <.literal16+0xedb> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6e8f <.literal16+0xedf> + .byte 127,67 // jg 6f2f <.literal16+0xedf> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6e93 <.literal16+0xee3> + .byte 127,67 // jg 6f33 <.literal16+0xee3> .byte 255,0 // incl (%rax) .byte 0,0 // add %al,(%rax) .byte 255,0 // incl (%rax) @@ -41614,11 +41953,11 @@ BALIGN16 .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%rax) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6efb <.literal16+0xf4b> + .byte 127,67 // jg 6f9b <.literal16+0xf4b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6eff <.literal16+0xf4f> + .byte 127,67 // jg 6f9f <.literal16+0xf4f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6f03 <.literal16+0xf53> + .byte 127,67 // jg 6fa3 <.literal16+0xf53> .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) .byte 0,0 // add %al,(%rax) .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) @@ -41714,13 +42053,13 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 255 // (bad) - .byte 127,71 // jg 702b <.literal16+0x107b> + .byte 127,71 // jg 70cb <.literal16+0x107b> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 702f <.literal16+0x107f> + .byte 127,71 // jg 70cf <.literal16+0x107f> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 7033 <.literal16+0x1083> + .byte 127,71 // jg 70d3 <.literal16+0x1083> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 7037 <.literal16+0x1087> + .byte 127,71 // jg 70d7 <.literal16+0x1087> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -41797,10 +42136,10 @@ BALIGN16 .byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax .byte 152 // cwtl .byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx) - .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc081ca <_sk_callback_sse2+0x2dc02317> + .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0826a <_sk_callback_sse2+0x2dc02316> .byte 17,192 // adc %eax,%eax .byte 45,16,17,192,18 // sub $0x12c01110,%eax - .byte 120,57 // js 70fc <.literal16+0x114c> + .byte 120,57 // js 719c <.literal16+0x114c> .byte 64,18,120,57 // adc 0x39(%rax),%dil .byte 64,18,120,57 // adc 0x39(%rax),%dil .byte 64,18,120,57 // adc 0x39(%rax),%dil @@ -41891,7 +42230,25 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) - .byte 0,63 // add %bh,(%rdi) + .byte 0,192 // add %al,%al + .byte 0,0 // add %al,(%rax) + .byte 0,192 // add %al,%al + .byte 0,0 // add %al,(%rax) + .byte 0,192 // add %al,%al + .byte 0,0 // add %al,(%rax) + .byte 0,192 // add %al,%al + .byte 0,0 // add %al,(%rax) + .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) + .byte 0,0 // add %al,(%rax) + .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) + .byte 0,0 // add %al,(%rax) + .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) + .byte 63 // (bad) + .byte 0,0 // add %al,(%rax) + .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,0 // add %al,(%rax) + .byte 63 // (bad) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -41951,11 +42308,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 7282 <.literal16+0x12d2> + .byte 62,114,28 // jb,pt 7352 <.literal16+0x1302> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 7286 <.literal16+0x12d6> + .byte 62,114,28 // jb,pt 7356 <.literal16+0x1306> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 728a <.literal16+0x12da> + .byte 62,114,28 // jb,pt 735a <.literal16+0x130a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -41999,7 +42356,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640115 <_sk_callback_sse2+0x3d63a262> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6401e5 <_sk_callback_sse2+0x3d63a291> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -42025,7 +42382,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640155 <_sk_callback_sse2+0x3d63a2a2> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640225 <_sk_callback_sse2+0x3d63a2d1> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -42034,13 +42391,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 734e <.literal16+0x139e> + .byte 114,28 // jb 741e <.literal16+0x13ce> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 7352 <.literal16+0x13a2> + .byte 62,114,28 // jb,pt 7422 <.literal16+0x13d2> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 7356 <.literal16+0x13a6> + .byte 62,114,28 // jb,pt 7426 <.literal16+0x13d6> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 735a <.literal16+0x13aa> + .byte 62,114,28 // jb,pt 742a <.literal16+0x13da> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -42061,11 +42418,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 7392 <.literal16+0x13e2> + .byte 62,114,28 // jb,pt 7462 <.literal16+0x1412> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 7396 <.literal16+0x13e6> + .byte 62,114,28 // jb,pt 7466 <.literal16+0x1416> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 739a <.literal16+0x13ea> + .byte 62,114,28 // jb,pt 746a <.literal16+0x141a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -42109,7 +42466,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640225 <_sk_callback_sse2+0x3d63a372> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6402f5 <_sk_callback_sse2+0x3d63a3a1> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -42135,7 +42492,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640265 <_sk_callback_sse2+0x3d63a3b2> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640335 <_sk_callback_sse2+0x3d63a3e1> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -42144,13 +42501,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 745e <.literal16+0x14ae> + .byte 114,28 // jb 752e <.literal16+0x14de> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 7462 <_sk_callback_sse2+0x15af> + .byte 62,114,28 // jb,pt 7532 <_sk_callback_sse2+0x15de> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 7466 <_sk_callback_sse2+0x15b3> + .byte 62,114,28 // jb,pt 7536 <_sk_callback_sse2+0x15e2> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 746a <_sk_callback_sse2+0x15b7> + .byte 62,114,28 // jb,pt 753a <_sk_callback_sse2+0x15e6> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -47014,7 +47371,7 @@ _sk_seed_shader_sse2: .byte 102,15,110,199 // movd %edi,%xmm0 .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0 .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 - .byte 15,40,145,244,140,0,0 // movaps 0x8cf4(%ecx),%xmm2 + .byte 15,40,145,52,142,0,0 // movaps 0x8e34(%ecx),%xmm2 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,16,0 // movups (%eax),%xmm0 .byte 15,88,193 // addps %xmm1,%xmm0 @@ -47036,7 +47393,7 @@ _sk_seed_shader_sse2: .byte 137,68,36,4 // mov %eax,0x4(%esp) .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 137,4,36 // mov %eax,(%esp) - .byte 15,40,145,4,141,0,0 // movaps 0x8d04(%ecx),%xmm2 + .byte 15,40,145,68,142,0,0 // movaps 0x8e44(%ecx),%xmm2 .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 255,19 // call *(%ebx) .byte 131,196,108 // add $0x6c,%esp @@ -47072,15 +47429,15 @@ _sk_dither_sse2: .byte 102,15,110,225 // movd %ecx,%xmm4 .byte 102,15,112,252,0 // pshufd $0x0,%xmm4,%xmm7 .byte 102,15,239,253 // pxor %xmm5,%xmm7 - .byte 102,15,111,182,117,140,0,0 // movdqa 0x8c75(%esi),%xmm6 + .byte 102,15,111,182,181,141,0,0 // movdqa 0x8db5(%esi),%xmm6 .byte 102,15,111,207 // movdqa %xmm7,%xmm1 .byte 102,15,219,206 // pand %xmm6,%xmm1 .byte 102,15,219,245 // pand %xmm5,%xmm6 - .byte 102,15,111,134,149,140,0,0 // movdqa 0x8c95(%esi),%xmm0 + .byte 102,15,111,134,213,141,0,0 // movdqa 0x8dd5(%esi),%xmm0 .byte 102,15,111,231 // movdqa %xmm7,%xmm4 .byte 102,15,219,224 // pand %xmm0,%xmm4 .byte 102,15,219,197 // pand %xmm5,%xmm0 - .byte 102,15,111,158,133,140,0,0 // movdqa 0x8c85(%esi),%xmm3 + .byte 102,15,111,158,197,141,0,0 // movdqa 0x8dc5(%esi),%xmm3 .byte 102,15,219,251 // pand %xmm3,%xmm7 .byte 102,15,219,235 // pand %xmm3,%xmm5 .byte 102,15,114,246,4 // pslld $0x4,%xmm6 @@ -47096,8 +47453,8 @@ _sk_dither_sse2: .byte 102,15,235,224 // por %xmm0,%xmm4 .byte 102,15,235,231 // por %xmm7,%xmm4 .byte 15,91,196 // cvtdq2ps %xmm4,%xmm0 - .byte 15,89,134,165,140,0,0 // mulps 0x8ca5(%esi),%xmm0 - .byte 15,88,134,181,140,0,0 // addps 0x8cb5(%esi),%xmm0 + .byte 15,89,134,229,141,0,0 // mulps 0x8de5(%esi),%xmm0 + .byte 15,88,134,245,141,0,0 // addps 0x8df5(%esi),%xmm0 .byte 139,55 // mov (%edi),%esi .byte 243,15,16,14 // movss (%esi),%xmm1 .byte 139,117,24 // mov 0x18(%ebp),%esi @@ -47330,7 +47687,7 @@ _sk_srcatop_sse2: .byte 88 // pop %eax .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0 .byte 15,89,208 // mulps %xmm0,%xmm2 - .byte 15,40,136,179,137,0,0 // movaps 0x89b3(%eax),%xmm1 + .byte 15,40,136,243,138,0,0 // movaps 0x8af3(%eax),%xmm1 .byte 15,92,203 // subps %xmm3,%xmm1 .byte 15,40,249 // movaps %xmm1,%xmm7 .byte 15,89,125,40 // mulps 0x28(%ebp),%xmm7 @@ -47391,7 +47748,7 @@ _sk_dstatop_sse2: .byte 88 // pop %eax .byte 15,40,245 // movaps %xmm5,%xmm6 .byte 15,89,117,40 // mulps 0x28(%ebp),%xmm6 - .byte 15,40,184,25,137,0,0 // movaps 0x8919(%eax),%xmm7 + .byte 15,40,184,89,138,0,0 // movaps 0x8a59(%eax),%xmm7 .byte 15,92,125,88 // subps 0x58(%ebp),%xmm7 .byte 15,89,199 // mulps %xmm7,%xmm0 .byte 15,88,198 // addps %xmm6,%xmm0 @@ -47537,7 +47894,7 @@ _sk_srcout_sse2: .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4 .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5 .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6 - .byte 15,40,184,181,135,0,0 // movaps 0x87b5(%eax),%xmm7 + .byte 15,40,184,245,136,0,0 // movaps 0x88f5(%eax),%xmm7 .byte 15,92,254 // subps %xmm6,%xmm7 .byte 15,89,199 // mulps %xmm7,%xmm0 .byte 15,89,207 // mulps %xmm7,%xmm1 @@ -47579,7 +47936,7 @@ _sk_dstout_sse2: .byte 139,85,16 // mov 0x10(%ebp),%edx .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 139,125,24 // mov 0x18(%ebp),%edi - .byte 15,40,160,77,135,0,0 // movaps 0x874d(%eax),%xmm4 + .byte 15,40,160,141,136,0,0 // movaps 0x888d(%eax),%xmm4 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5 .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6 @@ -47629,7 +47986,7 @@ _sk_srcover_sse2: .byte 232,0,0,0,0 // call 753 <_sk_srcover_sse2+0x17> .byte 88 // pop %eax .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5 - .byte 15,40,128,205,134,0,0 // movaps 0x86cd(%eax),%xmm0 + .byte 15,40,128,13,136,0,0 // movaps 0x880d(%eax),%xmm0 .byte 15,92,195 // subps %xmm3,%xmm0 .byte 15,40,248 // movaps %xmm0,%xmm7 .byte 15,89,253 // mulps %xmm5,%xmm7 @@ -47687,7 +48044,7 @@ _sk_dstover_sse2: .byte 139,77,16 // mov 0x10(%ebp),%ecx .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 139,125,24 // mov 0x18(%ebp),%edi - .byte 15,40,162,70,134,0,0 // movaps 0x8646(%edx),%xmm4 + .byte 15,40,162,134,135,0,0 // movaps 0x8786(%edx),%xmm4 .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5 .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6 @@ -47775,7 +48132,7 @@ _sk_multiply_sse2: .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 232,0,0,0,0 // call 8e0 <_sk_multiply_sse2+0x18> .byte 88 // pop %eax - .byte 15,40,144,96,133,0,0 // movaps 0x8560(%eax),%xmm2 + .byte 15,40,144,160,134,0,0 // movaps 0x86a0(%eax),%xmm2 .byte 15,40,250 // movaps %xmm2,%xmm7 .byte 15,92,125,88 // subps 0x58(%ebp),%xmm7 .byte 15,40,231 // movaps %xmm7,%xmm4 @@ -47951,7 +48308,7 @@ _sk_xor__sse2: .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) .byte 232,0,0,0,0 // call ac7 <_sk_xor__sse2+0x12> .byte 88 // pop %eax - .byte 15,40,176,137,131,0,0 // movaps 0x8389(%eax),%xmm6 + .byte 15,40,176,201,132,0,0 // movaps 0x84c9(%eax),%xmm6 .byte 15,40,254 // movaps %xmm6,%xmm7 .byte 15,92,125,88 // subps 0x58(%ebp),%xmm7 .byte 15,89,199 // mulps %xmm7,%xmm0 @@ -48037,7 +48394,7 @@ _sk_darken_sse2: .byte 15,92,226 // subps %xmm2,%xmm4 .byte 232,0,0,0,0 // call bc1 <_sk_darken_sse2+0x63> .byte 88 // pop %eax - .byte 15,40,144,159,130,0,0 // movaps 0x829f(%eax),%xmm2 + .byte 15,40,144,223,131,0,0 // movaps 0x83df(%eax),%xmm2 .byte 15,92,214 // subps %xmm6,%xmm2 .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5 .byte 15,89,213 // mulps %xmm5,%xmm2 @@ -48107,7 +48464,7 @@ _sk_lighten_sse2: .byte 15,92,226 // subps %xmm2,%xmm4 .byte 232,0,0,0,0 // call c86 <_sk_lighten_sse2+0x63> .byte 88 // pop %eax - .byte 15,40,144,234,129,0,0 // movaps 0x81ea(%eax),%xmm2 + .byte 15,40,144,42,131,0,0 // movaps 0x832a(%eax),%xmm2 .byte 15,92,214 // subps %xmm6,%xmm2 .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5 .byte 15,89,213 // mulps %xmm5,%xmm2 @@ -48180,7 +48537,7 @@ _sk_difference_sse2: .byte 15,92,226 // subps %xmm2,%xmm4 .byte 232,0,0,0,0 // call d54 <_sk_difference_sse2+0x6c> .byte 88 // pop %eax - .byte 15,40,144,44,129,0,0 // movaps 0x812c(%eax),%xmm2 + .byte 15,40,144,108,130,0,0 // movaps 0x826c(%eax),%xmm2 .byte 15,92,214 // subps %xmm6,%xmm2 .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5 .byte 15,89,213 // mulps %xmm5,%xmm2 @@ -48242,7 +48599,7 @@ _sk_exclusion_sse2: .byte 15,89,213 // mulps %xmm5,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 15,92,226 // subps %xmm2,%xmm4 - .byte 15,40,144,198,128,0,0 // movaps 0x80c6(%eax),%xmm2 + .byte 15,40,144,6,130,0,0 // movaps 0x8206(%eax),%xmm2 .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5 .byte 15,89,213 // mulps %xmm5,%xmm2 @@ -48298,7 +48655,7 @@ _sk_colorburn_sse2: .byte 15,40,196 // movaps %xmm4,%xmm0 .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,92,238 // subps %xmm6,%xmm5 - .byte 15,40,176,37,128,0,0 // movaps 0x8025(%eax),%xmm6 + .byte 15,40,176,101,129,0,0 // movaps 0x8165(%eax),%xmm6 .byte 15,40,230 // movaps %xmm6,%xmm4 .byte 15,92,224 // subps %xmm0,%xmm4 .byte 15,40,220 // movaps %xmm4,%xmm3 @@ -48441,7 +48798,7 @@ _sk_colordodge_sse2: .byte 15,94,212 // divps %xmm4,%xmm2 .byte 15,40,224 // movaps %xmm0,%xmm4 .byte 15,93,226 // minps %xmm2,%xmm4 - .byte 15,40,152,115,126,0,0 // movaps 0x7e73(%eax),%xmm3 + .byte 15,40,152,179,127,0,0 // movaps 0x7fb3(%eax),%xmm3 .byte 15,40,211 // movaps %xmm3,%xmm2 .byte 15,92,208 // subps %xmm0,%xmm2 .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp) @@ -48567,7 +48924,7 @@ _sk_hardlight_sse2: .byte 15,40,224 // movaps %xmm0,%xmm4 .byte 232,0,0,0,0 // call 11df <_sk_hardlight_sse2+0x1a> .byte 88 // pop %eax - .byte 15,40,176,225,124,0,0 // movaps 0x7ce1(%eax),%xmm6 + .byte 15,40,176,33,126,0,0 // movaps 0x7e21(%eax),%xmm6 .byte 15,40,206 // movaps %xmm6,%xmm1 .byte 15,92,77,88 // subps 0x58(%ebp),%xmm1 .byte 15,41,77,184 // movaps %xmm1,-0x48(%ebp) @@ -48694,7 +49051,7 @@ _sk_overlay_sse2: .byte 232,0,0,0,0 // call 136a <_sk_overlay_sse2+0x18> .byte 88 // pop %eax .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0 - .byte 15,40,144,102,123,0,0 // movaps 0x7b66(%eax),%xmm2 + .byte 15,40,144,166,124,0,0 // movaps 0x7ca6(%eax),%xmm2 .byte 15,40,234 // movaps %xmm2,%xmm5 .byte 15,92,232 // subps %xmm0,%xmm5 .byte 15,40,248 // movaps %xmm0,%xmm7 @@ -48838,17 +49195,17 @@ _sk_softlight_sse2: .byte 232,0,0,0,0 // call 1539 <_sk_softlight_sse2+0x51> .byte 88 // pop %eax .byte 15,40,233 // movaps %xmm1,%xmm5 - .byte 15,40,128,183,121,0,0 // movaps 0x79b7(%eax),%xmm0 + .byte 15,40,128,247,122,0,0 // movaps 0x7af7(%eax),%xmm0 .byte 15,41,133,120,255,255,255 // movaps %xmm0,-0x88(%ebp) .byte 15,88,232 // addps %xmm0,%xmm5 .byte 15,89,234 // mulps %xmm2,%xmm5 - .byte 15,40,184,167,121,0,0 // movaps 0x79a7(%eax),%xmm7 + .byte 15,40,184,231,122,0,0 // movaps 0x7ae7(%eax),%xmm7 .byte 15,41,125,216 // movaps %xmm7,-0x28(%ebp) .byte 15,92,249 // subps %xmm1,%xmm7 .byte 15,82,209 // rsqrtps %xmm1,%xmm2 .byte 15,83,242 // rcpps %xmm2,%xmm6 .byte 15,92,241 // subps %xmm1,%xmm6 - .byte 15,40,128,199,121,0,0 // movaps 0x79c7(%eax),%xmm0 + .byte 15,40,128,7,123,0,0 // movaps 0x7b07(%eax),%xmm0 .byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp) .byte 15,89,200 // mulps %xmm0,%xmm1 .byte 15,88,205 // addps %xmm5,%xmm1 @@ -49061,7 +49418,7 @@ _sk_hue_sse2: .byte 15,41,101,200 // movaps %xmm4,-0x38(%ebp) .byte 15,40,233 // movaps %xmm1,%xmm5 .byte 15,89,238 // mulps %xmm6,%xmm5 - .byte 15,40,184,54,119,0,0 // movaps 0x7736(%eax),%xmm7 + .byte 15,40,184,118,120,0,0 // movaps 0x7876(%eax),%xmm7 .byte 15,41,125,168 // movaps %xmm7,-0x58(%ebp) .byte 15,92,125,88 // subps 0x58(%ebp),%xmm7 .byte 15,89,199 // mulps %xmm7,%xmm0 @@ -49091,15 +49448,15 @@ _sk_hue_sse2: .byte 15,89,243 // mulps %xmm3,%xmm6 .byte 15,89,235 // mulps %xmm3,%xmm5 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,40,152,6,119,0,0 // movaps 0x7706(%eax),%xmm3 + .byte 15,40,152,70,120,0,0 // movaps 0x7846(%eax),%xmm3 .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1 .byte 15,89,203 // mulps %xmm3,%xmm1 - .byte 15,40,160,22,119,0,0 // movaps 0x7716(%eax),%xmm4 + .byte 15,40,160,86,120,0,0 // movaps 0x7856(%eax),%xmm4 .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7 .byte 15,89,252 // mulps %xmm4,%xmm7 .byte 15,88,249 // addps %xmm1,%xmm7 - .byte 15,40,152,38,119,0,0 // movaps 0x7726(%eax),%xmm3 + .byte 15,40,152,102,120,0,0 // movaps 0x7866(%eax),%xmm3 .byte 15,40,77,72 // movaps 0x48(%ebp),%xmm1 .byte 15,89,203 // mulps %xmm3,%xmm1 .byte 15,88,207 // addps %xmm7,%xmm1 @@ -49314,15 +49671,15 @@ _sk_saturation_sse2: .byte 15,89,254 // mulps %xmm6,%xmm7 .byte 232,0,0,0,0 // call 1b58 <_sk_saturation_sse2+0x8e> .byte 88 // pop %eax - .byte 15,40,176,248,115,0,0 // movaps 0x73f8(%eax),%xmm6 + .byte 15,40,176,56,117,0,0 // movaps 0x7538(%eax),%xmm6 .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 15,89,214 // mulps %xmm6,%xmm2 - .byte 15,40,160,8,116,0,0 // movaps 0x7408(%eax),%xmm4 + .byte 15,40,160,72,117,0,0 // movaps 0x7548(%eax),%xmm4 .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1 .byte 15,89,204 // mulps %xmm4,%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2 - .byte 15,89,144,24,116,0,0 // mulps 0x7418(%eax),%xmm2 + .byte 15,89,144,88,117,0,0 // mulps 0x7558(%eax),%xmm2 .byte 15,88,209 // addps %xmm1,%xmm2 .byte 15,94,232 // divps %xmm0,%xmm5 .byte 15,94,216 // divps %xmm0,%xmm3 @@ -49338,7 +49695,7 @@ _sk_saturation_sse2: .byte 15,89,252 // mulps %xmm4,%xmm7 .byte 15,88,249 // addps %xmm1,%xmm7 .byte 15,40,200 // movaps %xmm0,%xmm1 - .byte 15,89,136,24,116,0,0 // mulps 0x7418(%eax),%xmm1 + .byte 15,89,136,88,117,0,0 // mulps 0x7558(%eax),%xmm1 .byte 15,88,207 // addps %xmm7,%xmm1 .byte 15,89,85,216 // mulps -0x28(%ebp),%xmm2 .byte 15,92,209 // subps %xmm1,%xmm2 @@ -49358,7 +49715,7 @@ _sk_saturation_sse2: .byte 15,89,245 // mulps %xmm5,%xmm6 .byte 15,89,227 // mulps %xmm3,%xmm4 .byte 15,88,230 // addps %xmm6,%xmm4 - .byte 15,40,128,24,116,0,0 // movaps 0x7418(%eax),%xmm0 + .byte 15,40,128,88,117,0,0 // movaps 0x7558(%eax),%xmm0 .byte 15,89,194 // mulps %xmm2,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 .byte 15,41,69,136 // movaps %xmm0,-0x78(%ebp) @@ -49381,7 +49738,7 @@ _sk_saturation_sse2: .byte 15,40,224 // movaps %xmm0,%xmm4 .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0 .byte 15,89,200 // mulps %xmm0,%xmm1 - .byte 15,40,144,40,116,0,0 // movaps 0x7428(%eax),%xmm2 + .byte 15,40,144,104,117,0,0 // movaps 0x7568(%eax),%xmm2 .byte 15,41,85,152 // movaps %xmm2,-0x68(%ebp) .byte 15,92,212 // subps %xmm4,%xmm2 .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp) @@ -49511,15 +49868,15 @@ _sk_color_sse2: .byte 88 // pop %eax .byte 15,40,85,56 // movaps 0x38(%ebp),%xmm2 .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4 - .byte 15,40,152,177,113,0,0 // movaps 0x71b1(%eax),%xmm3 + .byte 15,40,152,241,114,0,0 // movaps 0x72f1(%eax),%xmm3 .byte 15,89,227 // mulps %xmm3,%xmm4 .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) - .byte 15,40,176,193,113,0,0 // movaps 0x71c1(%eax),%xmm6 + .byte 15,40,176,1,115,0,0 // movaps 0x7301(%eax),%xmm6 .byte 15,89,214 // mulps %xmm6,%xmm2 .byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp) .byte 15,88,212 // addps %xmm4,%xmm2 .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4 - .byte 15,40,184,209,113,0,0 // movaps 0x71d1(%eax),%xmm7 + .byte 15,40,184,17,115,0,0 // movaps 0x7311(%eax),%xmm7 .byte 15,41,189,56,255,255,255 // movaps %xmm7,-0xc8(%ebp) .byte 15,89,231 // mulps %xmm7,%xmm4 .byte 15,88,226 // addps %xmm2,%xmm4 @@ -49534,7 +49891,7 @@ _sk_color_sse2: .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 15,89,214 // mulps %xmm6,%xmm2 .byte 15,88,212 // addps %xmm4,%xmm2 - .byte 15,40,136,225,113,0,0 // movaps 0x71e1(%eax),%xmm1 + .byte 15,40,136,33,115,0,0 // movaps 0x7321(%eax),%xmm1 .byte 15,41,77,168 // movaps %xmm1,-0x58(%ebp) .byte 15,40,225 // movaps %xmm1,%xmm4 .byte 15,40,93,88 // movaps 0x58(%ebp),%xmm3 @@ -49715,17 +50072,17 @@ _sk_luminosity_sse2: .byte 15,40,216 // movaps %xmm0,%xmm3 .byte 232,0,0,0,0 // call 2092 <_sk_luminosity_sse2+0x1a> .byte 88 // pop %eax - .byte 15,40,160,62,111,0,0 // movaps 0x6f3e(%eax),%xmm4 + .byte 15,40,160,126,112,0,0 // movaps 0x707e(%eax),%xmm4 .byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp) .byte 15,40,211 // movaps %xmm3,%xmm2 .byte 15,89,212 // mulps %xmm4,%xmm2 - .byte 15,40,128,78,111,0,0 // movaps 0x6f4e(%eax),%xmm0 + .byte 15,40,128,142,112,0,0 // movaps 0x708e(%eax),%xmm0 .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp) .byte 15,40,225 // movaps %xmm1,%xmm4 .byte 15,89,224 // mulps %xmm0,%xmm4 .byte 15,88,226 // addps %xmm2,%xmm4 .byte 15,40,85,88 // movaps 0x58(%ebp),%xmm2 - .byte 15,40,184,110,111,0,0 // movaps 0x6f6e(%eax),%xmm7 + .byte 15,40,184,174,112,0,0 // movaps 0x70ae(%eax),%xmm7 .byte 15,41,125,152 // movaps %xmm7,-0x68(%ebp) .byte 15,92,250 // subps %xmm2,%xmm7 .byte 15,89,223 // mulps %xmm7,%xmm3 @@ -49735,7 +50092,7 @@ _sk_luminosity_sse2: .byte 15,89,253 // mulps %xmm5,%xmm7 .byte 15,41,189,120,255,255,255 // movaps %xmm7,-0x88(%ebp) .byte 15,40,205 // movaps %xmm5,%xmm1 - .byte 15,40,128,94,111,0,0 // movaps 0x6f5e(%eax),%xmm0 + .byte 15,40,128,158,112,0,0 // movaps 0x709e(%eax),%xmm0 .byte 15,89,200 // mulps %xmm0,%xmm1 .byte 15,88,204 // addps %xmm4,%xmm1 .byte 15,40,238 // movaps %xmm6,%xmm5 @@ -49920,7 +50277,7 @@ _sk_srcover_rgba_8888_sse2: .byte 133,210 // test %edx,%edx .byte 15,133,40,1,0,0 // jne 2464 <_sk_srcover_rgba_8888_sse2+0x15d> .byte 243,15,111,12,142 // movdqu (%esi,%ecx,4),%xmm1 - .byte 102,15,111,135,234,108,0,0 // movdqa 0x6cea(%edi),%xmm0 + .byte 102,15,111,135,42,110,0,0 // movdqa 0x6e2a(%edi),%xmm0 .byte 102,15,111,225 // movdqa %xmm1,%xmm4 .byte 102,15,219,224 // pand %xmm0,%xmm4 .byte 102,15,111,249 // movdqa %xmm1,%xmm7 @@ -49930,9 +50287,9 @@ _sk_srcover_rgba_8888_sse2: .byte 102,15,114,213,16 // psrld $0x10,%xmm5 .byte 102,15,219,232 // pand %xmm0,%xmm5 .byte 15,91,244 // cvtdq2ps %xmm4,%xmm6 - .byte 15,40,167,250,108,0,0 // movaps 0x6cfa(%edi),%xmm4 + .byte 15,40,167,58,110,0,0 // movaps 0x6e3a(%edi),%xmm4 .byte 15,92,227 // subps %xmm3,%xmm4 - .byte 15,40,135,10,109,0,0 // movaps 0x6d0a(%edi),%xmm0 + .byte 15,40,135,74,110,0,0 // movaps 0x6e4a(%edi),%xmm0 .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp) .byte 15,40,85,200 // movaps -0x38(%ebp),%xmm2 .byte 15,89,208 // mulps %xmm0,%xmm2 @@ -50091,7 +50448,7 @@ _sk_clamp_1_sse2: .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4 .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5 .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6 - .byte 15,40,184,228,106,0,0 // movaps 0x6ae4(%eax),%xmm7 + .byte 15,40,184,36,108,0,0 // movaps 0x6c24(%eax),%xmm7 .byte 15,93,199 // minps %xmm7,%xmm0 .byte 15,93,207 // minps %xmm7,%xmm1 .byte 15,93,215 // minps %xmm7,%xmm2 @@ -50136,7 +50493,7 @@ _sk_clamp_a_sse2: .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5 .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6 .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7 - .byte 15,93,152,127,106,0,0 // minps 0x6a7f(%eax),%xmm3 + .byte 15,93,152,191,107,0,0 // minps 0x6bbf(%eax),%xmm3 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 15,93,195 // minps %xmm3,%xmm0 .byte 15,93,203 // minps %xmm3,%xmm1 @@ -50176,7 +50533,7 @@ _sk_clamp_a_dst_sse2: .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 139,125,24 // mov 0x18(%ebp),%edi .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4 - .byte 15,93,160,29,106,0,0 // minps 0x6a1d(%eax),%xmm4 + .byte 15,93,160,93,107,0,0 // minps 0x6b5d(%eax),%xmm4 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5 .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6 @@ -50415,7 +50772,7 @@ _sk_unpremul_sse2: .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4 .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5 .byte 15,87,246 // xorps %xmm6,%xmm6 - .byte 15,40,185,208,103,0,0 // movaps 0x67d0(%ecx),%xmm7 + .byte 15,40,185,16,105,0,0 // movaps 0x6910(%ecx),%xmm7 .byte 15,94,251 // divps %xmm3,%xmm7 .byte 15,194,243,4 // cmpneqps %xmm3,%xmm6 .byte 15,84,247 // andps %xmm7,%xmm6 @@ -50461,19 +50818,19 @@ _sk_from_srgb_sse2: .byte 88 // pop %eax .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,89,219 // mulps %xmm3,%xmm3 - .byte 15,40,160,97,103,0,0 // movaps 0x6761(%eax),%xmm4 + .byte 15,40,160,161,104,0,0 // movaps 0x68a1(%eax),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 - .byte 15,40,136,113,103,0,0 // movaps 0x6771(%eax),%xmm1 + .byte 15,40,136,177,104,0,0 // movaps 0x68b1(%eax),%xmm1 .byte 15,41,77,200 // movaps %xmm1,-0x38(%ebp) .byte 15,88,193 // addps %xmm1,%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,40,152,81,103,0,0 // movaps 0x6751(%eax),%xmm3 + .byte 15,40,152,145,104,0,0 // movaps 0x6891(%eax),%xmm3 .byte 15,40,202 // movaps %xmm2,%xmm1 .byte 15,89,203 // mulps %xmm3,%xmm1 - .byte 15,40,184,129,103,0,0 // movaps 0x6781(%eax),%xmm7 + .byte 15,40,184,193,104,0,0 // movaps 0x68c1(%eax),%xmm7 .byte 15,41,125,216 // movaps %xmm7,-0x28(%ebp) .byte 15,88,199 // addps %xmm7,%xmm0 - .byte 15,40,184,145,103,0,0 // movaps 0x6791(%eax),%xmm7 + .byte 15,40,184,209,104,0,0 // movaps 0x68d1(%eax),%xmm7 .byte 15,194,215,1 // cmpltps %xmm7,%xmm2 .byte 15,84,202 // andps %xmm2,%xmm1 .byte 15,85,208 // andnps %xmm0,%xmm2 @@ -50552,19 +50909,19 @@ _sk_from_srgb_dst_sse2: .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1 .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 - .byte 15,40,168,142,102,0,0 // movaps 0x668e(%eax),%xmm5 + .byte 15,40,168,206,103,0,0 // movaps 0x67ce(%eax),%xmm5 .byte 15,40,249 // movaps %xmm1,%xmm7 .byte 15,89,253 // mulps %xmm5,%xmm7 - .byte 15,40,144,158,102,0,0 // movaps 0x669e(%eax),%xmm2 + .byte 15,40,144,222,103,0,0 // movaps 0x67de(%eax),%xmm2 .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp) .byte 15,88,250 // addps %xmm2,%xmm7 .byte 15,89,248 // mulps %xmm0,%xmm7 - .byte 15,40,176,126,102,0,0 // movaps 0x667e(%eax),%xmm6 + .byte 15,40,176,190,103,0,0 // movaps 0x67be(%eax),%xmm6 .byte 15,40,225 // movaps %xmm1,%xmm4 .byte 15,89,230 // mulps %xmm6,%xmm4 - .byte 15,40,152,174,102,0,0 // movaps 0x66ae(%eax),%xmm3 + .byte 15,40,152,238,103,0,0 // movaps 0x67ee(%eax),%xmm3 .byte 15,88,251 // addps %xmm3,%xmm7 - .byte 15,40,144,190,102,0,0 // movaps 0x66be(%eax),%xmm2 + .byte 15,40,144,254,103,0,0 // movaps 0x67fe(%eax),%xmm2 .byte 15,194,202,1 // cmpltps %xmm2,%xmm1 .byte 15,84,225 // andps %xmm1,%xmm4 .byte 15,85,207 // andnps %xmm7,%xmm1 @@ -50640,25 +50997,25 @@ _sk_to_srgb_sse2: .byte 232,0,0,0,0 // call 2b72 <_sk_to_srgb_sse2+0x1e> .byte 88 // pop %eax .byte 15,82,218 // rsqrtps %xmm2,%xmm3 - .byte 15,40,160,190,101,0,0 // movaps 0x65be(%eax),%xmm4 + .byte 15,40,160,254,102,0,0 // movaps 0x66fe(%eax),%xmm4 .byte 15,40,235 // movaps %xmm3,%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 - .byte 15,40,128,206,101,0,0 // movaps 0x65ce(%eax),%xmm0 + .byte 15,40,128,14,103,0,0 // movaps 0x670e(%eax),%xmm0 .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp) .byte 15,88,232 // addps %xmm0,%xmm5 .byte 15,89,235 // mulps %xmm3,%xmm5 - .byte 15,40,128,222,101,0,0 // movaps 0x65de(%eax),%xmm0 + .byte 15,40,128,30,103,0,0 // movaps 0x671e(%eax),%xmm0 .byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp) .byte 15,88,232 // addps %xmm0,%xmm5 - .byte 15,40,128,238,101,0,0 // movaps 0x65ee(%eax),%xmm0 + .byte 15,40,128,46,103,0,0 // movaps 0x672e(%eax),%xmm0 .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp) .byte 15,88,216 // addps %xmm0,%xmm3 .byte 15,83,195 // rcpps %xmm3,%xmm0 .byte 15,89,197 // mulps %xmm5,%xmm0 - .byte 15,40,168,174,101,0,0 // movaps 0x65ae(%eax),%xmm5 + .byte 15,40,168,238,102,0,0 // movaps 0x66ee(%eax),%xmm5 .byte 15,40,202 // movaps %xmm2,%xmm1 .byte 15,89,205 // mulps %xmm5,%xmm1 - .byte 15,40,152,254,101,0,0 // movaps 0x65fe(%eax),%xmm3 + .byte 15,40,152,62,103,0,0 // movaps 0x673e(%eax),%xmm3 .byte 15,194,211,1 // cmpltps %xmm3,%xmm2 .byte 15,84,202 // andps %xmm2,%xmm1 .byte 15,85,208 // andnps %xmm0,%xmm2 @@ -50747,13 +51104,13 @@ _sk_rgb_to_hsl_sse2: .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 15,92,199 // subps %xmm7,%xmm0 .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp) - .byte 15,40,152,207,100,0,0 // movaps 0x64cf(%eax),%xmm3 + .byte 15,40,152,15,102,0,0 // movaps 0x660f(%eax),%xmm3 .byte 15,94,216 // divps %xmm0,%xmm3 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 15,92,194 // subps %xmm2,%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 .byte 15,194,234,1 // cmpltps %xmm2,%xmm5 - .byte 15,84,168,223,100,0,0 // andps 0x64df(%eax),%xmm5 + .byte 15,84,168,31,102,0,0 // andps 0x661f(%eax),%xmm5 .byte 15,88,232 // addps %xmm0,%xmm5 .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 15,194,196,0 // cmpeqps %xmm4,%xmm0 @@ -50763,9 +51120,9 @@ _sk_rgb_to_hsl_sse2: .byte 15,92,101,216 // subps -0x28(%ebp),%xmm4 .byte 15,89,211 // mulps %xmm3,%xmm2 .byte 15,89,227 // mulps %xmm3,%xmm4 - .byte 15,40,152,239,100,0,0 // movaps 0x64ef(%eax),%xmm3 + .byte 15,40,152,47,102,0,0 // movaps 0x662f(%eax),%xmm3 .byte 15,88,211 // addps %xmm3,%xmm2 - .byte 15,88,160,255,100,0,0 // addps 0x64ff(%eax),%xmm4 + .byte 15,88,160,63,102,0,0 // addps 0x663f(%eax),%xmm4 .byte 15,84,214 // andps %xmm6,%xmm2 .byte 15,85,244 // andnps %xmm4,%xmm6 .byte 15,86,242 // orps %xmm2,%xmm6 @@ -50780,7 +51137,7 @@ _sk_rgb_to_hsl_sse2: .byte 15,194,231,4 // cmpneqps %xmm7,%xmm4 .byte 15,92,217 // subps %xmm1,%xmm3 .byte 15,88,207 // addps %xmm7,%xmm1 - .byte 15,40,168,31,101,0,0 // movaps 0x651f(%eax),%xmm5 + .byte 15,40,168,95,102,0,0 // movaps 0x665f(%eax),%xmm5 .byte 15,92,223 // subps %xmm7,%xmm3 .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 15,89,213 // mulps %xmm5,%xmm2 @@ -50793,7 +51150,7 @@ _sk_rgb_to_hsl_sse2: .byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1 .byte 15,94,205 // divps %xmm5,%xmm1 .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5 - .byte 15,89,128,15,101,0,0 // mulps 0x650f(%eax),%xmm0 + .byte 15,89,128,79,102,0,0 // mulps 0x664f(%eax),%xmm0 .byte 15,84,196 // andps %xmm4,%xmm0 .byte 15,84,204 // andps %xmm4,%xmm1 .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4 @@ -50831,7 +51188,7 @@ _sk_hsl_to_rgb_sse2: .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp) .byte 232,0,0,0,0 // call 2de6 <_sk_hsl_to_rgb_sse2+0x1c> .byte 88 // pop %eax - .byte 15,40,152,250,99,0,0 // movaps 0x63fa(%eax),%xmm3 + .byte 15,40,152,58,101,0,0 // movaps 0x653a(%eax),%xmm3 .byte 15,40,227 // movaps %xmm3,%xmm4 .byte 15,40,243 // movaps %xmm3,%xmm6 .byte 15,41,181,72,255,255,255 // movaps %xmm6,-0xb8(%ebp) @@ -50845,13 +51202,13 @@ _sk_hsl_to_rgb_sse2: .byte 15,84,236 // andps %xmm4,%xmm5 .byte 15,85,225 // andnps %xmm1,%xmm4 .byte 15,86,229 // orps %xmm5,%xmm4 - .byte 15,40,136,10,100,0,0 // movaps 0x640a(%eax),%xmm1 + .byte 15,40,136,74,101,0,0 // movaps 0x654a(%eax),%xmm1 .byte 15,88,200 // addps %xmm0,%xmm1 .byte 243,15,91,193 // cvttps2dq %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,217 // movaps %xmm1,%xmm3 .byte 15,194,216,1 // cmpltps %xmm0,%xmm3 - .byte 15,40,168,26,100,0,0 // movaps 0x641a(%eax),%xmm5 + .byte 15,40,168,90,101,0,0 // movaps 0x655a(%eax),%xmm5 .byte 15,41,173,104,255,255,255 // movaps %xmm5,-0x98(%ebp) .byte 15,84,221 // andps %xmm5,%xmm3 .byte 15,92,195 // subps %xmm3,%xmm0 @@ -50862,19 +51219,19 @@ _sk_hsl_to_rgb_sse2: .byte 15,41,101,184 // movaps %xmm4,-0x48(%ebp) .byte 15,88,237 // addps %xmm5,%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 - .byte 15,40,144,42,100,0,0 // movaps 0x642a(%eax),%xmm2 + .byte 15,40,144,106,101,0,0 // movaps 0x656a(%eax),%xmm2 .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp) .byte 15,194,209,2 // cmpleps %xmm1,%xmm2 .byte 15,92,229 // subps %xmm5,%xmm4 .byte 15,40,198 // movaps %xmm6,%xmm0 .byte 15,194,193,2 // cmpleps %xmm1,%xmm0 - .byte 15,40,176,90,100,0,0 // movaps 0x645a(%eax),%xmm6 + .byte 15,40,176,154,101,0,0 // movaps 0x659a(%eax),%xmm6 .byte 15,41,181,88,255,255,255 // movaps %xmm6,-0xa8(%ebp) .byte 15,194,241,2 // cmpleps %xmm1,%xmm6 - .byte 15,40,152,58,100,0,0 // movaps 0x643a(%eax),%xmm3 + .byte 15,40,152,122,101,0,0 // movaps 0x657a(%eax),%xmm3 .byte 15,41,93,152 // movaps %xmm3,-0x68(%ebp) .byte 15,89,203 // mulps %xmm3,%xmm1 - .byte 15,40,184,74,100,0,0 // movaps 0x644a(%eax),%xmm7 + .byte 15,40,184,138,101,0,0 // movaps 0x658a(%eax),%xmm7 .byte 15,41,125,136 // movaps %xmm7,-0x78(%ebp) .byte 15,92,249 // subps %xmm1,%xmm7 .byte 15,89,252 // mulps %xmm4,%xmm7 @@ -50899,18 +51256,18 @@ _sk_hsl_to_rgb_sse2: .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,202 // movaps %xmm2,%xmm1 .byte 15,194,200,1 // cmpltps %xmm0,%xmm1 - .byte 15,84,136,26,100,0,0 // andps 0x641a(%eax),%xmm1 + .byte 15,84,136,90,101,0,0 // andps 0x655a(%eax),%xmm1 .byte 15,92,193 // subps %xmm1,%xmm0 .byte 15,40,202 // movaps %xmm2,%xmm1 .byte 15,92,200 // subps %xmm0,%xmm1 - .byte 15,40,128,42,100,0,0 // movaps 0x642a(%eax),%xmm0 + .byte 15,40,128,106,101,0,0 // movaps 0x656a(%eax),%xmm0 .byte 15,194,193,2 // cmpleps %xmm1,%xmm0 - .byte 15,40,144,250,99,0,0 // movaps 0x63fa(%eax),%xmm2 + .byte 15,40,144,58,101,0,0 // movaps 0x653a(%eax),%xmm2 .byte 15,194,209,2 // cmpleps %xmm1,%xmm2 - .byte 15,40,152,90,100,0,0 // movaps 0x645a(%eax),%xmm3 + .byte 15,40,152,154,101,0,0 // movaps 0x659a(%eax),%xmm3 .byte 15,194,217,2 // cmpleps %xmm1,%xmm3 - .byte 15,89,136,58,100,0,0 // mulps 0x643a(%eax),%xmm1 - .byte 15,40,176,74,100,0,0 // movaps 0x644a(%eax),%xmm6 + .byte 15,89,136,122,101,0,0 // mulps 0x657a(%eax),%xmm1 + .byte 15,40,176,138,101,0,0 // movaps 0x658a(%eax),%xmm6 .byte 15,92,241 // subps %xmm1,%xmm6 .byte 15,89,244 // mulps %xmm4,%xmm6 .byte 15,88,245 // addps %xmm5,%xmm6 @@ -50930,7 +51287,7 @@ _sk_hsl_to_rgb_sse2: .byte 15,40,117,216 // movaps -0x28(%ebp),%xmm6 .byte 15,85,243 // andnps %xmm3,%xmm6 .byte 15,40,85,200 // movaps -0x38(%ebp),%xmm2 - .byte 15,88,144,106,100,0,0 // addps 0x646a(%eax),%xmm2 + .byte 15,88,144,170,101,0,0 // addps 0x65aa(%eax),%xmm2 .byte 243,15,91,194 // cvttps2dq %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,202 // movaps %xmm2,%xmm1 @@ -51070,9 +51427,9 @@ _sk_scale_u8_sse2: .byte 102,15,110,36,57 // movd (%ecx,%edi,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,219,163,116,97,0,0 // pand 0x6174(%ebx),%xmm4 + .byte 102,15,219,163,180,98,0,0 // pand 0x62b4(%ebx),%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,163,132,97,0,0 // mulps 0x6184(%ebx),%xmm4 + .byte 15,89,163,196,98,0,0 // mulps 0x62c4(%ebx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 15,89,204 // mulps %xmm4,%xmm1 .byte 15,89,212 // mulps %xmm4,%xmm2 @@ -51200,9 +51557,9 @@ _sk_lerp_u8_sse2: .byte 102,15,110,36,57 // movd (%ecx,%edi,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,219,163,13,96,0,0 // pand 0x600d(%ebx),%xmm4 + .byte 102,15,219,163,77,97,0,0 // pand 0x614d(%ebx),%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,163,29,96,0,0 // mulps 0x601d(%ebx),%xmm4 + .byte 15,89,163,93,97,0,0 // mulps 0x615d(%ebx),%xmm4 .byte 15,92,197 // subps %xmm5,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6 @@ -51286,17 +51643,17 @@ _sk_lerp_565_sse2: .byte 15,133,212,0,0,0 // jne 347c <_sk_lerp_565_sse2+0xfb> .byte 243,15,126,52,121 // movq (%ecx,%edi,2),%xmm6 .byte 102,15,97,240 // punpcklwd %xmm0,%xmm6 - .byte 102,15,111,163,17,95,0,0 // movdqa 0x5f11(%ebx),%xmm4 + .byte 102,15,111,163,81,96,0,0 // movdqa 0x6051(%ebx),%xmm4 .byte 102,15,219,230 // pand %xmm6,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,163,33,95,0,0 // mulps 0x5f21(%ebx),%xmm4 - .byte 102,15,111,187,49,95,0,0 // movdqa 0x5f31(%ebx),%xmm7 + .byte 15,89,163,97,96,0,0 // mulps 0x6061(%ebx),%xmm4 + .byte 102,15,111,187,113,96,0,0 // movdqa 0x6071(%ebx),%xmm7 .byte 102,15,219,254 // pand %xmm6,%xmm7 .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 - .byte 15,89,187,65,95,0,0 // mulps 0x5f41(%ebx),%xmm7 - .byte 102,15,219,179,81,95,0,0 // pand 0x5f51(%ebx),%xmm6 + .byte 15,89,187,129,96,0,0 // mulps 0x6081(%ebx),%xmm7 + .byte 102,15,219,179,145,96,0,0 // pand 0x6091(%ebx),%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,89,179,97,95,0,0 // mulps 0x5f61(%ebx),%xmm6 + .byte 15,89,179,161,96,0,0 // mulps 0x60a1(%ebx),%xmm6 .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5 .byte 15,92,197 // subps %xmm5,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 @@ -51384,7 +51741,7 @@ _sk_load_tables_sse2: .byte 139,58 // mov (%edx),%edi .byte 15,133,75,1,0,0 // jne 3642 <_sk_load_tables_sse2+0x16f> .byte 243,15,111,28,159 // movdqu (%edi,%ebx,4),%xmm3 - .byte 102,15,111,150,31,94,0,0 // movdqa 0x5e1f(%esi),%xmm2 + .byte 102,15,111,150,95,95,0,0 // movdqa 0x5f5f(%esi),%xmm2 .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1 @@ -51440,7 +51797,7 @@ _sk_load_tables_sse2: .byte 15,20,215 // unpcklps %xmm7,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,158,47,94,0,0 // mulps 0x5e2f(%esi),%xmm3 + .byte 15,89,158,111,95,0,0 // mulps 0x5f6f(%esi),%xmm3 .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 137,206 // mov %ecx,%esi .byte 141,78,8 // lea 0x8(%esi),%ecx @@ -51598,7 +51955,7 @@ _sk_load_tables_u16_be_sse2: .byte 243,15,126,93,208 // movq -0x30(%ebp),%xmm3 .byte 102,15,97,223 // punpcklwd %xmm7,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,159,146,92,0,0 // mulps 0x5c92(%edi),%xmm3 + .byte 15,89,159,210,93,0,0 // mulps 0x5dd2(%edi),%xmm3 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 137,193 // mov %eax,%ecx .byte 141,65,8 // lea 0x8(%ecx),%eax @@ -51767,7 +52124,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 137,4,36 // mov %eax,(%esp) .byte 139,69,240 // mov -0x10(%ebp),%eax - .byte 15,40,152,95,90,0,0 // movaps 0x5a5f(%eax),%xmm3 + .byte 15,40,152,159,91,0,0 // movaps 0x5b9f(%eax),%xmm3 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 255,81,4 // call *0x4(%ecx) .byte 131,196,124 // add $0x7c,%esp @@ -51810,7 +52167,7 @@ _sk_byte_tables_sse2: .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,8 // mov (%eax),%ecx - .byte 15,40,170,37,88,0,0 // movaps 0x5825(%edx),%xmm5 + .byte 15,40,170,101,89,0,0 // movaps 0x5965(%edx),%xmm5 .byte 15,89,197 // mulps %xmm5,%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 102,15,112,224,78 // pshufd $0x4e,%xmm0,%xmm4 @@ -51832,7 +52189,7 @@ _sk_byte_tables_sse2: .byte 102,15,196,192,0 // pinsrw $0x0,%eax,%xmm0 .byte 139,65,4 // mov 0x4(%ecx),%eax .byte 102,15,196,195,1 // pinsrw $0x1,%ebx,%xmm0 - .byte 15,40,162,53,88,0,0 // movaps 0x5835(%edx),%xmm4 + .byte 15,40,162,117,89,0,0 // movaps 0x5975(%edx),%xmm4 .byte 15,89,205 // mulps %xmm5,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 .byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6 @@ -51976,7 +52333,7 @@ _sk_byte_tables_rgb_sse2: .byte 102,15,196,199,0 // pinsrw $0x0,%edi,%xmm0 .byte 139,121,4 // mov 0x4(%ecx),%edi .byte 102,15,196,198,1 // pinsrw $0x1,%esi,%xmm0 - .byte 15,40,170,9,86,0,0 // movaps 0x5609(%edx),%xmm5 + .byte 15,40,170,73,87,0,0 // movaps 0x5749(%edx),%xmm5 .byte 15,89,204 // mulps %xmm4,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 .byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6 @@ -52320,15 +52677,15 @@ _sk_parametric_r_sse2: .byte 15,88,244 // addps %xmm4,%xmm6 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,91,230 // cvtdq2ps %xmm6,%xmm4 - .byte 15,89,166,16,82,0,0 // mulps 0x5210(%esi),%xmm4 - .byte 15,84,182,32,82,0,0 // andps 0x5220(%esi),%xmm6 - .byte 15,86,182,48,82,0,0 // orps 0x5230(%esi),%xmm6 - .byte 15,88,166,64,82,0,0 // addps 0x5240(%esi),%xmm4 - .byte 15,40,190,80,82,0,0 // movaps 0x5250(%esi),%xmm7 + .byte 15,89,166,80,83,0,0 // mulps 0x5350(%esi),%xmm4 + .byte 15,84,182,96,83,0,0 // andps 0x5360(%esi),%xmm6 + .byte 15,86,182,112,83,0,0 // orps 0x5370(%esi),%xmm6 + .byte 15,88,166,128,83,0,0 // addps 0x5380(%esi),%xmm4 + .byte 15,40,190,144,83,0,0 // movaps 0x5390(%esi),%xmm7 .byte 15,89,254 // mulps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 - .byte 15,88,182,96,82,0,0 // addps 0x5260(%esi),%xmm6 - .byte 15,40,190,112,82,0,0 // movaps 0x5270(%esi),%xmm7 + .byte 15,88,182,160,83,0,0 // addps 0x53a0(%esi),%xmm6 + .byte 15,40,190,176,83,0,0 // movaps 0x53b0(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 @@ -52336,21 +52693,21 @@ _sk_parametric_r_sse2: .byte 15,91,245 // cvtdq2ps %xmm5,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,194,254,1 // cmpltps %xmm6,%xmm7 - .byte 15,40,174,128,82,0,0 // movaps 0x5280(%esi),%xmm5 + .byte 15,40,174,192,83,0,0 // movaps 0x53c0(%esi),%xmm5 .byte 15,84,253 // andps %xmm5,%xmm7 .byte 15,92,247 // subps %xmm7,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,92,254 // subps %xmm6,%xmm7 - .byte 15,88,166,144,82,0,0 // addps 0x5290(%esi),%xmm4 - .byte 15,40,182,160,82,0,0 // movaps 0x52a0(%esi),%xmm6 + .byte 15,88,166,208,83,0,0 // addps 0x53d0(%esi),%xmm4 + .byte 15,40,182,224,83,0,0 // movaps 0x53e0(%esi),%xmm6 .byte 15,89,247 // mulps %xmm7,%xmm6 .byte 15,92,230 // subps %xmm6,%xmm4 - .byte 15,40,182,176,82,0,0 // movaps 0x52b0(%esi),%xmm6 + .byte 15,40,182,240,83,0,0 // movaps 0x53f0(%esi),%xmm6 .byte 15,92,247 // subps %xmm7,%xmm6 - .byte 15,40,190,192,82,0,0 // movaps 0x52c0(%esi),%xmm7 + .byte 15,40,190,0,84,0,0 // movaps 0x5400(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,88,252 // addps %xmm4,%xmm7 - .byte 15,89,190,208,82,0,0 // mulps 0x52d0(%esi),%xmm7 + .byte 15,89,190,16,84,0,0 // mulps 0x5410(%esi),%xmm7 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 243,15,16,103,16 // movss 0x10(%edi),%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 @@ -52419,15 +52776,15 @@ _sk_parametric_g_sse2: .byte 15,88,244 // addps %xmm4,%xmm6 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,91,230 // cvtdq2ps %xmm6,%xmm4 - .byte 15,89,166,126,81,0,0 // mulps 0x517e(%esi),%xmm4 - .byte 15,84,182,142,81,0,0 // andps 0x518e(%esi),%xmm6 - .byte 15,86,182,158,81,0,0 // orps 0x519e(%esi),%xmm6 - .byte 15,88,166,174,81,0,0 // addps 0x51ae(%esi),%xmm4 - .byte 15,40,190,190,81,0,0 // movaps 0x51be(%esi),%xmm7 + .byte 15,89,166,190,82,0,0 // mulps 0x52be(%esi),%xmm4 + .byte 15,84,182,206,82,0,0 // andps 0x52ce(%esi),%xmm6 + .byte 15,86,182,222,82,0,0 // orps 0x52de(%esi),%xmm6 + .byte 15,88,166,238,82,0,0 // addps 0x52ee(%esi),%xmm4 + .byte 15,40,190,254,82,0,0 // movaps 0x52fe(%esi),%xmm7 .byte 15,89,254 // mulps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 - .byte 15,88,182,206,81,0,0 // addps 0x51ce(%esi),%xmm6 - .byte 15,40,190,222,81,0,0 // movaps 0x51de(%esi),%xmm7 + .byte 15,88,182,14,83,0,0 // addps 0x530e(%esi),%xmm6 + .byte 15,40,190,30,83,0,0 // movaps 0x531e(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 @@ -52435,21 +52792,21 @@ _sk_parametric_g_sse2: .byte 15,91,245 // cvtdq2ps %xmm5,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,194,254,1 // cmpltps %xmm6,%xmm7 - .byte 15,40,174,238,81,0,0 // movaps 0x51ee(%esi),%xmm5 + .byte 15,40,174,46,83,0,0 // movaps 0x532e(%esi),%xmm5 .byte 15,84,253 // andps %xmm5,%xmm7 .byte 15,92,247 // subps %xmm7,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,92,254 // subps %xmm6,%xmm7 - .byte 15,88,166,254,81,0,0 // addps 0x51fe(%esi),%xmm4 - .byte 15,40,182,14,82,0,0 // movaps 0x520e(%esi),%xmm6 + .byte 15,88,166,62,83,0,0 // addps 0x533e(%esi),%xmm4 + .byte 15,40,182,78,83,0,0 // movaps 0x534e(%esi),%xmm6 .byte 15,89,247 // mulps %xmm7,%xmm6 .byte 15,92,230 // subps %xmm6,%xmm4 - .byte 15,40,182,30,82,0,0 // movaps 0x521e(%esi),%xmm6 + .byte 15,40,182,94,83,0,0 // movaps 0x535e(%esi),%xmm6 .byte 15,92,247 // subps %xmm7,%xmm6 - .byte 15,40,190,46,82,0,0 // movaps 0x522e(%esi),%xmm7 + .byte 15,40,190,110,83,0,0 // movaps 0x536e(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,88,252 // addps %xmm4,%xmm7 - .byte 15,89,190,62,82,0,0 // mulps 0x523e(%esi),%xmm7 + .byte 15,89,190,126,83,0,0 // mulps 0x537e(%esi),%xmm7 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 243,15,16,103,16 // movss 0x10(%edi),%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 @@ -52518,15 +52875,15 @@ _sk_parametric_b_sse2: .byte 15,88,244 // addps %xmm4,%xmm6 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,91,230 // cvtdq2ps %xmm6,%xmm4 - .byte 15,89,166,236,80,0,0 // mulps 0x50ec(%esi),%xmm4 - .byte 15,84,182,252,80,0,0 // andps 0x50fc(%esi),%xmm6 - .byte 15,86,182,12,81,0,0 // orps 0x510c(%esi),%xmm6 - .byte 15,88,166,28,81,0,0 // addps 0x511c(%esi),%xmm4 - .byte 15,40,190,44,81,0,0 // movaps 0x512c(%esi),%xmm7 + .byte 15,89,166,44,82,0,0 // mulps 0x522c(%esi),%xmm4 + .byte 15,84,182,60,82,0,0 // andps 0x523c(%esi),%xmm6 + .byte 15,86,182,76,82,0,0 // orps 0x524c(%esi),%xmm6 + .byte 15,88,166,92,82,0,0 // addps 0x525c(%esi),%xmm4 + .byte 15,40,190,108,82,0,0 // movaps 0x526c(%esi),%xmm7 .byte 15,89,254 // mulps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 - .byte 15,88,182,60,81,0,0 // addps 0x513c(%esi),%xmm6 - .byte 15,40,190,76,81,0,0 // movaps 0x514c(%esi),%xmm7 + .byte 15,88,182,124,82,0,0 // addps 0x527c(%esi),%xmm6 + .byte 15,40,190,140,82,0,0 // movaps 0x528c(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 @@ -52534,21 +52891,21 @@ _sk_parametric_b_sse2: .byte 15,91,245 // cvtdq2ps %xmm5,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,194,254,1 // cmpltps %xmm6,%xmm7 - .byte 15,40,174,92,81,0,0 // movaps 0x515c(%esi),%xmm5 + .byte 15,40,174,156,82,0,0 // movaps 0x529c(%esi),%xmm5 .byte 15,84,253 // andps %xmm5,%xmm7 .byte 15,92,247 // subps %xmm7,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,92,254 // subps %xmm6,%xmm7 - .byte 15,88,166,108,81,0,0 // addps 0x516c(%esi),%xmm4 - .byte 15,40,182,124,81,0,0 // movaps 0x517c(%esi),%xmm6 + .byte 15,88,166,172,82,0,0 // addps 0x52ac(%esi),%xmm4 + .byte 15,40,182,188,82,0,0 // movaps 0x52bc(%esi),%xmm6 .byte 15,89,247 // mulps %xmm7,%xmm6 .byte 15,92,230 // subps %xmm6,%xmm4 - .byte 15,40,182,140,81,0,0 // movaps 0x518c(%esi),%xmm6 + .byte 15,40,182,204,82,0,0 // movaps 0x52cc(%esi),%xmm6 .byte 15,92,247 // subps %xmm7,%xmm6 - .byte 15,40,190,156,81,0,0 // movaps 0x519c(%esi),%xmm7 + .byte 15,40,190,220,82,0,0 // movaps 0x52dc(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,88,252 // addps %xmm4,%xmm7 - .byte 15,89,190,172,81,0,0 // mulps 0x51ac(%esi),%xmm7 + .byte 15,89,190,236,82,0,0 // mulps 0x52ec(%esi),%xmm7 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 243,15,16,103,16 // movss 0x10(%edi),%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 @@ -52617,15 +52974,15 @@ _sk_parametric_a_sse2: .byte 15,88,244 // addps %xmm4,%xmm6 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,91,230 // cvtdq2ps %xmm6,%xmm4 - .byte 15,89,166,90,80,0,0 // mulps 0x505a(%esi),%xmm4 - .byte 15,84,182,106,80,0,0 // andps 0x506a(%esi),%xmm6 - .byte 15,86,182,122,80,0,0 // orps 0x507a(%esi),%xmm6 - .byte 15,88,166,138,80,0,0 // addps 0x508a(%esi),%xmm4 - .byte 15,40,190,154,80,0,0 // movaps 0x509a(%esi),%xmm7 + .byte 15,89,166,154,81,0,0 // mulps 0x519a(%esi),%xmm4 + .byte 15,84,182,170,81,0,0 // andps 0x51aa(%esi),%xmm6 + .byte 15,86,182,186,81,0,0 // orps 0x51ba(%esi),%xmm6 + .byte 15,88,166,202,81,0,0 // addps 0x51ca(%esi),%xmm4 + .byte 15,40,190,218,81,0,0 // movaps 0x51da(%esi),%xmm7 .byte 15,89,254 // mulps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 - .byte 15,88,182,170,80,0,0 // addps 0x50aa(%esi),%xmm6 - .byte 15,40,190,186,80,0,0 // movaps 0x50ba(%esi),%xmm7 + .byte 15,88,182,234,81,0,0 // addps 0x51ea(%esi),%xmm6 + .byte 15,40,190,250,81,0,0 // movaps 0x51fa(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 @@ -52633,21 +52990,21 @@ _sk_parametric_a_sse2: .byte 15,91,245 // cvtdq2ps %xmm5,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,194,254,1 // cmpltps %xmm6,%xmm7 - .byte 15,40,174,202,80,0,0 // movaps 0x50ca(%esi),%xmm5 + .byte 15,40,174,10,82,0,0 // movaps 0x520a(%esi),%xmm5 .byte 15,84,253 // andps %xmm5,%xmm7 .byte 15,92,247 // subps %xmm7,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,92,254 // subps %xmm6,%xmm7 - .byte 15,88,166,218,80,0,0 // addps 0x50da(%esi),%xmm4 - .byte 15,40,182,234,80,0,0 // movaps 0x50ea(%esi),%xmm6 + .byte 15,88,166,26,82,0,0 // addps 0x521a(%esi),%xmm4 + .byte 15,40,182,42,82,0,0 // movaps 0x522a(%esi),%xmm6 .byte 15,89,247 // mulps %xmm7,%xmm6 .byte 15,92,230 // subps %xmm6,%xmm4 - .byte 15,40,182,250,80,0,0 // movaps 0x50fa(%esi),%xmm6 + .byte 15,40,182,58,82,0,0 // movaps 0x523a(%esi),%xmm6 .byte 15,92,247 // subps %xmm7,%xmm6 - .byte 15,40,190,10,81,0,0 // movaps 0x510a(%esi),%xmm7 + .byte 15,40,190,74,82,0,0 // movaps 0x524a(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,88,252 // addps %xmm4,%xmm7 - .byte 15,89,190,26,81,0,0 // mulps 0x511a(%esi),%xmm7 + .byte 15,89,190,90,82,0,0 // mulps 0x525a(%esi),%xmm7 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 243,15,16,103,16 // movss 0x10(%edi),%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 @@ -52706,29 +53063,29 @@ _sk_lab_to_xyz_sse2: .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 232,0,0,0,0 // call 46f2 <_sk_lab_to_xyz_sse2+0x18> .byte 88 // pop %eax - .byte 15,89,144,190,79,0,0 // mulps 0x4fbe(%eax),%xmm2 - .byte 15,40,160,206,79,0,0 // movaps 0x4fce(%eax),%xmm4 + .byte 15,89,144,254,80,0,0 // mulps 0x50fe(%eax),%xmm2 + .byte 15,40,160,14,81,0,0 // movaps 0x510e(%eax),%xmm4 .byte 15,89,204 // mulps %xmm4,%xmm1 - .byte 15,40,168,222,79,0,0 // movaps 0x4fde(%eax),%xmm5 + .byte 15,40,168,30,81,0,0 // movaps 0x511e(%eax),%xmm5 .byte 15,88,205 // addps %xmm5,%xmm1 .byte 15,89,220 // mulps %xmm4,%xmm3 .byte 15,88,221 // addps %xmm5,%xmm3 - .byte 15,88,144,238,79,0,0 // addps 0x4fee(%eax),%xmm2 - .byte 15,89,144,254,79,0,0 // mulps 0x4ffe(%eax),%xmm2 - .byte 15,89,136,14,80,0,0 // mulps 0x500e(%eax),%xmm1 + .byte 15,88,144,46,81,0,0 // addps 0x512e(%eax),%xmm2 + .byte 15,89,144,62,81,0,0 // mulps 0x513e(%eax),%xmm2 + .byte 15,89,136,78,81,0,0 // mulps 0x514e(%eax),%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 - .byte 15,89,152,30,80,0,0 // mulps 0x501e(%eax),%xmm3 + .byte 15,89,152,94,81,0,0 // mulps 0x515e(%eax),%xmm3 .byte 15,40,234 // movaps %xmm2,%xmm5 .byte 15,92,235 // subps %xmm3,%xmm5 .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 15,89,193 // mulps %xmm1,%xmm0 - .byte 15,40,152,46,80,0,0 // movaps 0x502e(%eax),%xmm3 + .byte 15,40,152,110,81,0,0 // movaps 0x516e(%eax),%xmm3 .byte 15,40,227 // movaps %xmm3,%xmm4 .byte 15,194,224,1 // cmpltps %xmm0,%xmm4 - .byte 15,40,176,62,80,0,0 // movaps 0x503e(%eax),%xmm6 + .byte 15,40,176,126,81,0,0 // movaps 0x517e(%eax),%xmm6 .byte 15,88,206 // addps %xmm6,%xmm1 - .byte 15,40,184,78,80,0,0 // movaps 0x504e(%eax),%xmm7 + .byte 15,40,184,142,81,0,0 // movaps 0x518e(%eax),%xmm7 .byte 15,89,207 // mulps %xmm7,%xmm1 .byte 15,84,196 // andps %xmm4,%xmm0 .byte 15,85,225 // andnps %xmm1,%xmm4 @@ -52760,8 +53117,8 @@ _sk_lab_to_xyz_sse2: .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5 .byte 15,86,216 // orps %xmm0,%xmm3 .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0 - .byte 15,89,160,94,80,0,0 // mulps 0x505e(%eax),%xmm4 - .byte 15,89,152,110,80,0,0 // mulps 0x506e(%eax),%xmm3 + .byte 15,89,160,158,81,0,0 // mulps 0x519e(%eax),%xmm4 + .byte 15,89,152,174,81,0,0 // mulps 0x51ae(%eax),%xmm3 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 141,88,4 // lea 0x4(%eax),%ebx .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp) @@ -52811,9 +53168,9 @@ _sk_load_a8_sse2: .byte 102,15,110,28,25 // movd (%ecx,%ebx,1),%xmm3 .byte 102,15,96,216 // punpcklbw %xmm0,%xmm3 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,219,158,79,79,0,0 // pand 0x4f4f(%esi),%xmm3 + .byte 102,15,219,158,143,80,0,0 // pand 0x508f(%esi),%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,158,95,79,0,0 // mulps 0x4f5f(%esi),%xmm3 + .byte 15,89,158,159,80,0,0 // mulps 0x509f(%esi),%xmm3 .byte 141,72,8 // lea 0x8(%eax),%ecx .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp) .byte 15,41,84,36,64 // movaps %xmm2,0x40(%esp) @@ -52883,10 +53240,10 @@ _sk_load_a8_dst_sse2: .byte 102,15,110,36,57 // movd (%ecx,%edi,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,219,163,127,78,0,0 // pand 0x4e7f(%ebx),%xmm4 + .byte 102,15,219,163,191,79,0,0 // pand 0x4fbf(%ebx),%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 .byte 102,15,87,237 // xorpd %xmm5,%xmm5 - .byte 15,89,163,143,78,0,0 // mulps 0x4e8f(%ebx),%xmm4 + .byte 15,89,163,207,79,0,0 // mulps 0x4fcf(%ebx),%xmm4 .byte 141,72,8 // lea 0x8(%eax),%ecx .byte 102,15,41,108,36,64 // movapd %xmm5,0x40(%esp) .byte 102,15,41,108,36,48 // movapd %xmm5,0x30(%esp) @@ -52980,7 +53337,7 @@ _sk_gather_a8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,158,88,77,0,0 // mulps 0x4d58(%esi),%xmm3 + .byte 15,89,158,152,78,0,0 // mulps 0x4e98(%esi),%xmm3 .byte 139,117,24 // mov 0x18(%ebp),%esi .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0 .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1 @@ -53026,7 +53383,7 @@ _sk_store_a8_sse2: .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,48 // mov (%eax),%esi .byte 139,30 // mov (%esi),%ebx - .byte 15,40,161,215,76,0,0 // movaps 0x4cd7(%ecx),%xmm4 + .byte 15,40,161,23,78,0,0 // movaps 0x4e17(%ecx),%xmm4 .byte 15,89,227 // mulps %xmm3,%xmm4 .byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4 .byte 102,15,114,244,16 // pslld $0x10,%xmm4 @@ -53076,7 +53433,7 @@ _sk_store_a8_sse2: .byte 136,84,59,2 // mov %dl,0x2(%ebx,%edi,1) .byte 139,85,20 // mov 0x14(%ebp),%edx .byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4 - .byte 102,15,219,161,231,76,0,0 // pand 0x4ce7(%ecx),%xmm4 + .byte 102,15,219,161,39,78,0,0 // pand 0x4e27(%ecx),%xmm4 .byte 102,15,103,228 // packuswb %xmm4,%xmm4 .byte 102,15,103,228 // packuswb %xmm4,%xmm4 .byte 102,15,103,228 // packuswb %xmm4,%xmm4 @@ -53116,9 +53473,9 @@ _sk_load_g8_sse2: .byte 102,15,110,4,58 // movd (%edx,%edi,1),%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 - .byte 102,15,219,128,248,75,0,0 // pand 0x4bf8(%eax),%xmm0 + .byte 102,15,219,128,56,77,0,0 // pand 0x4d38(%eax),%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,128,8,76,0,0 // mulps 0x4c08(%eax),%xmm0 + .byte 15,89,128,72,77,0,0 // mulps 0x4d48(%eax),%xmm0 .byte 141,81,8 // lea 0x8(%ecx),%edx .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp) .byte 15,41,92,36,64 // movaps %xmm3,0x40(%esp) @@ -53130,7 +53487,7 @@ _sk_load_g8_sse2: .byte 137,84,36,4 // mov %edx,0x4(%esp) .byte 139,85,8 // mov 0x8(%ebp),%edx .byte 137,20,36 // mov %edx,(%esp) - .byte 15,40,152,24,76,0,0 // movaps 0x4c18(%eax),%xmm3 + .byte 15,40,152,88,77,0,0 // movaps 0x4d58(%eax),%xmm3 .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,81,4 // call *0x4(%ecx) @@ -53188,11 +53545,11 @@ _sk_load_g8_dst_sse2: .byte 102,15,110,36,25 // movd (%ecx,%ebx,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,219,166,55,75,0,0 // pand 0x4b37(%esi),%xmm4 + .byte 102,15,219,166,119,76,0,0 // pand 0x4c77(%esi),%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,166,71,75,0,0 // mulps 0x4b47(%esi),%xmm4 + .byte 15,89,166,135,76,0,0 // mulps 0x4c87(%esi),%xmm4 .byte 141,72,8 // lea 0x8(%eax),%ecx - .byte 15,40,174,87,75,0,0 // movaps 0x4b57(%esi),%xmm5 + .byte 15,40,174,151,76,0,0 // movaps 0x4c97(%esi),%xmm5 .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp) .byte 137,84,36,16 // mov %edx,0x10(%esp) .byte 137,124,36,12 // mov %edi,0xc(%esp) @@ -53288,7 +53645,7 @@ _sk_gather_g8_sse2: .byte 102,15,96,197 // punpcklbw %xmm5,%xmm0 .byte 102,15,97,197 // punpcklwd %xmm5,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,134,32,74,0,0 // mulps 0x4a20(%esi),%xmm0 + .byte 15,89,134,96,75,0,0 // mulps 0x4b60(%esi),%xmm0 .byte 139,93,24 // mov 0x18(%ebp),%ebx .byte 137,193 // mov %eax,%ecx .byte 141,65,8 // lea 0x8(%ecx),%eax @@ -53302,7 +53659,7 @@ _sk_gather_g8_sse2: .byte 137,68,36,4 // mov %eax,0x4(%esp) .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 137,4,36 // mov %eax,(%esp) - .byte 15,40,158,48,74,0,0 // movaps 0x4a30(%esi),%xmm3 + .byte 15,40,158,112,75,0,0 // movaps 0x4b70(%esi),%xmm3 .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,81,4 // call *0x4(%ecx) @@ -53385,11 +53742,11 @@ _sk_gather_i8_sse2: .byte 102,15,98,232 // punpckldq %xmm0,%xmm5 .byte 102,15,98,233 // punpckldq %xmm1,%xmm5 .byte 139,77,240 // mov -0x10(%ebp),%ecx - .byte 102,15,111,145,172,73,0,0 // movdqa 0x49ac(%ecx),%xmm2 + .byte 102,15,111,145,236,74,0,0 // movdqa 0x4aec(%ecx),%xmm2 .byte 102,15,111,197 // movdqa %xmm5,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,40,161,188,73,0,0 // movaps 0x49bc(%ecx),%xmm4 + .byte 15,40,161,252,74,0,0 // movaps 0x4afc(%ecx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 102,15,111,205 // movdqa %xmm5,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -53454,17 +53811,17 @@ _sk_load_565_sse2: .byte 15,133,134,0,0,0 // jne 50f0 <_sk_load_565_sse2+0xbd> .byte 243,15,126,20,122 // movq (%edx,%edi,2),%xmm2 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,128,63,72,0,0 // movdqa 0x483f(%eax),%xmm0 + .byte 102,15,111,128,127,73,0,0 // movdqa 0x497f(%eax),%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,128,79,72,0,0 // mulps 0x484f(%eax),%xmm0 - .byte 102,15,111,136,95,72,0,0 // movdqa 0x485f(%eax),%xmm1 + .byte 15,89,128,143,73,0,0 // mulps 0x498f(%eax),%xmm0 + .byte 102,15,111,136,159,73,0,0 // movdqa 0x499f(%eax),%xmm1 .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,136,111,72,0,0 // mulps 0x486f(%eax),%xmm1 - .byte 102,15,219,144,127,72,0,0 // pand 0x487f(%eax),%xmm2 + .byte 15,89,136,175,73,0,0 // mulps 0x49af(%eax),%xmm1 + .byte 102,15,219,144,191,73,0,0 // pand 0x49bf(%eax),%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,144,143,72,0,0 // mulps 0x488f(%eax),%xmm2 + .byte 15,89,144,207,73,0,0 // mulps 0x49cf(%eax),%xmm2 .byte 141,81,8 // lea 0x8(%ecx),%edx .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp) .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp) @@ -53476,7 +53833,7 @@ _sk_load_565_sse2: .byte 137,84,36,4 // mov %edx,0x4(%esp) .byte 139,85,8 // mov 0x8(%ebp),%edx .byte 137,20,36 // mov %edx,(%esp) - .byte 15,40,152,159,72,0,0 // movaps 0x489f(%eax),%xmm3 + .byte 15,40,152,223,73,0,0 // movaps 0x49df(%eax),%xmm3 .byte 255,81,4 // call *0x4(%ecx) .byte 131,196,108 // add $0x6c,%esp .byte 94 // pop %esi @@ -53529,19 +53886,19 @@ _sk_load_565_dst_sse2: .byte 15,133,134,0,0,0 // jne 51f4 <_sk_load_565_dst_sse2+0xad> .byte 243,15,126,36,89 // movq (%ecx,%ebx,2),%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,111,174,155,71,0,0 // movdqa 0x479b(%esi),%xmm5 + .byte 102,15,111,174,219,72,0,0 // movdqa 0x48db(%esi),%xmm5 .byte 102,15,219,236 // pand %xmm4,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,174,171,71,0,0 // mulps 0x47ab(%esi),%xmm5 - .byte 102,15,111,182,187,71,0,0 // movdqa 0x47bb(%esi),%xmm6 + .byte 15,89,174,235,72,0,0 // mulps 0x48eb(%esi),%xmm5 + .byte 102,15,111,182,251,72,0,0 // movdqa 0x48fb(%esi),%xmm6 .byte 102,15,219,244 // pand %xmm4,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,89,182,203,71,0,0 // mulps 0x47cb(%esi),%xmm6 - .byte 102,15,219,166,219,71,0,0 // pand 0x47db(%esi),%xmm4 + .byte 15,89,182,11,73,0,0 // mulps 0x490b(%esi),%xmm6 + .byte 102,15,219,166,27,73,0,0 // pand 0x491b(%esi),%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,166,235,71,0,0 // mulps 0x47eb(%esi),%xmm4 + .byte 15,89,166,43,73,0,0 // mulps 0x492b(%esi),%xmm4 .byte 141,72,8 // lea 0x8(%eax),%ecx - .byte 15,40,190,251,71,0,0 // movaps 0x47fb(%esi),%xmm7 + .byte 15,40,190,59,73,0,0 // movaps 0x493b(%esi),%xmm7 .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp) .byte 137,84,36,16 // mov %edx,0x10(%esp) .byte 137,124,36,12 // mov %edi,0xc(%esp) @@ -53629,17 +53986,17 @@ _sk_gather_565_sse2: .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,128,7,71,0,0 // movdqa 0x4707(%eax),%xmm0 + .byte 102,15,111,128,71,72,0,0 // movdqa 0x4847(%eax),%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,128,23,71,0,0 // mulps 0x4717(%eax),%xmm0 - .byte 102,15,111,136,39,71,0,0 // movdqa 0x4727(%eax),%xmm1 + .byte 15,89,128,87,72,0,0 // mulps 0x4857(%eax),%xmm0 + .byte 102,15,111,136,103,72,0,0 // movdqa 0x4867(%eax),%xmm1 .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,136,55,71,0,0 // mulps 0x4737(%eax),%xmm1 - .byte 102,15,219,144,71,71,0,0 // pand 0x4747(%eax),%xmm2 + .byte 15,89,136,119,72,0,0 // mulps 0x4877(%eax),%xmm1 + .byte 102,15,219,144,135,72,0,0 // pand 0x4887(%eax),%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,144,87,71,0,0 // mulps 0x4757(%eax),%xmm2 + .byte 15,89,144,151,72,0,0 // mulps 0x4897(%eax),%xmm2 .byte 139,93,24 // mov 0x18(%ebp),%ebx .byte 141,74,8 // lea 0x8(%edx),%ecx .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp) @@ -53652,7 +54009,7 @@ _sk_gather_565_sse2: .byte 137,76,36,4 // mov %ecx,0x4(%esp) .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 137,12,36 // mov %ecx,(%esp) - .byte 15,40,152,103,71,0,0 // movaps 0x4767(%eax),%xmm3 + .byte 15,40,152,167,72,0,0 // movaps 0x48a7(%eax),%xmm3 .byte 255,82,4 // call *0x4(%edx) .byte 131,196,108 // add $0x6c,%esp .byte 94 // pop %esi @@ -53673,12 +54030,12 @@ _sk_store_565_sse2: .byte 131,236,108 // sub $0x6c,%esp .byte 232,0,0,0,0 // call 537b <_sk_store_565_sse2+0xe> .byte 88 // pop %eax - .byte 15,40,160,85,70,0,0 // movaps 0x4655(%eax),%xmm4 + .byte 15,40,160,149,71,0,0 // movaps 0x4795(%eax),%xmm4 .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 .byte 102,15,91,237 // cvtps2dq %xmm5,%xmm5 .byte 102,15,114,245,11 // pslld $0xb,%xmm5 - .byte 15,40,176,101,70,0,0 // movaps 0x4665(%eax),%xmm6 + .byte 15,40,176,165,71,0,0 // movaps 0x47a5(%eax),%xmm6 .byte 15,89,241 // mulps %xmm1,%xmm6 .byte 102,15,91,246 // cvtps2dq %xmm6,%xmm6 .byte 102,15,114,246,5 // pslld $0x5,%xmm6 @@ -53772,21 +54129,21 @@ _sk_load_4444_sse2: .byte 15,133,149,0,0,0 // jne 554d <_sk_load_4444_sse2+0xcc> .byte 243,15,126,28,89 // movq (%ecx,%ebx,2),%xmm3 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,134,97,69,0,0 // movdqa 0x4561(%esi),%xmm0 + .byte 102,15,111,134,161,70,0,0 // movdqa 0x46a1(%esi),%xmm0 .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,134,113,69,0,0 // mulps 0x4571(%esi),%xmm0 - .byte 102,15,111,142,129,69,0,0 // movdqa 0x4581(%esi),%xmm1 + .byte 15,89,134,177,70,0,0 // mulps 0x46b1(%esi),%xmm0 + .byte 102,15,111,142,193,70,0,0 // movdqa 0x46c1(%esi),%xmm1 .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,142,145,69,0,0 // mulps 0x4591(%esi),%xmm1 - .byte 102,15,111,150,161,69,0,0 // movdqa 0x45a1(%esi),%xmm2 + .byte 15,89,142,209,70,0,0 // mulps 0x46d1(%esi),%xmm1 + .byte 102,15,111,150,225,70,0,0 // movdqa 0x46e1(%esi),%xmm2 .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,150,177,69,0,0 // mulps 0x45b1(%esi),%xmm2 - .byte 102,15,219,158,193,69,0,0 // pand 0x45c1(%esi),%xmm3 + .byte 15,89,150,241,70,0,0 // mulps 0x46f1(%esi),%xmm2 + .byte 102,15,219,158,1,71,0,0 // pand 0x4701(%esi),%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,158,209,69,0,0 // mulps 0x45d1(%esi),%xmm3 + .byte 15,89,158,17,71,0,0 // mulps 0x4711(%esi),%xmm3 .byte 141,72,8 // lea 0x8(%eax),%ecx .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp) .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp) @@ -53850,21 +54207,21 @@ _sk_load_4444_dst_sse2: .byte 15,133,149,0,0,0 // jne 5660 <_sk_load_4444_dst_sse2+0xbc> .byte 243,15,126,36,89 // movq (%ecx,%ebx,2),%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,111,175,190,68,0,0 // movdqa 0x44be(%edi),%xmm5 + .byte 102,15,111,175,254,69,0,0 // movdqa 0x45fe(%edi),%xmm5 .byte 102,15,219,236 // pand %xmm4,%xmm5 .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 - .byte 15,89,175,206,68,0,0 // mulps 0x44ce(%edi),%xmm5 - .byte 102,15,111,183,222,68,0,0 // movdqa 0x44de(%edi),%xmm6 + .byte 15,89,175,14,70,0,0 // mulps 0x460e(%edi),%xmm5 + .byte 102,15,111,183,30,70,0,0 // movdqa 0x461e(%edi),%xmm6 .byte 102,15,219,244 // pand %xmm4,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,89,183,238,68,0,0 // mulps 0x44ee(%edi),%xmm6 - .byte 102,15,111,191,254,68,0,0 // movdqa 0x44fe(%edi),%xmm7 + .byte 15,89,183,46,70,0,0 // mulps 0x462e(%edi),%xmm6 + .byte 102,15,111,191,62,70,0,0 // movdqa 0x463e(%edi),%xmm7 .byte 102,15,219,252 // pand %xmm4,%xmm7 .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 - .byte 15,89,191,14,69,0,0 // mulps 0x450e(%edi),%xmm7 - .byte 102,15,219,167,30,69,0,0 // pand 0x451e(%edi),%xmm4 + .byte 15,89,191,78,70,0,0 // mulps 0x464e(%edi),%xmm7 + .byte 102,15,219,167,94,70,0,0 // pand 0x465e(%edi),%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,167,46,69,0,0 // mulps 0x452e(%edi),%xmm4 + .byte 15,89,167,110,70,0,0 // mulps 0x466e(%edi),%xmm4 .byte 141,72,8 // lea 0x8(%eax),%ecx .byte 137,84,36,16 // mov %edx,0x10(%esp) .byte 137,116,36,12 // mov %esi,0xc(%esp) @@ -53950,21 +54307,21 @@ _sk_gather_4444_sse2: .byte 139,125,20 // mov 0x14(%ebp),%edi .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,130,43,68,0,0 // movdqa 0x442b(%edx),%xmm0 + .byte 102,15,111,130,107,69,0,0 // movdqa 0x456b(%edx),%xmm0 .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,130,59,68,0,0 // mulps 0x443b(%edx),%xmm0 - .byte 102,15,111,138,75,68,0,0 // movdqa 0x444b(%edx),%xmm1 + .byte 15,89,130,123,69,0,0 // mulps 0x457b(%edx),%xmm0 + .byte 102,15,111,138,139,69,0,0 // movdqa 0x458b(%edx),%xmm1 .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,138,91,68,0,0 // mulps 0x445b(%edx),%xmm1 - .byte 102,15,111,146,107,68,0,0 // movdqa 0x446b(%edx),%xmm2 + .byte 15,89,138,155,69,0,0 // mulps 0x459b(%edx),%xmm1 + .byte 102,15,111,146,171,69,0,0 // movdqa 0x45ab(%edx),%xmm2 .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,146,123,68,0,0 // mulps 0x447b(%edx),%xmm2 - .byte 102,15,219,154,139,68,0,0 // pand 0x448b(%edx),%xmm3 + .byte 15,89,146,187,69,0,0 // mulps 0x45bb(%edx),%xmm2 + .byte 102,15,219,154,203,69,0,0 // pand 0x45cb(%edx),%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,154,155,68,0,0 // mulps 0x449b(%edx),%xmm3 + .byte 15,89,154,219,69,0,0 // mulps 0x45db(%edx),%xmm3 .byte 139,85,24 // mov 0x18(%ebp),%edx .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4 .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5 @@ -54000,7 +54357,7 @@ _sk_store_4444_sse2: .byte 131,236,108 // sub $0x6c,%esp .byte 232,0,0,0,0 // call 57f6 <_sk_store_4444_sse2+0xe> .byte 88 // pop %eax - .byte 15,40,160,122,67,0,0 // movaps 0x437a(%eax),%xmm4 + .byte 15,40,160,186,68,0,0 // movaps 0x44ba(%eax),%xmm4 .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 .byte 102,15,91,237 // cvtps2dq %xmm5,%xmm5 @@ -54101,11 +54458,11 @@ _sk_load_8888_sse2: .byte 139,117,8 // mov 0x8(%ebp),%esi .byte 15,133,147,0,0,0 // jne 59cd <_sk_load_8888_sse2+0xc2> .byte 243,15,111,44,185 // movdqu (%ecx,%edi,4),%xmm5 - .byte 102,15,111,147,103,66,0,0 // movdqa 0x4267(%ebx),%xmm2 + .byte 102,15,111,147,167,67,0,0 // movdqa 0x43a7(%ebx),%xmm2 .byte 102,15,111,197 // movdqa %xmm5,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,40,163,119,66,0,0 // movaps 0x4277(%ebx),%xmm4 + .byte 15,40,163,183,67,0,0 // movaps 0x43b7(%ebx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 102,15,111,205 // movdqa %xmm5,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -54181,11 +54538,11 @@ _sk_load_8888_dst_sse2: .byte 139,117,8 // mov 0x8(%ebp),%esi .byte 15,133,150,0,0,0 // jne 5adc <_sk_load_8888_dst_sse2+0xc9> .byte 243,15,111,28,185 // movdqu (%ecx,%edi,4),%xmm3 - .byte 102,15,111,147,115,65,0,0 // movdqa 0x4173(%ebx),%xmm2 + .byte 102,15,111,147,179,66,0,0 // movdqa 0x42b3(%ebx),%xmm2 .byte 102,15,111,243 // movdqa %xmm3,%xmm6 .byte 102,15,219,242 // pand %xmm2,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,40,187,131,65,0,0 // movaps 0x4183(%ebx),%xmm7 + .byte 15,40,187,195,66,0,0 // movaps 0x42c3(%ebx),%xmm7 .byte 15,89,247 // mulps %xmm7,%xmm6 .byte 102,15,111,227 // movdqa %xmm3,%xmm4 .byte 102,15,114,212,8 // psrld $0x8,%xmm4 @@ -54278,8 +54635,8 @@ _sk_gather_8888_sse2: .byte 102,15,110,4,183 // movd (%edi,%esi,4),%xmm0 .byte 139,117,16 // mov 0x10(%ebp),%esi .byte 139,125,20 // mov 0x14(%ebp),%edi - .byte 102,15,111,162,144,64,0,0 // movdqa 0x4090(%edx),%xmm4 - .byte 15,40,170,160,64,0,0 // movaps 0x40a0(%edx),%xmm5 + .byte 102,15,111,162,208,65,0,0 // movdqa 0x41d0(%edx),%xmm4 + .byte 15,40,170,224,65,0,0 // movaps 0x41e0(%edx),%xmm5 .byte 139,85,24 // mov 0x18(%ebp),%edx .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6 .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7 @@ -54335,7 +54692,7 @@ _sk_store_8888_sse2: .byte 131,236,108 // sub $0x6c,%esp .byte 232,0,0,0,0 // call 5c55 <_sk_store_8888_sse2+0xe> .byte 88 // pop %eax - .byte 15,40,160,139,63,0,0 // movaps 0x3f8b(%eax),%xmm4 + .byte 15,40,160,203,64,0,0 // movaps 0x40cb(%eax),%xmm4 .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 .byte 102,15,91,237 // cvtps2dq %xmm5,%xmm5 @@ -54426,11 +54783,11 @@ _sk_load_bgra_sse2: .byte 139,117,8 // mov 0x8(%ebp),%esi .byte 15,133,147,0,0,0 // jne 5dfe <_sk_load_bgra_sse2+0xc2> .byte 243,15,111,44,185 // movdqu (%ecx,%edi,4),%xmm5 - .byte 102,15,111,131,166,62,0,0 // movdqa 0x3ea6(%ebx),%xmm0 + .byte 102,15,111,131,230,63,0,0 // movdqa 0x3fe6(%ebx),%xmm0 .byte 102,15,111,205 // movdqa %xmm5,%xmm1 .byte 102,15,219,200 // pand %xmm0,%xmm1 .byte 15,91,209 // cvtdq2ps %xmm1,%xmm2 - .byte 15,40,163,182,62,0,0 // movaps 0x3eb6(%ebx),%xmm4 + .byte 15,40,163,246,63,0,0 // movaps 0x3ff6(%ebx),%xmm4 .byte 15,89,212 // mulps %xmm4,%xmm2 .byte 102,15,111,205 // movdqa %xmm5,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -54506,11 +54863,11 @@ _sk_load_bgra_dst_sse2: .byte 139,117,8 // mov 0x8(%ebp),%esi .byte 15,133,150,0,0,0 // jne 5f0d <_sk_load_bgra_dst_sse2+0xc9> .byte 243,15,111,28,185 // movdqu (%ecx,%edi,4),%xmm3 - .byte 102,15,111,147,178,61,0,0 // movdqa 0x3db2(%ebx),%xmm2 + .byte 102,15,111,147,242,62,0,0 // movdqa 0x3ef2(%ebx),%xmm2 .byte 102,15,111,243 // movdqa %xmm3,%xmm6 .byte 102,15,219,242 // pand %xmm2,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,40,187,194,61,0,0 // movaps 0x3dc2(%ebx),%xmm7 + .byte 15,40,187,2,63,0,0 // movaps 0x3f02(%ebx),%xmm7 .byte 15,89,247 // mulps %xmm7,%xmm6 .byte 102,15,111,227 // movdqa %xmm3,%xmm4 .byte 102,15,114,212,8 // psrld $0x8,%xmm4 @@ -54603,8 +54960,8 @@ _sk_gather_bgra_sse2: .byte 102,15,110,4,183 // movd (%edi,%esi,4),%xmm0 .byte 139,117,16 // mov 0x10(%ebp),%esi .byte 139,125,20 // mov 0x14(%ebp),%edi - .byte 102,15,111,162,207,60,0,0 // movdqa 0x3ccf(%edx),%xmm4 - .byte 15,40,170,223,60,0,0 // movaps 0x3cdf(%edx),%xmm5 + .byte 102,15,111,162,15,62,0,0 // movdqa 0x3e0f(%edx),%xmm4 + .byte 15,40,170,31,62,0,0 // movaps 0x3e1f(%edx),%xmm5 .byte 139,85,24 // mov 0x18(%ebp),%edx .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6 .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7 @@ -54660,7 +55017,7 @@ _sk_store_bgra_sse2: .byte 131,236,108 // sub $0x6c,%esp .byte 232,0,0,0,0 // call 6086 <_sk_store_bgra_sse2+0xe> .byte 88 // pop %eax - .byte 15,40,160,202,59,0,0 // movaps 0x3bca(%eax),%xmm4 + .byte 15,40,160,10,61,0,0 // movaps 0x3d0a(%eax),%xmm4 .byte 15,40,234 // movaps %xmm2,%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 .byte 102,15,91,237 // cvtps2dq %xmm5,%xmm5 @@ -54775,7 +55132,7 @@ _sk_load_f16_sse2: .byte 102,15,126,69,232 // movd %xmm0,-0x18(%ebp) .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,97,243 // punpcklwd %xmm3,%xmm6 - .byte 102,15,111,171,226,58,0,0 // movdqa 0x3ae2(%ebx),%xmm5 + .byte 102,15,111,171,34,60,0,0 // movdqa 0x3c22(%ebx),%xmm5 .byte 102,15,111,214 // movdqa %xmm6,%xmm2 .byte 102,15,219,213 // pand %xmm5,%xmm2 .byte 102,15,239,242 // pxor %xmm2,%xmm6 @@ -54809,15 +55166,15 @@ _sk_load_f16_sse2: .byte 102,15,111,199 // movdqa %xmm7,%xmm0 .byte 102,15,114,240,13 // pslld $0xd,%xmm0 .byte 102,15,235,197 // por %xmm5,%xmm0 - .byte 102,15,111,155,242,58,0,0 // movdqa 0x3af2(%ebx),%xmm3 + .byte 102,15,111,155,50,60,0,0 // movdqa 0x3c32(%ebx),%xmm3 .byte 102,15,254,203 // paddd %xmm3,%xmm1 .byte 102,15,254,211 // paddd %xmm3,%xmm2 .byte 102,15,254,227 // paddd %xmm3,%xmm4 .byte 102,15,254,195 // paddd %xmm3,%xmm0 - .byte 102,15,111,155,2,59,0,0 // movdqa 0x3b02(%ebx),%xmm3 + .byte 102,15,111,155,66,60,0,0 // movdqa 0x3c42(%ebx),%xmm3 .byte 102,15,127,93,184 // movdqa %xmm3,-0x48(%ebp) .byte 102,15,239,243 // pxor %xmm3,%xmm6 - .byte 102,15,111,155,18,59,0,0 // movdqa 0x3b12(%ebx),%xmm3 + .byte 102,15,111,155,82,60,0,0 // movdqa 0x3c52(%ebx),%xmm3 .byte 102,15,111,235 // movdqa %xmm3,%xmm5 .byte 102,15,102,238 // pcmpgtd %xmm6,%xmm5 .byte 102,15,223,233 // pandn %xmm1,%xmm5 @@ -54919,7 +55276,7 @@ _sk_load_f16_dst_sse2: .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,240 // punpcklwd %xmm0,%xmm6 .byte 102,15,239,228 // pxor %xmm4,%xmm4 - .byte 102,15,111,155,213,56,0,0 // movdqa 0x38d5(%ebx),%xmm3 + .byte 102,15,111,155,21,58,0,0 // movdqa 0x3a15(%ebx),%xmm3 .byte 102,15,111,198 // movdqa %xmm6,%xmm0 .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 102,15,239,240 // pxor %xmm0,%xmm6 @@ -54953,15 +55310,15 @@ _sk_load_f16_dst_sse2: .byte 102,15,111,209 // movdqa %xmm1,%xmm2 .byte 102,15,114,242,13 // pslld $0xd,%xmm2 .byte 102,15,235,211 // por %xmm3,%xmm2 - .byte 102,15,111,155,229,56,0,0 // movdqa 0x38e5(%ebx),%xmm3 + .byte 102,15,111,155,37,58,0,0 // movdqa 0x3a25(%ebx),%xmm3 .byte 102,15,254,251 // paddd %xmm3,%xmm7 .byte 102,15,254,235 // paddd %xmm3,%xmm5 .byte 102,15,254,227 // paddd %xmm3,%xmm4 .byte 102,15,254,211 // paddd %xmm3,%xmm2 - .byte 102,15,111,131,245,56,0,0 // movdqa 0x38f5(%ebx),%xmm0 + .byte 102,15,111,131,53,58,0,0 // movdqa 0x3a35(%ebx),%xmm0 .byte 102,15,127,69,184 // movdqa %xmm0,-0x48(%ebp) .byte 102,15,239,240 // pxor %xmm0,%xmm6 - .byte 102,15,111,131,5,57,0,0 // movdqa 0x3905(%ebx),%xmm0 + .byte 102,15,111,131,69,58,0,0 // movdqa 0x3a45(%ebx),%xmm0 .byte 102,15,111,216 // movdqa %xmm0,%xmm3 .byte 102,15,102,222 // pcmpgtd %xmm6,%xmm3 .byte 102,15,223,223 // pandn %xmm7,%xmm3 @@ -55083,7 +55440,7 @@ _sk_gather_f16_sse2: .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,111,236 // movdqa %xmm4,%xmm5 .byte 102,15,97,235 // punpcklwd %xmm3,%xmm5 - .byte 102,15,111,161,214,54,0,0 // movdqa 0x36d6(%ecx),%xmm4 + .byte 102,15,111,161,22,56,0,0 // movdqa 0x3816(%ecx),%xmm4 .byte 102,15,111,197 // movdqa %xmm5,%xmm0 .byte 102,15,219,196 // pand %xmm4,%xmm0 .byte 102,15,239,232 // pxor %xmm0,%xmm5 @@ -55117,16 +55474,16 @@ _sk_gather_f16_sse2: .byte 102,15,111,200 // movdqa %xmm0,%xmm1 .byte 102,15,114,241,13 // pslld $0xd,%xmm1 .byte 102,15,235,204 // por %xmm4,%xmm1 - .byte 102,15,111,153,230,54,0,0 // movdqa 0x36e6(%ecx),%xmm3 + .byte 102,15,111,153,38,56,0,0 // movdqa 0x3826(%ecx),%xmm3 .byte 102,15,254,235 // paddd %xmm3,%xmm5 .byte 102,15,254,243 // paddd %xmm3,%xmm6 .byte 102,15,254,251 // paddd %xmm3,%xmm7 .byte 102,15,254,203 // paddd %xmm3,%xmm1 - .byte 102,15,111,153,246,54,0,0 // movdqa 0x36f6(%ecx),%xmm3 + .byte 102,15,111,153,54,56,0,0 // movdqa 0x3836(%ecx),%xmm3 .byte 102,15,127,93,184 // movdqa %xmm3,-0x48(%ebp) .byte 102,15,111,85,136 // movdqa -0x78(%ebp),%xmm2 .byte 102,15,239,211 // pxor %xmm3,%xmm2 - .byte 102,15,111,153,6,55,0,0 // movdqa 0x3706(%ecx),%xmm3 + .byte 102,15,111,153,70,56,0,0 // movdqa 0x3846(%ecx),%xmm3 .byte 102,15,111,227 // movdqa %xmm3,%xmm4 .byte 102,15,102,226 // pcmpgtd %xmm2,%xmm4 .byte 102,15,223,229 // pandn %xmm5,%xmm4 @@ -55185,18 +55542,18 @@ _sk_store_f16_sse2: .byte 102,15,111,250 // movdqa %xmm2,%xmm7 .byte 232,0,0,0,0 // call 68a7 <_sk_store_f16_sse2+0x19> .byte 88 // pop %eax - .byte 102,15,111,176,121,52,0,0 // movdqa 0x3479(%eax),%xmm6 + .byte 102,15,111,176,185,53,0,0 // movdqa 0x35b9(%eax),%xmm6 .byte 102,15,111,208 // movdqa %xmm0,%xmm2 .byte 102,15,219,214 // pand %xmm6,%xmm2 .byte 102,15,127,69,184 // movdqa %xmm0,-0x48(%ebp) .byte 102,15,111,232 // movdqa %xmm0,%xmm5 .byte 102,15,239,234 // pxor %xmm2,%xmm5 - .byte 102,15,111,160,137,52,0,0 // movdqa 0x3489(%eax),%xmm4 + .byte 102,15,111,160,201,53,0,0 // movdqa 0x35c9(%eax),%xmm4 .byte 102,15,114,210,16 // psrld $0x10,%xmm2 .byte 102,15,111,196 // movdqa %xmm4,%xmm0 .byte 102,15,102,197 // pcmpgtd %xmm5,%xmm0 .byte 102,15,114,213,13 // psrld $0xd,%xmm5 - .byte 102,15,111,152,153,52,0,0 // movdqa 0x3499(%eax),%xmm3 + .byte 102,15,111,152,217,53,0,0 // movdqa 0x35d9(%eax),%xmm3 .byte 102,15,254,211 // paddd %xmm3,%xmm2 .byte 102,15,254,213 // paddd %xmm5,%xmm2 .byte 102,15,114,242,16 // pslld $0x10,%xmm2 @@ -55336,7 +55693,7 @@ _sk_load_u16_be_sse2: .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,97,195 // punpcklwd %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,40,163,219,50,0,0 // movaps 0x32db(%ebx),%xmm4 + .byte 15,40,163,27,52,0,0 // movaps 0x341b(%ebx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 102,15,111,205 // movdqa %xmm5,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -55450,7 +55807,7 @@ _sk_load_rgb_u16_be_sse2: .byte 102,15,239,255 // pxor %xmm7,%xmm7 .byte 102,15,97,199 // punpcklwd %xmm7,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,40,160,78,49,0,0 // movaps 0x314e(%eax),%xmm4 + .byte 15,40,160,142,50,0,0 // movaps 0x328e(%eax),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -55488,7 +55845,7 @@ _sk_load_rgb_u16_be_sse2: .byte 137,84,36,4 // mov %edx,0x4(%esp) .byte 139,85,8 // mov 0x8(%ebp),%edx .byte 137,20,36 // mov %edx,(%esp) - .byte 15,40,152,94,49,0,0 // movaps 0x315e(%eax),%xmm3 + .byte 15,40,152,158,50,0,0 // movaps 0x329e(%eax),%xmm3 .byte 255,81,4 // call *0x4(%ecx) .byte 131,196,124 // add $0x7c,%esp .byte 94 // pop %esi @@ -55528,7 +55885,7 @@ _sk_store_u16_be_sse2: .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) .byte 232,0,0,0,0 // call 6db8 <_sk_store_u16_be_sse2+0x12> .byte 88 // pop %eax - .byte 15,40,176,200,47,0,0 // movaps 0x2fc8(%eax),%xmm6 + .byte 15,40,176,8,49,0,0 // movaps 0x3108(%eax),%xmm6 .byte 15,40,224 // movaps %xmm0,%xmm4 .byte 15,89,230 // mulps %xmm6,%xmm4 .byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4 @@ -55951,7 +56308,7 @@ _sk_repeat_x_sse2: .byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 15,194,238,1 // cmpltps %xmm6,%xmm5 - .byte 15,84,174,248,42,0,0 // andps 0x2af8(%esi),%xmm5 + .byte 15,84,174,56,44,0,0 // andps 0x2c38(%esi),%xmm5 .byte 139,117,24 // mov 0x18(%ebp),%esi .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7 .byte 15,92,245 // subps %xmm5,%xmm6 @@ -56006,7 +56363,7 @@ _sk_repeat_y_sse2: .byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 15,194,238,1 // cmpltps %xmm6,%xmm5 - .byte 15,84,174,105,42,0,0 // andps 0x2a69(%esi),%xmm5 + .byte 15,84,174,169,43,0,0 // andps 0x2ba9(%esi),%xmm5 .byte 139,117,24 // mov 0x18(%ebp),%esi .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7 .byte 15,92,245 // subps %xmm5,%xmm6 @@ -56059,13 +56416,13 @@ _sk_mirror_x_sse2: .byte 15,40,229 // movaps %xmm5,%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 .byte 15,92,196 // subps %xmm4,%xmm0 - .byte 243,15,89,183,106,46,0,0 // mulss 0x2e6a(%edi),%xmm6 + .byte 243,15,89,183,218,47,0,0 // mulss 0x2fda(%edi),%xmm6 .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6 .byte 15,89,240 // mulps %xmm0,%xmm6 .byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7 .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 .byte 15,194,247,1 // cmpltps %xmm7,%xmm6 - .byte 15,84,183,218,41,0,0 // andps 0x29da(%edi),%xmm6 + .byte 15,84,183,26,43,0,0 // andps 0x2b1a(%edi),%xmm6 .byte 139,125,24 // mov 0x18(%ebp),%edi .byte 15,92,254 // subps %xmm6,%xmm7 .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6 @@ -56123,13 +56480,13 @@ _sk_mirror_y_sse2: .byte 15,40,229 // movaps %xmm5,%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 .byte 15,92,204 // subps %xmm4,%xmm1 - .byte 243,15,89,183,173,45,0,0 // mulss 0x2dad(%edi),%xmm6 + .byte 243,15,89,183,29,47,0,0 // mulss 0x2f1d(%edi),%xmm6 .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6 .byte 15,89,241 // mulps %xmm1,%xmm6 .byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7 .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 .byte 15,194,247,1 // cmpltps %xmm7,%xmm6 - .byte 15,84,183,41,41,0,0 // andps 0x2929(%edi),%xmm6 + .byte 15,84,183,105,42,0,0 // andps 0x2a69(%edi),%xmm6 .byte 139,125,24 // mov 0x18(%ebp),%edi .byte 15,92,254 // subps %xmm6,%xmm7 .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6 @@ -56187,7 +56544,7 @@ _sk_clamp_x_1_sse2: .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,95,224 // maxps %xmm0,%xmm4 .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0 - .byte 15,93,160,120,40,0,0 // minps 0x2878(%eax),%xmm4 + .byte 15,93,160,184,41,0,0 // minps 0x29b8(%eax),%xmm4 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 141,88,4 // lea 0x4(%eax),%ebx .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp) @@ -56230,7 +56587,7 @@ _sk_repeat_x_1_sse2: .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 15,40,248 // movaps %xmm0,%xmm7 .byte 15,194,254,1 // cmpltps %xmm6,%xmm7 - .byte 15,84,184,22,40,0,0 // andps 0x2816(%eax),%xmm7 + .byte 15,84,184,86,41,0,0 // andps 0x2956(%eax),%xmm7 .byte 15,92,247 // subps %xmm7,%xmm6 .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7 .byte 15,92,198 // subps %xmm6,%xmm0 @@ -56271,14 +56628,14 @@ _sk_mirror_x_1_sse2: .byte 139,85,20 // mov 0x14(%ebp),%edx .byte 139,117,24 // mov 0x18(%ebp),%esi .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4 - .byte 15,40,175,169,39,0,0 // movaps 0x27a9(%edi),%xmm5 + .byte 15,40,175,233,40,0,0 // movaps 0x28e9(%edi),%xmm5 .byte 15,88,197 // addps %xmm5,%xmm0 - .byte 15,40,183,185,39,0,0 // movaps 0x27b9(%edi),%xmm6 + .byte 15,40,183,249,40,0,0 // movaps 0x28f9(%edi),%xmm6 .byte 15,89,240 // mulps %xmm0,%xmm6 .byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7 .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 .byte 15,194,247,1 // cmpltps %xmm7,%xmm6 - .byte 15,84,183,201,39,0,0 // andps 0x27c9(%edi),%xmm6 + .byte 15,84,183,9,41,0,0 // andps 0x2909(%edi),%xmm6 .byte 15,92,254 // subps %xmm6,%xmm7 .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6 .byte 15,88,255 // addps %xmm7,%xmm7 @@ -56329,9 +56686,9 @@ _sk_luminance_to_alpha_sse2: .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4 .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5 .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6 - .byte 15,89,128,57,39,0,0 // mulps 0x2739(%eax),%xmm0 - .byte 15,89,136,73,39,0,0 // mulps 0x2749(%eax),%xmm1 - .byte 15,89,152,89,39,0,0 // mulps 0x2759(%eax),%xmm3 + .byte 15,89,128,121,40,0,0 // mulps 0x2879(%eax),%xmm0 + .byte 15,89,136,137,40,0,0 // mulps 0x2889(%eax),%xmm1 + .byte 15,89,152,153,40,0,0 // mulps 0x2899(%eax),%xmm3 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 15,88,200 // addps %xmm0,%xmm1 .byte 15,88,217 // addps %xmm1,%xmm3 @@ -56792,12 +57149,12 @@ _sk_evenly_spaced_gradient_sse2: .byte 78 // dec %esi .byte 102,15,110,206 // movd %esi,%xmm1 .byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1 - .byte 102,15,111,146,179,33,0,0 // movdqa 0x21b3(%edx),%xmm2 + .byte 102,15,111,146,243,34,0,0 // movdqa 0x22f3(%edx),%xmm2 .byte 102,15,219,209 // pand %xmm1,%xmm2 - .byte 102,15,235,146,195,33,0,0 // por 0x21c3(%edx),%xmm2 + .byte 102,15,235,146,3,35,0,0 // por 0x2303(%edx),%xmm2 .byte 102,15,114,209,16 // psrld $0x10,%xmm1 - .byte 102,15,235,138,211,33,0,0 // por 0x21d3(%edx),%xmm1 - .byte 15,88,138,227,33,0,0 // addps 0x21e3(%edx),%xmm1 + .byte 102,15,235,138,19,35,0,0 // por 0x2313(%edx),%xmm1 + .byte 15,88,138,35,35,0,0 // addps 0x2323(%edx),%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,89,200 // mulps %xmm0,%xmm1 .byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1 @@ -56930,15 +57287,15 @@ _sk_gauss_a_to_rgba_sse2: .byte 15,40,85,56 // movaps 0x38(%ebp),%xmm2 .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4 .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5 - .byte 15,40,130,252,31,0,0 // movaps 0x1ffc(%edx),%xmm0 + .byte 15,40,130,60,33,0,0 // movaps 0x213c(%edx),%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,130,12,32,0,0 // addps 0x200c(%edx),%xmm0 + .byte 15,88,130,76,33,0,0 // addps 0x214c(%edx),%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,130,28,32,0,0 // addps 0x201c(%edx),%xmm0 + .byte 15,88,130,92,33,0,0 // addps 0x215c(%edx),%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,130,44,32,0,0 // addps 0x202c(%edx),%xmm0 + .byte 15,88,130,108,33,0,0 // addps 0x216c(%edx),%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,130,60,32,0,0 // addps 0x203c(%edx),%xmm0 + .byte 15,88,130,124,33,0,0 // addps 0x217c(%edx),%xmm0 .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 141,90,4 // lea 0x4(%edx),%ebx .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp) @@ -56985,7 +57342,7 @@ _sk_gradient_sse2: .byte 72 // dec %eax .byte 131,193,4 // add $0x4,%ecx .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 15,40,146,175,31,0,0 // movaps 0x1faf(%edx),%xmm2 + .byte 15,40,146,239,32,0,0 // movaps 0x20ef(%edx),%xmm2 .byte 243,15,16,25 // movss (%ecx),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 @@ -57197,35 +57554,35 @@ _sk_xy_to_unit_angle_sse2: .byte 15,94,247 // divps %xmm7,%xmm6 .byte 15,40,254 // movaps %xmm6,%xmm7 .byte 15,89,255 // mulps %xmm7,%xmm7 - .byte 15,40,128,255,28,0,0 // movaps 0x1cff(%eax),%xmm0 + .byte 15,40,128,63,30,0,0 // movaps 0x1e3f(%eax),%xmm0 .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 15,88,128,15,29,0,0 // addps 0x1d0f(%eax),%xmm0 + .byte 15,88,128,79,30,0,0 // addps 0x1e4f(%eax),%xmm0 .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 15,88,128,31,29,0,0 // addps 0x1d1f(%eax),%xmm0 + .byte 15,88,128,95,30,0,0 // addps 0x1e5f(%eax),%xmm0 .byte 15,89,199 // mulps %xmm7,%xmm0 .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 139,125,24 // mov 0x18(%ebp),%edi - .byte 15,88,128,47,29,0,0 // addps 0x1d2f(%eax),%xmm0 + .byte 15,88,128,111,30,0,0 // addps 0x1e6f(%eax),%xmm0 .byte 15,89,198 // mulps %xmm6,%xmm0 .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6 .byte 15,194,236,1 // cmpltps %xmm4,%xmm5 - .byte 15,40,184,63,29,0,0 // movaps 0x1d3f(%eax),%xmm7 + .byte 15,40,184,127,30,0,0 // movaps 0x1e7f(%eax),%xmm7 .byte 15,92,248 // subps %xmm0,%xmm7 .byte 15,84,253 // andps %xmm5,%xmm7 .byte 15,85,232 // andnps %xmm0,%xmm5 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,86,239 // orps %xmm7,%xmm5 .byte 15,194,204,1 // cmpltps %xmm4,%xmm1 - .byte 15,40,128,79,29,0,0 // movaps 0x1d4f(%eax),%xmm0 + .byte 15,40,128,143,30,0,0 // movaps 0x1e8f(%eax),%xmm0 .byte 15,92,197 // subps %xmm5,%xmm0 .byte 15,84,193 // andps %xmm1,%xmm0 .byte 15,85,205 // andnps %xmm5,%xmm1 .byte 15,86,200 // orps %xmm0,%xmm1 .byte 15,40,194 // movaps %xmm2,%xmm0 .byte 15,194,196,1 // cmpltps %xmm4,%xmm0 - .byte 15,40,168,95,29,0,0 // movaps 0x1d5f(%eax),%xmm5 + .byte 15,40,168,159,30,0,0 // movaps 0x1e9f(%eax),%xmm5 .byte 15,92,233 // subps %xmm1,%xmm5 .byte 15,84,232 // andps %xmm0,%xmm5 .byte 15,85,193 // andnps %xmm1,%xmm0 @@ -57300,10 +57657,10 @@ _sk_xy_to_radius_sse2: .byte 93 // pop %ebp .byte 195 // ret -HIDDEN _sk_xy_to_2pt_conical_sse2 -.globl _sk_xy_to_2pt_conical_sse2 -FUNCTION(_sk_xy_to_2pt_conical_sse2) -_sk_xy_to_2pt_conical_sse2: +HIDDEN _sk_xy_to_2pt_conical_quadratic_sse2 +.globl _sk_xy_to_2pt_conical_quadratic_sse2 +FUNCTION(_sk_xy_to_2pt_conical_quadratic_sse2) +_sk_xy_to_2pt_conical_quadratic_sse2: .byte 85 // push %ebp .byte 137,229 // mov %esp,%ebp .byte 83 // push %ebx @@ -57313,15 +57670,15 @@ _sk_xy_to_2pt_conical_sse2: .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,40,209 // movaps %xmm1,%xmm2 - .byte 232,0,0,0,0 // call 8376 <_sk_xy_to_2pt_conical_sse2+0x18> + .byte 232,0,0,0,0 // call 8376 <_sk_xy_to_2pt_conical_quadratic_sse2+0x18> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,58 // mov (%edx),%edi - .byte 243,15,16,47 // movss (%edi),%xmm5 - .byte 243,15,16,119,8 // movss 0x8(%edi),%xmm6 - .byte 243,15,16,103,12 // movss 0xc(%edi),%xmm4 + .byte 243,15,16,111,32 // movss 0x20(%edi),%xmm5 + .byte 243,15,16,119,40 // movss 0x28(%edi),%xmm6 + .byte 243,15,16,103,44 // movss 0x2c(%edi),%xmm4 .byte 243,15,89,230 // mulss %xmm6,%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 .byte 15,88,224 // addps %xmm0,%xmm4 @@ -57329,14 +57686,14 @@ _sk_xy_to_2pt_conical_sse2: .byte 15,40,250 // movaps %xmm2,%xmm7 .byte 15,89,255 // mulps %xmm7,%xmm7 .byte 15,88,248 // addps %xmm0,%xmm7 - .byte 243,15,16,79,4 // movss 0x4(%edi),%xmm1 + .byte 243,15,16,79,36 // movss 0x24(%edi),%xmm1 .byte 139,125,20 // mov 0x14(%ebp),%edi .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 - .byte 15,89,166,234,27,0,0 // mulps 0x1bea(%esi),%xmm4 + .byte 15,89,166,42,29,0,0 // mulps 0x1d2a(%esi),%xmm4 .byte 243,15,89,246 // mulss %xmm6,%xmm6 .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6 .byte 15,92,254 // subps %xmm6,%xmm7 - .byte 15,89,174,250,27,0,0 // mulps 0x1bfa(%esi),%xmm5 + .byte 15,89,174,58,29,0,0 // mulps 0x1d3a(%esi),%xmm5 .byte 15,89,239 // mulps %xmm7,%xmm5 .byte 15,40,196 // movaps %xmm4,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 @@ -57344,8 +57701,8 @@ _sk_xy_to_2pt_conical_sse2: .byte 15,81,232 // sqrtps %xmm0,%xmm5 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 15,92,196 // subps %xmm4,%xmm0 - .byte 15,87,166,10,28,0,0 // xorps 0x1c0a(%esi),%xmm4 - .byte 15,40,182,26,28,0,0 // movaps 0x1c1a(%esi),%xmm6 + .byte 15,87,166,74,29,0,0 // xorps 0x1d4a(%esi),%xmm4 + .byte 15,40,182,90,29,0,0 // movaps 0x1d5a(%esi),%xmm6 .byte 139,117,24 // mov 0x18(%ebp),%esi .byte 15,92,229 // subps %xmm5,%xmm4 .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5 @@ -57379,6 +57736,117 @@ _sk_xy_to_2pt_conical_sse2: .byte 93 // pop %ebp .byte 195 // ret +HIDDEN _sk_xy_to_2pt_conical_linear_sse2 +.globl _sk_xy_to_2pt_conical_linear_sse2 +FUNCTION(_sk_xy_to_2pt_conical_linear_sse2) +_sk_xy_to_2pt_conical_linear_sse2: + .byte 85 // push %ebp + .byte 137,229 // mov %esp,%ebp + .byte 83 // push %ebx + .byte 87 // push %edi + .byte 86 // push %esi + .byte 131,236,108 // sub $0x6c,%esp + .byte 232,0,0,0,0 // call 8466 <_sk_xy_to_2pt_conical_linear_sse2+0xe> + .byte 94 // pop %esi + .byte 139,69,8 // mov 0x8(%ebp),%eax + .byte 139,77,16 // mov 0x10(%ebp),%ecx + .byte 139,85,12 // mov 0xc(%ebp),%edx + .byte 139,58 // mov (%edx),%edi + .byte 243,15,16,103,40 // movss 0x28(%edi),%xmm4 + .byte 243,15,16,111,44 // movss 0x2c(%edi),%xmm5 + .byte 15,40,245 // movaps %xmm5,%xmm6 + .byte 243,15,89,244 // mulss %xmm4,%xmm6 + .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6 + .byte 15,88,240 // addps %xmm0,%xmm6 + .byte 15,89,182,122,28,0,0 // mulps 0x1c7a(%esi),%xmm6 + .byte 15,89,192 // mulps %xmm0,%xmm0 + .byte 15,89,201 // mulps %xmm1,%xmm1 + .byte 15,88,200 // addps %xmm0,%xmm1 + .byte 15,40,196 // movaps %xmm4,%xmm0 + .byte 243,15,89,192 // mulss %xmm0,%xmm0 + .byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0 + .byte 15,92,200 // subps %xmm0,%xmm1 + .byte 15,87,142,138,28,0,0 // xorps 0x1c8a(%esi),%xmm1 + .byte 15,94,206 // divps %xmm6,%xmm1 + .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 + .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 + .byte 15,89,233 // mulps %xmm1,%xmm5 + .byte 15,88,236 // addps %xmm4,%xmm5 + .byte 15,87,228 // xorps %xmm4,%xmm4 + .byte 15,194,236,1 // cmpltps %xmm4,%xmm5 + .byte 15,194,225,3 // cmpunordps %xmm1,%xmm4 + .byte 15,86,229 // orps %xmm5,%xmm4 + .byte 15,85,166,154,28,0,0 // andnps 0x1c9a(%esi),%xmm4 + .byte 139,117,20 // mov 0x14(%ebp),%esi + .byte 15,17,39 // movups %xmm4,(%edi) + .byte 139,125,24 // mov 0x18(%ebp),%edi + .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0 + .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5 + .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6 + .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7 + .byte 141,90,8 // lea 0x8(%edx),%ebx + .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp) + .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp) + .byte 15,41,108,36,48 // movaps %xmm5,0x30(%esp) + .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp) + .byte 137,124,36,16 // mov %edi,0x10(%esp) + .byte 137,116,36,12 // mov %esi,0xc(%esp) + .byte 137,76,36,8 // mov %ecx,0x8(%esp) + .byte 137,92,36,4 // mov %ebx,0x4(%esp) + .byte 137,4,36 // mov %eax,(%esp) + .byte 15,40,193 // movaps %xmm1,%xmm0 + .byte 15,40,204 // movaps %xmm4,%xmm1 + .byte 255,82,4 // call *0x4(%edx) + .byte 131,196,108 // add $0x6c,%esp + .byte 94 // pop %esi + .byte 95 // pop %edi + .byte 91 // pop %ebx + .byte 93 // pop %ebp + .byte 195 // ret + +HIDDEN _sk_vector_scale_sse2 +.globl _sk_vector_scale_sse2 +FUNCTION(_sk_vector_scale_sse2) +_sk_vector_scale_sse2: + .byte 85 // push %ebp + .byte 137,229 // mov %esp,%ebp + .byte 83 // push %ebx + .byte 87 // push %edi + .byte 86 // push %esi + .byte 131,236,108 // sub $0x6c,%esp + .byte 139,69,8 // mov 0x8(%ebp),%eax + .byte 139,77,16 // mov 0x10(%ebp),%ecx + .byte 139,85,20 // mov 0x14(%ebp),%edx + .byte 139,117,12 // mov 0xc(%ebp),%esi + .byte 139,62 // mov (%esi),%edi + .byte 15,16,39 // movups (%edi),%xmm4 + .byte 139,125,24 // mov 0x18(%ebp),%edi + .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5 + .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6 + .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7 + .byte 15,89,196 // mulps %xmm4,%xmm0 + .byte 15,89,204 // mulps %xmm4,%xmm1 + .byte 15,89,212 // mulps %xmm4,%xmm2 + .byte 15,89,220 // mulps %xmm4,%xmm3 + .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4 + .byte 141,94,8 // lea 0x8(%esi),%ebx + .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp) + .byte 15,41,124,36,64 // movaps %xmm7,0x40(%esp) + .byte 15,41,116,36,48 // movaps %xmm6,0x30(%esp) + .byte 15,41,108,36,32 // movaps %xmm5,0x20(%esp) + .byte 137,124,36,16 // mov %edi,0x10(%esp) + .byte 137,84,36,12 // mov %edx,0xc(%esp) + .byte 137,76,36,8 // mov %ecx,0x8(%esp) + .byte 137,92,36,4 // mov %ebx,0x4(%esp) + .byte 137,4,36 // mov %eax,(%esp) + .byte 255,86,4 // call *0x4(%esi) + .byte 131,196,108 // add $0x6c,%esp + .byte 94 // pop %esi + .byte 95 // pop %edi + .byte 91 // pop %ebx + .byte 93 // pop %ebp + .byte 195 // ret + HIDDEN _sk_save_xy_sse2 .globl _sk_save_xy_sse2 FUNCTION(_sk_save_xy_sse2) @@ -57391,16 +57859,16 @@ _sk_save_xy_sse2: .byte 131,236,124 // sub $0x7c,%esp .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 232,0,0,0,0 // call 846c <_sk_save_xy_sse2+0x15> + .byte 232,0,0,0,0 // call 85ac <_sk_save_xy_sse2+0x15> .byte 88 // pop %eax - .byte 15,40,160,52,27,0,0 // movaps 0x1b34(%eax),%xmm4 + .byte 15,40,160,100,27,0,0 // movaps 0x1b64(%eax),%xmm4 .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,88,236 // addps %xmm4,%xmm5 .byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 15,40,253 // movaps %xmm5,%xmm7 .byte 15,194,254,1 // cmpltps %xmm6,%xmm7 - .byte 15,40,144,68,27,0,0 // movaps 0x1b44(%eax),%xmm2 + .byte 15,40,144,116,27,0,0 // movaps 0x1b74(%eax),%xmm2 .byte 15,84,250 // andps %xmm2,%xmm7 .byte 15,92,247 // subps %xmm7,%xmm6 .byte 15,92,238 // subps %xmm6,%xmm5 @@ -57504,15 +57972,15 @@ _sk_bilinear_nx_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 85b1 <_sk_bilinear_nx_sse2+0xe> + .byte 232,0,0,0,0 // call 86f1 <_sk_bilinear_nx_sse2+0xe> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx .byte 139,117,12 // mov 0xc(%ebp),%esi .byte 139,62 // mov (%esi),%edi .byte 15,16,7 // movups (%edi),%xmm0 - .byte 15,88,128,15,26,0,0 // addps 0x1a0f(%eax),%xmm0 - .byte 15,40,160,31,26,0,0 // movaps 0x1a1f(%eax),%xmm4 + .byte 15,88,128,63,26,0,0 // addps 0x1a3f(%eax),%xmm0 + .byte 15,40,160,79,26,0,0 // movaps 0x1a4f(%eax),%xmm4 .byte 139,69,20 // mov 0x14(%ebp),%eax .byte 15,16,111,64 // movups 0x40(%edi),%xmm5 .byte 15,92,229 // subps %xmm5,%xmm4 @@ -57550,14 +58018,14 @@ _sk_bilinear_px_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 8635 <_sk_bilinear_px_sse2+0xe> + .byte 232,0,0,0,0 // call 8775 <_sk_bilinear_px_sse2+0xe> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx .byte 139,117,12 // mov 0xc(%ebp),%esi .byte 139,62 // mov (%esi),%edi .byte 15,16,7 // movups (%edi),%xmm0 - .byte 15,88,128,171,25,0,0 // addps 0x19ab(%eax),%xmm0 + .byte 15,88,128,219,25,0,0 // addps 0x19db(%eax),%xmm0 .byte 139,69,20 // mov 0x14(%ebp),%eax .byte 15,16,103,64 // movups 0x40(%edi),%xmm4 .byte 15,17,167,128,0,0,0 // movups %xmm4,0x80(%edi) @@ -57594,15 +58062,15 @@ _sk_bilinear_ny_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 86af <_sk_bilinear_ny_sse2+0xe> + .byte 232,0,0,0,0 // call 87ef <_sk_bilinear_ny_sse2+0xe> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx .byte 139,117,12 // mov 0xc(%ebp),%esi .byte 139,62 // mov (%esi),%edi .byte 15,16,79,32 // movups 0x20(%edi),%xmm1 - .byte 15,88,136,65,25,0,0 // addps 0x1941(%eax),%xmm1 - .byte 15,40,160,81,25,0,0 // movaps 0x1951(%eax),%xmm4 + .byte 15,88,136,113,25,0,0 // addps 0x1971(%eax),%xmm1 + .byte 15,40,160,129,25,0,0 // movaps 0x1981(%eax),%xmm4 .byte 139,69,20 // mov 0x14(%ebp),%eax .byte 15,16,111,96 // movups 0x60(%edi),%xmm5 .byte 15,92,229 // subps %xmm5,%xmm4 @@ -57640,14 +58108,14 @@ _sk_bilinear_py_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 8734 <_sk_bilinear_py_sse2+0xe> + .byte 232,0,0,0,0 // call 8874 <_sk_bilinear_py_sse2+0xe> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx .byte 139,117,12 // mov 0xc(%ebp),%esi .byte 139,62 // mov (%esi),%edi .byte 15,16,79,32 // movups 0x20(%edi),%xmm1 - .byte 15,88,136,220,24,0,0 // addps 0x18dc(%eax),%xmm1 + .byte 15,88,136,12,25,0,0 // addps 0x190c(%eax),%xmm1 .byte 139,69,20 // mov 0x14(%ebp),%eax .byte 15,16,103,96 // movups 0x60(%edi),%xmm4 .byte 15,17,167,160,0,0,0 // movups %xmm4,0xa0(%edi) @@ -57684,7 +58152,7 @@ _sk_bicubic_n3x_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 87af <_sk_bicubic_n3x_sse2+0xe> + .byte 232,0,0,0,0 // call 88ef <_sk_bicubic_n3x_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -57692,12 +58160,12 @@ _sk_bicubic_n3x_sse2: .byte 139,58 // mov (%edx),%edi .byte 15,16,7 // movups (%edi),%xmm0 .byte 15,16,103,64 // movups 0x40(%edi),%xmm4 - .byte 15,88,134,113,24,0,0 // addps 0x1871(%esi),%xmm0 - .byte 15,40,174,129,24,0,0 // movaps 0x1881(%esi),%xmm5 + .byte 15,88,134,161,24,0,0 // addps 0x18a1(%esi),%xmm0 + .byte 15,40,174,177,24,0,0 // movaps 0x18b1(%esi),%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 .byte 15,40,229 // movaps %xmm5,%xmm4 - .byte 15,89,174,145,24,0,0 // mulps 0x1891(%esi),%xmm5 - .byte 15,88,174,161,24,0,0 // addps 0x18a1(%esi),%xmm5 + .byte 15,89,174,193,24,0,0 // mulps 0x18c1(%esi),%xmm5 + .byte 15,88,174,209,24,0,0 // addps 0x18d1(%esi),%xmm5 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 15,89,228 // mulps %xmm4,%xmm4 .byte 15,89,236 // mulps %xmm4,%xmm5 @@ -57735,7 +58203,7 @@ _sk_bicubic_n1x_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 884a <_sk_bicubic_n1x_sse2+0xe> + .byte 232,0,0,0,0 // call 898a <_sk_bicubic_n1x_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -57743,16 +58211,16 @@ _sk_bicubic_n1x_sse2: .byte 139,58 // mov (%edx),%edi .byte 15,16,7 // movups (%edi),%xmm0 .byte 15,16,103,64 // movups 0x40(%edi),%xmm4 - .byte 15,88,134,22,24,0,0 // addps 0x1816(%esi),%xmm0 - .byte 15,40,174,38,24,0,0 // movaps 0x1826(%esi),%xmm5 + .byte 15,88,134,70,24,0,0 // addps 0x1846(%esi),%xmm0 + .byte 15,40,174,86,24,0,0 // movaps 0x1856(%esi),%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 - .byte 15,40,166,54,24,0,0 // movaps 0x1836(%esi),%xmm4 + .byte 15,40,166,102,24,0,0 // movaps 0x1866(%esi),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,166,70,24,0,0 // addps 0x1846(%esi),%xmm4 + .byte 15,88,166,118,24,0,0 // addps 0x1876(%esi),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,166,86,24,0,0 // addps 0x1856(%esi),%xmm4 + .byte 15,88,166,134,24,0,0 // addps 0x1886(%esi),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,166,102,24,0,0 // addps 0x1866(%esi),%xmm4 + .byte 15,88,166,150,24,0,0 // addps 0x1896(%esi),%xmm4 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 15,17,167,128,0,0,0 // movups %xmm4,0x80(%edi) .byte 139,125,24 // mov 0x18(%ebp),%edi @@ -57788,21 +58256,21 @@ _sk_bicubic_p1x_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 88f3 <_sk_bicubic_p1x_sse2+0xe> + .byte 232,0,0,0,0 // call 8a33 <_sk_bicubic_p1x_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,58 // mov (%edx),%edi - .byte 15,40,166,205,23,0,0 // movaps 0x17cd(%esi),%xmm4 + .byte 15,40,166,253,23,0,0 // movaps 0x17fd(%esi),%xmm4 .byte 15,16,71,64 // movups 0x40(%edi),%xmm0 - .byte 15,40,174,221,23,0,0 // movaps 0x17dd(%esi),%xmm5 + .byte 15,40,174,13,24,0,0 // movaps 0x180d(%esi),%xmm5 .byte 15,89,232 // mulps %xmm0,%xmm5 - .byte 15,88,174,237,23,0,0 // addps 0x17ed(%esi),%xmm5 + .byte 15,88,174,29,24,0,0 // addps 0x181d(%esi),%xmm5 .byte 15,89,232 // mulps %xmm0,%xmm5 .byte 15,88,236 // addps %xmm4,%xmm5 .byte 15,89,232 // mulps %xmm0,%xmm5 - .byte 15,88,174,253,23,0,0 // addps 0x17fd(%esi),%xmm5 + .byte 15,88,174,45,24,0,0 // addps 0x182d(%esi),%xmm5 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 15,16,7 // movups (%edi),%xmm0 .byte 15,17,175,128,0,0,0 // movups %xmm5,0x80(%edi) @@ -57840,7 +58308,7 @@ _sk_bicubic_p3x_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 8991 <_sk_bicubic_p3x_sse2+0xe> + .byte 232,0,0,0,0 // call 8ad1 <_sk_bicubic_p3x_sse2+0xe> .byte 89 // pop %ecx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,85,16 // mov 0x10(%ebp),%edx @@ -57848,10 +58316,10 @@ _sk_bicubic_p3x_sse2: .byte 139,62 // mov (%esi),%edi .byte 15,16,7 // movups (%edi),%xmm0 .byte 15,16,103,64 // movups 0x40(%edi),%xmm4 - .byte 15,88,129,111,23,0,0 // addps 0x176f(%ecx),%xmm0 + .byte 15,88,129,159,23,0,0 // addps 0x179f(%ecx),%xmm0 .byte 15,40,236 // movaps %xmm4,%xmm5 - .byte 15,89,161,127,23,0,0 // mulps 0x177f(%ecx),%xmm4 - .byte 15,88,161,143,23,0,0 // addps 0x178f(%ecx),%xmm4 + .byte 15,89,161,175,23,0,0 // mulps 0x17af(%ecx),%xmm4 + .byte 15,88,161,191,23,0,0 // addps 0x17bf(%ecx),%xmm4 .byte 139,77,20 // mov 0x14(%ebp),%ecx .byte 15,89,237 // mulps %xmm5,%xmm5 .byte 15,89,229 // mulps %xmm5,%xmm4 @@ -57889,7 +58357,7 @@ _sk_bicubic_n3y_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 8a22 <_sk_bicubic_n3y_sse2+0xe> + .byte 232,0,0,0,0 // call 8b62 <_sk_bicubic_n3y_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -57897,12 +58365,12 @@ _sk_bicubic_n3y_sse2: .byte 139,58 // mov (%edx),%edi .byte 15,16,79,32 // movups 0x20(%edi),%xmm1 .byte 15,16,103,96 // movups 0x60(%edi),%xmm4 - .byte 15,88,142,14,23,0,0 // addps 0x170e(%esi),%xmm1 - .byte 15,40,174,30,23,0,0 // movaps 0x171e(%esi),%xmm5 + .byte 15,88,142,62,23,0,0 // addps 0x173e(%esi),%xmm1 + .byte 15,40,174,78,23,0,0 // movaps 0x174e(%esi),%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 .byte 15,40,229 // movaps %xmm5,%xmm4 - .byte 15,89,174,46,23,0,0 // mulps 0x172e(%esi),%xmm5 - .byte 15,88,174,62,23,0,0 // addps 0x173e(%esi),%xmm5 + .byte 15,89,174,94,23,0,0 // mulps 0x175e(%esi),%xmm5 + .byte 15,88,174,110,23,0,0 // addps 0x176e(%esi),%xmm5 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 15,89,228 // mulps %xmm4,%xmm4 .byte 15,89,236 // mulps %xmm4,%xmm5 @@ -57940,7 +58408,7 @@ _sk_bicubic_n1y_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 8abe <_sk_bicubic_n1y_sse2+0xe> + .byte 232,0,0,0,0 // call 8bfe <_sk_bicubic_n1y_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -57948,16 +58416,16 @@ _sk_bicubic_n1y_sse2: .byte 139,58 // mov (%edx),%edi .byte 15,16,79,32 // movups 0x20(%edi),%xmm1 .byte 15,16,103,96 // movups 0x60(%edi),%xmm4 - .byte 15,88,142,178,22,0,0 // addps 0x16b2(%esi),%xmm1 - .byte 15,40,174,194,22,0,0 // movaps 0x16c2(%esi),%xmm5 + .byte 15,88,142,226,22,0,0 // addps 0x16e2(%esi),%xmm1 + .byte 15,40,174,242,22,0,0 // movaps 0x16f2(%esi),%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 - .byte 15,40,166,210,22,0,0 // movaps 0x16d2(%esi),%xmm4 + .byte 15,40,166,2,23,0,0 // movaps 0x1702(%esi),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,166,226,22,0,0 // addps 0x16e2(%esi),%xmm4 + .byte 15,88,166,18,23,0,0 // addps 0x1712(%esi),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,166,242,22,0,0 // addps 0x16f2(%esi),%xmm4 + .byte 15,88,166,34,23,0,0 // addps 0x1722(%esi),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,166,2,23,0,0 // addps 0x1702(%esi),%xmm4 + .byte 15,88,166,50,23,0,0 // addps 0x1732(%esi),%xmm4 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 15,17,167,160,0,0,0 // movups %xmm4,0xa0(%edi) .byte 139,125,24 // mov 0x18(%ebp),%edi @@ -57993,21 +58461,21 @@ _sk_bicubic_p1y_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 8b68 <_sk_bicubic_p1y_sse2+0xe> + .byte 232,0,0,0,0 // call 8ca8 <_sk_bicubic_p1y_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,58 // mov (%edx),%edi - .byte 15,40,166,104,22,0,0 // movaps 0x1668(%esi),%xmm4 + .byte 15,40,166,152,22,0,0 // movaps 0x1698(%esi),%xmm4 .byte 15,16,79,96 // movups 0x60(%edi),%xmm1 - .byte 15,40,174,120,22,0,0 // movaps 0x1678(%esi),%xmm5 + .byte 15,40,174,168,22,0,0 // movaps 0x16a8(%esi),%xmm5 .byte 15,89,233 // mulps %xmm1,%xmm5 - .byte 15,88,174,136,22,0,0 // addps 0x1688(%esi),%xmm5 + .byte 15,88,174,184,22,0,0 // addps 0x16b8(%esi),%xmm5 .byte 15,89,233 // mulps %xmm1,%xmm5 .byte 15,88,236 // addps %xmm4,%xmm5 .byte 15,89,233 // mulps %xmm1,%xmm5 - .byte 15,88,174,152,22,0,0 // addps 0x1698(%esi),%xmm5 + .byte 15,88,174,200,22,0,0 // addps 0x16c8(%esi),%xmm5 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 15,16,79,32 // movups 0x20(%edi),%xmm1 .byte 15,17,175,160,0,0,0 // movups %xmm5,0xa0(%edi) @@ -58045,7 +58513,7 @@ _sk_bicubic_p3y_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 8c07 <_sk_bicubic_p3y_sse2+0xe> + .byte 232,0,0,0,0 // call 8d47 <_sk_bicubic_p3y_sse2+0xe> .byte 89 // pop %ecx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,85,16 // mov 0x10(%ebp),%edx @@ -58053,10 +58521,10 @@ _sk_bicubic_p3y_sse2: .byte 139,62 // mov (%esi),%edi .byte 15,16,79,32 // movups 0x20(%edi),%xmm1 .byte 15,16,103,96 // movups 0x60(%edi),%xmm4 - .byte 15,88,137,9,22,0,0 // addps 0x1609(%ecx),%xmm1 + .byte 15,88,137,57,22,0,0 // addps 0x1639(%ecx),%xmm1 .byte 15,40,236 // movaps %xmm4,%xmm5 - .byte 15,89,161,25,22,0,0 // mulps 0x1619(%ecx),%xmm4 - .byte 15,88,161,41,22,0,0 // addps 0x1629(%ecx),%xmm4 + .byte 15,89,161,73,22,0,0 // mulps 0x1649(%ecx),%xmm4 + .byte 15,88,161,89,22,0,0 // addps 0x1659(%ecx),%xmm4 .byte 139,77,20 // mov 0x14(%ebp),%ecx .byte 15,89,237 // mulps %xmm5,%xmm5 .byte 15,89,229 // mulps %xmm5,%xmm4 @@ -58306,11 +58774,11 @@ BALIGN16 .byte 0,224 // add %ah,%al .byte 64 // inc %eax .byte 0,0 // add %al,(%eax) - .byte 224,64 // loopne 8f48 <.literal16+0x1d8> + .byte 224,64 // loopne 9088 <.literal16+0x1d8> .byte 0,0 // add %al,(%eax) - .byte 224,64 // loopne 8f4c <.literal16+0x1dc> + .byte 224,64 // loopne 908c <.literal16+0x1dc> .byte 0,0 // add %al,(%eax) - .byte 224,64 // loopne 8f50 <.literal16+0x1e0> + .byte 224,64 // loopne 9090 <.literal16+0x1e0> .byte 154,153,153,62,154,153,153 // lcall $0x9999,$0x9a3e9999 .byte 62,154,153,153,62,154,153,153 // ds lcall $0x9999,$0x9a3e9999 .byte 62,61,10,23,63,61 // ds cmp $0x3d3f170a,%eax @@ -58321,16 +58789,16 @@ BALIGN16 .byte 63 // aas .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8f71 <.literal16+0x201> + .byte 225,61 // loope 90b1 <.literal16+0x201> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8f75 <.literal16+0x205> + .byte 225,61 // loope 90b5 <.literal16+0x205> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8f79 <.literal16+0x209> + .byte 225,61 // loope 90b9 <.literal16+0x209> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8f7d <.literal16+0x20d> + .byte 225,61 // loope 90bd <.literal16+0x20d> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -58347,16 +58815,16 @@ BALIGN16 .byte 63 // aas .byte 61,10,23,63,174 // cmp $0xae3f170a,%eax .byte 71 // inc %edi - .byte 225,61 // loope 8fb1 <.literal16+0x241> + .byte 225,61 // loope 90f1 <.literal16+0x241> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8fb5 <.literal16+0x245> + .byte 225,61 // loope 90f5 <.literal16+0x245> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8fb9 <.literal16+0x249> + .byte 225,61 // loope 90f9 <.literal16+0x249> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8fbd <.literal16+0x24d> + .byte 225,61 // loope 90fd <.literal16+0x24d> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -58373,16 +58841,16 @@ BALIGN16 .byte 63 // aas .byte 61,10,23,63,174 // cmp $0xae3f170a,%eax .byte 71 // inc %edi - .byte 225,61 // loope 8ff1 <.literal16+0x281> + .byte 225,61 // loope 9131 <.literal16+0x281> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8ff5 <.literal16+0x285> + .byte 225,61 // loope 9135 <.literal16+0x285> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8ff9 <.literal16+0x289> + .byte 225,61 // loope 9139 <.literal16+0x289> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8ffd <.literal16+0x28d> + .byte 225,61 // loope 913d <.literal16+0x28d> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -58399,16 +58867,16 @@ BALIGN16 .byte 63 // aas .byte 61,10,23,63,174 // cmp $0xae3f170a,%eax .byte 71 // inc %edi - .byte 225,61 // loope 9031 <.literal16+0x2c1> + .byte 225,61 // loope 9171 <.literal16+0x2c1> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 9035 <.literal16+0x2c5> + .byte 225,61 // loope 9175 <.literal16+0x2c5> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 9039 <.literal16+0x2c9> + .byte 225,61 // loope 9179 <.literal16+0x2c9> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 903d <.literal16+0x2cd> + .byte 225,61 // loope 917d <.literal16+0x2cd> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -58430,11 +58898,11 @@ BALIGN16 .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%eax) .byte 67 // inc %ebx .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 907b <.literal16+0x30b> + .byte 127,67 // jg 91bb <.literal16+0x30b> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 907f <.literal16+0x30f> + .byte 127,67 // jg 91bf <.literal16+0x30f> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9083 <.literal16+0x313> + .byte 127,67 // jg 91c3 <.literal16+0x313> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -58703,13 +59171,13 @@ BALIGN16 .byte 132,55 // test %dh,(%edi) .byte 8,33 // or %ah,(%ecx) .byte 132,55 // test %dh,(%edi) - .byte 224,7 // loopne 92c9 <.literal16+0x559> + .byte 224,7 // loopne 9409 <.literal16+0x559> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 92cd <.literal16+0x55d> + .byte 224,7 // loopne 940d <.literal16+0x55d> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 92d1 <.literal16+0x561> + .byte 224,7 // loopne 9411 <.literal16+0x561> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 92d5 <.literal16+0x565> + .byte 224,7 // loopne 9415 <.literal16+0x565> .byte 0,0 // add %al,(%eax) .byte 33,8 // and %ecx,(%eax) .byte 2,58 // add (%edx),%bh @@ -58758,11 +59226,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,127,67 // add %bh,0x43(%edi) .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 938b <.literal16+0x61b> + .byte 127,67 // jg 94cb <.literal16+0x61b> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 938f <.literal16+0x61f> + .byte 127,67 // jg 94cf <.literal16+0x61f> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9393 <.literal16+0x623> + .byte 127,67 // jg 94d3 <.literal16+0x623> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%eax) .byte 128,59,129 // cmpb $0x81,(%ebx) .byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%eax) @@ -58777,16 +59245,16 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 9384 <.literal16+0x614> + .byte 127,0 // jg 94c4 <.literal16+0x614> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9388 <.literal16+0x618> + .byte 127,0 // jg 94c8 <.literal16+0x618> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 938c <.literal16+0x61c> + .byte 127,0 // jg 94cc <.literal16+0x61c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9390 <.literal16+0x620> + .byte 127,0 // jg 94d0 <.literal16+0x620> .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) @@ -58795,7 +59263,7 @@ BALIGN16 .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) - .byte 119,115 // ja 9415 <.literal16+0x6a5> + .byte 119,115 // ja 9555 <.literal16+0x6a5> .byte 248 // clc .byte 194,119,115 // ret $0x7377 .byte 248 // clc @@ -58806,7 +59274,7 @@ BALIGN16 .byte 194,117,191 // ret $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas - .byte 117,191 // jne 9379 <.literal16+0x609> + .byte 117,191 // jne 94b9 <.literal16+0x609> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas .byte 249 // stc @@ -58822,7 +59290,7 @@ BALIGN16 .byte 68 // inc %esp .byte 180,62 // mov $0x3e,%ah .byte 163,233,220,63,163 // mov %eax,0xa33fdce9 - .byte 233,220,63,163,233 // jmp e9a3d3b6 <_sk_callback_sse2+0xe9a3472b> + .byte 233,220,63,163,233 // jmp e9a3d4f6 <_sk_callback_sse2+0xe9a3472b> .byte 220,63 // fdivrl (%edi) .byte 163,233,220,63,0 // mov %eax,0x3fdce9 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -58877,16 +59345,16 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 9454 <.literal16+0x6e4> + .byte 127,0 // jg 9594 <.literal16+0x6e4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9458 <.literal16+0x6e8> + .byte 127,0 // jg 9598 <.literal16+0x6e8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 945c <.literal16+0x6ec> + .byte 127,0 // jg 959c <.literal16+0x6ec> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9460 <.literal16+0x6f0> + .byte 127,0 // jg 95a0 <.literal16+0x6f0> .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) @@ -58895,7 +59363,7 @@ BALIGN16 .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) - .byte 119,115 // ja 94e5 <.literal16+0x775> + .byte 119,115 // ja 9625 <.literal16+0x775> .byte 248 // clc .byte 194,119,115 // ret $0x7377 .byte 248 // clc @@ -58906,7 +59374,7 @@ BALIGN16 .byte 194,117,191 // ret $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas - .byte 117,191 // jne 9449 <.literal16+0x6d9> + .byte 117,191 // jne 9589 <.literal16+0x6d9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas .byte 249 // stc @@ -58922,7 +59390,7 @@ BALIGN16 .byte 68 // inc %esp .byte 180,62 // mov $0x3e,%ah .byte 163,233,220,63,163 // mov %eax,0xa33fdce9 - .byte 233,220,63,163,233 // jmp e9a3d486 <_sk_callback_sse2+0xe9a347fb> + .byte 233,220,63,163,233 // jmp e9a3d5c6 <_sk_callback_sse2+0xe9a347fb> .byte 220,63 // fdivrl (%edi) .byte 163,233,220,63,0 // mov %eax,0x3fdce9 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -58977,16 +59445,16 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 9524 <.literal16+0x7b4> + .byte 127,0 // jg 9664 <.literal16+0x7b4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9528 <.literal16+0x7b8> + .byte 127,0 // jg 9668 <.literal16+0x7b8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 952c <.literal16+0x7bc> + .byte 127,0 // jg 966c <.literal16+0x7bc> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9530 <.literal16+0x7c0> + .byte 127,0 // jg 9670 <.literal16+0x7c0> .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) @@ -58995,7 +59463,7 @@ BALIGN16 .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) - .byte 119,115 // ja 95b5 <.literal16+0x845> + .byte 119,115 // ja 96f5 <.literal16+0x845> .byte 248 // clc .byte 194,119,115 // ret $0x7377 .byte 248 // clc @@ -59006,7 +59474,7 @@ BALIGN16 .byte 194,117,191 // ret $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas - .byte 117,191 // jne 9519 <.literal16+0x7a9> + .byte 117,191 // jne 9659 <.literal16+0x7a9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas .byte 249 // stc @@ -59022,7 +59490,7 @@ BALIGN16 .byte 68 // inc %esp .byte 180,62 // mov $0x3e,%ah .byte 163,233,220,63,163 // mov %eax,0xa33fdce9 - .byte 233,220,63,163,233 // jmp e9a3d556 <_sk_callback_sse2+0xe9a348cb> + .byte 233,220,63,163,233 // jmp e9a3d696 <_sk_callback_sse2+0xe9a348cb> .byte 220,63 // fdivrl (%edi) .byte 163,233,220,63,0 // mov %eax,0x3fdce9 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -59077,16 +59545,16 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 95f4 <.literal16+0x884> + .byte 127,0 // jg 9734 <.literal16+0x884> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 95f8 <.literal16+0x888> + .byte 127,0 // jg 9738 <.literal16+0x888> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 95fc <.literal16+0x88c> + .byte 127,0 // jg 973c <.literal16+0x88c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 9600 <.literal16+0x890> + .byte 127,0 // jg 9740 <.literal16+0x890> .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) @@ -59095,7 +59563,7 @@ BALIGN16 .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) - .byte 119,115 // ja 9685 <.literal16+0x915> + .byte 119,115 // ja 97c5 <.literal16+0x915> .byte 248 // clc .byte 194,119,115 // ret $0x7377 .byte 248 // clc @@ -59106,7 +59574,7 @@ BALIGN16 .byte 194,117,191 // ret $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas - .byte 117,191 // jne 95e9 <.literal16+0x879> + .byte 117,191 // jne 9729 <.literal16+0x879> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas .byte 249 // stc @@ -59122,7 +59590,7 @@ BALIGN16 .byte 68 // inc %esp .byte 180,62 // mov $0x3e,%ah .byte 163,233,220,63,163 // mov %eax,0xa33fdce9 - .byte 233,220,63,163,233 // jmp e9a3d626 <_sk_callback_sse2+0xe9a3499b> + .byte 233,220,63,163,233 // jmp e9a3d766 <_sk_callback_sse2+0xe9a3499b> .byte 220,63 // fdivrl (%edi) .byte 163,233,220,63,0 // mov %eax,0x3fdce9 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -59173,13 +59641,13 @@ BALIGN16 .byte 200,66,0,0 // enter $0x42,$0x0 .byte 200,66,0,0 // enter $0x42,$0x0 .byte 200,66,0,0 // enter $0x42,$0x0 - .byte 127,67 // jg 9707 <.literal16+0x997> + .byte 127,67 // jg 9847 <.literal16+0x997> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 970b <.literal16+0x99b> + .byte 127,67 // jg 984b <.literal16+0x99b> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 970f <.literal16+0x99f> + .byte 127,67 // jg 984f <.literal16+0x99f> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9713 <.literal16+0x9a3> + .byte 127,67 // jg 9853 <.literal16+0x9a3> .byte 0,0 // add %al,(%eax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%eax) @@ -59230,16 +59698,16 @@ BALIGN16 .byte 128,3,62 // addb $0x3e,(%ebx) .byte 31 // pop %ds .byte 215 // xlat %ds:(%ebx) - .byte 118,63 // jbe 9793 <.literal16+0xa23> + .byte 118,63 // jbe 98d3 <.literal16+0xa23> .byte 31 // pop %ds .byte 215 // xlat %ds:(%ebx) - .byte 118,63 // jbe 9797 <.literal16+0xa27> + .byte 118,63 // jbe 98d7 <.literal16+0xa27> .byte 31 // pop %ds .byte 215 // xlat %ds:(%ebx) - .byte 118,63 // jbe 979b <.literal16+0xa2b> + .byte 118,63 // jbe 98db <.literal16+0xa2b> .byte 31 // pop %ds .byte 215 // xlat %ds:(%ebx) - .byte 118,63 // jbe 979f <.literal16+0xa2f> + .byte 118,63 // jbe 98df <.literal16+0xa2f> .byte 246,64,83,63 // testb $0x3f,0x53(%eax) .byte 246,64,83,63 // testb $0x3f,0x53(%eax) .byte 246,64,83,63 // testb $0x3f,0x53(%eax) @@ -59268,11 +59736,11 @@ BALIGN16 .byte 128,59,0 // cmpb $0x0,(%ebx) .byte 0,127,67 // add %bh,0x43(%edi) .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 980b <.literal16+0xa9b> + .byte 127,67 // jg 994b <.literal16+0xa9b> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 980f <.literal16+0xa9f> + .byte 127,67 // jg 994f <.literal16+0xa9f> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9813 <.literal16+0xaa3> + .byte 127,67 // jg 9953 <.literal16+0xaa3> .byte 255,0 // incl (%eax) .byte 0,0 // add %al,(%eax) .byte 0,0 // add %al,(%eax) @@ -59343,13 +59811,13 @@ BALIGN16 .byte 132,55 // test %dh,(%edi) .byte 8,33 // or %ah,(%ecx) .byte 132,55 // test %dh,(%edi) - .byte 224,7 // loopne 98a9 <.literal16+0xb39> + .byte 224,7 // loopne 99e9 <.literal16+0xb39> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 98ad <.literal16+0xb3d> + .byte 224,7 // loopne 99ed <.literal16+0xb3d> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 98b1 <.literal16+0xb41> + .byte 224,7 // loopne 99f1 <.literal16+0xb41> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 98b5 <.literal16+0xb45> + .byte 224,7 // loopne 99f5 <.literal16+0xb45> .byte 0,0 // add %al,(%eax) .byte 33,8 // and %ecx,(%eax) .byte 2,58 // add (%edx),%bh @@ -59395,13 +59863,13 @@ BALIGN16 .byte 132,55 // test %dh,(%edi) .byte 8,33 // or %ah,(%ecx) .byte 132,55 // test %dh,(%edi) - .byte 224,7 // loopne 9919 <.literal16+0xba9> + .byte 224,7 // loopne 9a59 <.literal16+0xba9> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 991d <.literal16+0xbad> + .byte 224,7 // loopne 9a5d <.literal16+0xbad> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9921 <.literal16+0xbb1> + .byte 224,7 // loopne 9a61 <.literal16+0xbb1> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9925 <.literal16+0xbb5> + .byte 224,7 // loopne 9a65 <.literal16+0xbb5> .byte 0,0 // add %al,(%eax) .byte 33,8 // and %ecx,(%eax) .byte 2,58 // add (%edx),%bh @@ -59447,13 +59915,13 @@ BALIGN16 .byte 132,55 // test %dh,(%edi) .byte 8,33 // or %ah,(%ecx) .byte 132,55 // test %dh,(%edi) - .byte 224,7 // loopne 9989 <.literal16+0xc19> + .byte 224,7 // loopne 9ac9 <.literal16+0xc19> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 998d <.literal16+0xc1d> + .byte 224,7 // loopne 9acd <.literal16+0xc1d> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9991 <.literal16+0xc21> + .byte 224,7 // loopne 9ad1 <.literal16+0xc21> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 9995 <.literal16+0xc25> + .byte 224,7 // loopne 9ad5 <.literal16+0xc25> .byte 0,0 // add %al,(%eax) .byte 33,8 // and %ecx,(%eax) .byte 2,58 // add (%edx),%bh @@ -59495,13 +59963,13 @@ BALIGN16 .byte 248 // clc .byte 65 // inc %ecx .byte 0,0 // add %al,(%eax) - .byte 124,66 // jl 9a26 <.literal16+0xcb6> + .byte 124,66 // jl 9b66 <.literal16+0xcb6> .byte 0,0 // add %al,(%eax) - .byte 124,66 // jl 9a2a <.literal16+0xcba> + .byte 124,66 // jl 9b6a <.literal16+0xcba> .byte 0,0 // add %al,(%eax) - .byte 124,66 // jl 9a2e <.literal16+0xcbe> + .byte 124,66 // jl 9b6e <.literal16+0xcbe> .byte 0,0 // add %al,(%eax) - .byte 124,66 // jl 9a32 <.literal16+0xcc2> + .byte 124,66 // jl 9b72 <.literal16+0xcc2> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%eax) .byte 0,240 // add %dh,%al @@ -59635,13 +60103,13 @@ BALIGN16 .byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%eax) .byte 61,137,136,136,61 // cmp $0x3d888889,%eax .byte 0,0 // add %al,(%eax) - .byte 112,65 // jo 9bb5 <.literal16+0xe45> + .byte 112,65 // jo 9cf5 <.literal16+0xe45> .byte 0,0 // add %al,(%eax) - .byte 112,65 // jo 9bb9 <.literal16+0xe49> + .byte 112,65 // jo 9cf9 <.literal16+0xe49> .byte 0,0 // add %al,(%eax) - .byte 112,65 // jo 9bbd <.literal16+0xe4d> + .byte 112,65 // jo 9cfd <.literal16+0xe4d> .byte 0,0 // add %al,(%eax) - .byte 112,65 // jo 9bc1 <.literal16+0xe51> + .byte 112,65 // jo 9d01 <.literal16+0xe51> .byte 255,0 // incl (%eax) .byte 0,0 // add %al,(%eax) .byte 255,0 // incl (%eax) @@ -59672,11 +60140,11 @@ BALIGN16 .byte 128,59,129 // cmpb $0x81,(%ebx) .byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax) .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9c2b <.literal16+0xebb> + .byte 127,67 // jg 9d6b <.literal16+0xebb> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9c2f <.literal16+0xebf> + .byte 127,67 // jg 9d6f <.literal16+0xebf> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9c33 <.literal16+0xec3> + .byte 127,67 // jg 9d73 <.literal16+0xec3> .byte 255,0 // incl (%eax) .byte 0,0 // add %al,(%eax) .byte 255,0 // incl (%eax) @@ -59707,11 +60175,11 @@ BALIGN16 .byte 128,59,129 // cmpb $0x81,(%ebx) .byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax) .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9c9b <.literal16+0xf2b> + .byte 127,67 // jg 9ddb <.literal16+0xf2b> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9c9f <.literal16+0xf2f> + .byte 127,67 // jg 9ddf <.literal16+0xf2f> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 9ca3 <.literal16+0xf33> + .byte 127,67 // jg 9de3 <.literal16+0xf33> .byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax) .byte 0,0 // add %al,(%eax) .byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax) @@ -59810,13 +60278,13 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 255 // (bad) - .byte 127,71 // jg 9dcb <.literal16+0x105b> + .byte 127,71 // jg 9f0b <.literal16+0x105b> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 9dcf <.literal16+0x105f> + .byte 127,71 // jg 9f0f <.literal16+0x105f> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 9dd3 <.literal16+0x1063> + .byte 127,71 // jg 9f13 <.literal16+0x1063> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 9dd7 <.literal16+0x1067> + .byte 127,71 // jg 9f17 <.literal16+0x1067> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -59924,7 +60392,7 @@ BALIGN16 .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110 .byte 17,192 // adc %eax,%eax .byte 45,16,17,192,18 // sub $0x12c01110,%eax - .byte 120,57 // js 9edc <.literal16+0x116c> + .byte 120,57 // js a01c <.literal16+0x116c> .byte 64 // inc %eax .byte 18,120,57 // adc 0x39(%eax),%bh .byte 64 // inc %eax @@ -60021,7 +60489,25 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) - .byte 0,63 // add %bh,(%edi) + .byte 0,192 // add %al,%al + .byte 0,0 // add %al,(%eax) + .byte 0,192 // add %al,%al + .byte 0,0 // add %al,(%eax) + .byte 0,192 // add %al,%al + .byte 0,0 // add %al,(%eax) + .byte 0,192 // add %al,%al + .byte 0,0 // add %al,(%eax) + .byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax) + .byte 0,0 // add %al,(%eax) + .byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax) + .byte 0,0 // add %al,(%eax) + .byte 128,63,0 // cmpb $0x0,(%edi) + .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) + .byte 63 // aas + .byte 0,0 // add %al,(%eax) + .byte 128,63,0 // cmpb $0x0,(%edi) + .byte 0,0 // add %al,(%eax) + .byte 63 // aas .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) @@ -60081,11 +60567,11 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 128,63,114 // cmpb $0x72,(%edi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt a062 <.literal16+0x12f2> + .byte 62,114,28 // jb,pt a1d2 <.literal16+0x1322> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a066 <.literal16+0x12f6> + .byte 62,114,28 // jb,pt a1d6 <.literal16+0x1326> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a06a <.literal16+0x12fa> + .byte 62,114,28 // jb,pt a1da <.literal16+0x132a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%edi) .byte 170 // stos %al,%es:(%edi) @@ -60164,13 +60650,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%edi) .byte 0,192 // add %al,%al .byte 63 // aas - .byte 114,28 // jb a12e <.literal16+0x13be> + .byte 114,28 // jb a29e <.literal16+0x13ee> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a132 <.literal16+0x13c2> + .byte 62,114,28 // jb,pt a2a2 <.literal16+0x13f2> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a136 <.literal16+0x13c6> + .byte 62,114,28 // jb,pt a2a6 <.literal16+0x13f6> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a13a <.literal16+0x13ca> + .byte 62,114,28 // jb,pt a2aa <.literal16+0x13fa> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%edi) .byte 170 // stos %al,%es:(%edi) @@ -60191,11 +60677,11 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 128,63,114 // cmpb $0x72,(%edi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt a172 <.literal16+0x1402> + .byte 62,114,28 // jb,pt a2e2 <.literal16+0x1432> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a176 <.literal16+0x1406> + .byte 62,114,28 // jb,pt a2e6 <.literal16+0x1436> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a17a <.literal16+0x140a> + .byte 62,114,28 // jb,pt a2ea <.literal16+0x143a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%edi) .byte 170 // stos %al,%es:(%edi) @@ -60274,13 +60760,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%edi) .byte 0,192 // add %al,%al .byte 63 // aas - .byte 114,28 // jb a23e <.literal16+0x14ce> + .byte 114,28 // jb a3ae <.literal16+0x14fe> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a242 <_sk_callback_sse2+0x15b7> + .byte 62,114,28 // jb,pt a3b2 <_sk_callback_sse2+0x15e7> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a246 <_sk_callback_sse2+0x15bb> + .byte 62,114,28 // jb,pt a3b6 <_sk_callback_sse2+0x15eb> .byte 199 // (bad) - .byte 62,114,28 // jb,pt a24a <_sk_callback_sse2+0x15bf> + .byte 62,114,28 // jb,pt a3ba <_sk_callback_sse2+0x15ef> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%edi) .byte 170 // stos %al,%es:(%edi) diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S index f39d55a668..de4f9f947e 100644 --- a/src/jumper/SkJumper_generated_win.S +++ b/src/jumper/SkJumper_generated_win.S @@ -94,7 +94,7 @@ _sk_seed_shader_hsw LABEL PROC DB 197,249,110,194 ; vmovd %edx,%xmm0 DB 196,226,125,88,192 ; vpbroadcastd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,154,85,0,0 ; vbroadcastss 0x559a(%rip),%ymm1 # 56cc <_sk_callback_hsw+0x129> + DB 196,226,125,24,13,66,86,0,0 ; vbroadcastss 0x5642(%rip),%ymm1 # 5774 <_sk_callback_hsw+0x12b> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0 DB 197,249,110,209 ; vmovd %ecx,%xmm2 @@ -102,7 +102,7 @@ _sk_seed_shader_hsw LABEL PROC DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,21,122,85,0,0 ; vbroadcastss 0x557a(%rip),%ymm2 # 56d0 <_sk_callback_hsw+0x12d> + DB 196,226,125,24,21,34,86,0,0 ; vbroadcastss 0x5622(%rip),%ymm2 # 5778 <_sk_callback_hsw+0x12f> DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3 DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 @@ -119,13 +119,13 @@ _sk_dither_hsw LABEL PROC DB 197,121,110,201 ; vmovd %ecx,%xmm9 DB 196,66,125,88,201 ; vpbroadcastd %xmm9,%ymm9 DB 196,65,53,239,200 ; vpxor %ymm8,%ymm9,%ymm9 - DB 196,98,125,88,21,65,85,0,0 ; vpbroadcastd 0x5541(%rip),%ymm10 # 56d4 <_sk_callback_hsw+0x131> + DB 196,98,125,88,21,233,85,0,0 ; vpbroadcastd 0x55e9(%rip),%ymm10 # 577c <_sk_callback_hsw+0x133> DB 196,65,53,219,218 ; vpand %ymm10,%ymm9,%ymm11 DB 196,193,37,114,243,5 ; vpslld $0x5,%ymm11,%ymm11 DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10 DB 196,193,45,114,242,4 ; vpslld $0x4,%ymm10,%ymm10 - DB 196,98,125,88,37,38,85,0,0 ; vpbroadcastd 0x5526(%rip),%ymm12 # 56d8 <_sk_callback_hsw+0x135> - DB 196,98,125,88,45,33,85,0,0 ; vpbroadcastd 0x5521(%rip),%ymm13 # 56dc <_sk_callback_hsw+0x139> + DB 196,98,125,88,37,206,85,0,0 ; vpbroadcastd 0x55ce(%rip),%ymm12 # 5780 <_sk_callback_hsw+0x137> + DB 196,98,125,88,45,201,85,0,0 ; vpbroadcastd 0x55c9(%rip),%ymm13 # 5784 <_sk_callback_hsw+0x13b> DB 196,65,53,219,245 ; vpand %ymm13,%ymm9,%ymm14 DB 196,193,13,114,246,2 ; vpslld $0x2,%ymm14,%ymm14 DB 196,65,61,219,237 ; vpand %ymm13,%ymm8,%ymm13 @@ -140,8 +140,8 @@ _sk_dither_hsw LABEL PROC DB 196,65,61,235,194 ; vpor %ymm10,%ymm8,%ymm8 DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,211,84,0,0 ; vbroadcastss 0x54d3(%rip),%ymm9 # 56e0 <_sk_callback_hsw+0x13d> - DB 196,98,125,24,21,206,84,0,0 ; vbroadcastss 0x54ce(%rip),%ymm10 # 56e4 <_sk_callback_hsw+0x141> + DB 196,98,125,24,13,123,85,0,0 ; vbroadcastss 0x557b(%rip),%ymm9 # 5788 <_sk_callback_hsw+0x13f> + DB 196,98,125,24,21,118,85,0,0 ; vbroadcastss 0x5576(%rip),%ymm10 # 578c <_sk_callback_hsw+0x143> DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10 DB 196,98,125,24,0 ; vbroadcastss (%rax),%ymm8 DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 @@ -200,7 +200,7 @@ _sk_clear_hsw LABEL PROC PUBLIC _sk_srcatop_hsw _sk_srcatop_hsw LABEL PROC DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0 - DB 196,98,125,24,5,38,84,0,0 ; vbroadcastss 0x5426(%rip),%ymm8 # 56e8 <_sk_callback_hsw+0x145> + DB 196,98,125,24,5,206,84,0,0 ; vbroadcastss 0x54ce(%rip),%ymm8 # 5790 <_sk_callback_hsw+0x147> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,226,61,184,196 ; vfmadd231ps %ymm4,%ymm8,%ymm0 DB 197,244,89,207 ; vmulps %ymm7,%ymm1,%ymm1 @@ -214,7 +214,7 @@ _sk_srcatop_hsw LABEL PROC PUBLIC _sk_dstatop_hsw _sk_dstatop_hsw LABEL PROC - DB 196,98,125,24,5,249,83,0,0 ; vbroadcastss 0x53f9(%rip),%ymm8 # 56ec <_sk_callback_hsw+0x149> + DB 196,98,125,24,5,161,84,0,0 ; vbroadcastss 0x54a1(%rip),%ymm8 # 5794 <_sk_callback_hsw+0x14b> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 196,226,101,184,196 ; vfmadd231ps %ymm4,%ymm3,%ymm0 @@ -247,7 +247,7 @@ _sk_dstin_hsw LABEL PROC PUBLIC _sk_srcout_hsw _sk_srcout_hsw LABEL PROC - DB 196,98,125,24,5,160,83,0,0 ; vbroadcastss 0x53a0(%rip),%ymm8 # 56f0 <_sk_callback_hsw+0x14d> + DB 196,98,125,24,5,72,84,0,0 ; vbroadcastss 0x5448(%rip),%ymm8 # 5798 <_sk_callback_hsw+0x14f> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 @@ -258,7 +258,7 @@ _sk_srcout_hsw LABEL PROC PUBLIC _sk_dstout_hsw _sk_dstout_hsw LABEL PROC - DB 196,226,125,24,5,131,83,0,0 ; vbroadcastss 0x5383(%rip),%ymm0 # 56f4 <_sk_callback_hsw+0x151> + DB 196,226,125,24,5,43,84,0,0 ; vbroadcastss 0x542b(%rip),%ymm0 # 579c <_sk_callback_hsw+0x153> DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3 DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0 DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1 @@ -269,7 +269,7 @@ _sk_dstout_hsw LABEL PROC PUBLIC _sk_srcover_hsw _sk_srcover_hsw LABEL PROC - DB 196,98,125,24,5,102,83,0,0 ; vbroadcastss 0x5366(%rip),%ymm8 # 56f8 <_sk_callback_hsw+0x155> + DB 196,98,125,24,5,14,84,0,0 ; vbroadcastss 0x540e(%rip),%ymm8 # 57a0 <_sk_callback_hsw+0x157> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0 DB 196,194,85,184,200 ; vfmadd231ps %ymm8,%ymm5,%ymm1 @@ -280,7 +280,7 @@ _sk_srcover_hsw LABEL PROC PUBLIC _sk_dstover_hsw _sk_dstover_hsw LABEL PROC - DB 196,98,125,24,5,69,83,0,0 ; vbroadcastss 0x5345(%rip),%ymm8 # 56fc <_sk_callback_hsw+0x159> + DB 196,98,125,24,5,237,83,0,0 ; vbroadcastss 0x53ed(%rip),%ymm8 # 57a4 <_sk_callback_hsw+0x15b> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0 DB 196,226,61,168,205 ; vfmadd213ps %ymm5,%ymm8,%ymm1 @@ -300,7 +300,7 @@ _sk_modulate_hsw LABEL PROC PUBLIC _sk_multiply_hsw _sk_multiply_hsw LABEL PROC - DB 196,98,125,24,5,16,83,0,0 ; vbroadcastss 0x5310(%rip),%ymm8 # 5700 <_sk_callback_hsw+0x15d> + DB 196,98,125,24,5,184,83,0,0 ; vbroadcastss 0x53b8(%rip),%ymm8 # 57a8 <_sk_callback_hsw+0x15f> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -342,7 +342,7 @@ _sk_screen_hsw LABEL PROC PUBLIC _sk_xor__hsw _sk_xor__hsw LABEL PROC - DB 196,98,125,24,5,139,82,0,0 ; vbroadcastss 0x528b(%rip),%ymm8 # 5704 <_sk_callback_hsw+0x161> + DB 196,98,125,24,5,51,83,0,0 ; vbroadcastss 0x5333(%rip),%ymm8 # 57ac <_sk_callback_hsw+0x163> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -374,7 +374,7 @@ _sk_darken_hsw LABEL PROC DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9 DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,19,82,0,0 ; vbroadcastss 0x5213(%rip),%ymm8 # 5708 <_sk_callback_hsw+0x165> + DB 196,98,125,24,5,187,82,0,0 ; vbroadcastss 0x52bb(%rip),%ymm8 # 57b0 <_sk_callback_hsw+0x167> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -397,7 +397,7 @@ _sk_lighten_hsw LABEL PROC DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9 DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,194,81,0,0 ; vbroadcastss 0x51c2(%rip),%ymm8 # 570c <_sk_callback_hsw+0x169> + DB 196,98,125,24,5,106,82,0,0 ; vbroadcastss 0x526a(%rip),%ymm8 # 57b4 <_sk_callback_hsw+0x16b> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -423,7 +423,7 @@ _sk_difference_hsw LABEL PROC DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2 DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,101,81,0,0 ; vbroadcastss 0x5165(%rip),%ymm8 # 5710 <_sk_callback_hsw+0x16d> + DB 196,98,125,24,5,13,82,0,0 ; vbroadcastss 0x520d(%rip),%ymm8 # 57b8 <_sk_callback_hsw+0x16f> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -443,7 +443,7 @@ _sk_exclusion_hsw LABEL PROC DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2 DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,35,81,0,0 ; vbroadcastss 0x5123(%rip),%ymm8 # 5714 <_sk_callback_hsw+0x171> + DB 196,98,125,24,5,203,81,0,0 ; vbroadcastss 0x51cb(%rip),%ymm8 # 57bc <_sk_callback_hsw+0x173> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -451,7 +451,7 @@ _sk_exclusion_hsw LABEL PROC PUBLIC _sk_colorburn_hsw _sk_colorburn_hsw LABEL PROC - DB 196,98,125,24,5,17,81,0,0 ; vbroadcastss 0x5111(%rip),%ymm8 # 5718 <_sk_callback_hsw+0x175> + DB 196,98,125,24,5,185,81,0,0 ; vbroadcastss 0x51b9(%rip),%ymm8 # 57c0 <_sk_callback_hsw+0x177> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11 DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10 @@ -507,7 +507,7 @@ _sk_colorburn_hsw LABEL PROC PUBLIC _sk_colordodge_hsw _sk_colordodge_hsw LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 - DB 196,98,125,24,13,28,80,0,0 ; vbroadcastss 0x501c(%rip),%ymm9 # 571c <_sk_callback_hsw+0x179> + DB 196,98,125,24,13,196,80,0,0 ; vbroadcastss 0x50c4(%rip),%ymm9 # 57c4 <_sk_callback_hsw+0x17b> DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10 DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11 DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9 @@ -558,7 +558,7 @@ _sk_colordodge_hsw LABEL PROC PUBLIC _sk_hardlight_hsw _sk_hardlight_hsw LABEL PROC - DB 196,98,125,24,5,61,79,0,0 ; vbroadcastss 0x4f3d(%rip),%ymm8 # 5720 <_sk_callback_hsw+0x17d> + DB 196,98,125,24,5,229,79,0,0 ; vbroadcastss 0x4fe5(%rip),%ymm8 # 57c8 <_sk_callback_hsw+0x17f> DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10 DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -607,7 +607,7 @@ _sk_hardlight_hsw LABEL PROC PUBLIC _sk_overlay_hsw _sk_overlay_hsw LABEL PROC - DB 196,98,125,24,5,117,78,0,0 ; vbroadcastss 0x4e75(%rip),%ymm8 # 5724 <_sk_callback_hsw+0x181> + DB 196,98,125,24,5,29,79,0,0 ; vbroadcastss 0x4f1d(%rip),%ymm8 # 57cc <_sk_callback_hsw+0x183> DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10 DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -667,10 +667,10 @@ _sk_softlight_hsw LABEL PROC DB 196,65,20,88,197 ; vaddps %ymm13,%ymm13,%ymm8 DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8 DB 196,66,61,168,192 ; vfmadd213ps %ymm8,%ymm8,%ymm8 - DB 196,98,125,24,29,124,77,0,0 ; vbroadcastss 0x4d7c(%rip),%ymm11 # 572c <_sk_callback_hsw+0x189> + DB 196,98,125,24,29,36,78,0,0 ; vbroadcastss 0x4e24(%rip),%ymm11 # 57d4 <_sk_callback_hsw+0x18b> DB 196,65,20,88,227 ; vaddps %ymm11,%ymm13,%ymm12 DB 196,65,28,89,192 ; vmulps %ymm8,%ymm12,%ymm8 - DB 196,98,125,24,37,109,77,0,0 ; vbroadcastss 0x4d6d(%rip),%ymm12 # 5730 <_sk_callback_hsw+0x18d> + DB 196,98,125,24,37,21,78,0,0 ; vbroadcastss 0x4e15(%rip),%ymm12 # 57d8 <_sk_callback_hsw+0x18f> DB 196,66,21,184,196 ; vfmadd231ps %ymm12,%ymm13,%ymm8 DB 196,65,124,82,245 ; vrsqrtps %ymm13,%ymm14 DB 196,65,124,83,246 ; vrcpps %ymm14,%ymm14 @@ -680,7 +680,7 @@ _sk_softlight_hsw LABEL PROC DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15 DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14 DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15 - DB 196,98,125,24,5,48,77,0,0 ; vbroadcastss 0x4d30(%rip),%ymm8 # 5728 <_sk_callback_hsw+0x185> + DB 196,98,125,24,5,216,77,0,0 ; vbroadcastss 0x4dd8(%rip),%ymm8 # 57d0 <_sk_callback_hsw+0x187> DB 196,65,60,92,237 ; vsubps %ymm13,%ymm8,%ymm13 DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0 DB 196,98,125,168,235 ; vfmadd213ps %ymm3,%ymm0,%ymm13 @@ -793,11 +793,11 @@ _sk_hue_hsw LABEL PROC DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10 DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10 DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - DB 196,98,125,24,53,47,75,0,0 ; vbroadcastss 0x4b2f(%rip),%ymm14 # 5734 <_sk_callback_hsw+0x191> - DB 196,98,125,24,61,42,75,0,0 ; vbroadcastss 0x4b2a(%rip),%ymm15 # 5738 <_sk_callback_hsw+0x195> + DB 196,98,125,24,53,215,75,0,0 ; vbroadcastss 0x4bd7(%rip),%ymm14 # 57dc <_sk_callback_hsw+0x193> + DB 196,98,125,24,61,210,75,0,0 ; vbroadcastss 0x4bd2(%rip),%ymm15 # 57e0 <_sk_callback_hsw+0x197> DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13 DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13 - DB 196,226,125,24,5,27,75,0,0 ; vbroadcastss 0x4b1b(%rip),%ymm0 # 573c <_sk_callback_hsw+0x199> + DB 196,226,125,24,5,195,75,0,0 ; vbroadcastss 0x4bc3(%rip),%ymm0 # 57e4 <_sk_callback_hsw+0x19b> DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13 DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10 DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -852,7 +852,7 @@ _sk_hue_hsw LABEL PROC DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0 DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9 DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8 - DB 196,226,125,24,13,8,74,0,0 ; vbroadcastss 0x4a08(%rip),%ymm1 # 5740 <_sk_callback_hsw+0x19d> + DB 196,226,125,24,13,176,74,0,0 ; vbroadcastss 0x4ab0(%rip),%ymm1 # 57e8 <_sk_callback_hsw+0x19f> DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11 @@ -906,11 +906,11 @@ _sk_saturation_hsw LABEL PROC DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10 DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10 DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - DB 196,98,125,24,53,25,73,0,0 ; vbroadcastss 0x4919(%rip),%ymm14 # 5744 <_sk_callback_hsw+0x1a1> - DB 196,98,125,24,61,20,73,0,0 ; vbroadcastss 0x4914(%rip),%ymm15 # 5748 <_sk_callback_hsw+0x1a5> + DB 196,98,125,24,53,193,73,0,0 ; vbroadcastss 0x49c1(%rip),%ymm14 # 57ec <_sk_callback_hsw+0x1a3> + DB 196,98,125,24,61,188,73,0,0 ; vbroadcastss 0x49bc(%rip),%ymm15 # 57f0 <_sk_callback_hsw+0x1a7> DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13 DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13 - DB 196,226,125,24,5,5,73,0,0 ; vbroadcastss 0x4905(%rip),%ymm0 # 574c <_sk_callback_hsw+0x1a9> + DB 196,226,125,24,5,173,73,0,0 ; vbroadcastss 0x49ad(%rip),%ymm0 # 57f4 <_sk_callback_hsw+0x1ab> DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13 DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10 DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -965,7 +965,7 @@ _sk_saturation_hsw LABEL PROC DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0 DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9 DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8 - DB 196,226,125,24,13,242,71,0,0 ; vbroadcastss 0x47f2(%rip),%ymm1 # 5750 <_sk_callback_hsw+0x1ad> + DB 196,226,125,24,13,154,72,0,0 ; vbroadcastss 0x489a(%rip),%ymm1 # 57f8 <_sk_callback_hsw+0x1af> DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11 @@ -993,11 +993,11 @@ _sk_color_hsw LABEL PROC DB 197,108,89,199 ; vmulps %ymm7,%ymm2,%ymm8 DB 197,116,89,215 ; vmulps %ymm7,%ymm1,%ymm10 DB 197,52,89,223 ; vmulps %ymm7,%ymm9,%ymm11 - DB 196,98,125,24,45,133,71,0,0 ; vbroadcastss 0x4785(%rip),%ymm13 # 5754 <_sk_callback_hsw+0x1b1> - DB 196,98,125,24,53,128,71,0,0 ; vbroadcastss 0x4780(%rip),%ymm14 # 5758 <_sk_callback_hsw+0x1b5> + DB 196,98,125,24,45,45,72,0,0 ; vbroadcastss 0x482d(%rip),%ymm13 # 57fc <_sk_callback_hsw+0x1b3> + DB 196,98,125,24,53,40,72,0,0 ; vbroadcastss 0x4828(%rip),%ymm14 # 5800 <_sk_callback_hsw+0x1b7> DB 196,65,84,89,230 ; vmulps %ymm14,%ymm5,%ymm12 DB 196,66,93,184,229 ; vfmadd231ps %ymm13,%ymm4,%ymm12 - DB 196,98,125,24,61,113,71,0,0 ; vbroadcastss 0x4771(%rip),%ymm15 # 575c <_sk_callback_hsw+0x1b9> + DB 196,98,125,24,61,25,72,0,0 ; vbroadcastss 0x4819(%rip),%ymm15 # 5804 <_sk_callback_hsw+0x1bb> DB 196,66,77,184,231 ; vfmadd231ps %ymm15,%ymm6,%ymm12 DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9 DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -1053,7 +1053,7 @@ _sk_color_hsw LABEL PROC DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1 DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8 DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9 - DB 196,226,125,24,5,83,70,0,0 ; vbroadcastss 0x4653(%rip),%ymm0 # 5760 <_sk_callback_hsw+0x1bd> + DB 196,226,125,24,5,251,70,0,0 ; vbroadcastss 0x46fb(%rip),%ymm0 # 5808 <_sk_callback_hsw+0x1bf> DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11 @@ -1081,11 +1081,11 @@ _sk_luminosity_hsw LABEL PROC DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8 DB 197,100,89,213 ; vmulps %ymm5,%ymm3,%ymm10 DB 197,100,89,222 ; vmulps %ymm6,%ymm3,%ymm11 - DB 196,98,125,24,45,230,69,0,0 ; vbroadcastss 0x45e6(%rip),%ymm13 # 5764 <_sk_callback_hsw+0x1c1> - DB 196,98,125,24,53,225,69,0,0 ; vbroadcastss 0x45e1(%rip),%ymm14 # 5768 <_sk_callback_hsw+0x1c5> + DB 196,98,125,24,45,142,70,0,0 ; vbroadcastss 0x468e(%rip),%ymm13 # 580c <_sk_callback_hsw+0x1c3> + DB 196,98,125,24,53,137,70,0,0 ; vbroadcastss 0x4689(%rip),%ymm14 # 5810 <_sk_callback_hsw+0x1c7> DB 196,65,116,89,230 ; vmulps %ymm14,%ymm1,%ymm12 DB 196,66,109,184,229 ; vfmadd231ps %ymm13,%ymm2,%ymm12 - DB 196,98,125,24,61,210,69,0,0 ; vbroadcastss 0x45d2(%rip),%ymm15 # 576c <_sk_callback_hsw+0x1c9> + DB 196,98,125,24,61,122,70,0,0 ; vbroadcastss 0x467a(%rip),%ymm15 # 5814 <_sk_callback_hsw+0x1cb> DB 196,66,53,184,231 ; vfmadd231ps %ymm15,%ymm9,%ymm12 DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9 DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -1141,7 +1141,7 @@ _sk_luminosity_hsw LABEL PROC DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1 DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8 DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9 - DB 196,226,125,24,5,180,68,0,0 ; vbroadcastss 0x44b4(%rip),%ymm0 # 5770 <_sk_callback_hsw+0x1cd> + DB 196,226,125,24,5,92,69,0,0 ; vbroadcastss 0x455c(%rip),%ymm0 # 5818 <_sk_callback_hsw+0x1cf> DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11 @@ -1168,17 +1168,17 @@ _sk_srcover_rgba_8888_hsw LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 15,133,180,0,0,0 ; jne 13ce <_sk_srcover_rgba_8888_hsw+0xcd> DB 196,193,124,16,58 ; vmovups (%r10),%ymm7 - DB 197,196,84,37,57,72,0,0 ; vandps 0x4839(%rip),%ymm7,%ymm4 # 5b60 <_sk_callback_hsw+0x5bd> + DB 197,196,84,37,249,72,0,0 ; vandps 0x48f9(%rip),%ymm7,%ymm4 # 5c20 <_sk_callback_hsw+0x5d7> DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,69,0,45,76,72,0,0 ; vpshufb 0x484c(%rip),%ymm7,%ymm5 # 5b80 <_sk_callback_hsw+0x5dd> + DB 196,226,69,0,45,12,73,0,0 ; vpshufb 0x490c(%rip),%ymm7,%ymm5 # 5c40 <_sk_callback_hsw+0x5f7> DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 - DB 196,226,69,0,53,95,72,0,0 ; vpshufb 0x485f(%rip),%ymm7,%ymm6 # 5ba0 <_sk_callback_hsw+0x5fd> + DB 196,226,69,0,53,31,73,0,0 ; vpshufb 0x491f(%rip),%ymm7,%ymm6 # 5c60 <_sk_callback_hsw+0x617> DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6 DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7 DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7 - DB 196,98,125,24,5,29,68,0,0 ; vbroadcastss 0x441d(%rip),%ymm8 # 5774 <_sk_callback_hsw+0x1d1> + DB 196,98,125,24,5,197,68,0,0 ; vbroadcastss 0x44c5(%rip),%ymm8 # 581c <_sk_callback_hsw+0x1d3> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 - DB 196,98,125,24,13,20,68,0,0 ; vbroadcastss 0x4414(%rip),%ymm9 # 5778 <_sk_callback_hsw+0x1d5> + DB 196,98,125,24,13,188,68,0,0 ; vbroadcastss 0x44bc(%rip),%ymm9 # 5820 <_sk_callback_hsw+0x1d7> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0 DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1 @@ -1234,7 +1234,7 @@ _sk_clamp_0_hsw LABEL PROC PUBLIC _sk_clamp_1_hsw _sk_clamp_1_hsw LABEL PROC - DB 196,98,125,24,5,57,67,0,0 ; vbroadcastss 0x4339(%rip),%ymm8 # 577c <_sk_callback_hsw+0x1d9> + DB 196,98,125,24,5,225,67,0,0 ; vbroadcastss 0x43e1(%rip),%ymm8 # 5824 <_sk_callback_hsw+0x1db> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1 DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2 @@ -1244,7 +1244,7 @@ _sk_clamp_1_hsw LABEL PROC PUBLIC _sk_clamp_a_hsw _sk_clamp_a_hsw LABEL PROC - DB 196,98,125,24,5,28,67,0,0 ; vbroadcastss 0x431c(%rip),%ymm8 # 5780 <_sk_callback_hsw+0x1dd> + DB 196,98,125,24,5,196,67,0,0 ; vbroadcastss 0x43c4(%rip),%ymm8 # 5828 <_sk_callback_hsw+0x1df> DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3 DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0 DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1 @@ -1254,7 +1254,7 @@ _sk_clamp_a_hsw LABEL PROC PUBLIC _sk_clamp_a_dst_hsw _sk_clamp_a_dst_hsw LABEL PROC - DB 196,98,125,24,5,2,67,0,0 ; vbroadcastss 0x4302(%rip),%ymm8 # 5784 <_sk_callback_hsw+0x1e1> + DB 196,98,125,24,5,170,67,0,0 ; vbroadcastss 0x43aa(%rip),%ymm8 # 582c <_sk_callback_hsw+0x1e3> DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7 DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4 DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5 @@ -1309,7 +1309,7 @@ PUBLIC _sk_unpremul_hsw _sk_unpremul_hsw LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9 - DB 196,98,125,24,21,126,66,0,0 ; vbroadcastss 0x427e(%rip),%ymm10 # 5788 <_sk_callback_hsw+0x1e5> + DB 196,98,125,24,21,38,67,0,0 ; vbroadcastss 0x4326(%rip),%ymm10 # 5830 <_sk_callback_hsw+0x1e7> DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10 DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 @@ -1320,16 +1320,16 @@ _sk_unpremul_hsw LABEL PROC PUBLIC _sk_from_srgb_hsw _sk_from_srgb_hsw LABEL PROC - DB 196,98,125,24,5,95,66,0,0 ; vbroadcastss 0x425f(%rip),%ymm8 # 578c <_sk_callback_hsw+0x1e9> + DB 196,98,125,24,5,7,67,0,0 ; vbroadcastss 0x4307(%rip),%ymm8 # 5834 <_sk_callback_hsw+0x1eb> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10 - DB 196,98,125,24,29,81,66,0,0 ; vbroadcastss 0x4251(%rip),%ymm11 # 5790 <_sk_callback_hsw+0x1ed> - DB 196,98,125,24,37,76,66,0,0 ; vbroadcastss 0x424c(%rip),%ymm12 # 5794 <_sk_callback_hsw+0x1f1> + DB 196,98,125,24,29,249,66,0,0 ; vbroadcastss 0x42f9(%rip),%ymm11 # 5838 <_sk_callback_hsw+0x1ef> + DB 196,98,125,24,37,244,66,0,0 ; vbroadcastss 0x42f4(%rip),%ymm12 # 583c <_sk_callback_hsw+0x1f3> DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13 DB 196,66,125,168,235 ; vfmadd213ps %ymm11,%ymm0,%ymm13 - DB 196,98,125,24,53,61,66,0,0 ; vbroadcastss 0x423d(%rip),%ymm14 # 5798 <_sk_callback_hsw+0x1f5> + DB 196,98,125,24,53,229,66,0,0 ; vbroadcastss 0x42e5(%rip),%ymm14 # 5840 <_sk_callback_hsw+0x1f7> DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13 - DB 196,98,125,24,21,51,66,0,0 ; vbroadcastss 0x4233(%rip),%ymm10 # 579c <_sk_callback_hsw+0x1f9> + DB 196,98,125,24,21,219,66,0,0 ; vbroadcastss 0x42db(%rip),%ymm10 # 5844 <_sk_callback_hsw+0x1fb> DB 196,193,124,194,194,1 ; vcmpltps %ymm10,%ymm0,%ymm0 DB 196,195,21,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm13,%ymm0 DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9 @@ -1350,16 +1350,16 @@ _sk_from_srgb_hsw LABEL PROC PUBLIC _sk_from_srgb_dst_hsw _sk_from_srgb_dst_hsw LABEL PROC - DB 196,98,125,24,5,219,65,0,0 ; vbroadcastss 0x41db(%rip),%ymm8 # 57a0 <_sk_callback_hsw+0x1fd> + DB 196,98,125,24,5,131,66,0,0 ; vbroadcastss 0x4283(%rip),%ymm8 # 5848 <_sk_callback_hsw+0x1ff> DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9 DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10 - DB 196,98,125,24,29,205,65,0,0 ; vbroadcastss 0x41cd(%rip),%ymm11 # 57a4 <_sk_callback_hsw+0x201> - DB 196,98,125,24,37,200,65,0,0 ; vbroadcastss 0x41c8(%rip),%ymm12 # 57a8 <_sk_callback_hsw+0x205> + DB 196,98,125,24,29,117,66,0,0 ; vbroadcastss 0x4275(%rip),%ymm11 # 584c <_sk_callback_hsw+0x203> + DB 196,98,125,24,37,112,66,0,0 ; vbroadcastss 0x4270(%rip),%ymm12 # 5850 <_sk_callback_hsw+0x207> DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13 DB 196,66,93,168,235 ; vfmadd213ps %ymm11,%ymm4,%ymm13 - DB 196,98,125,24,53,185,65,0,0 ; vbroadcastss 0x41b9(%rip),%ymm14 # 57ac <_sk_callback_hsw+0x209> + DB 196,98,125,24,53,97,66,0,0 ; vbroadcastss 0x4261(%rip),%ymm14 # 5854 <_sk_callback_hsw+0x20b> DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13 - DB 196,98,125,24,21,175,65,0,0 ; vbroadcastss 0x41af(%rip),%ymm10 # 57b0 <_sk_callback_hsw+0x20d> + DB 196,98,125,24,21,87,66,0,0 ; vbroadcastss 0x4257(%rip),%ymm10 # 5858 <_sk_callback_hsw+0x20f> DB 196,193,92,194,226,1 ; vcmpltps %ymm10,%ymm4,%ymm4 DB 196,195,21,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm13,%ymm4 DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9 @@ -1381,19 +1381,19 @@ _sk_from_srgb_dst_hsw LABEL PROC PUBLIC _sk_to_srgb_hsw _sk_to_srgb_hsw LABEL PROC DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9 - DB 196,98,125,24,5,83,65,0,0 ; vbroadcastss 0x4153(%rip),%ymm8 # 57b4 <_sk_callback_hsw+0x211> + DB 196,98,125,24,5,251,65,0,0 ; vbroadcastss 0x41fb(%rip),%ymm8 # 585c <_sk_callback_hsw+0x213> DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10 - DB 196,98,125,24,29,73,65,0,0 ; vbroadcastss 0x4149(%rip),%ymm11 # 57b8 <_sk_callback_hsw+0x215> - DB 196,98,125,24,37,68,65,0,0 ; vbroadcastss 0x4144(%rip),%ymm12 # 57bc <_sk_callback_hsw+0x219> + DB 196,98,125,24,29,241,65,0,0 ; vbroadcastss 0x41f1(%rip),%ymm11 # 5860 <_sk_callback_hsw+0x217> + DB 196,98,125,24,37,236,65,0,0 ; vbroadcastss 0x41ec(%rip),%ymm12 # 5864 <_sk_callback_hsw+0x21b> DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13 DB 196,66,53,168,235 ; vfmadd213ps %ymm11,%ymm9,%ymm13 - DB 196,98,125,24,53,53,65,0,0 ; vbroadcastss 0x4135(%rip),%ymm14 # 57c0 <_sk_callback_hsw+0x21d> + DB 196,98,125,24,53,221,65,0,0 ; vbroadcastss 0x41dd(%rip),%ymm14 # 5868 <_sk_callback_hsw+0x21f> DB 196,66,53,168,238 ; vfmadd213ps %ymm14,%ymm9,%ymm13 - DB 196,98,125,24,61,43,65,0,0 ; vbroadcastss 0x412b(%rip),%ymm15 # 57c4 <_sk_callback_hsw+0x221> + DB 196,98,125,24,61,211,65,0,0 ; vbroadcastss 0x41d3(%rip),%ymm15 # 586c <_sk_callback_hsw+0x223> DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9 DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9 DB 196,65,20,89,201 ; vmulps %ymm9,%ymm13,%ymm9 - DB 196,98,125,24,45,23,65,0,0 ; vbroadcastss 0x4117(%rip),%ymm13 # 57c8 <_sk_callback_hsw+0x225> + DB 196,98,125,24,45,191,65,0,0 ; vbroadcastss 0x41bf(%rip),%ymm13 # 5870 <_sk_callback_hsw+0x227> DB 196,193,124,194,197,1 ; vcmpltps %ymm13,%ymm0,%ymm0 DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0 DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9 @@ -1425,26 +1425,26 @@ _sk_rgb_to_hsl_hsw LABEL PROC DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9 DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9 DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10 - DB 196,98,125,24,29,140,64,0,0 ; vbroadcastss 0x408c(%rip),%ymm11 # 57cc <_sk_callback_hsw+0x229> + DB 196,98,125,24,29,52,65,0,0 ; vbroadcastss 0x4134(%rip),%ymm11 # 5874 <_sk_callback_hsw+0x22b> DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11 DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12 DB 197,116,194,234,1 ; vcmpltps %ymm2,%ymm1,%ymm13 - DB 196,98,125,24,53,121,64,0,0 ; vbroadcastss 0x4079(%rip),%ymm14 # 57d0 <_sk_callback_hsw+0x22d> + DB 196,98,125,24,53,33,65,0,0 ; vbroadcastss 0x4121(%rip),%ymm14 # 5878 <_sk_callback_hsw+0x22f> DB 196,65,4,87,255 ; vxorps %ymm15,%ymm15,%ymm15 DB 196,67,5,74,238,208 ; vblendvps %ymm13,%ymm14,%ymm15,%ymm13 DB 196,66,37,168,229 ; vfmadd213ps %ymm13,%ymm11,%ymm12 DB 197,236,92,208 ; vsubps %ymm0,%ymm2,%ymm2 DB 197,124,92,233 ; vsubps %ymm1,%ymm0,%ymm13 - DB 196,98,125,24,53,96,64,0,0 ; vbroadcastss 0x4060(%rip),%ymm14 # 57d8 <_sk_callback_hsw+0x235> + DB 196,98,125,24,53,8,65,0,0 ; vbroadcastss 0x4108(%rip),%ymm14 # 5880 <_sk_callback_hsw+0x237> DB 196,66,37,168,238 ; vfmadd213ps %ymm14,%ymm11,%ymm13 - DB 196,98,125,24,53,78,64,0,0 ; vbroadcastss 0x404e(%rip),%ymm14 # 57d4 <_sk_callback_hsw+0x231> + DB 196,98,125,24,53,246,64,0,0 ; vbroadcastss 0x40f6(%rip),%ymm14 # 587c <_sk_callback_hsw+0x233> DB 196,194,37,168,214 ; vfmadd213ps %ymm14,%ymm11,%ymm2 DB 197,188,194,201,0 ; vcmpeqps %ymm1,%ymm8,%ymm1 DB 196,227,21,74,202,16 ; vblendvps %ymm1,%ymm2,%ymm13,%ymm1 DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0 DB 196,195,117,74,196,0 ; vblendvps %ymm0,%ymm12,%ymm1,%ymm0 DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1 - DB 196,98,125,24,29,49,64,0,0 ; vbroadcastss 0x4031(%rip),%ymm11 # 57e0 <_sk_callback_hsw+0x23d> + DB 196,98,125,24,29,217,64,0,0 ; vbroadcastss 0x40d9(%rip),%ymm11 # 5888 <_sk_callback_hsw+0x23f> DB 196,193,116,89,211 ; vmulps %ymm11,%ymm1,%ymm2 DB 197,36,194,218,1 ; vcmpltps %ymm2,%ymm11,%ymm11 DB 196,65,12,92,224 ; vsubps %ymm8,%ymm14,%ymm12 @@ -1454,7 +1454,7 @@ _sk_rgb_to_hsl_hsw LABEL PROC DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1 DB 196,195,125,74,199,128 ; vblendvps %ymm8,%ymm15,%ymm0,%ymm0 DB 196,195,117,74,207,128 ; vblendvps %ymm8,%ymm15,%ymm1,%ymm1 - DB 196,98,125,24,5,244,63,0,0 ; vbroadcastss 0x3ff4(%rip),%ymm8 # 57dc <_sk_callback_hsw+0x239> + DB 196,98,125,24,5,156,64,0,0 ; vbroadcastss 0x409c(%rip),%ymm8 # 5884 <_sk_callback_hsw+0x23b> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -1469,30 +1469,30 @@ _sk_hsl_to_rgb_hsw LABEL PROC DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp) DB 197,252,40,233 ; vmovaps %ymm1,%ymm5 DB 197,252,40,224 ; vmovaps %ymm0,%ymm4 - DB 196,98,125,24,5,187,63,0,0 ; vbroadcastss 0x3fbb(%rip),%ymm8 # 57e4 <_sk_callback_hsw+0x241> + DB 196,98,125,24,5,99,64,0,0 ; vbroadcastss 0x4063(%rip),%ymm8 # 588c <_sk_callback_hsw+0x243> DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9 DB 197,84,89,210 ; vmulps %ymm2,%ymm5,%ymm10 DB 196,65,84,92,218 ; vsubps %ymm10,%ymm5,%ymm11 DB 196,67,45,74,203,144 ; vblendvps %ymm9,%ymm11,%ymm10,%ymm9 DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10 - DB 196,98,125,24,13,158,63,0,0 ; vbroadcastss 0x3f9e(%rip),%ymm9 # 57e8 <_sk_callback_hsw+0x245> + DB 196,98,125,24,13,70,64,0,0 ; vbroadcastss 0x4046(%rip),%ymm9 # 5890 <_sk_callback_hsw+0x247> DB 196,66,109,170,202 ; vfmsub213ps %ymm10,%ymm2,%ymm9 - DB 196,98,125,24,29,148,63,0,0 ; vbroadcastss 0x3f94(%rip),%ymm11 # 57ec <_sk_callback_hsw+0x249> + DB 196,98,125,24,29,60,64,0,0 ; vbroadcastss 0x403c(%rip),%ymm11 # 5894 <_sk_callback_hsw+0x24b> DB 196,65,92,88,219 ; vaddps %ymm11,%ymm4,%ymm11 DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12 DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15 DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11 - DB 196,98,125,24,45,126,63,0,0 ; vbroadcastss 0x3f7e(%rip),%ymm13 # 57f4 <_sk_callback_hsw+0x251> + DB 196,98,125,24,45,38,64,0,0 ; vbroadcastss 0x4026(%rip),%ymm13 # 589c <_sk_callback_hsw+0x253> DB 196,193,4,89,197 ; vmulps %ymm13,%ymm15,%ymm0 - DB 196,98,125,24,53,116,63,0,0 ; vbroadcastss 0x3f74(%rip),%ymm14 # 57f8 <_sk_callback_hsw+0x255> + DB 196,98,125,24,53,28,64,0,0 ; vbroadcastss 0x401c(%rip),%ymm14 # 58a0 <_sk_callback_hsw+0x257> DB 197,12,92,224 ; vsubps %ymm0,%ymm14,%ymm12 DB 196,66,37,168,225 ; vfmadd213ps %ymm9,%ymm11,%ymm12 - DB 196,226,125,24,29,90,63,0,0 ; vbroadcastss 0x3f5a(%rip),%ymm3 # 57f0 <_sk_callback_hsw+0x24d> + DB 196,226,125,24,29,2,64,0,0 ; vbroadcastss 0x4002(%rip),%ymm3 # 5898 <_sk_callback_hsw+0x24f> DB 196,193,100,194,255,2 ; vcmpleps %ymm15,%ymm3,%ymm7 DB 196,195,29,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm12,%ymm7 DB 196,65,60,194,231,2 ; vcmpleps %ymm15,%ymm8,%ymm12 DB 196,227,45,74,255,192 ; vblendvps %ymm12,%ymm7,%ymm10,%ymm7 - DB 196,98,125,24,37,69,63,0,0 ; vbroadcastss 0x3f45(%rip),%ymm12 # 57fc <_sk_callback_hsw+0x259> + DB 196,98,125,24,37,237,63,0,0 ; vbroadcastss 0x3fed(%rip),%ymm12 # 58a4 <_sk_callback_hsw+0x25b> DB 196,65,28,194,255,2 ; vcmpleps %ymm15,%ymm12,%ymm15 DB 196,194,37,168,193 ; vfmadd213ps %ymm9,%ymm11,%ymm0 DB 196,99,125,74,255,240 ; vblendvps %ymm15,%ymm7,%ymm0,%ymm15 @@ -1508,7 +1508,7 @@ _sk_hsl_to_rgb_hsw LABEL PROC DB 197,156,194,192,2 ; vcmpleps %ymm0,%ymm12,%ymm0 DB 196,194,37,168,249 ; vfmadd213ps %ymm9,%ymm11,%ymm7 DB 196,227,69,74,201,0 ; vblendvps %ymm0,%ymm1,%ymm7,%ymm1 - DB 196,226,125,24,5,241,62,0,0 ; vbroadcastss 0x3ef1(%rip),%ymm0 # 5800 <_sk_callback_hsw+0x25d> + DB 196,226,125,24,5,153,63,0,0 ; vbroadcastss 0x3f99(%rip),%ymm0 # 58a8 <_sk_callback_hsw+0x25f> DB 197,220,88,192 ; vaddps %ymm0,%ymm4,%ymm0 DB 196,227,125,8,224,1 ; vroundps $0x1,%ymm0,%ymm4 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 @@ -1554,10 +1554,10 @@ _sk_scale_u8_hsw LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,58 ; jne 19f6 <_sk_scale_u8_hsw+0x44> DB 196,66,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm8 - DB 197,57,219,5,246,68,0,0 ; vpand 0x44f6(%rip),%xmm8,%xmm8 # 5ec0 <_sk_callback_hsw+0x91d> + DB 197,57,219,5,182,69,0,0 ; vpand 0x45b6(%rip),%xmm8,%xmm8 # 5f80 <_sk_callback_hsw+0x937> DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,39,62,0,0 ; vbroadcastss 0x3e27(%rip),%ymm9 # 5804 <_sk_callback_hsw+0x261> + DB 196,98,125,24,13,207,62,0,0 ; vbroadcastss 0x3ecf(%rip),%ymm9 # 58ac <_sk_callback_hsw+0x263> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 @@ -1606,7 +1606,7 @@ _sk_scale_u8_hsw LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf001aa0 <_sk_callback_hsw+0xffffffffdeffc4fd> + DB 233,255,255,255,222 ; jmpq ffffffffdf001aa0 <_sk_callback_hsw+0xffffffffdeffc457> DB 255 ; (bad) DB 255 ; (bad) DB 255,211 ; callq *%rbx @@ -1639,10 +1639,10 @@ _sk_lerp_u8_hsw LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,78 ; jne 1b33 <_sk_lerp_u8_hsw+0x58> DB 196,66,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm8 - DB 197,57,219,5,221,67,0,0 ; vpand 0x43dd(%rip),%xmm8,%xmm8 # 5ed0 <_sk_callback_hsw+0x92d> + DB 197,57,219,5,157,68,0,0 ; vpand 0x449d(%rip),%xmm8,%xmm8 # 5f90 <_sk_callback_hsw+0x947> DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,2,61,0,0 ; vbroadcastss 0x3d02(%rip),%ymm9 # 5808 <_sk_callback_hsw+0x265> + DB 196,98,125,24,13,170,61,0,0 ; vbroadcastss 0x3daa(%rip),%ymm9 # 58b0 <_sk_callback_hsw+0x267> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0 @@ -1716,20 +1716,20 @@ _sk_lerp_565_hsw LABEL PROC DB 15,133,169,0,0,0 ; jne 1c9f <_sk_lerp_565_hsw+0xb7> DB 196,65,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm8 DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8 - DB 196,98,125,88,13,2,60,0,0 ; vpbroadcastd 0x3c02(%rip),%ymm9 # 580c <_sk_callback_hsw+0x269> + DB 196,98,125,88,13,170,60,0,0 ; vpbroadcastd 0x3caa(%rip),%ymm9 # 58b4 <_sk_callback_hsw+0x26b> DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9 DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9 - DB 196,98,125,24,21,243,59,0,0 ; vbroadcastss 0x3bf3(%rip),%ymm10 # 5810 <_sk_callback_hsw+0x26d> + DB 196,98,125,24,21,155,60,0,0 ; vbroadcastss 0x3c9b(%rip),%ymm10 # 58b8 <_sk_callback_hsw+0x26f> DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9 - DB 196,98,125,88,21,233,59,0,0 ; vpbroadcastd 0x3be9(%rip),%ymm10 # 5814 <_sk_callback_hsw+0x271> + DB 196,98,125,88,21,145,60,0,0 ; vpbroadcastd 0x3c91(%rip),%ymm10 # 58bc <_sk_callback_hsw+0x273> DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10 DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10 - DB 196,98,125,24,29,218,59,0,0 ; vbroadcastss 0x3bda(%rip),%ymm11 # 5818 <_sk_callback_hsw+0x275> + DB 196,98,125,24,29,130,60,0,0 ; vbroadcastss 0x3c82(%rip),%ymm11 # 58c0 <_sk_callback_hsw+0x277> DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 - DB 196,98,125,88,29,208,59,0,0 ; vpbroadcastd 0x3bd0(%rip),%ymm11 # 581c <_sk_callback_hsw+0x279> + DB 196,98,125,88,29,120,60,0,0 ; vpbroadcastd 0x3c78(%rip),%ymm11 # 58c4 <_sk_callback_hsw+0x27b> DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,29,193,59,0,0 ; vbroadcastss 0x3bc1(%rip),%ymm11 # 5820 <_sk_callback_hsw+0x27d> + DB 196,98,125,24,29,105,60,0,0 ; vbroadcastss 0x3c69(%rip),%ymm11 # 58c8 <_sk_callback_hsw+0x27f> DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 DB 196,226,53,168,196 ; vfmadd213ps %ymm4,%ymm9,%ymm0 @@ -1803,21 +1803,21 @@ _sk_load_tables_hsw LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,105 ; jne 1dc2 <_sk_load_tables_hsw+0x7e> DB 196,193,124,16,26 ; vmovups (%r10),%ymm3 - DB 197,228,84,13,90,62,0,0 ; vandps 0x3e5a(%rip),%ymm3,%ymm1 # 5bc0 <_sk_callback_hsw+0x61d> + DB 197,228,84,13,26,63,0,0 ; vandps 0x3f1a(%rip),%ymm3,%ymm1 # 5c80 <_sk_callback_hsw+0x637> DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8 DB 72,139,72,8 ; mov 0x8(%rax),%rcx DB 76,139,80,16 ; mov 0x10(%rax),%r10 DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2 DB 196,226,109,146,4,137 ; vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0 - DB 196,226,101,0,21,90,62,0,0 ; vpshufb 0x3e5a(%rip),%ymm3,%ymm2 # 5be0 <_sk_callback_hsw+0x63d> + DB 196,226,101,0,21,26,63,0,0 ; vpshufb 0x3f1a(%rip),%ymm3,%ymm2 # 5ca0 <_sk_callback_hsw+0x657> DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9 DB 196,194,53,146,12,146 ; vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1 DB 72,139,64,24 ; mov 0x18(%rax),%rax - DB 196,98,101,0,13,98,62,0,0 ; vpshufb 0x3e62(%rip),%ymm3,%ymm9 # 5c00 <_sk_callback_hsw+0x65d> + DB 196,98,101,0,13,34,63,0,0 ; vpshufb 0x3f22(%rip),%ymm3,%ymm9 # 5cc0 <_sk_callback_hsw+0x677> DB 196,162,61,146,20,136 ; vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,110,58,0,0 ; vbroadcastss 0x3a6e(%rip),%ymm8 # 5824 <_sk_callback_hsw+0x281> + DB 196,98,125,24,5,22,59,0,0 ; vbroadcastss 0x3b16(%rip),%ymm8 # 58cc <_sk_callback_hsw+0x283> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 76,137,201 ; mov %r9,%rcx @@ -1854,7 +1854,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC DB 197,185,108,200 ; vpunpcklqdq %xmm0,%xmm8,%xmm1 DB 197,185,109,208 ; vpunpckhqdq %xmm0,%xmm8,%xmm2 DB 197,49,108,195 ; vpunpcklqdq %xmm3,%xmm9,%xmm8 - DB 197,121,111,21,142,64,0,0 ; vmovdqa 0x408e(%rip),%xmm10 # 5ee0 <_sk_callback_hsw+0x93d> + DB 197,121,111,21,78,65,0,0 ; vmovdqa 0x414e(%rip),%xmm10 # 5fa0 <_sk_callback_hsw+0x957> DB 196,193,113,219,194 ; vpand %xmm10,%xmm1,%xmm0 DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1 DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11 @@ -1876,7 +1876,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC DB 197,185,235,219 ; vpor %xmm3,%xmm8,%xmm3 DB 196,226,125,51,219 ; vpmovzxwd %xmm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,103,57,0,0 ; vbroadcastss 0x3967(%rip),%ymm8 # 5828 <_sk_callback_hsw+0x285> + DB 196,98,125,24,5,15,58,0,0 ; vbroadcastss 0x3a0f(%rip),%ymm8 # 58d0 <_sk_callback_hsw+0x287> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -1934,7 +1934,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3 DB 197,185,109,210 ; vpunpckhqdq %xmm2,%xmm8,%xmm2 DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8 - DB 197,121,111,13,46,63,0,0 ; vmovdqa 0x3f2e(%rip),%xmm9 # 5ef0 <_sk_callback_hsw+0x94d> + DB 197,121,111,13,238,63,0,0 ; vmovdqa 0x3fee(%rip),%xmm9 # 5fb0 <_sk_callback_hsw+0x967> DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0 DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1 DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3 @@ -1951,7 +1951,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC DB 196,98,125,51,194 ; vpmovzxwd %xmm2,%ymm8 DB 196,162,101,146,20,128 ; vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,21,56,0,0 ; vbroadcastss 0x3815(%rip),%ymm3 # 582c <_sk_callback_hsw+0x289> + DB 196,226,125,24,29,189,56,0,0 ; vbroadcastss 0x38bd(%rip),%ymm3 # 58d4 <_sk_callback_hsw+0x28b> DB 255,224 ; jmpq *%rax DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0 DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0 @@ -1990,7 +1990,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC PUBLIC _sk_byte_tables_hsw _sk_byte_tables_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,93,55,0,0 ; vbroadcastss 0x375d(%rip),%ymm8 # 5830 <_sk_callback_hsw+0x28d> + DB 196,98,125,24,5,5,56,0,0 ; vbroadcastss 0x3805(%rip),%ymm8 # 58d8 <_sk_callback_hsw+0x28f> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9 DB 196,65,249,126,201 ; vmovq %xmm9,%r9 @@ -2112,7 +2112,7 @@ _sk_byte_tables_hsw LABEL PROC DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,2,53,0,0 ; vbroadcastss 0x3502(%rip),%ymm8 # 5834 <_sk_callback_hsw+0x291> + DB 196,98,125,24,5,170,53,0,0 ; vbroadcastss 0x35aa(%rip),%ymm8 # 58dc <_sk_callback_hsw+0x293> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 @@ -2226,7 +2226,7 @@ _sk_byte_tables_rgb_hsw LABEL PROC DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,238,50,0,0 ; vbroadcastss 0x32ee(%rip),%ymm8 # 5838 <_sk_callback_hsw+0x295> + DB 196,98,125,24,5,150,51,0,0 ; vbroadcastss 0x3396(%rip),%ymm8 # 58e0 <_sk_callback_hsw+0x297> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 @@ -2315,33 +2315,33 @@ _sk_parametric_r_hsw LABEL PROC DB 196,66,125,168,211 ; vfmadd213ps %ymm11,%ymm0,%ymm10 DB 196,226,125,24,0 ; vbroadcastss (%rax),%ymm0 DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11 - DB 196,98,125,24,37,200,49,0,0 ; vbroadcastss 0x31c8(%rip),%ymm12 # 583c <_sk_callback_hsw+0x299> - DB 196,98,125,24,45,195,49,0,0 ; vbroadcastss 0x31c3(%rip),%ymm13 # 5840 <_sk_callback_hsw+0x29d> + DB 196,98,125,24,37,112,50,0,0 ; vbroadcastss 0x3270(%rip),%ymm12 # 58e4 <_sk_callback_hsw+0x29b> + DB 196,98,125,24,45,107,50,0,0 ; vbroadcastss 0x326b(%rip),%ymm13 # 58e8 <_sk_callback_hsw+0x29f> DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,185,49,0,0 ; vbroadcastss 0x31b9(%rip),%ymm13 # 5844 <_sk_callback_hsw+0x2a1> + DB 196,98,125,24,45,97,50,0,0 ; vbroadcastss 0x3261(%rip),%ymm13 # 58ec <_sk_callback_hsw+0x2a3> DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,175,49,0,0 ; vbroadcastss 0x31af(%rip),%ymm13 # 5848 <_sk_callback_hsw+0x2a5> + DB 196,98,125,24,45,87,50,0,0 ; vbroadcastss 0x3257(%rip),%ymm13 # 58f0 <_sk_callback_hsw+0x2a7> DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13 - DB 196,98,125,24,29,165,49,0,0 ; vbroadcastss 0x31a5(%rip),%ymm11 # 584c <_sk_callback_hsw+0x2a9> + DB 196,98,125,24,29,77,50,0,0 ; vbroadcastss 0x324d(%rip),%ymm11 # 58f4 <_sk_callback_hsw+0x2ab> DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11 - DB 196,98,125,24,37,155,49,0,0 ; vbroadcastss 0x319b(%rip),%ymm12 # 5850 <_sk_callback_hsw+0x2ad> + DB 196,98,125,24,37,67,50,0,0 ; vbroadcastss 0x3243(%rip),%ymm12 # 58f8 <_sk_callback_hsw+0x2af> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,145,49,0,0 ; vbroadcastss 0x3191(%rip),%ymm12 # 5854 <_sk_callback_hsw+0x2b1> + DB 196,98,125,24,37,57,50,0,0 ; vbroadcastss 0x3239(%rip),%ymm12 # 58fc <_sk_callback_hsw+0x2b3> DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10 DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10 DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10 - DB 196,98,125,24,29,114,49,0,0 ; vbroadcastss 0x3172(%rip),%ymm11 # 5858 <_sk_callback_hsw+0x2b5> + DB 196,98,125,24,29,26,50,0,0 ; vbroadcastss 0x321a(%rip),%ymm11 # 5900 <_sk_callback_hsw+0x2b7> DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0 - DB 196,98,125,24,29,104,49,0,0 ; vbroadcastss 0x3168(%rip),%ymm11 # 585c <_sk_callback_hsw+0x2b9> + DB 196,98,125,24,29,16,50,0,0 ; vbroadcastss 0x3210(%rip),%ymm11 # 5904 <_sk_callback_hsw+0x2bb> DB 196,98,45,172,216 ; vfnmadd213ps %ymm0,%ymm10,%ymm11 - DB 196,226,125,24,5,94,49,0,0 ; vbroadcastss 0x315e(%rip),%ymm0 # 5860 <_sk_callback_hsw+0x2bd> + DB 196,226,125,24,5,6,50,0,0 ; vbroadcastss 0x3206(%rip),%ymm0 # 5908 <_sk_callback_hsw+0x2bf> DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0 - DB 196,98,125,24,21,84,49,0,0 ; vbroadcastss 0x3154(%rip),%ymm10 # 5864 <_sk_callback_hsw+0x2c1> + DB 196,98,125,24,21,252,49,0,0 ; vbroadcastss 0x31fc(%rip),%ymm10 # 590c <_sk_callback_hsw+0x2c3> DB 197,172,94,192 ; vdivps %ymm0,%ymm10,%ymm0 DB 197,164,88,192 ; vaddps %ymm0,%ymm11,%ymm0 - DB 196,98,125,24,21,71,49,0,0 ; vbroadcastss 0x3147(%rip),%ymm10 # 5868 <_sk_callback_hsw+0x2c5> + DB 196,98,125,24,21,239,49,0,0 ; vbroadcastss 0x31ef(%rip),%ymm10 # 5910 <_sk_callback_hsw+0x2c7> DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -2349,7 +2349,7 @@ _sk_parametric_r_hsw LABEL PROC DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,30,49,0,0 ; vbroadcastss 0x311e(%rip),%ymm8 # 586c <_sk_callback_hsw+0x2c9> + DB 196,98,125,24,5,198,49,0,0 ; vbroadcastss 0x31c6(%rip),%ymm8 # 5914 <_sk_callback_hsw+0x2cb> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -2367,33 +2367,33 @@ _sk_parametric_g_hsw LABEL PROC DB 196,66,117,168,211 ; vfmadd213ps %ymm11,%ymm1,%ymm10 DB 196,226,125,24,8 ; vbroadcastss (%rax),%ymm1 DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11 - DB 196,98,125,24,37,214,48,0,0 ; vbroadcastss 0x30d6(%rip),%ymm12 # 5870 <_sk_callback_hsw+0x2cd> - DB 196,98,125,24,45,209,48,0,0 ; vbroadcastss 0x30d1(%rip),%ymm13 # 5874 <_sk_callback_hsw+0x2d1> + DB 196,98,125,24,37,126,49,0,0 ; vbroadcastss 0x317e(%rip),%ymm12 # 5918 <_sk_callback_hsw+0x2cf> + DB 196,98,125,24,45,121,49,0,0 ; vbroadcastss 0x3179(%rip),%ymm13 # 591c <_sk_callback_hsw+0x2d3> DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,199,48,0,0 ; vbroadcastss 0x30c7(%rip),%ymm13 # 5878 <_sk_callback_hsw+0x2d5> + DB 196,98,125,24,45,111,49,0,0 ; vbroadcastss 0x316f(%rip),%ymm13 # 5920 <_sk_callback_hsw+0x2d7> DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,189,48,0,0 ; vbroadcastss 0x30bd(%rip),%ymm13 # 587c <_sk_callback_hsw+0x2d9> + DB 196,98,125,24,45,101,49,0,0 ; vbroadcastss 0x3165(%rip),%ymm13 # 5924 <_sk_callback_hsw+0x2db> DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13 - DB 196,98,125,24,29,179,48,0,0 ; vbroadcastss 0x30b3(%rip),%ymm11 # 5880 <_sk_callback_hsw+0x2dd> + DB 196,98,125,24,29,91,49,0,0 ; vbroadcastss 0x315b(%rip),%ymm11 # 5928 <_sk_callback_hsw+0x2df> DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11 - DB 196,98,125,24,37,169,48,0,0 ; vbroadcastss 0x30a9(%rip),%ymm12 # 5884 <_sk_callback_hsw+0x2e1> + DB 196,98,125,24,37,81,49,0,0 ; vbroadcastss 0x3151(%rip),%ymm12 # 592c <_sk_callback_hsw+0x2e3> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,159,48,0,0 ; vbroadcastss 0x309f(%rip),%ymm12 # 5888 <_sk_callback_hsw+0x2e5> + DB 196,98,125,24,37,71,49,0,0 ; vbroadcastss 0x3147(%rip),%ymm12 # 5930 <_sk_callback_hsw+0x2e7> DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10 DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1 DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10 DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10 - DB 196,98,125,24,29,128,48,0,0 ; vbroadcastss 0x3080(%rip),%ymm11 # 588c <_sk_callback_hsw+0x2e9> + DB 196,98,125,24,29,40,49,0,0 ; vbroadcastss 0x3128(%rip),%ymm11 # 5934 <_sk_callback_hsw+0x2eb> DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,118,48,0,0 ; vbroadcastss 0x3076(%rip),%ymm11 # 5890 <_sk_callback_hsw+0x2ed> + DB 196,98,125,24,29,30,49,0,0 ; vbroadcastss 0x311e(%rip),%ymm11 # 5938 <_sk_callback_hsw+0x2ef> DB 196,98,45,172,217 ; vfnmadd213ps %ymm1,%ymm10,%ymm11 - DB 196,226,125,24,13,108,48,0,0 ; vbroadcastss 0x306c(%rip),%ymm1 # 5894 <_sk_callback_hsw+0x2f1> + DB 196,226,125,24,13,20,49,0,0 ; vbroadcastss 0x3114(%rip),%ymm1 # 593c <_sk_callback_hsw+0x2f3> DB 196,193,116,92,202 ; vsubps %ymm10,%ymm1,%ymm1 - DB 196,98,125,24,21,98,48,0,0 ; vbroadcastss 0x3062(%rip),%ymm10 # 5898 <_sk_callback_hsw+0x2f5> + DB 196,98,125,24,21,10,49,0,0 ; vbroadcastss 0x310a(%rip),%ymm10 # 5940 <_sk_callback_hsw+0x2f7> DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1 DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1 - DB 196,98,125,24,21,85,48,0,0 ; vbroadcastss 0x3055(%rip),%ymm10 # 589c <_sk_callback_hsw+0x2f9> + DB 196,98,125,24,21,253,48,0,0 ; vbroadcastss 0x30fd(%rip),%ymm10 # 5944 <_sk_callback_hsw+0x2fb> DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1 DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -2401,7 +2401,7 @@ _sk_parametric_g_hsw LABEL PROC DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1 - DB 196,98,125,24,5,44,48,0,0 ; vbroadcastss 0x302c(%rip),%ymm8 # 58a0 <_sk_callback_hsw+0x2fd> + DB 196,98,125,24,5,212,48,0,0 ; vbroadcastss 0x30d4(%rip),%ymm8 # 5948 <_sk_callback_hsw+0x2ff> DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -2419,33 +2419,33 @@ _sk_parametric_b_hsw LABEL PROC DB 196,66,109,168,211 ; vfmadd213ps %ymm11,%ymm2,%ymm10 DB 196,226,125,24,16 ; vbroadcastss (%rax),%ymm2 DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11 - DB 196,98,125,24,37,228,47,0,0 ; vbroadcastss 0x2fe4(%rip),%ymm12 # 58a4 <_sk_callback_hsw+0x301> - DB 196,98,125,24,45,223,47,0,0 ; vbroadcastss 0x2fdf(%rip),%ymm13 # 58a8 <_sk_callback_hsw+0x305> + DB 196,98,125,24,37,140,48,0,0 ; vbroadcastss 0x308c(%rip),%ymm12 # 594c <_sk_callback_hsw+0x303> + DB 196,98,125,24,45,135,48,0,0 ; vbroadcastss 0x3087(%rip),%ymm13 # 5950 <_sk_callback_hsw+0x307> DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,213,47,0,0 ; vbroadcastss 0x2fd5(%rip),%ymm13 # 58ac <_sk_callback_hsw+0x309> + DB 196,98,125,24,45,125,48,0,0 ; vbroadcastss 0x307d(%rip),%ymm13 # 5954 <_sk_callback_hsw+0x30b> DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,203,47,0,0 ; vbroadcastss 0x2fcb(%rip),%ymm13 # 58b0 <_sk_callback_hsw+0x30d> + DB 196,98,125,24,45,115,48,0,0 ; vbroadcastss 0x3073(%rip),%ymm13 # 5958 <_sk_callback_hsw+0x30f> DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13 - DB 196,98,125,24,29,193,47,0,0 ; vbroadcastss 0x2fc1(%rip),%ymm11 # 58b4 <_sk_callback_hsw+0x311> + DB 196,98,125,24,29,105,48,0,0 ; vbroadcastss 0x3069(%rip),%ymm11 # 595c <_sk_callback_hsw+0x313> DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11 - DB 196,98,125,24,37,183,47,0,0 ; vbroadcastss 0x2fb7(%rip),%ymm12 # 58b8 <_sk_callback_hsw+0x315> + DB 196,98,125,24,37,95,48,0,0 ; vbroadcastss 0x305f(%rip),%ymm12 # 5960 <_sk_callback_hsw+0x317> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,173,47,0,0 ; vbroadcastss 0x2fad(%rip),%ymm12 # 58bc <_sk_callback_hsw+0x319> + DB 196,98,125,24,37,85,48,0,0 ; vbroadcastss 0x3055(%rip),%ymm12 # 5964 <_sk_callback_hsw+0x31b> DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10 DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2 DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10 DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10 - DB 196,98,125,24,29,142,47,0,0 ; vbroadcastss 0x2f8e(%rip),%ymm11 # 58c0 <_sk_callback_hsw+0x31d> + DB 196,98,125,24,29,54,48,0,0 ; vbroadcastss 0x3036(%rip),%ymm11 # 5968 <_sk_callback_hsw+0x31f> DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 - DB 196,98,125,24,29,132,47,0,0 ; vbroadcastss 0x2f84(%rip),%ymm11 # 58c4 <_sk_callback_hsw+0x321> + DB 196,98,125,24,29,44,48,0,0 ; vbroadcastss 0x302c(%rip),%ymm11 # 596c <_sk_callback_hsw+0x323> DB 196,98,45,172,218 ; vfnmadd213ps %ymm2,%ymm10,%ymm11 - DB 196,226,125,24,21,122,47,0,0 ; vbroadcastss 0x2f7a(%rip),%ymm2 # 58c8 <_sk_callback_hsw+0x325> + DB 196,226,125,24,21,34,48,0,0 ; vbroadcastss 0x3022(%rip),%ymm2 # 5970 <_sk_callback_hsw+0x327> DB 196,193,108,92,210 ; vsubps %ymm10,%ymm2,%ymm2 - DB 196,98,125,24,21,112,47,0,0 ; vbroadcastss 0x2f70(%rip),%ymm10 # 58cc <_sk_callback_hsw+0x329> + DB 196,98,125,24,21,24,48,0,0 ; vbroadcastss 0x3018(%rip),%ymm10 # 5974 <_sk_callback_hsw+0x32b> DB 197,172,94,210 ; vdivps %ymm2,%ymm10,%ymm2 DB 197,164,88,210 ; vaddps %ymm2,%ymm11,%ymm2 - DB 196,98,125,24,21,99,47,0,0 ; vbroadcastss 0x2f63(%rip),%ymm10 # 58d0 <_sk_callback_hsw+0x32d> + DB 196,98,125,24,21,11,48,0,0 ; vbroadcastss 0x300b(%rip),%ymm10 # 5978 <_sk_callback_hsw+0x32f> DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2 DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -2453,7 +2453,7 @@ _sk_parametric_b_hsw LABEL PROC DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,58,47,0,0 ; vbroadcastss 0x2f3a(%rip),%ymm8 # 58d4 <_sk_callback_hsw+0x331> + DB 196,98,125,24,5,226,47,0,0 ; vbroadcastss 0x2fe2(%rip),%ymm8 # 597c <_sk_callback_hsw+0x333> DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -2471,33 +2471,33 @@ _sk_parametric_a_hsw LABEL PROC DB 196,66,101,168,211 ; vfmadd213ps %ymm11,%ymm3,%ymm10 DB 196,226,125,24,24 ; vbroadcastss (%rax),%ymm3 DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11 - DB 196,98,125,24,37,242,46,0,0 ; vbroadcastss 0x2ef2(%rip),%ymm12 # 58d8 <_sk_callback_hsw+0x335> - DB 196,98,125,24,45,237,46,0,0 ; vbroadcastss 0x2eed(%rip),%ymm13 # 58dc <_sk_callback_hsw+0x339> + DB 196,98,125,24,37,154,47,0,0 ; vbroadcastss 0x2f9a(%rip),%ymm12 # 5980 <_sk_callback_hsw+0x337> + DB 196,98,125,24,45,149,47,0,0 ; vbroadcastss 0x2f95(%rip),%ymm13 # 5984 <_sk_callback_hsw+0x33b> DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,227,46,0,0 ; vbroadcastss 0x2ee3(%rip),%ymm13 # 58e0 <_sk_callback_hsw+0x33d> + DB 196,98,125,24,45,139,47,0,0 ; vbroadcastss 0x2f8b(%rip),%ymm13 # 5988 <_sk_callback_hsw+0x33f> DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,217,46,0,0 ; vbroadcastss 0x2ed9(%rip),%ymm13 # 58e4 <_sk_callback_hsw+0x341> + DB 196,98,125,24,45,129,47,0,0 ; vbroadcastss 0x2f81(%rip),%ymm13 # 598c <_sk_callback_hsw+0x343> DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13 - DB 196,98,125,24,29,207,46,0,0 ; vbroadcastss 0x2ecf(%rip),%ymm11 # 58e8 <_sk_callback_hsw+0x345> + DB 196,98,125,24,29,119,47,0,0 ; vbroadcastss 0x2f77(%rip),%ymm11 # 5990 <_sk_callback_hsw+0x347> DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11 - DB 196,98,125,24,37,197,46,0,0 ; vbroadcastss 0x2ec5(%rip),%ymm12 # 58ec <_sk_callback_hsw+0x349> + DB 196,98,125,24,37,109,47,0,0 ; vbroadcastss 0x2f6d(%rip),%ymm12 # 5994 <_sk_callback_hsw+0x34b> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,187,46,0,0 ; vbroadcastss 0x2ebb(%rip),%ymm12 # 58f0 <_sk_callback_hsw+0x34d> + DB 196,98,125,24,37,99,47,0,0 ; vbroadcastss 0x2f63(%rip),%ymm12 # 5998 <_sk_callback_hsw+0x34f> DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10 DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3 DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10 DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10 - DB 196,98,125,24,29,156,46,0,0 ; vbroadcastss 0x2e9c(%rip),%ymm11 # 58f4 <_sk_callback_hsw+0x351> + DB 196,98,125,24,29,68,47,0,0 ; vbroadcastss 0x2f44(%rip),%ymm11 # 599c <_sk_callback_hsw+0x353> DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3 - DB 196,98,125,24,29,146,46,0,0 ; vbroadcastss 0x2e92(%rip),%ymm11 # 58f8 <_sk_callback_hsw+0x355> + DB 196,98,125,24,29,58,47,0,0 ; vbroadcastss 0x2f3a(%rip),%ymm11 # 59a0 <_sk_callback_hsw+0x357> DB 196,98,45,172,219 ; vfnmadd213ps %ymm3,%ymm10,%ymm11 - DB 196,226,125,24,29,136,46,0,0 ; vbroadcastss 0x2e88(%rip),%ymm3 # 58fc <_sk_callback_hsw+0x359> + DB 196,226,125,24,29,48,47,0,0 ; vbroadcastss 0x2f30(%rip),%ymm3 # 59a4 <_sk_callback_hsw+0x35b> DB 196,193,100,92,218 ; vsubps %ymm10,%ymm3,%ymm3 - DB 196,98,125,24,21,126,46,0,0 ; vbroadcastss 0x2e7e(%rip),%ymm10 # 5900 <_sk_callback_hsw+0x35d> + DB 196,98,125,24,21,38,47,0,0 ; vbroadcastss 0x2f26(%rip),%ymm10 # 59a8 <_sk_callback_hsw+0x35f> DB 197,172,94,219 ; vdivps %ymm3,%ymm10,%ymm3 DB 197,164,88,219 ; vaddps %ymm3,%ymm11,%ymm3 - DB 196,98,125,24,21,113,46,0,0 ; vbroadcastss 0x2e71(%rip),%ymm10 # 5904 <_sk_callback_hsw+0x361> + DB 196,98,125,24,21,25,47,0,0 ; vbroadcastss 0x2f19(%rip),%ymm10 # 59ac <_sk_callback_hsw+0x363> DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3 DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -2505,33 +2505,33 @@ _sk_parametric_a_hsw LABEL PROC DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3 - DB 196,98,125,24,5,72,46,0,0 ; vbroadcastss 0x2e48(%rip),%ymm8 # 5908 <_sk_callback_hsw+0x365> + DB 196,98,125,24,5,240,46,0,0 ; vbroadcastss 0x2ef0(%rip),%ymm8 # 59b0 <_sk_callback_hsw+0x367> DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax PUBLIC _sk_lab_to_xyz_hsw _sk_lab_to_xyz_hsw LABEL PROC - DB 196,98,125,24,5,58,46,0,0 ; vbroadcastss 0x2e3a(%rip),%ymm8 # 590c <_sk_callback_hsw+0x369> - DB 196,98,125,24,13,53,46,0,0 ; vbroadcastss 0x2e35(%rip),%ymm9 # 5910 <_sk_callback_hsw+0x36d> - DB 196,98,125,24,21,48,46,0,0 ; vbroadcastss 0x2e30(%rip),%ymm10 # 5914 <_sk_callback_hsw+0x371> + DB 196,98,125,24,5,226,46,0,0 ; vbroadcastss 0x2ee2(%rip),%ymm8 # 59b4 <_sk_callback_hsw+0x36b> + DB 196,98,125,24,13,221,46,0,0 ; vbroadcastss 0x2edd(%rip),%ymm9 # 59b8 <_sk_callback_hsw+0x36f> + DB 196,98,125,24,21,216,46,0,0 ; vbroadcastss 0x2ed8(%rip),%ymm10 # 59bc <_sk_callback_hsw+0x373> DB 196,194,53,168,202 ; vfmadd213ps %ymm10,%ymm9,%ymm1 DB 196,194,53,168,210 ; vfmadd213ps %ymm10,%ymm9,%ymm2 - DB 196,98,125,24,13,33,46,0,0 ; vbroadcastss 0x2e21(%rip),%ymm9 # 5918 <_sk_callback_hsw+0x375> + DB 196,98,125,24,13,201,46,0,0 ; vbroadcastss 0x2ec9(%rip),%ymm9 # 59c0 <_sk_callback_hsw+0x377> DB 196,66,125,184,200 ; vfmadd231ps %ymm8,%ymm0,%ymm9 - DB 196,226,125,24,5,23,46,0,0 ; vbroadcastss 0x2e17(%rip),%ymm0 # 591c <_sk_callback_hsw+0x379> + DB 196,226,125,24,5,191,46,0,0 ; vbroadcastss 0x2ebf(%rip),%ymm0 # 59c4 <_sk_callback_hsw+0x37b> DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0 - DB 196,98,125,24,5,14,46,0,0 ; vbroadcastss 0x2e0e(%rip),%ymm8 # 5920 <_sk_callback_hsw+0x37d> + DB 196,98,125,24,5,182,46,0,0 ; vbroadcastss 0x2eb6(%rip),%ymm8 # 59c8 <_sk_callback_hsw+0x37f> DB 196,98,117,168,192 ; vfmadd213ps %ymm0,%ymm1,%ymm8 - DB 196,98,125,24,13,4,46,0,0 ; vbroadcastss 0x2e04(%rip),%ymm9 # 5924 <_sk_callback_hsw+0x381> + DB 196,98,125,24,13,172,46,0,0 ; vbroadcastss 0x2eac(%rip),%ymm9 # 59cc <_sk_callback_hsw+0x383> DB 196,98,109,172,200 ; vfnmadd213ps %ymm0,%ymm2,%ymm9 DB 196,193,60,89,200 ; vmulps %ymm8,%ymm8,%ymm1 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 - DB 196,226,125,24,21,241,45,0,0 ; vbroadcastss 0x2df1(%rip),%ymm2 # 5928 <_sk_callback_hsw+0x385> + DB 196,226,125,24,21,153,46,0,0 ; vbroadcastss 0x2e99(%rip),%ymm2 # 59d0 <_sk_callback_hsw+0x387> DB 197,108,194,209,1 ; vcmpltps %ymm1,%ymm2,%ymm10 - DB 196,98,125,24,29,231,45,0,0 ; vbroadcastss 0x2de7(%rip),%ymm11 # 592c <_sk_callback_hsw+0x389> + DB 196,98,125,24,29,143,46,0,0 ; vbroadcastss 0x2e8f(%rip),%ymm11 # 59d4 <_sk_callback_hsw+0x38b> DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8 - DB 196,98,125,24,37,221,45,0,0 ; vbroadcastss 0x2ddd(%rip),%ymm12 # 5930 <_sk_callback_hsw+0x38d> + DB 196,98,125,24,37,133,46,0,0 ; vbroadcastss 0x2e85(%rip),%ymm12 # 59d8 <_sk_callback_hsw+0x38f> DB 196,65,60,89,196 ; vmulps %ymm12,%ymm8,%ymm8 DB 196,99,61,74,193,160 ; vblendvps %ymm10,%ymm1,%ymm8,%ymm8 DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1 @@ -2546,9 +2546,9 @@ _sk_lab_to_xyz_hsw LABEL PROC DB 196,65,52,88,203 ; vaddps %ymm11,%ymm9,%ymm9 DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9 DB 196,227,53,74,208,32 ; vblendvps %ymm2,%ymm0,%ymm9,%ymm2 - DB 196,226,125,24,5,146,45,0,0 ; vbroadcastss 0x2d92(%rip),%ymm0 # 5934 <_sk_callback_hsw+0x391> + DB 196,226,125,24,5,58,46,0,0 ; vbroadcastss 0x2e3a(%rip),%ymm0 # 59dc <_sk_callback_hsw+0x393> DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 - DB 196,98,125,24,5,137,45,0,0 ; vbroadcastss 0x2d89(%rip),%ymm8 # 5938 <_sk_callback_hsw+0x395> + DB 196,98,125,24,5,49,46,0,0 ; vbroadcastss 0x2e31(%rip),%ymm8 # 59e0 <_sk_callback_hsw+0x397> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -2560,10 +2560,10 @@ _sk_load_a8_hsw LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,52 ; jne 2bf6 <_sk_load_a8_hsw+0x3e> DB 196,194,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm0 - DB 197,249,219,5,48,51,0,0 ; vpand 0x3330(%rip),%xmm0,%xmm0 # 5f00 <_sk_callback_hsw+0x95d> + DB 197,249,219,5,240,51,0,0 ; vpand 0x33f0(%rip),%xmm0,%xmm0 # 5fc0 <_sk_callback_hsw+0x977> DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,90,45,0,0 ; vbroadcastss 0x2d5a(%rip),%ymm1 # 593c <_sk_callback_hsw+0x399> + DB 196,226,125,24,13,2,46,0,0 ; vbroadcastss 0x2e02(%rip),%ymm1 # 59e4 <_sk_callback_hsw+0x39b> DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -2630,10 +2630,10 @@ _sk_load_a8_dst_hsw LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,52 ; jne 2ce6 <_sk_load_a8_dst_hsw+0x3e> DB 196,194,121,48,36,19 ; vpmovzxbw (%r11,%rdx,1),%xmm4 - DB 197,217,219,37,80,50,0,0 ; vpand 0x3250(%rip),%xmm4,%xmm4 # 5f10 <_sk_callback_hsw+0x96d> + DB 197,217,219,37,16,51,0,0 ; vpand 0x3310(%rip),%xmm4,%xmm4 # 5fd0 <_sk_callback_hsw+0x987> DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,110,44,0,0 ; vbroadcastss 0x2c6e(%rip),%ymm5 # 5940 <_sk_callback_hsw+0x39d> + DB 196,226,125,24,45,22,45,0,0 ; vbroadcastss 0x2d16(%rip),%ymm5 # 59e8 <_sk_callback_hsw+0x39f> DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 @@ -2731,7 +2731,7 @@ _sk_gather_a8_hsw LABEL PROC DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0 DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,246,42,0,0 ; vbroadcastss 0x2af6(%rip),%ymm1 # 5944 <_sk_callback_hsw+0x3a1> + DB 196,226,125,24,13,158,43,0,0 ; vbroadcastss 0x2b9e(%rip),%ymm1 # 59ec <_sk_callback_hsw+0x3a3> DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -2743,7 +2743,7 @@ PUBLIC _sk_store_a8_hsw _sk_store_a8_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 - DB 196,98,125,24,5,216,42,0,0 ; vbroadcastss 0x2ad8(%rip),%ymm8 # 5948 <_sk_callback_hsw+0x3a5> + DB 196,98,125,24,5,128,43,0,0 ; vbroadcastss 0x2b80(%rip),%ymm8 # 59f0 <_sk_callback_hsw+0x3a7> DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8 DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8 DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 @@ -2768,13 +2768,13 @@ _sk_store_a8_hsw LABEL PROC DB 196,67,121,20,4,19,0 ; vpextrb $0x0,%xmm8,(%r11,%rdx,1) DB 235,202 ; jmp 2e95 <_sk_store_a8_hsw+0x33> DB 196,67,121,20,68,19,2,4 ; vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1) - DB 196,98,57,0,5,68,48,0,0 ; vpshufb 0x3044(%rip),%xmm8,%xmm8 # 5f20 <_sk_callback_hsw+0x97d> + DB 196,98,57,0,5,4,49,0,0 ; vpshufb 0x3104(%rip),%xmm8,%xmm8 # 5fe0 <_sk_callback_hsw+0x997> DB 196,67,121,21,4,19,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,1) DB 235,176 ; jmp 2e95 <_sk_store_a8_hsw+0x33> DB 196,67,121,20,68,19,6,12 ; vpextrb $0xc,%xmm8,0x6(%r11,%rdx,1) DB 196,67,121,20,68,19,5,10 ; vpextrb $0xa,%xmm8,0x5(%r11,%rdx,1) DB 196,67,121,20,68,19,4,8 ; vpextrb $0x8,%xmm8,0x4(%r11,%rdx,1) - DB 196,98,57,0,5,42,48,0,0 ; vpshufb 0x302a(%rip),%xmm8,%xmm8 # 5f30 <_sk_callback_hsw+0x98d> + DB 196,98,57,0,5,234,48,0,0 ; vpshufb 0x30ea(%rip),%xmm8,%xmm8 # 5ff0 <_sk_callback_hsw+0x9a7> DB 196,65,121,126,4,19 ; vmovd %xmm8,(%r11,%rdx,1) DB 235,135 ; jmp 2e95 <_sk_store_a8_hsw+0x33> DB 102,144 ; xchg %ax,%ax @@ -2805,13 +2805,13 @@ _sk_load_g8_hsw LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,57 ; jne 2f6f <_sk_load_g8_hsw+0x43> DB 196,194,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm0 - DB 197,249,219,5,252,47,0,0 ; vpand 0x2ffc(%rip),%xmm0,%xmm0 # 5f40 <_sk_callback_hsw+0x99d> + DB 197,249,219,5,188,48,0,0 ; vpand 0x30bc(%rip),%xmm0,%xmm0 # 6000 <_sk_callback_hsw+0x9b7> DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,246,41,0,0 ; vbroadcastss 0x29f6(%rip),%ymm1 # 594c <_sk_callback_hsw+0x3a9> + DB 196,226,125,24,13,158,42,0,0 ; vbroadcastss 0x2a9e(%rip),%ymm1 # 59f4 <_sk_callback_hsw+0x3ab> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,235,41,0,0 ; vbroadcastss 0x29eb(%rip),%ymm3 # 5950 <_sk_callback_hsw+0x3ad> + DB 196,226,125,24,29,147,42,0,0 ; vbroadcastss 0x2a93(%rip),%ymm3 # 59f8 <_sk_callback_hsw+0x3af> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 255,224 ; jmpq *%rax @@ -2876,13 +2876,13 @@ _sk_load_g8_dst_hsw LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,57 ; jne 3067 <_sk_load_g8_dst_hsw+0x43> DB 196,194,121,48,36,19 ; vpmovzxbw (%r11,%rdx,1),%xmm4 - DB 197,217,219,37,20,47,0,0 ; vpand 0x2f14(%rip),%xmm4,%xmm4 # 5f50 <_sk_callback_hsw+0x9ad> + DB 197,217,219,37,212,47,0,0 ; vpand 0x2fd4(%rip),%xmm4,%xmm4 # 6010 <_sk_callback_hsw+0x9c7> DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,6,41,0,0 ; vbroadcastss 0x2906(%rip),%ymm5 # 5954 <_sk_callback_hsw+0x3b1> + DB 196,226,125,24,45,174,41,0,0 ; vbroadcastss 0x29ae(%rip),%ymm5 # 59fc <_sk_callback_hsw+0x3b3> DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,61,251,40,0,0 ; vbroadcastss 0x28fb(%rip),%ymm7 # 5958 <_sk_callback_hsw+0x3b5> + DB 196,226,125,24,61,163,41,0,0 ; vbroadcastss 0x29a3(%rip),%ymm7 # 5a00 <_sk_callback_hsw+0x3b7> DB 197,252,40,236 ; vmovaps %ymm4,%ymm5 DB 197,252,40,244 ; vmovaps %ymm4,%ymm6 DB 255,224 ; jmpq *%rax @@ -2978,10 +2978,10 @@ _sk_gather_g8_hsw LABEL PROC DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0 DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,138,39,0,0 ; vbroadcastss 0x278a(%rip),%ymm1 # 595c <_sk_callback_hsw+0x3b9> + DB 196,226,125,24,13,50,40,0,0 ; vbroadcastss 0x2832(%rip),%ymm1 # 5a04 <_sk_callback_hsw+0x3bb> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,127,39,0,0 ; vbroadcastss 0x277f(%rip),%ymm3 # 5960 <_sk_callback_hsw+0x3bd> + DB 196,226,125,24,29,39,40,0,0 ; vbroadcastss 0x2827(%rip),%ymm3 # 5a08 <_sk_callback_hsw+0x3bf> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 255,224 ; jmpq *%rax @@ -3027,14 +3027,14 @@ _sk_gather_i8_hsw LABEL PROC DB 73,139,65,8 ; mov 0x8(%r9),%rax DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1 DB 196,226,117,144,28,128 ; vpgatherdd %ymm1,(%rax,%ymm0,4),%ymm3 - DB 197,229,219,5,127,41,0,0 ; vpand 0x297f(%rip),%ymm3,%ymm0 # 5c20 <_sk_callback_hsw+0x67d> + DB 197,229,219,5,63,42,0,0 ; vpand 0x2a3f(%rip),%ymm3,%ymm0 # 5ce0 <_sk_callback_hsw+0x697> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,182,38,0,0 ; vbroadcastss 0x26b6(%rip),%ymm8 # 5964 <_sk_callback_hsw+0x3c1> + DB 196,98,125,24,5,94,39,0,0 ; vbroadcastss 0x275e(%rip),%ymm8 # 5a0c <_sk_callback_hsw+0x3c3> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 - DB 196,226,101,0,13,132,41,0,0 ; vpshufb 0x2984(%rip),%ymm3,%ymm1 # 5c40 <_sk_callback_hsw+0x69d> + DB 196,226,101,0,13,68,42,0,0 ; vpshufb 0x2a44(%rip),%ymm3,%ymm1 # 5d00 <_sk_callback_hsw+0x6b7> DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 - DB 196,226,101,0,21,146,41,0,0 ; vpshufb 0x2992(%rip),%ymm3,%ymm2 # 5c60 <_sk_callback_hsw+0x6bd> + DB 196,226,101,0,21,82,42,0,0 ; vpshufb 0x2a52(%rip),%ymm3,%ymm2 # 5d20 <_sk_callback_hsw+0x6d7> DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 @@ -3052,23 +3052,23 @@ _sk_load_565_hsw LABEL PROC DB 117,114 ; jne 3366 <_sk_load_565_hsw+0x7c> DB 196,193,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm0 DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2 - DB 196,226,125,88,5,96,38,0,0 ; vpbroadcastd 0x2660(%rip),%ymm0 # 5968 <_sk_callback_hsw+0x3c5> + DB 196,226,125,88,5,8,39,0,0 ; vpbroadcastd 0x2708(%rip),%ymm0 # 5a10 <_sk_callback_hsw+0x3c7> DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,83,38,0,0 ; vbroadcastss 0x2653(%rip),%ymm1 # 596c <_sk_callback_hsw+0x3c9> + DB 196,226,125,24,13,251,38,0,0 ; vbroadcastss 0x26fb(%rip),%ymm1 # 5a14 <_sk_callback_hsw+0x3cb> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,88,13,74,38,0,0 ; vpbroadcastd 0x264a(%rip),%ymm1 # 5970 <_sk_callback_hsw+0x3cd> + DB 196,226,125,88,13,242,38,0,0 ; vpbroadcastd 0x26f2(%rip),%ymm1 # 5a18 <_sk_callback_hsw+0x3cf> DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,29,61,38,0,0 ; vbroadcastss 0x263d(%rip),%ymm3 # 5974 <_sk_callback_hsw+0x3d1> + DB 196,226,125,24,29,229,38,0,0 ; vbroadcastss 0x26e5(%rip),%ymm3 # 5a1c <_sk_callback_hsw+0x3d3> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 - DB 196,226,125,88,29,52,38,0,0 ; vpbroadcastd 0x2634(%rip),%ymm3 # 5978 <_sk_callback_hsw+0x3d5> + DB 196,226,125,88,29,220,38,0,0 ; vpbroadcastd 0x26dc(%rip),%ymm3 # 5a20 <_sk_callback_hsw+0x3d7> DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,226,125,24,29,39,38,0,0 ; vbroadcastss 0x2627(%rip),%ymm3 # 597c <_sk_callback_hsw+0x3d9> + DB 196,226,125,24,29,207,38,0,0 ; vbroadcastss 0x26cf(%rip),%ymm3 # 5a24 <_sk_callback_hsw+0x3db> DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,28,38,0,0 ; vbroadcastss 0x261c(%rip),%ymm3 # 5980 <_sk_callback_hsw+0x3dd> + DB 196,226,125,24,29,196,38,0,0 ; vbroadcastss 0x26c4(%rip),%ymm3 # 5a28 <_sk_callback_hsw+0x3df> DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,7 ; and $0x7,%r9b @@ -3124,23 +3124,23 @@ _sk_load_565_dst_hsw LABEL PROC DB 117,114 ; jne 3480 <_sk_load_565_dst_hsw+0x7c> DB 196,193,122,111,36,83 ; vmovdqu (%r11,%rdx,2),%xmm4 DB 196,226,125,51,244 ; vpmovzxwd %xmm4,%ymm6 - DB 196,226,125,88,37,98,37,0,0 ; vpbroadcastd 0x2562(%rip),%ymm4 # 5984 <_sk_callback_hsw+0x3e1> + DB 196,226,125,88,37,10,38,0,0 ; vpbroadcastd 0x260a(%rip),%ymm4 # 5a2c <_sk_callback_hsw+0x3e3> DB 197,205,219,228 ; vpand %ymm4,%ymm6,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,85,37,0,0 ; vbroadcastss 0x2555(%rip),%ymm5 # 5988 <_sk_callback_hsw+0x3e5> + DB 196,226,125,24,45,253,37,0,0 ; vbroadcastss 0x25fd(%rip),%ymm5 # 5a30 <_sk_callback_hsw+0x3e7> DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4 - DB 196,226,125,88,45,76,37,0,0 ; vpbroadcastd 0x254c(%rip),%ymm5 # 598c <_sk_callback_hsw+0x3e9> + DB 196,226,125,88,45,244,37,0,0 ; vpbroadcastd 0x25f4(%rip),%ymm5 # 5a34 <_sk_callback_hsw+0x3eb> DB 197,205,219,237 ; vpand %ymm5,%ymm6,%ymm5 DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 - DB 196,226,125,24,61,63,37,0,0 ; vbroadcastss 0x253f(%rip),%ymm7 # 5990 <_sk_callback_hsw+0x3ed> + DB 196,226,125,24,61,231,37,0,0 ; vbroadcastss 0x25e7(%rip),%ymm7 # 5a38 <_sk_callback_hsw+0x3ef> DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5 - DB 196,226,125,88,61,54,37,0,0 ; vpbroadcastd 0x2536(%rip),%ymm7 # 5994 <_sk_callback_hsw+0x3f1> + DB 196,226,125,88,61,222,37,0,0 ; vpbroadcastd 0x25de(%rip),%ymm7 # 5a3c <_sk_callback_hsw+0x3f3> DB 197,205,219,247 ; vpand %ymm7,%ymm6,%ymm6 DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6 - DB 196,226,125,24,61,41,37,0,0 ; vbroadcastss 0x2529(%rip),%ymm7 # 5998 <_sk_callback_hsw+0x3f5> + DB 196,226,125,24,61,209,37,0,0 ; vbroadcastss 0x25d1(%rip),%ymm7 # 5a40 <_sk_callback_hsw+0x3f7> DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,61,30,37,0,0 ; vbroadcastss 0x251e(%rip),%ymm7 # 599c <_sk_callback_hsw+0x3f9> + DB 196,226,125,24,61,198,37,0,0 ; vbroadcastss 0x25c6(%rip),%ymm7 # 5a44 <_sk_callback_hsw+0x3fb> DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,7 ; and $0x7,%r9b @@ -3226,34 +3226,34 @@ _sk_gather_565_hsw LABEL PROC DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0 DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2 - DB 196,226,125,88,5,211,35,0,0 ; vpbroadcastd 0x23d3(%rip),%ymm0 # 59a0 <_sk_callback_hsw+0x3fd> + DB 196,226,125,88,5,123,36,0,0 ; vpbroadcastd 0x247b(%rip),%ymm0 # 5a48 <_sk_callback_hsw+0x3ff> DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,198,35,0,0 ; vbroadcastss 0x23c6(%rip),%ymm1 # 59a4 <_sk_callback_hsw+0x401> + DB 196,226,125,24,13,110,36,0,0 ; vbroadcastss 0x246e(%rip),%ymm1 # 5a4c <_sk_callback_hsw+0x403> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,88,13,189,35,0,0 ; vpbroadcastd 0x23bd(%rip),%ymm1 # 59a8 <_sk_callback_hsw+0x405> + DB 196,226,125,88,13,101,36,0,0 ; vpbroadcastd 0x2465(%rip),%ymm1 # 5a50 <_sk_callback_hsw+0x407> DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,29,176,35,0,0 ; vbroadcastss 0x23b0(%rip),%ymm3 # 59ac <_sk_callback_hsw+0x409> + DB 196,226,125,24,29,88,36,0,0 ; vbroadcastss 0x2458(%rip),%ymm3 # 5a54 <_sk_callback_hsw+0x40b> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 - DB 196,226,125,88,29,167,35,0,0 ; vpbroadcastd 0x23a7(%rip),%ymm3 # 59b0 <_sk_callback_hsw+0x40d> + DB 196,226,125,88,29,79,36,0,0 ; vpbroadcastd 0x244f(%rip),%ymm3 # 5a58 <_sk_callback_hsw+0x40f> DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,226,125,24,29,154,35,0,0 ; vbroadcastss 0x239a(%rip),%ymm3 # 59b4 <_sk_callback_hsw+0x411> + DB 196,226,125,24,29,66,36,0,0 ; vbroadcastss 0x2442(%rip),%ymm3 # 5a5c <_sk_callback_hsw+0x413> DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,143,35,0,0 ; vbroadcastss 0x238f(%rip),%ymm3 # 59b8 <_sk_callback_hsw+0x415> + DB 196,226,125,24,29,55,36,0,0 ; vbroadcastss 0x2437(%rip),%ymm3 # 5a60 <_sk_callback_hsw+0x417> DB 255,224 ; jmpq *%rax PUBLIC _sk_store_565_hsw _sk_store_565_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 - DB 196,98,125,24,5,131,35,0,0 ; vbroadcastss 0x2383(%rip),%ymm8 # 59bc <_sk_callback_hsw+0x419> + DB 196,98,125,24,5,43,36,0,0 ; vbroadcastss 0x242b(%rip),%ymm8 # 5a64 <_sk_callback_hsw+0x41b> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,193,53,114,241,11 ; vpslld $0xb,%ymm9,%ymm9 - DB 196,98,125,24,21,110,35,0,0 ; vbroadcastss 0x236e(%rip),%ymm10 # 59c0 <_sk_callback_hsw+0x41d> + DB 196,98,125,24,21,22,36,0,0 ; vbroadcastss 0x2416(%rip),%ymm10 # 5a68 <_sk_callback_hsw+0x41f> DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10 DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10 DB 196,193,45,114,242,5 ; vpslld $0x5,%ymm10,%ymm10 @@ -3321,25 +3321,25 @@ _sk_load_4444_hsw LABEL PROC DB 15,133,138,0,0,0 ; jne 37a4 <_sk_load_4444_hsw+0x98> DB 196,193,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm0 DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3 - DB 196,226,125,88,5,150,34,0,0 ; vpbroadcastd 0x2296(%rip),%ymm0 # 59c4 <_sk_callback_hsw+0x421> + DB 196,226,125,88,5,62,35,0,0 ; vpbroadcastd 0x233e(%rip),%ymm0 # 5a6c <_sk_callback_hsw+0x423> DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,137,34,0,0 ; vbroadcastss 0x2289(%rip),%ymm1 # 59c8 <_sk_callback_hsw+0x425> + DB 196,226,125,24,13,49,35,0,0 ; vbroadcastss 0x2331(%rip),%ymm1 # 5a70 <_sk_callback_hsw+0x427> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,88,13,128,34,0,0 ; vpbroadcastd 0x2280(%rip),%ymm1 # 59cc <_sk_callback_hsw+0x429> + DB 196,226,125,88,13,40,35,0,0 ; vpbroadcastd 0x2328(%rip),%ymm1 # 5a74 <_sk_callback_hsw+0x42b> DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,21,115,34,0,0 ; vbroadcastss 0x2273(%rip),%ymm2 # 59d0 <_sk_callback_hsw+0x42d> + DB 196,226,125,24,21,27,35,0,0 ; vbroadcastss 0x231b(%rip),%ymm2 # 5a78 <_sk_callback_hsw+0x42f> DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1 - DB 196,226,125,88,21,106,34,0,0 ; vpbroadcastd 0x226a(%rip),%ymm2 # 59d4 <_sk_callback_hsw+0x431> + DB 196,226,125,88,21,18,35,0,0 ; vpbroadcastd 0x2312(%rip),%ymm2 # 5a7c <_sk_callback_hsw+0x433> DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,98,125,24,5,93,34,0,0 ; vbroadcastss 0x225d(%rip),%ymm8 # 59d8 <_sk_callback_hsw+0x435> + DB 196,98,125,24,5,5,35,0,0 ; vbroadcastss 0x2305(%rip),%ymm8 # 5a80 <_sk_callback_hsw+0x437> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 - DB 196,98,125,88,5,83,34,0,0 ; vpbroadcastd 0x2253(%rip),%ymm8 # 59dc <_sk_callback_hsw+0x439> + DB 196,98,125,88,5,251,34,0,0 ; vpbroadcastd 0x22fb(%rip),%ymm8 # 5a84 <_sk_callback_hsw+0x43b> DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,69,34,0,0 ; vbroadcastss 0x2245(%rip),%ymm8 # 59e0 <_sk_callback_hsw+0x43d> + DB 196,98,125,24,5,237,34,0,0 ; vbroadcastss 0x22ed(%rip),%ymm8 # 5a88 <_sk_callback_hsw+0x43f> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -3396,25 +3396,25 @@ _sk_load_4444_dst_hsw LABEL PROC DB 15,133,138,0,0,0 ; jne 38dc <_sk_load_4444_dst_hsw+0x98> DB 196,193,122,111,36,83 ; vmovdqu (%r11,%rdx,2),%xmm4 DB 196,226,125,51,252 ; vpmovzxwd %xmm4,%ymm7 - DB 196,226,125,88,37,126,33,0,0 ; vpbroadcastd 0x217e(%rip),%ymm4 # 59e4 <_sk_callback_hsw+0x441> + DB 196,226,125,88,37,38,34,0,0 ; vpbroadcastd 0x2226(%rip),%ymm4 # 5a8c <_sk_callback_hsw+0x443> DB 197,197,219,228 ; vpand %ymm4,%ymm7,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,113,33,0,0 ; vbroadcastss 0x2171(%rip),%ymm5 # 59e8 <_sk_callback_hsw+0x445> + DB 196,226,125,24,45,25,34,0,0 ; vbroadcastss 0x2219(%rip),%ymm5 # 5a90 <_sk_callback_hsw+0x447> DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4 - DB 196,226,125,88,45,104,33,0,0 ; vpbroadcastd 0x2168(%rip),%ymm5 # 59ec <_sk_callback_hsw+0x449> + DB 196,226,125,88,45,16,34,0,0 ; vpbroadcastd 0x2210(%rip),%ymm5 # 5a94 <_sk_callback_hsw+0x44b> DB 197,197,219,237 ; vpand %ymm5,%ymm7,%ymm5 DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 - DB 196,226,125,24,53,91,33,0,0 ; vbroadcastss 0x215b(%rip),%ymm6 # 59f0 <_sk_callback_hsw+0x44d> + DB 196,226,125,24,53,3,34,0,0 ; vbroadcastss 0x2203(%rip),%ymm6 # 5a98 <_sk_callback_hsw+0x44f> DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5 - DB 196,226,125,88,53,82,33,0,0 ; vpbroadcastd 0x2152(%rip),%ymm6 # 59f4 <_sk_callback_hsw+0x451> + DB 196,226,125,88,53,250,33,0,0 ; vpbroadcastd 0x21fa(%rip),%ymm6 # 5a9c <_sk_callback_hsw+0x453> DB 197,197,219,246 ; vpand %ymm6,%ymm7,%ymm6 DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6 - DB 196,98,125,24,5,69,33,0,0 ; vbroadcastss 0x2145(%rip),%ymm8 # 59f8 <_sk_callback_hsw+0x455> + DB 196,98,125,24,5,237,33,0,0 ; vbroadcastss 0x21ed(%rip),%ymm8 # 5aa0 <_sk_callback_hsw+0x457> DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6 - DB 196,98,125,88,5,59,33,0,0 ; vpbroadcastd 0x213b(%rip),%ymm8 # 59fc <_sk_callback_hsw+0x459> + DB 196,98,125,88,5,227,33,0,0 ; vpbroadcastd 0x21e3(%rip),%ymm8 # 5aa4 <_sk_callback_hsw+0x45b> DB 196,193,69,219,248 ; vpand %ymm8,%ymm7,%ymm7 DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7 - DB 196,98,125,24,5,45,33,0,0 ; vbroadcastss 0x212d(%rip),%ymm8 # 5a00 <_sk_callback_hsw+0x45d> + DB 196,98,125,24,5,213,33,0,0 ; vbroadcastss 0x21d5(%rip),%ymm8 # 5aa8 <_sk_callback_hsw+0x45f> DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -3502,25 +3502,25 @@ _sk_gather_4444_hsw LABEL PROC DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0 DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3 - DB 196,226,125,88,5,215,31,0,0 ; vpbroadcastd 0x1fd7(%rip),%ymm0 # 5a04 <_sk_callback_hsw+0x461> + DB 196,226,125,88,5,127,32,0,0 ; vpbroadcastd 0x207f(%rip),%ymm0 # 5aac <_sk_callback_hsw+0x463> DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,202,31,0,0 ; vbroadcastss 0x1fca(%rip),%ymm1 # 5a08 <_sk_callback_hsw+0x465> + DB 196,226,125,24,13,114,32,0,0 ; vbroadcastss 0x2072(%rip),%ymm1 # 5ab0 <_sk_callback_hsw+0x467> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,88,13,193,31,0,0 ; vpbroadcastd 0x1fc1(%rip),%ymm1 # 5a0c <_sk_callback_hsw+0x469> + DB 196,226,125,88,13,105,32,0,0 ; vpbroadcastd 0x2069(%rip),%ymm1 # 5ab4 <_sk_callback_hsw+0x46b> DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,21,180,31,0,0 ; vbroadcastss 0x1fb4(%rip),%ymm2 # 5a10 <_sk_callback_hsw+0x46d> + DB 196,226,125,24,21,92,32,0,0 ; vbroadcastss 0x205c(%rip),%ymm2 # 5ab8 <_sk_callback_hsw+0x46f> DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1 - DB 196,226,125,88,21,171,31,0,0 ; vpbroadcastd 0x1fab(%rip),%ymm2 # 5a14 <_sk_callback_hsw+0x471> + DB 196,226,125,88,21,83,32,0,0 ; vpbroadcastd 0x2053(%rip),%ymm2 # 5abc <_sk_callback_hsw+0x473> DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,98,125,24,5,158,31,0,0 ; vbroadcastss 0x1f9e(%rip),%ymm8 # 5a18 <_sk_callback_hsw+0x475> + DB 196,98,125,24,5,70,32,0,0 ; vbroadcastss 0x2046(%rip),%ymm8 # 5ac0 <_sk_callback_hsw+0x477> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 - DB 196,98,125,88,5,148,31,0,0 ; vpbroadcastd 0x1f94(%rip),%ymm8 # 5a1c <_sk_callback_hsw+0x479> + DB 196,98,125,88,5,60,32,0,0 ; vpbroadcastd 0x203c(%rip),%ymm8 # 5ac4 <_sk_callback_hsw+0x47b> DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,134,31,0,0 ; vbroadcastss 0x1f86(%rip),%ymm8 # 5a20 <_sk_callback_hsw+0x47d> + DB 196,98,125,24,5,46,32,0,0 ; vbroadcastss 0x202e(%rip),%ymm8 # 5ac8 <_sk_callback_hsw+0x47f> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -3529,7 +3529,7 @@ PUBLIC _sk_store_4444_hsw _sk_store_4444_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 - DB 196,98,125,24,5,115,31,0,0 ; vbroadcastss 0x1f73(%rip),%ymm8 # 5a24 <_sk_callback_hsw+0x481> + DB 196,98,125,24,5,27,32,0,0 ; vbroadcastss 0x201b(%rip),%ymm8 # 5acc <_sk_callback_hsw+0x483> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,193,53,114,241,12 ; vpslld $0xc,%ymm9,%ymm9 @@ -3605,14 +3605,14 @@ _sk_load_8888_hsw LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,88 ; jne 3bfd <_sk_load_8888_hsw+0x6d> DB 196,193,124,16,26 ; vmovups (%r10),%ymm3 - DB 197,228,84,5,206,32,0,0 ; vandps 0x20ce(%rip),%ymm3,%ymm0 # 5c80 <_sk_callback_hsw+0x6dd> + DB 197,228,84,5,142,33,0,0 ; vandps 0x218e(%rip),%ymm3,%ymm0 # 5d40 <_sk_callback_hsw+0x6f7> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,105,30,0,0 ; vbroadcastss 0x1e69(%rip),%ymm8 # 5a28 <_sk_callback_hsw+0x485> + DB 196,98,125,24,5,17,31,0,0 ; vbroadcastss 0x1f11(%rip),%ymm8 # 5ad0 <_sk_callback_hsw+0x487> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 - DB 196,226,101,0,13,211,32,0,0 ; vpshufb 0x20d3(%rip),%ymm3,%ymm1 # 5ca0 <_sk_callback_hsw+0x6fd> + DB 196,226,101,0,13,147,33,0,0 ; vpshufb 0x2193(%rip),%ymm3,%ymm1 # 5d60 <_sk_callback_hsw+0x717> DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 - DB 196,226,101,0,21,225,32,0,0 ; vpshufb 0x20e1(%rip),%ymm3,%ymm2 # 5cc0 <_sk_callback_hsw+0x71d> + DB 196,226,101,0,21,161,33,0,0 ; vpshufb 0x21a1(%rip),%ymm3,%ymm2 # 5d80 <_sk_callback_hsw+0x737> DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 @@ -3640,14 +3640,14 @@ _sk_load_8888_dst_hsw LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,88 ; jne 3c90 <_sk_load_8888_dst_hsw+0x6d> DB 196,193,124,16,58 ; vmovups (%r10),%ymm7 - DB 197,196,84,37,155,32,0,0 ; vandps 0x209b(%rip),%ymm7,%ymm4 # 5ce0 <_sk_callback_hsw+0x73d> + DB 197,196,84,37,91,33,0,0 ; vandps 0x215b(%rip),%ymm7,%ymm4 # 5da0 <_sk_callback_hsw+0x757> DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,98,125,24,5,218,29,0,0 ; vbroadcastss 0x1dda(%rip),%ymm8 # 5a2c <_sk_callback_hsw+0x489> + DB 196,98,125,24,5,130,30,0,0 ; vbroadcastss 0x1e82(%rip),%ymm8 # 5ad4 <_sk_callback_hsw+0x48b> DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4 - DB 196,226,69,0,45,160,32,0,0 ; vpshufb 0x20a0(%rip),%ymm7,%ymm5 # 5d00 <_sk_callback_hsw+0x75d> + DB 196,226,69,0,45,96,33,0,0 ; vpshufb 0x2160(%rip),%ymm7,%ymm5 # 5dc0 <_sk_callback_hsw+0x777> DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 DB 196,193,84,89,232 ; vmulps %ymm8,%ymm5,%ymm5 - DB 196,226,69,0,53,174,32,0,0 ; vpshufb 0x20ae(%rip),%ymm7,%ymm6 # 5d20 <_sk_callback_hsw+0x77d> + DB 196,226,69,0,53,110,33,0,0 ; vpshufb 0x216e(%rip),%ymm7,%ymm6 # 5de0 <_sk_callback_hsw+0x797> DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6 DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6 DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7 @@ -3677,14 +3677,14 @@ _sk_gather_8888_hsw LABEL PROC DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0 DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1 DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3 - DB 197,229,219,5,92,32,0,0 ; vpand 0x205c(%rip),%ymm3,%ymm0 # 5d40 <_sk_callback_hsw+0x79d> + DB 197,229,219,5,28,33,0,0 ; vpand 0x211c(%rip),%ymm3,%ymm0 # 5e00 <_sk_callback_hsw+0x7b7> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,63,29,0,0 ; vbroadcastss 0x1d3f(%rip),%ymm8 # 5a30 <_sk_callback_hsw+0x48d> + DB 196,98,125,24,5,231,29,0,0 ; vbroadcastss 0x1de7(%rip),%ymm8 # 5ad8 <_sk_callback_hsw+0x48f> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 - DB 196,226,101,0,13,97,32,0,0 ; vpshufb 0x2061(%rip),%ymm3,%ymm1 # 5d60 <_sk_callback_hsw+0x7bd> + DB 196,226,101,0,13,33,33,0,0 ; vpshufb 0x2121(%rip),%ymm3,%ymm1 # 5e20 <_sk_callback_hsw+0x7d7> DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 - DB 196,226,101,0,21,111,32,0,0 ; vpshufb 0x206f(%rip),%ymm3,%ymm2 # 5d80 <_sk_callback_hsw+0x7dd> + DB 196,226,101,0,21,47,33,0,0 ; vpshufb 0x212f(%rip),%ymm3,%ymm2 # 5e40 <_sk_callback_hsw+0x7f7> DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 @@ -3699,7 +3699,7 @@ _sk_store_8888_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 76,3,16 ; add (%rax),%r10 - DB 196,98,125,24,5,239,28,0,0 ; vbroadcastss 0x1cef(%rip),%ymm8 # 5a34 <_sk_callback_hsw+0x491> + DB 196,98,125,24,5,151,29,0,0 ; vbroadcastss 0x1d97(%rip),%ymm8 # 5adc <_sk_callback_hsw+0x493> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10 @@ -3739,14 +3739,14 @@ _sk_load_bgra_hsw LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,88 ; jne 3e32 <_sk_load_bgra_hsw+0x6d> DB 196,193,124,16,26 ; vmovups (%r10),%ymm3 - DB 197,228,84,5,185,31,0,0 ; vandps 0x1fb9(%rip),%ymm3,%ymm0 # 5da0 <_sk_callback_hsw+0x7fd> + DB 197,228,84,5,121,32,0,0 ; vandps 0x2079(%rip),%ymm3,%ymm0 # 5e60 <_sk_callback_hsw+0x817> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,68,28,0,0 ; vbroadcastss 0x1c44(%rip),%ymm8 # 5a38 <_sk_callback_hsw+0x495> + DB 196,98,125,24,5,236,28,0,0 ; vbroadcastss 0x1cec(%rip),%ymm8 # 5ae0 <_sk_callback_hsw+0x497> DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2 - DB 196,226,101,0,5,190,31,0,0 ; vpshufb 0x1fbe(%rip),%ymm3,%ymm0 # 5dc0 <_sk_callback_hsw+0x81d> + DB 196,226,101,0,5,126,32,0,0 ; vpshufb 0x207e(%rip),%ymm3,%ymm0 # 5e80 <_sk_callback_hsw+0x837> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1 - DB 196,226,101,0,5,204,31,0,0 ; vpshufb 0x1fcc(%rip),%ymm3,%ymm0 # 5de0 <_sk_callback_hsw+0x83d> + DB 196,226,101,0,5,140,32,0,0 ; vpshufb 0x208c(%rip),%ymm3,%ymm0 # 5ea0 <_sk_callback_hsw+0x857> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 @@ -3774,14 +3774,14 @@ _sk_load_bgra_dst_hsw LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,88 ; jne 3ec5 <_sk_load_bgra_dst_hsw+0x6d> DB 196,193,124,16,58 ; vmovups (%r10),%ymm7 - DB 197,196,84,37,134,31,0,0 ; vandps 0x1f86(%rip),%ymm7,%ymm4 # 5e00 <_sk_callback_hsw+0x85d> + DB 197,196,84,37,70,32,0,0 ; vandps 0x2046(%rip),%ymm7,%ymm4 # 5ec0 <_sk_callback_hsw+0x877> DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,98,125,24,5,181,27,0,0 ; vbroadcastss 0x1bb5(%rip),%ymm8 # 5a3c <_sk_callback_hsw+0x499> + DB 196,98,125,24,5,93,28,0,0 ; vbroadcastss 0x1c5d(%rip),%ymm8 # 5ae4 <_sk_callback_hsw+0x49b> DB 196,193,92,89,240 ; vmulps %ymm8,%ymm4,%ymm6 - DB 196,226,69,0,37,139,31,0,0 ; vpshufb 0x1f8b(%rip),%ymm7,%ymm4 # 5e20 <_sk_callback_hsw+0x87d> + DB 196,226,69,0,37,75,32,0,0 ; vpshufb 0x204b(%rip),%ymm7,%ymm4 # 5ee0 <_sk_callback_hsw+0x897> DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 DB 196,193,92,89,232 ; vmulps %ymm8,%ymm4,%ymm5 - DB 196,226,69,0,37,153,31,0,0 ; vpshufb 0x1f99(%rip),%ymm7,%ymm4 # 5e40 <_sk_callback_hsw+0x89d> + DB 196,226,69,0,37,89,32,0,0 ; vpshufb 0x2059(%rip),%ymm7,%ymm4 # 5f00 <_sk_callback_hsw+0x8b7> DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4 DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7 @@ -3811,14 +3811,14 @@ _sk_gather_bgra_hsw LABEL PROC DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0 DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1 DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3 - DB 197,229,219,5,71,31,0,0 ; vpand 0x1f47(%rip),%ymm3,%ymm0 # 5e60 <_sk_callback_hsw+0x8bd> + DB 197,229,219,5,7,32,0,0 ; vpand 0x2007(%rip),%ymm3,%ymm0 # 5f20 <_sk_callback_hsw+0x8d7> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,26,27,0,0 ; vbroadcastss 0x1b1a(%rip),%ymm8 # 5a40 <_sk_callback_hsw+0x49d> + DB 196,98,125,24,5,194,27,0,0 ; vbroadcastss 0x1bc2(%rip),%ymm8 # 5ae8 <_sk_callback_hsw+0x49f> DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2 - DB 196,226,101,0,5,76,31,0,0 ; vpshufb 0x1f4c(%rip),%ymm3,%ymm0 # 5e80 <_sk_callback_hsw+0x8dd> + DB 196,226,101,0,5,12,32,0,0 ; vpshufb 0x200c(%rip),%ymm3,%ymm0 # 5f40 <_sk_callback_hsw+0x8f7> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1 - DB 196,226,101,0,5,90,31,0,0 ; vpshufb 0x1f5a(%rip),%ymm3,%ymm0 # 5ea0 <_sk_callback_hsw+0x8fd> + DB 196,226,101,0,5,26,32,0,0 ; vpshufb 0x201a(%rip),%ymm3,%ymm0 # 5f60 <_sk_callback_hsw+0x917> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 @@ -3833,7 +3833,7 @@ _sk_store_bgra_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 76,3,16 ; add (%rax),%r10 - DB 196,98,125,24,5,202,26,0,0 ; vbroadcastss 0x1aca(%rip),%ymm8 # 5a44 <_sk_callback_hsw+0x4a1> + DB 196,98,125,24,5,114,27,0,0 ; vbroadcastss 0x1b72(%rip),%ymm8 # 5aec <_sk_callback_hsw+0x4a3> DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10 @@ -4077,7 +4077,7 @@ _sk_load_u16_be_hsw LABEL PROC DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0 DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,21,225,22,0,0 ; vbroadcastss 0x16e1(%rip),%ymm10 # 5a48 <_sk_callback_hsw+0x4a5> + DB 196,98,125,24,21,137,23,0,0 ; vbroadcastss 0x1789(%rip),%ymm10 # 5af0 <_sk_callback_hsw+0x4a7> DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1 DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2 @@ -4159,7 +4159,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0 DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,21,114,21,0,0 ; vbroadcastss 0x1572(%rip),%ymm10 # 5a4c <_sk_callback_hsw+0x4a9> + DB 196,98,125,24,21,26,22,0,0 ; vbroadcastss 0x161a(%rip),%ymm10 # 5af4 <_sk_callback_hsw+0x4ab> DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1 DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2 @@ -4176,7 +4176,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,38,21,0,0 ; vbroadcastss 0x1526(%rip),%ymm3 # 5a50 <_sk_callback_hsw+0x4ad> + DB 196,226,125,24,29,206,21,0,0 ; vbroadcastss 0x15ce(%rip),%ymm3 # 5af8 <_sk_callback_hsw+0x4af> DB 255,224 ; jmpq *%rax DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0 DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0 @@ -4217,7 +4217,7 @@ _sk_store_u16_be_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax - DB 196,98,125,24,5,99,20,0,0 ; vbroadcastss 0x1463(%rip),%ymm8 # 5a54 <_sk_callback_hsw+0x4b1> + DB 196,98,125,24,5,11,21,0,0 ; vbroadcastss 0x150b(%rip),%ymm8 # 5afc <_sk_callback_hsw+0x4b3> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10 @@ -4488,7 +4488,7 @@ _sk_mirror_x_hsw LABEL PROC DB 196,65,124,92,218 ; vsubps %ymm10,%ymm0,%ymm11 DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0 DB 196,98,125,24,192 ; vbroadcastss %xmm0,%ymm8 - DB 197,178,89,5,49,16,0,0 ; vmulss 0x1031(%rip),%xmm9,%xmm0 # 5a58 <_sk_callback_hsw+0x4b5> + DB 197,178,89,5,217,16,0,0 ; vmulss 0x10d9(%rip),%xmm9,%xmm0 # 5b00 <_sk_callback_hsw+0x4b7> DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0 DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0 DB 196,227,125,8,192,1 ; vroundps $0x1,%ymm0,%ymm0 @@ -4512,7 +4512,7 @@ _sk_mirror_y_hsw LABEL PROC DB 196,65,116,92,218 ; vsubps %ymm10,%ymm1,%ymm11 DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1 DB 196,98,125,24,193 ; vbroadcastss %xmm1,%ymm8 - DB 197,178,89,13,213,15,0,0 ; vmulss 0xfd5(%rip),%xmm9,%xmm1 # 5a5c <_sk_callback_hsw+0x4b9> + DB 197,178,89,13,125,16,0,0 ; vmulss 0x107d(%rip),%xmm9,%xmm1 # 5b04 <_sk_callback_hsw+0x4bb> DB 196,226,125,24,201 ; vbroadcastss %xmm1,%ymm1 DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1 DB 196,227,125,8,201,1 ; vroundps $0x1,%ymm1,%ymm1 @@ -4531,7 +4531,7 @@ PUBLIC _sk_clamp_x_1_hsw _sk_clamp_x_1_hsw LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0 - DB 196,98,125,24,5,142,15,0,0 ; vbroadcastss 0xf8e(%rip),%ymm8 # 5a60 <_sk_callback_hsw+0x4bd> + DB 196,98,125,24,5,54,16,0,0 ; vbroadcastss 0x1036(%rip),%ymm8 # 5b08 <_sk_callback_hsw+0x4bf> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -4545,9 +4545,9 @@ _sk_repeat_x_1_hsw LABEL PROC PUBLIC _sk_mirror_x_1_hsw _sk_mirror_x_1_hsw LABEL PROC - DB 196,98,125,24,5,113,15,0,0 ; vbroadcastss 0xf71(%rip),%ymm8 # 5a64 <_sk_callback_hsw+0x4c1> + DB 196,98,125,24,5,25,16,0,0 ; vbroadcastss 0x1019(%rip),%ymm8 # 5b0c <_sk_callback_hsw+0x4c3> DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,13,103,15,0,0 ; vbroadcastss 0xf67(%rip),%ymm9 # 5a68 <_sk_callback_hsw+0x4c5> + DB 196,98,125,24,13,15,16,0,0 ; vbroadcastss 0x100f(%rip),%ymm9 # 5b10 <_sk_callback_hsw+0x4c7> DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9 DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9 DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9 @@ -4561,11 +4561,11 @@ _sk_mirror_x_1_hsw LABEL PROC PUBLIC _sk_luminance_to_alpha_hsw _sk_luminance_to_alpha_hsw LABEL PROC - DB 196,226,125,24,29,55,15,0,0 ; vbroadcastss 0xf37(%rip),%ymm3 # 5a6c <_sk_callback_hsw+0x4c9> - DB 196,98,125,24,5,50,15,0,0 ; vbroadcastss 0xf32(%rip),%ymm8 # 5a70 <_sk_callback_hsw+0x4cd> + DB 196,226,125,24,29,223,15,0,0 ; vbroadcastss 0xfdf(%rip),%ymm3 # 5b14 <_sk_callback_hsw+0x4cb> + DB 196,98,125,24,5,218,15,0,0 ; vbroadcastss 0xfda(%rip),%ymm8 # 5b18 <_sk_callback_hsw+0x4cf> DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 DB 196,226,125,184,203 ; vfmadd231ps %ymm3,%ymm0,%ymm1 - DB 196,226,125,24,29,35,15,0,0 ; vbroadcastss 0xf23(%rip),%ymm3 # 5a74 <_sk_callback_hsw+0x4d1> + DB 196,226,125,24,29,203,15,0,0 ; vbroadcastss 0xfcb(%rip),%ymm3 # 5b1c <_sk_callback_hsw+0x4d3> DB 196,226,109,168,217 ; vfmadd213ps %ymm1,%ymm2,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -4791,14 +4791,14 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC PUBLIC _sk_gauss_a_to_rgba_hsw _sk_gauss_a_to_rgba_hsw LABEL PROC - DB 196,226,125,24,5,107,11,0,0 ; vbroadcastss 0xb6b(%rip),%ymm0 # 5a78 <_sk_callback_hsw+0x4d5> - DB 196,226,125,24,13,102,11,0,0 ; vbroadcastss 0xb66(%rip),%ymm1 # 5a7c <_sk_callback_hsw+0x4d9> + DB 196,226,125,24,5,19,12,0,0 ; vbroadcastss 0xc13(%rip),%ymm0 # 5b20 <_sk_callback_hsw+0x4d7> + DB 196,226,125,24,13,14,12,0,0 ; vbroadcastss 0xc0e(%rip),%ymm1 # 5b24 <_sk_callback_hsw+0x4db> DB 196,226,101,168,200 ; vfmadd213ps %ymm0,%ymm3,%ymm1 - DB 196,226,125,24,5,92,11,0,0 ; vbroadcastss 0xb5c(%rip),%ymm0 # 5a80 <_sk_callback_hsw+0x4dd> + DB 196,226,125,24,5,4,12,0,0 ; vbroadcastss 0xc04(%rip),%ymm0 # 5b28 <_sk_callback_hsw+0x4df> DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0 - DB 196,226,125,24,13,82,11,0,0 ; vbroadcastss 0xb52(%rip),%ymm1 # 5a84 <_sk_callback_hsw+0x4e1> + DB 196,226,125,24,13,250,11,0,0 ; vbroadcastss 0xbfa(%rip),%ymm1 # 5b2c <_sk_callback_hsw+0x4e3> DB 196,226,101,184,200 ; vfmadd231ps %ymm0,%ymm3,%ymm1 - DB 196,226,125,24,5,72,11,0,0 ; vbroadcastss 0xb48(%rip),%ymm0 # 5a88 <_sk_callback_hsw+0x4e5> + DB 196,226,125,24,5,240,11,0,0 ; vbroadcastss 0xbf0(%rip),%ymm0 # 5b30 <_sk_callback_hsw+0x4e7> DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 @@ -4815,7 +4815,7 @@ _sk_gradient_hsw LABEL PROC DB 76,139,80,72 ; mov 0x48(%rax),%r10 DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 DB 65,187,1,0,0,0 ; mov $0x1,%r11d - DB 196,226,125,24,21,17,11,0,0 ; vbroadcastss 0xb11(%rip),%ymm2 # 5a8c <_sk_callback_hsw+0x4e9> + DB 196,226,125,24,21,185,11,0,0 ; vbroadcastss 0xbb9(%rip),%ymm2 # 5b34 <_sk_callback_hsw+0x4eb> DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9 DB 196,130,125,24,28,154 ; vbroadcastss (%r10,%r11,4),%ymm3 DB 197,228,194,216,2 ; vcmpleps %ymm0,%ymm3,%ymm3 @@ -4906,24 +4906,24 @@ _sk_xy_to_unit_angle_hsw LABEL PROC DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12 DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11 DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12 - DB 196,98,125,24,45,144,9,0,0 ; vbroadcastss 0x990(%rip),%ymm13 # 5a90 <_sk_callback_hsw+0x4ed> - DB 196,98,125,24,53,139,9,0,0 ; vbroadcastss 0x98b(%rip),%ymm14 # 5a94 <_sk_callback_hsw+0x4f1> + DB 196,98,125,24,45,56,10,0,0 ; vbroadcastss 0xa38(%rip),%ymm13 # 5b38 <_sk_callback_hsw+0x4ef> + DB 196,98,125,24,53,51,10,0,0 ; vbroadcastss 0xa33(%rip),%ymm14 # 5b3c <_sk_callback_hsw+0x4f3> DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14 - DB 196,98,125,24,45,129,9,0,0 ; vbroadcastss 0x981(%rip),%ymm13 # 5a98 <_sk_callback_hsw+0x4f5> + DB 196,98,125,24,45,41,10,0,0 ; vbroadcastss 0xa29(%rip),%ymm13 # 5b40 <_sk_callback_hsw+0x4f7> DB 196,66,29,184,238 ; vfmadd231ps %ymm14,%ymm12,%ymm13 - DB 196,98,125,24,53,119,9,0,0 ; vbroadcastss 0x977(%rip),%ymm14 # 5a9c <_sk_callback_hsw+0x4f9> + DB 196,98,125,24,53,31,10,0,0 ; vbroadcastss 0xa1f(%rip),%ymm14 # 5b44 <_sk_callback_hsw+0x4fb> DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14 DB 196,65,36,89,222 ; vmulps %ymm14,%ymm11,%ymm11 DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9 - DB 196,98,125,24,21,98,9,0,0 ; vbroadcastss 0x962(%rip),%ymm10 # 5aa0 <_sk_callback_hsw+0x4fd> + DB 196,98,125,24,21,10,10,0,0 ; vbroadcastss 0xa0a(%rip),%ymm10 # 5b48 <_sk_callback_hsw+0x4ff> DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10 DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9 DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,21,76,9,0,0 ; vbroadcastss 0x94c(%rip),%ymm10 # 5aa4 <_sk_callback_hsw+0x501> + DB 196,98,125,24,21,244,9,0,0 ; vbroadcastss 0x9f4(%rip),%ymm10 # 5b4c <_sk_callback_hsw+0x503> DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10 DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0 DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9 - DB 196,98,125,24,21,54,9,0,0 ; vbroadcastss 0x936(%rip),%ymm10 # 5aa8 <_sk_callback_hsw+0x505> + DB 196,98,125,24,21,222,9,0,0 ; vbroadcastss 0x9de(%rip),%ymm10 # 5b50 <_sk_callback_hsw+0x507> DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10 DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0 DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9 @@ -4939,32 +4939,32 @@ _sk_xy_to_radius_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax -PUBLIC _sk_xy_to_2pt_conical_hsw -_sk_xy_to_2pt_conical_hsw LABEL PROC +PUBLIC _sk_xy_to_2pt_conical_quadratic_hsw +_sk_xy_to_2pt_conical_quadratic_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,0 ; vbroadcastss (%rax),%ymm8 - DB 197,122,16,72,8 ; vmovss 0x8(%rax),%xmm9 - DB 197,50,89,80,12 ; vmulss 0xc(%rax),%xmm9,%xmm10 + DB 196,98,125,24,64,32 ; vbroadcastss 0x20(%rax),%ymm8 + DB 197,122,16,72,40 ; vmovss 0x28(%rax),%xmm9 + DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10 DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10 DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10 - DB 196,98,125,24,29,235,8,0,0 ; vbroadcastss 0x8eb(%rip),%ymm11 # 5aac <_sk_callback_hsw+0x509> + DB 196,98,125,24,29,146,9,0,0 ; vbroadcastss 0x992(%rip),%ymm11 # 5b54 <_sk_callback_hsw+0x50b> DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11 DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11 DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0 DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0 DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0 - DB 196,98,125,24,13,202,8,0,0 ; vbroadcastss 0x8ca(%rip),%ymm9 # 5ab0 <_sk_callback_hsw+0x50d> + DB 196,98,125,24,13,113,9,0,0 ; vbroadcastss 0x971(%rip),%ymm9 # 5b58 <_sk_callback_hsw+0x50f> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0 DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0 - DB 196,98,125,24,64,4 ; vbroadcastss 0x4(%rax),%ymm8 - DB 196,98,125,24,13,173,8,0,0 ; vbroadcastss 0x8ad(%rip),%ymm9 # 5ab4 <_sk_callback_hsw+0x511> + DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8 + DB 196,98,125,24,13,84,9,0,0 ; vbroadcastss 0x954(%rip),%ymm9 # 5b5c <_sk_callback_hsw+0x513> DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9 DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10 DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10 - DB 196,98,125,24,29,153,8,0,0 ; vbroadcastss 0x899(%rip),%ymm11 # 5ab8 <_sk_callback_hsw+0x515> + DB 196,98,125,24,29,64,9,0,0 ; vbroadcastss 0x940(%rip),%ymm11 # 5b60 <_sk_callback_hsw+0x517> DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 @@ -4973,10 +4973,52 @@ _sk_xy_to_2pt_conical_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax +PUBLIC _sk_xy_to_2pt_conical_linear_hsw +_sk_xy_to_2pt_conical_linear_hsw LABEL PROC + DB 72,173 ; lods %ds:(%rsi),%rax + DB 197,122,16,64,40 ; vmovss 0x28(%rax),%xmm8 + DB 197,122,16,72,44 ; vmovss 0x2c(%rax),%xmm9 + DB 196,65,50,89,208 ; vmulss %xmm8,%xmm9,%xmm10 + DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10 + DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10 + DB 196,98,125,24,29,7,9,0,0 ; vbroadcastss 0x907(%rip),%ymm11 # 5b64 <_sk_callback_hsw+0x51b> + DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 + DB 197,244,89,201 ; vmulps %ymm1,%ymm1,%ymm1 + DB 196,226,125,184,200 ; vfmadd231ps %ymm0,%ymm0,%ymm1 + DB 196,193,58,89,192 ; vmulss %xmm8,%xmm8,%xmm0 + DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0 + DB 197,244,92,192 ; vsubps %ymm0,%ymm1,%ymm0 + DB 196,226,125,24,13,230,8,0,0 ; vbroadcastss 0x8e6(%rip),%ymm1 # 5b68 <_sk_callback_hsw+0x51f> + DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0 + DB 196,193,124,94,194 ; vdivps %ymm10,%ymm0,%ymm0 + DB 196,194,125,24,201 ; vbroadcastss %xmm9,%ymm1 + DB 196,66,125,24,192 ; vbroadcastss %xmm8,%ymm8 + DB 196,98,125,184,193 ; vfmadd231ps %ymm1,%ymm0,%ymm8 + DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 + DB 197,60,194,193,1 ; vcmpltps %ymm1,%ymm8,%ymm8 + DB 196,98,125,24,13,192,8,0,0 ; vbroadcastss 0x8c0(%rip),%ymm9 # 5b6c <_sk_callback_hsw+0x523> + DB 196,99,53,74,193,128 ; vblendvps %ymm8,%ymm1,%ymm9,%ymm8 + DB 197,124,194,201,3 ; vcmpunordps %ymm1,%ymm0,%ymm9 + DB 196,227,61,74,201,144 ; vblendvps %ymm9,%ymm1,%ymm8,%ymm1 + DB 197,252,17,8 ; vmovups %ymm1,(%rax) + DB 72,173 ; lods %ds:(%rsi),%rax + DB 255,224 ; jmpq *%rax + +PUBLIC _sk_vector_scale_hsw +_sk_vector_scale_hsw LABEL PROC + DB 72,173 ; lods %ds:(%rsi),%rax + DB 197,124,16,0 ; vmovups (%rax),%ymm8 + DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 + DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 + DB 197,188,89,210 ; vmulps %ymm2,%ymm8,%ymm2 + DB 197,188,89,219 ; vmulps %ymm3,%ymm8,%ymm3 + DB 72,173 ; lods %ds:(%rsi),%rax + DB 255,224 ; jmpq *%rax + PUBLIC _sk_save_xy_hsw _sk_save_xy_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,120,8,0,0 ; vbroadcastss 0x878(%rip),%ymm8 # 5abc <_sk_callback_hsw+0x519> + DB 196,98,125,24,5,134,8,0,0 ; vbroadcastss 0x886(%rip),%ymm8 # 5b70 <_sk_callback_hsw+0x527> DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9 DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10 DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9 @@ -5006,9 +5048,9 @@ _sk_accumulate_hsw LABEL PROC PUBLIC _sk_bilinear_nx_hsw _sk_bilinear_nx_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,12,8,0,0 ; vbroadcastss 0x80c(%rip),%ymm0 # 5ac0 <_sk_callback_hsw+0x51d> + DB 196,226,125,24,5,26,8,0,0 ; vbroadcastss 0x81a(%rip),%ymm0 # 5b74 <_sk_callback_hsw+0x52b> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,3,8,0,0 ; vbroadcastss 0x803(%rip),%ymm8 # 5ac4 <_sk_callback_hsw+0x521> + DB 196,98,125,24,5,17,8,0,0 ; vbroadcastss 0x811(%rip),%ymm8 # 5b78 <_sk_callback_hsw+0x52f> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -5017,7 +5059,7 @@ _sk_bilinear_nx_hsw LABEL PROC PUBLIC _sk_bilinear_px_hsw _sk_bilinear_px_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,235,7,0,0 ; vbroadcastss 0x7eb(%rip),%ymm0 # 5ac8 <_sk_callback_hsw+0x525> + DB 196,226,125,24,5,249,7,0,0 ; vbroadcastss 0x7f9(%rip),%ymm0 # 5b7c <_sk_callback_hsw+0x533> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -5027,9 +5069,9 @@ _sk_bilinear_px_hsw LABEL PROC PUBLIC _sk_bilinear_ny_hsw _sk_bilinear_ny_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,207,7,0,0 ; vbroadcastss 0x7cf(%rip),%ymm1 # 5acc <_sk_callback_hsw+0x529> + DB 196,226,125,24,13,221,7,0,0 ; vbroadcastss 0x7dd(%rip),%ymm1 # 5b80 <_sk_callback_hsw+0x537> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,197,7,0,0 ; vbroadcastss 0x7c5(%rip),%ymm8 # 5ad0 <_sk_callback_hsw+0x52d> + DB 196,98,125,24,5,211,7,0,0 ; vbroadcastss 0x7d3(%rip),%ymm8 # 5b84 <_sk_callback_hsw+0x53b> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -5038,7 +5080,7 @@ _sk_bilinear_ny_hsw LABEL PROC PUBLIC _sk_bilinear_py_hsw _sk_bilinear_py_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,173,7,0,0 ; vbroadcastss 0x7ad(%rip),%ymm1 # 5ad4 <_sk_callback_hsw+0x531> + DB 196,226,125,24,13,187,7,0,0 ; vbroadcastss 0x7bb(%rip),%ymm1 # 5b88 <_sk_callback_hsw+0x53f> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -5048,13 +5090,13 @@ _sk_bilinear_py_hsw LABEL PROC PUBLIC _sk_bicubic_n3x_hsw _sk_bicubic_n3x_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,144,7,0,0 ; vbroadcastss 0x790(%rip),%ymm0 # 5ad8 <_sk_callback_hsw+0x535> + DB 196,226,125,24,5,158,7,0,0 ; vbroadcastss 0x79e(%rip),%ymm0 # 5b8c <_sk_callback_hsw+0x543> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,135,7,0,0 ; vbroadcastss 0x787(%rip),%ymm8 # 5adc <_sk_callback_hsw+0x539> + DB 196,98,125,24,5,149,7,0,0 ; vbroadcastss 0x795(%rip),%ymm8 # 5b90 <_sk_callback_hsw+0x547> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,120,7,0,0 ; vbroadcastss 0x778(%rip),%ymm10 # 5ae0 <_sk_callback_hsw+0x53d> - DB 196,98,125,24,29,115,7,0,0 ; vbroadcastss 0x773(%rip),%ymm11 # 5ae4 <_sk_callback_hsw+0x541> + DB 196,98,125,24,21,134,7,0,0 ; vbroadcastss 0x786(%rip),%ymm10 # 5b94 <_sk_callback_hsw+0x54b> + DB 196,98,125,24,29,129,7,0,0 ; vbroadcastss 0x781(%rip),%ymm11 # 5b98 <_sk_callback_hsw+0x54f> DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11 DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -5064,16 +5106,16 @@ _sk_bicubic_n3x_hsw LABEL PROC PUBLIC _sk_bicubic_n1x_hsw _sk_bicubic_n1x_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,86,7,0,0 ; vbroadcastss 0x756(%rip),%ymm0 # 5ae8 <_sk_callback_hsw+0x545> + DB 196,226,125,24,5,100,7,0,0 ; vbroadcastss 0x764(%rip),%ymm0 # 5b9c <_sk_callback_hsw+0x553> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,77,7,0,0 ; vbroadcastss 0x74d(%rip),%ymm8 # 5aec <_sk_callback_hsw+0x549> + DB 196,98,125,24,5,91,7,0,0 ; vbroadcastss 0x75b(%rip),%ymm8 # 5ba0 <_sk_callback_hsw+0x557> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 - DB 196,98,125,24,13,67,7,0,0 ; vbroadcastss 0x743(%rip),%ymm9 # 5af0 <_sk_callback_hsw+0x54d> - DB 196,98,125,24,21,62,7,0,0 ; vbroadcastss 0x73e(%rip),%ymm10 # 5af4 <_sk_callback_hsw+0x551> + DB 196,98,125,24,13,81,7,0,0 ; vbroadcastss 0x751(%rip),%ymm9 # 5ba4 <_sk_callback_hsw+0x55b> + DB 196,98,125,24,21,76,7,0,0 ; vbroadcastss 0x74c(%rip),%ymm10 # 5ba8 <_sk_callback_hsw+0x55f> DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10 - DB 196,98,125,24,13,52,7,0,0 ; vbroadcastss 0x734(%rip),%ymm9 # 5af8 <_sk_callback_hsw+0x555> + DB 196,98,125,24,13,66,7,0,0 ; vbroadcastss 0x742(%rip),%ymm9 # 5bac <_sk_callback_hsw+0x563> DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9 - DB 196,98,125,24,21,42,7,0,0 ; vbroadcastss 0x72a(%rip),%ymm10 # 5afc <_sk_callback_hsw+0x559> + DB 196,98,125,24,21,56,7,0,0 ; vbroadcastss 0x738(%rip),%ymm10 # 5bb0 <_sk_callback_hsw+0x567> DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10 DB 197,124,17,144,128,0,0,0 ; vmovups %ymm10,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -5082,14 +5124,14 @@ _sk_bicubic_n1x_hsw LABEL PROC PUBLIC _sk_bicubic_p1x_hsw _sk_bicubic_p1x_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,18,7,0,0 ; vbroadcastss 0x712(%rip),%ymm8 # 5b00 <_sk_callback_hsw+0x55d> + DB 196,98,125,24,5,32,7,0,0 ; vbroadcastss 0x720(%rip),%ymm8 # 5bb4 <_sk_callback_hsw+0x56b> DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0 DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9 - DB 196,98,125,24,21,4,7,0,0 ; vbroadcastss 0x704(%rip),%ymm10 # 5b04 <_sk_callback_hsw+0x561> - DB 196,98,125,24,29,255,6,0,0 ; vbroadcastss 0x6ff(%rip),%ymm11 # 5b08 <_sk_callback_hsw+0x565> + DB 196,98,125,24,21,18,7,0,0 ; vbroadcastss 0x712(%rip),%ymm10 # 5bb8 <_sk_callback_hsw+0x56f> + DB 196,98,125,24,29,13,7,0,0 ; vbroadcastss 0x70d(%rip),%ymm11 # 5bbc <_sk_callback_hsw+0x573> DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11 DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11 - DB 196,98,125,24,5,240,6,0,0 ; vbroadcastss 0x6f0(%rip),%ymm8 # 5b0c <_sk_callback_hsw+0x569> + DB 196,98,125,24,5,254,6,0,0 ; vbroadcastss 0x6fe(%rip),%ymm8 # 5bc0 <_sk_callback_hsw+0x577> DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -5098,12 +5140,12 @@ _sk_bicubic_p1x_hsw LABEL PROC PUBLIC _sk_bicubic_p3x_hsw _sk_bicubic_p3x_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,216,6,0,0 ; vbroadcastss 0x6d8(%rip),%ymm0 # 5b10 <_sk_callback_hsw+0x56d> + DB 196,226,125,24,5,230,6,0,0 ; vbroadcastss 0x6e6(%rip),%ymm0 # 5bc4 <_sk_callback_hsw+0x57b> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,197,6,0,0 ; vbroadcastss 0x6c5(%rip),%ymm10 # 5b14 <_sk_callback_hsw+0x571> - DB 196,98,125,24,29,192,6,0,0 ; vbroadcastss 0x6c0(%rip),%ymm11 # 5b18 <_sk_callback_hsw+0x575> + DB 196,98,125,24,21,211,6,0,0 ; vbroadcastss 0x6d3(%rip),%ymm10 # 5bc8 <_sk_callback_hsw+0x57f> + DB 196,98,125,24,29,206,6,0,0 ; vbroadcastss 0x6ce(%rip),%ymm11 # 5bcc <_sk_callback_hsw+0x583> DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11 DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -5113,13 +5155,13 @@ _sk_bicubic_p3x_hsw LABEL PROC PUBLIC _sk_bicubic_n3y_hsw _sk_bicubic_n3y_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,163,6,0,0 ; vbroadcastss 0x6a3(%rip),%ymm1 # 5b1c <_sk_callback_hsw+0x579> + DB 196,226,125,24,13,177,6,0,0 ; vbroadcastss 0x6b1(%rip),%ymm1 # 5bd0 <_sk_callback_hsw+0x587> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,153,6,0,0 ; vbroadcastss 0x699(%rip),%ymm8 # 5b20 <_sk_callback_hsw+0x57d> + DB 196,98,125,24,5,167,6,0,0 ; vbroadcastss 0x6a7(%rip),%ymm8 # 5bd4 <_sk_callback_hsw+0x58b> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,138,6,0,0 ; vbroadcastss 0x68a(%rip),%ymm10 # 5b24 <_sk_callback_hsw+0x581> - DB 196,98,125,24,29,133,6,0,0 ; vbroadcastss 0x685(%rip),%ymm11 # 5b28 <_sk_callback_hsw+0x585> + DB 196,98,125,24,21,152,6,0,0 ; vbroadcastss 0x698(%rip),%ymm10 # 5bd8 <_sk_callback_hsw+0x58f> + DB 196,98,125,24,29,147,6,0,0 ; vbroadcastss 0x693(%rip),%ymm11 # 5bdc <_sk_callback_hsw+0x593> DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11 DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -5129,16 +5171,16 @@ _sk_bicubic_n3y_hsw LABEL PROC PUBLIC _sk_bicubic_n1y_hsw _sk_bicubic_n1y_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,104,6,0,0 ; vbroadcastss 0x668(%rip),%ymm1 # 5b2c <_sk_callback_hsw+0x589> + DB 196,226,125,24,13,118,6,0,0 ; vbroadcastss 0x676(%rip),%ymm1 # 5be0 <_sk_callback_hsw+0x597> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,94,6,0,0 ; vbroadcastss 0x65e(%rip),%ymm8 # 5b30 <_sk_callback_hsw+0x58d> + DB 196,98,125,24,5,108,6,0,0 ; vbroadcastss 0x66c(%rip),%ymm8 # 5be4 <_sk_callback_hsw+0x59b> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 - DB 196,98,125,24,13,84,6,0,0 ; vbroadcastss 0x654(%rip),%ymm9 # 5b34 <_sk_callback_hsw+0x591> - DB 196,98,125,24,21,79,6,0,0 ; vbroadcastss 0x64f(%rip),%ymm10 # 5b38 <_sk_callback_hsw+0x595> + DB 196,98,125,24,13,98,6,0,0 ; vbroadcastss 0x662(%rip),%ymm9 # 5be8 <_sk_callback_hsw+0x59f> + DB 196,98,125,24,21,93,6,0,0 ; vbroadcastss 0x65d(%rip),%ymm10 # 5bec <_sk_callback_hsw+0x5a3> DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10 - DB 196,98,125,24,13,69,6,0,0 ; vbroadcastss 0x645(%rip),%ymm9 # 5b3c <_sk_callback_hsw+0x599> + DB 196,98,125,24,13,83,6,0,0 ; vbroadcastss 0x653(%rip),%ymm9 # 5bf0 <_sk_callback_hsw+0x5a7> DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9 - DB 196,98,125,24,21,59,6,0,0 ; vbroadcastss 0x63b(%rip),%ymm10 # 5b40 <_sk_callback_hsw+0x59d> + DB 196,98,125,24,21,73,6,0,0 ; vbroadcastss 0x649(%rip),%ymm10 # 5bf4 <_sk_callback_hsw+0x5ab> DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10 DB 197,124,17,144,160,0,0,0 ; vmovups %ymm10,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -5147,14 +5189,14 @@ _sk_bicubic_n1y_hsw LABEL PROC PUBLIC _sk_bicubic_p1y_hsw _sk_bicubic_p1y_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,35,6,0,0 ; vbroadcastss 0x623(%rip),%ymm8 # 5b44 <_sk_callback_hsw+0x5a1> + DB 196,98,125,24,5,49,6,0,0 ; vbroadcastss 0x631(%rip),%ymm8 # 5bf8 <_sk_callback_hsw+0x5af> DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1 DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9 - DB 196,98,125,24,21,20,6,0,0 ; vbroadcastss 0x614(%rip),%ymm10 # 5b48 <_sk_callback_hsw+0x5a5> - DB 196,98,125,24,29,15,6,0,0 ; vbroadcastss 0x60f(%rip),%ymm11 # 5b4c <_sk_callback_hsw+0x5a9> + DB 196,98,125,24,21,34,6,0,0 ; vbroadcastss 0x622(%rip),%ymm10 # 5bfc <_sk_callback_hsw+0x5b3> + DB 196,98,125,24,29,29,6,0,0 ; vbroadcastss 0x61d(%rip),%ymm11 # 5c00 <_sk_callback_hsw+0x5b7> DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11 DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11 - DB 196,98,125,24,5,0,6,0,0 ; vbroadcastss 0x600(%rip),%ymm8 # 5b50 <_sk_callback_hsw+0x5ad> + DB 196,98,125,24,5,14,6,0,0 ; vbroadcastss 0x60e(%rip),%ymm8 # 5c04 <_sk_callback_hsw+0x5bb> DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -5163,12 +5205,12 @@ _sk_bicubic_p1y_hsw LABEL PROC PUBLIC _sk_bicubic_p3y_hsw _sk_bicubic_p3y_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,232,5,0,0 ; vbroadcastss 0x5e8(%rip),%ymm1 # 5b54 <_sk_callback_hsw+0x5b1> + DB 196,226,125,24,13,246,5,0,0 ; vbroadcastss 0x5f6(%rip),%ymm1 # 5c08 <_sk_callback_hsw+0x5bf> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,212,5,0,0 ; vbroadcastss 0x5d4(%rip),%ymm10 # 5b58 <_sk_callback_hsw+0x5b5> - DB 196,98,125,24,29,207,5,0,0 ; vbroadcastss 0x5cf(%rip),%ymm11 # 5b5c <_sk_callback_hsw+0x5b9> + DB 196,98,125,24,21,226,5,0,0 ; vbroadcastss 0x5e2(%rip),%ymm10 # 5c0c <_sk_callback_hsw+0x5c3> + DB 196,98,125,24,29,221,5,0,0 ; vbroadcastss 0x5dd(%rip),%ymm11 # 5c10 <_sk_callback_hsw+0x5c7> DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11 DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -5290,25 +5332,25 @@ ALIGN 4 DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 577d <.literal4+0xb1> + DB 71,225,61 ; rex.RXB loope 5825 <.literal4+0xb1> DB 0,0 ; add %al,(%rax) DB 128,63,154 ; cmpb $0x9a,(%rdi) DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 578d <.literal4+0xc1> + DB 71,225,61 ; rex.RXB loope 5835 <.literal4+0xc1> DB 0,0 ; add %al,(%rax) DB 128,63,154 ; cmpb $0x9a,(%rdi) DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 579d <.literal4+0xd1> + DB 71,225,61 ; rex.RXB loope 5845 <.literal4+0xd1> DB 0,0 ; add %al,(%rax) DB 128,63,154 ; cmpb $0x9a,(%rdi) DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 57ad <.literal4+0xe1> + DB 71,225,61 ; rex.RXB loope 5855 <.literal4+0xe1> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax) @@ -5370,7 +5412,7 @@ ALIGN 4 DB 190,129,128,128,59 ; mov $0x3b808081,%esi DB 129,128,128,59,0,248,0,0,8,33 ; addl $0x21080000,-0x7ffc480(%rax) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 581d <.literal4+0x151> + DB 224,7 ; loopne 58c5 <.literal4+0x151> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -5386,10 +5428,10 @@ ALIGN 4 DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax) DB 0,52,255 ; add %dh,(%rdi,%rdi,8) DB 255 ; (bad) - DB 127,0 ; jg 5844 <.literal4+0x178> + DB 127,0 ; jg 58ec <.literal4+0x178> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 58bd <.literal4+0x1f1> + DB 119,115 ; ja 5965 <.literal4+0x1f1> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -5403,10 +5445,10 @@ ALIGN 4 DB 0,128,63,0,0,0 ; add %al,0x3f(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 5878 <.literal4+0x1ac> + DB 127,0 ; jg 5920 <.literal4+0x1ac> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 58f1 <.literal4+0x225> + DB 119,115 ; ja 5999 <.literal4+0x225> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -5420,10 +5462,10 @@ ALIGN 4 DB 0,128,63,0,0,0 ; add %al,0x3f(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 58ac <.literal4+0x1e0> + DB 127,0 ; jg 5954 <.literal4+0x1e0> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 5925 <.literal4+0x259> + DB 119,115 ; ja 59cd <.literal4+0x259> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -5437,10 +5479,10 @@ ALIGN 4 DB 0,128,63,0,0,0 ; add %al,0x3f(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 58e0 <.literal4+0x214> + DB 127,0 ; jg 5988 <.literal4+0x214> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 5959 <.literal4+0x28d> + DB 119,115 ; ja 5a01 <.literal4+0x28d> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -5453,7 +5495,7 @@ ALIGN 4 DB 0,75,0 ; add %cl,0x0(%rbx) DB 0,128,63,0,0,200 ; add %al,-0x37ffffc1(%rax) DB 66,0,0 ; rex.X add %al,(%rax) - DB 127,67 ; jg 5957 <.literal4+0x28b> + DB 127,67 ; jg 59ff <.literal4+0x28b> DB 0,0 ; add %al,(%rax) DB 0,195 ; add %al,%bl DB 0,0 ; add %al,(%rax) @@ -5465,7 +5507,7 @@ ALIGN 4 DB 190,80,128,3,62 ; mov $0x3e038050,%esi DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 5977 <.literal4+0x2ab> + DB 118,63 ; jbe 5a1f <.literal4+0x2ab> DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax) DB 128,59,0 ; cmpb $0x0,(%rbx) @@ -5480,7 +5522,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 5979 <.literal4+0x2ad> + DB 224,7 ; loopne 5a21 <.literal4+0x2ad> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -5492,7 +5534,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 5995 <.literal4+0x2c9> + DB 224,7 ; loopne 5a3d <.literal4+0x2c9> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -5504,7 +5546,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 59b1 <.literal4+0x2e5> + DB 224,7 ; loopne 5a59 <.literal4+0x2e5> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -5515,7 +5557,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 248 ; clc DB 65,0,0 ; add %al,(%r8) - DB 124,66 ; jl 5a06 <.literal4+0x33a> + DB 124,66 ; jl 5aae <.literal4+0x33a> DB 0,240 ; add %dh,%al DB 0,0 ; add %al,(%rax) DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax) @@ -5541,7 +5583,7 @@ ALIGN 4 DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax) DB 0,0 ; add %al,(%rax) DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax) - DB 112,65 ; jo 5a69 <.literal4+0x39d> + DB 112,65 ; jo 5b11 <.literal4+0x39d> DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax) DB 128,59,0 ; cmpb $0x0,(%rbx) DB 0,127,67 ; add %bh,0x43(%rdi) @@ -5555,7 +5597,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 255 ; (bad) - DB 127,71 ; jg 5a9f <.literal4+0x3d3> + DB 127,71 ; jg 5b47 <.literal4+0x3d3> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -5596,6 +5638,10 @@ ALIGN 4 DB 128,0,0 ; addb $0x0,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) + DB 0,192 ; add %al,%al + DB 0,0 ; add %al,(%rax) + DB 0,128,0,0,128,63 ; add %al,0x3f800000(%rax) + DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,191,0,0,128,63 ; add %bh,0x3f800000(%rdi) @@ -5673,16 +5719,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005b88 <_sk_callback_hsw+0xa0005e5> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005c48 <_sk_callback_hsw+0xa0005ff> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005b90 <_sk_callback_hsw+0x120005ed> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005c50 <_sk_callback_hsw+0x12000607> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005b98 <_sk_callback_hsw+0x1a0005f5> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005c58 <_sk_callback_hsw+0x1a00060f> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005ba0 <_sk_callback_hsw+0x30005fd> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005c60 <_sk_callback_hsw+0x3000617> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -5725,16 +5771,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005be8 <_sk_callback_hsw+0xa000645> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005ca8 <_sk_callback_hsw+0xa00065f> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005bf0 <_sk_callback_hsw+0x1200064d> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005cb0 <_sk_callback_hsw+0x12000667> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005bf8 <_sk_callback_hsw+0x1a000655> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005cb8 <_sk_callback_hsw+0x1a00066f> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005c00 <_sk_callback_hsw+0x300065d> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005cc0 <_sk_callback_hsw+0x3000677> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -5777,16 +5823,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005c48 <_sk_callback_hsw+0xa0006a5> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005d08 <_sk_callback_hsw+0xa0006bf> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005c50 <_sk_callback_hsw+0x120006ad> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005d10 <_sk_callback_hsw+0x120006c7> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005c58 <_sk_callback_hsw+0x1a0006b5> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005d18 <_sk_callback_hsw+0x1a0006cf> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005c60 <_sk_callback_hsw+0x30006bd> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005d20 <_sk_callback_hsw+0x30006d7> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -5829,16 +5875,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005ca8 <_sk_callback_hsw+0xa000705> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005d68 <_sk_callback_hsw+0xa00071f> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005cb0 <_sk_callback_hsw+0x1200070d> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005d70 <_sk_callback_hsw+0x12000727> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005cb8 <_sk_callback_hsw+0x1a000715> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005d78 <_sk_callback_hsw+0x1a00072f> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005cc0 <_sk_callback_hsw+0x300071d> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005d80 <_sk_callback_hsw+0x3000737> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -5881,16 +5927,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005d08 <_sk_callback_hsw+0xa000765> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005dc8 <_sk_callback_hsw+0xa00077f> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005d10 <_sk_callback_hsw+0x1200076d> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005dd0 <_sk_callback_hsw+0x12000787> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005d18 <_sk_callback_hsw+0x1a000775> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005dd8 <_sk_callback_hsw+0x1a00078f> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005d20 <_sk_callback_hsw+0x300077d> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005de0 <_sk_callback_hsw+0x3000797> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -5933,16 +5979,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005d68 <_sk_callback_hsw+0xa0007c5> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005e28 <_sk_callback_hsw+0xa0007df> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005d70 <_sk_callback_hsw+0x120007cd> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005e30 <_sk_callback_hsw+0x120007e7> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005d78 <_sk_callback_hsw+0x1a0007d5> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005e38 <_sk_callback_hsw+0x1a0007ef> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005d80 <_sk_callback_hsw+0x30007dd> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005e40 <_sk_callback_hsw+0x30007f7> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -5985,16 +6031,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005dc8 <_sk_callback_hsw+0xa000825> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005e88 <_sk_callback_hsw+0xa00083f> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005dd0 <_sk_callback_hsw+0x1200082d> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005e90 <_sk_callback_hsw+0x12000847> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005dd8 <_sk_callback_hsw+0x1a000835> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005e98 <_sk_callback_hsw+0x1a00084f> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005de0 <_sk_callback_hsw+0x300083d> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005ea0 <_sk_callback_hsw+0x3000857> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -6037,16 +6083,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005e28 <_sk_callback_hsw+0xa000885> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005ee8 <_sk_callback_hsw+0xa00089f> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005e30 <_sk_callback_hsw+0x1200088d> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005ef0 <_sk_callback_hsw+0x120008a7> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005e38 <_sk_callback_hsw+0x1a000895> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005ef8 <_sk_callback_hsw+0x1a0008af> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005e40 <_sk_callback_hsw+0x300089d> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005f00 <_sk_callback_hsw+0x30008b7> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -6089,16 +6135,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005e88 <_sk_callback_hsw+0xa0008e5> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005f48 <_sk_callback_hsw+0xa0008ff> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005e90 <_sk_callback_hsw+0x120008ed> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005f50 <_sk_callback_hsw+0x12000907> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005e98 <_sk_callback_hsw+0x1a0008f5> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005f58 <_sk_callback_hsw+0x1a00090f> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005ea0 <_sk_callback_hsw+0x30008fd> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005f60 <_sk_callback_hsw+0x3000917> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -6292,7 +6338,7 @@ _sk_seed_shader_avx LABEL PROC DB 197,249,112,192,0 ; vpshufd $0x0,%xmm0,%xmm0 DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,208,118,0,0 ; vbroadcastss 0x76d0(%rip),%ymm1 # 7808 <_sk_callback_avx+0x12c> + DB 196,226,125,24,13,152,119,0,0 ; vbroadcastss 0x7798(%rip),%ymm1 # 78d0 <_sk_callback_avx+0x129> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0 DB 197,249,110,209 ; vmovd %ecx,%xmm2 @@ -6301,7 +6347,7 @@ _sk_seed_shader_avx LABEL PROC DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,21,170,118,0,0 ; vbroadcastss 0x76aa(%rip),%ymm2 # 780c <_sk_callback_avx+0x130> + DB 196,226,125,24,21,114,119,0,0 ; vbroadcastss 0x7772(%rip),%ymm2 # 78d4 <_sk_callback_avx+0x12d> DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3 DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 @@ -6323,7 +6369,7 @@ _sk_dither_avx LABEL PROC DB 196,65,121,112,201,0 ; vpshufd $0x0,%xmm9,%xmm9 DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9 DB 196,65,52,87,208 ; vxorps %ymm8,%ymm9,%ymm10 - DB 196,98,125,24,29,83,118,0,0 ; vbroadcastss 0x7653(%rip),%ymm11 # 7810 <_sk_callback_avx+0x134> + DB 196,98,125,24,29,27,119,0,0 ; vbroadcastss 0x771b(%rip),%ymm11 # 78d8 <_sk_callback_avx+0x131> DB 196,65,44,84,203 ; vandps %ymm11,%ymm10,%ymm9 DB 196,193,25,114,241,5 ; vpslld $0x5,%xmm9,%xmm12 DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9 @@ -6334,8 +6380,8 @@ _sk_dither_avx LABEL PROC DB 196,67,125,25,219,1 ; vextractf128 $0x1,%ymm11,%xmm11 DB 196,193,33,114,243,4 ; vpslld $0x4,%xmm11,%xmm11 DB 196,67,29,24,219,1 ; vinsertf128 $0x1,%xmm11,%ymm12,%ymm11 - DB 196,98,125,24,37,20,118,0,0 ; vbroadcastss 0x7614(%rip),%ymm12 # 7814 <_sk_callback_avx+0x138> - DB 196,98,125,24,45,15,118,0,0 ; vbroadcastss 0x760f(%rip),%ymm13 # 7818 <_sk_callback_avx+0x13c> + DB 196,98,125,24,37,220,118,0,0 ; vbroadcastss 0x76dc(%rip),%ymm12 # 78dc <_sk_callback_avx+0x135> + DB 196,98,125,24,45,215,118,0,0 ; vbroadcastss 0x76d7(%rip),%ymm13 # 78e0 <_sk_callback_avx+0x139> DB 196,65,44,84,245 ; vandps %ymm13,%ymm10,%ymm14 DB 196,193,1,114,246,2 ; vpslld $0x2,%xmm14,%xmm15 DB 196,67,125,25,246,1 ; vextractf128 $0x1,%ymm14,%xmm14 @@ -6362,9 +6408,9 @@ _sk_dither_avx LABEL PROC DB 196,65,60,86,193 ; vorps %ymm9,%ymm8,%ymm8 DB 196,65,60,86,194 ; vorps %ymm10,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,122,117,0,0 ; vbroadcastss 0x757a(%rip),%ymm9 # 781c <_sk_callback_avx+0x140> + DB 196,98,125,24,13,66,118,0,0 ; vbroadcastss 0x7642(%rip),%ymm9 # 78e4 <_sk_callback_avx+0x13d> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 - DB 196,98,125,24,13,112,117,0,0 ; vbroadcastss 0x7570(%rip),%ymm9 # 7820 <_sk_callback_avx+0x144> + DB 196,98,125,24,13,56,118,0,0 ; vbroadcastss 0x7638(%rip),%ymm9 # 78e8 <_sk_callback_avx+0x141> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 196,98,125,24,8 ; vbroadcastss (%rax),%ymm9 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 @@ -6423,7 +6469,7 @@ _sk_clear_avx LABEL PROC PUBLIC _sk_srcatop_avx _sk_srcatop_avx LABEL PROC DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0 - DB 196,98,125,24,5,200,116,0,0 ; vbroadcastss 0x74c8(%rip),%ymm8 # 7824 <_sk_callback_avx+0x148> + DB 196,98,125,24,5,144,117,0,0 ; vbroadcastss 0x7590(%rip),%ymm8 # 78ec <_sk_callback_avx+0x145> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9 DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0 @@ -6442,7 +6488,7 @@ _sk_srcatop_avx LABEL PROC PUBLIC _sk_dstatop_avx _sk_dstatop_avx LABEL PROC DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8 - DB 196,98,125,24,13,138,116,0,0 ; vbroadcastss 0x748a(%rip),%ymm9 # 7828 <_sk_callback_avx+0x14c> + DB 196,98,125,24,13,82,117,0,0 ; vbroadcastss 0x7552(%rip),%ymm9 # 78f0 <_sk_callback_avx+0x149> DB 197,52,92,207 ; vsubps %ymm7,%ymm9,%ymm9 DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0 DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0 @@ -6478,7 +6524,7 @@ _sk_dstin_avx LABEL PROC PUBLIC _sk_srcout_avx _sk_srcout_avx LABEL PROC - DB 196,98,125,24,5,41,116,0,0 ; vbroadcastss 0x7429(%rip),%ymm8 # 782c <_sk_callback_avx+0x150> + DB 196,98,125,24,5,241,116,0,0 ; vbroadcastss 0x74f1(%rip),%ymm8 # 78f4 <_sk_callback_avx+0x14d> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 @@ -6489,7 +6535,7 @@ _sk_srcout_avx LABEL PROC PUBLIC _sk_dstout_avx _sk_dstout_avx LABEL PROC - DB 196,226,125,24,5,12,116,0,0 ; vbroadcastss 0x740c(%rip),%ymm0 # 7830 <_sk_callback_avx+0x154> + DB 196,226,125,24,5,212,116,0,0 ; vbroadcastss 0x74d4(%rip),%ymm0 # 78f8 <_sk_callback_avx+0x151> DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3 DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0 DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1 @@ -6500,7 +6546,7 @@ _sk_dstout_avx LABEL PROC PUBLIC _sk_srcover_avx _sk_srcover_avx LABEL PROC - DB 196,98,125,24,5,239,115,0,0 ; vbroadcastss 0x73ef(%rip),%ymm8 # 7834 <_sk_callback_avx+0x158> + DB 196,98,125,24,5,183,116,0,0 ; vbroadcastss 0x74b7(%rip),%ymm8 # 78fc <_sk_callback_avx+0x155> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9 DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0 @@ -6515,7 +6561,7 @@ _sk_srcover_avx LABEL PROC PUBLIC _sk_dstover_avx _sk_dstover_avx LABEL PROC - DB 196,98,125,24,5,194,115,0,0 ; vbroadcastss 0x73c2(%rip),%ymm8 # 7838 <_sk_callback_avx+0x15c> + DB 196,98,125,24,5,138,116,0,0 ; vbroadcastss 0x748a(%rip),%ymm8 # 7900 <_sk_callback_avx+0x159> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0 @@ -6539,7 +6585,7 @@ _sk_modulate_avx LABEL PROC PUBLIC _sk_multiply_avx _sk_multiply_avx LABEL PROC - DB 196,98,125,24,5,129,115,0,0 ; vbroadcastss 0x7381(%rip),%ymm8 # 783c <_sk_callback_avx+0x160> + DB 196,98,125,24,5,73,116,0,0 ; vbroadcastss 0x7449(%rip),%ymm8 # 7904 <_sk_callback_avx+0x15d> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -6593,7 +6639,7 @@ _sk_screen_avx LABEL PROC PUBLIC _sk_xor__avx _sk_xor__avx LABEL PROC - DB 196,98,125,24,5,208,114,0,0 ; vbroadcastss 0x72d0(%rip),%ymm8 # 7840 <_sk_callback_avx+0x164> + DB 196,98,125,24,5,152,115,0,0 ; vbroadcastss 0x7398(%rip),%ymm8 # 7908 <_sk_callback_avx+0x161> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -6628,7 +6674,7 @@ _sk_darken_avx LABEL PROC DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9 DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,80,114,0,0 ; vbroadcastss 0x7250(%rip),%ymm8 # 7844 <_sk_callback_avx+0x168> + DB 196,98,125,24,5,24,115,0,0 ; vbroadcastss 0x7318(%rip),%ymm8 # 790c <_sk_callback_avx+0x165> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8 DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3 @@ -6652,7 +6698,7 @@ _sk_lighten_avx LABEL PROC DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9 DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,252,113,0,0 ; vbroadcastss 0x71fc(%rip),%ymm8 # 7848 <_sk_callback_avx+0x16c> + DB 196,98,125,24,5,196,114,0,0 ; vbroadcastss 0x72c4(%rip),%ymm8 # 7910 <_sk_callback_avx+0x169> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8 DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3 @@ -6679,7 +6725,7 @@ _sk_difference_avx LABEL PROC DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2 DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,156,113,0,0 ; vbroadcastss 0x719c(%rip),%ymm8 # 784c <_sk_callback_avx+0x170> + DB 196,98,125,24,5,100,114,0,0 ; vbroadcastss 0x7264(%rip),%ymm8 # 7914 <_sk_callback_avx+0x16d> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8 DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3 @@ -6700,7 +6746,7 @@ _sk_exclusion_avx LABEL PROC DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2 DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,87,113,0,0 ; vbroadcastss 0x7157(%rip),%ymm8 # 7850 <_sk_callback_avx+0x174> + DB 196,98,125,24,5,31,114,0,0 ; vbroadcastss 0x721f(%rip),%ymm8 # 7918 <_sk_callback_avx+0x171> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8 DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3 @@ -6709,7 +6755,7 @@ _sk_exclusion_avx LABEL PROC PUBLIC _sk_colorburn_avx _sk_colorburn_avx LABEL PROC - DB 196,98,125,24,5,66,113,0,0 ; vbroadcastss 0x7142(%rip),%ymm8 # 7854 <_sk_callback_avx+0x178> + DB 196,98,125,24,5,10,114,0,0 ; vbroadcastss 0x720a(%rip),%ymm8 # 791c <_sk_callback_avx+0x175> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11 DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10 @@ -6769,7 +6815,7 @@ _sk_colorburn_avx LABEL PROC PUBLIC _sk_colordodge_avx _sk_colordodge_avx LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 - DB 196,98,125,24,13,62,112,0,0 ; vbroadcastss 0x703e(%rip),%ymm9 # 7858 <_sk_callback_avx+0x17c> + DB 196,98,125,24,13,6,113,0,0 ; vbroadcastss 0x7106(%rip),%ymm9 # 7920 <_sk_callback_avx+0x179> DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10 DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11 DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9 @@ -6824,7 +6870,7 @@ _sk_colordodge_avx LABEL PROC PUBLIC _sk_hardlight_avx _sk_hardlight_avx LABEL PROC - DB 196,98,125,24,5,80,111,0,0 ; vbroadcastss 0x6f50(%rip),%ymm8 # 785c <_sk_callback_avx+0x180> + DB 196,98,125,24,5,24,112,0,0 ; vbroadcastss 0x7018(%rip),%ymm8 # 7924 <_sk_callback_avx+0x17d> DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10 DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -6877,7 +6923,7 @@ _sk_hardlight_avx LABEL PROC PUBLIC _sk_overlay_avx _sk_overlay_avx LABEL PROC - DB 196,98,125,24,5,121,110,0,0 ; vbroadcastss 0x6e79(%rip),%ymm8 # 7860 <_sk_callback_avx+0x184> + DB 196,98,125,24,5,65,111,0,0 ; vbroadcastss 0x6f41(%rip),%ymm8 # 7928 <_sk_callback_avx+0x181> DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10 DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -6942,10 +6988,10 @@ _sk_softlight_avx LABEL PROC DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8 DB 196,65,60,89,216 ; vmulps %ymm8,%ymm8,%ymm11 DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8 - DB 196,98,125,24,29,108,109,0,0 ; vbroadcastss 0x6d6c(%rip),%ymm11 # 7868 <_sk_callback_avx+0x18c> + DB 196,98,125,24,29,52,110,0,0 ; vbroadcastss 0x6e34(%rip),%ymm11 # 7930 <_sk_callback_avx+0x189> DB 196,65,28,88,235 ; vaddps %ymm11,%ymm12,%ymm13 DB 196,65,20,89,192 ; vmulps %ymm8,%ymm13,%ymm8 - DB 196,98,125,24,45,93,109,0,0 ; vbroadcastss 0x6d5d(%rip),%ymm13 # 786c <_sk_callback_avx+0x190> + DB 196,98,125,24,45,37,110,0,0 ; vbroadcastss 0x6e25(%rip),%ymm13 # 7934 <_sk_callback_avx+0x18d> DB 196,65,28,89,245 ; vmulps %ymm13,%ymm12,%ymm14 DB 196,65,12,88,192 ; vaddps %ymm8,%ymm14,%ymm8 DB 196,65,124,82,244 ; vrsqrtps %ymm12,%ymm14 @@ -6956,7 +7002,7 @@ _sk_softlight_avx LABEL PROC DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15 DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14 DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15 - DB 196,98,125,24,5,27,109,0,0 ; vbroadcastss 0x6d1b(%rip),%ymm8 # 7864 <_sk_callback_avx+0x188> + DB 196,98,125,24,5,227,109,0,0 ; vbroadcastss 0x6de3(%rip),%ymm8 # 792c <_sk_callback_avx+0x185> DB 196,65,60,92,228 ; vsubps %ymm12,%ymm8,%ymm12 DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0 DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12 @@ -7083,12 +7129,12 @@ _sk_hue_avx LABEL PROC DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11 DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11 DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - DB 196,98,125,24,53,229,106,0,0 ; vbroadcastss 0x6ae5(%rip),%ymm14 # 7870 <_sk_callback_avx+0x194> + DB 196,98,125,24,53,173,107,0,0 ; vbroadcastss 0x6bad(%rip),%ymm14 # 7938 <_sk_callback_avx+0x191> DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11 - DB 196,98,125,24,61,219,106,0,0 ; vbroadcastss 0x6adb(%rip),%ymm15 # 7874 <_sk_callback_avx+0x198> + DB 196,98,125,24,61,163,107,0,0 ; vbroadcastss 0x6ba3(%rip),%ymm15 # 793c <_sk_callback_avx+0x195> DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13 DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11 - DB 196,226,125,24,5,204,106,0,0 ; vbroadcastss 0x6acc(%rip),%ymm0 # 7878 <_sk_callback_avx+0x19c> + DB 196,226,125,24,5,148,107,0,0 ; vbroadcastss 0x6b94(%rip),%ymm0 # 7940 <_sk_callback_avx+0x199> DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13 DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11 DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13 @@ -7149,7 +7195,7 @@ _sk_hue_avx LABEL PROC DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10 DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2 DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,165,105,0,0 ; vbroadcastss 0x69a5(%rip),%ymm8 # 787c <_sk_callback_avx+0x1a0> + DB 196,98,125,24,5,109,106,0,0 ; vbroadcastss 0x6a6d(%rip),%ymm8 # 7944 <_sk_callback_avx+0x19d> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -7206,12 +7252,12 @@ _sk_saturation_avx LABEL PROC DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11 DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11 DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - DB 196,98,125,24,53,173,104,0,0 ; vbroadcastss 0x68ad(%rip),%ymm14 # 7880 <_sk_callback_avx+0x1a4> + DB 196,98,125,24,53,117,105,0,0 ; vbroadcastss 0x6975(%rip),%ymm14 # 7948 <_sk_callback_avx+0x1a1> DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11 - DB 196,98,125,24,61,163,104,0,0 ; vbroadcastss 0x68a3(%rip),%ymm15 # 7884 <_sk_callback_avx+0x1a8> + DB 196,98,125,24,61,107,105,0,0 ; vbroadcastss 0x696b(%rip),%ymm15 # 794c <_sk_callback_avx+0x1a5> DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13 DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11 - DB 196,226,125,24,5,148,104,0,0 ; vbroadcastss 0x6894(%rip),%ymm0 # 7888 <_sk_callback_avx+0x1ac> + DB 196,226,125,24,5,92,105,0,0 ; vbroadcastss 0x695c(%rip),%ymm0 # 7950 <_sk_callback_avx+0x1a9> DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13 DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11 DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13 @@ -7272,7 +7318,7 @@ _sk_saturation_avx LABEL PROC DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10 DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2 DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,109,103,0,0 ; vbroadcastss 0x676d(%rip),%ymm8 # 788c <_sk_callback_avx+0x1b0> + DB 196,98,125,24,5,53,104,0,0 ; vbroadcastss 0x6835(%rip),%ymm8 # 7954 <_sk_callback_avx+0x1ad> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -7301,12 +7347,12 @@ _sk_color_avx LABEL PROC DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp) DB 197,124,89,199 ; vmulps %ymm7,%ymm0,%ymm8 DB 197,116,89,207 ; vmulps %ymm7,%ymm1,%ymm9 - DB 196,98,125,24,45,253,102,0,0 ; vbroadcastss 0x66fd(%rip),%ymm13 # 7890 <_sk_callback_avx+0x1b4> + DB 196,98,125,24,45,197,103,0,0 ; vbroadcastss 0x67c5(%rip),%ymm13 # 7958 <_sk_callback_avx+0x1b1> DB 196,65,92,89,213 ; vmulps %ymm13,%ymm4,%ymm10 - DB 196,98,125,24,53,243,102,0,0 ; vbroadcastss 0x66f3(%rip),%ymm14 # 7894 <_sk_callback_avx+0x1b8> + DB 196,98,125,24,53,187,103,0,0 ; vbroadcastss 0x67bb(%rip),%ymm14 # 795c <_sk_callback_avx+0x1b5> DB 196,65,84,89,222 ; vmulps %ymm14,%ymm5,%ymm11 DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10 - DB 196,98,125,24,61,228,102,0,0 ; vbroadcastss 0x66e4(%rip),%ymm15 # 7898 <_sk_callback_avx+0x1bc> + DB 196,98,125,24,61,172,103,0,0 ; vbroadcastss 0x67ac(%rip),%ymm15 # 7960 <_sk_callback_avx+0x1b9> DB 196,65,76,89,223 ; vmulps %ymm15,%ymm6,%ymm11 DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0 DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11 @@ -7369,7 +7415,7 @@ _sk_color_avx LABEL PROC DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9 DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0 DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8 - DB 196,226,125,24,5,171,101,0,0 ; vbroadcastss 0x65ab(%rip),%ymm0 # 789c <_sk_callback_avx+0x1c0> + DB 196,226,125,24,5,115,102,0,0 ; vbroadcastss 0x6673(%rip),%ymm0 # 7964 <_sk_callback_avx+0x1bd> DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10 DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2 DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11 @@ -7399,12 +7445,12 @@ _sk_luminosity_avx LABEL PROC DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8 DB 197,100,89,205 ; vmulps %ymm5,%ymm3,%ymm9 - DB 196,98,125,24,45,55,101,0,0 ; vbroadcastss 0x6537(%rip),%ymm13 # 78a0 <_sk_callback_avx+0x1c4> + DB 196,98,125,24,45,255,101,0,0 ; vbroadcastss 0x65ff(%rip),%ymm13 # 7968 <_sk_callback_avx+0x1c1> DB 196,65,108,89,213 ; vmulps %ymm13,%ymm2,%ymm10 - DB 196,98,125,24,53,45,101,0,0 ; vbroadcastss 0x652d(%rip),%ymm14 # 78a4 <_sk_callback_avx+0x1c8> + DB 196,98,125,24,53,245,101,0,0 ; vbroadcastss 0x65f5(%rip),%ymm14 # 796c <_sk_callback_avx+0x1c5> DB 196,65,116,89,222 ; vmulps %ymm14,%ymm1,%ymm11 DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10 - DB 196,98,125,24,61,30,101,0,0 ; vbroadcastss 0x651e(%rip),%ymm15 # 78a8 <_sk_callback_avx+0x1cc> + DB 196,98,125,24,61,230,101,0,0 ; vbroadcastss 0x65e6(%rip),%ymm15 # 7970 <_sk_callback_avx+0x1c9> DB 196,65,28,89,223 ; vmulps %ymm15,%ymm12,%ymm11 DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0 DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11 @@ -7467,7 +7513,7 @@ _sk_luminosity_avx LABEL PROC DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9 DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0 DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8 - DB 196,226,125,24,5,229,99,0,0 ; vbroadcastss 0x63e5(%rip),%ymm0 # 78ac <_sk_callback_avx+0x1d0> + DB 196,226,125,24,5,173,100,0,0 ; vbroadcastss 0x64ad(%rip),%ymm0 # 7974 <_sk_callback_avx+0x1cd> DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11 @@ -7498,7 +7544,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 15,133,47,1,0,0 ; jne 1661 <_sk_srcover_rgba_8888_avx+0x14c> DB 196,193,124,16,58 ; vmovups (%r10),%ymm7 - DB 197,124,40,13,65,105,0,0 ; vmovaps 0x6941(%rip),%ymm9 # 7e80 <_sk_callback_avx+0x7a4> + DB 197,124,40,13,33,106,0,0 ; vmovaps 0x6a21(%rip),%ymm9 # 7f60 <_sk_callback_avx+0x7b9> DB 196,193,68,84,225 ; vandps %ymm9,%ymm7,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 DB 197,209,114,215,8 ; vpsrld $0x8,%xmm7,%xmm5 @@ -7516,9 +7562,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 196,193,65,114,208,24 ; vpsrld $0x18,%xmm8,%xmm7 DB 196,227,53,24,255,1 ; vinsertf128 $0x1,%xmm7,%ymm9,%ymm7 DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7 - DB 196,98,125,24,5,16,99,0,0 ; vbroadcastss 0x6310(%rip),%ymm8 # 78b0 <_sk_callback_avx+0x1d4> + DB 196,98,125,24,5,216,99,0,0 ; vbroadcastss 0x63d8(%rip),%ymm8 # 7978 <_sk_callback_avx+0x1d1> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 - DB 196,98,125,24,13,7,99,0,0 ; vbroadcastss 0x6307(%rip),%ymm9 # 78b4 <_sk_callback_avx+0x1d8> + DB 196,98,125,24,13,207,99,0,0 ; vbroadcastss 0x63cf(%rip),%ymm9 # 797c <_sk_callback_avx+0x1d5> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 197,60,89,212 ; vmulps %ymm4,%ymm8,%ymm10 DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0 @@ -7564,9 +7610,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 72,211,232 ; shr %cl,%rax DB 196,225,249,110,224 ; vmovq %rax,%xmm4 DB 196,226,121,48,228 ; vpmovzxbw %xmm4,%xmm4 - DB 196,226,89,0,45,87,102,0,0 ; vpshufb 0x6657(%rip),%xmm4,%xmm5 # 7ce0 <_sk_callback_avx+0x604> + DB 196,226,89,0,45,39,103,0,0 ; vpshufb 0x6727(%rip),%xmm4,%xmm5 # 7db0 <_sk_callback_avx+0x609> DB 196,226,121,33,237 ; vpmovsxbd %xmm5,%xmm5 - DB 196,226,89,0,37,89,102,0,0 ; vpshufb 0x6659(%rip),%xmm4,%xmm4 # 7cf0 <_sk_callback_avx+0x614> + DB 196,226,89,0,37,41,103,0,0 ; vpshufb 0x6729(%rip),%xmm4,%xmm4 # 7dc0 <_sk_callback_avx+0x619> DB 196,226,121,33,228 ; vpmovsxbd %xmm4,%xmm4 DB 196,227,85,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm4 DB 196,194,93,44,58 ; vmaskmovps (%r10),%ymm4,%ymm7 @@ -7578,9 +7624,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 72,211,232 ; shr %cl,%rax DB 196,97,249,110,200 ; vmovq %rax,%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 - DB 196,98,49,0,21,12,102,0,0 ; vpshufb 0x660c(%rip),%xmm9,%xmm10 # 7ce0 <_sk_callback_avx+0x604> + DB 196,98,49,0,21,220,102,0,0 ; vpshufb 0x66dc(%rip),%xmm9,%xmm10 # 7db0 <_sk_callback_avx+0x609> DB 196,66,121,33,210 ; vpmovsxbd %xmm10,%xmm10 - DB 196,98,49,0,13,14,102,0,0 ; vpshufb 0x660e(%rip),%xmm9,%xmm9 # 7cf0 <_sk_callback_avx+0x614> + DB 196,98,49,0,13,222,102,0,0 ; vpshufb 0x66de(%rip),%xmm9,%xmm9 # 7dc0 <_sk_callback_avx+0x619> DB 196,66,121,33,201 ; vpmovsxbd %xmm9,%xmm9 DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 DB 196,66,53,46,2 ; vmaskmovps %ymm8,%ymm9,(%r10) @@ -7598,7 +7644,7 @@ _sk_clamp_0_avx LABEL PROC PUBLIC _sk_clamp_1_avx _sk_clamp_1_avx LABEL PROC - DB 196,98,125,24,5,155,97,0,0 ; vbroadcastss 0x619b(%rip),%ymm8 # 78b8 <_sk_callback_avx+0x1dc> + DB 196,98,125,24,5,99,98,0,0 ; vbroadcastss 0x6263(%rip),%ymm8 # 7980 <_sk_callback_avx+0x1d9> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1 DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2 @@ -7608,7 +7654,7 @@ _sk_clamp_1_avx LABEL PROC PUBLIC _sk_clamp_a_avx _sk_clamp_a_avx LABEL PROC - DB 196,98,125,24,5,126,97,0,0 ; vbroadcastss 0x617e(%rip),%ymm8 # 78bc <_sk_callback_avx+0x1e0> + DB 196,98,125,24,5,70,98,0,0 ; vbroadcastss 0x6246(%rip),%ymm8 # 7984 <_sk_callback_avx+0x1dd> DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3 DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0 DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1 @@ -7618,7 +7664,7 @@ _sk_clamp_a_avx LABEL PROC PUBLIC _sk_clamp_a_dst_avx _sk_clamp_a_dst_avx LABEL PROC - DB 196,98,125,24,5,100,97,0,0 ; vbroadcastss 0x6164(%rip),%ymm8 # 78c0 <_sk_callback_avx+0x1e4> + DB 196,98,125,24,5,44,98,0,0 ; vbroadcastss 0x622c(%rip),%ymm8 # 7988 <_sk_callback_avx+0x1e1> DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7 DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4 DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5 @@ -7673,7 +7719,7 @@ PUBLIC _sk_unpremul_avx _sk_unpremul_avx LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9 - DB 196,98,125,24,21,224,96,0,0 ; vbroadcastss 0x60e0(%rip),%ymm10 # 78c4 <_sk_callback_avx+0x1e8> + DB 196,98,125,24,21,168,97,0,0 ; vbroadcastss 0x61a8(%rip),%ymm10 # 798c <_sk_callback_avx+0x1e5> DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10 DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 @@ -7684,17 +7730,17 @@ _sk_unpremul_avx LABEL PROC PUBLIC _sk_from_srgb_avx _sk_from_srgb_avx LABEL PROC - DB 196,98,125,24,5,193,96,0,0 ; vbroadcastss 0x60c1(%rip),%ymm8 # 78c8 <_sk_callback_avx+0x1ec> + DB 196,98,125,24,5,137,97,0,0 ; vbroadcastss 0x6189(%rip),%ymm8 # 7990 <_sk_callback_avx+0x1e9> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10 - DB 196,98,125,24,29,179,96,0,0 ; vbroadcastss 0x60b3(%rip),%ymm11 # 78cc <_sk_callback_avx+0x1f0> + DB 196,98,125,24,29,123,97,0,0 ; vbroadcastss 0x617b(%rip),%ymm11 # 7994 <_sk_callback_avx+0x1ed> DB 196,65,124,89,227 ; vmulps %ymm11,%ymm0,%ymm12 - DB 196,98,125,24,45,169,96,0,0 ; vbroadcastss 0x60a9(%rip),%ymm13 # 78d0 <_sk_callback_avx+0x1f4> + DB 196,98,125,24,45,113,97,0,0 ; vbroadcastss 0x6171(%rip),%ymm13 # 7998 <_sk_callback_avx+0x1f1> DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12 DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,154,96,0,0 ; vbroadcastss 0x609a(%rip),%ymm12 # 78d4 <_sk_callback_avx+0x1f8> + DB 196,98,125,24,37,98,97,0,0 ; vbroadcastss 0x6162(%rip),%ymm12 # 799c <_sk_callback_avx+0x1f5> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,53,144,96,0,0 ; vbroadcastss 0x6090(%rip),%ymm14 # 78d8 <_sk_callback_avx+0x1fc> + DB 196,98,125,24,53,88,97,0,0 ; vbroadcastss 0x6158(%rip),%ymm14 # 79a0 <_sk_callback_avx+0x1f9> DB 196,193,124,194,198,1 ; vcmpltps %ymm14,%ymm0,%ymm0 DB 196,195,45,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm10,%ymm0 DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9 @@ -7718,17 +7764,17 @@ _sk_from_srgb_avx LABEL PROC PUBLIC _sk_from_srgb_dst_avx _sk_from_srgb_dst_avx LABEL PROC - DB 196,98,125,24,5,41,96,0,0 ; vbroadcastss 0x6029(%rip),%ymm8 # 78dc <_sk_callback_avx+0x200> + DB 196,98,125,24,5,241,96,0,0 ; vbroadcastss 0x60f1(%rip),%ymm8 # 79a4 <_sk_callback_avx+0x1fd> DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9 DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10 - DB 196,98,125,24,29,27,96,0,0 ; vbroadcastss 0x601b(%rip),%ymm11 # 78e0 <_sk_callback_avx+0x204> + DB 196,98,125,24,29,227,96,0,0 ; vbroadcastss 0x60e3(%rip),%ymm11 # 79a8 <_sk_callback_avx+0x201> DB 196,65,92,89,227 ; vmulps %ymm11,%ymm4,%ymm12 - DB 196,98,125,24,45,17,96,0,0 ; vbroadcastss 0x6011(%rip),%ymm13 # 78e4 <_sk_callback_avx+0x208> + DB 196,98,125,24,45,217,96,0,0 ; vbroadcastss 0x60d9(%rip),%ymm13 # 79ac <_sk_callback_avx+0x205> DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12 DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,2,96,0,0 ; vbroadcastss 0x6002(%rip),%ymm12 # 78e8 <_sk_callback_avx+0x20c> + DB 196,98,125,24,37,202,96,0,0 ; vbroadcastss 0x60ca(%rip),%ymm12 # 79b0 <_sk_callback_avx+0x209> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,53,248,95,0,0 ; vbroadcastss 0x5ff8(%rip),%ymm14 # 78ec <_sk_callback_avx+0x210> + DB 196,98,125,24,53,192,96,0,0 ; vbroadcastss 0x60c0(%rip),%ymm14 # 79b4 <_sk_callback_avx+0x20d> DB 196,193,92,194,230,1 ; vcmpltps %ymm14,%ymm4,%ymm4 DB 196,195,45,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm10,%ymm4 DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9 @@ -7753,20 +7799,20 @@ _sk_from_srgb_dst_avx LABEL PROC PUBLIC _sk_to_srgb_avx _sk_to_srgb_avx LABEL PROC DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9 - DB 196,98,125,24,5,141,95,0,0 ; vbroadcastss 0x5f8d(%rip),%ymm8 # 78f0 <_sk_callback_avx+0x214> + DB 196,98,125,24,5,85,96,0,0 ; vbroadcastss 0x6055(%rip),%ymm8 # 79b8 <_sk_callback_avx+0x211> DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10 - DB 196,98,125,24,29,131,95,0,0 ; vbroadcastss 0x5f83(%rip),%ymm11 # 78f4 <_sk_callback_avx+0x218> + DB 196,98,125,24,29,75,96,0,0 ; vbroadcastss 0x604b(%rip),%ymm11 # 79bc <_sk_callback_avx+0x215> DB 196,65,52,89,227 ; vmulps %ymm11,%ymm9,%ymm12 - DB 196,98,125,24,45,121,95,0,0 ; vbroadcastss 0x5f79(%rip),%ymm13 # 78f8 <_sk_callback_avx+0x21c> + DB 196,98,125,24,45,65,96,0,0 ; vbroadcastss 0x6041(%rip),%ymm13 # 79c0 <_sk_callback_avx+0x219> DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12 DB 196,65,52,89,228 ; vmulps %ymm12,%ymm9,%ymm12 - DB 196,98,125,24,53,106,95,0,0 ; vbroadcastss 0x5f6a(%rip),%ymm14 # 78fc <_sk_callback_avx+0x220> + DB 196,98,125,24,53,50,96,0,0 ; vbroadcastss 0x6032(%rip),%ymm14 # 79c4 <_sk_callback_avx+0x21d> DB 196,65,28,88,230 ; vaddps %ymm14,%ymm12,%ymm12 - DB 196,98,125,24,61,96,95,0,0 ; vbroadcastss 0x5f60(%rip),%ymm15 # 7900 <_sk_callback_avx+0x224> + DB 196,98,125,24,61,40,96,0,0 ; vbroadcastss 0x6028(%rip),%ymm15 # 79c8 <_sk_callback_avx+0x221> DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9 DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9 DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9 - DB 196,98,125,24,37,76,95,0,0 ; vbroadcastss 0x5f4c(%rip),%ymm12 # 7904 <_sk_callback_avx+0x228> + DB 196,98,125,24,37,20,96,0,0 ; vbroadcastss 0x6014(%rip),%ymm12 # 79cc <_sk_callback_avx+0x225> DB 196,193,124,194,196,1 ; vcmpltps %ymm12,%ymm0,%ymm0 DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0 DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9 @@ -7801,7 +7847,7 @@ _sk_rgb_to_hsl_avx LABEL PROC DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9 DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9 DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10 - DB 196,98,125,24,29,178,94,0,0 ; vbroadcastss 0x5eb2(%rip),%ymm11 # 7908 <_sk_callback_avx+0x22c> + DB 196,98,125,24,29,122,95,0,0 ; vbroadcastss 0x5f7a(%rip),%ymm11 # 79d0 <_sk_callback_avx+0x229> DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11 DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12 DB 196,65,28,89,227 ; vmulps %ymm11,%ymm12,%ymm12 @@ -7811,19 +7857,19 @@ _sk_rgb_to_hsl_avx LABEL PROC DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2 DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1 DB 196,193,116,89,203 ; vmulps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,139,94,0,0 ; vbroadcastss 0x5e8b(%rip),%ymm11 # 7914 <_sk_callback_avx+0x238> + DB 196,98,125,24,29,83,95,0,0 ; vbroadcastss 0x5f53(%rip),%ymm11 # 79dc <_sk_callback_avx+0x235> DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,121,94,0,0 ; vbroadcastss 0x5e79(%rip),%ymm11 # 7910 <_sk_callback_avx+0x234> + DB 196,98,125,24,29,65,95,0,0 ; vbroadcastss 0x5f41(%rip),%ymm11 # 79d8 <_sk_callback_avx+0x231> DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 DB 196,227,117,74,202,224 ; vblendvps %ymm14,%ymm2,%ymm1,%ymm1 - DB 196,226,125,24,21,97,94,0,0 ; vbroadcastss 0x5e61(%rip),%ymm2 # 790c <_sk_callback_avx+0x230> + DB 196,226,125,24,21,41,95,0,0 ; vbroadcastss 0x5f29(%rip),%ymm2 # 79d4 <_sk_callback_avx+0x22d> DB 196,65,12,87,246 ; vxorps %ymm14,%ymm14,%ymm14 DB 196,227,13,74,210,208 ; vblendvps %ymm13,%ymm2,%ymm14,%ymm2 DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0 DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2 DB 196,227,117,74,194,0 ; vblendvps %ymm0,%ymm2,%ymm1,%ymm0 DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1 - DB 196,98,125,24,37,72,94,0,0 ; vbroadcastss 0x5e48(%rip),%ymm12 # 791c <_sk_callback_avx+0x240> + DB 196,98,125,24,37,16,95,0,0 ; vbroadcastss 0x5f10(%rip),%ymm12 # 79e4 <_sk_callback_avx+0x23d> DB 196,193,116,89,212 ; vmulps %ymm12,%ymm1,%ymm2 DB 197,28,194,226,1 ; vcmpltps %ymm2,%ymm12,%ymm12 DB 196,65,36,92,216 ; vsubps %ymm8,%ymm11,%ymm11 @@ -7833,7 +7879,7 @@ _sk_rgb_to_hsl_avx LABEL PROC DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1 DB 196,195,125,74,198,128 ; vblendvps %ymm8,%ymm14,%ymm0,%ymm0 DB 196,195,117,74,206,128 ; vblendvps %ymm8,%ymm14,%ymm1,%ymm1 - DB 196,98,125,24,5,11,94,0,0 ; vbroadcastss 0x5e0b(%rip),%ymm8 # 7918 <_sk_callback_avx+0x23c> + DB 196,98,125,24,5,211,94,0,0 ; vbroadcastss 0x5ed3(%rip),%ymm8 # 79e0 <_sk_callback_avx+0x239> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -7848,7 +7894,7 @@ _sk_hsl_to_rgb_avx LABEL PROC DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp) DB 197,252,40,225 ; vmovaps %ymm1,%ymm4 DB 197,252,40,216 ; vmovaps %ymm0,%ymm3 - DB 196,98,125,24,5,210,93,0,0 ; vbroadcastss 0x5dd2(%rip),%ymm8 # 7920 <_sk_callback_avx+0x244> + DB 196,98,125,24,5,154,94,0,0 ; vbroadcastss 0x5e9a(%rip),%ymm8 # 79e8 <_sk_callback_avx+0x241> DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9 DB 197,92,89,210 ; vmulps %ymm2,%ymm4,%ymm10 DB 196,65,92,92,218 ; vsubps %ymm10,%ymm4,%ymm11 @@ -7856,23 +7902,23 @@ _sk_hsl_to_rgb_avx LABEL PROC DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10 DB 197,108,88,202 ; vaddps %ymm2,%ymm2,%ymm9 DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9 - DB 196,98,125,24,29,172,93,0,0 ; vbroadcastss 0x5dac(%rip),%ymm11 # 7924 <_sk_callback_avx+0x248> + DB 196,98,125,24,29,116,94,0,0 ; vbroadcastss 0x5e74(%rip),%ymm11 # 79ec <_sk_callback_avx+0x245> DB 196,65,100,88,219 ; vaddps %ymm11,%ymm3,%ymm11 DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12 DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15 DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11 - DB 196,98,125,24,37,150,93,0,0 ; vbroadcastss 0x5d96(%rip),%ymm12 # 792c <_sk_callback_avx+0x250> + DB 196,98,125,24,37,94,94,0,0 ; vbroadcastss 0x5e5e(%rip),%ymm12 # 79f4 <_sk_callback_avx+0x24d> DB 196,193,4,89,196 ; vmulps %ymm12,%ymm15,%ymm0 - DB 196,98,125,24,45,140,93,0,0 ; vbroadcastss 0x5d8c(%rip),%ymm13 # 7930 <_sk_callback_avx+0x254> + DB 196,98,125,24,45,84,94,0,0 ; vbroadcastss 0x5e54(%rip),%ymm13 # 79f8 <_sk_callback_avx+0x251> DB 197,20,92,240 ; vsubps %ymm0,%ymm13,%ymm14 DB 196,65,36,89,246 ; vmulps %ymm14,%ymm11,%ymm14 DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14 - DB 196,226,125,24,13,109,93,0,0 ; vbroadcastss 0x5d6d(%rip),%ymm1 # 7928 <_sk_callback_avx+0x24c> + DB 196,226,125,24,13,53,94,0,0 ; vbroadcastss 0x5e35(%rip),%ymm1 # 79f0 <_sk_callback_avx+0x249> DB 196,193,116,194,255,2 ; vcmpleps %ymm15,%ymm1,%ymm7 DB 196,195,13,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm14,%ymm7 DB 196,65,60,194,247,2 ; vcmpleps %ymm15,%ymm8,%ymm14 DB 196,227,45,74,255,224 ; vblendvps %ymm14,%ymm7,%ymm10,%ymm7 - DB 196,98,125,24,53,88,93,0,0 ; vbroadcastss 0x5d58(%rip),%ymm14 # 7934 <_sk_callback_avx+0x258> + DB 196,98,125,24,53,32,94,0,0 ; vbroadcastss 0x5e20(%rip),%ymm14 # 79fc <_sk_callback_avx+0x255> DB 196,65,12,194,255,2 ; vcmpleps %ymm15,%ymm14,%ymm15 DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0 DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0 @@ -7891,7 +7937,7 @@ _sk_hsl_to_rgb_avx LABEL PROC DB 197,164,89,247 ; vmulps %ymm7,%ymm11,%ymm6 DB 197,180,88,246 ; vaddps %ymm6,%ymm9,%ymm6 DB 196,227,77,74,237,0 ; vblendvps %ymm0,%ymm5,%ymm6,%ymm5 - DB 196,226,125,24,5,250,92,0,0 ; vbroadcastss 0x5cfa(%rip),%ymm0 # 7938 <_sk_callback_avx+0x25c> + DB 196,226,125,24,5,194,93,0,0 ; vbroadcastss 0x5dc2(%rip),%ymm0 # 7a00 <_sk_callback_avx+0x259> DB 197,228,88,192 ; vaddps %ymm0,%ymm3,%ymm0 DB 196,227,125,8,216,1 ; vroundps $0x1,%ymm0,%ymm3 DB 197,252,92,195 ; vsubps %ymm3,%ymm0,%ymm0 @@ -7939,13 +7985,13 @@ _sk_scale_u8_avx LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,74 ; jne 1d3b <_sk_scale_u8_avx+0x54> DB 196,66,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm8 - DB 197,57,219,5,1,96,0,0 ; vpand 0x6001(%rip),%xmm8,%xmm8 # 7d00 <_sk_callback_avx+0x624> + DB 197,57,219,5,209,96,0,0 ; vpand 0x60d1(%rip),%xmm8,%xmm8 # 7dd0 <_sk_callback_avx+0x629> DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9 DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8 DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,26,92,0,0 ; vbroadcastss 0x5c1a(%rip),%ymm9 # 793c <_sk_callback_avx+0x260> + DB 196,98,125,24,13,226,92,0,0 ; vbroadcastss 0x5ce2(%rip),%ymm9 # 7a04 <_sk_callback_avx+0x25d> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 @@ -8033,13 +8079,13 @@ _sk_lerp_u8_avx LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,110 ; jne 1ea7 <_sk_lerp_u8_avx+0x78> DB 196,66,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm8 - DB 197,57,219,5,201,94,0,0 ; vpand 0x5ec9(%rip),%xmm8,%xmm8 # 7d10 <_sk_callback_avx+0x634> + DB 197,57,219,5,153,95,0,0 ; vpand 0x5f99(%rip),%xmm8,%xmm8 # 7de0 <_sk_callback_avx+0x639> DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9 DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8 DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,214,90,0,0 ; vbroadcastss 0x5ad6(%rip),%ymm9 # 7940 <_sk_callback_avx+0x264> + DB 196,98,125,24,13,158,91,0,0 ; vbroadcastss 0x5b9e(%rip),%ymm9 # 7a08 <_sk_callback_avx+0x261> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 @@ -8095,7 +8141,7 @@ _sk_lerp_u8_avx LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf001f54 <_sk_callback_avx+0xffffffffdeffa878> + DB 233,255,255,255,222 ; jmpq ffffffffdf001f54 <_sk_callback_avx+0xffffffffdeffa7ad> DB 255 ; (bad) DB 255 ; (bad) DB 255,211 ; callq *%rbx @@ -8117,20 +8163,20 @@ _sk_lerp_565_avx LABEL PROC DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9 DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8 DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 - DB 196,98,125,24,13,178,89,0,0 ; vbroadcastss 0x59b2(%rip),%ymm9 # 7944 <_sk_callback_avx+0x268> + DB 196,98,125,24,13,122,90,0,0 ; vbroadcastss 0x5a7a(%rip),%ymm9 # 7a0c <_sk_callback_avx+0x265> DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9 DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9 - DB 196,98,125,24,21,163,89,0,0 ; vbroadcastss 0x59a3(%rip),%ymm10 # 7948 <_sk_callback_avx+0x26c> + DB 196,98,125,24,21,107,90,0,0 ; vbroadcastss 0x5a6b(%rip),%ymm10 # 7a10 <_sk_callback_avx+0x269> DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9 - DB 196,98,125,24,21,153,89,0,0 ; vbroadcastss 0x5999(%rip),%ymm10 # 794c <_sk_callback_avx+0x270> + DB 196,98,125,24,21,97,90,0,0 ; vbroadcastss 0x5a61(%rip),%ymm10 # 7a14 <_sk_callback_avx+0x26d> DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10 DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10 - DB 196,98,125,24,29,138,89,0,0 ; vbroadcastss 0x598a(%rip),%ymm11 # 7950 <_sk_callback_avx+0x274> + DB 196,98,125,24,29,82,90,0,0 ; vbroadcastss 0x5a52(%rip),%ymm11 # 7a18 <_sk_callback_avx+0x271> DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 - DB 196,98,125,24,29,128,89,0,0 ; vbroadcastss 0x5980(%rip),%ymm11 # 7954 <_sk_callback_avx+0x278> + DB 196,98,125,24,29,72,90,0,0 ; vbroadcastss 0x5a48(%rip),%ymm11 # 7a1c <_sk_callback_avx+0x275> DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,29,113,89,0,0 ; vbroadcastss 0x5971(%rip),%ymm11 # 7958 <_sk_callback_avx+0x27c> + DB 196,98,125,24,29,57,90,0,0 ; vbroadcastss 0x5a39(%rip),%ymm11 # 7a20 <_sk_callback_avx+0x279> DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 @@ -8209,7 +8255,7 @@ _sk_load_tables_avx LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 15,133,251,1,0,0 ; jne 2302 <_sk_load_tables_avx+0x21e> DB 196,65,124,16,18 ; vmovups (%r10),%ymm10 - DB 197,124,40,13,140,93,0,0 ; vmovaps 0x5d8c(%rip),%ymm9 # 7ea0 <_sk_callback_avx+0x7c4> + DB 197,124,40,13,108,94,0,0 ; vmovaps 0x5e6c(%rip),%ymm9 # 7f80 <_sk_callback_avx+0x7d9> DB 196,193,44,84,201 ; vandps %ymm9,%ymm10,%ymm1 DB 196,227,125,25,200,1 ; vextractf128 $0x1,%ymm1,%xmm0 DB 196,193,249,126,195 ; vmovq %xmm0,%r11 @@ -8301,7 +8347,7 @@ _sk_load_tables_avx LABEL PROC DB 196,193,65,114,208,24 ; vpsrld $0x18,%xmm8,%xmm7 DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,226,125,24,61,111,86,0,0 ; vbroadcastss 0x566f(%rip),%ymm7 # 795c <_sk_callback_avx+0x280> + DB 196,226,125,24,61,55,87,0,0 ; vbroadcastss 0x5737(%rip),%ymm7 # 7a24 <_sk_callback_avx+0x27d> DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 76,137,201 ; mov %r9,%rcx @@ -8316,9 +8362,9 @@ _sk_load_tables_avx LABEL PROC DB 73,211,235 ; shr %cl,%r11 DB 196,193,249,110,195 ; vmovq %r11,%xmm0 DB 196,226,121,48,192 ; vpmovzxbw %xmm0,%xmm0 - DB 196,226,121,0,13,246,89,0,0 ; vpshufb 0x59f6(%rip),%xmm0,%xmm1 # 7d20 <_sk_callback_avx+0x644> + DB 196,226,121,0,13,198,90,0,0 ; vpshufb 0x5ac6(%rip),%xmm0,%xmm1 # 7df0 <_sk_callback_avx+0x649> DB 196,226,121,33,201 ; vpmovsxbd %xmm1,%xmm1 - DB 196,226,121,0,5,248,89,0,0 ; vpshufb 0x59f8(%rip),%xmm0,%xmm0 # 7d30 <_sk_callback_avx+0x654> + DB 196,226,121,0,5,200,90,0,0 ; vpshufb 0x5ac8(%rip),%xmm0,%xmm0 # 7e00 <_sk_callback_avx+0x659> DB 196,226,121,33,192 ; vpmovsxbd %xmm0,%xmm0 DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 DB 196,66,125,44,18 ; vmaskmovps (%r10),%ymm0,%ymm10 @@ -8347,7 +8393,7 @@ _sk_load_tables_u16_be_avx LABEL PROC DB 197,113,105,219 ; vpunpckhwd %xmm3,%xmm1,%xmm11 DB 197,177,108,200 ; vpunpcklqdq %xmm0,%xmm9,%xmm1 DB 197,49,109,224 ; vpunpckhqdq %xmm0,%xmm9,%xmm12 - DB 197,121,111,21,135,89,0,0 ; vmovdqa 0x5987(%rip),%xmm10 # 7d40 <_sk_callback_avx+0x664> + DB 197,121,111,21,87,90,0,0 ; vmovdqa 0x5a57(%rip),%xmm10 # 7e10 <_sk_callback_avx+0x669> DB 196,193,113,219,202 ; vpand %xmm10,%xmm1,%xmm1 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 196,193,113,105,209 ; vpunpckhwd %xmm9,%xmm1,%xmm2 @@ -8445,7 +8491,7 @@ _sk_load_tables_u16_be_avx LABEL PROC DB 196,226,121,51,219 ; vpmovzxwd %xmm3,%xmm3 DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,226,125,24,61,174,83,0,0 ; vbroadcastss 0x53ae(%rip),%ymm7 # 7960 <_sk_callback_avx+0x284> + DB 196,226,125,24,61,118,84,0,0 ; vbroadcastss 0x5476(%rip),%ymm7 # 7a28 <_sk_callback_avx+0x281> DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7 @@ -8508,7 +8554,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3 DB 197,57,109,218 ; vpunpckhqdq %xmm2,%xmm8,%xmm11 DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8 - DB 197,121,111,13,134,86,0,0 ; vmovdqa 0x5686(%rip),%xmm9 # 7d50 <_sk_callback_avx+0x674> + DB 197,121,111,13,86,87,0,0 ; vmovdqa 0x5756(%rip),%xmm9 # 7e20 <_sk_callback_avx+0x679> DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0 DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10 DB 196,193,121,105,202 ; vpunpckhwd %xmm10,%xmm0,%xmm1 @@ -8598,7 +8644,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC DB 196,195,105,33,211,48 ; vinsertps $0x30,%xmm11,%xmm2,%xmm2 DB 196,227,109,24,211,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,203,80,0,0 ; vbroadcastss 0x50cb(%rip),%ymm3 # 7964 <_sk_callback_avx+0x288> + DB 196,226,125,24,29,147,81,0,0 ; vbroadcastss 0x5193(%rip),%ymm3 # 7a2c <_sk_callback_avx+0x285> DB 197,252,16,52,36 ; vmovups (%rsp),%ymm6 DB 197,252,16,124,36,32 ; vmovups 0x20(%rsp),%ymm7 DB 72,131,196,88 ; add $0x58,%rsp @@ -8640,7 +8686,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC PUBLIC _sk_byte_tables_avx _sk_byte_tables_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,4,80,0,0 ; vbroadcastss 0x5004(%rip),%ymm8 # 7968 <_sk_callback_avx+0x28c> + DB 196,98,125,24,5,204,80,0,0 ; vbroadcastss 0x50cc(%rip),%ymm8 # 7a30 <_sk_callback_avx+0x289> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9 DB 196,65,249,126,201 ; vmovq %xmm9,%r9 @@ -8759,7 +8805,7 @@ _sk_byte_tables_avx LABEL PROC DB 196,194,121,49,204 ; vpmovzxbd %xmm12,%xmm1 DB 196,194,121,49,213 ; vpmovzxbd %xmm13,%xmm2 DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1 - DB 196,98,125,24,13,174,77,0,0 ; vbroadcastss 0x4dae(%rip),%ymm9 # 796c <_sk_callback_avx+0x290> + DB 196,98,125,24,13,118,78,0,0 ; vbroadcastss 0x4e76(%rip),%ymm9 # 7a34 <_sk_callback_avx+0x28d> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1 @@ -8873,7 +8919,7 @@ _sk_byte_tables_rgb_avx LABEL PROC DB 196,194,121,49,203 ; vpmovzxbd %xmm11,%xmm1 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,13,143,75,0,0 ; vbroadcastss 0x4b8f(%rip),%ymm9 # 7970 <_sk_callback_avx+0x294> + DB 196,98,125,24,13,87,76,0,0 ; vbroadcastss 0x4c57(%rip),%ymm9 # 7a38 <_sk_callback_avx+0x291> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 196,194,121,49,202 ; vpmovzxbd %xmm10,%xmm1 DB 196,194,121,49,212 ; vpmovzxbd %xmm12,%xmm2 @@ -9068,36 +9114,36 @@ _sk_parametric_r_avx LABEL PROC DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0 DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10 DB 197,124,91,216 ; vcvtdq2ps %ymm0,%ymm11 - DB 196,98,125,24,37,60,72,0,0 ; vbroadcastss 0x483c(%rip),%ymm12 # 7974 <_sk_callback_avx+0x298> + DB 196,98,125,24,37,4,73,0,0 ; vbroadcastss 0x4904(%rip),%ymm12 # 7a3c <_sk_callback_avx+0x295> DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,50,72,0,0 ; vbroadcastss 0x4832(%rip),%ymm12 # 7978 <_sk_callback_avx+0x29c> + DB 196,98,125,24,37,250,72,0,0 ; vbroadcastss 0x48fa(%rip),%ymm12 # 7a40 <_sk_callback_avx+0x299> DB 196,193,124,84,196 ; vandps %ymm12,%ymm0,%ymm0 - DB 196,98,125,24,37,40,72,0,0 ; vbroadcastss 0x4828(%rip),%ymm12 # 797c <_sk_callback_avx+0x2a0> + DB 196,98,125,24,37,240,72,0,0 ; vbroadcastss 0x48f0(%rip),%ymm12 # 7a44 <_sk_callback_avx+0x29d> DB 196,193,124,86,196 ; vorps %ymm12,%ymm0,%ymm0 - DB 196,98,125,24,37,30,72,0,0 ; vbroadcastss 0x481e(%rip),%ymm12 # 7980 <_sk_callback_avx+0x2a4> + DB 196,98,125,24,37,230,72,0,0 ; vbroadcastss 0x48e6(%rip),%ymm12 # 7a48 <_sk_callback_avx+0x2a1> DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,20,72,0,0 ; vbroadcastss 0x4814(%rip),%ymm12 # 7984 <_sk_callback_avx+0x2a8> + DB 196,98,125,24,37,220,72,0,0 ; vbroadcastss 0x48dc(%rip),%ymm12 # 7a4c <_sk_callback_avx+0x2a5> DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12 DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,5,72,0,0 ; vbroadcastss 0x4805(%rip),%ymm12 # 7988 <_sk_callback_avx+0x2ac> + DB 196,98,125,24,37,205,72,0,0 ; vbroadcastss 0x48cd(%rip),%ymm12 # 7a50 <_sk_callback_avx+0x2a9> DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0 - DB 196,98,125,24,37,251,71,0,0 ; vbroadcastss 0x47fb(%rip),%ymm12 # 798c <_sk_callback_avx+0x2b0> + DB 196,98,125,24,37,195,72,0,0 ; vbroadcastss 0x48c3(%rip),%ymm12 # 7a54 <_sk_callback_avx+0x2ad> DB 197,156,94,192 ; vdivps %ymm0,%ymm12,%ymm0 DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0 DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0 DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10 DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10 - DB 196,98,125,24,29,223,71,0,0 ; vbroadcastss 0x47df(%rip),%ymm11 # 7990 <_sk_callback_avx+0x2b4> + DB 196,98,125,24,29,167,72,0,0 ; vbroadcastss 0x48a7(%rip),%ymm11 # 7a58 <_sk_callback_avx+0x2b1> DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0 - DB 196,98,125,24,29,213,71,0,0 ; vbroadcastss 0x47d5(%rip),%ymm11 # 7994 <_sk_callback_avx+0x2b8> + DB 196,98,125,24,29,157,72,0,0 ; vbroadcastss 0x489d(%rip),%ymm11 # 7a5c <_sk_callback_avx+0x2b5> DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11 DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0 - DB 196,98,125,24,29,198,71,0,0 ; vbroadcastss 0x47c6(%rip),%ymm11 # 7998 <_sk_callback_avx+0x2bc> + DB 196,98,125,24,29,142,72,0,0 ; vbroadcastss 0x488e(%rip),%ymm11 # 7a60 <_sk_callback_avx+0x2b9> DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 - DB 196,98,125,24,29,188,71,0,0 ; vbroadcastss 0x47bc(%rip),%ymm11 # 799c <_sk_callback_avx+0x2c0> + DB 196,98,125,24,29,132,72,0,0 ; vbroadcastss 0x4884(%rip),%ymm11 # 7a64 <_sk_callback_avx+0x2bd> DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10 DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0 - DB 196,98,125,24,21,173,71,0,0 ; vbroadcastss 0x47ad(%rip),%ymm10 # 79a0 <_sk_callback_avx+0x2c4> + DB 196,98,125,24,21,117,72,0,0 ; vbroadcastss 0x4875(%rip),%ymm10 # 7a68 <_sk_callback_avx+0x2c1> DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -9105,7 +9151,7 @@ _sk_parametric_r_avx LABEL PROC DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,132,71,0,0 ; vbroadcastss 0x4784(%rip),%ymm8 # 79a4 <_sk_callback_avx+0x2c8> + DB 196,98,125,24,5,76,72,0,0 ; vbroadcastss 0x484c(%rip),%ymm8 # 7a6c <_sk_callback_avx+0x2c5> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -9125,36 +9171,36 @@ _sk_parametric_g_avx LABEL PROC DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10 DB 197,124,91,217 ; vcvtdq2ps %ymm1,%ymm11 - DB 196,98,125,24,37,53,71,0,0 ; vbroadcastss 0x4735(%rip),%ymm12 # 79a8 <_sk_callback_avx+0x2cc> + DB 196,98,125,24,37,253,71,0,0 ; vbroadcastss 0x47fd(%rip),%ymm12 # 7a70 <_sk_callback_avx+0x2c9> DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,43,71,0,0 ; vbroadcastss 0x472b(%rip),%ymm12 # 79ac <_sk_callback_avx+0x2d0> + DB 196,98,125,24,37,243,71,0,0 ; vbroadcastss 0x47f3(%rip),%ymm12 # 7a74 <_sk_callback_avx+0x2cd> DB 196,193,116,84,204 ; vandps %ymm12,%ymm1,%ymm1 - DB 196,98,125,24,37,33,71,0,0 ; vbroadcastss 0x4721(%rip),%ymm12 # 79b0 <_sk_callback_avx+0x2d4> + DB 196,98,125,24,37,233,71,0,0 ; vbroadcastss 0x47e9(%rip),%ymm12 # 7a78 <_sk_callback_avx+0x2d1> DB 196,193,116,86,204 ; vorps %ymm12,%ymm1,%ymm1 - DB 196,98,125,24,37,23,71,0,0 ; vbroadcastss 0x4717(%rip),%ymm12 # 79b4 <_sk_callback_avx+0x2d8> + DB 196,98,125,24,37,223,71,0,0 ; vbroadcastss 0x47df(%rip),%ymm12 # 7a7c <_sk_callback_avx+0x2d5> DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,13,71,0,0 ; vbroadcastss 0x470d(%rip),%ymm12 # 79b8 <_sk_callback_avx+0x2dc> + DB 196,98,125,24,37,213,71,0,0 ; vbroadcastss 0x47d5(%rip),%ymm12 # 7a80 <_sk_callback_avx+0x2d9> DB 196,65,116,89,228 ; vmulps %ymm12,%ymm1,%ymm12 DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,254,70,0,0 ; vbroadcastss 0x46fe(%rip),%ymm12 # 79bc <_sk_callback_avx+0x2e0> + DB 196,98,125,24,37,198,71,0,0 ; vbroadcastss 0x47c6(%rip),%ymm12 # 7a84 <_sk_callback_avx+0x2dd> DB 196,193,116,88,204 ; vaddps %ymm12,%ymm1,%ymm1 - DB 196,98,125,24,37,244,70,0,0 ; vbroadcastss 0x46f4(%rip),%ymm12 # 79c0 <_sk_callback_avx+0x2e4> + DB 196,98,125,24,37,188,71,0,0 ; vbroadcastss 0x47bc(%rip),%ymm12 # 7a88 <_sk_callback_avx+0x2e1> DB 197,156,94,201 ; vdivps %ymm1,%ymm12,%ymm1 DB 197,164,92,201 ; vsubps %ymm1,%ymm11,%ymm1 DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1 DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10 DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10 - DB 196,98,125,24,29,216,70,0,0 ; vbroadcastss 0x46d8(%rip),%ymm11 # 79c4 <_sk_callback_avx+0x2e8> + DB 196,98,125,24,29,160,71,0,0 ; vbroadcastss 0x47a0(%rip),%ymm11 # 7a8c <_sk_callback_avx+0x2e5> DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,206,70,0,0 ; vbroadcastss 0x46ce(%rip),%ymm11 # 79c8 <_sk_callback_avx+0x2ec> + DB 196,98,125,24,29,150,71,0,0 ; vbroadcastss 0x4796(%rip),%ymm11 # 7a90 <_sk_callback_avx+0x2e9> DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11 DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,191,70,0,0 ; vbroadcastss 0x46bf(%rip),%ymm11 # 79cc <_sk_callback_avx+0x2f0> + DB 196,98,125,24,29,135,71,0,0 ; vbroadcastss 0x4787(%rip),%ymm11 # 7a94 <_sk_callback_avx+0x2ed> DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 - DB 196,98,125,24,29,181,70,0,0 ; vbroadcastss 0x46b5(%rip),%ymm11 # 79d0 <_sk_callback_avx+0x2f4> + DB 196,98,125,24,29,125,71,0,0 ; vbroadcastss 0x477d(%rip),%ymm11 # 7a98 <_sk_callback_avx+0x2f1> DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10 DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1 - DB 196,98,125,24,21,166,70,0,0 ; vbroadcastss 0x46a6(%rip),%ymm10 # 79d4 <_sk_callback_avx+0x2f8> + DB 196,98,125,24,21,110,71,0,0 ; vbroadcastss 0x476e(%rip),%ymm10 # 7a9c <_sk_callback_avx+0x2f5> DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1 DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -9162,7 +9208,7 @@ _sk_parametric_g_avx LABEL PROC DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1 - DB 196,98,125,24,5,125,70,0,0 ; vbroadcastss 0x467d(%rip),%ymm8 # 79d8 <_sk_callback_avx+0x2fc> + DB 196,98,125,24,5,69,71,0,0 ; vbroadcastss 0x4745(%rip),%ymm8 # 7aa0 <_sk_callback_avx+0x2f9> DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -9182,36 +9228,36 @@ _sk_parametric_b_avx LABEL PROC DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10 DB 197,124,91,218 ; vcvtdq2ps %ymm2,%ymm11 - DB 196,98,125,24,37,46,70,0,0 ; vbroadcastss 0x462e(%rip),%ymm12 # 79dc <_sk_callback_avx+0x300> + DB 196,98,125,24,37,246,70,0,0 ; vbroadcastss 0x46f6(%rip),%ymm12 # 7aa4 <_sk_callback_avx+0x2fd> DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,36,70,0,0 ; vbroadcastss 0x4624(%rip),%ymm12 # 79e0 <_sk_callback_avx+0x304> + DB 196,98,125,24,37,236,70,0,0 ; vbroadcastss 0x46ec(%rip),%ymm12 # 7aa8 <_sk_callback_avx+0x301> DB 196,193,108,84,212 ; vandps %ymm12,%ymm2,%ymm2 - DB 196,98,125,24,37,26,70,0,0 ; vbroadcastss 0x461a(%rip),%ymm12 # 79e4 <_sk_callback_avx+0x308> + DB 196,98,125,24,37,226,70,0,0 ; vbroadcastss 0x46e2(%rip),%ymm12 # 7aac <_sk_callback_avx+0x305> DB 196,193,108,86,212 ; vorps %ymm12,%ymm2,%ymm2 - DB 196,98,125,24,37,16,70,0,0 ; vbroadcastss 0x4610(%rip),%ymm12 # 79e8 <_sk_callback_avx+0x30c> + DB 196,98,125,24,37,216,70,0,0 ; vbroadcastss 0x46d8(%rip),%ymm12 # 7ab0 <_sk_callback_avx+0x309> DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,6,70,0,0 ; vbroadcastss 0x4606(%rip),%ymm12 # 79ec <_sk_callback_avx+0x310> + DB 196,98,125,24,37,206,70,0,0 ; vbroadcastss 0x46ce(%rip),%ymm12 # 7ab4 <_sk_callback_avx+0x30d> DB 196,65,108,89,228 ; vmulps %ymm12,%ymm2,%ymm12 DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,247,69,0,0 ; vbroadcastss 0x45f7(%rip),%ymm12 # 79f0 <_sk_callback_avx+0x314> + DB 196,98,125,24,37,191,70,0,0 ; vbroadcastss 0x46bf(%rip),%ymm12 # 7ab8 <_sk_callback_avx+0x311> DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2 - DB 196,98,125,24,37,237,69,0,0 ; vbroadcastss 0x45ed(%rip),%ymm12 # 79f4 <_sk_callback_avx+0x318> + DB 196,98,125,24,37,181,70,0,0 ; vbroadcastss 0x46b5(%rip),%ymm12 # 7abc <_sk_callback_avx+0x315> DB 197,156,94,210 ; vdivps %ymm2,%ymm12,%ymm2 DB 197,164,92,210 ; vsubps %ymm2,%ymm11,%ymm2 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10 DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10 - DB 196,98,125,24,29,209,69,0,0 ; vbroadcastss 0x45d1(%rip),%ymm11 # 79f8 <_sk_callback_avx+0x31c> + DB 196,98,125,24,29,153,70,0,0 ; vbroadcastss 0x4699(%rip),%ymm11 # 7ac0 <_sk_callback_avx+0x319> DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 - DB 196,98,125,24,29,199,69,0,0 ; vbroadcastss 0x45c7(%rip),%ymm11 # 79fc <_sk_callback_avx+0x320> + DB 196,98,125,24,29,143,70,0,0 ; vbroadcastss 0x468f(%rip),%ymm11 # 7ac4 <_sk_callback_avx+0x31d> DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11 DB 196,193,108,92,211 ; vsubps %ymm11,%ymm2,%ymm2 - DB 196,98,125,24,29,184,69,0,0 ; vbroadcastss 0x45b8(%rip),%ymm11 # 7a00 <_sk_callback_avx+0x324> + DB 196,98,125,24,29,128,70,0,0 ; vbroadcastss 0x4680(%rip),%ymm11 # 7ac8 <_sk_callback_avx+0x321> DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 - DB 196,98,125,24,29,174,69,0,0 ; vbroadcastss 0x45ae(%rip),%ymm11 # 7a04 <_sk_callback_avx+0x328> + DB 196,98,125,24,29,118,70,0,0 ; vbroadcastss 0x4676(%rip),%ymm11 # 7acc <_sk_callback_avx+0x325> DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10 DB 196,193,108,88,210 ; vaddps %ymm10,%ymm2,%ymm2 - DB 196,98,125,24,21,159,69,0,0 ; vbroadcastss 0x459f(%rip),%ymm10 # 7a08 <_sk_callback_avx+0x32c> + DB 196,98,125,24,21,103,70,0,0 ; vbroadcastss 0x4667(%rip),%ymm10 # 7ad0 <_sk_callback_avx+0x329> DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2 DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -9219,7 +9265,7 @@ _sk_parametric_b_avx LABEL PROC DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,118,69,0,0 ; vbroadcastss 0x4576(%rip),%ymm8 # 7a0c <_sk_callback_avx+0x330> + DB 196,98,125,24,5,62,70,0,0 ; vbroadcastss 0x463e(%rip),%ymm8 # 7ad4 <_sk_callback_avx+0x32d> DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -9239,36 +9285,36 @@ _sk_parametric_a_avx LABEL PROC DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3 DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10 DB 197,124,91,219 ; vcvtdq2ps %ymm3,%ymm11 - DB 196,98,125,24,37,39,69,0,0 ; vbroadcastss 0x4527(%rip),%ymm12 # 7a10 <_sk_callback_avx+0x334> + DB 196,98,125,24,37,239,69,0,0 ; vbroadcastss 0x45ef(%rip),%ymm12 # 7ad8 <_sk_callback_avx+0x331> DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,29,69,0,0 ; vbroadcastss 0x451d(%rip),%ymm12 # 7a14 <_sk_callback_avx+0x338> + DB 196,98,125,24,37,229,69,0,0 ; vbroadcastss 0x45e5(%rip),%ymm12 # 7adc <_sk_callback_avx+0x335> DB 196,193,100,84,220 ; vandps %ymm12,%ymm3,%ymm3 - DB 196,98,125,24,37,19,69,0,0 ; vbroadcastss 0x4513(%rip),%ymm12 # 7a18 <_sk_callback_avx+0x33c> + DB 196,98,125,24,37,219,69,0,0 ; vbroadcastss 0x45db(%rip),%ymm12 # 7ae0 <_sk_callback_avx+0x339> DB 196,193,100,86,220 ; vorps %ymm12,%ymm3,%ymm3 - DB 196,98,125,24,37,9,69,0,0 ; vbroadcastss 0x4509(%rip),%ymm12 # 7a1c <_sk_callback_avx+0x340> + DB 196,98,125,24,37,209,69,0,0 ; vbroadcastss 0x45d1(%rip),%ymm12 # 7ae4 <_sk_callback_avx+0x33d> DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,255,68,0,0 ; vbroadcastss 0x44ff(%rip),%ymm12 # 7a20 <_sk_callback_avx+0x344> + DB 196,98,125,24,37,199,69,0,0 ; vbroadcastss 0x45c7(%rip),%ymm12 # 7ae8 <_sk_callback_avx+0x341> DB 196,65,100,89,228 ; vmulps %ymm12,%ymm3,%ymm12 DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,240,68,0,0 ; vbroadcastss 0x44f0(%rip),%ymm12 # 7a24 <_sk_callback_avx+0x348> + DB 196,98,125,24,37,184,69,0,0 ; vbroadcastss 0x45b8(%rip),%ymm12 # 7aec <_sk_callback_avx+0x345> DB 196,193,100,88,220 ; vaddps %ymm12,%ymm3,%ymm3 - DB 196,98,125,24,37,230,68,0,0 ; vbroadcastss 0x44e6(%rip),%ymm12 # 7a28 <_sk_callback_avx+0x34c> + DB 196,98,125,24,37,174,69,0,0 ; vbroadcastss 0x45ae(%rip),%ymm12 # 7af0 <_sk_callback_avx+0x349> DB 197,156,94,219 ; vdivps %ymm3,%ymm12,%ymm3 DB 197,164,92,219 ; vsubps %ymm3,%ymm11,%ymm3 DB 197,172,89,219 ; vmulps %ymm3,%ymm10,%ymm3 DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10 DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10 - DB 196,98,125,24,29,202,68,0,0 ; vbroadcastss 0x44ca(%rip),%ymm11 # 7a2c <_sk_callback_avx+0x350> + DB 196,98,125,24,29,146,69,0,0 ; vbroadcastss 0x4592(%rip),%ymm11 # 7af4 <_sk_callback_avx+0x34d> DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3 - DB 196,98,125,24,29,192,68,0,0 ; vbroadcastss 0x44c0(%rip),%ymm11 # 7a30 <_sk_callback_avx+0x354> + DB 196,98,125,24,29,136,69,0,0 ; vbroadcastss 0x4588(%rip),%ymm11 # 7af8 <_sk_callback_avx+0x351> DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11 DB 196,193,100,92,219 ; vsubps %ymm11,%ymm3,%ymm3 - DB 196,98,125,24,29,177,68,0,0 ; vbroadcastss 0x44b1(%rip),%ymm11 # 7a34 <_sk_callback_avx+0x358> + DB 196,98,125,24,29,121,69,0,0 ; vbroadcastss 0x4579(%rip),%ymm11 # 7afc <_sk_callback_avx+0x355> DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 - DB 196,98,125,24,29,167,68,0,0 ; vbroadcastss 0x44a7(%rip),%ymm11 # 7a38 <_sk_callback_avx+0x35c> + DB 196,98,125,24,29,111,69,0,0 ; vbroadcastss 0x456f(%rip),%ymm11 # 7b00 <_sk_callback_avx+0x359> DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10 DB 196,193,100,88,218 ; vaddps %ymm10,%ymm3,%ymm3 - DB 196,98,125,24,21,152,68,0,0 ; vbroadcastss 0x4498(%rip),%ymm10 # 7a3c <_sk_callback_avx+0x360> + DB 196,98,125,24,21,96,69,0,0 ; vbroadcastss 0x4560(%rip),%ymm10 # 7b04 <_sk_callback_avx+0x35d> DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3 DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -9276,38 +9322,38 @@ _sk_parametric_a_avx LABEL PROC DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3 - DB 196,98,125,24,5,111,68,0,0 ; vbroadcastss 0x446f(%rip),%ymm8 # 7a40 <_sk_callback_avx+0x364> + DB 196,98,125,24,5,55,69,0,0 ; vbroadcastss 0x4537(%rip),%ymm8 # 7b08 <_sk_callback_avx+0x361> DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax PUBLIC _sk_lab_to_xyz_avx _sk_lab_to_xyz_avx LABEL PROC - DB 196,98,125,24,5,97,68,0,0 ; vbroadcastss 0x4461(%rip),%ymm8 # 7a44 <_sk_callback_avx+0x368> + DB 196,98,125,24,5,41,69,0,0 ; vbroadcastss 0x4529(%rip),%ymm8 # 7b0c <_sk_callback_avx+0x365> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,87,68,0,0 ; vbroadcastss 0x4457(%rip),%ymm8 # 7a48 <_sk_callback_avx+0x36c> + DB 196,98,125,24,5,31,69,0,0 ; vbroadcastss 0x451f(%rip),%ymm8 # 7b10 <_sk_callback_avx+0x369> DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 - DB 196,98,125,24,13,77,68,0,0 ; vbroadcastss 0x444d(%rip),%ymm9 # 7a4c <_sk_callback_avx+0x370> + DB 196,98,125,24,13,21,69,0,0 ; vbroadcastss 0x4515(%rip),%ymm9 # 7b14 <_sk_callback_avx+0x36d> DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1 DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 196,193,108,88,209 ; vaddps %ymm9,%ymm2,%ymm2 - DB 196,98,125,24,5,57,68,0,0 ; vbroadcastss 0x4439(%rip),%ymm8 # 7a50 <_sk_callback_avx+0x374> + DB 196,98,125,24,5,1,69,0,0 ; vbroadcastss 0x4501(%rip),%ymm8 # 7b18 <_sk_callback_avx+0x371> DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,47,68,0,0 ; vbroadcastss 0x442f(%rip),%ymm8 # 7a54 <_sk_callback_avx+0x378> + DB 196,98,125,24,5,247,68,0,0 ; vbroadcastss 0x44f7(%rip),%ymm8 # 7b1c <_sk_callback_avx+0x375> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,37,68,0,0 ; vbroadcastss 0x4425(%rip),%ymm8 # 7a58 <_sk_callback_avx+0x37c> + DB 196,98,125,24,5,237,68,0,0 ; vbroadcastss 0x44ed(%rip),%ymm8 # 7b20 <_sk_callback_avx+0x379> DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 DB 197,252,88,201 ; vaddps %ymm1,%ymm0,%ymm1 - DB 196,98,125,24,5,23,68,0,0 ; vbroadcastss 0x4417(%rip),%ymm8 # 7a5c <_sk_callback_avx+0x380> + DB 196,98,125,24,5,223,68,0,0 ; vbroadcastss 0x44df(%rip),%ymm8 # 7b24 <_sk_callback_avx+0x37d> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 197,252,92,210 ; vsubps %ymm2,%ymm0,%ymm2 DB 197,116,89,193 ; vmulps %ymm1,%ymm1,%ymm8 DB 196,65,116,89,192 ; vmulps %ymm8,%ymm1,%ymm8 - DB 196,98,125,24,13,0,68,0,0 ; vbroadcastss 0x4400(%rip),%ymm9 # 7a60 <_sk_callback_avx+0x384> + DB 196,98,125,24,13,200,68,0,0 ; vbroadcastss 0x44c8(%rip),%ymm9 # 7b28 <_sk_callback_avx+0x381> DB 196,65,52,194,208,1 ; vcmpltps %ymm8,%ymm9,%ymm10 - DB 196,98,125,24,29,245,67,0,0 ; vbroadcastss 0x43f5(%rip),%ymm11 # 7a64 <_sk_callback_avx+0x388> + DB 196,98,125,24,29,189,68,0,0 ; vbroadcastss 0x44bd(%rip),%ymm11 # 7b2c <_sk_callback_avx+0x385> DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,37,235,67,0,0 ; vbroadcastss 0x43eb(%rip),%ymm12 # 7a68 <_sk_callback_avx+0x38c> + DB 196,98,125,24,37,179,68,0,0 ; vbroadcastss 0x44b3(%rip),%ymm12 # 7b30 <_sk_callback_avx+0x389> DB 196,193,116,89,204 ; vmulps %ymm12,%ymm1,%ymm1 DB 196,67,117,74,192,160 ; vblendvps %ymm10,%ymm8,%ymm1,%ymm8 DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1 @@ -9322,9 +9368,9 @@ _sk_lab_to_xyz_avx LABEL PROC DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 DB 196,193,108,89,212 ; vmulps %ymm12,%ymm2,%ymm2 DB 196,227,109,74,208,144 ; vblendvps %ymm9,%ymm0,%ymm2,%ymm2 - DB 196,226,125,24,5,161,67,0,0 ; vbroadcastss 0x43a1(%rip),%ymm0 # 7a6c <_sk_callback_avx+0x390> + DB 196,226,125,24,5,105,68,0,0 ; vbroadcastss 0x4469(%rip),%ymm0 # 7b34 <_sk_callback_avx+0x38d> DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 - DB 196,98,125,24,5,152,67,0,0 ; vbroadcastss 0x4398(%rip),%ymm8 # 7a70 <_sk_callback_avx+0x394> + DB 196,98,125,24,5,96,68,0,0 ; vbroadcastss 0x4460(%rip),%ymm8 # 7b38 <_sk_callback_avx+0x391> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -9336,13 +9382,13 @@ _sk_load_a8_avx LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,66 ; jne 372d <_sk_load_a8_avx+0x4c> DB 196,194,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm0 - DB 197,249,219,5,103,70,0,0 ; vpand 0x4667(%rip),%xmm0,%xmm0 # 7d60 <_sk_callback_avx+0x684> + DB 197,249,219,5,55,71,0,0 ; vpand 0x4737(%rip),%xmm0,%xmm0 # 7e30 <_sk_callback_avx+0x689> DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1 DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,91,67,0,0 ; vbroadcastss 0x435b(%rip),%ymm1 # 7a74 <_sk_callback_avx+0x398> + DB 196,226,125,24,13,35,68,0,0 ; vbroadcastss 0x4423(%rip),%ymm1 # 7b3c <_sk_callback_avx+0x395> DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -9390,7 +9436,7 @@ _sk_load_a8_avx LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf0037d4 <_sk_callback_avx+0xffffffffdeffc0f8> + DB 233,255,255,255,222 ; jmpq ffffffffdf0037d4 <_sk_callback_avx+0xffffffffdeffc02d> DB 255 ; (bad) DB 255 ; (bad) DB 255,211 ; callq *%rbx @@ -9408,13 +9454,13 @@ _sk_load_a8_dst_avx LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,66 ; jne 382c <_sk_load_a8_dst_avx+0x4c> DB 196,194,121,48,36,19 ; vpmovzxbw (%r11,%rdx,1),%xmm4 - DB 197,217,219,37,120,69,0,0 ; vpand 0x4578(%rip),%xmm4,%xmm4 # 7d70 <_sk_callback_avx+0x694> + DB 197,217,219,37,72,70,0,0 ; vpand 0x4648(%rip),%xmm4,%xmm4 # 7e40 <_sk_callback_avx+0x699> DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5 DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5 DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4 DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,96,66,0,0 ; vbroadcastss 0x4260(%rip),%ymm5 # 7a78 <_sk_callback_avx+0x39c> + DB 196,226,125,24,45,40,67,0,0 ; vbroadcastss 0x4328(%rip),%ymm5 # 7b40 <_sk_callback_avx+0x399> DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 @@ -9462,7 +9508,7 @@ _sk_load_a8_dst_avx LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 232,255,255,255,221 ; callq ffffffffde0038d4 <_sk_callback_avx+0xffffffffddffc1f8> + DB 232,255,255,255,221 ; callq ffffffffde0038d4 <_sk_callback_avx+0xffffffffddffc12d> DB 255 ; (bad) DB 255 ; (bad) DB 255,210 ; callq *%rdx @@ -9515,7 +9561,7 @@ _sk_gather_a8_avx LABEL PROC DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0 DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,208,64,0,0 ; vbroadcastss 0x40d0(%rip),%ymm1 # 7a7c <_sk_callback_avx+0x3a0> + DB 196,226,125,24,13,152,65,0,0 ; vbroadcastss 0x4198(%rip),%ymm1 # 7b44 <_sk_callback_avx+0x39d> DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -9527,7 +9573,7 @@ PUBLIC _sk_store_a8_avx _sk_store_a8_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 - DB 196,98,125,24,5,178,64,0,0 ; vbroadcastss 0x40b2(%rip),%ymm8 # 7a80 <_sk_callback_avx+0x3a4> + DB 196,98,125,24,5,122,65,0,0 ; vbroadcastss 0x417a(%rip),%ymm8 # 7b48 <_sk_callback_avx+0x3a1> DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8 DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8 DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 @@ -9552,13 +9598,13 @@ _sk_store_a8_avx LABEL PROC DB 196,67,121,20,4,19,0 ; vpextrb $0x0,%xmm8,(%r11,%rdx,1) DB 235,202 ; jmp 39f3 <_sk_store_a8_avx+0x33> DB 196,67,121,20,68,19,2,4 ; vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1) - DB 196,98,57,0,5,70,67,0,0 ; vpshufb 0x4346(%rip),%xmm8,%xmm8 # 7d80 <_sk_callback_avx+0x6a4> + DB 196,98,57,0,5,22,68,0,0 ; vpshufb 0x4416(%rip),%xmm8,%xmm8 # 7e50 <_sk_callback_avx+0x6a9> DB 196,67,121,21,4,19,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,1) DB 235,176 ; jmp 39f3 <_sk_store_a8_avx+0x33> DB 196,67,121,20,68,19,6,12 ; vpextrb $0xc,%xmm8,0x6(%r11,%rdx,1) DB 196,67,121,20,68,19,5,10 ; vpextrb $0xa,%xmm8,0x5(%r11,%rdx,1) DB 196,67,121,20,68,19,4,8 ; vpextrb $0x8,%xmm8,0x4(%r11,%rdx,1) - DB 196,98,57,0,5,44,67,0,0 ; vpshufb 0x432c(%rip),%xmm8,%xmm8 # 7d90 <_sk_callback_avx+0x6b4> + DB 196,98,57,0,5,252,67,0,0 ; vpshufb 0x43fc(%rip),%xmm8,%xmm8 # 7e60 <_sk_callback_avx+0x6b9> DB 196,65,121,126,4,19 ; vmovd %xmm8,(%r11,%rdx,1) DB 235,135 ; jmp 39f3 <_sk_store_a8_avx+0x33> DB 180,255 ; mov $0xff,%ah @@ -9588,16 +9634,16 @@ _sk_load_g8_avx LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,71 ; jne 3ad9 <_sk_load_g8_avx+0x51> DB 196,194,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm0 - DB 197,249,219,5,0,67,0,0 ; vpand 0x4300(%rip),%xmm0,%xmm0 # 7da0 <_sk_callback_avx+0x6c4> + DB 197,249,219,5,208,67,0,0 ; vpand 0x43d0(%rip),%xmm0,%xmm0 # 7e70 <_sk_callback_avx+0x6c9> DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1 DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,196,63,0,0 ; vbroadcastss 0x3fc4(%rip),%ymm1 # 7a84 <_sk_callback_avx+0x3a8> + DB 196,226,125,24,13,140,64,0,0 ; vbroadcastss 0x408c(%rip),%ymm1 # 7b4c <_sk_callback_avx+0x3a5> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,185,63,0,0 ; vbroadcastss 0x3fb9(%rip),%ymm3 # 7a88 <_sk_callback_avx+0x3ac> + DB 196,226,125,24,29,129,64,0,0 ; vbroadcastss 0x4081(%rip),%ymm3 # 7b50 <_sk_callback_avx+0x3a9> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 255,224 ; jmpq *%rax @@ -9642,7 +9688,7 @@ _sk_load_g8_avx LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf003b80 <_sk_callback_avx+0xffffffffdeffc4a4> + DB 233,255,255,255,222 ; jmpq ffffffffdf003b80 <_sk_callback_avx+0xffffffffdeffc3d9> DB 255 ; (bad) DB 255 ; (bad) DB 255,211 ; callq *%rbx @@ -9660,16 +9706,16 @@ _sk_load_g8_dst_avx LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,71 ; jne 3bdd <_sk_load_g8_dst_avx+0x51> DB 196,194,121,48,36,19 ; vpmovzxbw (%r11,%rdx,1),%xmm4 - DB 197,217,219,37,12,66,0,0 ; vpand 0x420c(%rip),%xmm4,%xmm4 # 7db0 <_sk_callback_avx+0x6d4> + DB 197,217,219,37,220,66,0,0 ; vpand 0x42dc(%rip),%xmm4,%xmm4 # 7e80 <_sk_callback_avx+0x6d9> DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5 DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5 DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4 DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,200,62,0,0 ; vbroadcastss 0x3ec8(%rip),%ymm5 # 7a8c <_sk_callback_avx+0x3b0> + DB 196,226,125,24,45,144,63,0,0 ; vbroadcastss 0x3f90(%rip),%ymm5 # 7b54 <_sk_callback_avx+0x3ad> DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,61,189,62,0,0 ; vbroadcastss 0x3ebd(%rip),%ymm7 # 7a90 <_sk_callback_avx+0x3b4> + DB 196,226,125,24,61,133,63,0,0 ; vbroadcastss 0x3f85(%rip),%ymm7 # 7b58 <_sk_callback_avx+0x3b1> DB 197,252,40,236 ; vmovaps %ymm4,%ymm5 DB 197,252,40,244 ; vmovaps %ymm4,%ymm6 DB 255,224 ; jmpq *%rax @@ -9714,7 +9760,7 @@ _sk_load_g8_dst_avx LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf003c84 <_sk_callback_avx+0xffffffffdeffc5a8> + DB 233,255,255,255,222 ; jmpq ffffffffdf003c84 <_sk_callback_avx+0xffffffffdeffc4dd> DB 255 ; (bad) DB 255 ; (bad) DB 255,211 ; callq *%rbx @@ -9767,10 +9813,10 @@ _sk_gather_g8_avx LABEL PROC DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0 DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,56,61,0,0 ; vbroadcastss 0x3d38(%rip),%ymm1 # 7a94 <_sk_callback_avx+0x3b8> + DB 196,226,125,24,13,0,62,0,0 ; vbroadcastss 0x3e00(%rip),%ymm1 # 7b5c <_sk_callback_avx+0x3b5> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,45,61,0,0 ; vbroadcastss 0x3d2d(%rip),%ymm3 # 7a98 <_sk_callback_avx+0x3bc> + DB 196,226,125,24,29,245,61,0,0 ; vbroadcastss 0x3df5(%rip),%ymm3 # 7b60 <_sk_callback_avx+0x3b9> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 255,224 ; jmpq *%rax @@ -9840,10 +9886,10 @@ _sk_gather_i8_avx LABEL PROC DB 72,193,235,30 ; shr $0x1e,%rbx DB 196,195,121,34,28,27,3 ; vpinsrd $0x3,(%r11,%rbx,1),%xmm0,%xmm3 DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - DB 197,124,40,21,28,64,0,0 ; vmovaps 0x401c(%rip),%ymm10 # 7ec0 <_sk_callback_avx+0x7e4> + DB 197,124,40,21,252,64,0,0 ; vmovaps 0x40fc(%rip),%ymm10 # 7fa0 <_sk_callback_avx+0x7f9> DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,13,230,59,0,0 ; vbroadcastss 0x3be6(%rip),%ymm9 # 7a9c <_sk_callback_avx+0x3c0> + DB 196,98,125,24,13,174,60,0,0 ; vbroadcastss 0x3cae(%rip),%ymm9 # 7b64 <_sk_callback_avx+0x3bd> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1 DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2 @@ -9877,23 +9923,23 @@ _sk_load_565_avx LABEL PROC DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - DB 196,226,125,24,5,88,59,0,0 ; vbroadcastss 0x3b58(%rip),%ymm0 # 7aa0 <_sk_callback_avx+0x3c4> + DB 196,226,125,24,5,32,60,0,0 ; vbroadcastss 0x3c20(%rip),%ymm0 # 7b68 <_sk_callback_avx+0x3c1> DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,75,59,0,0 ; vbroadcastss 0x3b4b(%rip),%ymm1 # 7aa4 <_sk_callback_avx+0x3c8> + DB 196,226,125,24,13,19,60,0,0 ; vbroadcastss 0x3c13(%rip),%ymm1 # 7b6c <_sk_callback_avx+0x3c5> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,66,59,0,0 ; vbroadcastss 0x3b42(%rip),%ymm1 # 7aa8 <_sk_callback_avx+0x3cc> + DB 196,226,125,24,13,10,60,0,0 ; vbroadcastss 0x3c0a(%rip),%ymm1 # 7b70 <_sk_callback_avx+0x3c9> DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,29,53,59,0,0 ; vbroadcastss 0x3b35(%rip),%ymm3 # 7aac <_sk_callback_avx+0x3d0> + DB 196,226,125,24,29,253,59,0,0 ; vbroadcastss 0x3bfd(%rip),%ymm3 # 7b74 <_sk_callback_avx+0x3cd> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 - DB 196,226,125,24,29,44,59,0,0 ; vbroadcastss 0x3b2c(%rip),%ymm3 # 7ab0 <_sk_callback_avx+0x3d4> + DB 196,226,125,24,29,244,59,0,0 ; vbroadcastss 0x3bf4(%rip),%ymm3 # 7b78 <_sk_callback_avx+0x3d1> DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,226,125,24,29,31,59,0,0 ; vbroadcastss 0x3b1f(%rip),%ymm3 # 7ab4 <_sk_callback_avx+0x3d8> + DB 196,226,125,24,29,231,59,0,0 ; vbroadcastss 0x3be7(%rip),%ymm3 # 7b7c <_sk_callback_avx+0x3d5> DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,20,59,0,0 ; vbroadcastss 0x3b14(%rip),%ymm3 # 7ab8 <_sk_callback_avx+0x3dc> + DB 196,226,125,24,29,220,59,0,0 ; vbroadcastss 0x3bdc(%rip),%ymm3 # 7b80 <_sk_callback_avx+0x3d9> DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,7 ; and $0x7,%r9b @@ -9952,23 +9998,23 @@ _sk_load_565_dst_avx LABEL PROC DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5 DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4 DB 196,227,93,24,245,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm6 - DB 196,226,125,24,37,68,58,0,0 ; vbroadcastss 0x3a44(%rip),%ymm4 # 7abc <_sk_callback_avx+0x3e0> + DB 196,226,125,24,37,12,59,0,0 ; vbroadcastss 0x3b0c(%rip),%ymm4 # 7b84 <_sk_callback_avx+0x3dd> DB 197,204,84,228 ; vandps %ymm4,%ymm6,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,55,58,0,0 ; vbroadcastss 0x3a37(%rip),%ymm5 # 7ac0 <_sk_callback_avx+0x3e4> + DB 196,226,125,24,45,255,58,0,0 ; vbroadcastss 0x3aff(%rip),%ymm5 # 7b88 <_sk_callback_avx+0x3e1> DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4 - DB 196,226,125,24,45,46,58,0,0 ; vbroadcastss 0x3a2e(%rip),%ymm5 # 7ac4 <_sk_callback_avx+0x3e8> + DB 196,226,125,24,45,246,58,0,0 ; vbroadcastss 0x3af6(%rip),%ymm5 # 7b8c <_sk_callback_avx+0x3e5> DB 197,204,84,237 ; vandps %ymm5,%ymm6,%ymm5 DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 - DB 196,226,125,24,61,33,58,0,0 ; vbroadcastss 0x3a21(%rip),%ymm7 # 7ac8 <_sk_callback_avx+0x3ec> + DB 196,226,125,24,61,233,58,0,0 ; vbroadcastss 0x3ae9(%rip),%ymm7 # 7b90 <_sk_callback_avx+0x3e9> DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5 - DB 196,226,125,24,61,24,58,0,0 ; vbroadcastss 0x3a18(%rip),%ymm7 # 7acc <_sk_callback_avx+0x3f0> + DB 196,226,125,24,61,224,58,0,0 ; vbroadcastss 0x3ae0(%rip),%ymm7 # 7b94 <_sk_callback_avx+0x3ed> DB 197,204,84,247 ; vandps %ymm7,%ymm6,%ymm6 DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6 - DB 196,226,125,24,61,11,58,0,0 ; vbroadcastss 0x3a0b(%rip),%ymm7 # 7ad0 <_sk_callback_avx+0x3f4> + DB 196,226,125,24,61,211,58,0,0 ; vbroadcastss 0x3ad3(%rip),%ymm7 # 7b98 <_sk_callback_avx+0x3f1> DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,61,0,58,0,0 ; vbroadcastss 0x3a00(%rip),%ymm7 # 7ad4 <_sk_callback_avx+0x3f8> + DB 196,226,125,24,61,200,58,0,0 ; vbroadcastss 0x3ac8(%rip),%ymm7 # 7b9c <_sk_callback_avx+0x3f5> DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,7 ; and $0x7,%r9b @@ -10062,37 +10108,37 @@ _sk_gather_565_avx LABEL PROC DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - DB 196,226,125,24,5,142,56,0,0 ; vbroadcastss 0x388e(%rip),%ymm0 # 7ad8 <_sk_callback_avx+0x3fc> + DB 196,226,125,24,5,86,57,0,0 ; vbroadcastss 0x3956(%rip),%ymm0 # 7ba0 <_sk_callback_avx+0x3f9> DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,129,56,0,0 ; vbroadcastss 0x3881(%rip),%ymm1 # 7adc <_sk_callback_avx+0x400> + DB 196,226,125,24,13,73,57,0,0 ; vbroadcastss 0x3949(%rip),%ymm1 # 7ba4 <_sk_callback_avx+0x3fd> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,120,56,0,0 ; vbroadcastss 0x3878(%rip),%ymm1 # 7ae0 <_sk_callback_avx+0x404> + DB 196,226,125,24,13,64,57,0,0 ; vbroadcastss 0x3940(%rip),%ymm1 # 7ba8 <_sk_callback_avx+0x401> DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,29,107,56,0,0 ; vbroadcastss 0x386b(%rip),%ymm3 # 7ae4 <_sk_callback_avx+0x408> + DB 196,226,125,24,29,51,57,0,0 ; vbroadcastss 0x3933(%rip),%ymm3 # 7bac <_sk_callback_avx+0x405> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 - DB 196,226,125,24,29,98,56,0,0 ; vbroadcastss 0x3862(%rip),%ymm3 # 7ae8 <_sk_callback_avx+0x40c> + DB 196,226,125,24,29,42,57,0,0 ; vbroadcastss 0x392a(%rip),%ymm3 # 7bb0 <_sk_callback_avx+0x409> DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,226,125,24,29,85,56,0,0 ; vbroadcastss 0x3855(%rip),%ymm3 # 7aec <_sk_callback_avx+0x410> + DB 196,226,125,24,29,29,57,0,0 ; vbroadcastss 0x391d(%rip),%ymm3 # 7bb4 <_sk_callback_avx+0x40d> DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,74,56,0,0 ; vbroadcastss 0x384a(%rip),%ymm3 # 7af0 <_sk_callback_avx+0x414> + DB 196,226,125,24,29,18,57,0,0 ; vbroadcastss 0x3912(%rip),%ymm3 # 7bb8 <_sk_callback_avx+0x411> DB 255,224 ; jmpq *%rax PUBLIC _sk_store_565_avx _sk_store_565_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 - DB 196,98,125,24,5,62,56,0,0 ; vbroadcastss 0x383e(%rip),%ymm8 # 7af4 <_sk_callback_avx+0x418> + DB 196,98,125,24,5,6,57,0,0 ; vbroadcastss 0x3906(%rip),%ymm8 # 7bbc <_sk_callback_avx+0x415> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,193,41,114,241,11 ; vpslld $0xb,%xmm9,%xmm10 DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9 DB 196,193,49,114,241,11 ; vpslld $0xb,%xmm9,%xmm9 DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 - DB 196,98,125,24,21,23,56,0,0 ; vbroadcastss 0x3817(%rip),%ymm10 # 7af8 <_sk_callback_avx+0x41c> + DB 196,98,125,24,21,223,56,0,0 ; vbroadcastss 0x38df(%rip),%ymm10 # 7bc0 <_sk_callback_avx+0x419> DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10 DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10 DB 196,193,33,114,242,5 ; vpslld $0x5,%xmm10,%xmm11 @@ -10164,25 +10210,25 @@ _sk_load_4444_avx LABEL PROC DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - DB 196,226,125,24,5,32,55,0,0 ; vbroadcastss 0x3720(%rip),%ymm0 # 7afc <_sk_callback_avx+0x420> + DB 196,226,125,24,5,232,55,0,0 ; vbroadcastss 0x37e8(%rip),%ymm0 # 7bc4 <_sk_callback_avx+0x41d> DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,19,55,0,0 ; vbroadcastss 0x3713(%rip),%ymm1 # 7b00 <_sk_callback_avx+0x424> + DB 196,226,125,24,13,219,55,0,0 ; vbroadcastss 0x37db(%rip),%ymm1 # 7bc8 <_sk_callback_avx+0x421> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,10,55,0,0 ; vbroadcastss 0x370a(%rip),%ymm1 # 7b04 <_sk_callback_avx+0x428> + DB 196,226,125,24,13,210,55,0,0 ; vbroadcastss 0x37d2(%rip),%ymm1 # 7bcc <_sk_callback_avx+0x425> DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,21,253,54,0,0 ; vbroadcastss 0x36fd(%rip),%ymm2 # 7b08 <_sk_callback_avx+0x42c> + DB 196,226,125,24,21,197,55,0,0 ; vbroadcastss 0x37c5(%rip),%ymm2 # 7bd0 <_sk_callback_avx+0x429> DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1 - DB 196,226,125,24,21,244,54,0,0 ; vbroadcastss 0x36f4(%rip),%ymm2 # 7b0c <_sk_callback_avx+0x430> + DB 196,226,125,24,21,188,55,0,0 ; vbroadcastss 0x37bc(%rip),%ymm2 # 7bd4 <_sk_callback_avx+0x42d> DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,98,125,24,5,231,54,0,0 ; vbroadcastss 0x36e7(%rip),%ymm8 # 7b10 <_sk_callback_avx+0x434> + DB 196,98,125,24,5,175,55,0,0 ; vbroadcastss 0x37af(%rip),%ymm8 # 7bd8 <_sk_callback_avx+0x431> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,221,54,0,0 ; vbroadcastss 0x36dd(%rip),%ymm8 # 7b14 <_sk_callback_avx+0x438> + DB 196,98,125,24,5,165,55,0,0 ; vbroadcastss 0x37a5(%rip),%ymm8 # 7bdc <_sk_callback_avx+0x435> DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,207,54,0,0 ; vbroadcastss 0x36cf(%rip),%ymm8 # 7b18 <_sk_callback_avx+0x43c> + DB 196,98,125,24,5,151,55,0,0 ; vbroadcastss 0x3797(%rip),%ymm8 # 7be0 <_sk_callback_avx+0x439> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -10243,25 +10289,25 @@ _sk_load_4444_dst_avx LABEL PROC DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5 DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4 DB 196,227,93,24,253,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm7 - DB 196,226,125,24,37,248,53,0,0 ; vbroadcastss 0x35f8(%rip),%ymm4 # 7b1c <_sk_callback_avx+0x440> + DB 196,226,125,24,37,192,54,0,0 ; vbroadcastss 0x36c0(%rip),%ymm4 # 7be4 <_sk_callback_avx+0x43d> DB 197,196,84,228 ; vandps %ymm4,%ymm7,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,125,24,45,235,53,0,0 ; vbroadcastss 0x35eb(%rip),%ymm5 # 7b20 <_sk_callback_avx+0x444> + DB 196,226,125,24,45,179,54,0,0 ; vbroadcastss 0x36b3(%rip),%ymm5 # 7be8 <_sk_callback_avx+0x441> DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4 - DB 196,226,125,24,45,226,53,0,0 ; vbroadcastss 0x35e2(%rip),%ymm5 # 7b24 <_sk_callback_avx+0x448> + DB 196,226,125,24,45,170,54,0,0 ; vbroadcastss 0x36aa(%rip),%ymm5 # 7bec <_sk_callback_avx+0x445> DB 197,196,84,237 ; vandps %ymm5,%ymm7,%ymm5 DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 - DB 196,226,125,24,53,213,53,0,0 ; vbroadcastss 0x35d5(%rip),%ymm6 # 7b28 <_sk_callback_avx+0x44c> + DB 196,226,125,24,53,157,54,0,0 ; vbroadcastss 0x369d(%rip),%ymm6 # 7bf0 <_sk_callback_avx+0x449> DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5 - DB 196,226,125,24,53,204,53,0,0 ; vbroadcastss 0x35cc(%rip),%ymm6 # 7b2c <_sk_callback_avx+0x450> + DB 196,226,125,24,53,148,54,0,0 ; vbroadcastss 0x3694(%rip),%ymm6 # 7bf4 <_sk_callback_avx+0x44d> DB 197,196,84,246 ; vandps %ymm6,%ymm7,%ymm6 DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6 - DB 196,98,125,24,5,191,53,0,0 ; vbroadcastss 0x35bf(%rip),%ymm8 # 7b30 <_sk_callback_avx+0x454> + DB 196,98,125,24,5,135,54,0,0 ; vbroadcastss 0x3687(%rip),%ymm8 # 7bf8 <_sk_callback_avx+0x451> DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6 - DB 196,98,125,24,5,181,53,0,0 ; vbroadcastss 0x35b5(%rip),%ymm8 # 7b34 <_sk_callback_avx+0x458> + DB 196,98,125,24,5,125,54,0,0 ; vbroadcastss 0x367d(%rip),%ymm8 # 7bfc <_sk_callback_avx+0x455> DB 196,193,68,84,248 ; vandps %ymm8,%ymm7,%ymm7 DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7 - DB 196,98,125,24,5,167,53,0,0 ; vbroadcastss 0x35a7(%rip),%ymm8 # 7b38 <_sk_callback_avx+0x45c> + DB 196,98,125,24,5,111,54,0,0 ; vbroadcastss 0x366f(%rip),%ymm8 # 7c00 <_sk_callback_avx+0x459> DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -10357,25 +10403,25 @@ _sk_gather_4444_avx LABEL PROC DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - DB 196,226,125,24,5,46,52,0,0 ; vbroadcastss 0x342e(%rip),%ymm0 # 7b3c <_sk_callback_avx+0x460> + DB 196,226,125,24,5,246,52,0,0 ; vbroadcastss 0x34f6(%rip),%ymm0 # 7c04 <_sk_callback_avx+0x45d> DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,33,52,0,0 ; vbroadcastss 0x3421(%rip),%ymm1 # 7b40 <_sk_callback_avx+0x464> + DB 196,226,125,24,13,233,52,0,0 ; vbroadcastss 0x34e9(%rip),%ymm1 # 7c08 <_sk_callback_avx+0x461> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,24,52,0,0 ; vbroadcastss 0x3418(%rip),%ymm1 # 7b44 <_sk_callback_avx+0x468> + DB 196,226,125,24,13,224,52,0,0 ; vbroadcastss 0x34e0(%rip),%ymm1 # 7c0c <_sk_callback_avx+0x465> DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,21,11,52,0,0 ; vbroadcastss 0x340b(%rip),%ymm2 # 7b48 <_sk_callback_avx+0x46c> + DB 196,226,125,24,21,211,52,0,0 ; vbroadcastss 0x34d3(%rip),%ymm2 # 7c10 <_sk_callback_avx+0x469> DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1 - DB 196,226,125,24,21,2,52,0,0 ; vbroadcastss 0x3402(%rip),%ymm2 # 7b4c <_sk_callback_avx+0x470> + DB 196,226,125,24,21,202,52,0,0 ; vbroadcastss 0x34ca(%rip),%ymm2 # 7c14 <_sk_callback_avx+0x46d> DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,98,125,24,5,245,51,0,0 ; vbroadcastss 0x33f5(%rip),%ymm8 # 7b50 <_sk_callback_avx+0x474> + DB 196,98,125,24,5,189,52,0,0 ; vbroadcastss 0x34bd(%rip),%ymm8 # 7c18 <_sk_callback_avx+0x471> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,235,51,0,0 ; vbroadcastss 0x33eb(%rip),%ymm8 # 7b54 <_sk_callback_avx+0x478> + DB 196,98,125,24,5,179,52,0,0 ; vbroadcastss 0x34b3(%rip),%ymm8 # 7c1c <_sk_callback_avx+0x475> DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,221,51,0,0 ; vbroadcastss 0x33dd(%rip),%ymm8 # 7b58 <_sk_callback_avx+0x47c> + DB 196,98,125,24,5,165,52,0,0 ; vbroadcastss 0x34a5(%rip),%ymm8 # 7c20 <_sk_callback_avx+0x479> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -10384,7 +10430,7 @@ PUBLIC _sk_store_4444_avx _sk_store_4444_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 - DB 196,98,125,24,5,202,51,0,0 ; vbroadcastss 0x33ca(%rip),%ymm8 # 7b5c <_sk_callback_avx+0x480> + DB 196,98,125,24,5,146,52,0,0 ; vbroadcastss 0x3492(%rip),%ymm8 # 7c24 <_sk_callback_avx+0x47d> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,193,41,114,241,12 ; vpslld $0xc,%xmm9,%xmm10 @@ -10452,7 +10498,7 @@ _sk_store_4444_avx LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 232,255,255,255,224 ; callq ffffffffe10048a0 <_sk_callback_avx+0xffffffffe0ffd1c4> + DB 232,255,255,255,224 ; callq ffffffffe10048a0 <_sk_callback_avx+0xffffffffe0ffd0f9> DB 255 ; (bad) DB 255 ; (bad) DB 255 ; .byte 0xff @@ -10467,10 +10513,10 @@ _sk_load_8888_avx LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 15,133,139,0,0,0 ; jne 4949 <_sk_load_8888_avx+0xa5> DB 196,193,124,16,26 ; vmovups (%r10),%ymm3 - DB 197,124,40,21,21,54,0,0 ; vmovaps 0x3615(%rip),%ymm10 # 7ee0 <_sk_callback_avx+0x804> + DB 197,124,40,21,245,54,0,0 ; vmovaps 0x36f5(%rip),%ymm10 # 7fc0 <_sk_callback_avx+0x819> DB 196,193,100,84,194 ; vandps %ymm10,%ymm3,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,131,50,0,0 ; vbroadcastss 0x3283(%rip),%ymm8 # 7b60 <_sk_callback_avx+0x484> + DB 196,98,125,24,5,75,51,0,0 ; vbroadcastss 0x334b(%rip),%ymm8 # 7c28 <_sk_callback_avx+0x481> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1 DB 196,195,125,25,217,1 ; vextractf128 $0x1,%ymm3,%xmm9 @@ -10501,9 +10547,9 @@ _sk_load_8888_avx LABEL PROC DB 72,211,232 ; shr %cl,%rax DB 196,225,249,110,192 ; vmovq %rax,%xmm0 DB 196,226,121,48,192 ; vpmovzxbw %xmm0,%xmm0 - DB 196,226,121,0,13,79,52,0,0 ; vpshufb 0x344f(%rip),%xmm0,%xmm1 # 7dc0 <_sk_callback_avx+0x6e4> + DB 196,226,121,0,13,31,53,0,0 ; vpshufb 0x351f(%rip),%xmm0,%xmm1 # 7e90 <_sk_callback_avx+0x6e9> DB 196,226,121,33,201 ; vpmovsxbd %xmm1,%xmm1 - DB 196,226,121,0,5,81,52,0,0 ; vpshufb 0x3451(%rip),%xmm0,%xmm0 # 7dd0 <_sk_callback_avx+0x6f4> + DB 196,226,121,0,5,33,53,0,0 ; vpshufb 0x3521(%rip),%xmm0,%xmm0 # 7ea0 <_sk_callback_avx+0x6f9> DB 196,226,121,33,192 ; vpmovsxbd %xmm0,%xmm0 DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 DB 196,194,125,44,26 ; vmaskmovps (%r10),%ymm0,%ymm3 @@ -10519,10 +10565,10 @@ _sk_load_8888_dst_avx LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 15,133,139,0,0,0 ; jne 4a39 <_sk_load_8888_dst_avx+0xa5> DB 196,193,124,16,58 ; vmovups (%r10),%ymm7 - DB 197,124,40,21,69,53,0,0 ; vmovaps 0x3545(%rip),%ymm10 # 7f00 <_sk_callback_avx+0x824> + DB 197,124,40,21,37,54,0,0 ; vmovaps 0x3625(%rip),%ymm10 # 7fe0 <_sk_callback_avx+0x839> DB 196,193,68,84,226 ; vandps %ymm10,%ymm7,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,98,125,24,5,151,49,0,0 ; vbroadcastss 0x3197(%rip),%ymm8 # 7b64 <_sk_callback_avx+0x488> + DB 196,98,125,24,5,95,50,0,0 ; vbroadcastss 0x325f(%rip),%ymm8 # 7c2c <_sk_callback_avx+0x485> DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4 DB 197,209,114,215,8 ; vpsrld $0x8,%xmm7,%xmm5 DB 196,195,125,25,249,1 ; vextractf128 $0x1,%ymm7,%xmm9 @@ -10553,9 +10599,9 @@ _sk_load_8888_dst_avx LABEL PROC DB 72,211,232 ; shr %cl,%rax DB 196,225,249,110,224 ; vmovq %rax,%xmm4 DB 196,226,121,48,228 ; vpmovzxbw %xmm4,%xmm4 - DB 196,226,89,0,45,127,51,0,0 ; vpshufb 0x337f(%rip),%xmm4,%xmm5 # 7de0 <_sk_callback_avx+0x704> + DB 196,226,89,0,45,79,52,0,0 ; vpshufb 0x344f(%rip),%xmm4,%xmm5 # 7eb0 <_sk_callback_avx+0x709> DB 196,226,121,33,237 ; vpmovsxbd %xmm5,%xmm5 - DB 196,226,89,0,37,129,51,0,0 ; vpshufb 0x3381(%rip),%xmm4,%xmm4 # 7df0 <_sk_callback_avx+0x714> + DB 196,226,89,0,37,81,52,0,0 ; vpshufb 0x3451(%rip),%xmm4,%xmm4 # 7ec0 <_sk_callback_avx+0x719> DB 196,226,121,33,228 ; vpmovsxbd %xmm4,%xmm4 DB 196,227,85,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm4 DB 196,194,93,44,58 ; vmaskmovps (%r10),%ymm4,%ymm7 @@ -10596,10 +10642,10 @@ _sk_gather_8888_avx LABEL PROC DB 73,193,234,32 ; shr $0x20,%r10 DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3 DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - DB 197,124,40,21,241,51,0,0 ; vmovaps 0x33f1(%rip),%ymm10 # 7f20 <_sk_callback_avx+0x844> + DB 197,124,40,21,209,52,0,0 ; vmovaps 0x34d1(%rip),%ymm10 # 8000 <_sk_callback_avx+0x859> DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,13,39,48,0,0 ; vbroadcastss 0x3027(%rip),%ymm9 # 7b68 <_sk_callback_avx+0x48c> + DB 196,98,125,24,13,239,48,0,0 ; vbroadcastss 0x30ef(%rip),%ymm9 # 7c30 <_sk_callback_avx+0x489> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1 DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2 @@ -10628,7 +10674,7 @@ _sk_store_8888_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 76,3,16 ; add (%rax),%r10 - DB 196,98,125,24,5,176,47,0,0 ; vbroadcastss 0x2fb0(%rip),%ymm8 # 7b6c <_sk_callback_avx+0x490> + DB 196,98,125,24,5,120,48,0,0 ; vbroadcastss 0x3078(%rip),%ymm8 # 7c34 <_sk_callback_avx+0x48d> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10 @@ -10666,9 +10712,9 @@ _sk_store_8888_avx LABEL PROC DB 72,211,232 ; shr %cl,%rax DB 196,97,249,110,200 ; vmovq %rax,%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 - DB 196,98,49,0,21,138,49,0,0 ; vpshufb 0x318a(%rip),%xmm9,%xmm10 # 7e00 <_sk_callback_avx+0x724> + DB 196,98,49,0,21,90,50,0,0 ; vpshufb 0x325a(%rip),%xmm9,%xmm10 # 7ed0 <_sk_callback_avx+0x729> DB 196,66,121,33,210 ; vpmovsxbd %xmm10,%xmm10 - DB 196,98,49,0,13,140,49,0,0 ; vpshufb 0x318c(%rip),%xmm9,%xmm9 # 7e10 <_sk_callback_avx+0x734> + DB 196,98,49,0,13,92,50,0,0 ; vpshufb 0x325c(%rip),%xmm9,%xmm9 # 7ee0 <_sk_callback_avx+0x739> DB 196,66,121,33,201 ; vpmovsxbd %xmm9,%xmm9 DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 DB 196,66,53,46,2 ; vmaskmovps %ymm8,%ymm9,(%r10) @@ -10684,10 +10730,10 @@ _sk_load_bgra_avx LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 15,133,139,0,0,0 ; jne 4d3b <_sk_load_bgra_avx+0xa5> DB 196,193,124,16,26 ; vmovups (%r10),%ymm3 - DB 197,124,40,21,131,50,0,0 ; vmovaps 0x3283(%rip),%ymm10 # 7f40 <_sk_callback_avx+0x864> + DB 197,124,40,21,99,51,0,0 ; vmovaps 0x3363(%rip),%ymm10 # 8020 <_sk_callback_avx+0x879> DB 196,193,100,84,202 ; vandps %ymm10,%ymm3,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,98,125,24,5,161,46,0,0 ; vbroadcastss 0x2ea1(%rip),%ymm8 # 7b70 <_sk_callback_avx+0x494> + DB 196,98,125,24,5,105,47,0,0 ; vbroadcastss 0x2f69(%rip),%ymm8 # 7c38 <_sk_callback_avx+0x491> DB 196,193,116,89,208 ; vmulps %ymm8,%ymm1,%ymm2 DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1 DB 196,195,125,25,217,1 ; vextractf128 $0x1,%ymm3,%xmm9 @@ -10718,9 +10764,9 @@ _sk_load_bgra_avx LABEL PROC DB 72,211,232 ; shr %cl,%rax DB 196,225,249,110,192 ; vmovq %rax,%xmm0 DB 196,226,121,48,192 ; vpmovzxbw %xmm0,%xmm0 - DB 196,226,121,0,13,189,48,0,0 ; vpshufb 0x30bd(%rip),%xmm0,%xmm1 # 7e20 <_sk_callback_avx+0x744> + DB 196,226,121,0,13,141,49,0,0 ; vpshufb 0x318d(%rip),%xmm0,%xmm1 # 7ef0 <_sk_callback_avx+0x749> DB 196,226,121,33,201 ; vpmovsxbd %xmm1,%xmm1 - DB 196,226,121,0,5,191,48,0,0 ; vpshufb 0x30bf(%rip),%xmm0,%xmm0 # 7e30 <_sk_callback_avx+0x754> + DB 196,226,121,0,5,143,49,0,0 ; vpshufb 0x318f(%rip),%xmm0,%xmm0 # 7f00 <_sk_callback_avx+0x759> DB 196,226,121,33,192 ; vpmovsxbd %xmm0,%xmm0 DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 DB 196,194,125,44,26 ; vmaskmovps (%r10),%ymm0,%ymm3 @@ -10736,10 +10782,10 @@ _sk_load_bgra_dst_avx LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 15,133,139,0,0,0 ; jne 4e2b <_sk_load_bgra_dst_avx+0xa5> DB 196,193,124,16,58 ; vmovups (%r10),%ymm7 - DB 197,124,40,21,179,49,0,0 ; vmovaps 0x31b3(%rip),%ymm10 # 7f60 <_sk_callback_avx+0x884> + DB 197,124,40,21,147,50,0,0 ; vmovaps 0x3293(%rip),%ymm10 # 8040 <_sk_callback_avx+0x899> DB 196,193,68,84,234 ; vandps %ymm10,%ymm7,%ymm5 DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 - DB 196,98,125,24,5,181,45,0,0 ; vbroadcastss 0x2db5(%rip),%ymm8 # 7b74 <_sk_callback_avx+0x498> + DB 196,98,125,24,5,125,46,0,0 ; vbroadcastss 0x2e7d(%rip),%ymm8 # 7c3c <_sk_callback_avx+0x495> DB 196,193,84,89,240 ; vmulps %ymm8,%ymm5,%ymm6 DB 197,209,114,215,8 ; vpsrld $0x8,%xmm7,%xmm5 DB 196,195,125,25,249,1 ; vextractf128 $0x1,%ymm7,%xmm9 @@ -10770,9 +10816,9 @@ _sk_load_bgra_dst_avx LABEL PROC DB 72,211,232 ; shr %cl,%rax DB 196,225,249,110,224 ; vmovq %rax,%xmm4 DB 196,226,121,48,228 ; vpmovzxbw %xmm4,%xmm4 - DB 196,226,89,0,45,237,47,0,0 ; vpshufb 0x2fed(%rip),%xmm4,%xmm5 # 7e40 <_sk_callback_avx+0x764> + DB 196,226,89,0,45,189,48,0,0 ; vpshufb 0x30bd(%rip),%xmm4,%xmm5 # 7f10 <_sk_callback_avx+0x769> DB 196,226,121,33,237 ; vpmovsxbd %xmm5,%xmm5 - DB 196,226,89,0,37,239,47,0,0 ; vpshufb 0x2fef(%rip),%xmm4,%xmm4 # 7e50 <_sk_callback_avx+0x774> + DB 196,226,89,0,37,191,48,0,0 ; vpshufb 0x30bf(%rip),%xmm4,%xmm4 # 7f20 <_sk_callback_avx+0x779> DB 196,226,121,33,228 ; vpmovsxbd %xmm4,%xmm4 DB 196,227,85,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm4 DB 196,194,93,44,58 ; vmaskmovps (%r10),%ymm4,%ymm7 @@ -10813,10 +10859,10 @@ _sk_gather_bgra_avx LABEL PROC DB 73,193,234,32 ; shr $0x20,%r10 DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3 DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - DB 197,124,40,13,95,48,0,0 ; vmovaps 0x305f(%rip),%ymm9 # 7f80 <_sk_callback_avx+0x8a4> + DB 197,124,40,13,63,49,0,0 ; vmovaps 0x313f(%rip),%ymm9 # 8060 <_sk_callback_avx+0x8b9> DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,21,69,44,0,0 ; vbroadcastss 0x2c45(%rip),%ymm10 # 7b78 <_sk_callback_avx+0x49c> + DB 196,98,125,24,21,13,45,0,0 ; vbroadcastss 0x2d0d(%rip),%ymm10 # 7c40 <_sk_callback_avx+0x499> DB 196,193,124,89,210 ; vmulps %ymm10,%ymm0,%ymm2 DB 196,193,121,114,208,8 ; vpsrld $0x8,%xmm8,%xmm0 DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1 @@ -10845,7 +10891,7 @@ _sk_store_bgra_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 76,3,16 ; add (%rax),%r10 - DB 196,98,125,24,5,206,43,0,0 ; vbroadcastss 0x2bce(%rip),%ymm8 # 7b7c <_sk_callback_avx+0x4a0> + DB 196,98,125,24,5,150,44,0,0 ; vbroadcastss 0x2c96(%rip),%ymm8 # 7c44 <_sk_callback_avx+0x49d> DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10 @@ -10883,9 +10929,9 @@ _sk_store_bgra_avx LABEL PROC DB 72,211,232 ; shr %cl,%rax DB 196,97,249,110,200 ; vmovq %rax,%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 - DB 196,98,49,0,21,248,45,0,0 ; vpshufb 0x2df8(%rip),%xmm9,%xmm10 # 7e60 <_sk_callback_avx+0x784> + DB 196,98,49,0,21,200,46,0,0 ; vpshufb 0x2ec8(%rip),%xmm9,%xmm10 # 7f30 <_sk_callback_avx+0x789> DB 196,66,121,33,210 ; vpmovsxbd %xmm10,%xmm10 - DB 196,98,49,0,13,250,45,0,0 ; vpshufb 0x2dfa(%rip),%xmm9,%xmm9 # 7e70 <_sk_callback_avx+0x794> + DB 196,98,49,0,13,202,46,0,0 ; vpshufb 0x2eca(%rip),%xmm9,%xmm9 # 7f40 <_sk_callback_avx+0x799> DB 196,66,121,33,201 ; vpmovsxbd %xmm9,%xmm9 DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 DB 196,66,53,46,2 ; vmaskmovps %ymm8,%ymm9,(%r10) @@ -10919,13 +10965,13 @@ _sk_load_f16_avx LABEL PROC DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 - DB 196,98,125,24,37,115,42,0,0 ; vbroadcastss 0x2a73(%rip),%ymm12 # 7b80 <_sk_callback_avx+0x4a4> + DB 196,98,125,24,37,59,43,0,0 ; vbroadcastss 0x2b3b(%rip),%ymm12 # 7c48 <_sk_callback_avx+0x4a1> DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1 DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0 DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14 - DB 196,98,121,24,29,95,42,0,0 ; vbroadcastss 0x2a5f(%rip),%xmm11 # 7b84 <_sk_callback_avx+0x4a8> + DB 196,98,121,24,29,39,43,0,0 ; vbroadcastss 0x2b27(%rip),%xmm11 # 7c4c <_sk_callback_avx+0x4a5> DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3 - DB 196,98,121,24,45,85,42,0,0 ; vbroadcastss 0x2a55(%rip),%xmm13 # 7b88 <_sk_callback_avx+0x4ac> + DB 196,98,121,24,45,29,43,0,0 ; vbroadcastss 0x2b1d(%rip),%xmm13 # 7c50 <_sk_callback_avx+0x4a9> DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3 DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10 DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -10939,7 +10985,7 @@ _sk_load_f16_avx LABEL PROC DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0 DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1 - DB 196,226,121,24,29,11,42,0,0 ; vbroadcastss 0x2a0b(%rip),%xmm3 # 7b8c <_sk_callback_avx+0x4b0> + DB 196,226,121,24,29,211,42,0,0 ; vbroadcastss 0x2ad3(%rip),%xmm3 # 7c54 <_sk_callback_avx+0x4ad> DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1 DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 @@ -11084,13 +11130,13 @@ _sk_load_f16_dst_avx LABEL PROC DB 197,217,105,232 ; vpunpckhwd %xmm0,%xmm4,%xmm5 DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4 DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 - DB 196,98,125,24,37,83,39,0,0 ; vbroadcastss 0x2753(%rip),%ymm12 # 7b90 <_sk_callback_avx+0x4b4> + DB 196,98,125,24,37,27,40,0,0 ; vbroadcastss 0x281b(%rip),%ymm12 # 7c58 <_sk_callback_avx+0x4b1> DB 196,193,92,84,236 ; vandps %ymm12,%ymm4,%ymm5 DB 197,220,87,229 ; vxorps %ymm5,%ymm4,%ymm4 DB 196,195,125,25,230,1 ; vextractf128 $0x1,%ymm4,%xmm14 - DB 196,98,121,24,29,63,39,0,0 ; vbroadcastss 0x273f(%rip),%xmm11 # 7b94 <_sk_callback_avx+0x4b8> + DB 196,98,121,24,29,7,40,0,0 ; vbroadcastss 0x2807(%rip),%xmm11 # 7c5c <_sk_callback_avx+0x4b5> DB 196,193,8,87,251 ; vxorps %xmm11,%xmm14,%xmm7 - DB 196,98,121,24,45,53,39,0,0 ; vbroadcastss 0x2735(%rip),%xmm13 # 7b98 <_sk_callback_avx+0x4bc> + DB 196,98,121,24,45,253,39,0,0 ; vbroadcastss 0x27fd(%rip),%xmm13 # 7c60 <_sk_callback_avx+0x4b9> DB 197,145,102,255 ; vpcmpgtd %xmm7,%xmm13,%xmm7 DB 196,65,88,87,211 ; vxorps %xmm11,%xmm4,%xmm10 DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -11104,7 +11150,7 @@ _sk_load_f16_dst_avx LABEL PROC DB 196,227,93,24,231,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm4 DB 197,220,86,229 ; vorps %ymm5,%ymm4,%ymm4 DB 196,227,125,25,229,1 ; vextractf128 $0x1,%ymm4,%xmm5 - DB 196,226,121,24,61,235,38,0,0 ; vbroadcastss 0x26eb(%rip),%xmm7 # 7b9c <_sk_callback_avx+0x4c0> + DB 196,226,121,24,61,179,39,0,0 ; vbroadcastss 0x27b3(%rip),%xmm7 # 7c64 <_sk_callback_avx+0x4bd> DB 197,209,254,239 ; vpaddd %xmm7,%xmm5,%xmm5 DB 197,217,254,231 ; vpaddd %xmm7,%xmm4,%xmm4 DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4 @@ -11278,13 +11324,13 @@ _sk_gather_f16_avx LABEL PROC DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 - DB 196,98,125,24,37,172,35,0,0 ; vbroadcastss 0x23ac(%rip),%ymm12 # 7ba0 <_sk_callback_avx+0x4c4> + DB 196,98,125,24,37,116,36,0,0 ; vbroadcastss 0x2474(%rip),%ymm12 # 7c68 <_sk_callback_avx+0x4c1> DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1 DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0 DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14 - DB 196,98,121,24,29,152,35,0,0 ; vbroadcastss 0x2398(%rip),%xmm11 # 7ba4 <_sk_callback_avx+0x4c8> + DB 196,98,121,24,29,96,36,0,0 ; vbroadcastss 0x2460(%rip),%xmm11 # 7c6c <_sk_callback_avx+0x4c5> DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3 - DB 196,98,121,24,45,142,35,0,0 ; vbroadcastss 0x238e(%rip),%xmm13 # 7ba8 <_sk_callback_avx+0x4cc> + DB 196,98,121,24,45,86,36,0,0 ; vbroadcastss 0x2456(%rip),%xmm13 # 7c70 <_sk_callback_avx+0x4c9> DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3 DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10 DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -11298,7 +11344,7 @@ _sk_gather_f16_avx LABEL PROC DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0 DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1 - DB 196,226,121,24,29,68,35,0,0 ; vbroadcastss 0x2344(%rip),%xmm3 # 7bac <_sk_callback_avx+0x4d0> + DB 196,226,121,24,29,12,36,0,0 ; vbroadcastss 0x240c(%rip),%xmm3 # 7c74 <_sk_callback_avx+0x4cd> DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1 DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 @@ -11396,12 +11442,12 @@ _sk_store_f16_avx LABEL PROC DB 197,252,17,180,36,128,0,0,0 ; vmovups %ymm6,0x80(%rsp) DB 197,252,17,108,36,96 ; vmovups %ymm5,0x60(%rsp) DB 197,252,17,100,36,64 ; vmovups %ymm4,0x40(%rsp) - DB 196,98,125,24,13,88,33,0,0 ; vbroadcastss 0x2158(%rip),%ymm9 # 7bb0 <_sk_callback_avx+0x4d4> + DB 196,98,125,24,13,32,34,0,0 ; vbroadcastss 0x2220(%rip),%ymm9 # 7c78 <_sk_callback_avx+0x4d1> DB 196,65,124,84,209 ; vandps %ymm9,%ymm0,%ymm10 DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp) DB 196,65,124,87,218 ; vxorps %ymm10,%ymm0,%ymm11 DB 196,67,125,25,220,1 ; vextractf128 $0x1,%ymm11,%xmm12 - DB 196,98,121,24,5,62,33,0,0 ; vbroadcastss 0x213e(%rip),%xmm8 # 7bb4 <_sk_callback_avx+0x4d8> + DB 196,98,121,24,5,6,34,0,0 ; vbroadcastss 0x2206(%rip),%xmm8 # 7c7c <_sk_callback_avx+0x4d5> DB 196,65,57,102,236 ; vpcmpgtd %xmm12,%xmm8,%xmm13 DB 196,65,57,102,243 ; vpcmpgtd %xmm11,%xmm8,%xmm14 DB 196,67,13,24,237,1 ; vinsertf128 $0x1,%xmm13,%ymm14,%ymm13 @@ -11411,7 +11457,7 @@ _sk_store_f16_avx LABEL PROC DB 196,67,13,24,242,1 ; vinsertf128 $0x1,%xmm10,%ymm14,%ymm14 DB 196,193,33,114,211,13 ; vpsrld $0xd,%xmm11,%xmm11 DB 196,193,25,114,212,13 ; vpsrld $0xd,%xmm12,%xmm12 - DB 196,98,125,24,21,5,33,0,0 ; vbroadcastss 0x2105(%rip),%ymm10 # 7bb8 <_sk_callback_avx+0x4dc> + DB 196,98,125,24,21,205,33,0,0 ; vbroadcastss 0x21cd(%rip),%ymm10 # 7c80 <_sk_callback_avx+0x4d9> DB 196,65,12,86,242 ; vorps %ymm10,%ymm14,%ymm14 DB 196,67,125,25,247,1 ; vextractf128 $0x1,%ymm14,%xmm15 DB 196,65,1,254,228 ; vpaddd %xmm12,%xmm15,%xmm12 @@ -11554,7 +11600,7 @@ _sk_load_u16_be_avx LABEL PROC DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,29,84,30,0,0 ; vbroadcastss 0x1e54(%rip),%ymm11 # 7bbc <_sk_callback_avx+0x4e0> + DB 196,98,125,24,29,28,31,0,0 ; vbroadcastss 0x1f1c(%rip),%ymm11 # 7c84 <_sk_callback_avx+0x4dd> DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0 DB 197,177,109,202 ; vpunpckhqdq %xmm2,%xmm9,%xmm1 DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2 @@ -11645,7 +11691,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,29,180,28,0,0 ; vbroadcastss 0x1cb4(%rip),%ymm11 # 7bc0 <_sk_callback_avx+0x4e4> + DB 196,98,125,24,29,124,29,0,0 ; vbroadcastss 0x1d7c(%rip),%ymm11 # 7c88 <_sk_callback_avx+0x4e1> DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0 DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1 DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2 @@ -11666,7 +11712,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,81,28,0,0 ; vbroadcastss 0x1c51(%rip),%ymm3 # 7bc4 <_sk_callback_avx+0x4e8> + DB 196,226,125,24,29,25,29,0,0 ; vbroadcastss 0x1d19(%rip),%ymm3 # 7c8c <_sk_callback_avx+0x4e5> DB 255,224 ; jmpq *%rax DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0 DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0 @@ -11707,7 +11753,7 @@ _sk_store_u16_be_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax - DB 196,98,125,24,5,142,27,0,0 ; vbroadcastss 0x1b8e(%rip),%ymm8 # 7bc8 <_sk_callback_avx+0x4ec> + DB 196,98,125,24,5,86,28,0,0 ; vbroadcastss 0x1c56(%rip),%ymm8 # 7c90 <_sk_callback_avx+0x4e9> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10 @@ -11992,7 +12038,7 @@ _sk_mirror_x_avx LABEL PROC DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0 DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0 DB 196,99,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm8 - DB 197,178,89,5,255,22,0,0 ; vmulss 0x16ff(%rip),%xmm9,%xmm0 # 7bcc <_sk_callback_avx+0x4f0> + DB 197,178,89,5,199,23,0,0 ; vmulss 0x17c7(%rip),%xmm9,%xmm0 # 7c94 <_sk_callback_avx+0x4ed> DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0 DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0 @@ -12023,7 +12069,7 @@ _sk_mirror_y_avx LABEL PROC DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1 DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1 DB 196,99,117,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm8 - DB 197,178,89,13,122,22,0,0 ; vmulss 0x167a(%rip),%xmm9,%xmm1 # 7bd0 <_sk_callback_avx+0x4f4> + DB 197,178,89,13,66,23,0,0 ; vmulss 0x1742(%rip),%xmm9,%xmm1 # 7c98 <_sk_callback_avx+0x4f1> DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1 DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1 DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1 @@ -12047,7 +12093,7 @@ PUBLIC _sk_clamp_x_1_avx _sk_clamp_x_1_avx LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0 - DB 196,98,125,24,5,24,22,0,0 ; vbroadcastss 0x1618(%rip),%ymm8 # 7bd4 <_sk_callback_avx+0x4f8> + DB 196,98,125,24,5,224,22,0,0 ; vbroadcastss 0x16e0(%rip),%ymm8 # 7c9c <_sk_callback_avx+0x4f5> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -12061,9 +12107,9 @@ _sk_repeat_x_1_avx LABEL PROC PUBLIC _sk_mirror_x_1_avx _sk_mirror_x_1_avx LABEL PROC - DB 196,98,125,24,5,251,21,0,0 ; vbroadcastss 0x15fb(%rip),%ymm8 # 7bd8 <_sk_callback_avx+0x4fc> + DB 196,98,125,24,5,195,22,0,0 ; vbroadcastss 0x16c3(%rip),%ymm8 # 7ca0 <_sk_callback_avx+0x4f9> DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,13,241,21,0,0 ; vbroadcastss 0x15f1(%rip),%ymm9 # 7bdc <_sk_callback_avx+0x500> + DB 196,98,125,24,13,185,22,0,0 ; vbroadcastss 0x16b9(%rip),%ymm9 # 7ca4 <_sk_callback_avx+0x4fd> DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9 DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9 DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9 @@ -12077,12 +12123,12 @@ _sk_mirror_x_1_avx LABEL PROC PUBLIC _sk_luminance_to_alpha_avx _sk_luminance_to_alpha_avx LABEL PROC - DB 196,226,125,24,29,193,21,0,0 ; vbroadcastss 0x15c1(%rip),%ymm3 # 7be0 <_sk_callback_avx+0x504> + DB 196,226,125,24,29,137,22,0,0 ; vbroadcastss 0x1689(%rip),%ymm3 # 7ca8 <_sk_callback_avx+0x501> DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0 - DB 196,226,125,24,29,184,21,0,0 ; vbroadcastss 0x15b8(%rip),%ymm3 # 7be4 <_sk_callback_avx+0x508> + DB 196,226,125,24,29,128,22,0,0 ; vbroadcastss 0x1680(%rip),%ymm3 # 7cac <_sk_callback_avx+0x505> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,171,21,0,0 ; vbroadcastss 0x15ab(%rip),%ymm1 # 7be8 <_sk_callback_avx+0x50c> + DB 196,226,125,24,13,115,22,0,0 ; vbroadcastss 0x1673(%rip),%ymm1 # 7cb0 <_sk_callback_avx+0x509> DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1 DB 197,252,88,217 ; vaddps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -12450,18 +12496,18 @@ _sk_evenly_spaced_gradient_avx LABEL PROC PUBLIC _sk_gauss_a_to_rgba_avx _sk_gauss_a_to_rgba_avx LABEL PROC - DB 196,226,125,24,5,212,14,0,0 ; vbroadcastss 0xed4(%rip),%ymm0 # 7bec <_sk_callback_avx+0x510> + DB 196,226,125,24,5,156,15,0,0 ; vbroadcastss 0xf9c(%rip),%ymm0 # 7cb4 <_sk_callback_avx+0x50d> DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0 - DB 196,226,125,24,13,203,14,0,0 ; vbroadcastss 0xecb(%rip),%ymm1 # 7bf0 <_sk_callback_avx+0x514> + DB 196,226,125,24,13,147,15,0,0 ; vbroadcastss 0xf93(%rip),%ymm1 # 7cb8 <_sk_callback_avx+0x511> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0 - DB 196,226,125,24,13,190,14,0,0 ; vbroadcastss 0xebe(%rip),%ymm1 # 7bf4 <_sk_callback_avx+0x518> + DB 196,226,125,24,13,134,15,0,0 ; vbroadcastss 0xf86(%rip),%ymm1 # 7cbc <_sk_callback_avx+0x515> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0 - DB 196,226,125,24,13,177,14,0,0 ; vbroadcastss 0xeb1(%rip),%ymm1 # 7bf8 <_sk_callback_avx+0x51c> + DB 196,226,125,24,13,121,15,0,0 ; vbroadcastss 0xf79(%rip),%ymm1 # 7cc0 <_sk_callback_avx+0x519> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0 - DB 196,226,125,24,13,164,14,0,0 ; vbroadcastss 0xea4(%rip),%ymm1 # 7bfc <_sk_callback_avx+0x520> + DB 196,226,125,24,13,108,15,0,0 ; vbroadcastss 0xf6c(%rip),%ymm1 # 7cc4 <_sk_callback_avx+0x51d> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 @@ -12488,7 +12534,7 @@ _sk_gradient_avx LABEL PROC DB 73,255,201 ; dec %r9 DB 72,131,195,4 ; add $0x4,%rbx DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9 - DB 196,98,125,24,21,89,14,0,0 ; vbroadcastss 0xe59(%rip),%ymm10 # 7c00 <_sk_callback_avx+0x524> + DB 196,98,125,24,21,33,15,0,0 ; vbroadcastss 0xf21(%rip),%ymm10 # 7cc8 <_sk_callback_avx+0x521> DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 DB 196,98,125,24,3 ; vbroadcastss (%rbx),%ymm8 DB 197,60,194,192,2 ; vcmpleps %ymm0,%ymm8,%ymm8 @@ -12680,27 +12726,27 @@ _sk_xy_to_unit_angle_avx LABEL PROC DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12 DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11 DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12 - DB 196,98,125,24,45,76,10,0,0 ; vbroadcastss 0xa4c(%rip),%ymm13 # 7c04 <_sk_callback_avx+0x528> + DB 196,98,125,24,45,20,11,0,0 ; vbroadcastss 0xb14(%rip),%ymm13 # 7ccc <_sk_callback_avx+0x525> DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13 - DB 196,98,125,24,53,66,10,0,0 ; vbroadcastss 0xa42(%rip),%ymm14 # 7c08 <_sk_callback_avx+0x52c> + DB 196,98,125,24,53,10,11,0,0 ; vbroadcastss 0xb0a(%rip),%ymm14 # 7cd0 <_sk_callback_avx+0x529> DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13 DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13 - DB 196,98,125,24,53,51,10,0,0 ; vbroadcastss 0xa33(%rip),%ymm14 # 7c0c <_sk_callback_avx+0x530> + DB 196,98,125,24,53,251,10,0,0 ; vbroadcastss 0xafb(%rip),%ymm14 # 7cd4 <_sk_callback_avx+0x52d> DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13 DB 196,65,28,89,229 ; vmulps %ymm13,%ymm12,%ymm12 - DB 196,98,125,24,45,36,10,0,0 ; vbroadcastss 0xa24(%rip),%ymm13 # 7c10 <_sk_callback_avx+0x534> + DB 196,98,125,24,45,236,10,0,0 ; vbroadcastss 0xaec(%rip),%ymm13 # 7cd8 <_sk_callback_avx+0x531> DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12 DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9 - DB 196,98,125,24,21,15,10,0,0 ; vbroadcastss 0xa0f(%rip),%ymm10 # 7c14 <_sk_callback_avx+0x538> + DB 196,98,125,24,21,215,10,0,0 ; vbroadcastss 0xad7(%rip),%ymm10 # 7cdc <_sk_callback_avx+0x535> DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10 DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9 DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,21,249,9,0,0 ; vbroadcastss 0x9f9(%rip),%ymm10 # 7c18 <_sk_callback_avx+0x53c> + DB 196,98,125,24,21,193,10,0,0 ; vbroadcastss 0xac1(%rip),%ymm10 # 7ce0 <_sk_callback_avx+0x539> DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10 DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0 DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9 - DB 196,98,125,24,21,227,9,0,0 ; vbroadcastss 0x9e3(%rip),%ymm10 # 7c1c <_sk_callback_avx+0x540> + DB 196,98,125,24,21,171,10,0,0 ; vbroadcastss 0xaab(%rip),%ymm10 # 7ce4 <_sk_callback_avx+0x53d> DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10 DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0 DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9 @@ -12717,16 +12763,16 @@ _sk_xy_to_radius_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax -PUBLIC _sk_xy_to_2pt_conical_avx -_sk_xy_to_2pt_conical_avx LABEL PROC +PUBLIC _sk_xy_to_2pt_conical_quadratic_avx +_sk_xy_to_2pt_conical_quadratic_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,0 ; vbroadcastss (%rax),%ymm8 - DB 197,122,16,72,8 ; vmovss 0x8(%rax),%xmm9 - DB 197,50,89,80,12 ; vmulss 0xc(%rax),%xmm9,%xmm10 + DB 196,98,125,24,64,32 ; vbroadcastss 0x20(%rax),%ymm8 + DB 197,122,16,72,40 ; vmovss 0x28(%rax),%xmm9 + DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10 DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10 DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10 DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10 - DB 196,98,125,24,29,142,9,0,0 ; vbroadcastss 0x98e(%rip),%ymm11 # 7c20 <_sk_callback_avx+0x544> + DB 196,98,125,24,29,85,10,0,0 ; vbroadcastss 0xa55(%rip),%ymm11 # 7ce8 <_sk_callback_avx+0x541> DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0 DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11 @@ -12735,18 +12781,18 @@ _sk_xy_to_2pt_conical_avx LABEL PROC DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0 DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0 - DB 196,98,125,24,13,98,9,0,0 ; vbroadcastss 0x962(%rip),%ymm9 # 7c24 <_sk_callback_avx+0x548> + DB 196,98,125,24,13,41,10,0,0 ; vbroadcastss 0xa29(%rip),%ymm9 # 7cec <_sk_callback_avx+0x545> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8 DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0 DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0 - DB 196,98,125,24,64,4 ; vbroadcastss 0x4(%rax),%ymm8 - DB 196,98,125,24,13,64,9,0,0 ; vbroadcastss 0x940(%rip),%ymm9 # 7c28 <_sk_callback_avx+0x54c> + DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8 + DB 196,98,125,24,13,7,10,0,0 ; vbroadcastss 0xa07(%rip),%ymm9 # 7cf0 <_sk_callback_avx+0x549> DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9 DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10 DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10 - DB 196,98,125,24,29,44,9,0,0 ; vbroadcastss 0x92c(%rip),%ymm11 # 7c2c <_sk_callback_avx+0x550> + DB 196,98,125,24,29,243,9,0,0 ; vbroadcastss 0x9f3(%rip),%ymm11 # 7cf4 <_sk_callback_avx+0x54d> DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 @@ -12755,10 +12801,58 @@ _sk_xy_to_2pt_conical_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax +PUBLIC _sk_xy_to_2pt_conical_linear_avx +_sk_xy_to_2pt_conical_linear_avx LABEL PROC + DB 72,173 ; lods %ds:(%rsi),%rax + DB 197,122,16,64,40 ; vmovss 0x28(%rax),%xmm8 + DB 197,122,16,72,44 ; vmovss 0x2c(%rax),%xmm9 + DB 196,65,50,89,208 ; vmulss %xmm8,%xmm9,%xmm10 + DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10 + DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10 + DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10 + DB 196,98,125,24,29,179,9,0,0 ; vbroadcastss 0x9b3(%rip),%ymm11 # 7cf8 <_sk_callback_avx+0x551> + DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 + DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0 + DB 197,244,89,201 ; vmulps %ymm1,%ymm1,%ymm1 + DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 + DB 196,193,58,89,200 ; vmulss %xmm8,%xmm8,%xmm1 + DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1 + DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1 + DB 197,252,92,193 ; vsubps %ymm1,%ymm0,%ymm0 + DB 196,226,125,24,13,136,9,0,0 ; vbroadcastss 0x988(%rip),%ymm1 # 7cfc <_sk_callback_avx+0x555> + DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0 + DB 196,193,124,94,194 ; vdivps %ymm10,%ymm0,%ymm0 + DB 196,193,121,112,201,0 ; vpshufd $0x0,%xmm9,%xmm1 + DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1 + DB 196,65,121,112,192,0 ; vpshufd $0x0,%xmm8,%xmm8 + DB 196,67,61,24,192,1 ; vinsertf128 $0x1,%xmm8,%ymm8,%ymm8 + DB 197,244,89,200 ; vmulps %ymm0,%ymm1,%ymm1 + DB 197,188,88,201 ; vaddps %ymm1,%ymm8,%ymm1 + DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 + DB 196,193,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm1 + DB 196,98,125,24,13,79,9,0,0 ; vbroadcastss 0x94f(%rip),%ymm9 # 7d00 <_sk_callback_avx+0x559> + DB 196,195,53,74,200,16 ; vblendvps %ymm1,%ymm8,%ymm9,%ymm1 + DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9 + DB 196,195,117,74,200,144 ; vblendvps %ymm9,%ymm8,%ymm1,%ymm1 + DB 197,252,17,8 ; vmovups %ymm1,(%rax) + DB 72,173 ; lods %ds:(%rsi),%rax + DB 255,224 ; jmpq *%rax + +PUBLIC _sk_vector_scale_avx +_sk_vector_scale_avx LABEL PROC + DB 72,173 ; lods %ds:(%rsi),%rax + DB 197,124,16,0 ; vmovups (%rax),%ymm8 + DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 + DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 + DB 197,188,89,210 ; vmulps %ymm2,%ymm8,%ymm2 + DB 197,188,89,219 ; vmulps %ymm3,%ymm8,%ymm3 + DB 72,173 ; lods %ds:(%rsi),%rax + DB 255,224 ; jmpq *%rax + PUBLIC _sk_save_xy_avx _sk_save_xy_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,11,9,0,0 ; vbroadcastss 0x90b(%rip),%ymm8 # 7c30 <_sk_callback_avx+0x554> + DB 196,98,125,24,5,20,9,0,0 ; vbroadcastss 0x914(%rip),%ymm8 # 7d04 <_sk_callback_avx+0x55d> DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9 DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10 DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9 @@ -12791,9 +12885,9 @@ _sk_accumulate_avx LABEL PROC PUBLIC _sk_bilinear_nx_avx _sk_bilinear_nx_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,151,8,0,0 ; vbroadcastss 0x897(%rip),%ymm0 # 7c34 <_sk_callback_avx+0x558> + DB 196,226,125,24,5,160,8,0,0 ; vbroadcastss 0x8a0(%rip),%ymm0 # 7d08 <_sk_callback_avx+0x561> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,142,8,0,0 ; vbroadcastss 0x88e(%rip),%ymm8 # 7c38 <_sk_callback_avx+0x55c> + DB 196,98,125,24,5,151,8,0,0 ; vbroadcastss 0x897(%rip),%ymm8 # 7d0c <_sk_callback_avx+0x565> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -12802,7 +12896,7 @@ _sk_bilinear_nx_avx LABEL PROC PUBLIC _sk_bilinear_px_avx _sk_bilinear_px_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,118,8,0,0 ; vbroadcastss 0x876(%rip),%ymm0 # 7c3c <_sk_callback_avx+0x560> + DB 196,226,125,24,5,127,8,0,0 ; vbroadcastss 0x87f(%rip),%ymm0 # 7d10 <_sk_callback_avx+0x569> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -12812,9 +12906,9 @@ _sk_bilinear_px_avx LABEL PROC PUBLIC _sk_bilinear_ny_avx _sk_bilinear_ny_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,90,8,0,0 ; vbroadcastss 0x85a(%rip),%ymm1 # 7c40 <_sk_callback_avx+0x564> + DB 196,226,125,24,13,99,8,0,0 ; vbroadcastss 0x863(%rip),%ymm1 # 7d14 <_sk_callback_avx+0x56d> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,80,8,0,0 ; vbroadcastss 0x850(%rip),%ymm8 # 7c44 <_sk_callback_avx+0x568> + DB 196,98,125,24,5,89,8,0,0 ; vbroadcastss 0x859(%rip),%ymm8 # 7d18 <_sk_callback_avx+0x571> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -12823,7 +12917,7 @@ _sk_bilinear_ny_avx LABEL PROC PUBLIC _sk_bilinear_py_avx _sk_bilinear_py_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,56,8,0,0 ; vbroadcastss 0x838(%rip),%ymm1 # 7c48 <_sk_callback_avx+0x56c> + DB 196,226,125,24,13,65,8,0,0 ; vbroadcastss 0x841(%rip),%ymm1 # 7d1c <_sk_callback_avx+0x575> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -12833,14 +12927,14 @@ _sk_bilinear_py_avx LABEL PROC PUBLIC _sk_bicubic_n3x_avx _sk_bicubic_n3x_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,27,8,0,0 ; vbroadcastss 0x81b(%rip),%ymm0 # 7c4c <_sk_callback_avx+0x570> + DB 196,226,125,24,5,36,8,0,0 ; vbroadcastss 0x824(%rip),%ymm0 # 7d20 <_sk_callback_avx+0x579> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,18,8,0,0 ; vbroadcastss 0x812(%rip),%ymm8 # 7c50 <_sk_callback_avx+0x574> + DB 196,98,125,24,5,27,8,0,0 ; vbroadcastss 0x81b(%rip),%ymm8 # 7d24 <_sk_callback_avx+0x57d> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,3,8,0,0 ; vbroadcastss 0x803(%rip),%ymm10 # 7c54 <_sk_callback_avx+0x578> + DB 196,98,125,24,21,12,8,0,0 ; vbroadcastss 0x80c(%rip),%ymm10 # 7d28 <_sk_callback_avx+0x581> DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 - DB 196,98,125,24,21,249,7,0,0 ; vbroadcastss 0x7f9(%rip),%ymm10 # 7c58 <_sk_callback_avx+0x57c> + DB 196,98,125,24,21,2,8,0,0 ; vbroadcastss 0x802(%rip),%ymm10 # 7d2c <_sk_callback_avx+0x585> DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -12850,19 +12944,19 @@ _sk_bicubic_n3x_avx LABEL PROC PUBLIC _sk_bicubic_n1x_avx _sk_bicubic_n1x_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,220,7,0,0 ; vbroadcastss 0x7dc(%rip),%ymm0 # 7c5c <_sk_callback_avx+0x580> + DB 196,226,125,24,5,229,7,0,0 ; vbroadcastss 0x7e5(%rip),%ymm0 # 7d30 <_sk_callback_avx+0x589> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,211,7,0,0 ; vbroadcastss 0x7d3(%rip),%ymm8 # 7c60 <_sk_callback_avx+0x584> + DB 196,98,125,24,5,220,7,0,0 ; vbroadcastss 0x7dc(%rip),%ymm8 # 7d34 <_sk_callback_avx+0x58d> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 - DB 196,98,125,24,13,201,7,0,0 ; vbroadcastss 0x7c9(%rip),%ymm9 # 7c64 <_sk_callback_avx+0x588> + DB 196,98,125,24,13,210,7,0,0 ; vbroadcastss 0x7d2(%rip),%ymm9 # 7d38 <_sk_callback_avx+0x591> DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9 - DB 196,98,125,24,21,191,7,0,0 ; vbroadcastss 0x7bf(%rip),%ymm10 # 7c68 <_sk_callback_avx+0x58c> + DB 196,98,125,24,21,200,7,0,0 ; vbroadcastss 0x7c8(%rip),%ymm10 # 7d3c <_sk_callback_avx+0x595> DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9 DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9 - DB 196,98,125,24,21,176,7,0,0 ; vbroadcastss 0x7b0(%rip),%ymm10 # 7c6c <_sk_callback_avx+0x590> + DB 196,98,125,24,21,185,7,0,0 ; vbroadcastss 0x7b9(%rip),%ymm10 # 7d40 <_sk_callback_avx+0x599> DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9 DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 - DB 196,98,125,24,13,161,7,0,0 ; vbroadcastss 0x7a1(%rip),%ymm9 # 7c70 <_sk_callback_avx+0x594> + DB 196,98,125,24,13,170,7,0,0 ; vbroadcastss 0x7aa(%rip),%ymm9 # 7d44 <_sk_callback_avx+0x59d> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -12871,17 +12965,17 @@ _sk_bicubic_n1x_avx LABEL PROC PUBLIC _sk_bicubic_p1x_avx _sk_bicubic_p1x_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,137,7,0,0 ; vbroadcastss 0x789(%rip),%ymm8 # 7c74 <_sk_callback_avx+0x598> + DB 196,98,125,24,5,146,7,0,0 ; vbroadcastss 0x792(%rip),%ymm8 # 7d48 <_sk_callback_avx+0x5a1> DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0 DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9 - DB 196,98,125,24,21,123,7,0,0 ; vbroadcastss 0x77b(%rip),%ymm10 # 7c78 <_sk_callback_avx+0x59c> + DB 196,98,125,24,21,132,7,0,0 ; vbroadcastss 0x784(%rip),%ymm10 # 7d4c <_sk_callback_avx+0x5a5> DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10 - DB 196,98,125,24,29,113,7,0,0 ; vbroadcastss 0x771(%rip),%ymm11 # 7c7c <_sk_callback_avx+0x5a0> + DB 196,98,125,24,29,122,7,0,0 ; vbroadcastss 0x77a(%rip),%ymm11 # 7d50 <_sk_callback_avx+0x5a9> DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10 DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10 DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 - DB 196,98,125,24,13,88,7,0,0 ; vbroadcastss 0x758(%rip),%ymm9 # 7c80 <_sk_callback_avx+0x5a4> + DB 196,98,125,24,13,97,7,0,0 ; vbroadcastss 0x761(%rip),%ymm9 # 7d54 <_sk_callback_avx+0x5ad> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -12890,13 +12984,13 @@ _sk_bicubic_p1x_avx LABEL PROC PUBLIC _sk_bicubic_p3x_avx _sk_bicubic_p3x_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,64,7,0,0 ; vbroadcastss 0x740(%rip),%ymm0 # 7c84 <_sk_callback_avx+0x5a8> + DB 196,226,125,24,5,73,7,0,0 ; vbroadcastss 0x749(%rip),%ymm0 # 7d58 <_sk_callback_avx+0x5b1> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,45,7,0,0 ; vbroadcastss 0x72d(%rip),%ymm10 # 7c88 <_sk_callback_avx+0x5ac> + DB 196,98,125,24,21,54,7,0,0 ; vbroadcastss 0x736(%rip),%ymm10 # 7d5c <_sk_callback_avx+0x5b5> DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 - DB 196,98,125,24,21,35,7,0,0 ; vbroadcastss 0x723(%rip),%ymm10 # 7c8c <_sk_callback_avx+0x5b0> + DB 196,98,125,24,21,44,7,0,0 ; vbroadcastss 0x72c(%rip),%ymm10 # 7d60 <_sk_callback_avx+0x5b9> DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -12906,14 +13000,14 @@ _sk_bicubic_p3x_avx LABEL PROC PUBLIC _sk_bicubic_n3y_avx _sk_bicubic_n3y_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,6,7,0,0 ; vbroadcastss 0x706(%rip),%ymm1 # 7c90 <_sk_callback_avx+0x5b4> + DB 196,226,125,24,13,15,7,0,0 ; vbroadcastss 0x70f(%rip),%ymm1 # 7d64 <_sk_callback_avx+0x5bd> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,252,6,0,0 ; vbroadcastss 0x6fc(%rip),%ymm8 # 7c94 <_sk_callback_avx+0x5b8> + DB 196,98,125,24,5,5,7,0,0 ; vbroadcastss 0x705(%rip),%ymm8 # 7d68 <_sk_callback_avx+0x5c1> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,237,6,0,0 ; vbroadcastss 0x6ed(%rip),%ymm10 # 7c98 <_sk_callback_avx+0x5bc> + DB 196,98,125,24,21,246,6,0,0 ; vbroadcastss 0x6f6(%rip),%ymm10 # 7d6c <_sk_callback_avx+0x5c5> DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 - DB 196,98,125,24,21,227,6,0,0 ; vbroadcastss 0x6e3(%rip),%ymm10 # 7c9c <_sk_callback_avx+0x5c0> + DB 196,98,125,24,21,236,6,0,0 ; vbroadcastss 0x6ec(%rip),%ymm10 # 7d70 <_sk_callback_avx+0x5c9> DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -12923,19 +13017,19 @@ _sk_bicubic_n3y_avx LABEL PROC PUBLIC _sk_bicubic_n1y_avx _sk_bicubic_n1y_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,198,6,0,0 ; vbroadcastss 0x6c6(%rip),%ymm1 # 7ca0 <_sk_callback_avx+0x5c4> + DB 196,226,125,24,13,207,6,0,0 ; vbroadcastss 0x6cf(%rip),%ymm1 # 7d74 <_sk_callback_avx+0x5cd> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,188,6,0,0 ; vbroadcastss 0x6bc(%rip),%ymm8 # 7ca4 <_sk_callback_avx+0x5c8> + DB 196,98,125,24,5,197,6,0,0 ; vbroadcastss 0x6c5(%rip),%ymm8 # 7d78 <_sk_callback_avx+0x5d1> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 - DB 196,98,125,24,13,178,6,0,0 ; vbroadcastss 0x6b2(%rip),%ymm9 # 7ca8 <_sk_callback_avx+0x5cc> + DB 196,98,125,24,13,187,6,0,0 ; vbroadcastss 0x6bb(%rip),%ymm9 # 7d7c <_sk_callback_avx+0x5d5> DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9 - DB 196,98,125,24,21,168,6,0,0 ; vbroadcastss 0x6a8(%rip),%ymm10 # 7cac <_sk_callback_avx+0x5d0> + DB 196,98,125,24,21,177,6,0,0 ; vbroadcastss 0x6b1(%rip),%ymm10 # 7d80 <_sk_callback_avx+0x5d9> DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9 DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9 - DB 196,98,125,24,21,153,6,0,0 ; vbroadcastss 0x699(%rip),%ymm10 # 7cb0 <_sk_callback_avx+0x5d4> + DB 196,98,125,24,21,162,6,0,0 ; vbroadcastss 0x6a2(%rip),%ymm10 # 7d84 <_sk_callback_avx+0x5dd> DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9 DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 - DB 196,98,125,24,13,138,6,0,0 ; vbroadcastss 0x68a(%rip),%ymm9 # 7cb4 <_sk_callback_avx+0x5d8> + DB 196,98,125,24,13,147,6,0,0 ; vbroadcastss 0x693(%rip),%ymm9 # 7d88 <_sk_callback_avx+0x5e1> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -12944,17 +13038,17 @@ _sk_bicubic_n1y_avx LABEL PROC PUBLIC _sk_bicubic_p1y_avx _sk_bicubic_p1y_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,114,6,0,0 ; vbroadcastss 0x672(%rip),%ymm8 # 7cb8 <_sk_callback_avx+0x5dc> + DB 196,98,125,24,5,123,6,0,0 ; vbroadcastss 0x67b(%rip),%ymm8 # 7d8c <_sk_callback_avx+0x5e5> DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1 DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9 - DB 196,98,125,24,21,99,6,0,0 ; vbroadcastss 0x663(%rip),%ymm10 # 7cbc <_sk_callback_avx+0x5e0> + DB 196,98,125,24,21,108,6,0,0 ; vbroadcastss 0x66c(%rip),%ymm10 # 7d90 <_sk_callback_avx+0x5e9> DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10 - DB 196,98,125,24,29,89,6,0,0 ; vbroadcastss 0x659(%rip),%ymm11 # 7cc0 <_sk_callback_avx+0x5e4> + DB 196,98,125,24,29,98,6,0,0 ; vbroadcastss 0x662(%rip),%ymm11 # 7d94 <_sk_callback_avx+0x5ed> DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10 DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10 DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 - DB 196,98,125,24,13,64,6,0,0 ; vbroadcastss 0x640(%rip),%ymm9 # 7cc4 <_sk_callback_avx+0x5e8> + DB 196,98,125,24,13,73,6,0,0 ; vbroadcastss 0x649(%rip),%ymm9 # 7d98 <_sk_callback_avx+0x5f1> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -12963,13 +13057,13 @@ _sk_bicubic_p1y_avx LABEL PROC PUBLIC _sk_bicubic_p3y_avx _sk_bicubic_p3y_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,40,6,0,0 ; vbroadcastss 0x628(%rip),%ymm1 # 7cc8 <_sk_callback_avx+0x5ec> + DB 196,226,125,24,13,49,6,0,0 ; vbroadcastss 0x631(%rip),%ymm1 # 7d9c <_sk_callback_avx+0x5f5> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,20,6,0,0 ; vbroadcastss 0x614(%rip),%ymm10 # 7ccc <_sk_callback_avx+0x5f0> + DB 196,98,125,24,21,29,6,0,0 ; vbroadcastss 0x61d(%rip),%ymm10 # 7da0 <_sk_callback_avx+0x5f9> DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 - DB 196,98,125,24,21,10,6,0,0 ; vbroadcastss 0x60a(%rip),%ymm10 # 7cd0 <_sk_callback_avx+0x5f4> + DB 196,98,125,24,21,19,6,0,0 ; vbroadcastss 0x613(%rip),%ymm10 # 7da4 <_sk_callback_avx+0x5fd> DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -13091,25 +13185,25 @@ ALIGN 4 DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 78b9 <.literal4+0xb1> + DB 71,225,61 ; rex.RXB loope 7981 <.literal4+0xb1> DB 0,0 ; add %al,(%rax) DB 128,63,154 ; cmpb $0x9a,(%rdi) DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 78c9 <.literal4+0xc1> + DB 71,225,61 ; rex.RXB loope 7991 <.literal4+0xc1> DB 0,0 ; add %al,(%rax) DB 128,63,154 ; cmpb $0x9a,(%rdi) DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 78d9 <.literal4+0xd1> + DB 71,225,61 ; rex.RXB loope 79a1 <.literal4+0xd1> DB 0,0 ; add %al,(%rax) DB 128,63,154 ; cmpb $0x9a,(%rdi) DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 78e9 <.literal4+0xe1> + DB 71,225,61 ; rex.RXB loope 79b1 <.literal4+0xe1> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax) @@ -13173,7 +13267,7 @@ ALIGN 4 DB 190,129,128,128,59 ; mov $0x3b808081,%esi DB 129,128,128,59,0,248,0,0,8,33 ; addl $0x21080000,-0x7ffc480(%rax) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 7955 <.literal4+0x14d> + DB 224,7 ; loopne 7a1d <.literal4+0x14d> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -13189,10 +13283,10 @@ ALIGN 4 DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax) DB 0,52,255 ; add %dh,(%rdi,%rdi,8) DB 255 ; (bad) - DB 127,0 ; jg 797c <.literal4+0x174> + DB 127,0 ; jg 7a44 <.literal4+0x174> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 79f5 <.literal4+0x1ed> + DB 119,115 ; ja 7abd <.literal4+0x1ed> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -13206,10 +13300,10 @@ ALIGN 4 DB 0,128,63,0,0,0 ; add %al,0x3f(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 79b0 <.literal4+0x1a8> + DB 127,0 ; jg 7a78 <.literal4+0x1a8> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 7a29 <.literal4+0x221> + DB 119,115 ; ja 7af1 <.literal4+0x221> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -13223,10 +13317,10 @@ ALIGN 4 DB 0,128,63,0,0,0 ; add %al,0x3f(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 79e4 <.literal4+0x1dc> + DB 127,0 ; jg 7aac <.literal4+0x1dc> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 7a5d <.literal4+0x255> + DB 119,115 ; ja 7b25 <.literal4+0x255> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -13240,10 +13334,10 @@ ALIGN 4 DB 0,128,63,0,0,0 ; add %al,0x3f(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 7a18 <.literal4+0x210> + DB 127,0 ; jg 7ae0 <.literal4+0x210> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 7a91 <.literal4+0x289> + DB 119,115 ; ja 7b59 <.literal4+0x289> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -13256,7 +13350,7 @@ ALIGN 4 DB 0,75,0 ; add %cl,0x0(%rbx) DB 0,128,63,0,0,200 ; add %al,-0x37ffffc1(%rax) DB 66,0,0 ; rex.X add %al,(%rax) - DB 127,67 ; jg 7a8f <.literal4+0x287> + DB 127,67 ; jg 7b57 <.literal4+0x287> DB 0,0 ; add %al,(%rax) DB 0,195 ; add %al,%bl DB 0,0 ; add %al,(%rax) @@ -13268,7 +13362,7 @@ ALIGN 4 DB 190,80,128,3,62 ; mov $0x3e038050,%esi DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 7aaf <.literal4+0x2a7> + DB 118,63 ; jbe 7b77 <.literal4+0x2a7> DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax) DB 128,59,0 ; cmpb $0x0,(%rbx) @@ -13283,7 +13377,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 7ab1 <.literal4+0x2a9> + DB 224,7 ; loopne 7b79 <.literal4+0x2a9> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -13295,7 +13389,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 7acd <.literal4+0x2c5> + DB 224,7 ; loopne 7b95 <.literal4+0x2c5> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -13307,7 +13401,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 7ae9 <.literal4+0x2e1> + DB 224,7 ; loopne 7bb1 <.literal4+0x2e1> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -13318,7 +13412,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 248 ; clc DB 65,0,0 ; add %al,(%r8) - DB 124,66 ; jl 7b3e <.literal4+0x336> + DB 124,66 ; jl 7c06 <.literal4+0x336> DB 0,240 ; add %dh,%al DB 0,0 ; add %al,(%rax) DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax) @@ -13344,7 +13438,7 @@ ALIGN 4 DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax) DB 0,0 ; add %al,(%rax) DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax) - DB 112,65 ; jo 7ba1 <.literal4+0x399> + DB 112,65 ; jo 7c69 <.literal4+0x399> DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax) DB 128,59,0 ; cmpb $0x0,(%rbx) DB 0,127,67 ; add %bh,0x43(%rdi) @@ -13370,7 +13464,7 @@ ALIGN 4 DB 0,128,55,0,0,128 ; add %al,-0x7fffffc9(%rax) DB 63 ; (bad) DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 7c13 <.literal4+0x40b> + DB 127,71 ; jg 7cdb <.literal4+0x40b> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -13412,6 +13506,10 @@ ALIGN 4 DB 128,0,0 ; addb $0x0,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) + DB 0,192 ; add %al,%al + DB 0,0 ; add %al,(%rax) + DB 0,128,0,0,128,63 ; add %al,0x3f800000(%rax) + DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,191,0,0,128,63 ; add %bh,0x3f800000(%rdi) @@ -13916,7 +14014,7 @@ _sk_seed_shader_sse41 LABEL PROC DB 102,15,110,194 ; movd %edx,%xmm0 DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0 DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1 - DB 15,40,21,232,89,0,0 ; movaps 0x59e8(%rip),%xmm2 # 5b10 <_sk_callback_sse41+0xcb> + DB 15,40,21,168,90,0,0 ; movaps 0x5aa8(%rip),%xmm2 # 5bd0 <_sk_callback_sse41+0xda> DB 15,88,202 ; addps %xmm2,%xmm1 DB 15,16,7 ; movups (%rdi),%xmm0 DB 15,88,193 ; addps %xmm1,%xmm0 @@ -13925,7 +14023,7 @@ _sk_seed_shader_sse41 LABEL PROC DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 15,88,202 ; addps %xmm2,%xmm1 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,21,215,89,0,0 ; movaps 0x59d7(%rip),%xmm2 # 5b20 <_sk_callback_sse41+0xdb> + DB 15,40,21,151,90,0,0 ; movaps 0x5a97(%rip),%xmm2 # 5be0 <_sk_callback_sse41+0xea> DB 15,87,219 ; xorps %xmm3,%xmm3 DB 15,87,228 ; xorps %xmm4,%xmm4 DB 15,87,237 ; xorps %xmm5,%xmm5 @@ -13943,14 +14041,14 @@ _sk_dither_sse41 LABEL PROC DB 102,68,15,110,193 ; movd %ecx,%xmm8 DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8 DB 102,69,15,239,193 ; pxor %xmm9,%xmm8 - DB 102,68,15,111,21,165,89,0,0 ; movdqa 0x59a5(%rip),%xmm10 # 5b30 <_sk_callback_sse41+0xeb> + DB 102,68,15,111,21,101,90,0,0 ; movdqa 0x5a65(%rip),%xmm10 # 5bf0 <_sk_callback_sse41+0xfa> DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11 DB 102,69,15,219,218 ; pand %xmm10,%xmm11 DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11 DB 102,69,15,219,209 ; pand %xmm9,%xmm10 DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10 - DB 102,68,15,111,37,145,89,0,0 ; movdqa 0x5991(%rip),%xmm12 # 5b40 <_sk_callback_sse41+0xfb> - DB 102,68,15,111,45,152,89,0,0 ; movdqa 0x5998(%rip),%xmm13 # 5b50 <_sk_callback_sse41+0x10b> + DB 102,68,15,111,37,81,90,0,0 ; movdqa 0x5a51(%rip),%xmm12 # 5c00 <_sk_callback_sse41+0x10a> + DB 102,68,15,111,45,88,90,0,0 ; movdqa 0x5a58(%rip),%xmm13 # 5c10 <_sk_callback_sse41+0x11a> DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14 DB 102,69,15,219,245 ; pand %xmm13,%xmm14 DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14 @@ -13966,8 +14064,8 @@ _sk_dither_sse41 LABEL PROC DB 102,69,15,235,245 ; por %xmm13,%xmm14 DB 102,69,15,235,240 ; por %xmm8,%xmm14 DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8 - DB 68,15,89,5,83,89,0,0 ; mulps 0x5953(%rip),%xmm8 # 5b60 <_sk_callback_sse41+0x11b> - DB 68,15,88,5,91,89,0,0 ; addps 0x595b(%rip),%xmm8 # 5b70 <_sk_callback_sse41+0x12b> + DB 68,15,89,5,19,90,0,0 ; mulps 0x5a13(%rip),%xmm8 # 5c20 <_sk_callback_sse41+0x12a> + DB 68,15,88,5,27,90,0,0 ; addps 0x5a1b(%rip),%xmm8 # 5c30 <_sk_callback_sse41+0x13a> DB 243,68,15,16,16 ; movss (%rax),%xmm10 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,89,208 ; mulps %xmm8,%xmm10 @@ -14034,7 +14132,7 @@ _sk_clear_sse41 LABEL PROC PUBLIC _sk_srcatop_sse41 _sk_srcatop_sse41 LABEL PROC DB 15,89,199 ; mulps %xmm7,%xmm0 - DB 68,15,40,5,181,88,0,0 ; movaps 0x58b5(%rip),%xmm8 # 5b80 <_sk_callback_sse41+0x13b> + DB 68,15,40,5,117,89,0,0 ; movaps 0x5975(%rip),%xmm8 # 5c40 <_sk_callback_sse41+0x14a> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -14057,7 +14155,7 @@ PUBLIC _sk_dstatop_sse41 _sk_dstatop_sse41 LABEL PROC DB 68,15,40,195 ; movaps %xmm3,%xmm8 DB 68,15,89,196 ; mulps %xmm4,%xmm8 - DB 68,15,40,13,120,88,0,0 ; movaps 0x5878(%rip),%xmm9 # 5b90 <_sk_callback_sse41+0x14b> + DB 68,15,40,13,56,89,0,0 ; movaps 0x5938(%rip),%xmm9 # 5c50 <_sk_callback_sse41+0x15a> DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 65,15,88,192 ; addps %xmm8,%xmm0 @@ -14098,7 +14196,7 @@ _sk_dstin_sse41 LABEL PROC PUBLIC _sk_srcout_sse41 _sk_srcout_sse41 LABEL PROC - DB 68,15,40,5,28,88,0,0 ; movaps 0x581c(%rip),%xmm8 # 5ba0 <_sk_callback_sse41+0x15b> + DB 68,15,40,5,220,88,0,0 ; movaps 0x58dc(%rip),%xmm8 # 5c60 <_sk_callback_sse41+0x16a> DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 @@ -14109,7 +14207,7 @@ _sk_srcout_sse41 LABEL PROC PUBLIC _sk_dstout_sse41 _sk_dstout_sse41 LABEL PROC - DB 68,15,40,5,12,88,0,0 ; movaps 0x580c(%rip),%xmm8 # 5bb0 <_sk_callback_sse41+0x16b> + DB 68,15,40,5,204,88,0,0 ; movaps 0x58cc(%rip),%xmm8 # 5c70 <_sk_callback_sse41+0x17a> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 15,89,196 ; mulps %xmm4,%xmm0 @@ -14124,7 +14222,7 @@ _sk_dstout_sse41 LABEL PROC PUBLIC _sk_srcover_sse41 _sk_srcover_sse41 LABEL PROC - DB 68,15,40,5,239,87,0,0 ; movaps 0x57ef(%rip),%xmm8 # 5bc0 <_sk_callback_sse41+0x17b> + DB 68,15,40,5,175,88,0,0 ; movaps 0x58af(%rip),%xmm8 # 5c80 <_sk_callback_sse41+0x18a> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -14142,7 +14240,7 @@ _sk_srcover_sse41 LABEL PROC PUBLIC _sk_dstover_sse41 _sk_dstover_sse41 LABEL PROC - DB 68,15,40,5,195,87,0,0 ; movaps 0x57c3(%rip),%xmm8 # 5bd0 <_sk_callback_sse41+0x18b> + DB 68,15,40,5,131,88,0,0 ; movaps 0x5883(%rip),%xmm8 # 5c90 <_sk_callback_sse41+0x19a> DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -14166,7 +14264,7 @@ _sk_modulate_sse41 LABEL PROC PUBLIC _sk_multiply_sse41 _sk_multiply_sse41 LABEL PROC - DB 68,15,40,5,151,87,0,0 ; movaps 0x5797(%rip),%xmm8 # 5be0 <_sk_callback_sse41+0x19b> + DB 68,15,40,5,87,88,0,0 ; movaps 0x5857(%rip),%xmm8 # 5ca0 <_sk_callback_sse41+0x1aa> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 69,15,40,209 ; movaps %xmm9,%xmm10 @@ -14235,7 +14333,7 @@ _sk_screen_sse41 LABEL PROC PUBLIC _sk_xor__sse41 _sk_xor__sse41 LABEL PROC DB 68,15,40,195 ; movaps %xmm3,%xmm8 - DB 15,40,29,204,86,0,0 ; movaps 0x56cc(%rip),%xmm3 # 5bf0 <_sk_callback_sse41+0x1ab> + DB 15,40,29,140,87,0,0 ; movaps 0x578c(%rip),%xmm3 # 5cb0 <_sk_callback_sse41+0x1ba> DB 68,15,40,203 ; movaps %xmm3,%xmm9 DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 65,15,89,193 ; mulps %xmm9,%xmm0 @@ -14281,7 +14379,7 @@ _sk_darken_sse41 LABEL PROC DB 68,15,89,206 ; mulps %xmm6,%xmm9 DB 65,15,95,209 ; maxps %xmm9,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,55,86,0,0 ; movaps 0x5637(%rip),%xmm2 # 5c00 <_sk_callback_sse41+0x1bb> + DB 15,40,21,247,86,0,0 ; movaps 0x56f7(%rip),%xmm2 # 5cc0 <_sk_callback_sse41+0x1ca> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -14313,7 +14411,7 @@ _sk_lighten_sse41 LABEL PROC DB 68,15,89,206 ; mulps %xmm6,%xmm9 DB 65,15,93,209 ; minps %xmm9,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,220,85,0,0 ; movaps 0x55dc(%rip),%xmm2 # 5c10 <_sk_callback_sse41+0x1cb> + DB 15,40,21,156,86,0,0 ; movaps 0x569c(%rip),%xmm2 # 5cd0 <_sk_callback_sse41+0x1da> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -14348,7 +14446,7 @@ _sk_difference_sse41 LABEL PROC DB 65,15,93,209 ; minps %xmm9,%xmm2 DB 15,88,210 ; addps %xmm2,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,118,85,0,0 ; movaps 0x5576(%rip),%xmm2 # 5c20 <_sk_callback_sse41+0x1db> + DB 15,40,21,54,86,0,0 ; movaps 0x5636(%rip),%xmm2 # 5ce0 <_sk_callback_sse41+0x1ea> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -14374,7 +14472,7 @@ _sk_exclusion_sse41 LABEL PROC DB 15,89,214 ; mulps %xmm6,%xmm2 DB 15,88,210 ; addps %xmm2,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,54,85,0,0 ; movaps 0x5536(%rip),%xmm2 # 5c30 <_sk_callback_sse41+0x1eb> + DB 15,40,21,246,85,0,0 ; movaps 0x55f6(%rip),%xmm2 # 5cf0 <_sk_callback_sse41+0x1fa> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -14385,7 +14483,7 @@ _sk_exclusion_sse41 LABEL PROC PUBLIC _sk_colorburn_sse41 _sk_colorburn_sse41 LABEL PROC DB 68,15,40,192 ; movaps %xmm0,%xmm8 - DB 68,15,40,21,41,85,0,0 ; movaps 0x5529(%rip),%xmm10 # 5c40 <_sk_callback_sse41+0x1fb> + DB 68,15,40,21,233,85,0,0 ; movaps 0x55e9(%rip),%xmm10 # 5d00 <_sk_callback_sse41+0x20a> DB 69,15,40,218 ; movaps %xmm10,%xmm11 DB 68,15,92,223 ; subps %xmm7,%xmm11 DB 69,15,40,203 ; movaps %xmm11,%xmm9 @@ -14465,7 +14563,7 @@ _sk_colorburn_sse41 LABEL PROC PUBLIC _sk_colordodge_sse41 _sk_colordodge_sse41 LABEL PROC DB 68,15,40,192 ; movaps %xmm0,%xmm8 - DB 68,15,40,21,7,84,0,0 ; movaps 0x5407(%rip),%xmm10 # 5c50 <_sk_callback_sse41+0x20b> + DB 68,15,40,21,199,84,0,0 ; movaps 0x54c7(%rip),%xmm10 # 5d10 <_sk_callback_sse41+0x21a> DB 69,15,40,218 ; movaps %xmm10,%xmm11 DB 68,15,92,223 ; subps %xmm7,%xmm11 DB 69,15,40,227 ; movaps %xmm11,%xmm12 @@ -14546,7 +14644,7 @@ _sk_hardlight_sse41 LABEL PROC DB 15,40,244 ; movaps %xmm4,%xmm6 DB 15,40,227 ; movaps %xmm3,%xmm4 DB 68,15,40,200 ; movaps %xmm0,%xmm9 - DB 68,15,40,21,221,82,0,0 ; movaps 0x52dd(%rip),%xmm10 # 5c60 <_sk_callback_sse41+0x21b> + DB 68,15,40,21,157,83,0,0 ; movaps 0x539d(%rip),%xmm10 # 5d20 <_sk_callback_sse41+0x22a> DB 65,15,40,234 ; movaps %xmm10,%xmm5 DB 15,92,239 ; subps %xmm7,%xmm5 DB 15,40,197 ; movaps %xmm5,%xmm0 @@ -14628,7 +14726,7 @@ PUBLIC _sk_overlay_sse41 _sk_overlay_sse41 LABEL PROC DB 68,15,40,201 ; movaps %xmm1,%xmm9 DB 68,15,40,240 ; movaps %xmm0,%xmm14 - DB 68,15,40,21,191,81,0,0 ; movaps 0x51bf(%rip),%xmm10 # 5c70 <_sk_callback_sse41+0x22b> + DB 68,15,40,21,127,82,0,0 ; movaps 0x527f(%rip),%xmm10 # 5d30 <_sk_callback_sse41+0x23a> DB 69,15,40,218 ; movaps %xmm10,%xmm11 DB 68,15,92,223 ; subps %xmm7,%xmm11 DB 65,15,40,195 ; movaps %xmm11,%xmm0 @@ -14712,7 +14810,7 @@ _sk_softlight_sse41 LABEL PROC DB 15,40,198 ; movaps %xmm6,%xmm0 DB 15,94,199 ; divps %xmm7,%xmm0 DB 65,15,84,193 ; andps %xmm9,%xmm0 - DB 15,40,13,146,80,0,0 ; movaps 0x5092(%rip),%xmm1 # 5c80 <_sk_callback_sse41+0x23b> + DB 15,40,13,82,81,0,0 ; movaps 0x5152(%rip),%xmm1 # 5d40 <_sk_callback_sse41+0x24a> DB 68,15,40,209 ; movaps %xmm1,%xmm10 DB 68,15,92,208 ; subps %xmm0,%xmm10 DB 68,15,40,240 ; movaps %xmm0,%xmm14 @@ -14725,10 +14823,10 @@ _sk_softlight_sse41 LABEL PROC DB 15,40,208 ; movaps %xmm0,%xmm2 DB 15,89,210 ; mulps %xmm2,%xmm2 DB 15,88,208 ; addps %xmm0,%xmm2 - DB 68,15,40,45,112,80,0,0 ; movaps 0x5070(%rip),%xmm13 # 5c90 <_sk_callback_sse41+0x24b> + DB 68,15,40,45,48,81,0,0 ; movaps 0x5130(%rip),%xmm13 # 5d50 <_sk_callback_sse41+0x25a> DB 69,15,88,245 ; addps %xmm13,%xmm14 DB 68,15,89,242 ; mulps %xmm2,%xmm14 - DB 68,15,40,37,112,80,0,0 ; movaps 0x5070(%rip),%xmm12 # 5ca0 <_sk_callback_sse41+0x25b> + DB 68,15,40,37,48,81,0,0 ; movaps 0x5130(%rip),%xmm12 # 5d60 <_sk_callback_sse41+0x26a> DB 69,15,89,252 ; mulps %xmm12,%xmm15 DB 69,15,88,254 ; addps %xmm14,%xmm15 DB 15,40,198 ; movaps %xmm6,%xmm0 @@ -14914,12 +15012,12 @@ _sk_hue_sse41 LABEL PROC DB 68,15,84,208 ; andps %xmm0,%xmm10 DB 15,84,200 ; andps %xmm0,%xmm1 DB 68,15,84,232 ; andps %xmm0,%xmm13 - DB 15,40,5,214,77,0,0 ; movaps 0x4dd6(%rip),%xmm0 # 5cb0 <_sk_callback_sse41+0x26b> + DB 15,40,5,150,78,0,0 ; movaps 0x4e96(%rip),%xmm0 # 5d70 <_sk_callback_sse41+0x27a> DB 68,15,89,224 ; mulps %xmm0,%xmm12 - DB 15,40,21,219,77,0,0 ; movaps 0x4ddb(%rip),%xmm2 # 5cc0 <_sk_callback_sse41+0x27b> + DB 15,40,21,155,78,0,0 ; movaps 0x4e9b(%rip),%xmm2 # 5d80 <_sk_callback_sse41+0x28a> DB 15,89,250 ; mulps %xmm2,%xmm7 DB 65,15,88,252 ; addps %xmm12,%xmm7 - DB 68,15,40,53,220,77,0,0 ; movaps 0x4ddc(%rip),%xmm14 # 5cd0 <_sk_callback_sse41+0x28b> + DB 68,15,40,53,156,78,0,0 ; movaps 0x4e9c(%rip),%xmm14 # 5d90 <_sk_callback_sse41+0x29a> DB 68,15,40,252 ; movaps %xmm4,%xmm15 DB 69,15,89,254 ; mulps %xmm14,%xmm15 DB 68,15,88,255 ; addps %xmm7,%xmm15 @@ -15002,7 +15100,7 @@ _sk_hue_sse41 LABEL PROC DB 65,15,88,214 ; addps %xmm14,%xmm2 DB 15,40,196 ; movaps %xmm4,%xmm0 DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1 - DB 68,15,40,13,161,76,0,0 ; movaps 0x4ca1(%rip),%xmm9 # 5ce0 <_sk_callback_sse41+0x29b> + DB 68,15,40,13,97,77,0,0 ; movaps 0x4d61(%rip),%xmm9 # 5da0 <_sk_callback_sse41+0x2aa> DB 65,15,40,225 ; movaps %xmm9,%xmm4 DB 15,92,229 ; subps %xmm5,%xmm4 DB 15,40,68,36,48 ; movaps 0x30(%rsp),%xmm0 @@ -15096,14 +15194,14 @@ _sk_saturation_sse41 LABEL PROC DB 68,15,84,215 ; andps %xmm7,%xmm10 DB 68,15,84,223 ; andps %xmm7,%xmm11 DB 68,15,84,199 ; andps %xmm7,%xmm8 - DB 15,40,21,84,75,0,0 ; movaps 0x4b54(%rip),%xmm2 # 5cf0 <_sk_callback_sse41+0x2ab> + DB 15,40,21,20,76,0,0 ; movaps 0x4c14(%rip),%xmm2 # 5db0 <_sk_callback_sse41+0x2ba> DB 15,40,221 ; movaps %xmm5,%xmm3 DB 15,89,218 ; mulps %xmm2,%xmm3 - DB 15,40,13,87,75,0,0 ; movaps 0x4b57(%rip),%xmm1 # 5d00 <_sk_callback_sse41+0x2bb> + DB 15,40,13,23,76,0,0 ; movaps 0x4c17(%rip),%xmm1 # 5dc0 <_sk_callback_sse41+0x2ca> DB 15,40,254 ; movaps %xmm6,%xmm7 DB 15,89,249 ; mulps %xmm1,%xmm7 DB 15,88,251 ; addps %xmm3,%xmm7 - DB 68,15,40,45,86,75,0,0 ; movaps 0x4b56(%rip),%xmm13 # 5d10 <_sk_callback_sse41+0x2cb> + DB 68,15,40,45,22,76,0,0 ; movaps 0x4c16(%rip),%xmm13 # 5dd0 <_sk_callback_sse41+0x2da> DB 69,15,89,245 ; mulps %xmm13,%xmm14 DB 68,15,88,247 ; addps %xmm7,%xmm14 DB 65,15,40,218 ; movaps %xmm10,%xmm3 @@ -15184,7 +15282,7 @@ _sk_saturation_sse41 LABEL PROC DB 65,15,88,253 ; addps %xmm13,%xmm7 DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 102,68,15,56,20,223 ; blendvps %xmm0,%xmm7,%xmm11 - DB 68,15,40,13,28,74,0,0 ; movaps 0x4a1c(%rip),%xmm9 # 5d20 <_sk_callback_sse41+0x2db> + DB 68,15,40,13,220,74,0,0 ; movaps 0x4adc(%rip),%xmm9 # 5de0 <_sk_callback_sse41+0x2ea> DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 68,15,92,204 ; subps %xmm4,%xmm9 DB 15,40,60,36 ; movaps (%rsp),%xmm7 @@ -15239,14 +15337,14 @@ _sk_color_sse41 LABEL PROC DB 15,40,231 ; movaps %xmm7,%xmm4 DB 68,15,89,244 ; mulps %xmm4,%xmm14 DB 15,89,204 ; mulps %xmm4,%xmm1 - DB 68,15,40,13,97,73,0,0 ; movaps 0x4961(%rip),%xmm9 # 5d30 <_sk_callback_sse41+0x2eb> + DB 68,15,40,13,33,74,0,0 ; movaps 0x4a21(%rip),%xmm9 # 5df0 <_sk_callback_sse41+0x2fa> DB 65,15,40,250 ; movaps %xmm10,%xmm7 DB 65,15,89,249 ; mulps %xmm9,%xmm7 - DB 68,15,40,21,97,73,0,0 ; movaps 0x4961(%rip),%xmm10 # 5d40 <_sk_callback_sse41+0x2fb> + DB 68,15,40,21,33,74,0,0 ; movaps 0x4a21(%rip),%xmm10 # 5e00 <_sk_callback_sse41+0x30a> DB 65,15,40,219 ; movaps %xmm11,%xmm3 DB 65,15,89,218 ; mulps %xmm10,%xmm3 DB 15,88,223 ; addps %xmm7,%xmm3 - DB 68,15,40,29,94,73,0,0 ; movaps 0x495e(%rip),%xmm11 # 5d50 <_sk_callback_sse41+0x30b> + DB 68,15,40,29,30,74,0,0 ; movaps 0x4a1e(%rip),%xmm11 # 5e10 <_sk_callback_sse41+0x31a> DB 69,15,40,236 ; movaps %xmm12,%xmm13 DB 69,15,89,235 ; mulps %xmm11,%xmm13 DB 68,15,88,235 ; addps %xmm3,%xmm13 @@ -15331,7 +15429,7 @@ _sk_color_sse41 LABEL PROC DB 65,15,88,251 ; addps %xmm11,%xmm7 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 102,15,56,20,207 ; blendvps %xmm0,%xmm7,%xmm1 - DB 68,15,40,13,26,72,0,0 ; movaps 0x481a(%rip),%xmm9 # 5d60 <_sk_callback_sse41+0x31b> + DB 68,15,40,13,218,72,0,0 ; movaps 0x48da(%rip),%xmm9 # 5e20 <_sk_callback_sse41+0x32a> DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 15,92,196 ; subps %xmm4,%xmm0 DB 68,15,89,192 ; mulps %xmm0,%xmm8 @@ -15383,13 +15481,13 @@ _sk_luminosity_sse41 LABEL PROC DB 69,15,89,216 ; mulps %xmm8,%xmm11 DB 68,15,40,203 ; movaps %xmm3,%xmm9 DB 68,15,89,205 ; mulps %xmm5,%xmm9 - DB 68,15,40,5,108,71,0,0 ; movaps 0x476c(%rip),%xmm8 # 5d70 <_sk_callback_sse41+0x32b> + DB 68,15,40,5,44,72,0,0 ; movaps 0x482c(%rip),%xmm8 # 5e30 <_sk_callback_sse41+0x33a> DB 65,15,89,192 ; mulps %xmm8,%xmm0 - DB 68,15,40,21,112,71,0,0 ; movaps 0x4770(%rip),%xmm10 # 5d80 <_sk_callback_sse41+0x33b> + DB 68,15,40,21,48,72,0,0 ; movaps 0x4830(%rip),%xmm10 # 5e40 <_sk_callback_sse41+0x34a> DB 15,40,233 ; movaps %xmm1,%xmm5 DB 65,15,89,234 ; mulps %xmm10,%xmm5 DB 15,88,232 ; addps %xmm0,%xmm5 - DB 68,15,40,37,110,71,0,0 ; movaps 0x476e(%rip),%xmm12 # 5d90 <_sk_callback_sse41+0x34b> + DB 68,15,40,37,46,72,0,0 ; movaps 0x482e(%rip),%xmm12 # 5e50 <_sk_callback_sse41+0x35a> DB 68,15,40,242 ; movaps %xmm2,%xmm14 DB 69,15,89,244 ; mulps %xmm12,%xmm14 DB 68,15,88,245 ; addps %xmm5,%xmm14 @@ -15474,7 +15572,7 @@ _sk_luminosity_sse41 LABEL PROC DB 65,15,88,244 ; addps %xmm12,%xmm6 DB 65,15,40,195 ; movaps %xmm11,%xmm0 DB 102,68,15,56,20,206 ; blendvps %xmm0,%xmm6,%xmm9 - DB 15,40,5,36,70,0,0 ; movaps 0x4624(%rip),%xmm0 # 5da0 <_sk_callback_sse41+0x35b> + DB 15,40,5,228,70,0,0 ; movaps 0x46e4(%rip),%xmm0 # 5e60 <_sk_callback_sse41+0x36a> DB 15,40,208 ; movaps %xmm0,%xmm2 DB 15,92,215 ; subps %xmm7,%xmm2 DB 15,89,226 ; mulps %xmm2,%xmm4 @@ -15516,20 +15614,20 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC DB 15,133,217,0,0,0 ; jne 18d3 <_sk_srcover_rgba_8888_sse41+0xe7> DB 243,15,111,60,144 ; movdqu (%rax,%rdx,4),%xmm7 DB 77,133,192 ; test %r8,%r8 - DB 102,15,111,37,166,69,0,0 ; movdqa 0x45a6(%rip),%xmm4 # 5db0 <_sk_callback_sse41+0x36b> + DB 102,15,111,37,102,70,0,0 ; movdqa 0x4666(%rip),%xmm4 # 5e70 <_sk_callback_sse41+0x37a> DB 102,15,219,231 ; pand %xmm7,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 DB 102,15,111,239 ; movdqa %xmm7,%xmm5 - DB 102,15,56,0,45,162,69,0,0 ; pshufb 0x45a2(%rip),%xmm5 # 5dc0 <_sk_callback_sse41+0x37b> + DB 102,15,56,0,45,98,70,0,0 ; pshufb 0x4662(%rip),%xmm5 # 5e80 <_sk_callback_sse41+0x38a> DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 DB 102,15,111,247 ; movdqa %xmm7,%xmm6 - DB 102,15,56,0,53,162,69,0,0 ; pshufb 0x45a2(%rip),%xmm6 # 5dd0 <_sk_callback_sse41+0x38b> + DB 102,15,56,0,53,98,70,0,0 ; pshufb 0x4662(%rip),%xmm6 # 5e90 <_sk_callback_sse41+0x39a> DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 DB 102,15,114,215,24 ; psrld $0x18,%xmm7 DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7 - DB 68,15,40,5,159,69,0,0 ; movaps 0x459f(%rip),%xmm8 # 5de0 <_sk_callback_sse41+0x39b> + DB 68,15,40,5,95,70,0,0 ; movaps 0x465f(%rip),%xmm8 # 5ea0 <_sk_callback_sse41+0x3aa> DB 68,15,92,195 ; subps %xmm3,%xmm8 - DB 68,15,40,37,163,69,0,0 ; movaps 0x45a3(%rip),%xmm12 # 5df0 <_sk_callback_sse41+0x3ab> + DB 68,15,40,37,99,70,0,0 ; movaps 0x4663(%rip),%xmm12 # 5eb0 <_sk_callback_sse41+0x3ba> DB 65,15,89,196 ; mulps %xmm12,%xmm0 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -15605,7 +15703,7 @@ _sk_clamp_0_sse41 LABEL PROC PUBLIC _sk_clamp_1_sse41 _sk_clamp_1_sse41 LABEL PROC - DB 68,15,40,5,149,68,0,0 ; movaps 0x4495(%rip),%xmm8 # 5e00 <_sk_callback_sse41+0x3bb> + DB 68,15,40,5,85,69,0,0 ; movaps 0x4555(%rip),%xmm8 # 5ec0 <_sk_callback_sse41+0x3ca> DB 65,15,93,192 ; minps %xmm8,%xmm0 DB 65,15,93,200 ; minps %xmm8,%xmm1 DB 65,15,93,208 ; minps %xmm8,%xmm2 @@ -15615,7 +15713,7 @@ _sk_clamp_1_sse41 LABEL PROC PUBLIC _sk_clamp_a_sse41 _sk_clamp_a_sse41 LABEL PROC - DB 15,93,29,138,68,0,0 ; minps 0x448a(%rip),%xmm3 # 5e10 <_sk_callback_sse41+0x3cb> + DB 15,93,29,74,69,0,0 ; minps 0x454a(%rip),%xmm3 # 5ed0 <_sk_callback_sse41+0x3da> DB 15,93,195 ; minps %xmm3,%xmm0 DB 15,93,203 ; minps %xmm3,%xmm1 DB 15,93,211 ; minps %xmm3,%xmm2 @@ -15624,7 +15722,7 @@ _sk_clamp_a_sse41 LABEL PROC PUBLIC _sk_clamp_a_dst_sse41 _sk_clamp_a_dst_sse41 LABEL PROC - DB 15,93,61,134,68,0,0 ; minps 0x4486(%rip),%xmm7 # 5e20 <_sk_callback_sse41+0x3db> + DB 15,93,61,70,69,0,0 ; minps 0x4546(%rip),%xmm7 # 5ee0 <_sk_callback_sse41+0x3ea> DB 15,93,231 ; minps %xmm7,%xmm4 DB 15,93,239 ; minps %xmm7,%xmm5 DB 15,93,247 ; minps %xmm7,%xmm6 @@ -15680,7 +15778,7 @@ _sk_premul_sse41 LABEL PROC PUBLIC _sk_unpremul_sse41 _sk_unpremul_sse41 LABEL PROC DB 69,15,87,192 ; xorps %xmm8,%xmm8 - DB 68,15,40,13,33,68,0,0 ; movaps 0x4421(%rip),%xmm9 # 5e30 <_sk_callback_sse41+0x3eb> + DB 68,15,40,13,225,68,0,0 ; movaps 0x44e1(%rip),%xmm9 # 5ef0 <_sk_callback_sse41+0x3fa> DB 68,15,94,203 ; divps %xmm3,%xmm9 DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8 DB 69,15,84,193 ; andps %xmm9,%xmm8 @@ -15692,20 +15790,20 @@ _sk_unpremul_sse41 LABEL PROC PUBLIC _sk_from_srgb_sse41 _sk_from_srgb_sse41 LABEL PROC - DB 68,15,40,29,12,68,0,0 ; movaps 0x440c(%rip),%xmm11 # 5e40 <_sk_callback_sse41+0x3fb> + DB 68,15,40,29,204,68,0,0 ; movaps 0x44cc(%rip),%xmm11 # 5f00 <_sk_callback_sse41+0x40a> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 DB 68,15,40,208 ; movaps %xmm0,%xmm10 DB 69,15,89,210 ; mulps %xmm10,%xmm10 - DB 68,15,40,37,4,68,0,0 ; movaps 0x4404(%rip),%xmm12 # 5e50 <_sk_callback_sse41+0x40b> + DB 68,15,40,37,196,68,0,0 ; movaps 0x44c4(%rip),%xmm12 # 5f10 <_sk_callback_sse41+0x41a> DB 68,15,40,192 ; movaps %xmm0,%xmm8 DB 69,15,89,196 ; mulps %xmm12,%xmm8 - DB 68,15,40,45,4,68,0,0 ; movaps 0x4404(%rip),%xmm13 # 5e60 <_sk_callback_sse41+0x41b> + DB 68,15,40,45,196,68,0,0 ; movaps 0x44c4(%rip),%xmm13 # 5f20 <_sk_callback_sse41+0x42a> DB 69,15,88,197 ; addps %xmm13,%xmm8 DB 69,15,89,194 ; mulps %xmm10,%xmm8 - DB 68,15,40,53,4,68,0,0 ; movaps 0x4404(%rip),%xmm14 # 5e70 <_sk_callback_sse41+0x42b> + DB 68,15,40,53,196,68,0,0 ; movaps 0x44c4(%rip),%xmm14 # 5f30 <_sk_callback_sse41+0x43a> DB 69,15,88,198 ; addps %xmm14,%xmm8 - DB 68,15,40,61,8,68,0,0 ; movaps 0x4408(%rip),%xmm15 # 5e80 <_sk_callback_sse41+0x43b> + DB 68,15,40,61,200,68,0,0 ; movaps 0x44c8(%rip),%xmm15 # 5f40 <_sk_callback_sse41+0x44a> DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0 DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8 DB 68,15,40,209 ; movaps %xmm1,%xmm10 @@ -15740,19 +15838,19 @@ PUBLIC _sk_from_srgb_dst_sse41 _sk_from_srgb_dst_sse41 LABEL PROC DB 68,15,40,204 ; movaps %xmm4,%xmm9 DB 68,15,40,192 ; movaps %xmm0,%xmm8 - DB 68,15,40,29,147,67,0,0 ; movaps 0x4393(%rip),%xmm11 # 5e90 <_sk_callback_sse41+0x44b> + DB 68,15,40,29,83,68,0,0 ; movaps 0x4453(%rip),%xmm11 # 5f50 <_sk_callback_sse41+0x45a> DB 69,15,40,209 ; movaps %xmm9,%xmm10 DB 69,15,89,211 ; mulps %xmm11,%xmm10 DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 15,89,192 ; mulps %xmm0,%xmm0 - DB 68,15,40,37,140,67,0,0 ; movaps 0x438c(%rip),%xmm12 # 5ea0 <_sk_callback_sse41+0x45b> + DB 68,15,40,37,76,68,0,0 ; movaps 0x444c(%rip),%xmm12 # 5f60 <_sk_callback_sse41+0x46a> DB 65,15,89,228 ; mulps %xmm12,%xmm4 - DB 68,15,40,45,144,67,0,0 ; movaps 0x4390(%rip),%xmm13 # 5eb0 <_sk_callback_sse41+0x46b> + DB 68,15,40,45,80,68,0,0 ; movaps 0x4450(%rip),%xmm13 # 5f70 <_sk_callback_sse41+0x47a> DB 65,15,88,229 ; addps %xmm13,%xmm4 DB 15,89,224 ; mulps %xmm0,%xmm4 - DB 68,15,40,53,145,67,0,0 ; movaps 0x4391(%rip),%xmm14 # 5ec0 <_sk_callback_sse41+0x47b> + DB 68,15,40,53,81,68,0,0 ; movaps 0x4451(%rip),%xmm14 # 5f80 <_sk_callback_sse41+0x48a> DB 65,15,88,230 ; addps %xmm14,%xmm4 - DB 68,15,40,61,149,67,0,0 ; movaps 0x4395(%rip),%xmm15 # 5ed0 <_sk_callback_sse41+0x48b> + DB 68,15,40,61,85,68,0,0 ; movaps 0x4455(%rip),%xmm15 # 5f90 <_sk_callback_sse41+0x49a> DB 69,15,194,207,1 ; cmpltps %xmm15,%xmm9 DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 102,65,15,56,20,226 ; blendvps %xmm0,%xmm10,%xmm4 @@ -15795,22 +15893,22 @@ _sk_to_srgb_sse41 LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 DB 15,40,209 ; movaps %xmm1,%xmm2 DB 68,15,82,192 ; rsqrtps %xmm0,%xmm8 - DB 68,15,40,29,6,67,0,0 ; movaps 0x4306(%rip),%xmm11 # 5ee0 <_sk_callback_sse41+0x49b> + DB 68,15,40,29,198,67,0,0 ; movaps 0x43c6(%rip),%xmm11 # 5fa0 <_sk_callback_sse41+0x4aa> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 - DB 68,15,40,37,6,67,0,0 ; movaps 0x4306(%rip),%xmm12 # 5ef0 <_sk_callback_sse41+0x4ab> + DB 68,15,40,37,198,67,0,0 ; movaps 0x43c6(%rip),%xmm12 # 5fb0 <_sk_callback_sse41+0x4ba> DB 69,15,40,248 ; movaps %xmm8,%xmm15 DB 69,15,89,252 ; mulps %xmm12,%xmm15 - DB 68,15,40,21,6,67,0,0 ; movaps 0x4306(%rip),%xmm10 # 5f00 <_sk_callback_sse41+0x4bb> + DB 68,15,40,21,198,67,0,0 ; movaps 0x43c6(%rip),%xmm10 # 5fc0 <_sk_callback_sse41+0x4ca> DB 69,15,88,250 ; addps %xmm10,%xmm15 DB 69,15,89,248 ; mulps %xmm8,%xmm15 - DB 68,15,40,45,6,67,0,0 ; movaps 0x4306(%rip),%xmm13 # 5f10 <_sk_callback_sse41+0x4cb> + DB 68,15,40,45,198,67,0,0 ; movaps 0x43c6(%rip),%xmm13 # 5fd0 <_sk_callback_sse41+0x4da> DB 69,15,88,253 ; addps %xmm13,%xmm15 - DB 68,15,40,53,10,67,0,0 ; movaps 0x430a(%rip),%xmm14 # 5f20 <_sk_callback_sse41+0x4db> + DB 68,15,40,53,202,67,0,0 ; movaps 0x43ca(%rip),%xmm14 # 5fe0 <_sk_callback_sse41+0x4ea> DB 69,15,88,198 ; addps %xmm14,%xmm8 DB 69,15,83,192 ; rcpps %xmm8,%xmm8 DB 69,15,89,199 ; mulps %xmm15,%xmm8 - DB 68,15,40,61,6,67,0,0 ; movaps 0x4306(%rip),%xmm15 # 5f30 <_sk_callback_sse41+0x4eb> + DB 68,15,40,61,198,67,0,0 ; movaps 0x43c6(%rip),%xmm15 # 5ff0 <_sk_callback_sse41+0x4fa> DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0 DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8 DB 68,15,82,202 ; rsqrtps %xmm2,%xmm9 @@ -15862,7 +15960,7 @@ _sk_rgb_to_hsl_sse41 LABEL PROC DB 68,15,93,226 ; minps %xmm2,%xmm12 DB 65,15,40,203 ; movaps %xmm11,%xmm1 DB 65,15,92,204 ; subps %xmm12,%xmm1 - DB 68,15,40,53,80,66,0,0 ; movaps 0x4250(%rip),%xmm14 # 5f40 <_sk_callback_sse41+0x4fb> + DB 68,15,40,53,16,67,0,0 ; movaps 0x4310(%rip),%xmm14 # 6000 <_sk_callback_sse41+0x50a> DB 68,15,94,241 ; divps %xmm1,%xmm14 DB 69,15,40,211 ; movaps %xmm11,%xmm10 DB 69,15,194,208,0 ; cmpeqps %xmm8,%xmm10 @@ -15871,27 +15969,27 @@ _sk_rgb_to_hsl_sse41 LABEL PROC DB 65,15,89,198 ; mulps %xmm14,%xmm0 DB 69,15,40,249 ; movaps %xmm9,%xmm15 DB 68,15,194,250,1 ; cmpltps %xmm2,%xmm15 - DB 68,15,84,61,55,66,0,0 ; andps 0x4237(%rip),%xmm15 # 5f50 <_sk_callback_sse41+0x50b> + DB 68,15,84,61,247,66,0,0 ; andps 0x42f7(%rip),%xmm15 # 6010 <_sk_callback_sse41+0x51a> DB 68,15,88,248 ; addps %xmm0,%xmm15 DB 65,15,40,195 ; movaps %xmm11,%xmm0 DB 65,15,194,193,0 ; cmpeqps %xmm9,%xmm0 DB 65,15,92,208 ; subps %xmm8,%xmm2 DB 65,15,89,214 ; mulps %xmm14,%xmm2 - DB 68,15,40,45,42,66,0,0 ; movaps 0x422a(%rip),%xmm13 # 5f60 <_sk_callback_sse41+0x51b> + DB 68,15,40,45,234,66,0,0 ; movaps 0x42ea(%rip),%xmm13 # 6020 <_sk_callback_sse41+0x52a> DB 65,15,88,213 ; addps %xmm13,%xmm2 DB 69,15,92,193 ; subps %xmm9,%xmm8 DB 69,15,89,198 ; mulps %xmm14,%xmm8 - DB 68,15,88,5,38,66,0,0 ; addps 0x4226(%rip),%xmm8 # 5f70 <_sk_callback_sse41+0x52b> + DB 68,15,88,5,230,66,0,0 ; addps 0x42e6(%rip),%xmm8 # 6030 <_sk_callback_sse41+0x53a> DB 102,68,15,56,20,194 ; blendvps %xmm0,%xmm2,%xmm8 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 102,69,15,56,20,199 ; blendvps %xmm0,%xmm15,%xmm8 - DB 68,15,89,5,30,66,0,0 ; mulps 0x421e(%rip),%xmm8 # 5f80 <_sk_callback_sse41+0x53b> + DB 68,15,89,5,222,66,0,0 ; mulps 0x42de(%rip),%xmm8 # 6040 <_sk_callback_sse41+0x54a> DB 69,15,40,203 ; movaps %xmm11,%xmm9 DB 69,15,194,204,4 ; cmpneqps %xmm12,%xmm9 DB 69,15,84,193 ; andps %xmm9,%xmm8 DB 69,15,92,235 ; subps %xmm11,%xmm13 DB 69,15,88,220 ; addps %xmm12,%xmm11 - DB 15,40,5,18,66,0,0 ; movaps 0x4212(%rip),%xmm0 # 5f90 <_sk_callback_sse41+0x54b> + DB 15,40,5,210,66,0,0 ; movaps 0x42d2(%rip),%xmm0 # 6050 <_sk_callback_sse41+0x55a> DB 65,15,40,211 ; movaps %xmm11,%xmm2 DB 15,89,208 ; mulps %xmm0,%xmm2 DB 15,194,194,1 ; cmpltps %xmm2,%xmm0 @@ -15912,7 +16010,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC DB 15,41,100,36,32 ; movaps %xmm4,0x20(%rsp) DB 15,41,92,36,16 ; movaps %xmm3,0x10(%rsp) DB 68,15,40,208 ; movaps %xmm0,%xmm10 - DB 68,15,40,13,212,65,0,0 ; movaps 0x41d4(%rip),%xmm9 # 5fa0 <_sk_callback_sse41+0x55b> + DB 68,15,40,13,148,66,0,0 ; movaps 0x4294(%rip),%xmm9 # 6060 <_sk_callback_sse41+0x56a> DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 15,194,194,2 ; cmpleps %xmm2,%xmm0 DB 15,40,217 ; movaps %xmm1,%xmm3 @@ -15925,19 +16023,19 @@ _sk_hsl_to_rgb_sse41 LABEL PROC DB 15,41,20,36 ; movaps %xmm2,(%rsp) DB 69,15,88,192 ; addps %xmm8,%xmm8 DB 68,15,92,197 ; subps %xmm5,%xmm8 - DB 68,15,40,53,176,65,0,0 ; movaps 0x41b0(%rip),%xmm14 # 5fb0 <_sk_callback_sse41+0x56b> + DB 68,15,40,53,112,66,0,0 ; movaps 0x4270(%rip),%xmm14 # 6070 <_sk_callback_sse41+0x57a> DB 69,15,88,242 ; addps %xmm10,%xmm14 DB 102,65,15,58,8,198,1 ; roundps $0x1,%xmm14,%xmm0 DB 68,15,92,240 ; subps %xmm0,%xmm14 - DB 68,15,40,29,169,65,0,0 ; movaps 0x41a9(%rip),%xmm11 # 5fc0 <_sk_callback_sse41+0x57b> + DB 68,15,40,29,105,66,0,0 ; movaps 0x4269(%rip),%xmm11 # 6080 <_sk_callback_sse41+0x58a> DB 65,15,40,195 ; movaps %xmm11,%xmm0 DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0 DB 15,40,245 ; movaps %xmm5,%xmm6 DB 65,15,92,240 ; subps %xmm8,%xmm6 - DB 15,40,61,162,65,0,0 ; movaps 0x41a2(%rip),%xmm7 # 5fd0 <_sk_callback_sse41+0x58b> + DB 15,40,61,98,66,0,0 ; movaps 0x4262(%rip),%xmm7 # 6090 <_sk_callback_sse41+0x59a> DB 69,15,40,238 ; movaps %xmm14,%xmm13 DB 68,15,89,239 ; mulps %xmm7,%xmm13 - DB 15,40,29,163,65,0,0 ; movaps 0x41a3(%rip),%xmm3 # 5fe0 <_sk_callback_sse41+0x59b> + DB 15,40,29,99,66,0,0 ; movaps 0x4263(%rip),%xmm3 # 60a0 <_sk_callback_sse41+0x5aa> DB 68,15,40,227 ; movaps %xmm3,%xmm12 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 68,15,89,230 ; mulps %xmm6,%xmm12 @@ -15947,7 +16045,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0 DB 68,15,40,253 ; movaps %xmm5,%xmm15 DB 102,69,15,56,20,252 ; blendvps %xmm0,%xmm12,%xmm15 - DB 68,15,40,37,130,65,0,0 ; movaps 0x4182(%rip),%xmm12 # 5ff0 <_sk_callback_sse41+0x5ab> + DB 68,15,40,37,66,66,0,0 ; movaps 0x4242(%rip),%xmm12 # 60b0 <_sk_callback_sse41+0x5ba> DB 65,15,40,196 ; movaps %xmm12,%xmm0 DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0 DB 68,15,89,238 ; mulps %xmm6,%xmm13 @@ -15981,7 +16079,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC DB 65,15,40,198 ; movaps %xmm14,%xmm0 DB 15,40,20,36 ; movaps (%rsp),%xmm2 DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1 - DB 68,15,88,21,251,64,0,0 ; addps 0x40fb(%rip),%xmm10 # 6000 <_sk_callback_sse41+0x5bb> + DB 68,15,88,21,187,65,0,0 ; addps 0x41bb(%rip),%xmm10 # 60c0 <_sk_callback_sse41+0x5ca> DB 102,65,15,58,8,194,1 ; roundps $0x1,%xmm10,%xmm0 DB 68,15,92,208 ; subps %xmm0,%xmm10 DB 69,15,194,218,2 ; cmpleps %xmm10,%xmm11 @@ -16031,9 +16129,9 @@ _sk_scale_u8_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,52 ; jne 1fe2 <_sk_scale_u8_sse41+0x3e> DB 102,69,15,56,49,4,18 ; pmovzxbd (%r10,%rdx,1),%xmm8 - DB 102,68,15,219,5,82,64,0,0 ; pand 0x4052(%rip),%xmm8 # 6010 <_sk_callback_sse41+0x5cb> + DB 102,68,15,219,5,18,65,0,0 ; pand 0x4112(%rip),%xmm8 # 60d0 <_sk_callback_sse41+0x5da> DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,86,64,0,0 ; mulps 0x4056(%rip),%xmm8 # 6020 <_sk_callback_sse41+0x5db> + DB 68,15,89,5,22,65,0,0 ; mulps 0x4116(%rip),%xmm8 # 60e0 <_sk_callback_sse41+0x5ea> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 65,15,89,208 ; mulps %xmm8,%xmm2 @@ -16089,9 +16187,9 @@ _sk_lerp_u8_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,72 ; jne 20c3 <_sk_lerp_u8_sse41+0x52> DB 102,69,15,56,49,4,18 ; pmovzxbd (%r10,%rdx,1),%xmm8 - DB 102,68,15,219,5,165,63,0,0 ; pand 0x3fa5(%rip),%xmm8 # 6030 <_sk_callback_sse41+0x5eb> + DB 102,68,15,219,5,101,64,0,0 ; pand 0x4065(%rip),%xmm8 # 60f0 <_sk_callback_sse41+0x5fa> DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,169,63,0,0 ; mulps 0x3fa9(%rip),%xmm8 # 6040 <_sk_callback_sse41+0x5fb> + DB 68,15,89,5,105,64,0,0 ; mulps 0x4069(%rip),%xmm8 # 6100 <_sk_callback_sse41+0x60a> DB 15,92,196 ; subps %xmm4,%xmm0 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -16134,17 +16232,17 @@ _sk_lerp_565_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 15,133,152,0,0,0 ; jne 21c3 <_sk_lerp_565_sse41+0xa6> DB 102,69,15,56,51,20,82 ; pmovzxwd (%r10,%rdx,2),%xmm10 - DB 102,68,15,111,5,21,63,0,0 ; movdqa 0x3f15(%rip),%xmm8 # 6050 <_sk_callback_sse41+0x60b> + DB 102,68,15,111,5,213,63,0,0 ; movdqa 0x3fd5(%rip),%xmm8 # 6110 <_sk_callback_sse41+0x61a> DB 102,69,15,219,194 ; pand %xmm10,%xmm8 DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,20,63,0,0 ; mulps 0x3f14(%rip),%xmm8 # 6060 <_sk_callback_sse41+0x61b> - DB 102,68,15,111,13,27,63,0,0 ; movdqa 0x3f1b(%rip),%xmm9 # 6070 <_sk_callback_sse41+0x62b> + DB 68,15,89,5,212,63,0,0 ; mulps 0x3fd4(%rip),%xmm8 # 6120 <_sk_callback_sse41+0x62a> + DB 102,68,15,111,13,219,63,0,0 ; movdqa 0x3fdb(%rip),%xmm9 # 6130 <_sk_callback_sse41+0x63a> DB 102,69,15,219,202 ; pand %xmm10,%xmm9 DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9 - DB 68,15,89,13,26,63,0,0 ; mulps 0x3f1a(%rip),%xmm9 # 6080 <_sk_callback_sse41+0x63b> - DB 102,68,15,219,21,33,63,0,0 ; pand 0x3f21(%rip),%xmm10 # 6090 <_sk_callback_sse41+0x64b> + DB 68,15,89,13,218,63,0,0 ; mulps 0x3fda(%rip),%xmm9 # 6140 <_sk_callback_sse41+0x64a> + DB 102,68,15,219,21,225,63,0,0 ; pand 0x3fe1(%rip),%xmm10 # 6150 <_sk_callback_sse41+0x65a> DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 - DB 68,15,89,21,37,63,0,0 ; mulps 0x3f25(%rip),%xmm10 # 60a0 <_sk_callback_sse41+0x65b> + DB 68,15,89,21,229,63,0,0 ; mulps 0x3fe5(%rip),%xmm10 # 6160 <_sk_callback_sse41+0x66a> DB 15,92,196 ; subps %xmm4,%xmm0 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -16196,7 +16294,7 @@ _sk_load_tables_sse41 LABEL PROC DB 65,87 ; push %r15 DB 65,86 ; push %r14 DB 83 ; push %rbx - DB 102,15,111,5,114,62,0,0 ; movdqa 0x3e72(%rip),%xmm0 # 60b0 <_sk_callback_sse41+0x66b> + DB 102,15,111,5,50,63,0,0 ; movdqa 0x3f32(%rip),%xmm0 # 6170 <_sk_callback_sse41+0x67a> DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9 DB 102,73,15,126,194 ; movq %xmm0,%r10 @@ -16211,7 +16309,7 @@ _sk_load_tables_sse41 LABEL PROC DB 102,66,15,58,33,4,179,32 ; insertps $0x20,(%rbx,%r14,4),%xmm0 DB 102,66,15,58,33,4,11,48 ; insertps $0x30,(%rbx,%r9,1),%xmm0 DB 102,65,15,111,200 ; movdqa %xmm8,%xmm1 - DB 102,15,56,0,13,45,62,0,0 ; pshufb 0x3e2d(%rip),%xmm1 # 60c0 <_sk_callback_sse41+0x67b> + DB 102,15,56,0,13,237,62,0,0 ; pshufb 0x3eed(%rip),%xmm1 # 6180 <_sk_callback_sse41+0x68a> DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9 DB 102,72,15,126,203 ; movq %xmm1,%rbx DB 68,15,182,211 ; movzbl %bl,%r10d @@ -16226,7 +16324,7 @@ _sk_load_tables_sse41 LABEL PROC DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1 DB 76,139,72,24 ; mov 0x18(%rax),%r9 DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2 - DB 102,15,56,0,21,233,61,0,0 ; pshufb 0x3de9(%rip),%xmm2 # 60d0 <_sk_callback_sse41+0x68b> + DB 102,15,56,0,21,169,62,0,0 ; pshufb 0x3ea9(%rip),%xmm2 # 6190 <_sk_callback_sse41+0x69a> DB 102,72,15,58,22,211,1 ; pextrq $0x1,%xmm2,%rbx DB 102,72,15,126,208 ; movq %xmm2,%rax DB 68,15,182,208 ; movzbl %al,%r10d @@ -16241,7 +16339,7 @@ _sk_load_tables_sse41 LABEL PROC DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2 DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8 DB 65,15,91,216 ; cvtdq2ps %xmm8,%xmm3 - DB 15,89,29,166,61,0,0 ; mulps 0x3da6(%rip),%xmm3 # 60e0 <_sk_callback_sse41+0x69b> + DB 15,89,29,102,62,0,0 ; mulps 0x3e66(%rip),%xmm3 # 61a0 <_sk_callback_sse41+0x6aa> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 65,94 ; pop %r14 @@ -16282,7 +16380,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1 DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9 - DB 102,68,15,111,5,20,61,0,0 ; movdqa 0x3d14(%rip),%xmm8 # 60f0 <_sk_callback_sse41+0x6ab> + DB 102,68,15,111,5,212,61,0,0 ; movdqa 0x3dd4(%rip),%xmm8 # 61b0 <_sk_callback_sse41+0x6ba> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0 @@ -16300,7 +16398,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC DB 102,15,58,33,194,32 ; insertps $0x20,%xmm2,%xmm0 DB 243,66,15,16,20,11 ; movss (%rbx,%r9,1),%xmm2 DB 102,15,58,33,194,48 ; insertps $0x30,%xmm2,%xmm0 - DB 102,15,56,0,13,195,60,0,0 ; pshufb 0x3cc3(%rip),%xmm1 # 6100 <_sk_callback_sse41+0x6bb> + DB 102,15,56,0,13,131,61,0,0 ; pshufb 0x3d83(%rip),%xmm1 # 61c0 <_sk_callback_sse41+0x6ca> DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1 DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9 DB 102,72,15,126,203 ; movq %xmm1,%rbx @@ -16336,7 +16434,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC DB 102,65,15,235,216 ; por %xmm8,%xmm3 DB 102,15,56,51,219 ; pmovzxwd %xmm3,%xmm3 DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,17,60,0,0 ; mulps 0x3c11(%rip),%xmm3 # 6110 <_sk_callback_sse41+0x6cb> + DB 15,89,29,209,60,0,0 ; mulps 0x3cd1(%rip),%xmm3 # 61d0 <_sk_callback_sse41+0x6da> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 65,94 ; pop %r14 @@ -16376,7 +16474,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9 DB 102,15,111,202 ; movdqa %xmm2,%xmm1 DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1 - DB 102,68,15,111,5,134,59,0,0 ; movdqa 0x3b86(%rip),%xmm8 # 6120 <_sk_callback_sse41+0x6db> + DB 102,68,15,111,5,70,60,0,0 ; movdqa 0x3c46(%rip),%xmm8 # 61e0 <_sk_callback_sse41+0x6ea> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0 @@ -16394,7 +16492,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC DB 102,15,58,33,195,32 ; insertps $0x20,%xmm3,%xmm0 DB 243,66,15,16,28,11 ; movss (%rbx,%r9,1),%xmm3 DB 102,15,58,33,195,48 ; insertps $0x30,%xmm3,%xmm0 - DB 102,15,56,0,13,53,59,0,0 ; pshufb 0x3b35(%rip),%xmm1 # 6130 <_sk_callback_sse41+0x6eb> + DB 102,15,56,0,13,245,59,0,0 ; pshufb 0x3bf5(%rip),%xmm1 # 61f0 <_sk_callback_sse41+0x6fa> DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1 DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9 DB 102,72,15,126,203 ; movq %xmm1,%rbx @@ -16425,7 +16523,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC DB 243,65,15,16,28,25 ; movss (%r9,%rbx,1),%xmm3 DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,160,58,0,0 ; movaps 0x3aa0(%rip),%xmm3 # 6140 <_sk_callback_sse41+0x6fb> + DB 15,40,29,96,59,0,0 ; movaps 0x3b60(%rip),%xmm3 # 6200 <_sk_callback_sse41+0x70a> DB 91 ; pop %rbx DB 65,94 ; pop %r14 DB 65,95 ; pop %r15 @@ -16457,7 +16555,7 @@ _sk_byte_tables_sse41 LABEL PROC DB 65,84 ; push %r12 DB 83 ; push %rbx DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,56,58,0,0 ; movaps 0x3a38(%rip),%xmm8 # 6150 <_sk_callback_sse41+0x70b> + DB 68,15,40,5,248,58,0,0 ; movaps 0x3af8(%rip),%xmm8 # 6210 <_sk_callback_sse41+0x71a> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0 DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9 @@ -16476,7 +16574,7 @@ _sk_byte_tables_sse41 LABEL PROC DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0 DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,13,233,57,0,0 ; movaps 0x39e9(%rip),%xmm9 # 6160 <_sk_callback_sse41+0x71b> + DB 68,15,40,13,169,58,0,0 ; movaps 0x3aa9(%rip),%xmm9 # 6220 <_sk_callback_sse41+0x72a> DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1 @@ -16570,7 +16668,7 @@ _sk_byte_tables_rgb_sse41 LABEL PROC DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0 DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,13,97,56,0,0 ; movaps 0x3861(%rip),%xmm9 # 6170 <_sk_callback_sse41+0x72b> + DB 68,15,40,13,33,57,0,0 ; movaps 0x3921(%rip),%xmm9 # 6230 <_sk_callback_sse41+0x73a> DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1 @@ -16747,31 +16845,31 @@ _sk_parametric_r_sse41 LABEL PROC DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,194 ; cvtdq2ps %xmm10,%xmm8 - DB 68,15,89,5,169,53,0,0 ; mulps 0x35a9(%rip),%xmm8 # 6180 <_sk_callback_sse41+0x73b> - DB 68,15,84,21,177,53,0,0 ; andps 0x35b1(%rip),%xmm10 # 6190 <_sk_callback_sse41+0x74b> - DB 68,15,86,21,185,53,0,0 ; orps 0x35b9(%rip),%xmm10 # 61a0 <_sk_callback_sse41+0x75b> - DB 68,15,88,5,193,53,0,0 ; addps 0x35c1(%rip),%xmm8 # 61b0 <_sk_callback_sse41+0x76b> - DB 68,15,40,37,201,53,0,0 ; movaps 0x35c9(%rip),%xmm12 # 61c0 <_sk_callback_sse41+0x77b> + DB 68,15,89,5,105,54,0,0 ; mulps 0x3669(%rip),%xmm8 # 6240 <_sk_callback_sse41+0x74a> + DB 68,15,84,21,113,54,0,0 ; andps 0x3671(%rip),%xmm10 # 6250 <_sk_callback_sse41+0x75a> + DB 68,15,86,21,121,54,0,0 ; orps 0x3679(%rip),%xmm10 # 6260 <_sk_callback_sse41+0x76a> + DB 68,15,88,5,129,54,0,0 ; addps 0x3681(%rip),%xmm8 # 6270 <_sk_callback_sse41+0x77a> + DB 68,15,40,37,137,54,0,0 ; movaps 0x3689(%rip),%xmm12 # 6280 <_sk_callback_sse41+0x78a> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,196 ; subps %xmm12,%xmm8 - DB 68,15,88,21,201,53,0,0 ; addps 0x35c9(%rip),%xmm10 # 61d0 <_sk_callback_sse41+0x78b> - DB 68,15,40,37,209,53,0,0 ; movaps 0x35d1(%rip),%xmm12 # 61e0 <_sk_callback_sse41+0x79b> + DB 68,15,88,21,137,54,0,0 ; addps 0x3689(%rip),%xmm10 # 6290 <_sk_callback_sse41+0x79a> + DB 68,15,40,37,145,54,0,0 ; movaps 0x3691(%rip),%xmm12 # 62a0 <_sk_callback_sse41+0x7aa> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,196 ; subps %xmm12,%xmm8 DB 69,15,89,195 ; mulps %xmm11,%xmm8 DB 102,69,15,58,8,208,1 ; roundps $0x1,%xmm8,%xmm10 DB 69,15,40,216 ; movaps %xmm8,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 68,15,88,5,190,53,0,0 ; addps 0x35be(%rip),%xmm8 # 61f0 <_sk_callback_sse41+0x7ab> - DB 68,15,40,21,198,53,0,0 ; movaps 0x35c6(%rip),%xmm10 # 6200 <_sk_callback_sse41+0x7bb> + DB 68,15,88,5,126,54,0,0 ; addps 0x367e(%rip),%xmm8 # 62b0 <_sk_callback_sse41+0x7ba> + DB 68,15,40,21,134,54,0,0 ; movaps 0x3686(%rip),%xmm10 # 62c0 <_sk_callback_sse41+0x7ca> DB 69,15,89,211 ; mulps %xmm11,%xmm10 DB 69,15,92,194 ; subps %xmm10,%xmm8 - DB 68,15,40,21,198,53,0,0 ; movaps 0x35c6(%rip),%xmm10 # 6210 <_sk_callback_sse41+0x7cb> + DB 68,15,40,21,134,54,0,0 ; movaps 0x3686(%rip),%xmm10 # 62d0 <_sk_callback_sse41+0x7da> DB 69,15,92,211 ; subps %xmm11,%xmm10 - DB 68,15,40,29,202,53,0,0 ; movaps 0x35ca(%rip),%xmm11 # 6220 <_sk_callback_sse41+0x7db> + DB 68,15,40,29,138,54,0,0 ; movaps 0x368a(%rip),%xmm11 # 62e0 <_sk_callback_sse41+0x7ea> DB 69,15,94,218 ; divps %xmm10,%xmm11 DB 69,15,88,216 ; addps %xmm8,%xmm11 - DB 68,15,89,29,202,53,0,0 ; mulps 0x35ca(%rip),%xmm11 # 6230 <_sk_callback_sse41+0x7eb> + DB 68,15,89,29,138,54,0,0 ; mulps 0x368a(%rip),%xmm11 # 62f0 <_sk_callback_sse41+0x7fa> DB 102,69,15,91,211 ; cvtps2dq %xmm11,%xmm10 DB 243,68,15,16,64,20 ; movss 0x14(%rax),%xmm8 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 @@ -16779,7 +16877,7 @@ _sk_parametric_r_sse41 LABEL PROC DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8 DB 15,87,192 ; xorps %xmm0,%xmm0 DB 68,15,95,192 ; maxps %xmm0,%xmm8 - DB 68,15,93,5,177,53,0,0 ; minps 0x35b1(%rip),%xmm8 # 6240 <_sk_callback_sse41+0x7fb> + DB 68,15,93,5,113,54,0,0 ; minps 0x3671(%rip),%xmm8 # 6300 <_sk_callback_sse41+0x80a> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -16807,31 +16905,31 @@ _sk_parametric_g_sse41 LABEL PROC DB 68,15,88,217 ; addps %xmm1,%xmm11 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12 - DB 68,15,89,37,82,53,0,0 ; mulps 0x3552(%rip),%xmm12 # 6250 <_sk_callback_sse41+0x80b> - DB 68,15,84,29,90,53,0,0 ; andps 0x355a(%rip),%xmm11 # 6260 <_sk_callback_sse41+0x81b> - DB 68,15,86,29,98,53,0,0 ; orps 0x3562(%rip),%xmm11 # 6270 <_sk_callback_sse41+0x82b> - DB 68,15,88,37,106,53,0,0 ; addps 0x356a(%rip),%xmm12 # 6280 <_sk_callback_sse41+0x83b> - DB 15,40,13,115,53,0,0 ; movaps 0x3573(%rip),%xmm1 # 6290 <_sk_callback_sse41+0x84b> + DB 68,15,89,37,18,54,0,0 ; mulps 0x3612(%rip),%xmm12 # 6310 <_sk_callback_sse41+0x81a> + DB 68,15,84,29,26,54,0,0 ; andps 0x361a(%rip),%xmm11 # 6320 <_sk_callback_sse41+0x82a> + DB 68,15,86,29,34,54,0,0 ; orps 0x3622(%rip),%xmm11 # 6330 <_sk_callback_sse41+0x83a> + DB 68,15,88,37,42,54,0,0 ; addps 0x362a(%rip),%xmm12 # 6340 <_sk_callback_sse41+0x84a> + DB 15,40,13,51,54,0,0 ; movaps 0x3633(%rip),%xmm1 # 6350 <_sk_callback_sse41+0x85a> DB 65,15,89,203 ; mulps %xmm11,%xmm1 DB 68,15,92,225 ; subps %xmm1,%xmm12 - DB 68,15,88,29,115,53,0,0 ; addps 0x3573(%rip),%xmm11 # 62a0 <_sk_callback_sse41+0x85b> - DB 15,40,13,124,53,0,0 ; movaps 0x357c(%rip),%xmm1 # 62b0 <_sk_callback_sse41+0x86b> + DB 68,15,88,29,51,54,0,0 ; addps 0x3633(%rip),%xmm11 # 6360 <_sk_callback_sse41+0x86a> + DB 15,40,13,60,54,0,0 ; movaps 0x363c(%rip),%xmm1 # 6370 <_sk_callback_sse41+0x87a> DB 65,15,94,203 ; divps %xmm11,%xmm1 DB 68,15,92,225 ; subps %xmm1,%xmm12 DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10 DB 69,15,40,220 ; movaps %xmm12,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 68,15,88,37,105,53,0,0 ; addps 0x3569(%rip),%xmm12 # 62c0 <_sk_callback_sse41+0x87b> - DB 15,40,13,114,53,0,0 ; movaps 0x3572(%rip),%xmm1 # 62d0 <_sk_callback_sse41+0x88b> + DB 68,15,88,37,41,54,0,0 ; addps 0x3629(%rip),%xmm12 # 6380 <_sk_callback_sse41+0x88a> + DB 15,40,13,50,54,0,0 ; movaps 0x3632(%rip),%xmm1 # 6390 <_sk_callback_sse41+0x89a> DB 65,15,89,203 ; mulps %xmm11,%xmm1 DB 68,15,92,225 ; subps %xmm1,%xmm12 - DB 68,15,40,21,114,53,0,0 ; movaps 0x3572(%rip),%xmm10 # 62e0 <_sk_callback_sse41+0x89b> + DB 68,15,40,21,50,54,0,0 ; movaps 0x3632(%rip),%xmm10 # 63a0 <_sk_callback_sse41+0x8aa> DB 69,15,92,211 ; subps %xmm11,%xmm10 - DB 15,40,13,119,53,0,0 ; movaps 0x3577(%rip),%xmm1 # 62f0 <_sk_callback_sse41+0x8ab> + DB 15,40,13,55,54,0,0 ; movaps 0x3637(%rip),%xmm1 # 63b0 <_sk_callback_sse41+0x8ba> DB 65,15,94,202 ; divps %xmm10,%xmm1 DB 65,15,88,204 ; addps %xmm12,%xmm1 - DB 15,89,13,120,53,0,0 ; mulps 0x3578(%rip),%xmm1 # 6300 <_sk_callback_sse41+0x8bb> + DB 15,89,13,56,54,0,0 ; mulps 0x3638(%rip),%xmm1 # 63c0 <_sk_callback_sse41+0x8ca> DB 102,68,15,91,209 ; cvtps2dq %xmm1,%xmm10 DB 243,15,16,72,20 ; movss 0x14(%rax),%xmm1 DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1 @@ -16839,7 +16937,7 @@ _sk_parametric_g_sse41 LABEL PROC DB 102,65,15,56,20,201 ; blendvps %xmm0,%xmm9,%xmm1 DB 15,87,192 ; xorps %xmm0,%xmm0 DB 15,95,200 ; maxps %xmm0,%xmm1 - DB 15,93,13,99,53,0,0 ; minps 0x3563(%rip),%xmm1 # 6310 <_sk_callback_sse41+0x8cb> + DB 15,93,13,35,54,0,0 ; minps 0x3623(%rip),%xmm1 # 63d0 <_sk_callback_sse41+0x8da> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -16867,31 +16965,31 @@ _sk_parametric_b_sse41 LABEL PROC DB 68,15,88,218 ; addps %xmm2,%xmm11 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12 - DB 68,15,89,37,4,53,0,0 ; mulps 0x3504(%rip),%xmm12 # 6320 <_sk_callback_sse41+0x8db> - DB 68,15,84,29,12,53,0,0 ; andps 0x350c(%rip),%xmm11 # 6330 <_sk_callback_sse41+0x8eb> - DB 68,15,86,29,20,53,0,0 ; orps 0x3514(%rip),%xmm11 # 6340 <_sk_callback_sse41+0x8fb> - DB 68,15,88,37,28,53,0,0 ; addps 0x351c(%rip),%xmm12 # 6350 <_sk_callback_sse41+0x90b> - DB 15,40,21,37,53,0,0 ; movaps 0x3525(%rip),%xmm2 # 6360 <_sk_callback_sse41+0x91b> + DB 68,15,89,37,196,53,0,0 ; mulps 0x35c4(%rip),%xmm12 # 63e0 <_sk_callback_sse41+0x8ea> + DB 68,15,84,29,204,53,0,0 ; andps 0x35cc(%rip),%xmm11 # 63f0 <_sk_callback_sse41+0x8fa> + DB 68,15,86,29,212,53,0,0 ; orps 0x35d4(%rip),%xmm11 # 6400 <_sk_callback_sse41+0x90a> + DB 68,15,88,37,220,53,0,0 ; addps 0x35dc(%rip),%xmm12 # 6410 <_sk_callback_sse41+0x91a> + DB 15,40,21,229,53,0,0 ; movaps 0x35e5(%rip),%xmm2 # 6420 <_sk_callback_sse41+0x92a> DB 65,15,89,211 ; mulps %xmm11,%xmm2 DB 68,15,92,226 ; subps %xmm2,%xmm12 - DB 68,15,88,29,37,53,0,0 ; addps 0x3525(%rip),%xmm11 # 6370 <_sk_callback_sse41+0x92b> - DB 15,40,21,46,53,0,0 ; movaps 0x352e(%rip),%xmm2 # 6380 <_sk_callback_sse41+0x93b> + DB 68,15,88,29,229,53,0,0 ; addps 0x35e5(%rip),%xmm11 # 6430 <_sk_callback_sse41+0x93a> + DB 15,40,21,238,53,0,0 ; movaps 0x35ee(%rip),%xmm2 # 6440 <_sk_callback_sse41+0x94a> DB 65,15,94,211 ; divps %xmm11,%xmm2 DB 68,15,92,226 ; subps %xmm2,%xmm12 DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10 DB 69,15,40,220 ; movaps %xmm12,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 68,15,88,37,27,53,0,0 ; addps 0x351b(%rip),%xmm12 # 6390 <_sk_callback_sse41+0x94b> - DB 15,40,21,36,53,0,0 ; movaps 0x3524(%rip),%xmm2 # 63a0 <_sk_callback_sse41+0x95b> + DB 68,15,88,37,219,53,0,0 ; addps 0x35db(%rip),%xmm12 # 6450 <_sk_callback_sse41+0x95a> + DB 15,40,21,228,53,0,0 ; movaps 0x35e4(%rip),%xmm2 # 6460 <_sk_callback_sse41+0x96a> DB 65,15,89,211 ; mulps %xmm11,%xmm2 DB 68,15,92,226 ; subps %xmm2,%xmm12 - DB 68,15,40,21,36,53,0,0 ; movaps 0x3524(%rip),%xmm10 # 63b0 <_sk_callback_sse41+0x96b> + DB 68,15,40,21,228,53,0,0 ; movaps 0x35e4(%rip),%xmm10 # 6470 <_sk_callback_sse41+0x97a> DB 69,15,92,211 ; subps %xmm11,%xmm10 - DB 15,40,21,41,53,0,0 ; movaps 0x3529(%rip),%xmm2 # 63c0 <_sk_callback_sse41+0x97b> + DB 15,40,21,233,53,0,0 ; movaps 0x35e9(%rip),%xmm2 # 6480 <_sk_callback_sse41+0x98a> DB 65,15,94,210 ; divps %xmm10,%xmm2 DB 65,15,88,212 ; addps %xmm12,%xmm2 - DB 15,89,21,42,53,0,0 ; mulps 0x352a(%rip),%xmm2 # 63d0 <_sk_callback_sse41+0x98b> + DB 15,89,21,234,53,0,0 ; mulps 0x35ea(%rip),%xmm2 # 6490 <_sk_callback_sse41+0x99a> DB 102,68,15,91,210 ; cvtps2dq %xmm2,%xmm10 DB 243,15,16,80,20 ; movss 0x14(%rax),%xmm2 DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2 @@ -16899,7 +16997,7 @@ _sk_parametric_b_sse41 LABEL PROC DB 102,65,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm2 DB 15,87,192 ; xorps %xmm0,%xmm0 DB 15,95,208 ; maxps %xmm0,%xmm2 - DB 15,93,21,21,53,0,0 ; minps 0x3515(%rip),%xmm2 # 63e0 <_sk_callback_sse41+0x99b> + DB 15,93,21,213,53,0,0 ; minps 0x35d5(%rip),%xmm2 # 64a0 <_sk_callback_sse41+0x9aa> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -16927,31 +17025,31 @@ _sk_parametric_a_sse41 LABEL PROC DB 68,15,88,219 ; addps %xmm3,%xmm11 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12 - DB 68,15,89,37,182,52,0,0 ; mulps 0x34b6(%rip),%xmm12 # 63f0 <_sk_callback_sse41+0x9ab> - DB 68,15,84,29,190,52,0,0 ; andps 0x34be(%rip),%xmm11 # 6400 <_sk_callback_sse41+0x9bb> - DB 68,15,86,29,198,52,0,0 ; orps 0x34c6(%rip),%xmm11 # 6410 <_sk_callback_sse41+0x9cb> - DB 68,15,88,37,206,52,0,0 ; addps 0x34ce(%rip),%xmm12 # 6420 <_sk_callback_sse41+0x9db> - DB 15,40,29,215,52,0,0 ; movaps 0x34d7(%rip),%xmm3 # 6430 <_sk_callback_sse41+0x9eb> + DB 68,15,89,37,118,53,0,0 ; mulps 0x3576(%rip),%xmm12 # 64b0 <_sk_callback_sse41+0x9ba> + DB 68,15,84,29,126,53,0,0 ; andps 0x357e(%rip),%xmm11 # 64c0 <_sk_callback_sse41+0x9ca> + DB 68,15,86,29,134,53,0,0 ; orps 0x3586(%rip),%xmm11 # 64d0 <_sk_callback_sse41+0x9da> + DB 68,15,88,37,142,53,0,0 ; addps 0x358e(%rip),%xmm12 # 64e0 <_sk_callback_sse41+0x9ea> + DB 15,40,29,151,53,0,0 ; movaps 0x3597(%rip),%xmm3 # 64f0 <_sk_callback_sse41+0x9fa> DB 65,15,89,219 ; mulps %xmm11,%xmm3 DB 68,15,92,227 ; subps %xmm3,%xmm12 - DB 68,15,88,29,215,52,0,0 ; addps 0x34d7(%rip),%xmm11 # 6440 <_sk_callback_sse41+0x9fb> - DB 15,40,29,224,52,0,0 ; movaps 0x34e0(%rip),%xmm3 # 6450 <_sk_callback_sse41+0xa0b> + DB 68,15,88,29,151,53,0,0 ; addps 0x3597(%rip),%xmm11 # 6500 <_sk_callback_sse41+0xa0a> + DB 15,40,29,160,53,0,0 ; movaps 0x35a0(%rip),%xmm3 # 6510 <_sk_callback_sse41+0xa1a> DB 65,15,94,219 ; divps %xmm11,%xmm3 DB 68,15,92,227 ; subps %xmm3,%xmm12 DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10 DB 69,15,40,220 ; movaps %xmm12,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 68,15,88,37,205,52,0,0 ; addps 0x34cd(%rip),%xmm12 # 6460 <_sk_callback_sse41+0xa1b> - DB 15,40,29,214,52,0,0 ; movaps 0x34d6(%rip),%xmm3 # 6470 <_sk_callback_sse41+0xa2b> + DB 68,15,88,37,141,53,0,0 ; addps 0x358d(%rip),%xmm12 # 6520 <_sk_callback_sse41+0xa2a> + DB 15,40,29,150,53,0,0 ; movaps 0x3596(%rip),%xmm3 # 6530 <_sk_callback_sse41+0xa3a> DB 65,15,89,219 ; mulps %xmm11,%xmm3 DB 68,15,92,227 ; subps %xmm3,%xmm12 - DB 68,15,40,21,214,52,0,0 ; movaps 0x34d6(%rip),%xmm10 # 6480 <_sk_callback_sse41+0xa3b> + DB 68,15,40,21,150,53,0,0 ; movaps 0x3596(%rip),%xmm10 # 6540 <_sk_callback_sse41+0xa4a> DB 69,15,92,211 ; subps %xmm11,%xmm10 - DB 15,40,29,219,52,0,0 ; movaps 0x34db(%rip),%xmm3 # 6490 <_sk_callback_sse41+0xa4b> + DB 15,40,29,155,53,0,0 ; movaps 0x359b(%rip),%xmm3 # 6550 <_sk_callback_sse41+0xa5a> DB 65,15,94,218 ; divps %xmm10,%xmm3 DB 65,15,88,220 ; addps %xmm12,%xmm3 - DB 15,89,29,220,52,0,0 ; mulps 0x34dc(%rip),%xmm3 # 64a0 <_sk_callback_sse41+0xa5b> + DB 15,89,29,156,53,0,0 ; mulps 0x359c(%rip),%xmm3 # 6560 <_sk_callback_sse41+0xa6a> DB 102,68,15,91,211 ; cvtps2dq %xmm3,%xmm10 DB 243,15,16,88,20 ; movss 0x14(%rax),%xmm3 DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3 @@ -16959,7 +17057,7 @@ _sk_parametric_a_sse41 LABEL PROC DB 102,65,15,56,20,217 ; blendvps %xmm0,%xmm9,%xmm3 DB 15,87,192 ; xorps %xmm0,%xmm0 DB 15,95,216 ; maxps %xmm0,%xmm3 - DB 15,93,29,199,52,0,0 ; minps 0x34c7(%rip),%xmm3 # 64b0 <_sk_callback_sse41+0xa6b> + DB 15,93,29,135,53,0,0 ; minps 0x3587(%rip),%xmm3 # 6570 <_sk_callback_sse41+0xa7a> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -16967,29 +17065,29 @@ _sk_parametric_a_sse41 LABEL PROC PUBLIC _sk_lab_to_xyz_sse41 _sk_lab_to_xyz_sse41 LABEL PROC DB 68,15,40,192 ; movaps %xmm0,%xmm8 - DB 68,15,89,5,195,52,0,0 ; mulps 0x34c3(%rip),%xmm8 # 64c0 <_sk_callback_sse41+0xa7b> - DB 68,15,40,13,203,52,0,0 ; movaps 0x34cb(%rip),%xmm9 # 64d0 <_sk_callback_sse41+0xa8b> + DB 68,15,89,5,131,53,0,0 ; mulps 0x3583(%rip),%xmm8 # 6580 <_sk_callback_sse41+0xa8a> + DB 68,15,40,13,139,53,0,0 ; movaps 0x358b(%rip),%xmm9 # 6590 <_sk_callback_sse41+0xa9a> DB 65,15,89,201 ; mulps %xmm9,%xmm1 - DB 15,40,5,208,52,0,0 ; movaps 0x34d0(%rip),%xmm0 # 64e0 <_sk_callback_sse41+0xa9b> + DB 15,40,5,144,53,0,0 ; movaps 0x3590(%rip),%xmm0 # 65a0 <_sk_callback_sse41+0xaaa> DB 15,88,200 ; addps %xmm0,%xmm1 DB 65,15,89,209 ; mulps %xmm9,%xmm2 DB 15,88,208 ; addps %xmm0,%xmm2 - DB 68,15,88,5,206,52,0,0 ; addps 0x34ce(%rip),%xmm8 # 64f0 <_sk_callback_sse41+0xaab> - DB 68,15,89,5,214,52,0,0 ; mulps 0x34d6(%rip),%xmm8 # 6500 <_sk_callback_sse41+0xabb> - DB 15,89,13,223,52,0,0 ; mulps 0x34df(%rip),%xmm1 # 6510 <_sk_callback_sse41+0xacb> + DB 68,15,88,5,142,53,0,0 ; addps 0x358e(%rip),%xmm8 # 65b0 <_sk_callback_sse41+0xaba> + DB 68,15,89,5,150,53,0,0 ; mulps 0x3596(%rip),%xmm8 # 65c0 <_sk_callback_sse41+0xaca> + DB 15,89,13,159,53,0,0 ; mulps 0x359f(%rip),%xmm1 # 65d0 <_sk_callback_sse41+0xada> DB 65,15,88,200 ; addps %xmm8,%xmm1 - DB 15,89,21,228,52,0,0 ; mulps 0x34e4(%rip),%xmm2 # 6520 <_sk_callback_sse41+0xadb> + DB 15,89,21,164,53,0,0 ; mulps 0x35a4(%rip),%xmm2 # 65e0 <_sk_callback_sse41+0xaea> DB 69,15,40,208 ; movaps %xmm8,%xmm10 DB 68,15,92,210 ; subps %xmm2,%xmm10 DB 68,15,40,217 ; movaps %xmm1,%xmm11 DB 69,15,89,219 ; mulps %xmm11,%xmm11 DB 68,15,89,217 ; mulps %xmm1,%xmm11 - DB 68,15,40,13,216,52,0,0 ; movaps 0x34d8(%rip),%xmm9 # 6530 <_sk_callback_sse41+0xaeb> + DB 68,15,40,13,152,53,0,0 ; movaps 0x3598(%rip),%xmm9 # 65f0 <_sk_callback_sse41+0xafa> DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0 - DB 15,40,21,216,52,0,0 ; movaps 0x34d8(%rip),%xmm2 # 6540 <_sk_callback_sse41+0xafb> + DB 15,40,21,152,53,0,0 ; movaps 0x3598(%rip),%xmm2 # 6600 <_sk_callback_sse41+0xb0a> DB 15,88,202 ; addps %xmm2,%xmm1 - DB 68,15,40,37,221,52,0,0 ; movaps 0x34dd(%rip),%xmm12 # 6550 <_sk_callback_sse41+0xb0b> + DB 68,15,40,37,157,53,0,0 ; movaps 0x359d(%rip),%xmm12 # 6610 <_sk_callback_sse41+0xb1a> DB 65,15,89,204 ; mulps %xmm12,%xmm1 DB 102,65,15,56,20,203 ; blendvps %xmm0,%xmm11,%xmm1 DB 69,15,40,216 ; movaps %xmm8,%xmm11 @@ -17008,8 +17106,8 @@ _sk_lab_to_xyz_sse41 LABEL PROC DB 65,15,89,212 ; mulps %xmm12,%xmm2 DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 102,65,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm2 - DB 15,89,13,150,52,0,0 ; mulps 0x3496(%rip),%xmm1 # 6560 <_sk_callback_sse41+0xb1b> - DB 15,89,21,159,52,0,0 ; mulps 0x349f(%rip),%xmm2 # 6570 <_sk_callback_sse41+0xb2b> + DB 15,89,13,86,53,0,0 ; mulps 0x3556(%rip),%xmm1 # 6620 <_sk_callback_sse41+0xb2a> + DB 15,89,21,95,53,0,0 ; mulps 0x355f(%rip),%xmm2 # 6630 <_sk_callback_sse41+0xb3a> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,40,193 ; movaps %xmm1,%xmm0 DB 65,15,40,200 ; movaps %xmm8,%xmm1 @@ -17022,9 +17120,9 @@ _sk_load_a8_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,39 ; jne 310d <_sk_load_a8_sse41+0x31> DB 102,65,15,56,49,4,18 ; pmovzxbd (%r10,%rdx,1),%xmm0 - DB 102,15,219,5,139,52,0,0 ; pand 0x348b(%rip),%xmm0 # 6580 <_sk_callback_sse41+0xb3b> + DB 102,15,219,5,75,53,0,0 ; pand 0x354b(%rip),%xmm0 # 6640 <_sk_callback_sse41+0xb4a> DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3 - DB 15,89,29,145,52,0,0 ; mulps 0x3491(%rip),%xmm3 # 6590 <_sk_callback_sse41+0xb4b> + DB 15,89,29,81,53,0,0 ; mulps 0x3551(%rip),%xmm3 # 6650 <_sk_callback_sse41+0xb5a> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 @@ -17058,9 +17156,9 @@ _sk_load_a8_dst_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,39 ; jne 318b <_sk_load_a8_dst_sse41+0x31> DB 102,65,15,56,49,36,18 ; pmovzxbd (%r10,%rdx,1),%xmm4 - DB 102,15,219,37,45,52,0,0 ; pand 0x342d(%rip),%xmm4 # 65a0 <_sk_callback_sse41+0xb5b> + DB 102,15,219,37,237,52,0,0 ; pand 0x34ed(%rip),%xmm4 # 6660 <_sk_callback_sse41+0xb6a> DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7 - DB 15,89,61,51,52,0,0 ; mulps 0x3433(%rip),%xmm7 # 65b0 <_sk_callback_sse41+0xb6b> + DB 15,89,61,243,52,0,0 ; mulps 0x34f3(%rip),%xmm7 # 6670 <_sk_callback_sse41+0xb7a> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,228 ; xorps %xmm4,%xmm4 DB 102,15,239,237 ; pxor %xmm5,%xmm5 @@ -17112,7 +17210,7 @@ _sk_gather_a8_sse41 LABEL PROC DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0 DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0 DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3 - DB 15,89,29,120,51,0,0 ; mulps 0x3378(%rip),%xmm3 # 65c0 <_sk_callback_sse41+0xb7b> + DB 15,89,29,56,52,0,0 ; mulps 0x3438(%rip),%xmm3 # 6680 <_sk_callback_sse41+0xb8a> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 @@ -17125,7 +17223,7 @@ _sk_store_a8_sse41 LABEL PROC DB 72,131,236,4 ; sub $0x4,%rsp DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 - DB 68,15,40,5,103,51,0,0 ; movaps 0x3367(%rip),%xmm8 # 65d0 <_sk_callback_sse41+0xb8b> + DB 68,15,40,5,39,52,0,0 ; movaps 0x3427(%rip),%xmm8 # 6690 <_sk_callback_sse41+0xb9a> DB 68,15,89,195 ; mulps %xmm3,%xmm8 DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8 DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8 @@ -17147,7 +17245,7 @@ _sk_store_a8_sse41 LABEL PROC DB 65,128,249,3 ; cmp $0x3,%r9b DB 117,217 ; jne 328b <_sk_store_a8_sse41+0x33> DB 102,69,15,58,20,68,18,2,8 ; pextrb $0x8,%xmm8,0x2(%r10,%rdx,1) - DB 102,68,15,56,0,5,27,51,0,0 ; pshufb 0x331b(%rip),%xmm8 # 65e0 <_sk_callback_sse41+0xb9b> + DB 102,68,15,56,0,5,219,51,0,0 ; pshufb 0x33db(%rip),%xmm8 # 66a0 <_sk_callback_sse41+0xbaa> DB 102,69,15,58,21,4,18,0 ; pextrw $0x0,%xmm8,(%r10,%rdx,1) DB 235,188 ; jmp 328b <_sk_store_a8_sse41+0x33> DB 102,69,15,58,20,4,18,0 ; pextrb $0x0,%xmm8,(%r10,%rdx,1) @@ -17160,11 +17258,11 @@ _sk_load_g8_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,42 ; jne 330d <_sk_load_g8_sse41+0x34> DB 102,65,15,56,49,4,18 ; pmovzxbd (%r10,%rdx,1),%xmm0 - DB 102,15,219,5,254,50,0,0 ; pand 0x32fe(%rip),%xmm0 # 65f0 <_sk_callback_sse41+0xbab> + DB 102,15,219,5,190,51,0,0 ; pand 0x33be(%rip),%xmm0 # 66b0 <_sk_callback_sse41+0xbba> DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,4,51,0,0 ; mulps 0x3304(%rip),%xmm0 # 6600 <_sk_callback_sse41+0xbbb> + DB 15,89,5,196,51,0,0 ; mulps 0x33c4(%rip),%xmm0 # 66c0 <_sk_callback_sse41+0xbca> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,11,51,0,0 ; movaps 0x330b(%rip),%xmm3 # 6610 <_sk_callback_sse41+0xbcb> + DB 15,40,29,203,51,0,0 ; movaps 0x33cb(%rip),%xmm3 # 66d0 <_sk_callback_sse41+0xbda> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 255,224 ; jmpq *%rax @@ -17196,11 +17294,11 @@ _sk_load_g8_dst_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,42 ; jne 338e <_sk_load_g8_dst_sse41+0x34> DB 102,65,15,56,49,36,18 ; pmovzxbd (%r10,%rdx,1),%xmm4 - DB 102,15,219,37,173,50,0,0 ; pand 0x32ad(%rip),%xmm4 # 6620 <_sk_callback_sse41+0xbdb> + DB 102,15,219,37,109,51,0,0 ; pand 0x336d(%rip),%xmm4 # 66e0 <_sk_callback_sse41+0xbea> DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,37,179,50,0,0 ; mulps 0x32b3(%rip),%xmm4 # 6630 <_sk_callback_sse41+0xbeb> + DB 15,89,37,115,51,0,0 ; mulps 0x3373(%rip),%xmm4 # 66f0 <_sk_callback_sse41+0xbfa> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,61,186,50,0,0 ; movaps 0x32ba(%rip),%xmm7 # 6640 <_sk_callback_sse41+0xbfb> + DB 15,40,61,122,51,0,0 ; movaps 0x337a(%rip),%xmm7 # 6700 <_sk_callback_sse41+0xc0a> DB 15,40,236 ; movaps %xmm4,%xmm5 DB 15,40,244 ; movaps %xmm4,%xmm6 DB 255,224 ; jmpq *%rax @@ -17250,9 +17348,9 @@ _sk_gather_g8_sse41 LABEL PROC DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0 DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,5,50,0,0 ; mulps 0x3205(%rip),%xmm0 # 6650 <_sk_callback_sse41+0xc0b> + DB 15,89,5,197,50,0,0 ; mulps 0x32c5(%rip),%xmm0 # 6710 <_sk_callback_sse41+0xc1a> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,12,50,0,0 ; movaps 0x320c(%rip),%xmm3 # 6660 <_sk_callback_sse41+0xc1b> + DB 15,40,29,204,50,0,0 ; movaps 0x32cc(%rip),%xmm3 # 6720 <_sk_callback_sse41+0xc2a> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 91 ; pop %rbx @@ -17298,17 +17396,17 @@ _sk_gather_i8_sse41 LABEL PROC DB 102,15,58,34,28,24,1 ; pinsrd $0x1,(%rax,%rbx,1),%xmm3 DB 102,66,15,58,34,28,152,2 ; pinsrd $0x2,(%rax,%r11,4),%xmm3 DB 102,66,15,58,34,28,16,3 ; pinsrd $0x3,(%rax,%r10,1),%xmm3 - DB 102,15,111,5,95,49,0,0 ; movdqa 0x315f(%rip),%xmm0 # 6670 <_sk_callback_sse41+0xc2b> + DB 102,15,111,5,31,50,0,0 ; movdqa 0x321f(%rip),%xmm0 # 6730 <_sk_callback_sse41+0xc3a> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,96,49,0,0 ; movaps 0x3160(%rip),%xmm8 # 6680 <_sk_callback_sse41+0xc3b> + DB 68,15,40,5,32,50,0,0 ; movaps 0x3220(%rip),%xmm8 # 6740 <_sk_callback_sse41+0xc4a> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 - DB 102,15,56,0,13,95,49,0,0 ; pshufb 0x315f(%rip),%xmm1 # 6690 <_sk_callback_sse41+0xc4b> + DB 102,15,56,0,13,31,50,0,0 ; pshufb 0x321f(%rip),%xmm1 # 6750 <_sk_callback_sse41+0xc5a> DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,111,211 ; movdqa %xmm3,%xmm2 - DB 102,15,56,0,21,91,49,0,0 ; pshufb 0x315b(%rip),%xmm2 # 66a0 <_sk_callback_sse41+0xc5b> + DB 102,15,56,0,21,27,50,0,0 ; pshufb 0x321b(%rip),%xmm2 # 6760 <_sk_callback_sse41+0xc6a> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,15,114,211,24 ; psrld $0x18,%xmm3 @@ -17326,19 +17424,19 @@ _sk_load_565_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,80 ; jne 35b9 <_sk_load_565_sse41+0x5a> DB 102,65,15,56,51,20,82 ; pmovzxwd (%r10,%rdx,2),%xmm2 - DB 102,15,111,5,56,49,0,0 ; movdqa 0x3138(%rip),%xmm0 # 66b0 <_sk_callback_sse41+0xc6b> + DB 102,15,111,5,248,49,0,0 ; movdqa 0x31f8(%rip),%xmm0 # 6770 <_sk_callback_sse41+0xc7a> DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,58,49,0,0 ; mulps 0x313a(%rip),%xmm0 # 66c0 <_sk_callback_sse41+0xc7b> - DB 102,15,111,13,66,49,0,0 ; movdqa 0x3142(%rip),%xmm1 # 66d0 <_sk_callback_sse41+0xc8b> + DB 15,89,5,250,49,0,0 ; mulps 0x31fa(%rip),%xmm0 # 6780 <_sk_callback_sse41+0xc8a> + DB 102,15,111,13,2,50,0,0 ; movdqa 0x3202(%rip),%xmm1 # 6790 <_sk_callback_sse41+0xc9a> DB 102,15,219,202 ; pand %xmm2,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,68,49,0,0 ; mulps 0x3144(%rip),%xmm1 # 66e0 <_sk_callback_sse41+0xc9b> - DB 102,15,219,21,76,49,0,0 ; pand 0x314c(%rip),%xmm2 # 66f0 <_sk_callback_sse41+0xcab> + DB 15,89,13,4,50,0,0 ; mulps 0x3204(%rip),%xmm1 # 67a0 <_sk_callback_sse41+0xcaa> + DB 102,15,219,21,12,50,0,0 ; pand 0x320c(%rip),%xmm2 # 67b0 <_sk_callback_sse41+0xcba> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,82,49,0,0 ; mulps 0x3152(%rip),%xmm2 # 6700 <_sk_callback_sse41+0xcbb> + DB 15,89,21,18,50,0,0 ; mulps 0x3212(%rip),%xmm2 # 67c0 <_sk_callback_sse41+0xcca> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,89,49,0,0 ; movaps 0x3159(%rip),%xmm3 # 6710 <_sk_callback_sse41+0xccb> + DB 15,40,29,25,50,0,0 ; movaps 0x3219(%rip),%xmm3 # 67d0 <_sk_callback_sse41+0xcda> DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b @@ -17367,19 +17465,19 @@ _sk_load_565_dst_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,80 ; jne 3663 <_sk_load_565_dst_sse41+0x5a> DB 102,65,15,56,51,52,82 ; pmovzxwd (%r10,%rdx,2),%xmm6 - DB 102,15,111,37,254,48,0,0 ; movdqa 0x30fe(%rip),%xmm4 # 6720 <_sk_callback_sse41+0xcdb> + DB 102,15,111,37,190,49,0,0 ; movdqa 0x31be(%rip),%xmm4 # 67e0 <_sk_callback_sse41+0xcea> DB 102,15,219,230 ; pand %xmm6,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,37,0,49,0,0 ; mulps 0x3100(%rip),%xmm4 # 6730 <_sk_callback_sse41+0xceb> - DB 102,15,111,45,8,49,0,0 ; movdqa 0x3108(%rip),%xmm5 # 6740 <_sk_callback_sse41+0xcfb> + DB 15,89,37,192,49,0,0 ; mulps 0x31c0(%rip),%xmm4 # 67f0 <_sk_callback_sse41+0xcfa> + DB 102,15,111,45,200,49,0,0 ; movdqa 0x31c8(%rip),%xmm5 # 6800 <_sk_callback_sse41+0xd0a> DB 102,15,219,238 ; pand %xmm6,%xmm5 DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 - DB 15,89,45,10,49,0,0 ; mulps 0x310a(%rip),%xmm5 # 6750 <_sk_callback_sse41+0xd0b> - DB 102,15,219,53,18,49,0,0 ; pand 0x3112(%rip),%xmm6 # 6760 <_sk_callback_sse41+0xd1b> + DB 15,89,45,202,49,0,0 ; mulps 0x31ca(%rip),%xmm5 # 6810 <_sk_callback_sse41+0xd1a> + DB 102,15,219,53,210,49,0,0 ; pand 0x31d2(%rip),%xmm6 # 6820 <_sk_callback_sse41+0xd2a> DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 - DB 15,89,53,24,49,0,0 ; mulps 0x3118(%rip),%xmm6 # 6770 <_sk_callback_sse41+0xd2b> + DB 15,89,53,216,49,0,0 ; mulps 0x31d8(%rip),%xmm6 # 6830 <_sk_callback_sse41+0xd3a> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,61,31,49,0,0 ; movaps 0x311f(%rip),%xmm7 # 6780 <_sk_callback_sse41+0xd3b> + DB 15,40,61,223,49,0,0 ; movaps 0x31df(%rip),%xmm7 # 6840 <_sk_callback_sse41+0xd4a> DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b @@ -17425,19 +17523,19 @@ _sk_gather_565_sse41 LABEL PROC DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0 DB 102,15,56,51,208 ; pmovzxwd %xmm0,%xmm2 - DB 102,15,111,5,115,48,0,0 ; movdqa 0x3073(%rip),%xmm0 # 6790 <_sk_callback_sse41+0xd4b> + DB 102,15,111,5,51,49,0,0 ; movdqa 0x3133(%rip),%xmm0 # 6850 <_sk_callback_sse41+0xd5a> DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,117,48,0,0 ; mulps 0x3075(%rip),%xmm0 # 67a0 <_sk_callback_sse41+0xd5b> - DB 102,15,111,13,125,48,0,0 ; movdqa 0x307d(%rip),%xmm1 # 67b0 <_sk_callback_sse41+0xd6b> + DB 15,89,5,53,49,0,0 ; mulps 0x3135(%rip),%xmm0 # 6860 <_sk_callback_sse41+0xd6a> + DB 102,15,111,13,61,49,0,0 ; movdqa 0x313d(%rip),%xmm1 # 6870 <_sk_callback_sse41+0xd7a> DB 102,15,219,202 ; pand %xmm2,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,127,48,0,0 ; mulps 0x307f(%rip),%xmm1 # 67c0 <_sk_callback_sse41+0xd7b> - DB 102,15,219,21,135,48,0,0 ; pand 0x3087(%rip),%xmm2 # 67d0 <_sk_callback_sse41+0xd8b> + DB 15,89,13,63,49,0,0 ; mulps 0x313f(%rip),%xmm1 # 6880 <_sk_callback_sse41+0xd8a> + DB 102,15,219,21,71,49,0,0 ; pand 0x3147(%rip),%xmm2 # 6890 <_sk_callback_sse41+0xd9a> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,141,48,0,0 ; mulps 0x308d(%rip),%xmm2 # 67e0 <_sk_callback_sse41+0xd9b> + DB 15,89,21,77,49,0,0 ; mulps 0x314d(%rip),%xmm2 # 68a0 <_sk_callback_sse41+0xdaa> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,148,48,0,0 ; movaps 0x3094(%rip),%xmm3 # 67f0 <_sk_callback_sse41+0xdab> + DB 15,40,29,84,49,0,0 ; movaps 0x3154(%rip),%xmm3 # 68b0 <_sk_callback_sse41+0xdba> DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax @@ -17445,12 +17543,12 @@ PUBLIC _sk_store_565_sse41 _sk_store_565_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax - DB 68,15,40,5,148,48,0,0 ; movaps 0x3094(%rip),%xmm8 # 6800 <_sk_callback_sse41+0xdbb> + DB 68,15,40,5,84,49,0,0 ; movaps 0x3154(%rip),%xmm8 # 68c0 <_sk_callback_sse41+0xdca> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9 - DB 68,15,40,21,137,48,0,0 ; movaps 0x3089(%rip),%xmm10 # 6810 <_sk_callback_sse41+0xdcb> + DB 68,15,40,21,73,49,0,0 ; movaps 0x3149(%rip),%xmm10 # 68d0 <_sk_callback_sse41+0xdda> DB 68,15,89,209 ; mulps %xmm1,%xmm10 DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10 DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10 @@ -17487,21 +17585,21 @@ _sk_load_4444_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,95 ; jne 3867 <_sk_load_4444_sse41+0x69> DB 102,65,15,56,51,28,82 ; pmovzxwd (%r10,%rdx,2),%xmm3 - DB 102,15,111,5,9,48,0,0 ; movdqa 0x3009(%rip),%xmm0 # 6820 <_sk_callback_sse41+0xddb> + DB 102,15,111,5,201,48,0,0 ; movdqa 0x30c9(%rip),%xmm0 # 68e0 <_sk_callback_sse41+0xdea> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,11,48,0,0 ; mulps 0x300b(%rip),%xmm0 # 6830 <_sk_callback_sse41+0xdeb> - DB 102,15,111,13,19,48,0,0 ; movdqa 0x3013(%rip),%xmm1 # 6840 <_sk_callback_sse41+0xdfb> + DB 15,89,5,203,48,0,0 ; mulps 0x30cb(%rip),%xmm0 # 68f0 <_sk_callback_sse41+0xdfa> + DB 102,15,111,13,211,48,0,0 ; movdqa 0x30d3(%rip),%xmm1 # 6900 <_sk_callback_sse41+0xe0a> DB 102,15,219,203 ; pand %xmm3,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,21,48,0,0 ; mulps 0x3015(%rip),%xmm1 # 6850 <_sk_callback_sse41+0xe0b> - DB 102,15,111,21,29,48,0,0 ; movdqa 0x301d(%rip),%xmm2 # 6860 <_sk_callback_sse41+0xe1b> + DB 15,89,13,213,48,0,0 ; mulps 0x30d5(%rip),%xmm1 # 6910 <_sk_callback_sse41+0xe1a> + DB 102,15,111,21,221,48,0,0 ; movdqa 0x30dd(%rip),%xmm2 # 6920 <_sk_callback_sse41+0xe2a> DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,31,48,0,0 ; mulps 0x301f(%rip),%xmm2 # 6870 <_sk_callback_sse41+0xe2b> - DB 102,15,219,29,39,48,0,0 ; pand 0x3027(%rip),%xmm3 # 6880 <_sk_callback_sse41+0xe3b> + DB 15,89,21,223,48,0,0 ; mulps 0x30df(%rip),%xmm2 # 6930 <_sk_callback_sse41+0xe3a> + DB 102,15,219,29,231,48,0,0 ; pand 0x30e7(%rip),%xmm3 # 6940 <_sk_callback_sse41+0xe4a> DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,45,48,0,0 ; mulps 0x302d(%rip),%xmm3 # 6890 <_sk_callback_sse41+0xe4b> + DB 15,89,29,237,48,0,0 ; mulps 0x30ed(%rip),%xmm3 # 6950 <_sk_callback_sse41+0xe5a> DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d @@ -17531,21 +17629,21 @@ _sk_load_4444_dst_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,95 ; jne 3920 <_sk_load_4444_dst_sse41+0x69> DB 102,65,15,56,51,60,82 ; pmovzxwd (%r10,%rdx,2),%xmm7 - DB 102,15,111,37,208,47,0,0 ; movdqa 0x2fd0(%rip),%xmm4 # 68a0 <_sk_callback_sse41+0xe5b> + DB 102,15,111,37,144,48,0,0 ; movdqa 0x3090(%rip),%xmm4 # 6960 <_sk_callback_sse41+0xe6a> DB 102,15,219,231 ; pand %xmm7,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,37,210,47,0,0 ; mulps 0x2fd2(%rip),%xmm4 # 68b0 <_sk_callback_sse41+0xe6b> - DB 102,15,111,45,218,47,0,0 ; movdqa 0x2fda(%rip),%xmm5 # 68c0 <_sk_callback_sse41+0xe7b> + DB 15,89,37,146,48,0,0 ; mulps 0x3092(%rip),%xmm4 # 6970 <_sk_callback_sse41+0xe7a> + DB 102,15,111,45,154,48,0,0 ; movdqa 0x309a(%rip),%xmm5 # 6980 <_sk_callback_sse41+0xe8a> DB 102,15,219,239 ; pand %xmm7,%xmm5 DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 - DB 15,89,45,220,47,0,0 ; mulps 0x2fdc(%rip),%xmm5 # 68d0 <_sk_callback_sse41+0xe8b> - DB 102,15,111,53,228,47,0,0 ; movdqa 0x2fe4(%rip),%xmm6 # 68e0 <_sk_callback_sse41+0xe9b> + DB 15,89,45,156,48,0,0 ; mulps 0x309c(%rip),%xmm5 # 6990 <_sk_callback_sse41+0xe9a> + DB 102,15,111,53,164,48,0,0 ; movdqa 0x30a4(%rip),%xmm6 # 69a0 <_sk_callback_sse41+0xeaa> DB 102,15,219,247 ; pand %xmm7,%xmm6 DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 - DB 15,89,53,230,47,0,0 ; mulps 0x2fe6(%rip),%xmm6 # 68f0 <_sk_callback_sse41+0xeab> - DB 102,15,219,61,238,47,0,0 ; pand 0x2fee(%rip),%xmm7 # 6900 <_sk_callback_sse41+0xebb> + DB 15,89,53,166,48,0,0 ; mulps 0x30a6(%rip),%xmm6 # 69b0 <_sk_callback_sse41+0xeba> + DB 102,15,219,61,174,48,0,0 ; pand 0x30ae(%rip),%xmm7 # 69c0 <_sk_callback_sse41+0xeca> DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7 - DB 15,89,61,244,47,0,0 ; mulps 0x2ff4(%rip),%xmm7 # 6910 <_sk_callback_sse41+0xecb> + DB 15,89,61,180,48,0,0 ; mulps 0x30b4(%rip),%xmm7 # 69d0 <_sk_callback_sse41+0xeda> DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d @@ -17592,21 +17690,21 @@ _sk_gather_4444_sse41 LABEL PROC DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0 DB 102,15,56,51,216 ; pmovzxwd %xmm0,%xmm3 - DB 102,15,111,5,70,47,0,0 ; movdqa 0x2f46(%rip),%xmm0 # 6920 <_sk_callback_sse41+0xedb> + DB 102,15,111,5,6,48,0,0 ; movdqa 0x3006(%rip),%xmm0 # 69e0 <_sk_callback_sse41+0xeea> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,72,47,0,0 ; mulps 0x2f48(%rip),%xmm0 # 6930 <_sk_callback_sse41+0xeeb> - DB 102,15,111,13,80,47,0,0 ; movdqa 0x2f50(%rip),%xmm1 # 6940 <_sk_callback_sse41+0xefb> + DB 15,89,5,8,48,0,0 ; mulps 0x3008(%rip),%xmm0 # 69f0 <_sk_callback_sse41+0xefa> + DB 102,15,111,13,16,48,0,0 ; movdqa 0x3010(%rip),%xmm1 # 6a00 <_sk_callback_sse41+0xf0a> DB 102,15,219,203 ; pand %xmm3,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,82,47,0,0 ; mulps 0x2f52(%rip),%xmm1 # 6950 <_sk_callback_sse41+0xf0b> - DB 102,15,111,21,90,47,0,0 ; movdqa 0x2f5a(%rip),%xmm2 # 6960 <_sk_callback_sse41+0xf1b> + DB 15,89,13,18,48,0,0 ; mulps 0x3012(%rip),%xmm1 # 6a10 <_sk_callback_sse41+0xf1a> + DB 102,15,111,21,26,48,0,0 ; movdqa 0x301a(%rip),%xmm2 # 6a20 <_sk_callback_sse41+0xf2a> DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,92,47,0,0 ; mulps 0x2f5c(%rip),%xmm2 # 6970 <_sk_callback_sse41+0xf2b> - DB 102,15,219,29,100,47,0,0 ; pand 0x2f64(%rip),%xmm3 # 6980 <_sk_callback_sse41+0xf3b> + DB 15,89,21,28,48,0,0 ; mulps 0x301c(%rip),%xmm2 # 6a30 <_sk_callback_sse41+0xf3a> + DB 102,15,219,29,36,48,0,0 ; pand 0x3024(%rip),%xmm3 # 6a40 <_sk_callback_sse41+0xf4a> DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,106,47,0,0 ; mulps 0x2f6a(%rip),%xmm3 # 6990 <_sk_callback_sse41+0xf4b> + DB 15,89,29,42,48,0,0 ; mulps 0x302a(%rip),%xmm3 # 6a50 <_sk_callback_sse41+0xf5a> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax @@ -17615,7 +17713,7 @@ PUBLIC _sk_store_4444_sse41 _sk_store_4444_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax - DB 68,15,40,5,104,47,0,0 ; movaps 0x2f68(%rip),%xmm8 # 69a0 <_sk_callback_sse41+0xf5b> + DB 68,15,40,5,40,48,0,0 ; movaps 0x3028(%rip),%xmm8 # 6a60 <_sk_callback_sse41+0xf6a> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -17662,17 +17760,17 @@ _sk_load_8888_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,88 ; jne 3b40 <_sk_load_8888_sse41+0x62> DB 243,15,111,28,144 ; movdqu (%rax,%rdx,4),%xmm3 - DB 102,15,111,5,187,46,0,0 ; movdqa 0x2ebb(%rip),%xmm0 # 69b0 <_sk_callback_sse41+0xf6b> + DB 102,15,111,5,123,47,0,0 ; movdqa 0x2f7b(%rip),%xmm0 # 6a70 <_sk_callback_sse41+0xf7a> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,188,46,0,0 ; movaps 0x2ebc(%rip),%xmm8 # 69c0 <_sk_callback_sse41+0xf7b> + DB 68,15,40,5,124,47,0,0 ; movaps 0x2f7c(%rip),%xmm8 # 6a80 <_sk_callback_sse41+0xf8a> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 - DB 102,15,56,0,13,187,46,0,0 ; pshufb 0x2ebb(%rip),%xmm1 # 69d0 <_sk_callback_sse41+0xf8b> + DB 102,15,56,0,13,123,47,0,0 ; pshufb 0x2f7b(%rip),%xmm1 # 6a90 <_sk_callback_sse41+0xf9a> DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,111,211 ; movdqa %xmm3,%xmm2 - DB 102,15,56,0,21,183,46,0,0 ; pshufb 0x2eb7(%rip),%xmm2 # 69e0 <_sk_callback_sse41+0xf9b> + DB 102,15,56,0,21,119,47,0,0 ; pshufb 0x2f77(%rip),%xmm2 # 6aa0 <_sk_callback_sse41+0xfaa> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,15,114,211,24 ; psrld $0x18,%xmm3 @@ -17704,17 +17802,17 @@ _sk_load_8888_dst_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,88 ; jne 3be4 <_sk_load_8888_dst_sse41+0x62> DB 243,15,111,60,144 ; movdqu (%rax,%rdx,4),%xmm7 - DB 102,15,111,37,87,46,0,0 ; movdqa 0x2e57(%rip),%xmm4 # 69f0 <_sk_callback_sse41+0xfab> + DB 102,15,111,37,23,47,0,0 ; movdqa 0x2f17(%rip),%xmm4 # 6ab0 <_sk_callback_sse41+0xfba> DB 102,15,219,231 ; pand %xmm7,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 68,15,40,5,88,46,0,0 ; movaps 0x2e58(%rip),%xmm8 # 6a00 <_sk_callback_sse41+0xfbb> + DB 68,15,40,5,24,47,0,0 ; movaps 0x2f18(%rip),%xmm8 # 6ac0 <_sk_callback_sse41+0xfca> DB 65,15,89,224 ; mulps %xmm8,%xmm4 DB 102,15,111,239 ; movdqa %xmm7,%xmm5 - DB 102,15,56,0,45,87,46,0,0 ; pshufb 0x2e57(%rip),%xmm5 # 6a10 <_sk_callback_sse41+0xfcb> + DB 102,15,56,0,45,23,47,0,0 ; pshufb 0x2f17(%rip),%xmm5 # 6ad0 <_sk_callback_sse41+0xfda> DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 DB 65,15,89,232 ; mulps %xmm8,%xmm5 DB 102,15,111,247 ; movdqa %xmm7,%xmm6 - DB 102,15,56,0,53,83,46,0,0 ; pshufb 0x2e53(%rip),%xmm6 # 6a20 <_sk_callback_sse41+0xfdb> + DB 102,15,56,0,53,19,47,0,0 ; pshufb 0x2f13(%rip),%xmm6 # 6ae0 <_sk_callback_sse41+0xfea> DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 DB 65,15,89,240 ; mulps %xmm8,%xmm6 DB 102,15,114,215,24 ; psrld $0x18,%xmm7 @@ -17760,17 +17858,17 @@ _sk_gather_8888_sse41 LABEL PROC DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3 DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3 DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3 - DB 102,15,111,5,169,45,0,0 ; movdqa 0x2da9(%rip),%xmm0 # 6a30 <_sk_callback_sse41+0xfeb> + DB 102,15,111,5,105,46,0,0 ; movdqa 0x2e69(%rip),%xmm0 # 6af0 <_sk_callback_sse41+0xffa> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,170,45,0,0 ; movaps 0x2daa(%rip),%xmm8 # 6a40 <_sk_callback_sse41+0xffb> + DB 68,15,40,5,106,46,0,0 ; movaps 0x2e6a(%rip),%xmm8 # 6b00 <_sk_callback_sse41+0x100a> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 - DB 102,15,56,0,13,169,45,0,0 ; pshufb 0x2da9(%rip),%xmm1 # 6a50 <_sk_callback_sse41+0x100b> + DB 102,15,56,0,13,105,46,0,0 ; pshufb 0x2e69(%rip),%xmm1 # 6b10 <_sk_callback_sse41+0x101a> DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,111,211 ; movdqa %xmm3,%xmm2 - DB 102,15,56,0,21,165,45,0,0 ; pshufb 0x2da5(%rip),%xmm2 # 6a60 <_sk_callback_sse41+0x101b> + DB 102,15,56,0,21,101,46,0,0 ; pshufb 0x2e65(%rip),%xmm2 # 6b20 <_sk_callback_sse41+0x102a> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,15,114,211,24 ; psrld $0x18,%xmm3 @@ -17784,7 +17882,7 @@ PUBLIC _sk_store_8888_sse41 _sk_store_8888_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax - DB 68,15,40,5,144,45,0,0 ; movaps 0x2d90(%rip),%xmm8 # 6a70 <_sk_callback_sse41+0x102b> + DB 68,15,40,5,80,46,0,0 ; movaps 0x2e50(%rip),%xmm8 # 6b30 <_sk_callback_sse41+0x103a> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -17828,17 +17926,17 @@ _sk_load_bgra_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,88 ; jne 3dd4 <_sk_load_bgra_sse41+0x62> DB 243,15,111,28,144 ; movdqu (%rax,%rdx,4),%xmm3 - DB 102,15,111,5,247,44,0,0 ; movdqa 0x2cf7(%rip),%xmm0 # 6a80 <_sk_callback_sse41+0x103b> + DB 102,15,111,5,183,45,0,0 ; movdqa 0x2db7(%rip),%xmm0 # 6b40 <_sk_callback_sse41+0x104a> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2 - DB 68,15,40,5,248,44,0,0 ; movaps 0x2cf8(%rip),%xmm8 # 6a90 <_sk_callback_sse41+0x104b> + DB 68,15,40,5,184,45,0,0 ; movaps 0x2db8(%rip),%xmm8 # 6b50 <_sk_callback_sse41+0x105a> DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,15,111,195 ; movdqa %xmm3,%xmm0 - DB 102,15,56,0,5,247,44,0,0 ; pshufb 0x2cf7(%rip),%xmm0 # 6aa0 <_sk_callback_sse41+0x105b> + DB 102,15,56,0,5,183,45,0,0 ; pshufb 0x2db7(%rip),%xmm0 # 6b60 <_sk_callback_sse41+0x106a> DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,111,195 ; movdqa %xmm3,%xmm0 - DB 102,15,56,0,5,243,44,0,0 ; pshufb 0x2cf3(%rip),%xmm0 # 6ab0 <_sk_callback_sse41+0x106b> + DB 102,15,56,0,5,179,45,0,0 ; pshufb 0x2db3(%rip),%xmm0 # 6b70 <_sk_callback_sse41+0x107a> DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,114,211,24 ; psrld $0x18,%xmm3 @@ -17870,17 +17968,17 @@ _sk_load_bgra_dst_sse41 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,88 ; jne 3e78 <_sk_load_bgra_dst_sse41+0x62> DB 243,15,111,60,144 ; movdqu (%rax,%rdx,4),%xmm7 - DB 102,15,111,37,147,44,0,0 ; movdqa 0x2c93(%rip),%xmm4 # 6ac0 <_sk_callback_sse41+0x107b> + DB 102,15,111,37,83,45,0,0 ; movdqa 0x2d53(%rip),%xmm4 # 6b80 <_sk_callback_sse41+0x108a> DB 102,15,219,231 ; pand %xmm7,%xmm4 DB 15,91,244 ; cvtdq2ps %xmm4,%xmm6 - DB 68,15,40,5,148,44,0,0 ; movaps 0x2c94(%rip),%xmm8 # 6ad0 <_sk_callback_sse41+0x108b> + DB 68,15,40,5,84,45,0,0 ; movaps 0x2d54(%rip),%xmm8 # 6b90 <_sk_callback_sse41+0x109a> DB 65,15,89,240 ; mulps %xmm8,%xmm6 DB 102,15,111,231 ; movdqa %xmm7,%xmm4 - DB 102,15,56,0,37,147,44,0,0 ; pshufb 0x2c93(%rip),%xmm4 # 6ae0 <_sk_callback_sse41+0x109b> + DB 102,15,56,0,37,83,45,0,0 ; pshufb 0x2d53(%rip),%xmm4 # 6ba0 <_sk_callback_sse41+0x10aa> DB 15,91,236 ; cvtdq2ps %xmm4,%xmm5 DB 65,15,89,232 ; mulps %xmm8,%xmm5 DB 102,15,111,231 ; movdqa %xmm7,%xmm4 - DB 102,15,56,0,37,143,44,0,0 ; pshufb 0x2c8f(%rip),%xmm4 # 6af0 <_sk_callback_sse41+0x10ab> + DB 102,15,56,0,37,79,45,0,0 ; pshufb 0x2d4f(%rip),%xmm4 # 6bb0 <_sk_callback_sse41+0x10ba> DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 DB 65,15,89,224 ; mulps %xmm8,%xmm4 DB 102,15,114,215,24 ; psrld $0x18,%xmm7 @@ -17926,17 +18024,17 @@ _sk_gather_bgra_sse41 LABEL PROC DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3 DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3 DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3 - DB 102,15,111,5,229,43,0,0 ; movdqa 0x2be5(%rip),%xmm0 # 6b00 <_sk_callback_sse41+0x10bb> + DB 102,15,111,5,165,44,0,0 ; movdqa 0x2ca5(%rip),%xmm0 # 6bc0 <_sk_callback_sse41+0x10ca> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2 - DB 68,15,40,5,230,43,0,0 ; movaps 0x2be6(%rip),%xmm8 # 6b10 <_sk_callback_sse41+0x10cb> + DB 68,15,40,5,166,44,0,0 ; movaps 0x2ca6(%rip),%xmm8 # 6bd0 <_sk_callback_sse41+0x10da> DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,15,111,195 ; movdqa %xmm3,%xmm0 - DB 102,15,56,0,5,229,43,0,0 ; pshufb 0x2be5(%rip),%xmm0 # 6b20 <_sk_callback_sse41+0x10db> + DB 102,15,56,0,5,165,44,0,0 ; pshufb 0x2ca5(%rip),%xmm0 # 6be0 <_sk_callback_sse41+0x10ea> DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,111,195 ; movdqa %xmm3,%xmm0 - DB 102,15,56,0,5,225,43,0,0 ; pshufb 0x2be1(%rip),%xmm0 # 6b30 <_sk_callback_sse41+0x10eb> + DB 102,15,56,0,5,161,44,0,0 ; pshufb 0x2ca1(%rip),%xmm0 # 6bf0 <_sk_callback_sse41+0x10fa> DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,114,211,24 ; psrld $0x18,%xmm3 @@ -17950,7 +18048,7 @@ PUBLIC _sk_store_bgra_sse41 _sk_store_bgra_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax - DB 68,15,40,5,204,43,0,0 ; movaps 0x2bcc(%rip),%xmm8 # 6b40 <_sk_callback_sse41+0x10fb> + DB 68,15,40,5,140,44,0,0 ; movaps 0x2c8c(%rip),%xmm8 # 6c00 <_sk_callback_sse41+0x110a> DB 68,15,40,202 ; movaps %xmm2,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -18002,18 +18100,18 @@ _sk_load_f16_sse41 LABEL PROC DB 102,68,15,97,216 ; punpcklwd %xmm0,%xmm11 DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9 DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1 - DB 102,68,15,111,5,5,43,0,0 ; movdqa 0x2b05(%rip),%xmm8 # 6b50 <_sk_callback_sse41+0x110b> + DB 102,68,15,111,5,197,43,0,0 ; movdqa 0x2bc5(%rip),%xmm8 # 6c10 <_sk_callback_sse41+0x111a> DB 102,15,111,209 ; movdqa %xmm1,%xmm2 DB 102,65,15,219,208 ; pand %xmm8,%xmm2 DB 102,15,239,202 ; pxor %xmm2,%xmm1 - DB 102,15,111,29,0,43,0,0 ; movdqa 0x2b00(%rip),%xmm3 # 6b60 <_sk_callback_sse41+0x111b> + DB 102,15,111,29,192,43,0,0 ; movdqa 0x2bc0(%rip),%xmm3 # 6c20 <_sk_callback_sse41+0x112a> DB 102,15,114,242,16 ; pslld $0x10,%xmm2 DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0 DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0 DB 102,15,114,241,13 ; pslld $0xd,%xmm1 DB 102,15,235,202 ; por %xmm2,%xmm1 - DB 102,68,15,111,21,236,42,0,0 ; movdqa 0x2aec(%rip),%xmm10 # 6b70 <_sk_callback_sse41+0x112b> + DB 102,68,15,111,21,172,43,0,0 ; movdqa 0x2bac(%rip),%xmm10 # 6c30 <_sk_callback_sse41+0x113a> DB 102,65,15,254,202 ; paddd %xmm10,%xmm1 DB 102,15,219,193 ; pand %xmm1,%xmm0 DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11 @@ -18082,18 +18180,18 @@ _sk_load_f16_dst_sse41 LABEL PROC DB 102,68,15,97,220 ; punpcklwd %xmm4,%xmm11 DB 102,68,15,105,204 ; punpckhwd %xmm4,%xmm9 DB 102,65,15,56,51,235 ; pmovzxwd %xmm11,%xmm5 - DB 102,68,15,111,5,180,41,0,0 ; movdqa 0x29b4(%rip),%xmm8 # 6b80 <_sk_callback_sse41+0x113b> + DB 102,68,15,111,5,116,42,0,0 ; movdqa 0x2a74(%rip),%xmm8 # 6c40 <_sk_callback_sse41+0x114a> DB 102,15,111,245 ; movdqa %xmm5,%xmm6 DB 102,65,15,219,240 ; pand %xmm8,%xmm6 DB 102,15,239,238 ; pxor %xmm6,%xmm5 - DB 102,15,111,61,175,41,0,0 ; movdqa 0x29af(%rip),%xmm7 # 6b90 <_sk_callback_sse41+0x114b> + DB 102,15,111,61,111,42,0,0 ; movdqa 0x2a6f(%rip),%xmm7 # 6c50 <_sk_callback_sse41+0x115a> DB 102,15,114,246,16 ; pslld $0x10,%xmm6 DB 102,15,111,229 ; movdqa %xmm5,%xmm4 DB 102,15,56,63,231 ; pmaxud %xmm7,%xmm4 DB 102,15,118,229 ; pcmpeqd %xmm5,%xmm4 DB 102,15,114,245,13 ; pslld $0xd,%xmm5 DB 102,15,235,238 ; por %xmm6,%xmm5 - DB 102,68,15,111,21,155,41,0,0 ; movdqa 0x299b(%rip),%xmm10 # 6ba0 <_sk_callback_sse41+0x115b> + DB 102,68,15,111,21,91,42,0,0 ; movdqa 0x2a5b(%rip),%xmm10 # 6c60 <_sk_callback_sse41+0x116a> DB 102,65,15,254,234 ; paddd %xmm10,%xmm5 DB 102,15,219,229 ; pand %xmm5,%xmm4 DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11 @@ -18177,18 +18275,18 @@ _sk_gather_f16_sse41 LABEL PROC DB 102,68,15,97,218 ; punpcklwd %xmm2,%xmm11 DB 102,68,15,105,202 ; punpckhwd %xmm2,%xmm9 DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1 - DB 102,68,15,111,5,33,40,0,0 ; movdqa 0x2821(%rip),%xmm8 # 6bb0 <_sk_callback_sse41+0x116b> + DB 102,68,15,111,5,225,40,0,0 ; movdqa 0x28e1(%rip),%xmm8 # 6c70 <_sk_callback_sse41+0x117a> DB 102,15,111,209 ; movdqa %xmm1,%xmm2 DB 102,65,15,219,208 ; pand %xmm8,%xmm2 DB 102,15,239,202 ; pxor %xmm2,%xmm1 - DB 102,15,111,29,28,40,0,0 ; movdqa 0x281c(%rip),%xmm3 # 6bc0 <_sk_callback_sse41+0x117b> + DB 102,15,111,29,220,40,0,0 ; movdqa 0x28dc(%rip),%xmm3 # 6c80 <_sk_callback_sse41+0x118a> DB 102,15,114,242,16 ; pslld $0x10,%xmm2 DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0 DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0 DB 102,15,114,241,13 ; pslld $0xd,%xmm1 DB 102,15,235,202 ; por %xmm2,%xmm1 - DB 102,68,15,111,21,8,40,0,0 ; movdqa 0x2808(%rip),%xmm10 # 6bd0 <_sk_callback_sse41+0x118b> + DB 102,68,15,111,21,200,40,0,0 ; movdqa 0x28c8(%rip),%xmm10 # 6c90 <_sk_callback_sse41+0x119a> DB 102,65,15,254,202 ; paddd %xmm10,%xmm1 DB 102,15,219,193 ; pand %xmm1,%xmm0 DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11 @@ -18235,17 +18333,17 @@ PUBLIC _sk_store_f16_sse41 _sk_store_f16_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax - DB 102,68,15,111,21,61,39,0,0 ; movdqa 0x273d(%rip),%xmm10 # 6be0 <_sk_callback_sse41+0x119b> + DB 102,68,15,111,21,253,39,0,0 ; movdqa 0x27fd(%rip),%xmm10 # 6ca0 <_sk_callback_sse41+0x11aa> DB 102,68,15,111,216 ; movdqa %xmm0,%xmm11 DB 102,69,15,219,218 ; pand %xmm10,%xmm11 DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13 DB 102,69,15,239,235 ; pxor %xmm11,%xmm13 - DB 102,68,15,111,13,48,39,0,0 ; movdqa 0x2730(%rip),%xmm9 # 6bf0 <_sk_callback_sse41+0x11ab> + DB 102,68,15,111,13,240,39,0,0 ; movdqa 0x27f0(%rip),%xmm9 # 6cb0 <_sk_callback_sse41+0x11ba> DB 102,65,15,114,211,16 ; psrld $0x10,%xmm11 DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8 DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8 DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13 - DB 102,68,15,111,37,33,39,0,0 ; movdqa 0x2721(%rip),%xmm12 # 6c00 <_sk_callback_sse41+0x11bb> + DB 102,68,15,111,37,225,39,0,0 ; movdqa 0x27e1(%rip),%xmm12 # 6cc0 <_sk_callback_sse41+0x11ca> DB 102,69,15,235,220 ; por %xmm12,%xmm11 DB 102,69,15,254,221 ; paddd %xmm13,%xmm11 DB 102,69,15,223,195 ; pandn %xmm11,%xmm8 @@ -18327,7 +18425,7 @@ _sk_load_u16_be_sse41 LABEL PROC DB 102,15,235,200 ; por %xmm0,%xmm1 DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,178,37,0,0 ; movaps 0x25b2(%rip),%xmm8 # 6c10 <_sk_callback_sse41+0x11cb> + DB 68,15,40,5,114,38,0,0 ; movaps 0x2672(%rip),%xmm8 # 6cd0 <_sk_callback_sse41+0x11da> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 @@ -18392,7 +18490,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC DB 102,15,235,200 ; por %xmm0,%xmm1 DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,170,36,0,0 ; movaps 0x24aa(%rip),%xmm8 # 6c20 <_sk_callback_sse41+0x11db> + DB 68,15,40,5,106,37,0,0 ; movaps 0x256a(%rip),%xmm8 # 6ce0 <_sk_callback_sse41+0x11ea> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 @@ -18409,7 +18507,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,113,36,0,0 ; movaps 0x2471(%rip),%xmm3 # 6c30 <_sk_callback_sse41+0x11eb> + DB 15,40,29,49,37,0,0 ; movaps 0x2531(%rip),%xmm3 # 6cf0 <_sk_callback_sse41+0x11fa> DB 255,224 ; jmpq *%rax DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2 DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2 @@ -18436,7 +18534,7 @@ _sk_store_u16_be_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax - DB 68,15,40,21,11,36,0,0 ; movaps 0x240b(%rip),%xmm10 # 6c40 <_sk_callback_sse41+0x11fb> + DB 68,15,40,21,203,36,0,0 ; movaps 0x24cb(%rip),%xmm10 # 6d00 <_sk_callback_sse41+0x120a> DB 68,15,40,192 ; movaps %xmm0,%xmm8 DB 69,15,89,194 ; mulps %xmm10,%xmm8 DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8 @@ -18680,7 +18778,7 @@ _sk_mirror_x_sse41 LABEL PROC DB 65,15,92,194 ; subps %xmm10,%xmm0 DB 243,69,15,88,192 ; addss %xmm8,%xmm8 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 - DB 243,68,15,89,13,140,36,0,0 ; mulss 0x248c(%rip),%xmm9 # 7050 <_sk_callback_sse41+0x160b> + DB 243,68,15,89,13,124,37,0,0 ; mulss 0x257c(%rip),%xmm9 # 7140 <_sk_callback_sse41+0x164a> DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 DB 68,15,89,200 ; mulps %xmm0,%xmm9 DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9 @@ -18706,7 +18804,7 @@ _sk_mirror_y_sse41 LABEL PROC DB 65,15,92,202 ; subps %xmm10,%xmm1 DB 243,69,15,88,192 ; addss %xmm8,%xmm8 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 - DB 243,68,15,89,13,41,36,0,0 ; mulss 0x2429(%rip),%xmm9 # 7054 <_sk_callback_sse41+0x160f> + DB 243,68,15,89,13,25,37,0,0 ; mulss 0x2519(%rip),%xmm9 # 7144 <_sk_callback_sse41+0x164e> DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 DB 68,15,89,201 ; mulps %xmm1,%xmm9 DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9 @@ -18726,7 +18824,7 @@ PUBLIC _sk_clamp_x_1_sse41 _sk_clamp_x_1_sse41 LABEL PROC DB 69,15,87,192 ; xorps %xmm8,%xmm8 DB 68,15,95,192 ; maxps %xmm0,%xmm8 - DB 68,15,93,5,219,31,0,0 ; minps 0x1fdb(%rip),%xmm8 # 6c50 <_sk_callback_sse41+0x120b> + DB 68,15,93,5,155,32,0,0 ; minps 0x209b(%rip),%xmm8 # 6d10 <_sk_callback_sse41+0x121a> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -18740,9 +18838,9 @@ _sk_repeat_x_1_sse41 LABEL PROC PUBLIC _sk_mirror_x_1_sse41 _sk_mirror_x_1_sse41 LABEL PROC - DB 68,15,40,5,204,31,0,0 ; movaps 0x1fcc(%rip),%xmm8 # 6c60 <_sk_callback_sse41+0x121b> + DB 68,15,40,5,140,32,0,0 ; movaps 0x208c(%rip),%xmm8 # 6d20 <_sk_callback_sse41+0x122a> DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,13,208,31,0,0 ; movaps 0x1fd0(%rip),%xmm9 # 6c70 <_sk_callback_sse41+0x122b> + DB 68,15,40,13,144,32,0,0 ; movaps 0x2090(%rip),%xmm9 # 6d30 <_sk_callback_sse41+0x123a> DB 68,15,89,200 ; mulps %xmm0,%xmm9 DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9 DB 69,15,88,201 ; addps %xmm9,%xmm9 @@ -18757,10 +18855,10 @@ _sk_mirror_x_1_sse41 LABEL PROC PUBLIC _sk_luminance_to_alpha_sse41 _sk_luminance_to_alpha_sse41 LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 - DB 15,89,5,175,31,0,0 ; mulps 0x1faf(%rip),%xmm0 # 6c80 <_sk_callback_sse41+0x123b> - DB 15,89,13,184,31,0,0 ; mulps 0x1fb8(%rip),%xmm1 # 6c90 <_sk_callback_sse41+0x124b> + DB 15,89,5,111,32,0,0 ; mulps 0x206f(%rip),%xmm0 # 6d40 <_sk_callback_sse41+0x124a> + DB 15,89,13,120,32,0,0 ; mulps 0x2078(%rip),%xmm1 # 6d50 <_sk_callback_sse41+0x125a> DB 15,88,200 ; addps %xmm0,%xmm1 - DB 15,89,29,190,31,0,0 ; mulps 0x1fbe(%rip),%xmm3 # 6ca0 <_sk_callback_sse41+0x125b> + DB 15,89,29,126,32,0,0 ; mulps 0x207e(%rip),%xmm3 # 6d60 <_sk_callback_sse41+0x126a> DB 15,88,217 ; addps %xmm1,%xmm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 @@ -19117,15 +19215,15 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC PUBLIC _sk_gauss_a_to_rgba_sse41 _sk_gauss_a_to_rgba_sse41 LABEL PROC - DB 15,40,5,205,25,0,0 ; movaps 0x19cd(%rip),%xmm0 # 6cb0 <_sk_callback_sse41+0x126b> + DB 15,40,5,141,26,0,0 ; movaps 0x1a8d(%rip),%xmm0 # 6d70 <_sk_callback_sse41+0x127a> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,211,25,0,0 ; addps 0x19d3(%rip),%xmm0 # 6cc0 <_sk_callback_sse41+0x127b> + DB 15,88,5,147,26,0,0 ; addps 0x1a93(%rip),%xmm0 # 6d80 <_sk_callback_sse41+0x128a> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,217,25,0,0 ; addps 0x19d9(%rip),%xmm0 # 6cd0 <_sk_callback_sse41+0x128b> + DB 15,88,5,153,26,0,0 ; addps 0x1a99(%rip),%xmm0 # 6d90 <_sk_callback_sse41+0x129a> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,223,25,0,0 ; addps 0x19df(%rip),%xmm0 # 6ce0 <_sk_callback_sse41+0x129b> + DB 15,88,5,159,26,0,0 ; addps 0x1a9f(%rip),%xmm0 # 6da0 <_sk_callback_sse41+0x12aa> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,229,25,0,0 ; addps 0x19e5(%rip),%xmm0 # 6cf0 <_sk_callback_sse41+0x12ab> + DB 15,88,5,165,26,0,0 ; addps 0x1aa5(%rip),%xmm0 # 6db0 <_sk_callback_sse41+0x12ba> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 @@ -19146,7 +19244,7 @@ _sk_gradient_sse41 LABEL PROC DB 73,255,201 ; dec %r9 DB 72,131,195,4 ; add $0x4,%rbx DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 15,40,21,190,25,0,0 ; movaps 0x19be(%rip),%xmm2 # 6d00 <_sk_callback_sse41+0x12bb> + DB 15,40,21,126,26,0,0 ; movaps 0x1a7e(%rip),%xmm2 # 6dc0 <_sk_callback_sse41+0x12ca> DB 243,15,16,27 ; movss (%rbx),%xmm3 DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3 DB 15,194,216,2 ; cmpleps %xmm0,%xmm3 @@ -19280,26 +19378,26 @@ _sk_xy_to_unit_angle_sse41 LABEL PROC DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,40,236 ; movaps %xmm12,%xmm13 DB 69,15,89,237 ; mulps %xmm13,%xmm13 - DB 68,15,40,21,95,23,0,0 ; movaps 0x175f(%rip),%xmm10 # 6d10 <_sk_callback_sse41+0x12cb> + DB 68,15,40,21,31,24,0,0 ; movaps 0x181f(%rip),%xmm10 # 6dd0 <_sk_callback_sse41+0x12da> DB 69,15,89,213 ; mulps %xmm13,%xmm10 - DB 68,15,88,21,99,23,0,0 ; addps 0x1763(%rip),%xmm10 # 6d20 <_sk_callback_sse41+0x12db> + DB 68,15,88,21,35,24,0,0 ; addps 0x1823(%rip),%xmm10 # 6de0 <_sk_callback_sse41+0x12ea> DB 69,15,89,213 ; mulps %xmm13,%xmm10 - DB 68,15,88,21,103,23,0,0 ; addps 0x1767(%rip),%xmm10 # 6d30 <_sk_callback_sse41+0x12eb> + DB 68,15,88,21,39,24,0,0 ; addps 0x1827(%rip),%xmm10 # 6df0 <_sk_callback_sse41+0x12fa> DB 69,15,89,213 ; mulps %xmm13,%xmm10 - DB 68,15,88,21,107,23,0,0 ; addps 0x176b(%rip),%xmm10 # 6d40 <_sk_callback_sse41+0x12fb> + DB 68,15,88,21,43,24,0,0 ; addps 0x182b(%rip),%xmm10 # 6e00 <_sk_callback_sse41+0x130a> DB 69,15,89,212 ; mulps %xmm12,%xmm10 DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0 - DB 68,15,40,29,106,23,0,0 ; movaps 0x176a(%rip),%xmm11 # 6d50 <_sk_callback_sse41+0x130b> + DB 68,15,40,29,42,24,0,0 ; movaps 0x182a(%rip),%xmm11 # 6e10 <_sk_callback_sse41+0x131a> DB 69,15,92,218 ; subps %xmm10,%xmm11 DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10 DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9 - DB 68,15,40,29,99,23,0,0 ; movaps 0x1763(%rip),%xmm11 # 6d60 <_sk_callback_sse41+0x131b> + DB 68,15,40,29,35,24,0,0 ; movaps 0x1823(%rip),%xmm11 # 6e20 <_sk_callback_sse41+0x132a> DB 69,15,92,218 ; subps %xmm10,%xmm11 DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10 DB 15,40,193 ; movaps %xmm1,%xmm0 DB 65,15,194,192,1 ; cmpltps %xmm8,%xmm0 - DB 68,15,40,13,85,23,0,0 ; movaps 0x1755(%rip),%xmm9 # 6d70 <_sk_callback_sse41+0x132b> + DB 68,15,40,13,21,24,0,0 ; movaps 0x1815(%rip),%xmm9 # 6e30 <_sk_callback_sse41+0x133a> DB 69,15,92,202 ; subps %xmm10,%xmm9 DB 102,69,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm10 DB 69,15,194,194,7 ; cmpordps %xmm10,%xmm8 @@ -19318,18 +19416,18 @@ _sk_xy_to_radius_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax -PUBLIC _sk_xy_to_2pt_conical_sse41 -_sk_xy_to_2pt_conical_sse41 LABEL PROC +PUBLIC _sk_xy_to_2pt_conical_quadratic_sse41 +_sk_xy_to_2pt_conical_quadratic_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 243,68,15,16,16 ; movss (%rax),%xmm10 - DB 243,68,15,16,72,4 ; movss 0x4(%rax),%xmm9 + DB 243,68,15,16,80,32 ; movss 0x20(%rax),%xmm10 + DB 243,68,15,16,72,36 ; movss 0x24(%rax),%xmm9 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 - DB 243,68,15,16,88,8 ; movss 0x8(%rax),%xmm11 - DB 243,68,15,16,64,12 ; movss 0xc(%rax),%xmm8 + DB 243,68,15,16,88,40 ; movss 0x28(%rax),%xmm11 + DB 243,68,15,16,64,44 ; movss 0x2c(%rax),%xmm8 DB 243,69,15,89,195 ; mulss %xmm11,%xmm8 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 DB 68,15,88,192 ; addps %xmm0,%xmm8 - DB 68,15,89,5,255,22,0,0 ; mulps 0x16ff(%rip),%xmm8 # 6d80 <_sk_callback_sse41+0x133b> + DB 68,15,89,5,190,23,0,0 ; mulps 0x17be(%rip),%xmm8 # 6e40 <_sk_callback_sse41+0x134a> DB 15,89,192 ; mulps %xmm0,%xmm0 DB 68,15,40,225 ; movaps %xmm1,%xmm12 DB 69,15,89,228 ; mulps %xmm12,%xmm12 @@ -19337,7 +19435,7 @@ _sk_xy_to_2pt_conical_sse41 LABEL PROC DB 243,69,15,89,219 ; mulss %xmm11,%xmm11 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,92,227 ; subps %xmm11,%xmm12 - DB 68,15,89,21,234,22,0,0 ; mulps 0x16ea(%rip),%xmm10 # 6d90 <_sk_callback_sse41+0x134b> + DB 68,15,89,21,169,23,0,0 ; mulps 0x17a9(%rip),%xmm10 # 6e50 <_sk_callback_sse41+0x135a> DB 69,15,89,212 ; mulps %xmm12,%xmm10 DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 15,89,192 ; mulps %xmm0,%xmm0 @@ -19346,9 +19444,9 @@ _sk_xy_to_2pt_conical_sse41 LABEL PROC DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 65,15,92,192 ; subps %xmm8,%xmm0 - DB 68,15,87,5,210,22,0,0 ; xorps 0x16d2(%rip),%xmm8 # 6da0 <_sk_callback_sse41+0x135b> + DB 68,15,87,5,145,23,0,0 ; xorps 0x1791(%rip),%xmm8 # 6e60 <_sk_callback_sse41+0x136a> DB 65,15,89,193 ; mulps %xmm9,%xmm0 - DB 68,15,40,29,214,22,0,0 ; movaps 0x16d6(%rip),%xmm11 # 6db0 <_sk_callback_sse41+0x136b> + DB 68,15,40,29,149,23,0,0 ; movaps 0x1795(%rip),%xmm11 # 6e70 <_sk_callback_sse41+0x137a> DB 65,15,89,195 ; mulps %xmm11,%xmm0 DB 69,15,92,194 ; subps %xmm10,%xmm8 DB 69,15,89,193 ; mulps %xmm9,%xmm8 @@ -19357,10 +19455,58 @@ _sk_xy_to_2pt_conical_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax +PUBLIC _sk_xy_to_2pt_conical_linear_sse41 +_sk_xy_to_2pt_conical_linear_sse41 LABEL PROC + DB 68,15,40,192 ; movaps %xmm0,%xmm8 + DB 72,173 ; lods %ds:(%rsi),%rax + DB 243,68,15,16,72,40 ; movss 0x28(%rax),%xmm9 + DB 243,15,16,64,44 ; movss 0x2c(%rax),%xmm0 + DB 68,15,40,208 ; movaps %xmm0,%xmm10 + DB 243,69,15,89,209 ; mulss %xmm9,%xmm10 + DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 + DB 69,15,88,208 ; addps %xmm8,%xmm10 + DB 68,15,89,21,98,23,0,0 ; mulps 0x1762(%rip),%xmm10 # 6e80 <_sk_callback_sse41+0x138a> + DB 69,15,89,192 ; mulps %xmm8,%xmm8 + DB 15,89,201 ; mulps %xmm1,%xmm1 + DB 65,15,88,200 ; addps %xmm8,%xmm1 + DB 69,15,40,193 ; movaps %xmm9,%xmm8 + DB 243,69,15,89,192 ; mulss %xmm8,%xmm8 + DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 + DB 65,15,92,200 ; subps %xmm8,%xmm1 + DB 15,87,13,78,23,0,0 ; xorps 0x174e(%rip),%xmm1 # 6e90 <_sk_callback_sse41+0x139a> + DB 65,15,94,202 ; divps %xmm10,%xmm1 + DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0 + DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 + DB 15,89,193 ; mulps %xmm1,%xmm0 + DB 65,15,88,193 ; addps %xmm9,%xmm0 + DB 69,15,87,201 ; xorps %xmm9,%xmm9 + DB 65,15,194,193,1 ; cmpltps %xmm9,%xmm0 + DB 68,15,40,193 ; movaps %xmm1,%xmm8 + DB 69,15,194,193,3 ; cmpunordps %xmm9,%xmm8 + DB 65,15,86,192 ; orps %xmm8,%xmm0 + DB 68,15,40,5,44,23,0,0 ; movaps 0x172c(%rip),%xmm8 # 6ea0 <_sk_callback_sse41+0x13aa> + DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8 + DB 68,15,17,0 ; movups %xmm8,(%rax) + DB 72,173 ; lods %ds:(%rsi),%rax + DB 15,40,193 ; movaps %xmm1,%xmm0 + DB 65,15,40,200 ; movaps %xmm8,%xmm1 + DB 255,224 ; jmpq *%rax + +PUBLIC _sk_vector_scale_sse41 +_sk_vector_scale_sse41 LABEL PROC + DB 72,173 ; lods %ds:(%rsi),%rax + DB 68,15,16,0 ; movups (%rax),%xmm8 + DB 65,15,89,192 ; mulps %xmm8,%xmm0 + DB 65,15,89,200 ; mulps %xmm8,%xmm1 + DB 65,15,89,208 ; mulps %xmm8,%xmm2 + DB 65,15,89,216 ; mulps %xmm8,%xmm3 + DB 72,173 ; lods %ds:(%rsi),%rax + DB 255,224 ; jmpq *%rax + PUBLIC _sk_save_xy_sse41 _sk_save_xy_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,196,22,0,0 ; movaps 0x16c4(%rip),%xmm8 # 6dc0 <_sk_callback_sse41+0x137b> + DB 68,15,40,5,3,23,0,0 ; movaps 0x1703(%rip),%xmm8 # 6eb0 <_sk_callback_sse41+0x13ba> DB 15,17,0 ; movups %xmm0,(%rax) DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,88,200 ; addps %xmm8,%xmm9 @@ -19400,8 +19546,8 @@ _sk_bilinear_nx_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,70,22,0,0 ; addps 0x1646(%rip),%xmm0 # 6dd0 <_sk_callback_sse41+0x138b> - DB 68,15,40,13,78,22,0,0 ; movaps 0x164e(%rip),%xmm9 # 6de0 <_sk_callback_sse41+0x139b> + DB 15,88,5,133,22,0,0 ; addps 0x1685(%rip),%xmm0 # 6ec0 <_sk_callback_sse41+0x13ca> + DB 68,15,40,13,141,22,0,0 ; movaps 0x168d(%rip),%xmm9 # 6ed0 <_sk_callback_sse41+0x13da> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -19412,7 +19558,7 @@ _sk_bilinear_px_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,61,22,0,0 ; addps 0x163d(%rip),%xmm0 # 6df0 <_sk_callback_sse41+0x13ab> + DB 15,88,5,124,22,0,0 ; addps 0x167c(%rip),%xmm0 # 6ee0 <_sk_callback_sse41+0x13ea> DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -19422,8 +19568,8 @@ _sk_bilinear_ny_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,47,22,0,0 ; addps 0x162f(%rip),%xmm1 # 6e00 <_sk_callback_sse41+0x13bb> - DB 68,15,40,13,55,22,0,0 ; movaps 0x1637(%rip),%xmm9 # 6e10 <_sk_callback_sse41+0x13cb> + DB 15,88,13,110,22,0,0 ; addps 0x166e(%rip),%xmm1 # 6ef0 <_sk_callback_sse41+0x13fa> + DB 68,15,40,13,118,22,0,0 ; movaps 0x1676(%rip),%xmm9 # 6f00 <_sk_callback_sse41+0x140a> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -19434,7 +19580,7 @@ _sk_bilinear_py_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,37,22,0,0 ; addps 0x1625(%rip),%xmm1 # 6e20 <_sk_callback_sse41+0x13db> + DB 15,88,13,100,22,0,0 ; addps 0x1664(%rip),%xmm1 # 6f10 <_sk_callback_sse41+0x141a> DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -19444,13 +19590,13 @@ _sk_bicubic_n3x_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,24,22,0,0 ; addps 0x1618(%rip),%xmm0 # 6e30 <_sk_callback_sse41+0x13eb> - DB 68,15,40,13,32,22,0,0 ; movaps 0x1620(%rip),%xmm9 # 6e40 <_sk_callback_sse41+0x13fb> + DB 15,88,5,87,22,0,0 ; addps 0x1657(%rip),%xmm0 # 6f20 <_sk_callback_sse41+0x142a> + DB 68,15,40,13,95,22,0,0 ; movaps 0x165f(%rip),%xmm9 # 6f30 <_sk_callback_sse41+0x143a> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 69,15,89,192 ; mulps %xmm8,%xmm8 - DB 68,15,89,13,28,22,0,0 ; mulps 0x161c(%rip),%xmm9 # 6e50 <_sk_callback_sse41+0x140b> - DB 68,15,88,13,36,22,0,0 ; addps 0x1624(%rip),%xmm9 # 6e60 <_sk_callback_sse41+0x141b> + DB 68,15,89,13,91,22,0,0 ; mulps 0x165b(%rip),%xmm9 # 6f40 <_sk_callback_sse41+0x144a> + DB 68,15,88,13,99,22,0,0 ; addps 0x1663(%rip),%xmm9 # 6f50 <_sk_callback_sse41+0x145a> DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -19461,16 +19607,16 @@ _sk_bicubic_n1x_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,19,22,0,0 ; addps 0x1613(%rip),%xmm0 # 6e70 <_sk_callback_sse41+0x142b> - DB 68,15,40,13,27,22,0,0 ; movaps 0x161b(%rip),%xmm9 # 6e80 <_sk_callback_sse41+0x143b> + DB 15,88,5,82,22,0,0 ; addps 0x1652(%rip),%xmm0 # 6f60 <_sk_callback_sse41+0x146a> + DB 68,15,40,13,90,22,0,0 ; movaps 0x165a(%rip),%xmm9 # 6f70 <_sk_callback_sse41+0x147a> DB 69,15,92,200 ; subps %xmm8,%xmm9 - DB 68,15,40,5,31,22,0,0 ; movaps 0x161f(%rip),%xmm8 # 6e90 <_sk_callback_sse41+0x144b> + DB 68,15,40,5,94,22,0,0 ; movaps 0x165e(%rip),%xmm8 # 6f80 <_sk_callback_sse41+0x148a> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,35,22,0,0 ; addps 0x1623(%rip),%xmm8 # 6ea0 <_sk_callback_sse41+0x145b> + DB 68,15,88,5,98,22,0,0 ; addps 0x1662(%rip),%xmm8 # 6f90 <_sk_callback_sse41+0x149a> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,39,22,0,0 ; addps 0x1627(%rip),%xmm8 # 6eb0 <_sk_callback_sse41+0x146b> + DB 68,15,88,5,102,22,0,0 ; addps 0x1666(%rip),%xmm8 # 6fa0 <_sk_callback_sse41+0x14aa> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,43,22,0,0 ; addps 0x162b(%rip),%xmm8 # 6ec0 <_sk_callback_sse41+0x147b> + DB 68,15,88,5,106,22,0,0 ; addps 0x166a(%rip),%xmm8 # 6fb0 <_sk_callback_sse41+0x14ba> DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -19478,17 +19624,17 @@ _sk_bicubic_n1x_sse41 LABEL PROC PUBLIC _sk_bicubic_p1x_sse41 _sk_bicubic_p1x_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,37,22,0,0 ; movaps 0x1625(%rip),%xmm8 # 6ed0 <_sk_callback_sse41+0x148b> + DB 68,15,40,5,100,22,0,0 ; movaps 0x1664(%rip),%xmm8 # 6fc0 <_sk_callback_sse41+0x14ca> DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9 DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,21,33,22,0,0 ; movaps 0x1621(%rip),%xmm10 # 6ee0 <_sk_callback_sse41+0x149b> + DB 68,15,40,21,96,22,0,0 ; movaps 0x1660(%rip),%xmm10 # 6fd0 <_sk_callback_sse41+0x14da> DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,37,22,0,0 ; addps 0x1625(%rip),%xmm10 # 6ef0 <_sk_callback_sse41+0x14ab> + DB 68,15,88,21,100,22,0,0 ; addps 0x1664(%rip),%xmm10 # 6fe0 <_sk_callback_sse41+0x14ea> DB 69,15,89,209 ; mulps %xmm9,%xmm10 DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,33,22,0,0 ; addps 0x1621(%rip),%xmm10 # 6f00 <_sk_callback_sse41+0x14bb> + DB 68,15,88,21,96,22,0,0 ; addps 0x1660(%rip),%xmm10 # 6ff0 <_sk_callback_sse41+0x14fa> DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -19498,11 +19644,11 @@ _sk_bicubic_p3x_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,20,22,0,0 ; addps 0x1614(%rip),%xmm0 # 6f10 <_sk_callback_sse41+0x14cb> + DB 15,88,5,83,22,0,0 ; addps 0x1653(%rip),%xmm0 # 7000 <_sk_callback_sse41+0x150a> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 69,15,89,201 ; mulps %xmm9,%xmm9 - DB 68,15,89,5,20,22,0,0 ; mulps 0x1614(%rip),%xmm8 # 6f20 <_sk_callback_sse41+0x14db> - DB 68,15,88,5,28,22,0,0 ; addps 0x161c(%rip),%xmm8 # 6f30 <_sk_callback_sse41+0x14eb> + DB 68,15,89,5,83,22,0,0 ; mulps 0x1653(%rip),%xmm8 # 7010 <_sk_callback_sse41+0x151a> + DB 68,15,88,5,91,22,0,0 ; addps 0x165b(%rip),%xmm8 # 7020 <_sk_callback_sse41+0x152a> DB 69,15,89,193 ; mulps %xmm9,%xmm8 DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -19513,13 +19659,13 @@ _sk_bicubic_n3y_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,10,22,0,0 ; addps 0x160a(%rip),%xmm1 # 6f40 <_sk_callback_sse41+0x14fb> - DB 68,15,40,13,18,22,0,0 ; movaps 0x1612(%rip),%xmm9 # 6f50 <_sk_callback_sse41+0x150b> + DB 15,88,13,73,22,0,0 ; addps 0x1649(%rip),%xmm1 # 7030 <_sk_callback_sse41+0x153a> + DB 68,15,40,13,81,22,0,0 ; movaps 0x1651(%rip),%xmm9 # 7040 <_sk_callback_sse41+0x154a> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 69,15,89,192 ; mulps %xmm8,%xmm8 - DB 68,15,89,13,14,22,0,0 ; mulps 0x160e(%rip),%xmm9 # 6f60 <_sk_callback_sse41+0x151b> - DB 68,15,88,13,22,22,0,0 ; addps 0x1616(%rip),%xmm9 # 6f70 <_sk_callback_sse41+0x152b> + DB 68,15,89,13,77,22,0,0 ; mulps 0x164d(%rip),%xmm9 # 7050 <_sk_callback_sse41+0x155a> + DB 68,15,88,13,85,22,0,0 ; addps 0x1655(%rip),%xmm9 # 7060 <_sk_callback_sse41+0x156a> DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -19530,16 +19676,16 @@ _sk_bicubic_n1y_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,4,22,0,0 ; addps 0x1604(%rip),%xmm1 # 6f80 <_sk_callback_sse41+0x153b> - DB 68,15,40,13,12,22,0,0 ; movaps 0x160c(%rip),%xmm9 # 6f90 <_sk_callback_sse41+0x154b> + DB 15,88,13,67,22,0,0 ; addps 0x1643(%rip),%xmm1 # 7070 <_sk_callback_sse41+0x157a> + DB 68,15,40,13,75,22,0,0 ; movaps 0x164b(%rip),%xmm9 # 7080 <_sk_callback_sse41+0x158a> DB 69,15,92,200 ; subps %xmm8,%xmm9 - DB 68,15,40,5,16,22,0,0 ; movaps 0x1610(%rip),%xmm8 # 6fa0 <_sk_callback_sse41+0x155b> + DB 68,15,40,5,79,22,0,0 ; movaps 0x164f(%rip),%xmm8 # 7090 <_sk_callback_sse41+0x159a> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,20,22,0,0 ; addps 0x1614(%rip),%xmm8 # 6fb0 <_sk_callback_sse41+0x156b> + DB 68,15,88,5,83,22,0,0 ; addps 0x1653(%rip),%xmm8 # 70a0 <_sk_callback_sse41+0x15aa> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,24,22,0,0 ; addps 0x1618(%rip),%xmm8 # 6fc0 <_sk_callback_sse41+0x157b> + DB 68,15,88,5,87,22,0,0 ; addps 0x1657(%rip),%xmm8 # 70b0 <_sk_callback_sse41+0x15ba> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,28,22,0,0 ; addps 0x161c(%rip),%xmm8 # 6fd0 <_sk_callback_sse41+0x158b> + DB 68,15,88,5,91,22,0,0 ; addps 0x165b(%rip),%xmm8 # 70c0 <_sk_callback_sse41+0x15ca> DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -19547,17 +19693,17 @@ _sk_bicubic_n1y_sse41 LABEL PROC PUBLIC _sk_bicubic_p1y_sse41 _sk_bicubic_p1y_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,22,22,0,0 ; movaps 0x1616(%rip),%xmm8 # 6fe0 <_sk_callback_sse41+0x159b> + DB 68,15,40,5,85,22,0,0 ; movaps 0x1655(%rip),%xmm8 # 70d0 <_sk_callback_sse41+0x15da> DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9 DB 65,15,88,200 ; addps %xmm8,%xmm1 - DB 68,15,40,21,17,22,0,0 ; movaps 0x1611(%rip),%xmm10 # 6ff0 <_sk_callback_sse41+0x15ab> + DB 68,15,40,21,80,22,0,0 ; movaps 0x1650(%rip),%xmm10 # 70e0 <_sk_callback_sse41+0x15ea> DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,21,22,0,0 ; addps 0x1615(%rip),%xmm10 # 7000 <_sk_callback_sse41+0x15bb> + DB 68,15,88,21,84,22,0,0 ; addps 0x1654(%rip),%xmm10 # 70f0 <_sk_callback_sse41+0x15fa> DB 69,15,89,209 ; mulps %xmm9,%xmm10 DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,17,22,0,0 ; addps 0x1611(%rip),%xmm10 # 7010 <_sk_callback_sse41+0x15cb> + DB 68,15,88,21,80,22,0,0 ; addps 0x1650(%rip),%xmm10 # 7100 <_sk_callback_sse41+0x160a> DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -19567,11 +19713,11 @@ _sk_bicubic_p3y_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,3,22,0,0 ; addps 0x1603(%rip),%xmm1 # 7020 <_sk_callback_sse41+0x15db> + DB 15,88,13,66,22,0,0 ; addps 0x1642(%rip),%xmm1 # 7110 <_sk_callback_sse41+0x161a> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 69,15,89,201 ; mulps %xmm9,%xmm9 - DB 68,15,89,5,3,22,0,0 ; mulps 0x1603(%rip),%xmm8 # 7030 <_sk_callback_sse41+0x15eb> - DB 68,15,88,5,11,22,0,0 ; addps 0x160b(%rip),%xmm8 # 7040 <_sk_callback_sse41+0x15fb> + DB 68,15,89,5,66,22,0,0 ; mulps 0x1642(%rip),%xmm8 # 7120 <_sk_callback_sse41+0x162a> + DB 68,15,88,5,74,22,0,0 ; addps 0x164a(%rip),%xmm8 # 7130 <_sk_callback_sse41+0x163a> DB 69,15,89,193 ; mulps %xmm9,%xmm8 DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -19789,11 +19935,11 @@ ALIGN 16 DB 128,191,0,0,128,191,0 ; cmpb $0x0,-0x40800000(%rdi) DB 0,224 ; add %ah,%al DB 64,0,0 ; add %al,(%rax) - DB 224,64 ; loopne 5ce8 <.literal16+0x1d8> + DB 224,64 ; loopne 5da8 <.literal16+0x1d8> DB 0,0 ; add %al,(%rax) - DB 224,64 ; loopne 5cec <.literal16+0x1dc> + DB 224,64 ; loopne 5dac <.literal16+0x1dc> DB 0,0 ; add %al,(%rax) - DB 224,64 ; loopne 5cf0 <.literal16+0x1e0> + DB 224,64 ; loopne 5db0 <.literal16+0x1e0> DB 154 ; (bad) DB 153 ; cltd DB 153 ; cltd @@ -19813,13 +19959,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5d11 <.literal16+0x201> + DB 71,225,61 ; rex.RXB loope 5dd1 <.literal16+0x201> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5d15 <.literal16+0x205> + DB 71,225,61 ; rex.RXB loope 5dd5 <.literal16+0x205> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5d19 <.literal16+0x209> + DB 71,225,61 ; rex.RXB loope 5dd9 <.literal16+0x209> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5d1d <.literal16+0x20d> + DB 71,225,61 ; rex.RXB loope 5ddd <.literal16+0x20d> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -19844,13 +19990,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5d51 <.literal16+0x241> + DB 71,225,61 ; rex.RXB loope 5e11 <.literal16+0x241> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5d55 <.literal16+0x245> + DB 71,225,61 ; rex.RXB loope 5e15 <.literal16+0x245> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5d59 <.literal16+0x249> + DB 71,225,61 ; rex.RXB loope 5e19 <.literal16+0x249> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5d5d <.literal16+0x24d> + DB 71,225,61 ; rex.RXB loope 5e1d <.literal16+0x24d> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -19875,13 +20021,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5d91 <.literal16+0x281> + DB 71,225,61 ; rex.RXB loope 5e51 <.literal16+0x281> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5d95 <.literal16+0x285> + DB 71,225,61 ; rex.RXB loope 5e55 <.literal16+0x285> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5d99 <.literal16+0x289> + DB 71,225,61 ; rex.RXB loope 5e59 <.literal16+0x289> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5d9d <.literal16+0x28d> + DB 71,225,61 ; rex.RXB loope 5e5d <.literal16+0x28d> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -19906,13 +20052,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5dd1 <.literal16+0x2c1> + DB 71,225,61 ; rex.RXB loope 5e91 <.literal16+0x2c1> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5dd5 <.literal16+0x2c5> + DB 71,225,61 ; rex.RXB loope 5e95 <.literal16+0x2c5> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5dd9 <.literal16+0x2c9> + DB 71,225,61 ; rex.RXB loope 5e99 <.literal16+0x2c9> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5ddd <.literal16+0x2cd> + DB 71,225,61 ; rex.RXB loope 5e9d <.literal16+0x2cd> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -19929,10 +20075,10 @@ ALIGN 16 DB 0,1 ; add %al,(%rcx) DB 255 ; (bad) DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005dc8 <_sk_callback_sse41+0xa000383> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005e88 <_sk_callback_sse41+0xa000392> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005dd0 <_sk_callback_sse41+0x300038b> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005e90 <_sk_callback_sse41+0x300039a> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -19951,11 +20097,11 @@ ALIGN 16 DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax) DB 67,0,0 ; rex.XB add %al,(%r8) - DB 127,67 ; jg 5e3b <.literal16+0x32b> + DB 127,67 ; jg 5efb <.literal16+0x32b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5e3f <.literal16+0x32f> + DB 127,67 ; jg 5eff <.literal16+0x32f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5e43 <.literal16+0x333> + DB 127,67 ; jg 5f03 <.literal16+0x333> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -20237,13 +20383,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 6079 <.literal16+0x569> + DB 224,7 ; loopne 6139 <.literal16+0x569> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 607d <.literal16+0x56d> + DB 224,7 ; loopne 613d <.literal16+0x56d> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6081 <.literal16+0x571> + DB 224,7 ; loopne 6141 <.literal16+0x571> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6085 <.literal16+0x575> + DB 224,7 ; loopne 6145 <.literal16+0x575> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -20277,10 +20423,10 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0060c8 <_sk_callback_sse41+0xa000683> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006188 <_sk_callback_sse41+0xa000692> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30060d0 <_sk_callback_sse41+0x300068b> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006190 <_sk_callback_sse41+0x300069a> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -20335,11 +20481,11 @@ ALIGN 16 DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,127,67 ; add %bh,0x43(%rdi) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 619b <.literal16+0x68b> + DB 127,67 ; jg 625b <.literal16+0x68b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 619f <.literal16+0x68f> + DB 127,67 ; jg 625f <.literal16+0x68f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 61a3 <.literal16+0x693> + DB 127,67 ; jg 6263 <.literal16+0x693> DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax) DB 128,59,129 ; cmpb $0x81,(%rbx) DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%rax) @@ -20354,16 +20500,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 6194 <.literal16+0x684> + DB 127,0 ; jg 6254 <.literal16+0x684> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 6198 <.literal16+0x688> + DB 127,0 ; jg 6258 <.literal16+0x688> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 619c <.literal16+0x68c> + DB 127,0 ; jg 625c <.literal16+0x68c> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 61a0 <.literal16+0x690> + DB 127,0 ; jg 6260 <.literal16+0x690> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -20372,7 +20518,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 6225 <.literal16+0x715> + DB 119,115 ; ja 62e5 <.literal16+0x715> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -20383,7 +20529,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 6189 <.literal16+0x679> + DB 117,191 ; jne 6249 <.literal16+0x679> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -20395,7 +20541,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a3a1ca <_sk_callback_sse41+0xffffffffe9a34785> + DB 233,220,63,163,233 ; jmpq ffffffffe9a3a28a <_sk_callback_sse41+0xffffffffe9a34794> DB 220,63 ; fdivrl (%rdi) DB 81 ; push %rcx DB 140,242 ; mov %?,%edx @@ -20450,16 +20596,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 6264 <.literal16+0x754> + DB 127,0 ; jg 6324 <.literal16+0x754> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 6268 <.literal16+0x758> + DB 127,0 ; jg 6328 <.literal16+0x758> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 626c <.literal16+0x75c> + DB 127,0 ; jg 632c <.literal16+0x75c> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 6270 <.literal16+0x760> + DB 127,0 ; jg 6330 <.literal16+0x760> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -20468,7 +20614,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 62f5 <.literal16+0x7e5> + DB 119,115 ; ja 63b5 <.literal16+0x7e5> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -20479,7 +20625,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 6259 <.literal16+0x749> + DB 117,191 ; jne 6319 <.literal16+0x749> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -20491,7 +20637,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a3a29a <_sk_callback_sse41+0xffffffffe9a34855> + DB 233,220,63,163,233 ; jmpq ffffffffe9a3a35a <_sk_callback_sse41+0xffffffffe9a34864> DB 220,63 ; fdivrl (%rdi) DB 81 ; push %rcx DB 140,242 ; mov %?,%edx @@ -20546,16 +20692,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 6334 <.literal16+0x824> + DB 127,0 ; jg 63f4 <.literal16+0x824> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 6338 <.literal16+0x828> + DB 127,0 ; jg 63f8 <.literal16+0x828> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 633c <.literal16+0x82c> + DB 127,0 ; jg 63fc <.literal16+0x82c> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 6340 <.literal16+0x830> + DB 127,0 ; jg 6400 <.literal16+0x830> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -20564,7 +20710,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 63c5 <.literal16+0x8b5> + DB 119,115 ; ja 6485 <.literal16+0x8b5> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -20575,7 +20721,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 6329 <.literal16+0x819> + DB 117,191 ; jne 63e9 <.literal16+0x819> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -20587,7 +20733,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a3a36a <_sk_callback_sse41+0xffffffffe9a34925> + DB 233,220,63,163,233 ; jmpq ffffffffe9a3a42a <_sk_callback_sse41+0xffffffffe9a34934> DB 220,63 ; fdivrl (%rdi) DB 81 ; push %rcx DB 140,242 ; mov %?,%edx @@ -20642,16 +20788,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 6404 <.literal16+0x8f4> + DB 127,0 ; jg 64c4 <.literal16+0x8f4> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 6408 <.literal16+0x8f8> + DB 127,0 ; jg 64c8 <.literal16+0x8f8> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 640c <.literal16+0x8fc> + DB 127,0 ; jg 64cc <.literal16+0x8fc> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 6410 <.literal16+0x900> + DB 127,0 ; jg 64d0 <.literal16+0x900> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -20660,7 +20806,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 6495 <.literal16+0x985> + DB 119,115 ; ja 6555 <.literal16+0x985> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -20671,7 +20817,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 63f9 <.literal16+0x8e9> + DB 117,191 ; jne 64b9 <.literal16+0x8e9> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -20683,7 +20829,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a3a43a <_sk_callback_sse41+0xffffffffe9a349f5> + DB 233,220,63,163,233 ; jmpq ffffffffe9a3a4fa <_sk_callback_sse41+0xffffffffe9a34a04> DB 220,63 ; fdivrl (%rdi) DB 81 ; push %rcx DB 140,242 ; mov %?,%edx @@ -20734,13 +20880,13 @@ ALIGN 16 DB 200,66,0,0 ; enterq $0x42,$0x0 DB 200,66,0,0 ; enterq $0x42,$0x0 DB 200,66,0,0 ; enterq $0x42,$0x0 - DB 127,67 ; jg 6517 <.literal16+0xa07> + DB 127,67 ; jg 65d7 <.literal16+0xa07> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 651b <.literal16+0xa0b> + DB 127,67 ; jg 65db <.literal16+0xa0b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 651f <.literal16+0xa0f> + DB 127,67 ; jg 65df <.literal16+0xa0f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6523 <.literal16+0xa13> + DB 127,67 ; jg 65e3 <.literal16+0xa13> DB 0,0 ; add %al,(%rax) DB 0,195 ; add %al,%bl DB 0,0 ; add %al,(%rax) @@ -20787,16 +20933,16 @@ ALIGN 16 DB 128,3,62 ; addb $0x3e,(%rbx) DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 65a3 <.literal16+0xa93> + DB 118,63 ; jbe 6663 <.literal16+0xa93> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 65a7 <.literal16+0xa97> + DB 118,63 ; jbe 6667 <.literal16+0xa97> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 65ab <.literal16+0xa9b> + DB 118,63 ; jbe 666b <.literal16+0xa9b> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 65af <.literal16+0xa9f> + DB 118,63 ; jbe 666f <.literal16+0xa9f> DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 246,64,83,63 ; testb $0x3f,0x53(%rax) @@ -20825,11 +20971,11 @@ ALIGN 16 DB 128,59,0 ; cmpb $0x0,(%rbx) DB 0,127,67 ; add %bh,0x43(%rdi) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 661b <.literal16+0xb0b> + DB 127,67 ; jg 66db <.literal16+0xb0b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 661f <.literal16+0xb0f> + DB 127,67 ; jg 66df <.literal16+0xb0f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6623 <.literal16+0xb13> + DB 127,67 ; jg 66e3 <.literal16+0xb13> DB 0,4,0 ; add %al,(%rax,%rax,1) DB 0,0 ; add %al,(%rax) DB 0,0 ; add %al,(%rax) @@ -20887,7 +21033,7 @@ ALIGN 16 DB 5,255,255,255,9 ; add $0x9ffffff,%eax DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30066a0 <_sk_callback_sse41+0x3000c5b> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006760 <_sk_callback_sse41+0x3000c6a> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -20916,13 +21062,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 66d9 <.literal16+0xbc9> + DB 224,7 ; loopne 6799 <.literal16+0xbc9> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 66dd <.literal16+0xbcd> + DB 224,7 ; loopne 679d <.literal16+0xbcd> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 66e1 <.literal16+0xbd1> + DB 224,7 ; loopne 67a1 <.literal16+0xbd1> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 66e5 <.literal16+0xbd5> + DB 224,7 ; loopne 67a5 <.literal16+0xbd5> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -20968,13 +21114,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 6749 <.literal16+0xc39> + DB 224,7 ; loopne 6809 <.literal16+0xc39> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 674d <.literal16+0xc3d> + DB 224,7 ; loopne 680d <.literal16+0xc3d> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6751 <.literal16+0xc41> + DB 224,7 ; loopne 6811 <.literal16+0xc41> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6755 <.literal16+0xc45> + DB 224,7 ; loopne 6815 <.literal16+0xc45> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -21020,13 +21166,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 67b9 <.literal16+0xca9> + DB 224,7 ; loopne 6879 <.literal16+0xca9> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 67bd <.literal16+0xcad> + DB 224,7 ; loopne 687d <.literal16+0xcad> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 67c1 <.literal16+0xcb1> + DB 224,7 ; loopne 6881 <.literal16+0xcb1> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 67c5 <.literal16+0xcb5> + DB 224,7 ; loopne 6885 <.literal16+0xcb5> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -21064,13 +21210,13 @@ ALIGN 16 DB 65,0,0 ; add %al,(%r8) DB 248 ; clc DB 65,0,0 ; add %al,(%r8) - DB 124,66 ; jl 6856 <.literal16+0xd46> + DB 124,66 ; jl 6916 <.literal16+0xd46> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 685a <.literal16+0xd4a> + DB 124,66 ; jl 691a <.literal16+0xd4a> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 685e <.literal16+0xd4e> + DB 124,66 ; jl 691e <.literal16+0xd4e> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 6862 <.literal16+0xd52> + DB 124,66 ; jl 6922 <.literal16+0xd52> DB 0,240 ; add %dh,%al DB 0,0 ; add %al,(%rax) DB 0,240 ; add %dh,%al @@ -21204,13 +21350,13 @@ ALIGN 16 DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax) DB 61,137,136,136,61 ; cmp $0x3d888889,%eax DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 69e5 <.literal16+0xed5> + DB 112,65 ; jo 6aa5 <.literal16+0xed5> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 69e9 <.literal16+0xed9> + DB 112,65 ; jo 6aa9 <.literal16+0xed9> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 69ed <.literal16+0xedd> + DB 112,65 ; jo 6aad <.literal16+0xedd> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 69f1 <.literal16+0xee1> + DB 112,65 ; jo 6ab1 <.literal16+0xee1> DB 255,0 ; incl (%rax) DB 0,0 ; add %al,(%rax) DB 255,0 ; incl (%rax) @@ -21225,7 +21371,7 @@ ALIGN 16 DB 5,255,255,255,9 ; add $0x9ffffff,%eax DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30069e0 <_sk_callback_sse41+0x3000f9b> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006aa0 <_sk_callback_sse41+0x3000faa> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -21252,7 +21398,7 @@ ALIGN 16 DB 5,255,255,255,9 ; add $0x9ffffff,%eax DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006a20 <_sk_callback_sse41+0x3000fdb> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006ae0 <_sk_callback_sse41+0x3000fea> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -21279,7 +21425,7 @@ ALIGN 16 DB 5,255,255,255,9 ; add $0x9ffffff,%eax DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006a60 <_sk_callback_sse41+0x300101b> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006b20 <_sk_callback_sse41+0x300102a> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -21294,11 +21440,11 @@ ALIGN 16 DB 255,0 ; incl (%rax) DB 0,127,67 ; add %bh,0x43(%rdi) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6abb <.literal16+0xfab> + DB 127,67 ; jg 6b7b <.literal16+0xfab> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6abf <.literal16+0xfaf> + DB 127,67 ; jg 6b7f <.literal16+0xfaf> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6ac3 <.literal16+0xfb3> + DB 127,67 ; jg 6b83 <.literal16+0xfb3> DB 255,0 ; incl (%rax) DB 0,0 ; add %al,(%rax) DB 255,0 ; incl (%rax) @@ -21313,7 +21459,7 @@ ALIGN 16 DB 5,255,255,255,9 ; add $0x9ffffff,%eax DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006ab0 <_sk_callback_sse41+0x300106b> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006b70 <_sk_callback_sse41+0x300107a> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -21340,7 +21486,7 @@ ALIGN 16 DB 5,255,255,255,9 ; add $0x9ffffff,%eax DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006af0 <_sk_callback_sse41+0x30010ab> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006bb0 <_sk_callback_sse41+0x30010ba> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -21367,7 +21513,7 @@ ALIGN 16 DB 5,255,255,255,9 ; add $0x9ffffff,%eax DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006b30 <_sk_callback_sse41+0x30010eb> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006bf0 <_sk_callback_sse41+0x30010fa> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -21382,11 +21528,11 @@ ALIGN 16 DB 255,0 ; incl (%rax) DB 0,127,67 ; add %bh,0x43(%rdi) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6b8b <.literal16+0x107b> + DB 127,67 ; jg 6c4b <.literal16+0x107b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6b8f <.literal16+0x107f> + DB 127,67 ; jg 6c4f <.literal16+0x107f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6b93 <.literal16+0x1083> + DB 127,67 ; jg 6c53 <.literal16+0x1083> DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax) DB 0,0 ; add %al,(%rax) DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax) @@ -21481,13 +21627,13 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 255 ; (bad) - DB 127,71 ; jg 6c8b <.literal16+0x117b> + DB 127,71 ; jg 6d4b <.literal16+0x117b> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 6c8f <.literal16+0x117f> + DB 127,71 ; jg 6d4f <.literal16+0x117f> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 6c93 <.literal16+0x1183> + DB 127,71 ; jg 6d53 <.literal16+0x1183> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 6c97 <.literal16+0x1187> + DB 127,71 ; jg 6d57 <.literal16+0x1187> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -21533,10 +21679,10 @@ ALIGN 16 DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax DB 152 ; cwtl DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx) - DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc07dca <_sk_callback_sse41+0x2dc02385> + DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc07e8a <_sk_callback_sse41+0x2dc02394> DB 17,192 ; adc %eax,%eax DB 45,16,17,192,18 ; sub $0x12c01110,%eax - DB 120,57 ; js 6cfc <.literal16+0x11ec> + DB 120,57 ; js 6dbc <.literal16+0x11ec> DB 64,18,120,57 ; adc 0x39(%rax),%dil DB 64,18,120,57 ; adc 0x39(%rax),%dil DB 64,18,120,57 ; adc 0x39(%rax),%dil @@ -21627,7 +21773,25 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) - DB 0,63 ; add %bh,(%rdi) + DB 0,192 ; add %al,%al + DB 0,0 ; add %al,(%rax) + DB 0,192 ; add %al,%al + DB 0,0 ; add %al,(%rax) + DB 0,192 ; add %al,%al + DB 0,0 ; add %al,(%rax) + DB 0,192 ; add %al,%al + DB 0,0 ; add %al,(%rax) + DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax) + DB 0,0 ; add %al,(%rax) + DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax) + DB 0,0 ; add %al,(%rax) + DB 128,63,0 ; cmpb $0x0,(%rdi) + DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) + DB 63 ; (bad) + DB 0,0 ; add %al,(%rax) + DB 128,63,0 ; cmpb $0x0,(%rdi) + DB 0,0 ; add %al,(%rax) + DB 63 ; (bad) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -21681,11 +21845,11 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 128,63,114 ; cmpb $0x72,(%rdi) DB 28,199 ; sbb $0xc7,%al - DB 62,114,28 ; jb,pt 6e72 <.literal16+0x1362> + DB 62,114,28 ; jb,pt 6f62 <.literal16+0x1392> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6e76 <.literal16+0x1366> + DB 62,114,28 ; jb,pt 6f66 <.literal16+0x1396> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6e7a <.literal16+0x136a> + DB 62,114,28 ; jb,pt 6f6a <.literal16+0x139a> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -21729,7 +21893,7 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63fd05 <_sk_callback_sse41+0x3d63a2c0> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63fdf5 <_sk_callback_sse41+0x3d63a2ff> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -21755,7 +21919,7 @@ ALIGN 16 DB 0,192 ; add %al,%al DB 63 ; (bad) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63fd45 <_sk_callback_sse41+0x3d63a300> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63fe35 <_sk_callback_sse41+0x3d63a33f> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al @@ -21764,13 +21928,13 @@ ALIGN 16 DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al DB 63 ; (bad) - DB 114,28 ; jb 6f3e <.literal16+0x142e> + DB 114,28 ; jb 702e <.literal16+0x145e> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6f42 <.literal16+0x1432> + DB 62,114,28 ; jb,pt 7032 <.literal16+0x1462> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6f46 <.literal16+0x1436> + DB 62,114,28 ; jb,pt 7036 <.literal16+0x1466> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6f4a <.literal16+0x143a> + DB 62,114,28 ; jb,pt 703a <.literal16+0x146a> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -21791,11 +21955,11 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 128,63,114 ; cmpb $0x72,(%rdi) DB 28,199 ; sbb $0xc7,%al - DB 62,114,28 ; jb,pt 6f82 <.literal16+0x1472> + DB 62,114,28 ; jb,pt 7072 <.literal16+0x14a2> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6f86 <.literal16+0x1476> + DB 62,114,28 ; jb,pt 7076 <.literal16+0x14a6> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6f8a <.literal16+0x147a> + DB 62,114,28 ; jb,pt 707a <.literal16+0x14aa> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -21839,7 +22003,7 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63fe15 <_sk_callback_sse41+0x3d63a3d0> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63ff05 <_sk_callback_sse41+0x3d63a40f> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -21865,7 +22029,7 @@ ALIGN 16 DB 0,192 ; add %al,%al DB 63 ; (bad) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63fe55 <_sk_callback_sse41+0x3d63a410> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63ff45 <_sk_callback_sse41+0x3d63a44f> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al @@ -21874,13 +22038,13 @@ ALIGN 16 DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al DB 63 ; (bad) - DB 114,28 ; jb 704e <.literal16+0x153e> + DB 114,28 ; jb 713e <.literal16+0x156e> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 7052 <_sk_callback_sse41+0x160d> + DB 62,114,28 ; jb,pt 7142 <_sk_callback_sse41+0x164c> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 7056 <_sk_callback_sse41+0x1611> + DB 62,114,28 ; jb,pt 7146 <_sk_callback_sse41+0x1650> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 705a <_sk_callback_sse41+0x1615> + DB 62,114,28 ; jb,pt 714a <_sk_callback_sse41+0x1654> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -21981,7 +22145,7 @@ _sk_seed_shader_sse2 LABEL PROC DB 102,15,110,194 ; movd %edx,%xmm0 DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0 DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1 - DB 15,40,21,24,95,0,0 ; movaps 0x5f18(%rip),%xmm2 # 6040 <_sk_callback_sse2+0xd8> + DB 15,40,21,184,95,0,0 ; movaps 0x5fb8(%rip),%xmm2 # 60e0 <_sk_callback_sse2+0xd7> DB 15,88,202 ; addps %xmm2,%xmm1 DB 15,16,7 ; movups (%rdi),%xmm0 DB 15,88,193 ; addps %xmm1,%xmm0 @@ -21990,7 +22154,7 @@ _sk_seed_shader_sse2 LABEL PROC DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 15,88,202 ; addps %xmm2,%xmm1 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,21,7,95,0,0 ; movaps 0x5f07(%rip),%xmm2 # 6050 <_sk_callback_sse2+0xe8> + DB 15,40,21,167,95,0,0 ; movaps 0x5fa7(%rip),%xmm2 # 60f0 <_sk_callback_sse2+0xe7> DB 15,87,219 ; xorps %xmm3,%xmm3 DB 15,87,228 ; xorps %xmm4,%xmm4 DB 15,87,237 ; xorps %xmm5,%xmm5 @@ -22008,14 +22172,14 @@ _sk_dither_sse2 LABEL PROC DB 102,68,15,110,193 ; movd %ecx,%xmm8 DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8 DB 102,69,15,239,193 ; pxor %xmm9,%xmm8 - DB 102,68,15,111,21,213,94,0,0 ; movdqa 0x5ed5(%rip),%xmm10 # 6060 <_sk_callback_sse2+0xf8> + DB 102,68,15,111,21,117,95,0,0 ; movdqa 0x5f75(%rip),%xmm10 # 6100 <_sk_callback_sse2+0xf7> DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11 DB 102,69,15,219,218 ; pand %xmm10,%xmm11 DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11 DB 102,69,15,219,209 ; pand %xmm9,%xmm10 DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10 - DB 102,68,15,111,37,193,94,0,0 ; movdqa 0x5ec1(%rip),%xmm12 # 6070 <_sk_callback_sse2+0x108> - DB 102,68,15,111,45,200,94,0,0 ; movdqa 0x5ec8(%rip),%xmm13 # 6080 <_sk_callback_sse2+0x118> + DB 102,68,15,111,37,97,95,0,0 ; movdqa 0x5f61(%rip),%xmm12 # 6110 <_sk_callback_sse2+0x107> + DB 102,68,15,111,45,104,95,0,0 ; movdqa 0x5f68(%rip),%xmm13 # 6120 <_sk_callback_sse2+0x117> DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14 DB 102,69,15,219,245 ; pand %xmm13,%xmm14 DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14 @@ -22031,8 +22195,8 @@ _sk_dither_sse2 LABEL PROC DB 102,69,15,235,245 ; por %xmm13,%xmm14 DB 102,69,15,235,240 ; por %xmm8,%xmm14 DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8 - DB 68,15,89,5,131,94,0,0 ; mulps 0x5e83(%rip),%xmm8 # 6090 <_sk_callback_sse2+0x128> - DB 68,15,88,5,139,94,0,0 ; addps 0x5e8b(%rip),%xmm8 # 60a0 <_sk_callback_sse2+0x138> + DB 68,15,89,5,35,95,0,0 ; mulps 0x5f23(%rip),%xmm8 # 6130 <_sk_callback_sse2+0x127> + DB 68,15,88,5,43,95,0,0 ; addps 0x5f2b(%rip),%xmm8 # 6140 <_sk_callback_sse2+0x137> DB 243,68,15,16,16 ; movss (%rax),%xmm10 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,89,208 ; mulps %xmm8,%xmm10 @@ -22099,7 +22263,7 @@ _sk_clear_sse2 LABEL PROC PUBLIC _sk_srcatop_sse2 _sk_srcatop_sse2 LABEL PROC DB 15,89,199 ; mulps %xmm7,%xmm0 - DB 68,15,40,5,229,93,0,0 ; movaps 0x5de5(%rip),%xmm8 # 60b0 <_sk_callback_sse2+0x148> + DB 68,15,40,5,133,94,0,0 ; movaps 0x5e85(%rip),%xmm8 # 6150 <_sk_callback_sse2+0x147> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -22122,7 +22286,7 @@ PUBLIC _sk_dstatop_sse2 _sk_dstatop_sse2 LABEL PROC DB 68,15,40,195 ; movaps %xmm3,%xmm8 DB 68,15,89,196 ; mulps %xmm4,%xmm8 - DB 68,15,40,13,168,93,0,0 ; movaps 0x5da8(%rip),%xmm9 # 60c0 <_sk_callback_sse2+0x158> + DB 68,15,40,13,72,94,0,0 ; movaps 0x5e48(%rip),%xmm9 # 6160 <_sk_callback_sse2+0x157> DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 65,15,88,192 ; addps %xmm8,%xmm0 @@ -22163,7 +22327,7 @@ _sk_dstin_sse2 LABEL PROC PUBLIC _sk_srcout_sse2 _sk_srcout_sse2 LABEL PROC - DB 68,15,40,5,76,93,0,0 ; movaps 0x5d4c(%rip),%xmm8 # 60d0 <_sk_callback_sse2+0x168> + DB 68,15,40,5,236,93,0,0 ; movaps 0x5dec(%rip),%xmm8 # 6170 <_sk_callback_sse2+0x167> DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 @@ -22174,7 +22338,7 @@ _sk_srcout_sse2 LABEL PROC PUBLIC _sk_dstout_sse2 _sk_dstout_sse2 LABEL PROC - DB 68,15,40,5,60,93,0,0 ; movaps 0x5d3c(%rip),%xmm8 # 60e0 <_sk_callback_sse2+0x178> + DB 68,15,40,5,220,93,0,0 ; movaps 0x5ddc(%rip),%xmm8 # 6180 <_sk_callback_sse2+0x177> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 15,89,196 ; mulps %xmm4,%xmm0 @@ -22189,7 +22353,7 @@ _sk_dstout_sse2 LABEL PROC PUBLIC _sk_srcover_sse2 _sk_srcover_sse2 LABEL PROC - DB 68,15,40,5,31,93,0,0 ; movaps 0x5d1f(%rip),%xmm8 # 60f0 <_sk_callback_sse2+0x188> + DB 68,15,40,5,191,93,0,0 ; movaps 0x5dbf(%rip),%xmm8 # 6190 <_sk_callback_sse2+0x187> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -22207,7 +22371,7 @@ _sk_srcover_sse2 LABEL PROC PUBLIC _sk_dstover_sse2 _sk_dstover_sse2 LABEL PROC - DB 68,15,40,5,243,92,0,0 ; movaps 0x5cf3(%rip),%xmm8 # 6100 <_sk_callback_sse2+0x198> + DB 68,15,40,5,147,93,0,0 ; movaps 0x5d93(%rip),%xmm8 # 61a0 <_sk_callback_sse2+0x197> DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -22231,7 +22395,7 @@ _sk_modulate_sse2 LABEL PROC PUBLIC _sk_multiply_sse2 _sk_multiply_sse2 LABEL PROC - DB 68,15,40,5,199,92,0,0 ; movaps 0x5cc7(%rip),%xmm8 # 6110 <_sk_callback_sse2+0x1a8> + DB 68,15,40,5,103,93,0,0 ; movaps 0x5d67(%rip),%xmm8 # 61b0 <_sk_callback_sse2+0x1a7> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 69,15,40,209 ; movaps %xmm9,%xmm10 @@ -22300,7 +22464,7 @@ _sk_screen_sse2 LABEL PROC PUBLIC _sk_xor__sse2 _sk_xor__sse2 LABEL PROC DB 68,15,40,195 ; movaps %xmm3,%xmm8 - DB 15,40,29,252,91,0,0 ; movaps 0x5bfc(%rip),%xmm3 # 6120 <_sk_callback_sse2+0x1b8> + DB 15,40,29,156,92,0,0 ; movaps 0x5c9c(%rip),%xmm3 # 61c0 <_sk_callback_sse2+0x1b7> DB 68,15,40,203 ; movaps %xmm3,%xmm9 DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 65,15,89,193 ; mulps %xmm9,%xmm0 @@ -22346,7 +22510,7 @@ _sk_darken_sse2 LABEL PROC DB 68,15,89,206 ; mulps %xmm6,%xmm9 DB 65,15,95,209 ; maxps %xmm9,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,103,91,0,0 ; movaps 0x5b67(%rip),%xmm2 # 6130 <_sk_callback_sse2+0x1c8> + DB 15,40,21,7,92,0,0 ; movaps 0x5c07(%rip),%xmm2 # 61d0 <_sk_callback_sse2+0x1c7> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -22378,7 +22542,7 @@ _sk_lighten_sse2 LABEL PROC DB 68,15,89,206 ; mulps %xmm6,%xmm9 DB 65,15,93,209 ; minps %xmm9,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,12,91,0,0 ; movaps 0x5b0c(%rip),%xmm2 # 6140 <_sk_callback_sse2+0x1d8> + DB 15,40,21,172,91,0,0 ; movaps 0x5bac(%rip),%xmm2 # 61e0 <_sk_callback_sse2+0x1d7> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -22413,7 +22577,7 @@ _sk_difference_sse2 LABEL PROC DB 65,15,93,209 ; minps %xmm9,%xmm2 DB 15,88,210 ; addps %xmm2,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,166,90,0,0 ; movaps 0x5aa6(%rip),%xmm2 # 6150 <_sk_callback_sse2+0x1e8> + DB 15,40,21,70,91,0,0 ; movaps 0x5b46(%rip),%xmm2 # 61f0 <_sk_callback_sse2+0x1e7> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -22439,7 +22603,7 @@ _sk_exclusion_sse2 LABEL PROC DB 15,89,214 ; mulps %xmm6,%xmm2 DB 15,88,210 ; addps %xmm2,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,102,90,0,0 ; movaps 0x5a66(%rip),%xmm2 # 6160 <_sk_callback_sse2+0x1f8> + DB 15,40,21,6,91,0,0 ; movaps 0x5b06(%rip),%xmm2 # 6200 <_sk_callback_sse2+0x1f7> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -22450,7 +22614,7 @@ _sk_exclusion_sse2 LABEL PROC PUBLIC _sk_colorburn_sse2 _sk_colorburn_sse2 LABEL PROC DB 68,15,40,192 ; movaps %xmm0,%xmm8 - DB 68,15,40,21,89,90,0,0 ; movaps 0x5a59(%rip),%xmm10 # 6170 <_sk_callback_sse2+0x208> + DB 68,15,40,21,249,90,0,0 ; movaps 0x5af9(%rip),%xmm10 # 6210 <_sk_callback_sse2+0x207> DB 69,15,40,202 ; movaps %xmm10,%xmm9 DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 69,15,40,217 ; movaps %xmm9,%xmm11 @@ -22542,7 +22706,7 @@ _sk_colorburn_sse2 LABEL PROC PUBLIC _sk_colordodge_sse2 _sk_colordodge_sse2 LABEL PROC DB 68,15,40,200 ; movaps %xmm0,%xmm9 - DB 68,15,40,21,15,89,0,0 ; movaps 0x590f(%rip),%xmm10 # 6180 <_sk_callback_sse2+0x218> + DB 68,15,40,21,175,89,0,0 ; movaps 0x59af(%rip),%xmm10 # 6220 <_sk_callback_sse2+0x217> DB 69,15,40,218 ; movaps %xmm10,%xmm11 DB 68,15,92,223 ; subps %xmm7,%xmm11 DB 69,15,40,227 ; movaps %xmm11,%xmm12 @@ -22635,7 +22799,7 @@ _sk_hardlight_sse2 LABEL PROC DB 15,41,52,36 ; movaps %xmm6,(%rsp) DB 15,40,245 ; movaps %xmm5,%xmm6 DB 15,40,236 ; movaps %xmm4,%xmm5 - DB 68,15,40,29,193,87,0,0 ; movaps 0x57c1(%rip),%xmm11 # 6190 <_sk_callback_sse2+0x228> + DB 68,15,40,29,97,88,0,0 ; movaps 0x5861(%rip),%xmm11 # 6230 <_sk_callback_sse2+0x227> DB 69,15,40,211 ; movaps %xmm11,%xmm10 DB 68,15,92,215 ; subps %xmm7,%xmm10 DB 69,15,40,194 ; movaps %xmm10,%xmm8 @@ -22722,7 +22886,7 @@ PUBLIC _sk_overlay_sse2 _sk_overlay_sse2 LABEL PROC DB 68,15,40,193 ; movaps %xmm1,%xmm8 DB 68,15,40,232 ; movaps %xmm0,%xmm13 - DB 68,15,40,13,140,86,0,0 ; movaps 0x568c(%rip),%xmm9 # 61a0 <_sk_callback_sse2+0x238> + DB 68,15,40,13,44,87,0,0 ; movaps 0x572c(%rip),%xmm9 # 6240 <_sk_callback_sse2+0x237> DB 69,15,40,209 ; movaps %xmm9,%xmm10 DB 68,15,92,215 ; subps %xmm7,%xmm10 DB 69,15,40,218 ; movaps %xmm10,%xmm11 @@ -22812,7 +22976,7 @@ _sk_softlight_sse2 LABEL PROC DB 68,15,40,213 ; movaps %xmm5,%xmm10 DB 68,15,94,215 ; divps %xmm7,%xmm10 DB 69,15,84,212 ; andps %xmm12,%xmm10 - DB 68,15,40,13,70,85,0,0 ; movaps 0x5546(%rip),%xmm9 # 61b0 <_sk_callback_sse2+0x248> + DB 68,15,40,13,230,85,0,0 ; movaps 0x55e6(%rip),%xmm9 # 6250 <_sk_callback_sse2+0x247> DB 69,15,40,249 ; movaps %xmm9,%xmm15 DB 69,15,92,250 ; subps %xmm10,%xmm15 DB 69,15,40,218 ; movaps %xmm10,%xmm11 @@ -22825,10 +22989,10 @@ _sk_softlight_sse2 LABEL PROC DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 15,89,192 ; mulps %xmm0,%xmm0 DB 65,15,88,194 ; addps %xmm10,%xmm0 - DB 68,15,40,53,32,85,0,0 ; movaps 0x5520(%rip),%xmm14 # 61c0 <_sk_callback_sse2+0x258> + DB 68,15,40,53,192,85,0,0 ; movaps 0x55c0(%rip),%xmm14 # 6260 <_sk_callback_sse2+0x257> DB 69,15,88,222 ; addps %xmm14,%xmm11 DB 68,15,89,216 ; mulps %xmm0,%xmm11 - DB 68,15,40,21,32,85,0,0 ; movaps 0x5520(%rip),%xmm10 # 61d0 <_sk_callback_sse2+0x268> + DB 68,15,40,21,192,85,0,0 ; movaps 0x55c0(%rip),%xmm10 # 6270 <_sk_callback_sse2+0x267> DB 69,15,89,234 ; mulps %xmm10,%xmm13 DB 69,15,88,235 ; addps %xmm11,%xmm13 DB 15,88,228 ; addps %xmm4,%xmm4 @@ -22973,7 +23137,7 @@ _sk_hue_sse2 LABEL PROC DB 68,15,40,209 ; movaps %xmm1,%xmm10 DB 68,15,40,225 ; movaps %xmm1,%xmm12 DB 68,15,89,211 ; mulps %xmm3,%xmm10 - DB 68,15,40,5,92,83,0,0 ; movaps 0x535c(%rip),%xmm8 # 6210 <_sk_callback_sse2+0x2a8> + DB 68,15,40,5,252,83,0,0 ; movaps 0x53fc(%rip),%xmm8 # 62b0 <_sk_callback_sse2+0x2a7> DB 69,15,40,216 ; movaps %xmm8,%xmm11 DB 15,40,207 ; movaps %xmm7,%xmm1 DB 68,15,92,217 ; subps %xmm1,%xmm11 @@ -23021,12 +23185,12 @@ _sk_hue_sse2 LABEL PROC DB 69,15,84,206 ; andps %xmm14,%xmm9 DB 69,15,84,214 ; andps %xmm14,%xmm10 DB 65,15,84,214 ; andps %xmm14,%xmm2 - DB 68,15,40,61,105,82,0,0 ; movaps 0x5269(%rip),%xmm15 # 61e0 <_sk_callback_sse2+0x278> + DB 68,15,40,61,9,83,0,0 ; movaps 0x5309(%rip),%xmm15 # 6280 <_sk_callback_sse2+0x277> DB 65,15,89,231 ; mulps %xmm15,%xmm4 - DB 15,40,5,110,82,0,0 ; movaps 0x526e(%rip),%xmm0 # 61f0 <_sk_callback_sse2+0x288> + DB 15,40,5,14,83,0,0 ; movaps 0x530e(%rip),%xmm0 # 6290 <_sk_callback_sse2+0x287> DB 15,89,240 ; mulps %xmm0,%xmm6 DB 15,88,244 ; addps %xmm4,%xmm6 - DB 68,15,40,53,112,82,0,0 ; movaps 0x5270(%rip),%xmm14 # 6200 <_sk_callback_sse2+0x298> + DB 68,15,40,53,16,83,0,0 ; movaps 0x5310(%rip),%xmm14 # 62a0 <_sk_callback_sse2+0x297> DB 68,15,40,239 ; movaps %xmm7,%xmm13 DB 69,15,89,238 ; mulps %xmm14,%xmm13 DB 68,15,88,238 ; addps %xmm6,%xmm13 @@ -23204,14 +23368,14 @@ _sk_saturation_sse2 LABEL PROC DB 68,15,84,211 ; andps %xmm3,%xmm10 DB 68,15,84,203 ; andps %xmm3,%xmm9 DB 15,84,195 ; andps %xmm3,%xmm0 - DB 68,15,40,5,253,79,0,0 ; movaps 0x4ffd(%rip),%xmm8 # 6220 <_sk_callback_sse2+0x2b8> + DB 68,15,40,5,157,80,0,0 ; movaps 0x509d(%rip),%xmm8 # 62c0 <_sk_callback_sse2+0x2b7> DB 15,40,214 ; movaps %xmm6,%xmm2 DB 65,15,89,208 ; mulps %xmm8,%xmm2 - DB 15,40,13,255,79,0,0 ; movaps 0x4fff(%rip),%xmm1 # 6230 <_sk_callback_sse2+0x2c8> + DB 15,40,13,159,80,0,0 ; movaps 0x509f(%rip),%xmm1 # 62d0 <_sk_callback_sse2+0x2c7> DB 15,40,221 ; movaps %xmm5,%xmm3 DB 15,89,217 ; mulps %xmm1,%xmm3 DB 15,88,218 ; addps %xmm2,%xmm3 - DB 68,15,40,37,254,79,0,0 ; movaps 0x4ffe(%rip),%xmm12 # 6240 <_sk_callback_sse2+0x2d8> + DB 68,15,40,37,158,80,0,0 ; movaps 0x509e(%rip),%xmm12 # 62e0 <_sk_callback_sse2+0x2d7> DB 69,15,89,236 ; mulps %xmm12,%xmm13 DB 68,15,88,235 ; addps %xmm3,%xmm13 DB 65,15,40,210 ; movaps %xmm10,%xmm2 @@ -23256,7 +23420,7 @@ _sk_saturation_sse2 LABEL PROC DB 15,40,223 ; movaps %xmm7,%xmm3 DB 15,40,236 ; movaps %xmm4,%xmm5 DB 15,89,221 ; mulps %xmm5,%xmm3 - DB 68,15,40,5,99,79,0,0 ; movaps 0x4f63(%rip),%xmm8 # 6250 <_sk_callback_sse2+0x2e8> + DB 68,15,40,5,3,80,0,0 ; movaps 0x5003(%rip),%xmm8 # 62f0 <_sk_callback_sse2+0x2e7> DB 65,15,40,224 ; movaps %xmm8,%xmm4 DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 15,88,253 ; addps %xmm5,%xmm7 @@ -23357,14 +23521,14 @@ _sk_color_sse2 LABEL PROC DB 68,15,40,213 ; movaps %xmm5,%xmm10 DB 69,15,89,208 ; mulps %xmm8,%xmm10 DB 65,15,40,208 ; movaps %xmm8,%xmm2 - DB 68,15,40,45,251,77,0,0 ; movaps 0x4dfb(%rip),%xmm13 # 6260 <_sk_callback_sse2+0x2f8> + DB 68,15,40,45,155,78,0,0 ; movaps 0x4e9b(%rip),%xmm13 # 6300 <_sk_callback_sse2+0x2f7> DB 68,15,40,198 ; movaps %xmm6,%xmm8 DB 69,15,89,197 ; mulps %xmm13,%xmm8 - DB 68,15,40,53,251,77,0,0 ; movaps 0x4dfb(%rip),%xmm14 # 6270 <_sk_callback_sse2+0x308> + DB 68,15,40,53,155,78,0,0 ; movaps 0x4e9b(%rip),%xmm14 # 6310 <_sk_callback_sse2+0x307> DB 65,15,40,195 ; movaps %xmm11,%xmm0 DB 65,15,89,198 ; mulps %xmm14,%xmm0 DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,29,247,77,0,0 ; movaps 0x4df7(%rip),%xmm11 # 6280 <_sk_callback_sse2+0x318> + DB 68,15,40,29,151,78,0,0 ; movaps 0x4e97(%rip),%xmm11 # 6320 <_sk_callback_sse2+0x317> DB 69,15,89,227 ; mulps %xmm11,%xmm12 DB 68,15,88,224 ; addps %xmm0,%xmm12 DB 65,15,40,193 ; movaps %xmm9,%xmm0 @@ -23372,7 +23536,7 @@ _sk_color_sse2 LABEL PROC DB 69,15,40,250 ; movaps %xmm10,%xmm15 DB 69,15,89,254 ; mulps %xmm14,%xmm15 DB 68,15,88,248 ; addps %xmm0,%xmm15 - DB 68,15,40,5,227,77,0,0 ; movaps 0x4de3(%rip),%xmm8 # 6290 <_sk_callback_sse2+0x328> + DB 68,15,40,5,131,78,0,0 ; movaps 0x4e83(%rip),%xmm8 # 6330 <_sk_callback_sse2+0x327> DB 65,15,40,224 ; movaps %xmm8,%xmm4 DB 15,92,226 ; subps %xmm2,%xmm4 DB 15,89,252 ; mulps %xmm4,%xmm7 @@ -23508,15 +23672,15 @@ _sk_luminosity_sse2 LABEL PROC DB 68,15,40,205 ; movaps %xmm5,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 DB 15,89,222 ; mulps %xmm6,%xmm3 - DB 68,15,40,37,245,75,0,0 ; movaps 0x4bf5(%rip),%xmm12 # 62a0 <_sk_callback_sse2+0x338> + DB 68,15,40,37,149,76,0,0 ; movaps 0x4c95(%rip),%xmm12 # 6340 <_sk_callback_sse2+0x337> DB 68,15,40,199 ; movaps %xmm7,%xmm8 DB 69,15,89,196 ; mulps %xmm12,%xmm8 - DB 68,15,40,45,245,75,0,0 ; movaps 0x4bf5(%rip),%xmm13 # 62b0 <_sk_callback_sse2+0x348> + DB 68,15,40,45,149,76,0,0 ; movaps 0x4c95(%rip),%xmm13 # 6350 <_sk_callback_sse2+0x347> DB 68,15,40,241 ; movaps %xmm1,%xmm14 DB 69,15,89,245 ; mulps %xmm13,%xmm14 DB 69,15,88,240 ; addps %xmm8,%xmm14 - DB 68,15,40,29,241,75,0,0 ; movaps 0x4bf1(%rip),%xmm11 # 62c0 <_sk_callback_sse2+0x358> - DB 68,15,40,5,249,75,0,0 ; movaps 0x4bf9(%rip),%xmm8 # 62d0 <_sk_callback_sse2+0x368> + DB 68,15,40,29,145,76,0,0 ; movaps 0x4c91(%rip),%xmm11 # 6360 <_sk_callback_sse2+0x357> + DB 68,15,40,5,153,76,0,0 ; movaps 0x4c99(%rip),%xmm8 # 6370 <_sk_callback_sse2+0x367> DB 69,15,40,248 ; movaps %xmm8,%xmm15 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 68,15,92,248 ; subps %xmm0,%xmm15 @@ -23654,7 +23818,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 15,133,227,0,0,0 ; jne 19b1 <_sk_srcover_rgba_8888_sse2+0xf1> DB 243,68,15,111,4,144 ; movdqu (%rax,%rdx,4),%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 102,15,111,53,1,74,0,0 ; movdqa 0x4a01(%rip),%xmm6 # 62e0 <_sk_callback_sse2+0x378> + DB 102,15,111,53,161,74,0,0 ; movdqa 0x4aa1(%rip),%xmm6 # 6380 <_sk_callback_sse2+0x377> DB 102,65,15,111,224 ; movdqa %xmm8,%xmm4 DB 102,15,219,230 ; pand %xmm6,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 @@ -23668,9 +23832,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 15,91,247 ; cvtdq2ps %xmm7,%xmm6 DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8 DB 65,15,91,248 ; cvtdq2ps %xmm8,%xmm7 - DB 68,15,40,5,209,73,0,0 ; movaps 0x49d1(%rip),%xmm8 # 62f0 <_sk_callback_sse2+0x388> + DB 68,15,40,5,113,74,0,0 ; movaps 0x4a71(%rip),%xmm8 # 6390 <_sk_callback_sse2+0x387> DB 68,15,92,195 ; subps %xmm3,%xmm8 - DB 68,15,40,37,213,73,0,0 ; movaps 0x49d5(%rip),%xmm12 # 6300 <_sk_callback_sse2+0x398> + DB 68,15,40,37,117,74,0,0 ; movaps 0x4a75(%rip),%xmm12 # 63a0 <_sk_callback_sse2+0x397> DB 65,15,89,196 ; mulps %xmm12,%xmm0 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -23746,7 +23910,7 @@ _sk_clamp_0_sse2 LABEL PROC PUBLIC _sk_clamp_1_sse2 _sk_clamp_1_sse2 LABEL PROC - DB 68,15,40,5,198,72,0,0 ; movaps 0x48c6(%rip),%xmm8 # 6310 <_sk_callback_sse2+0x3a8> + DB 68,15,40,5,102,73,0,0 ; movaps 0x4966(%rip),%xmm8 # 63b0 <_sk_callback_sse2+0x3a7> DB 65,15,93,192 ; minps %xmm8,%xmm0 DB 65,15,93,200 ; minps %xmm8,%xmm1 DB 65,15,93,208 ; minps %xmm8,%xmm2 @@ -23756,7 +23920,7 @@ _sk_clamp_1_sse2 LABEL PROC PUBLIC _sk_clamp_a_sse2 _sk_clamp_a_sse2 LABEL PROC - DB 15,93,29,187,72,0,0 ; minps 0x48bb(%rip),%xmm3 # 6320 <_sk_callback_sse2+0x3b8> + DB 15,93,29,91,73,0,0 ; minps 0x495b(%rip),%xmm3 # 63c0 <_sk_callback_sse2+0x3b7> DB 15,93,195 ; minps %xmm3,%xmm0 DB 15,93,203 ; minps %xmm3,%xmm1 DB 15,93,211 ; minps %xmm3,%xmm2 @@ -23765,7 +23929,7 @@ _sk_clamp_a_sse2 LABEL PROC PUBLIC _sk_clamp_a_dst_sse2 _sk_clamp_a_dst_sse2 LABEL PROC - DB 15,93,61,183,72,0,0 ; minps 0x48b7(%rip),%xmm7 # 6330 <_sk_callback_sse2+0x3c8> + DB 15,93,61,87,73,0,0 ; minps 0x4957(%rip),%xmm7 # 63d0 <_sk_callback_sse2+0x3c7> DB 15,93,231 ; minps %xmm7,%xmm4 DB 15,93,239 ; minps %xmm7,%xmm5 DB 15,93,247 ; minps %xmm7,%xmm6 @@ -23821,7 +23985,7 @@ _sk_premul_sse2 LABEL PROC PUBLIC _sk_unpremul_sse2 _sk_unpremul_sse2 LABEL PROC DB 69,15,87,192 ; xorps %xmm8,%xmm8 - DB 68,15,40,13,82,72,0,0 ; movaps 0x4852(%rip),%xmm9 # 6340 <_sk_callback_sse2+0x3d8> + DB 68,15,40,13,242,72,0,0 ; movaps 0x48f2(%rip),%xmm9 # 63e0 <_sk_callback_sse2+0x3d7> DB 68,15,94,203 ; divps %xmm3,%xmm9 DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8 DB 69,15,84,193 ; andps %xmm9,%xmm8 @@ -23833,20 +23997,20 @@ _sk_unpremul_sse2 LABEL PROC PUBLIC _sk_from_srgb_sse2 _sk_from_srgb_sse2 LABEL PROC - DB 68,15,40,5,61,72,0,0 ; movaps 0x483d(%rip),%xmm8 # 6350 <_sk_callback_sse2+0x3e8> + DB 68,15,40,5,221,72,0,0 ; movaps 0x48dd(%rip),%xmm8 # 63f0 <_sk_callback_sse2+0x3e7> DB 68,15,40,232 ; movaps %xmm0,%xmm13 DB 69,15,89,232 ; mulps %xmm8,%xmm13 DB 68,15,40,216 ; movaps %xmm0,%xmm11 DB 69,15,89,219 ; mulps %xmm11,%xmm11 - DB 68,15,40,13,53,72,0,0 ; movaps 0x4835(%rip),%xmm9 # 6360 <_sk_callback_sse2+0x3f8> + DB 68,15,40,13,213,72,0,0 ; movaps 0x48d5(%rip),%xmm9 # 6400 <_sk_callback_sse2+0x3f7> DB 68,15,40,240 ; movaps %xmm0,%xmm14 DB 69,15,89,241 ; mulps %xmm9,%xmm14 - DB 68,15,40,21,53,72,0,0 ; movaps 0x4835(%rip),%xmm10 # 6370 <_sk_callback_sse2+0x408> + DB 68,15,40,21,213,72,0,0 ; movaps 0x48d5(%rip),%xmm10 # 6410 <_sk_callback_sse2+0x407> DB 69,15,88,242 ; addps %xmm10,%xmm14 DB 69,15,89,243 ; mulps %xmm11,%xmm14 - DB 68,15,40,29,53,72,0,0 ; movaps 0x4835(%rip),%xmm11 # 6380 <_sk_callback_sse2+0x418> + DB 68,15,40,29,213,72,0,0 ; movaps 0x48d5(%rip),%xmm11 # 6420 <_sk_callback_sse2+0x417> DB 69,15,88,243 ; addps %xmm11,%xmm14 - DB 68,15,40,37,57,72,0,0 ; movaps 0x4839(%rip),%xmm12 # 6390 <_sk_callback_sse2+0x428> + DB 68,15,40,37,217,72,0,0 ; movaps 0x48d9(%rip),%xmm12 # 6430 <_sk_callback_sse2+0x427> DB 65,15,194,196,1 ; cmpltps %xmm12,%xmm0 DB 68,15,84,232 ; andps %xmm0,%xmm13 DB 65,15,85,198 ; andnps %xmm14,%xmm0 @@ -23880,20 +24044,20 @@ _sk_from_srgb_sse2 LABEL PROC PUBLIC _sk_from_srgb_dst_sse2 _sk_from_srgb_dst_sse2 LABEL PROC - DB 68,15,40,5,202,71,0,0 ; movaps 0x47ca(%rip),%xmm8 # 63a0 <_sk_callback_sse2+0x438> + DB 68,15,40,5,106,72,0,0 ; movaps 0x486a(%rip),%xmm8 # 6440 <_sk_callback_sse2+0x437> DB 68,15,40,236 ; movaps %xmm4,%xmm13 DB 69,15,89,232 ; mulps %xmm8,%xmm13 DB 68,15,40,220 ; movaps %xmm4,%xmm11 DB 69,15,89,219 ; mulps %xmm11,%xmm11 - DB 68,15,40,13,194,71,0,0 ; movaps 0x47c2(%rip),%xmm9 # 63b0 <_sk_callback_sse2+0x448> + DB 68,15,40,13,98,72,0,0 ; movaps 0x4862(%rip),%xmm9 # 6450 <_sk_callback_sse2+0x447> DB 68,15,40,244 ; movaps %xmm4,%xmm14 DB 69,15,89,241 ; mulps %xmm9,%xmm14 - DB 68,15,40,21,194,71,0,0 ; movaps 0x47c2(%rip),%xmm10 # 63c0 <_sk_callback_sse2+0x458> + DB 68,15,40,21,98,72,0,0 ; movaps 0x4862(%rip),%xmm10 # 6460 <_sk_callback_sse2+0x457> DB 69,15,88,242 ; addps %xmm10,%xmm14 DB 69,15,89,243 ; mulps %xmm11,%xmm14 - DB 68,15,40,29,194,71,0,0 ; movaps 0x47c2(%rip),%xmm11 # 63d0 <_sk_callback_sse2+0x468> + DB 68,15,40,29,98,72,0,0 ; movaps 0x4862(%rip),%xmm11 # 6470 <_sk_callback_sse2+0x467> DB 69,15,88,243 ; addps %xmm11,%xmm14 - DB 68,15,40,37,198,71,0,0 ; movaps 0x47c6(%rip),%xmm12 # 63e0 <_sk_callback_sse2+0x478> + DB 68,15,40,37,102,72,0,0 ; movaps 0x4866(%rip),%xmm12 # 6480 <_sk_callback_sse2+0x477> DB 65,15,194,228,1 ; cmpltps %xmm12,%xmm4 DB 68,15,84,236 ; andps %xmm4,%xmm13 DB 65,15,85,230 ; andnps %xmm14,%xmm4 @@ -23928,22 +24092,22 @@ _sk_from_srgb_dst_sse2 LABEL PROC PUBLIC _sk_to_srgb_sse2 _sk_to_srgb_sse2 LABEL PROC DB 68,15,82,232 ; rsqrtps %xmm0,%xmm13 - DB 68,15,40,5,83,71,0,0 ; movaps 0x4753(%rip),%xmm8 # 63f0 <_sk_callback_sse2+0x488> + DB 68,15,40,5,243,71,0,0 ; movaps 0x47f3(%rip),%xmm8 # 6490 <_sk_callback_sse2+0x487> DB 68,15,40,240 ; movaps %xmm0,%xmm14 DB 69,15,89,240 ; mulps %xmm8,%xmm14 - DB 68,15,40,13,83,71,0,0 ; movaps 0x4753(%rip),%xmm9 # 6400 <_sk_callback_sse2+0x498> + DB 68,15,40,13,243,71,0,0 ; movaps 0x47f3(%rip),%xmm9 # 64a0 <_sk_callback_sse2+0x497> DB 69,15,40,253 ; movaps %xmm13,%xmm15 DB 69,15,89,249 ; mulps %xmm9,%xmm15 - DB 68,15,40,21,83,71,0,0 ; movaps 0x4753(%rip),%xmm10 # 6410 <_sk_callback_sse2+0x4a8> + DB 68,15,40,21,243,71,0,0 ; movaps 0x47f3(%rip),%xmm10 # 64b0 <_sk_callback_sse2+0x4a7> DB 69,15,88,250 ; addps %xmm10,%xmm15 DB 69,15,89,253 ; mulps %xmm13,%xmm15 - DB 68,15,40,29,83,71,0,0 ; movaps 0x4753(%rip),%xmm11 # 6420 <_sk_callback_sse2+0x4b8> + DB 68,15,40,29,243,71,0,0 ; movaps 0x47f3(%rip),%xmm11 # 64c0 <_sk_callback_sse2+0x4b7> DB 69,15,88,251 ; addps %xmm11,%xmm15 - DB 68,15,40,37,87,71,0,0 ; movaps 0x4757(%rip),%xmm12 # 6430 <_sk_callback_sse2+0x4c8> + DB 68,15,40,37,247,71,0,0 ; movaps 0x47f7(%rip),%xmm12 # 64d0 <_sk_callback_sse2+0x4c7> DB 69,15,88,236 ; addps %xmm12,%xmm13 DB 69,15,83,237 ; rcpps %xmm13,%xmm13 DB 69,15,89,239 ; mulps %xmm15,%xmm13 - DB 68,15,40,61,83,71,0,0 ; movaps 0x4753(%rip),%xmm15 # 6440 <_sk_callback_sse2+0x4d8> + DB 68,15,40,61,243,71,0,0 ; movaps 0x47f3(%rip),%xmm15 # 64e0 <_sk_callback_sse2+0x4d7> DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0 DB 68,15,84,240 ; andps %xmm0,%xmm14 DB 65,15,85,197 ; andnps %xmm13,%xmm0 @@ -23991,7 +24155,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC DB 68,15,93,218 ; minps %xmm2,%xmm11 DB 65,15,40,202 ; movaps %xmm10,%xmm1 DB 65,15,92,203 ; subps %xmm11,%xmm1 - DB 68,15,40,45,172,70,0,0 ; movaps 0x46ac(%rip),%xmm13 # 6450 <_sk_callback_sse2+0x4e8> + DB 68,15,40,45,76,71,0,0 ; movaps 0x474c(%rip),%xmm13 # 64f0 <_sk_callback_sse2+0x4e7> DB 68,15,94,233 ; divps %xmm1,%xmm13 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 65,15,194,192,0 ; cmpeqps %xmm8,%xmm0 @@ -24000,30 +24164,30 @@ _sk_rgb_to_hsl_sse2 LABEL PROC DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,40,241 ; movaps %xmm9,%xmm14 DB 68,15,194,242,1 ; cmpltps %xmm2,%xmm14 - DB 68,15,84,53,146,70,0,0 ; andps 0x4692(%rip),%xmm14 # 6460 <_sk_callback_sse2+0x4f8> + DB 68,15,84,53,50,71,0,0 ; andps 0x4732(%rip),%xmm14 # 6500 <_sk_callback_sse2+0x4f7> DB 69,15,88,244 ; addps %xmm12,%xmm14 DB 69,15,40,250 ; movaps %xmm10,%xmm15 DB 69,15,194,249,0 ; cmpeqps %xmm9,%xmm15 DB 65,15,92,208 ; subps %xmm8,%xmm2 DB 65,15,89,213 ; mulps %xmm13,%xmm2 - DB 68,15,40,37,133,70,0,0 ; movaps 0x4685(%rip),%xmm12 # 6470 <_sk_callback_sse2+0x508> + DB 68,15,40,37,37,71,0,0 ; movaps 0x4725(%rip),%xmm12 # 6510 <_sk_callback_sse2+0x507> DB 65,15,88,212 ; addps %xmm12,%xmm2 DB 69,15,92,193 ; subps %xmm9,%xmm8 DB 69,15,89,197 ; mulps %xmm13,%xmm8 - DB 68,15,88,5,129,70,0,0 ; addps 0x4681(%rip),%xmm8 # 6480 <_sk_callback_sse2+0x518> + DB 68,15,88,5,33,71,0,0 ; addps 0x4721(%rip),%xmm8 # 6520 <_sk_callback_sse2+0x517> DB 65,15,84,215 ; andps %xmm15,%xmm2 DB 69,15,85,248 ; andnps %xmm8,%xmm15 DB 68,15,86,250 ; orps %xmm2,%xmm15 DB 68,15,84,240 ; andps %xmm0,%xmm14 DB 65,15,85,199 ; andnps %xmm15,%xmm0 DB 65,15,86,198 ; orps %xmm14,%xmm0 - DB 15,89,5,114,70,0,0 ; mulps 0x4672(%rip),%xmm0 # 6490 <_sk_callback_sse2+0x528> + DB 15,89,5,18,71,0,0 ; mulps 0x4712(%rip),%xmm0 # 6530 <_sk_callback_sse2+0x527> DB 69,15,40,194 ; movaps %xmm10,%xmm8 DB 69,15,194,195,4 ; cmpneqps %xmm11,%xmm8 DB 65,15,84,192 ; andps %xmm8,%xmm0 DB 69,15,92,226 ; subps %xmm10,%xmm12 DB 69,15,88,211 ; addps %xmm11,%xmm10 - DB 68,15,40,13,101,70,0,0 ; movaps 0x4665(%rip),%xmm9 # 64a0 <_sk_callback_sse2+0x538> + DB 68,15,40,13,5,71,0,0 ; movaps 0x4705(%rip),%xmm9 # 6540 <_sk_callback_sse2+0x537> DB 65,15,40,210 ; movaps %xmm10,%xmm2 DB 65,15,89,209 ; mulps %xmm9,%xmm2 DB 68,15,194,202,1 ; cmpltps %xmm2,%xmm9 @@ -24046,7 +24210,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 15,41,92,36,32 ; movaps %xmm3,0x20(%rsp) DB 68,15,40,218 ; movaps %xmm2,%xmm11 DB 15,40,240 ; movaps %xmm0,%xmm6 - DB 68,15,40,13,32,70,0,0 ; movaps 0x4620(%rip),%xmm9 # 64b0 <_sk_callback_sse2+0x548> + DB 68,15,40,13,192,70,0,0 ; movaps 0x46c0(%rip),%xmm9 # 6550 <_sk_callback_sse2+0x547> DB 69,15,40,209 ; movaps %xmm9,%xmm10 DB 69,15,194,211,2 ; cmpleps %xmm11,%xmm10 DB 15,40,193 ; movaps %xmm1,%xmm0 @@ -24063,28 +24227,28 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 69,15,88,211 ; addps %xmm11,%xmm10 DB 69,15,88,219 ; addps %xmm11,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 15,40,5,234,69,0,0 ; movaps 0x45ea(%rip),%xmm0 # 64c0 <_sk_callback_sse2+0x558> + DB 15,40,5,138,70,0,0 ; movaps 0x468a(%rip),%xmm0 # 6560 <_sk_callback_sse2+0x557> DB 15,88,198 ; addps %xmm6,%xmm0 DB 243,15,91,200 ; cvttps2dq %xmm0,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 15,40,216 ; movaps %xmm0,%xmm3 DB 15,194,217,1 ; cmpltps %xmm1,%xmm3 - DB 15,84,29,226,69,0,0 ; andps 0x45e2(%rip),%xmm3 # 64d0 <_sk_callback_sse2+0x568> + DB 15,84,29,130,70,0,0 ; andps 0x4682(%rip),%xmm3 # 6570 <_sk_callback_sse2+0x567> DB 15,92,203 ; subps %xmm3,%xmm1 DB 15,92,193 ; subps %xmm1,%xmm0 - DB 68,15,40,45,228,69,0,0 ; movaps 0x45e4(%rip),%xmm13 # 64e0 <_sk_callback_sse2+0x578> + DB 68,15,40,45,132,70,0,0 ; movaps 0x4684(%rip),%xmm13 # 6580 <_sk_callback_sse2+0x577> DB 69,15,40,197 ; movaps %xmm13,%xmm8 DB 68,15,194,192,2 ; cmpleps %xmm0,%xmm8 DB 69,15,40,242 ; movaps %xmm10,%xmm14 DB 69,15,92,243 ; subps %xmm11,%xmm14 DB 65,15,40,217 ; movaps %xmm9,%xmm3 DB 15,194,216,2 ; cmpleps %xmm0,%xmm3 - DB 15,40,21,244,69,0,0 ; movaps 0x45f4(%rip),%xmm2 # 6510 <_sk_callback_sse2+0x5a8> + DB 15,40,21,148,70,0,0 ; movaps 0x4694(%rip),%xmm2 # 65b0 <_sk_callback_sse2+0x5a7> DB 68,15,40,250 ; movaps %xmm2,%xmm15 DB 68,15,194,248,2 ; cmpleps %xmm0,%xmm15 - DB 15,40,13,196,69,0,0 ; movaps 0x45c4(%rip),%xmm1 # 64f0 <_sk_callback_sse2+0x588> + DB 15,40,13,100,70,0,0 ; movaps 0x4664(%rip),%xmm1 # 6590 <_sk_callback_sse2+0x587> DB 15,89,193 ; mulps %xmm1,%xmm0 - DB 15,40,45,202,69,0,0 ; movaps 0x45ca(%rip),%xmm5 # 6500 <_sk_callback_sse2+0x598> + DB 15,40,45,106,70,0,0 ; movaps 0x466a(%rip),%xmm5 # 65a0 <_sk_callback_sse2+0x597> DB 15,40,229 ; movaps %xmm5,%xmm4 DB 15,92,224 ; subps %xmm0,%xmm4 DB 65,15,89,230 ; mulps %xmm14,%xmm4 @@ -24107,7 +24271,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 DB 15,40,222 ; movaps %xmm6,%xmm3 DB 15,194,216,1 ; cmpltps %xmm0,%xmm3 - DB 15,84,29,63,69,0,0 ; andps 0x453f(%rip),%xmm3 # 64d0 <_sk_callback_sse2+0x568> + DB 15,84,29,223,69,0,0 ; andps 0x45df(%rip),%xmm3 # 6570 <_sk_callback_sse2+0x567> DB 15,92,195 ; subps %xmm3,%xmm0 DB 68,15,40,230 ; movaps %xmm6,%xmm12 DB 68,15,92,224 ; subps %xmm0,%xmm12 @@ -24137,12 +24301,12 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 15,40,60,36 ; movaps (%rsp),%xmm7 DB 15,40,231 ; movaps %xmm7,%xmm4 DB 15,85,227 ; andnps %xmm3,%xmm4 - DB 15,88,53,24,69,0,0 ; addps 0x4518(%rip),%xmm6 # 6520 <_sk_callback_sse2+0x5b8> + DB 15,88,53,184,69,0,0 ; addps 0x45b8(%rip),%xmm6 # 65c0 <_sk_callback_sse2+0x5b7> DB 243,15,91,198 ; cvttps2dq %xmm6,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 DB 15,40,222 ; movaps %xmm6,%xmm3 DB 15,194,216,1 ; cmpltps %xmm0,%xmm3 - DB 15,84,29,179,68,0,0 ; andps 0x44b3(%rip),%xmm3 # 64d0 <_sk_callback_sse2+0x568> + DB 15,84,29,83,69,0,0 ; andps 0x4553(%rip),%xmm3 # 6570 <_sk_callback_sse2+0x567> DB 15,92,195 ; subps %xmm3,%xmm0 DB 15,92,240 ; subps %xmm0,%xmm6 DB 15,89,206 ; mulps %xmm6,%xmm1 @@ -24203,9 +24367,9 @@ _sk_scale_u8_sse2 LABEL PROC DB 102,69,15,110,4,18 ; movd (%r10,%rdx,1),%xmm8 DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8 DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8 - DB 102,68,15,219,5,64,68,0,0 ; pand 0x4440(%rip),%xmm8 # 6530 <_sk_callback_sse2+0x5c8> + DB 102,68,15,219,5,224,68,0,0 ; pand 0x44e0(%rip),%xmm8 # 65d0 <_sk_callback_sse2+0x5c7> DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,68,68,0,0 ; mulps 0x4444(%rip),%xmm8 # 6540 <_sk_callback_sse2+0x5d8> + DB 68,15,89,5,228,68,0,0 ; mulps 0x44e4(%rip),%xmm8 # 65e0 <_sk_callback_sse2+0x5d7> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 65,15,89,208 ; mulps %xmm8,%xmm2 @@ -24264,9 +24428,9 @@ _sk_lerp_u8_sse2 LABEL PROC DB 102,69,15,110,4,18 ; movd (%r10,%rdx,1),%xmm8 DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8 DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8 - DB 102,68,15,219,5,136,67,0,0 ; pand 0x4388(%rip),%xmm8 # 6550 <_sk_callback_sse2+0x5e8> + DB 102,68,15,219,5,40,68,0,0 ; pand 0x4428(%rip),%xmm8 # 65f0 <_sk_callback_sse2+0x5e7> DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,140,67,0,0 ; mulps 0x438c(%rip),%xmm8 # 6560 <_sk_callback_sse2+0x5f8> + DB 68,15,89,5,44,68,0,0 ; mulps 0x442c(%rip),%xmm8 # 6600 <_sk_callback_sse2+0x5f7> DB 15,92,196 ; subps %xmm4,%xmm0 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -24311,17 +24475,17 @@ _sk_lerp_565_sse2 LABEL PROC DB 15,133,156,0,0,0 ; jne 2306 <_sk_lerp_565_sse2+0xaa> DB 243,69,15,126,12,82 ; movq (%r10,%rdx,2),%xmm9 DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9 - DB 102,68,15,111,5,242,66,0,0 ; movdqa 0x42f2(%rip),%xmm8 # 6570 <_sk_callback_sse2+0x608> + DB 102,68,15,111,5,146,67,0,0 ; movdqa 0x4392(%rip),%xmm8 # 6610 <_sk_callback_sse2+0x607> DB 102,69,15,219,193 ; pand %xmm9,%xmm8 DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,241,66,0,0 ; mulps 0x42f1(%rip),%xmm8 # 6580 <_sk_callback_sse2+0x618> - DB 102,68,15,111,21,248,66,0,0 ; movdqa 0x42f8(%rip),%xmm10 # 6590 <_sk_callback_sse2+0x628> + DB 68,15,89,5,145,67,0,0 ; mulps 0x4391(%rip),%xmm8 # 6620 <_sk_callback_sse2+0x617> + DB 102,68,15,111,21,152,67,0,0 ; movdqa 0x4398(%rip),%xmm10 # 6630 <_sk_callback_sse2+0x627> DB 102,69,15,219,209 ; pand %xmm9,%xmm10 DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 - DB 68,15,89,21,247,66,0,0 ; mulps 0x42f7(%rip),%xmm10 # 65a0 <_sk_callback_sse2+0x638> - DB 102,68,15,219,13,254,66,0,0 ; pand 0x42fe(%rip),%xmm9 # 65b0 <_sk_callback_sse2+0x648> + DB 68,15,89,21,151,67,0,0 ; mulps 0x4397(%rip),%xmm10 # 6640 <_sk_callback_sse2+0x637> + DB 102,68,15,219,13,158,67,0,0 ; pand 0x439e(%rip),%xmm9 # 6650 <_sk_callback_sse2+0x647> DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9 - DB 68,15,89,13,2,67,0,0 ; mulps 0x4302(%rip),%xmm9 # 65c0 <_sk_callback_sse2+0x658> + DB 68,15,89,13,162,67,0,0 ; mulps 0x43a2(%rip),%xmm9 # 6660 <_sk_callback_sse2+0x657> DB 15,92,196 ; subps %xmm4,%xmm0 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -24373,7 +24537,7 @@ _sk_load_tables_sse2 LABEL PROC DB 65,87 ; push %r15 DB 65,86 ; push %r14 DB 83 ; push %rbx - DB 102,68,15,111,5,81,66,0,0 ; movdqa 0x4251(%rip),%xmm8 # 65d0 <_sk_callback_sse2+0x668> + DB 102,68,15,111,5,241,66,0,0 ; movdqa 0x42f1(%rip),%xmm8 # 6670 <_sk_callback_sse2+0x667> DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0 DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1 @@ -24429,7 +24593,7 @@ _sk_load_tables_sse2 LABEL PROC DB 65,15,20,208 ; unpcklps %xmm8,%xmm2 DB 102,65,15,114,209,24 ; psrld $0x18,%xmm9 DB 65,15,91,217 ; cvtdq2ps %xmm9,%xmm3 - DB 15,89,29,90,65,0,0 ; mulps 0x415a(%rip),%xmm3 # 65e0 <_sk_callback_sse2+0x678> + DB 15,89,29,250,65,0,0 ; mulps 0x41fa(%rip),%xmm3 # 6680 <_sk_callback_sse2+0x677> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 65,94 ; pop %r14 @@ -24469,7 +24633,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1 DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9 - DB 102,68,15,111,21,207,64,0,0 ; movdqa 0x40cf(%rip),%xmm10 # 65f0 <_sk_callback_sse2+0x688> + DB 102,68,15,111,21,111,65,0,0 ; movdqa 0x416f(%rip),%xmm10 # 6690 <_sk_callback_sse2+0x687> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,194 ; pand %xmm10,%xmm0 DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 @@ -24531,7 +24695,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC DB 102,65,15,235,217 ; por %xmm9,%xmm3 DB 102,65,15,97,216 ; punpcklwd %xmm8,%xmm3 DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,186,63,0,0 ; mulps 0x3fba(%rip),%xmm3 # 6600 <_sk_callback_sse2+0x698> + DB 15,89,29,90,64,0,0 ; mulps 0x405a(%rip),%xmm3 # 66a0 <_sk_callback_sse2+0x697> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 65,94 ; pop %r14 @@ -24572,7 +24736,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10 DB 102,65,15,111,195 ; movdqa %xmm11,%xmm0 DB 102,65,15,97,194 ; punpcklwd %xmm10,%xmm0 - DB 102,68,15,111,5,41,63,0,0 ; movdqa 0x3f29(%rip),%xmm8 # 6610 <_sk_callback_sse2+0x6a8> + DB 102,68,15,111,5,201,63,0,0 ; movdqa 0x3fc9(%rip),%xmm8 # 66b0 <_sk_callback_sse2+0x6a7> DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1 DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 @@ -24628,7 +24792,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC DB 15,20,211 ; unpcklps %xmm3,%xmm2 DB 65,15,20,208 ; unpcklps %xmm8,%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,52,62,0,0 ; movaps 0x3e34(%rip),%xmm3 # 6620 <_sk_callback_sse2+0x6b8> + DB 15,40,29,212,62,0,0 ; movaps 0x3ed4(%rip),%xmm3 # 66c0 <_sk_callback_sse2+0x6b7> DB 91 ; pop %rbx DB 65,94 ; pop %r14 DB 65,95 ; pop %r15 @@ -24660,7 +24824,7 @@ _sk_byte_tables_sse2 LABEL PROC DB 65,86 ; push %r14 DB 83 ; push %rbx DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,205,61,0,0 ; movaps 0x3dcd(%rip),%xmm8 # 6630 <_sk_callback_sse2+0x6c8> + DB 68,15,40,5,109,62,0,0 ; movaps 0x3e6d(%rip),%xmm8 # 66d0 <_sk_callback_sse2+0x6c7> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0 DB 102,73,15,126,193 ; movq %xmm0,%r9 @@ -24688,7 +24852,7 @@ _sk_byte_tables_sse2 LABEL PROC DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0 DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,21,103,61,0,0 ; movaps 0x3d67(%rip),%xmm10 # 6640 <_sk_callback_sse2+0x6d8> + DB 68,15,40,21,7,62,0,0 ; movaps 0x3e07(%rip),%xmm10 # 66e0 <_sk_callback_sse2+0x6d7> DB 65,15,89,194 ; mulps %xmm10,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1 @@ -24807,7 +24971,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0 DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,21,175,59,0,0 ; movaps 0x3baf(%rip),%xmm10 # 6650 <_sk_callback_sse2+0x6e8> + DB 68,15,40,21,79,60,0,0 ; movaps 0x3c4f(%rip),%xmm10 # 66f0 <_sk_callback_sse2+0x6e7> DB 65,15,89,194 ; mulps %xmm10,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1 @@ -25004,15 +25168,15 @@ _sk_parametric_r_sse2 LABEL PROC DB 69,15,88,209 ; addps %xmm9,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9 - DB 68,15,89,13,227,56,0,0 ; mulps 0x38e3(%rip),%xmm9 # 6660 <_sk_callback_sse2+0x6f8> - DB 68,15,84,21,235,56,0,0 ; andps 0x38eb(%rip),%xmm10 # 6670 <_sk_callback_sse2+0x708> - DB 68,15,86,21,243,56,0,0 ; orps 0x38f3(%rip),%xmm10 # 6680 <_sk_callback_sse2+0x718> - DB 68,15,88,13,251,56,0,0 ; addps 0x38fb(%rip),%xmm9 # 6690 <_sk_callback_sse2+0x728> - DB 68,15,40,37,3,57,0,0 ; movaps 0x3903(%rip),%xmm12 # 66a0 <_sk_callback_sse2+0x738> + DB 68,15,89,13,131,57,0,0 ; mulps 0x3983(%rip),%xmm9 # 6700 <_sk_callback_sse2+0x6f7> + DB 68,15,84,21,139,57,0,0 ; andps 0x398b(%rip),%xmm10 # 6710 <_sk_callback_sse2+0x707> + DB 68,15,86,21,147,57,0,0 ; orps 0x3993(%rip),%xmm10 # 6720 <_sk_callback_sse2+0x717> + DB 68,15,88,13,155,57,0,0 ; addps 0x399b(%rip),%xmm9 # 6730 <_sk_callback_sse2+0x727> + DB 68,15,40,37,163,57,0,0 ; movaps 0x39a3(%rip),%xmm12 # 6740 <_sk_callback_sse2+0x737> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,88,21,3,57,0,0 ; addps 0x3903(%rip),%xmm10 # 66b0 <_sk_callback_sse2+0x748> - DB 68,15,40,37,11,57,0,0 ; movaps 0x390b(%rip),%xmm12 # 66c0 <_sk_callback_sse2+0x758> + DB 68,15,88,21,163,57,0,0 ; addps 0x39a3(%rip),%xmm10 # 6750 <_sk_callback_sse2+0x747> + DB 68,15,40,37,171,57,0,0 ; movaps 0x39ab(%rip),%xmm12 # 6760 <_sk_callback_sse2+0x757> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 @@ -25020,22 +25184,22 @@ _sk_parametric_r_sse2 LABEL PROC DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13 - DB 68,15,40,21,245,56,0,0 ; movaps 0x38f5(%rip),%xmm10 # 66d0 <_sk_callback_sse2+0x768> + DB 68,15,40,21,149,57,0,0 ; movaps 0x3995(%rip),%xmm10 # 6770 <_sk_callback_sse2+0x767> DB 69,15,84,234 ; andps %xmm10,%xmm13 DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,92,236 ; subps %xmm12,%xmm13 - DB 68,15,88,13,233,56,0,0 ; addps 0x38e9(%rip),%xmm9 # 66e0 <_sk_callback_sse2+0x778> - DB 68,15,40,37,241,56,0,0 ; movaps 0x38f1(%rip),%xmm12 # 66f0 <_sk_callback_sse2+0x788> + DB 68,15,88,13,137,57,0,0 ; addps 0x3989(%rip),%xmm9 # 6780 <_sk_callback_sse2+0x777> + DB 68,15,40,37,145,57,0,0 ; movaps 0x3991(%rip),%xmm12 # 6790 <_sk_callback_sse2+0x787> DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,40,37,241,56,0,0 ; movaps 0x38f1(%rip),%xmm12 # 6700 <_sk_callback_sse2+0x798> + DB 68,15,40,37,145,57,0,0 ; movaps 0x3991(%rip),%xmm12 # 67a0 <_sk_callback_sse2+0x797> DB 69,15,92,229 ; subps %xmm13,%xmm12 - DB 68,15,40,45,245,56,0,0 ; movaps 0x38f5(%rip),%xmm13 # 6710 <_sk_callback_sse2+0x7a8> + DB 68,15,40,45,149,57,0,0 ; movaps 0x3995(%rip),%xmm13 # 67b0 <_sk_callback_sse2+0x7a7> DB 69,15,94,236 ; divps %xmm12,%xmm13 DB 69,15,88,233 ; addps %xmm9,%xmm13 - DB 68,15,89,45,245,56,0,0 ; mulps 0x38f5(%rip),%xmm13 # 6720 <_sk_callback_sse2+0x7b8> + DB 68,15,89,45,149,57,0,0 ; mulps 0x3995(%rip),%xmm13 # 67c0 <_sk_callback_sse2+0x7b7> DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9 DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12 DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12 @@ -25069,15 +25233,15 @@ _sk_parametric_g_sse2 LABEL PROC DB 69,15,88,209 ; addps %xmm9,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9 - DB 68,15,89,13,117,56,0,0 ; mulps 0x3875(%rip),%xmm9 # 6730 <_sk_callback_sse2+0x7c8> - DB 68,15,84,21,125,56,0,0 ; andps 0x387d(%rip),%xmm10 # 6740 <_sk_callback_sse2+0x7d8> - DB 68,15,86,21,133,56,0,0 ; orps 0x3885(%rip),%xmm10 # 6750 <_sk_callback_sse2+0x7e8> - DB 68,15,88,13,141,56,0,0 ; addps 0x388d(%rip),%xmm9 # 6760 <_sk_callback_sse2+0x7f8> - DB 68,15,40,37,149,56,0,0 ; movaps 0x3895(%rip),%xmm12 # 6770 <_sk_callback_sse2+0x808> + DB 68,15,89,13,21,57,0,0 ; mulps 0x3915(%rip),%xmm9 # 67d0 <_sk_callback_sse2+0x7c7> + DB 68,15,84,21,29,57,0,0 ; andps 0x391d(%rip),%xmm10 # 67e0 <_sk_callback_sse2+0x7d7> + DB 68,15,86,21,37,57,0,0 ; orps 0x3925(%rip),%xmm10 # 67f0 <_sk_callback_sse2+0x7e7> + DB 68,15,88,13,45,57,0,0 ; addps 0x392d(%rip),%xmm9 # 6800 <_sk_callback_sse2+0x7f7> + DB 68,15,40,37,53,57,0,0 ; movaps 0x3935(%rip),%xmm12 # 6810 <_sk_callback_sse2+0x807> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,88,21,149,56,0,0 ; addps 0x3895(%rip),%xmm10 # 6780 <_sk_callback_sse2+0x818> - DB 68,15,40,37,157,56,0,0 ; movaps 0x389d(%rip),%xmm12 # 6790 <_sk_callback_sse2+0x828> + DB 68,15,88,21,53,57,0,0 ; addps 0x3935(%rip),%xmm10 # 6820 <_sk_callback_sse2+0x817> + DB 68,15,40,37,61,57,0,0 ; movaps 0x393d(%rip),%xmm12 # 6830 <_sk_callback_sse2+0x827> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 @@ -25085,22 +25249,22 @@ _sk_parametric_g_sse2 LABEL PROC DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13 - DB 68,15,40,21,135,56,0,0 ; movaps 0x3887(%rip),%xmm10 # 67a0 <_sk_callback_sse2+0x838> + DB 68,15,40,21,39,57,0,0 ; movaps 0x3927(%rip),%xmm10 # 6840 <_sk_callback_sse2+0x837> DB 69,15,84,234 ; andps %xmm10,%xmm13 DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,92,236 ; subps %xmm12,%xmm13 - DB 68,15,88,13,123,56,0,0 ; addps 0x387b(%rip),%xmm9 # 67b0 <_sk_callback_sse2+0x848> - DB 68,15,40,37,131,56,0,0 ; movaps 0x3883(%rip),%xmm12 # 67c0 <_sk_callback_sse2+0x858> + DB 68,15,88,13,27,57,0,0 ; addps 0x391b(%rip),%xmm9 # 6850 <_sk_callback_sse2+0x847> + DB 68,15,40,37,35,57,0,0 ; movaps 0x3923(%rip),%xmm12 # 6860 <_sk_callback_sse2+0x857> DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,40,37,131,56,0,0 ; movaps 0x3883(%rip),%xmm12 # 67d0 <_sk_callback_sse2+0x868> + DB 68,15,40,37,35,57,0,0 ; movaps 0x3923(%rip),%xmm12 # 6870 <_sk_callback_sse2+0x867> DB 69,15,92,229 ; subps %xmm13,%xmm12 - DB 68,15,40,45,135,56,0,0 ; movaps 0x3887(%rip),%xmm13 # 67e0 <_sk_callback_sse2+0x878> + DB 68,15,40,45,39,57,0,0 ; movaps 0x3927(%rip),%xmm13 # 6880 <_sk_callback_sse2+0x877> DB 69,15,94,236 ; divps %xmm12,%xmm13 DB 69,15,88,233 ; addps %xmm9,%xmm13 - DB 68,15,89,45,135,56,0,0 ; mulps 0x3887(%rip),%xmm13 # 67f0 <_sk_callback_sse2+0x888> + DB 68,15,89,45,39,57,0,0 ; mulps 0x3927(%rip),%xmm13 # 6890 <_sk_callback_sse2+0x887> DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9 DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12 DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12 @@ -25134,15 +25298,15 @@ _sk_parametric_b_sse2 LABEL PROC DB 69,15,88,209 ; addps %xmm9,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9 - DB 68,15,89,13,7,56,0,0 ; mulps 0x3807(%rip),%xmm9 # 6800 <_sk_callback_sse2+0x898> - DB 68,15,84,21,15,56,0,0 ; andps 0x380f(%rip),%xmm10 # 6810 <_sk_callback_sse2+0x8a8> - DB 68,15,86,21,23,56,0,0 ; orps 0x3817(%rip),%xmm10 # 6820 <_sk_callback_sse2+0x8b8> - DB 68,15,88,13,31,56,0,0 ; addps 0x381f(%rip),%xmm9 # 6830 <_sk_callback_sse2+0x8c8> - DB 68,15,40,37,39,56,0,0 ; movaps 0x3827(%rip),%xmm12 # 6840 <_sk_callback_sse2+0x8d8> + DB 68,15,89,13,167,56,0,0 ; mulps 0x38a7(%rip),%xmm9 # 68a0 <_sk_callback_sse2+0x897> + DB 68,15,84,21,175,56,0,0 ; andps 0x38af(%rip),%xmm10 # 68b0 <_sk_callback_sse2+0x8a7> + DB 68,15,86,21,183,56,0,0 ; orps 0x38b7(%rip),%xmm10 # 68c0 <_sk_callback_sse2+0x8b7> + DB 68,15,88,13,191,56,0,0 ; addps 0x38bf(%rip),%xmm9 # 68d0 <_sk_callback_sse2+0x8c7> + DB 68,15,40,37,199,56,0,0 ; movaps 0x38c7(%rip),%xmm12 # 68e0 <_sk_callback_sse2+0x8d7> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,88,21,39,56,0,0 ; addps 0x3827(%rip),%xmm10 # 6850 <_sk_callback_sse2+0x8e8> - DB 68,15,40,37,47,56,0,0 ; movaps 0x382f(%rip),%xmm12 # 6860 <_sk_callback_sse2+0x8f8> + DB 68,15,88,21,199,56,0,0 ; addps 0x38c7(%rip),%xmm10 # 68f0 <_sk_callback_sse2+0x8e7> + DB 68,15,40,37,207,56,0,0 ; movaps 0x38cf(%rip),%xmm12 # 6900 <_sk_callback_sse2+0x8f7> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 @@ -25150,22 +25314,22 @@ _sk_parametric_b_sse2 LABEL PROC DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13 - DB 68,15,40,21,25,56,0,0 ; movaps 0x3819(%rip),%xmm10 # 6870 <_sk_callback_sse2+0x908> + DB 68,15,40,21,185,56,0,0 ; movaps 0x38b9(%rip),%xmm10 # 6910 <_sk_callback_sse2+0x907> DB 69,15,84,234 ; andps %xmm10,%xmm13 DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,92,236 ; subps %xmm12,%xmm13 - DB 68,15,88,13,13,56,0,0 ; addps 0x380d(%rip),%xmm9 # 6880 <_sk_callback_sse2+0x918> - DB 68,15,40,37,21,56,0,0 ; movaps 0x3815(%rip),%xmm12 # 6890 <_sk_callback_sse2+0x928> + DB 68,15,88,13,173,56,0,0 ; addps 0x38ad(%rip),%xmm9 # 6920 <_sk_callback_sse2+0x917> + DB 68,15,40,37,181,56,0,0 ; movaps 0x38b5(%rip),%xmm12 # 6930 <_sk_callback_sse2+0x927> DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,40,37,21,56,0,0 ; movaps 0x3815(%rip),%xmm12 # 68a0 <_sk_callback_sse2+0x938> + DB 68,15,40,37,181,56,0,0 ; movaps 0x38b5(%rip),%xmm12 # 6940 <_sk_callback_sse2+0x937> DB 69,15,92,229 ; subps %xmm13,%xmm12 - DB 68,15,40,45,25,56,0,0 ; movaps 0x3819(%rip),%xmm13 # 68b0 <_sk_callback_sse2+0x948> + DB 68,15,40,45,185,56,0,0 ; movaps 0x38b9(%rip),%xmm13 # 6950 <_sk_callback_sse2+0x947> DB 69,15,94,236 ; divps %xmm12,%xmm13 DB 69,15,88,233 ; addps %xmm9,%xmm13 - DB 68,15,89,45,25,56,0,0 ; mulps 0x3819(%rip),%xmm13 # 68c0 <_sk_callback_sse2+0x958> + DB 68,15,89,45,185,56,0,0 ; mulps 0x38b9(%rip),%xmm13 # 6960 <_sk_callback_sse2+0x957> DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9 DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12 DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12 @@ -25199,15 +25363,15 @@ _sk_parametric_a_sse2 LABEL PROC DB 69,15,88,209 ; addps %xmm9,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9 - DB 68,15,89,13,153,55,0,0 ; mulps 0x3799(%rip),%xmm9 # 68d0 <_sk_callback_sse2+0x968> - DB 68,15,84,21,161,55,0,0 ; andps 0x37a1(%rip),%xmm10 # 68e0 <_sk_callback_sse2+0x978> - DB 68,15,86,21,169,55,0,0 ; orps 0x37a9(%rip),%xmm10 # 68f0 <_sk_callback_sse2+0x988> - DB 68,15,88,13,177,55,0,0 ; addps 0x37b1(%rip),%xmm9 # 6900 <_sk_callback_sse2+0x998> - DB 68,15,40,37,185,55,0,0 ; movaps 0x37b9(%rip),%xmm12 # 6910 <_sk_callback_sse2+0x9a8> + DB 68,15,89,13,57,56,0,0 ; mulps 0x3839(%rip),%xmm9 # 6970 <_sk_callback_sse2+0x967> + DB 68,15,84,21,65,56,0,0 ; andps 0x3841(%rip),%xmm10 # 6980 <_sk_callback_sse2+0x977> + DB 68,15,86,21,73,56,0,0 ; orps 0x3849(%rip),%xmm10 # 6990 <_sk_callback_sse2+0x987> + DB 68,15,88,13,81,56,0,0 ; addps 0x3851(%rip),%xmm9 # 69a0 <_sk_callback_sse2+0x997> + DB 68,15,40,37,89,56,0,0 ; movaps 0x3859(%rip),%xmm12 # 69b0 <_sk_callback_sse2+0x9a7> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,88,21,185,55,0,0 ; addps 0x37b9(%rip),%xmm10 # 6920 <_sk_callback_sse2+0x9b8> - DB 68,15,40,37,193,55,0,0 ; movaps 0x37c1(%rip),%xmm12 # 6930 <_sk_callback_sse2+0x9c8> + DB 68,15,88,21,89,56,0,0 ; addps 0x3859(%rip),%xmm10 # 69c0 <_sk_callback_sse2+0x9b7> + DB 68,15,40,37,97,56,0,0 ; movaps 0x3861(%rip),%xmm12 # 69d0 <_sk_callback_sse2+0x9c7> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 @@ -25215,22 +25379,22 @@ _sk_parametric_a_sse2 LABEL PROC DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13 - DB 68,15,40,21,171,55,0,0 ; movaps 0x37ab(%rip),%xmm10 # 6940 <_sk_callback_sse2+0x9d8> + DB 68,15,40,21,75,56,0,0 ; movaps 0x384b(%rip),%xmm10 # 69e0 <_sk_callback_sse2+0x9d7> DB 69,15,84,234 ; andps %xmm10,%xmm13 DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,92,236 ; subps %xmm12,%xmm13 - DB 68,15,88,13,159,55,0,0 ; addps 0x379f(%rip),%xmm9 # 6950 <_sk_callback_sse2+0x9e8> - DB 68,15,40,37,167,55,0,0 ; movaps 0x37a7(%rip),%xmm12 # 6960 <_sk_callback_sse2+0x9f8> + DB 68,15,88,13,63,56,0,0 ; addps 0x383f(%rip),%xmm9 # 69f0 <_sk_callback_sse2+0x9e7> + DB 68,15,40,37,71,56,0,0 ; movaps 0x3847(%rip),%xmm12 # 6a00 <_sk_callback_sse2+0x9f7> DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,40,37,167,55,0,0 ; movaps 0x37a7(%rip),%xmm12 # 6970 <_sk_callback_sse2+0xa08> + DB 68,15,40,37,71,56,0,0 ; movaps 0x3847(%rip),%xmm12 # 6a10 <_sk_callback_sse2+0xa07> DB 69,15,92,229 ; subps %xmm13,%xmm12 - DB 68,15,40,45,171,55,0,0 ; movaps 0x37ab(%rip),%xmm13 # 6980 <_sk_callback_sse2+0xa18> + DB 68,15,40,45,75,56,0,0 ; movaps 0x384b(%rip),%xmm13 # 6a20 <_sk_callback_sse2+0xa17> DB 69,15,94,236 ; divps %xmm12,%xmm13 DB 69,15,88,233 ; addps %xmm9,%xmm13 - DB 68,15,89,45,171,55,0,0 ; mulps 0x37ab(%rip),%xmm13 # 6990 <_sk_callback_sse2+0xa28> + DB 68,15,89,45,75,56,0,0 ; mulps 0x384b(%rip),%xmm13 # 6a30 <_sk_callback_sse2+0xa27> DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9 DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12 DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12 @@ -25245,29 +25409,29 @@ _sk_parametric_a_sse2 LABEL PROC PUBLIC _sk_lab_to_xyz_sse2 _sk_lab_to_xyz_sse2 LABEL PROC - DB 15,89,5,136,55,0,0 ; mulps 0x3788(%rip),%xmm0 # 69a0 <_sk_callback_sse2+0xa38> - DB 68,15,40,5,144,55,0,0 ; movaps 0x3790(%rip),%xmm8 # 69b0 <_sk_callback_sse2+0xa48> + DB 15,89,5,40,56,0,0 ; mulps 0x3828(%rip),%xmm0 # 6a40 <_sk_callback_sse2+0xa37> + DB 68,15,40,5,48,56,0,0 ; movaps 0x3830(%rip),%xmm8 # 6a50 <_sk_callback_sse2+0xa47> DB 65,15,89,200 ; mulps %xmm8,%xmm1 - DB 68,15,40,13,148,55,0,0 ; movaps 0x3794(%rip),%xmm9 # 69c0 <_sk_callback_sse2+0xa58> + DB 68,15,40,13,52,56,0,0 ; movaps 0x3834(%rip),%xmm9 # 6a60 <_sk_callback_sse2+0xa57> DB 65,15,88,201 ; addps %xmm9,%xmm1 DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 65,15,88,209 ; addps %xmm9,%xmm2 - DB 15,88,5,145,55,0,0 ; addps 0x3791(%rip),%xmm0 # 69d0 <_sk_callback_sse2+0xa68> - DB 15,89,5,154,55,0,0 ; mulps 0x379a(%rip),%xmm0 # 69e0 <_sk_callback_sse2+0xa78> - DB 15,89,13,163,55,0,0 ; mulps 0x37a3(%rip),%xmm1 # 69f0 <_sk_callback_sse2+0xa88> + DB 15,88,5,49,56,0,0 ; addps 0x3831(%rip),%xmm0 # 6a70 <_sk_callback_sse2+0xa67> + DB 15,89,5,58,56,0,0 ; mulps 0x383a(%rip),%xmm0 # 6a80 <_sk_callback_sse2+0xa77> + DB 15,89,13,67,56,0,0 ; mulps 0x3843(%rip),%xmm1 # 6a90 <_sk_callback_sse2+0xa87> DB 15,88,200 ; addps %xmm0,%xmm1 - DB 15,89,21,169,55,0,0 ; mulps 0x37a9(%rip),%xmm2 # 6a00 <_sk_callback_sse2+0xa98> + DB 15,89,21,73,56,0,0 ; mulps 0x3849(%rip),%xmm2 # 6aa0 <_sk_callback_sse2+0xa97> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 68,15,92,202 ; subps %xmm2,%xmm9 DB 68,15,40,225 ; movaps %xmm1,%xmm12 DB 69,15,89,228 ; mulps %xmm12,%xmm12 DB 68,15,89,225 ; mulps %xmm1,%xmm12 - DB 15,40,21,158,55,0,0 ; movaps 0x379e(%rip),%xmm2 # 6a10 <_sk_callback_sse2+0xaa8> + DB 15,40,21,62,56,0,0 ; movaps 0x383e(%rip),%xmm2 # 6ab0 <_sk_callback_sse2+0xaa7> DB 68,15,40,194 ; movaps %xmm2,%xmm8 DB 69,15,194,196,1 ; cmpltps %xmm12,%xmm8 - DB 68,15,40,21,157,55,0,0 ; movaps 0x379d(%rip),%xmm10 # 6a20 <_sk_callback_sse2+0xab8> + DB 68,15,40,21,61,56,0,0 ; movaps 0x383d(%rip),%xmm10 # 6ac0 <_sk_callback_sse2+0xab7> DB 65,15,88,202 ; addps %xmm10,%xmm1 - DB 68,15,40,29,161,55,0,0 ; movaps 0x37a1(%rip),%xmm11 # 6a30 <_sk_callback_sse2+0xac8> + DB 68,15,40,29,65,56,0,0 ; movaps 0x3841(%rip),%xmm11 # 6ad0 <_sk_callback_sse2+0xac7> DB 65,15,89,203 ; mulps %xmm11,%xmm1 DB 69,15,84,224 ; andps %xmm8,%xmm12 DB 68,15,85,193 ; andnps %xmm1,%xmm8 @@ -25291,8 +25455,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC DB 15,84,194 ; andps %xmm2,%xmm0 DB 65,15,85,209 ; andnps %xmm9,%xmm2 DB 15,86,208 ; orps %xmm0,%xmm2 - DB 68,15,89,5,81,55,0,0 ; mulps 0x3751(%rip),%xmm8 # 6a40 <_sk_callback_sse2+0xad8> - DB 15,89,21,90,55,0,0 ; mulps 0x375a(%rip),%xmm2 # 6a50 <_sk_callback_sse2+0xae8> + DB 68,15,89,5,241,55,0,0 ; mulps 0x37f1(%rip),%xmm8 # 6ae0 <_sk_callback_sse2+0xad7> + DB 15,89,21,250,55,0,0 ; mulps 0x37fa(%rip),%xmm2 # 6af0 <_sk_callback_sse2+0xae7> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -25306,9 +25470,9 @@ _sk_load_a8_sse2 LABEL PROC DB 102,65,15,110,4,18 ; movd (%r10,%rdx,1),%xmm0 DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0 DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0 - DB 102,15,219,5,66,55,0,0 ; pand 0x3742(%rip),%xmm0 # 6a60 <_sk_callback_sse2+0xaf8> + DB 102,15,219,5,226,55,0,0 ; pand 0x37e2(%rip),%xmm0 # 6b00 <_sk_callback_sse2+0xaf7> DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3 - DB 15,89,29,72,55,0,0 ; mulps 0x3748(%rip),%xmm3 # 6a70 <_sk_callback_sse2+0xb08> + DB 15,89,29,232,55,0,0 ; mulps 0x37e8(%rip),%xmm3 # 6b10 <_sk_callback_sse2+0xb07> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 @@ -25345,9 +25509,9 @@ _sk_load_a8_dst_sse2 LABEL PROC DB 102,65,15,110,36,18 ; movd (%r10,%rdx,1),%xmm4 DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4 DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 - DB 102,15,219,37,220,54,0,0 ; pand 0x36dc(%rip),%xmm4 # 6a80 <_sk_callback_sse2+0xb18> + DB 102,15,219,37,124,55,0,0 ; pand 0x377c(%rip),%xmm4 # 6b20 <_sk_callback_sse2+0xb17> DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7 - DB 15,89,61,226,54,0,0 ; mulps 0x36e2(%rip),%xmm7 # 6a90 <_sk_callback_sse2+0xb28> + DB 15,89,61,130,55,0,0 ; mulps 0x3782(%rip),%xmm7 # 6b30 <_sk_callback_sse2+0xb27> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,228 ; xorps %xmm4,%xmm4 DB 102,15,87,237 ; xorpd %xmm5,%xmm5 @@ -25413,7 +25577,7 @@ _sk_gather_a8_sse2 LABEL PROC DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0 DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0 DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3 - DB 15,89,29,3,54,0,0 ; mulps 0x3603(%rip),%xmm3 # 6aa0 <_sk_callback_sse2+0xb38> + DB 15,89,29,163,54,0,0 ; mulps 0x36a3(%rip),%xmm3 # 6b40 <_sk_callback_sse2+0xb37> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 @@ -25427,7 +25591,7 @@ _sk_store_a8_sse2 LABEL PROC DB 72,131,236,40 ; sub $0x28,%rsp DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 - DB 68,15,40,5,241,53,0,0 ; movaps 0x35f1(%rip),%xmm8 # 6ab0 <_sk_callback_sse2+0xb48> + DB 68,15,40,5,145,54,0,0 ; movaps 0x3691(%rip),%xmm8 # 6b50 <_sk_callback_sse2+0xb47> DB 68,15,89,195 ; mulps %xmm3,%xmm8 DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8 DB 102,65,15,114,240,16 ; pslld $0x10,%xmm8 @@ -25454,7 +25618,7 @@ _sk_store_a8_sse2 LABEL PROC DB 102,68,15,127,68,36,16 ; movdqa %xmm8,0x10(%rsp) DB 138,68,36,24 ; mov 0x18(%rsp),%al DB 65,136,68,18,2 ; mov %al,0x2(%r10,%rdx,1) - DB 102,68,15,219,5,144,53,0,0 ; pand 0x3590(%rip),%xmm8 # 6ac0 <_sk_callback_sse2+0xb58> + DB 102,68,15,219,5,48,54,0,0 ; pand 0x3630(%rip),%xmm8 # 6b60 <_sk_callback_sse2+0xb57> DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8 DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8 DB 102,68,15,126,192 ; movd %xmm8,%eax @@ -25474,11 +25638,11 @@ _sk_load_g8_sse2 LABEL PROC DB 102,65,15,110,4,18 ; movd (%r10,%rdx,1),%xmm0 DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0 DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0 - DB 102,15,219,5,91,53,0,0 ; pand 0x355b(%rip),%xmm0 # 6ad0 <_sk_callback_sse2+0xb68> + DB 102,15,219,5,251,53,0,0 ; pand 0x35fb(%rip),%xmm0 # 6b70 <_sk_callback_sse2+0xb67> DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,97,53,0,0 ; mulps 0x3561(%rip),%xmm0 # 6ae0 <_sk_callback_sse2+0xb78> + DB 15,89,5,1,54,0,0 ; mulps 0x3601(%rip),%xmm0 # 6b80 <_sk_callback_sse2+0xb77> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,104,53,0,0 ; movaps 0x3568(%rip),%xmm3 # 6af0 <_sk_callback_sse2+0xb88> + DB 15,40,29,8,54,0,0 ; movaps 0x3608(%rip),%xmm3 # 6b90 <_sk_callback_sse2+0xb87> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 255,224 ; jmpq *%rax @@ -25513,11 +25677,11 @@ _sk_load_g8_dst_sse2 LABEL PROC DB 102,65,15,110,36,18 ; movd (%r10,%rdx,1),%xmm4 DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4 DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4 - DB 102,15,219,37,2,53,0,0 ; pand 0x3502(%rip),%xmm4 # 6b00 <_sk_callback_sse2+0xb98> + DB 102,15,219,37,162,53,0,0 ; pand 0x35a2(%rip),%xmm4 # 6ba0 <_sk_callback_sse2+0xb97> DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,37,8,53,0,0 ; mulps 0x3508(%rip),%xmm4 # 6b10 <_sk_callback_sse2+0xba8> + DB 15,89,37,168,53,0,0 ; mulps 0x35a8(%rip),%xmm4 # 6bb0 <_sk_callback_sse2+0xba7> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,61,15,53,0,0 ; movaps 0x350f(%rip),%xmm7 # 6b20 <_sk_callback_sse2+0xbb8> + DB 15,40,61,175,53,0,0 ; movaps 0x35af(%rip),%xmm7 # 6bc0 <_sk_callback_sse2+0xbb7> DB 15,40,236 ; movaps %xmm4,%xmm5 DB 15,40,244 ; movaps %xmm4,%xmm6 DB 255,224 ; jmpq *%rax @@ -25581,9 +25745,9 @@ _sk_gather_g8_sse2 LABEL PROC DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0 DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,54,52,0,0 ; mulps 0x3436(%rip),%xmm0 # 6b30 <_sk_callback_sse2+0xbc8> + DB 15,89,5,214,52,0,0 ; mulps 0x34d6(%rip),%xmm0 # 6bd0 <_sk_callback_sse2+0xbc7> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,61,52,0,0 ; movaps 0x343d(%rip),%xmm3 # 6b40 <_sk_callback_sse2+0xbd8> + DB 15,40,29,221,52,0,0 ; movaps 0x34dd(%rip),%xmm3 # 6be0 <_sk_callback_sse2+0xbd7> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 91 ; pop %rbx @@ -25649,11 +25813,11 @@ _sk_gather_i8_sse2 LABEL PROC DB 102,66,15,110,76,149,0 ; movd 0x0(%rbp,%r10,4),%xmm1 DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9 DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9 - DB 102,15,111,21,86,51,0,0 ; movdqa 0x3356(%rip),%xmm2 # 6b50 <_sk_callback_sse2+0xbe8> + DB 102,15,111,21,246,51,0,0 ; movdqa 0x33f6(%rip),%xmm2 # 6bf0 <_sk_callback_sse2+0xbe7> DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0 DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,82,51,0,0 ; movaps 0x3352(%rip),%xmm8 # 6b60 <_sk_callback_sse2+0xbf8> + DB 68,15,40,5,242,51,0,0 ; movaps 0x33f2(%rip),%xmm8 # 6c00 <_sk_callback_sse2+0xbf7> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -25682,19 +25846,19 @@ _sk_load_565_sse2 LABEL PROC DB 117,83 ; jne 38af <_sk_load_565_sse2+0x5d> DB 243,65,15,126,20,82 ; movq (%r10,%rdx,2),%xmm2 DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2 - DB 102,15,111,5,2,51,0,0 ; movdqa 0x3302(%rip),%xmm0 # 6b70 <_sk_callback_sse2+0xc08> + DB 102,15,111,5,162,51,0,0 ; movdqa 0x33a2(%rip),%xmm0 # 6c10 <_sk_callback_sse2+0xc07> DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,4,51,0,0 ; mulps 0x3304(%rip),%xmm0 # 6b80 <_sk_callback_sse2+0xc18> - DB 102,15,111,13,12,51,0,0 ; movdqa 0x330c(%rip),%xmm1 # 6b90 <_sk_callback_sse2+0xc28> + DB 15,89,5,164,51,0,0 ; mulps 0x33a4(%rip),%xmm0 # 6c20 <_sk_callback_sse2+0xc17> + DB 102,15,111,13,172,51,0,0 ; movdqa 0x33ac(%rip),%xmm1 # 6c30 <_sk_callback_sse2+0xc27> DB 102,15,219,202 ; pand %xmm2,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,14,51,0,0 ; mulps 0x330e(%rip),%xmm1 # 6ba0 <_sk_callback_sse2+0xc38> - DB 102,15,219,21,22,51,0,0 ; pand 0x3316(%rip),%xmm2 # 6bb0 <_sk_callback_sse2+0xc48> + DB 15,89,13,174,51,0,0 ; mulps 0x33ae(%rip),%xmm1 # 6c40 <_sk_callback_sse2+0xc37> + DB 102,15,219,21,182,51,0,0 ; pand 0x33b6(%rip),%xmm2 # 6c50 <_sk_callback_sse2+0xc47> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,28,51,0,0 ; mulps 0x331c(%rip),%xmm2 # 6bc0 <_sk_callback_sse2+0xc58> + DB 15,89,21,188,51,0,0 ; mulps 0x33bc(%rip),%xmm2 # 6c60 <_sk_callback_sse2+0xc57> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,35,51,0,0 ; movaps 0x3323(%rip),%xmm3 # 6bd0 <_sk_callback_sse2+0xc68> + DB 15,40,29,195,51,0,0 ; movaps 0x33c3(%rip),%xmm3 # 6c70 <_sk_callback_sse2+0xc67> DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b @@ -25724,19 +25888,19 @@ _sk_load_565_dst_sse2 LABEL PROC DB 117,83 ; jne 3959 <_sk_load_565_dst_sse2+0x5d> DB 243,65,15,126,52,82 ; movq (%r10,%rdx,2),%xmm6 DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6 - DB 102,15,111,37,200,50,0,0 ; movdqa 0x32c8(%rip),%xmm4 # 6be0 <_sk_callback_sse2+0xc78> + DB 102,15,111,37,104,51,0,0 ; movdqa 0x3368(%rip),%xmm4 # 6c80 <_sk_callback_sse2+0xc77> DB 102,15,219,230 ; pand %xmm6,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,37,202,50,0,0 ; mulps 0x32ca(%rip),%xmm4 # 6bf0 <_sk_callback_sse2+0xc88> - DB 102,15,111,45,210,50,0,0 ; movdqa 0x32d2(%rip),%xmm5 # 6c00 <_sk_callback_sse2+0xc98> + DB 15,89,37,106,51,0,0 ; mulps 0x336a(%rip),%xmm4 # 6c90 <_sk_callback_sse2+0xc87> + DB 102,15,111,45,114,51,0,0 ; movdqa 0x3372(%rip),%xmm5 # 6ca0 <_sk_callback_sse2+0xc97> DB 102,15,219,238 ; pand %xmm6,%xmm5 DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 - DB 15,89,45,212,50,0,0 ; mulps 0x32d4(%rip),%xmm5 # 6c10 <_sk_callback_sse2+0xca8> - DB 102,15,219,53,220,50,0,0 ; pand 0x32dc(%rip),%xmm6 # 6c20 <_sk_callback_sse2+0xcb8> + DB 15,89,45,116,51,0,0 ; mulps 0x3374(%rip),%xmm5 # 6cb0 <_sk_callback_sse2+0xca7> + DB 102,15,219,53,124,51,0,0 ; pand 0x337c(%rip),%xmm6 # 6cc0 <_sk_callback_sse2+0xcb7> DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 - DB 15,89,53,226,50,0,0 ; mulps 0x32e2(%rip),%xmm6 # 6c30 <_sk_callback_sse2+0xcc8> + DB 15,89,53,130,51,0,0 ; mulps 0x3382(%rip),%xmm6 # 6cd0 <_sk_callback_sse2+0xcc7> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,61,233,50,0,0 ; movaps 0x32e9(%rip),%xmm7 # 6c40 <_sk_callback_sse2+0xcd8> + DB 15,40,61,137,51,0,0 ; movaps 0x3389(%rip),%xmm7 # 6ce0 <_sk_callback_sse2+0xcd7> DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b @@ -25789,19 +25953,19 @@ _sk_gather_565_sse2 LABEL PROC DB 102,15,196,208,3 ; pinsrw $0x3,%eax,%xmm2 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2 - DB 102,15,111,5,36,50,0,0 ; movdqa 0x3224(%rip),%xmm0 # 6c50 <_sk_callback_sse2+0xce8> + DB 102,15,111,5,196,50,0,0 ; movdqa 0x32c4(%rip),%xmm0 # 6cf0 <_sk_callback_sse2+0xce7> DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,38,50,0,0 ; mulps 0x3226(%rip),%xmm0 # 6c60 <_sk_callback_sse2+0xcf8> - DB 102,15,111,13,46,50,0,0 ; movdqa 0x322e(%rip),%xmm1 # 6c70 <_sk_callback_sse2+0xd08> + DB 15,89,5,198,50,0,0 ; mulps 0x32c6(%rip),%xmm0 # 6d00 <_sk_callback_sse2+0xcf7> + DB 102,15,111,13,206,50,0,0 ; movdqa 0x32ce(%rip),%xmm1 # 6d10 <_sk_callback_sse2+0xd07> DB 102,15,219,202 ; pand %xmm2,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,48,50,0,0 ; mulps 0x3230(%rip),%xmm1 # 6c80 <_sk_callback_sse2+0xd18> - DB 102,15,219,21,56,50,0,0 ; pand 0x3238(%rip),%xmm2 # 6c90 <_sk_callback_sse2+0xd28> + DB 15,89,13,208,50,0,0 ; mulps 0x32d0(%rip),%xmm1 # 6d20 <_sk_callback_sse2+0xd17> + DB 102,15,219,21,216,50,0,0 ; pand 0x32d8(%rip),%xmm2 # 6d30 <_sk_callback_sse2+0xd27> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,62,50,0,0 ; mulps 0x323e(%rip),%xmm2 # 6ca0 <_sk_callback_sse2+0xd38> + DB 15,89,21,222,50,0,0 ; mulps 0x32de(%rip),%xmm2 # 6d40 <_sk_callback_sse2+0xd37> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,69,50,0,0 ; movaps 0x3245(%rip),%xmm3 # 6cb0 <_sk_callback_sse2+0xd48> + DB 15,40,29,229,50,0,0 ; movaps 0x32e5(%rip),%xmm3 # 6d50 <_sk_callback_sse2+0xd47> DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax @@ -25809,12 +25973,12 @@ PUBLIC _sk_store_565_sse2 _sk_store_565_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 - DB 68,15,40,5,69,50,0,0 ; movaps 0x3245(%rip),%xmm8 # 6cc0 <_sk_callback_sse2+0xd58> + DB 68,15,40,5,229,50,0,0 ; movaps 0x32e5(%rip),%xmm8 # 6d60 <_sk_callback_sse2+0xd57> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9 - DB 68,15,40,21,58,50,0,0 ; movaps 0x323a(%rip),%xmm10 # 6cd0 <_sk_callback_sse2+0xd68> + DB 68,15,40,21,218,50,0,0 ; movaps 0x32da(%rip),%xmm10 # 6d70 <_sk_callback_sse2+0xd67> DB 68,15,89,209 ; mulps %xmm1,%xmm10 DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10 DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10 @@ -25856,21 +26020,21 @@ _sk_load_4444_sse2 LABEL PROC DB 117,98 ; jne 3b88 <_sk_load_4444_sse2+0x6c> DB 243,65,15,126,28,82 ; movq (%r10,%rdx,2),%xmm3 DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3 - DB 102,15,111,5,168,49,0,0 ; movdqa 0x31a8(%rip),%xmm0 # 6ce0 <_sk_callback_sse2+0xd78> + DB 102,15,111,5,72,50,0,0 ; movdqa 0x3248(%rip),%xmm0 # 6d80 <_sk_callback_sse2+0xd77> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,170,49,0,0 ; mulps 0x31aa(%rip),%xmm0 # 6cf0 <_sk_callback_sse2+0xd88> - DB 102,15,111,13,178,49,0,0 ; movdqa 0x31b2(%rip),%xmm1 # 6d00 <_sk_callback_sse2+0xd98> + DB 15,89,5,74,50,0,0 ; mulps 0x324a(%rip),%xmm0 # 6d90 <_sk_callback_sse2+0xd87> + DB 102,15,111,13,82,50,0,0 ; movdqa 0x3252(%rip),%xmm1 # 6da0 <_sk_callback_sse2+0xd97> DB 102,15,219,203 ; pand %xmm3,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,180,49,0,0 ; mulps 0x31b4(%rip),%xmm1 # 6d10 <_sk_callback_sse2+0xda8> - DB 102,15,111,21,188,49,0,0 ; movdqa 0x31bc(%rip),%xmm2 # 6d20 <_sk_callback_sse2+0xdb8> + DB 15,89,13,84,50,0,0 ; mulps 0x3254(%rip),%xmm1 # 6db0 <_sk_callback_sse2+0xda7> + DB 102,15,111,21,92,50,0,0 ; movdqa 0x325c(%rip),%xmm2 # 6dc0 <_sk_callback_sse2+0xdb7> DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,190,49,0,0 ; mulps 0x31be(%rip),%xmm2 # 6d30 <_sk_callback_sse2+0xdc8> - DB 102,15,219,29,198,49,0,0 ; pand 0x31c6(%rip),%xmm3 # 6d40 <_sk_callback_sse2+0xdd8> + DB 15,89,21,94,50,0,0 ; mulps 0x325e(%rip),%xmm2 # 6dd0 <_sk_callback_sse2+0xdc7> + DB 102,15,219,29,102,50,0,0 ; pand 0x3266(%rip),%xmm3 # 6de0 <_sk_callback_sse2+0xdd7> DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,204,49,0,0 ; mulps 0x31cc(%rip),%xmm3 # 6d50 <_sk_callback_sse2+0xde8> + DB 15,89,29,108,50,0,0 ; mulps 0x326c(%rip),%xmm3 # 6df0 <_sk_callback_sse2+0xde7> DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d @@ -25901,21 +26065,21 @@ _sk_load_4444_dst_sse2 LABEL PROC DB 117,98 ; jne 3c41 <_sk_load_4444_dst_sse2+0x6c> DB 243,65,15,126,60,82 ; movq (%r10,%rdx,2),%xmm7 DB 102,15,97,248 ; punpcklwd %xmm0,%xmm7 - DB 102,15,111,37,111,49,0,0 ; movdqa 0x316f(%rip),%xmm4 # 6d60 <_sk_callback_sse2+0xdf8> + DB 102,15,111,37,15,50,0,0 ; movdqa 0x320f(%rip),%xmm4 # 6e00 <_sk_callback_sse2+0xdf7> DB 102,15,219,231 ; pand %xmm7,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 15,89,37,113,49,0,0 ; mulps 0x3171(%rip),%xmm4 # 6d70 <_sk_callback_sse2+0xe08> - DB 102,15,111,45,121,49,0,0 ; movdqa 0x3179(%rip),%xmm5 # 6d80 <_sk_callback_sse2+0xe18> + DB 15,89,37,17,50,0,0 ; mulps 0x3211(%rip),%xmm4 # 6e10 <_sk_callback_sse2+0xe07> + DB 102,15,111,45,25,50,0,0 ; movdqa 0x3219(%rip),%xmm5 # 6e20 <_sk_callback_sse2+0xe17> DB 102,15,219,239 ; pand %xmm7,%xmm5 DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 - DB 15,89,45,123,49,0,0 ; mulps 0x317b(%rip),%xmm5 # 6d90 <_sk_callback_sse2+0xe28> - DB 102,15,111,53,131,49,0,0 ; movdqa 0x3183(%rip),%xmm6 # 6da0 <_sk_callback_sse2+0xe38> + DB 15,89,45,27,50,0,0 ; mulps 0x321b(%rip),%xmm5 # 6e30 <_sk_callback_sse2+0xe27> + DB 102,15,111,53,35,50,0,0 ; movdqa 0x3223(%rip),%xmm6 # 6e40 <_sk_callback_sse2+0xe37> DB 102,15,219,247 ; pand %xmm7,%xmm6 DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 - DB 15,89,53,133,49,0,0 ; mulps 0x3185(%rip),%xmm6 # 6db0 <_sk_callback_sse2+0xe48> - DB 102,15,219,61,141,49,0,0 ; pand 0x318d(%rip),%xmm7 # 6dc0 <_sk_callback_sse2+0xe58> + DB 15,89,53,37,50,0,0 ; mulps 0x3225(%rip),%xmm6 # 6e50 <_sk_callback_sse2+0xe47> + DB 102,15,219,61,45,50,0,0 ; pand 0x322d(%rip),%xmm7 # 6e60 <_sk_callback_sse2+0xe57> DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7 - DB 15,89,61,147,49,0,0 ; mulps 0x3193(%rip),%xmm7 # 6dd0 <_sk_callback_sse2+0xe68> + DB 15,89,61,51,50,0,0 ; mulps 0x3233(%rip),%xmm7 # 6e70 <_sk_callback_sse2+0xe67> DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d @@ -25969,21 +26133,21 @@ _sk_gather_4444_sse2 LABEL PROC DB 102,15,196,216,3 ; pinsrw $0x3,%eax,%xmm3 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3 - DB 102,15,111,5,204,48,0,0 ; movdqa 0x30cc(%rip),%xmm0 # 6de0 <_sk_callback_sse2+0xe78> + DB 102,15,111,5,108,49,0,0 ; movdqa 0x316c(%rip),%xmm0 # 6e80 <_sk_callback_sse2+0xe77> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,206,48,0,0 ; mulps 0x30ce(%rip),%xmm0 # 6df0 <_sk_callback_sse2+0xe88> - DB 102,15,111,13,214,48,0,0 ; movdqa 0x30d6(%rip),%xmm1 # 6e00 <_sk_callback_sse2+0xe98> + DB 15,89,5,110,49,0,0 ; mulps 0x316e(%rip),%xmm0 # 6e90 <_sk_callback_sse2+0xe87> + DB 102,15,111,13,118,49,0,0 ; movdqa 0x3176(%rip),%xmm1 # 6ea0 <_sk_callback_sse2+0xe97> DB 102,15,219,203 ; pand %xmm3,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,216,48,0,0 ; mulps 0x30d8(%rip),%xmm1 # 6e10 <_sk_callback_sse2+0xea8> - DB 102,15,111,21,224,48,0,0 ; movdqa 0x30e0(%rip),%xmm2 # 6e20 <_sk_callback_sse2+0xeb8> + DB 15,89,13,120,49,0,0 ; mulps 0x3178(%rip),%xmm1 # 6eb0 <_sk_callback_sse2+0xea7> + DB 102,15,111,21,128,49,0,0 ; movdqa 0x3180(%rip),%xmm2 # 6ec0 <_sk_callback_sse2+0xeb7> DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,226,48,0,0 ; mulps 0x30e2(%rip),%xmm2 # 6e30 <_sk_callback_sse2+0xec8> - DB 102,15,219,29,234,48,0,0 ; pand 0x30ea(%rip),%xmm3 # 6e40 <_sk_callback_sse2+0xed8> + DB 15,89,21,130,49,0,0 ; mulps 0x3182(%rip),%xmm2 # 6ed0 <_sk_callback_sse2+0xec7> + DB 102,15,219,29,138,49,0,0 ; pand 0x318a(%rip),%xmm3 # 6ee0 <_sk_callback_sse2+0xed7> DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,240,48,0,0 ; mulps 0x30f0(%rip),%xmm3 # 6e50 <_sk_callback_sse2+0xee8> + DB 15,89,29,144,49,0,0 ; mulps 0x3190(%rip),%xmm3 # 6ef0 <_sk_callback_sse2+0xee7> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax @@ -25992,7 +26156,7 @@ PUBLIC _sk_store_4444_sse2 _sk_store_4444_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 - DB 68,15,40,5,238,48,0,0 ; movaps 0x30ee(%rip),%xmm8 # 6e60 <_sk_callback_sse2+0xef8> + DB 68,15,40,5,142,49,0,0 ; movaps 0x318e(%rip),%xmm8 # 6f00 <_sk_callback_sse2+0xef7> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -26043,11 +26207,11 @@ _sk_load_8888_sse2 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,98 ; jne 3e93 <_sk_load_8888_sse2+0x6c> DB 243,68,15,111,12,144 ; movdqu (%rax,%rdx,4),%xmm9 - DB 102,15,111,21,49,48,0,0 ; movdqa 0x3031(%rip),%xmm2 # 6e70 <_sk_callback_sse2+0xf08> + DB 102,15,111,21,209,48,0,0 ; movdqa 0x30d1(%rip),%xmm2 # 6f10 <_sk_callback_sse2+0xf07> DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0 DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,45,48,0,0 ; movaps 0x302d(%rip),%xmm8 # 6e80 <_sk_callback_sse2+0xf18> + DB 68,15,40,5,205,48,0,0 ; movaps 0x30cd(%rip),%xmm8 # 6f20 <_sk_callback_sse2+0xf17> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -26087,11 +26251,11 @@ _sk_load_8888_dst_sse2 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,98 ; jne 3f3f <_sk_load_8888_dst_sse2+0x6c> DB 243,68,15,111,12,144 ; movdqu (%rax,%rdx,4),%xmm9 - DB 102,15,111,53,165,47,0,0 ; movdqa 0x2fa5(%rip),%xmm6 # 6e90 <_sk_callback_sse2+0xf28> + DB 102,15,111,53,69,48,0,0 ; movdqa 0x3045(%rip),%xmm6 # 6f30 <_sk_callback_sse2+0xf27> DB 102,65,15,111,225 ; movdqa %xmm9,%xmm4 DB 102,15,219,230 ; pand %xmm6,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 - DB 68,15,40,5,161,47,0,0 ; movaps 0x2fa1(%rip),%xmm8 # 6ea0 <_sk_callback_sse2+0xf38> + DB 68,15,40,5,65,48,0,0 ; movaps 0x3041(%rip),%xmm8 # 6f40 <_sk_callback_sse2+0xf37> DB 65,15,89,224 ; mulps %xmm8,%xmm4 DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5 DB 102,15,114,213,8 ; psrld $0x8,%xmm5 @@ -26154,11 +26318,11 @@ _sk_gather_8888_sse2 LABEL PROC DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1 DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9 DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9 - DB 102,15,111,21,175,46,0,0 ; movdqa 0x2eaf(%rip),%xmm2 # 6eb0 <_sk_callback_sse2+0xf48> + DB 102,15,111,21,79,47,0,0 ; movdqa 0x2f4f(%rip),%xmm2 # 6f50 <_sk_callback_sse2+0xf47> DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0 DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,171,46,0,0 ; movaps 0x2eab(%rip),%xmm8 # 6ec0 <_sk_callback_sse2+0xf58> + DB 68,15,40,5,75,47,0,0 ; movaps 0x2f4b(%rip),%xmm8 # 6f60 <_sk_callback_sse2+0xf57> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -26181,7 +26345,7 @@ PUBLIC _sk_store_8888_sse2 _sk_store_8888_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax - DB 68,15,40,5,109,46,0,0 ; movaps 0x2e6d(%rip),%xmm8 # 6ed0 <_sk_callback_sse2+0xf68> + DB 68,15,40,5,13,47,0,0 ; movaps 0x2f0d(%rip),%xmm8 # 6f70 <_sk_callback_sse2+0xf67> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -26226,11 +26390,11 @@ _sk_load_bgra_sse2 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,98 ; jne 4165 <_sk_load_bgra_sse2+0x6c> DB 243,68,15,111,12,144 ; movdqu (%rax,%rdx,4),%xmm9 - DB 102,15,111,5,207,45,0,0 ; movdqa 0x2dcf(%rip),%xmm0 # 6ee0 <_sk_callback_sse2+0xf78> + DB 102,15,111,5,111,46,0,0 ; movdqa 0x2e6f(%rip),%xmm0 # 6f80 <_sk_callback_sse2+0xf77> DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,219,200 ; pand %xmm0,%xmm1 DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2 - DB 68,15,40,5,203,45,0,0 ; movaps 0x2dcb(%rip),%xmm8 # 6ef0 <_sk_callback_sse2+0xf88> + DB 68,15,40,5,107,46,0,0 ; movaps 0x2e6b(%rip),%xmm8 # 6f90 <_sk_callback_sse2+0xf87> DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -26270,11 +26434,11 @@ _sk_load_bgra_dst_sse2 LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 117,98 ; jne 4211 <_sk_load_bgra_dst_sse2+0x6c> DB 243,68,15,111,12,144 ; movdqu (%rax,%rdx,4),%xmm9 - DB 102,15,111,37,67,45,0,0 ; movdqa 0x2d43(%rip),%xmm4 # 6f00 <_sk_callback_sse2+0xf98> + DB 102,15,111,37,227,45,0,0 ; movdqa 0x2de3(%rip),%xmm4 # 6fa0 <_sk_callback_sse2+0xf97> DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5 DB 102,15,219,236 ; pand %xmm4,%xmm5 DB 15,91,245 ; cvtdq2ps %xmm5,%xmm6 - DB 68,15,40,5,63,45,0,0 ; movaps 0x2d3f(%rip),%xmm8 # 6f10 <_sk_callback_sse2+0xfa8> + DB 68,15,40,5,223,45,0,0 ; movaps 0x2ddf(%rip),%xmm8 # 6fb0 <_sk_callback_sse2+0xfa7> DB 65,15,89,240 ; mulps %xmm8,%xmm6 DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5 DB 102,15,114,213,8 ; psrld $0x8,%xmm5 @@ -26337,11 +26501,11 @@ _sk_gather_bgra_sse2 LABEL PROC DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1 DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9 DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9 - DB 102,15,111,5,77,44,0,0 ; movdqa 0x2c4d(%rip),%xmm0 # 6f20 <_sk_callback_sse2+0xfb8> + DB 102,15,111,5,237,44,0,0 ; movdqa 0x2ced(%rip),%xmm0 # 6fc0 <_sk_callback_sse2+0xfb7> DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,219,200 ; pand %xmm0,%xmm1 DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2 - DB 68,15,40,5,73,44,0,0 ; movaps 0x2c49(%rip),%xmm8 # 6f30 <_sk_callback_sse2+0xfc8> + DB 68,15,40,5,233,44,0,0 ; movaps 0x2ce9(%rip),%xmm8 # 6fd0 <_sk_callback_sse2+0xfc7> DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -26364,7 +26528,7 @@ PUBLIC _sk_store_bgra_sse2 _sk_store_bgra_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax - DB 68,15,40,5,11,44,0,0 ; movaps 0x2c0b(%rip),%xmm8 # 6f40 <_sk_callback_sse2+0xfd8> + DB 68,15,40,5,171,44,0,0 ; movaps 0x2cab(%rip),%xmm8 # 6fe0 <_sk_callback_sse2+0xfd7> DB 68,15,40,202 ; movaps %xmm2,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -26419,7 +26583,7 @@ _sk_load_f16_sse2 LABEL PROC DB 102,69,15,239,210 ; pxor %xmm10,%xmm10 DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1 DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1 - DB 102,68,15,111,13,55,43,0,0 ; movdqa 0x2b37(%rip),%xmm9 # 6f50 <_sk_callback_sse2+0xfe8> + DB 102,68,15,111,13,215,43,0,0 ; movdqa 0x2bd7(%rip),%xmm9 # 6ff0 <_sk_callback_sse2+0xfe7> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,193 ; pand %xmm9,%xmm0 DB 102,15,239,200 ; pxor %xmm0,%xmm1 @@ -26427,11 +26591,11 @@ _sk_load_f16_sse2 LABEL PROC DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13 DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13 DB 102,68,15,235,232 ; por %xmm0,%xmm13 - DB 102,68,15,111,29,28,43,0,0 ; movdqa 0x2b1c(%rip),%xmm11 # 6f60 <_sk_callback_sse2+0xff8> + DB 102,68,15,111,29,188,43,0,0 ; movdqa 0x2bbc(%rip),%xmm11 # 7000 <_sk_callback_sse2+0xff7> DB 102,69,15,254,235 ; paddd %xmm11,%xmm13 - DB 102,68,15,111,37,30,43,0,0 ; movdqa 0x2b1e(%rip),%xmm12 # 6f70 <_sk_callback_sse2+0x1008> + DB 102,68,15,111,37,190,43,0,0 ; movdqa 0x2bbe(%rip),%xmm12 # 7010 <_sk_callback_sse2+0x1007> DB 102,65,15,239,204 ; pxor %xmm12,%xmm1 - DB 102,15,111,29,33,43,0,0 ; movdqa 0x2b21(%rip),%xmm3 # 6f80 <_sk_callback_sse2+0x1018> + DB 102,15,111,29,193,43,0,0 ; movdqa 0x2bc1(%rip),%xmm3 # 7020 <_sk_callback_sse2+0x1017> DB 102,15,111,195 ; movdqa %xmm3,%xmm0 DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0 DB 102,65,15,223,197 ; pandn %xmm13,%xmm0 @@ -26508,7 +26672,7 @@ _sk_load_f16_dst_sse2 LABEL PROC DB 102,69,15,239,210 ; pxor %xmm10,%xmm10 DB 102,65,15,111,238 ; movdqa %xmm14,%xmm5 DB 102,65,15,97,234 ; punpcklwd %xmm10,%xmm5 - DB 102,68,15,111,13,206,41,0,0 ; movdqa 0x29ce(%rip),%xmm9 # 6f90 <_sk_callback_sse2+0x1028> + DB 102,68,15,111,13,110,42,0,0 ; movdqa 0x2a6e(%rip),%xmm9 # 7030 <_sk_callback_sse2+0x1027> DB 102,15,111,229 ; movdqa %xmm5,%xmm4 DB 102,65,15,219,225 ; pand %xmm9,%xmm4 DB 102,15,239,236 ; pxor %xmm4,%xmm5 @@ -26516,11 +26680,11 @@ _sk_load_f16_dst_sse2 LABEL PROC DB 102,68,15,111,237 ; movdqa %xmm5,%xmm13 DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13 DB 102,68,15,235,236 ; por %xmm4,%xmm13 - DB 102,68,15,111,29,179,41,0,0 ; movdqa 0x29b3(%rip),%xmm11 # 6fa0 <_sk_callback_sse2+0x1038> + DB 102,68,15,111,29,83,42,0,0 ; movdqa 0x2a53(%rip),%xmm11 # 7040 <_sk_callback_sse2+0x1037> DB 102,69,15,254,235 ; paddd %xmm11,%xmm13 - DB 102,68,15,111,37,181,41,0,0 ; movdqa 0x29b5(%rip),%xmm12 # 6fb0 <_sk_callback_sse2+0x1048> + DB 102,68,15,111,37,85,42,0,0 ; movdqa 0x2a55(%rip),%xmm12 # 7050 <_sk_callback_sse2+0x1047> DB 102,65,15,239,236 ; pxor %xmm12,%xmm5 - DB 102,15,111,61,184,41,0,0 ; movdqa 0x29b8(%rip),%xmm7 # 6fc0 <_sk_callback_sse2+0x1058> + DB 102,15,111,61,88,42,0,0 ; movdqa 0x2a58(%rip),%xmm7 # 7060 <_sk_callback_sse2+0x1057> DB 102,15,111,231 ; movdqa %xmm7,%xmm4 DB 102,15,102,229 ; pcmpgtd %xmm5,%xmm4 DB 102,65,15,223,229 ; pandn %xmm13,%xmm4 @@ -26618,7 +26782,7 @@ _sk_gather_f16_sse2 LABEL PROC DB 102,69,15,239,210 ; pxor %xmm10,%xmm10 DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1 DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1 - DB 102,68,15,111,13,10,40,0,0 ; movdqa 0x280a(%rip),%xmm9 # 6fd0 <_sk_callback_sse2+0x1068> + DB 102,68,15,111,13,170,40,0,0 ; movdqa 0x28aa(%rip),%xmm9 # 7070 <_sk_callback_sse2+0x1067> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,193 ; pand %xmm9,%xmm0 DB 102,15,239,200 ; pxor %xmm0,%xmm1 @@ -26626,11 +26790,11 @@ _sk_gather_f16_sse2 LABEL PROC DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13 DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13 DB 102,68,15,235,232 ; por %xmm0,%xmm13 - DB 102,68,15,111,29,239,39,0,0 ; movdqa 0x27ef(%rip),%xmm11 # 6fe0 <_sk_callback_sse2+0x1078> + DB 102,68,15,111,29,143,40,0,0 ; movdqa 0x288f(%rip),%xmm11 # 7080 <_sk_callback_sse2+0x1077> DB 102,69,15,254,235 ; paddd %xmm11,%xmm13 - DB 102,68,15,111,37,241,39,0,0 ; movdqa 0x27f1(%rip),%xmm12 # 6ff0 <_sk_callback_sse2+0x1088> + DB 102,68,15,111,37,145,40,0,0 ; movdqa 0x2891(%rip),%xmm12 # 7090 <_sk_callback_sse2+0x1087> DB 102,65,15,239,204 ; pxor %xmm12,%xmm1 - DB 102,15,111,29,244,39,0,0 ; movdqa 0x27f4(%rip),%xmm3 # 7000 <_sk_callback_sse2+0x1098> + DB 102,15,111,29,148,40,0,0 ; movdqa 0x2894(%rip),%xmm3 # 70a0 <_sk_callback_sse2+0x1097> DB 102,15,111,195 ; movdqa %xmm3,%xmm0 DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0 DB 102,65,15,223,197 ; pandn %xmm13,%xmm0 @@ -26682,17 +26846,17 @@ PUBLIC _sk_store_f16_sse2 _sk_store_f16_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax - DB 102,68,15,111,21,27,39,0,0 ; movdqa 0x271b(%rip),%xmm10 # 7010 <_sk_callback_sse2+0x10a8> + DB 102,68,15,111,21,187,39,0,0 ; movdqa 0x27bb(%rip),%xmm10 # 70b0 <_sk_callback_sse2+0x10a7> DB 102,68,15,111,224 ; movdqa %xmm0,%xmm12 DB 102,69,15,219,226 ; pand %xmm10,%xmm12 DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13 DB 102,69,15,239,236 ; pxor %xmm12,%xmm13 - DB 102,68,15,111,13,14,39,0,0 ; movdqa 0x270e(%rip),%xmm9 # 7020 <_sk_callback_sse2+0x10b8> + DB 102,68,15,111,13,174,39,0,0 ; movdqa 0x27ae(%rip),%xmm9 # 70c0 <_sk_callback_sse2+0x10b7> DB 102,65,15,114,212,16 ; psrld $0x10,%xmm12 DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8 DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8 DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13 - DB 102,68,15,111,29,255,38,0,0 ; movdqa 0x26ff(%rip),%xmm11 # 7030 <_sk_callback_sse2+0x10c8> + DB 102,68,15,111,29,159,39,0,0 ; movdqa 0x279f(%rip),%xmm11 # 70d0 <_sk_callback_sse2+0x10c7> DB 102,69,15,235,227 ; por %xmm11,%xmm12 DB 102,69,15,254,229 ; paddd %xmm13,%xmm12 DB 102,65,15,114,244,16 ; pslld $0x10,%xmm12 @@ -26783,7 +26947,7 @@ _sk_load_u16_be_sse2 LABEL PROC DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1 DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0 - DB 68,15,40,5,95,37,0,0 ; movaps 0x255f(%rip),%xmm8 # 7040 <_sk_callback_sse2+0x10d8> + DB 68,15,40,5,255,37,0,0 ; movaps 0x25ff(%rip),%xmm8 # 70e0 <_sk_callback_sse2+0x10d7> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 @@ -26850,7 +27014,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 102,65,15,97,200 ; punpcklwd %xmm8,%xmm1 DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0 - DB 68,15,40,13,78,36,0,0 ; movaps 0x244e(%rip),%xmm9 # 7050 <_sk_callback_sse2+0x10e8> + DB 68,15,40,13,238,36,0,0 ; movaps 0x24ee(%rip),%xmm9 # 70f0 <_sk_callback_sse2+0x10e7> DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 @@ -26867,7 +27031,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 65,15,89,209 ; mulps %xmm9,%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,21,36,0,0 ; movaps 0x2415(%rip),%xmm3 # 7060 <_sk_callback_sse2+0x10f8> + DB 15,40,29,181,36,0,0 ; movaps 0x24b5(%rip),%xmm3 # 7100 <_sk_callback_sse2+0x10f7> DB 255,224 ; jmpq *%rax DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2 DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2 @@ -26894,7 +27058,7 @@ _sk_store_u16_be_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax - DB 68,15,40,21,175,35,0,0 ; movaps 0x23af(%rip),%xmm10 # 7070 <_sk_callback_sse2+0x1108> + DB 68,15,40,21,79,36,0,0 ; movaps 0x244f(%rip),%xmm10 # 7110 <_sk_callback_sse2+0x1107> DB 68,15,40,192 ; movaps %xmm0,%xmm8 DB 69,15,89,194 ; mulps %xmm10,%xmm8 DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8 @@ -27112,7 +27276,7 @@ _sk_repeat_x_sse2 LABEL PROC DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10 DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9 - DB 68,15,84,13,125,32,0,0 ; andps 0x207d(%rip),%xmm9 # 7080 <_sk_callback_sse2+0x1118> + DB 68,15,84,13,29,33,0,0 ; andps 0x211d(%rip),%xmm9 # 7120 <_sk_callback_sse2+0x1117> DB 69,15,92,209 ; subps %xmm9,%xmm10 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 DB 69,15,89,208 ; mulps %xmm8,%xmm10 @@ -27133,7 +27297,7 @@ _sk_repeat_y_sse2 LABEL PROC DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10 DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9 - DB 68,15,84,13,62,32,0,0 ; andps 0x203e(%rip),%xmm9 # 7090 <_sk_callback_sse2+0x1128> + DB 68,15,84,13,222,32,0,0 ; andps 0x20de(%rip),%xmm9 # 7130 <_sk_callback_sse2+0x1127> DB 69,15,92,209 ; subps %xmm9,%xmm10 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 DB 69,15,89,208 ; mulps %xmm8,%xmm10 @@ -27154,13 +27318,13 @@ _sk_mirror_x_sse2 LABEL PROC DB 65,15,92,192 ; subps %xmm8,%xmm0 DB 243,69,15,88,201 ; addss %xmm9,%xmm9 DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 - DB 243,68,15,89,21,78,36,0,0 ; mulss 0x244e(%rip),%xmm10 # 74f0 <_sk_callback_sse2+0x1588> + DB 243,68,15,89,21,30,37,0,0 ; mulss 0x251e(%rip),%xmm10 # 75c0 <_sk_callback_sse2+0x15b7> DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 68,15,89,208 ; mulps %xmm0,%xmm10 DB 243,69,15,91,218 ; cvttps2dq %xmm10,%xmm11 DB 69,15,91,219 ; cvtdq2ps %xmm11,%xmm11 DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10 - DB 68,15,84,21,223,31,0,0 ; andps 0x1fdf(%rip),%xmm10 # 70a0 <_sk_callback_sse2+0x1138> + DB 68,15,84,21,127,32,0,0 ; andps 0x207f(%rip),%xmm10 # 7140 <_sk_callback_sse2+0x1137> DB 69,15,87,228 ; xorps %xmm12,%xmm12 DB 69,15,92,218 ; subps %xmm10,%xmm11 DB 69,15,89,217 ; mulps %xmm9,%xmm11 @@ -27184,13 +27348,13 @@ _sk_mirror_y_sse2 LABEL PROC DB 65,15,92,200 ; subps %xmm8,%xmm1 DB 243,69,15,88,201 ; addss %xmm9,%xmm9 DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 - DB 243,68,15,89,21,216,35,0,0 ; mulss 0x23d8(%rip),%xmm10 # 74f4 <_sk_callback_sse2+0x158c> + DB 243,68,15,89,21,168,36,0,0 ; mulss 0x24a8(%rip),%xmm10 # 75c4 <_sk_callback_sse2+0x15bb> DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 68,15,89,209 ; mulps %xmm1,%xmm10 DB 243,69,15,91,218 ; cvttps2dq %xmm10,%xmm11 DB 69,15,91,219 ; cvtdq2ps %xmm11,%xmm11 DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10 - DB 68,15,84,21,117,31,0,0 ; andps 0x1f75(%rip),%xmm10 # 70b0 <_sk_callback_sse2+0x1148> + DB 68,15,84,21,21,32,0,0 ; andps 0x2015(%rip),%xmm10 # 7150 <_sk_callback_sse2+0x1147> DB 69,15,87,228 ; xorps %xmm12,%xmm12 DB 69,15,92,218 ; subps %xmm10,%xmm11 DB 69,15,89,217 ; mulps %xmm9,%xmm11 @@ -27208,7 +27372,7 @@ PUBLIC _sk_clamp_x_1_sse2 _sk_clamp_x_1_sse2 LABEL PROC DB 69,15,87,192 ; xorps %xmm8,%xmm8 DB 68,15,95,192 ; maxps %xmm0,%xmm8 - DB 68,15,93,5,71,31,0,0 ; minps 0x1f47(%rip),%xmm8 # 70c0 <_sk_callback_sse2+0x1158> + DB 68,15,93,5,231,31,0,0 ; minps 0x1fe7(%rip),%xmm8 # 7160 <_sk_callback_sse2+0x1157> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -27219,7 +27383,7 @@ _sk_repeat_x_1_sse2 LABEL PROC DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9 - DB 68,15,84,13,53,31,0,0 ; andps 0x1f35(%rip),%xmm9 # 70d0 <_sk_callback_sse2+0x1168> + DB 68,15,84,13,213,31,0,0 ; andps 0x1fd5(%rip),%xmm9 # 7170 <_sk_callback_sse2+0x1167> DB 69,15,92,193 ; subps %xmm9,%xmm8 DB 65,15,92,192 ; subps %xmm8,%xmm0 DB 72,173 ; lods %ds:(%rsi),%rax @@ -27227,14 +27391,14 @@ _sk_repeat_x_1_sse2 LABEL PROC PUBLIC _sk_mirror_x_1_sse2 _sk_mirror_x_1_sse2 LABEL PROC - DB 68,15,40,5,49,31,0,0 ; movaps 0x1f31(%rip),%xmm8 # 70e0 <_sk_callback_sse2+0x1178> + DB 68,15,40,5,209,31,0,0 ; movaps 0x1fd1(%rip),%xmm8 # 7180 <_sk_callback_sse2+0x1177> DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,13,53,31,0,0 ; movaps 0x1f35(%rip),%xmm9 # 70f0 <_sk_callback_sse2+0x1188> + DB 68,15,40,13,213,31,0,0 ; movaps 0x1fd5(%rip),%xmm9 # 7190 <_sk_callback_sse2+0x1187> DB 68,15,89,200 ; mulps %xmm0,%xmm9 DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10 DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9 - DB 68,15,84,13,43,31,0,0 ; andps 0x1f2b(%rip),%xmm9 # 7100 <_sk_callback_sse2+0x1198> + DB 68,15,84,13,203,31,0,0 ; andps 0x1fcb(%rip),%xmm9 # 71a0 <_sk_callback_sse2+0x1197> DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,209 ; subps %xmm9,%xmm10 DB 69,15,88,210 ; addps %xmm10,%xmm10 @@ -27248,10 +27412,10 @@ _sk_mirror_x_1_sse2 LABEL PROC PUBLIC _sk_luminance_to_alpha_sse2 _sk_luminance_to_alpha_sse2 LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 - DB 15,89,5,17,31,0,0 ; mulps 0x1f11(%rip),%xmm0 # 7110 <_sk_callback_sse2+0x11a8> - DB 15,89,13,26,31,0,0 ; mulps 0x1f1a(%rip),%xmm1 # 7120 <_sk_callback_sse2+0x11b8> + DB 15,89,5,177,31,0,0 ; mulps 0x1fb1(%rip),%xmm0 # 71b0 <_sk_callback_sse2+0x11a7> + DB 15,89,13,186,31,0,0 ; mulps 0x1fba(%rip),%xmm1 # 71c0 <_sk_callback_sse2+0x11b7> DB 15,88,200 ; addps %xmm0,%xmm1 - DB 15,89,29,32,31,0,0 ; mulps 0x1f20(%rip),%xmm3 # 7130 <_sk_callback_sse2+0x11c8> + DB 15,89,29,192,31,0,0 ; mulps 0x1fc0(%rip),%xmm3 # 71d0 <_sk_callback_sse2+0x11c7> DB 15,88,217 ; addps %xmm1,%xmm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 @@ -27615,15 +27779,15 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC PUBLIC _sk_gauss_a_to_rgba_sse2 _sk_gauss_a_to_rgba_sse2 LABEL PROC - DB 15,40,5,83,25,0,0 ; movaps 0x1953(%rip),%xmm0 # 7140 <_sk_callback_sse2+0x11d8> + DB 15,40,5,243,25,0,0 ; movaps 0x19f3(%rip),%xmm0 # 71e0 <_sk_callback_sse2+0x11d7> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,89,25,0,0 ; addps 0x1959(%rip),%xmm0 # 7150 <_sk_callback_sse2+0x11e8> + DB 15,88,5,249,25,0,0 ; addps 0x19f9(%rip),%xmm0 # 71f0 <_sk_callback_sse2+0x11e7> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,95,25,0,0 ; addps 0x195f(%rip),%xmm0 # 7160 <_sk_callback_sse2+0x11f8> + DB 15,88,5,255,25,0,0 ; addps 0x19ff(%rip),%xmm0 # 7200 <_sk_callback_sse2+0x11f7> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,101,25,0,0 ; addps 0x1965(%rip),%xmm0 # 7170 <_sk_callback_sse2+0x1208> + DB 15,88,5,5,26,0,0 ; addps 0x1a05(%rip),%xmm0 # 7210 <_sk_callback_sse2+0x1207> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,107,25,0,0 ; addps 0x196b(%rip),%xmm0 # 7180 <_sk_callback_sse2+0x1218> + DB 15,88,5,11,26,0,0 ; addps 0x1a0b(%rip),%xmm0 # 7220 <_sk_callback_sse2+0x1217> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 @@ -27644,7 +27808,7 @@ _sk_gradient_sse2 LABEL PROC DB 73,255,201 ; dec %r9 DB 72,131,195,4 ; add $0x4,%rbx DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 15,40,21,68,25,0,0 ; movaps 0x1944(%rip),%xmm2 # 7190 <_sk_callback_sse2+0x1228> + DB 15,40,21,228,25,0,0 ; movaps 0x19e4(%rip),%xmm2 # 7230 <_sk_callback_sse2+0x1227> DB 243,15,16,27 ; movss (%rbx),%xmm3 DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3 DB 15,194,216,2 ; cmpleps %xmm0,%xmm3 @@ -27787,29 +27951,29 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC DB 69,15,94,220 ; divps %xmm12,%xmm11 DB 69,15,40,227 ; movaps %xmm11,%xmm12 DB 69,15,89,228 ; mulps %xmm12,%xmm12 - DB 68,15,40,45,5,23,0,0 ; movaps 0x1705(%rip),%xmm13 # 71a0 <_sk_callback_sse2+0x1238> + DB 68,15,40,45,165,23,0,0 ; movaps 0x17a5(%rip),%xmm13 # 7240 <_sk_callback_sse2+0x1237> DB 69,15,89,236 ; mulps %xmm12,%xmm13 - DB 68,15,88,45,9,23,0,0 ; addps 0x1709(%rip),%xmm13 # 71b0 <_sk_callback_sse2+0x1248> + DB 68,15,88,45,169,23,0,0 ; addps 0x17a9(%rip),%xmm13 # 7250 <_sk_callback_sse2+0x1247> DB 69,15,89,236 ; mulps %xmm12,%xmm13 - DB 68,15,88,45,13,23,0,0 ; addps 0x170d(%rip),%xmm13 # 71c0 <_sk_callback_sse2+0x1258> + DB 68,15,88,45,173,23,0,0 ; addps 0x17ad(%rip),%xmm13 # 7260 <_sk_callback_sse2+0x1257> DB 69,15,89,236 ; mulps %xmm12,%xmm13 - DB 68,15,88,45,17,23,0,0 ; addps 0x1711(%rip),%xmm13 # 71d0 <_sk_callback_sse2+0x1268> + DB 68,15,88,45,177,23,0,0 ; addps 0x17b1(%rip),%xmm13 # 7270 <_sk_callback_sse2+0x1267> DB 69,15,89,235 ; mulps %xmm11,%xmm13 DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9 - DB 68,15,40,21,16,23,0,0 ; movaps 0x1710(%rip),%xmm10 # 71e0 <_sk_callback_sse2+0x1278> + DB 68,15,40,21,176,23,0,0 ; movaps 0x17b0(%rip),%xmm10 # 7280 <_sk_callback_sse2+0x1277> DB 69,15,92,213 ; subps %xmm13,%xmm10 DB 69,15,84,209 ; andps %xmm9,%xmm10 DB 69,15,85,205 ; andnps %xmm13,%xmm9 DB 69,15,86,202 ; orps %xmm10,%xmm9 DB 68,15,194,192,1 ; cmpltps %xmm0,%xmm8 - DB 68,15,40,21,3,23,0,0 ; movaps 0x1703(%rip),%xmm10 # 71f0 <_sk_callback_sse2+0x1288> + DB 68,15,40,21,163,23,0,0 ; movaps 0x17a3(%rip),%xmm10 # 7290 <_sk_callback_sse2+0x1287> DB 69,15,92,209 ; subps %xmm9,%xmm10 DB 69,15,84,208 ; andps %xmm8,%xmm10 DB 69,15,85,193 ; andnps %xmm9,%xmm8 DB 69,15,86,194 ; orps %xmm10,%xmm8 DB 68,15,40,201 ; movaps %xmm1,%xmm9 DB 68,15,194,200,1 ; cmpltps %xmm0,%xmm9 - DB 68,15,40,21,242,22,0,0 ; movaps 0x16f2(%rip),%xmm10 # 7200 <_sk_callback_sse2+0x1298> + DB 68,15,40,21,146,23,0,0 ; movaps 0x1792(%rip),%xmm10 # 72a0 <_sk_callback_sse2+0x1297> DB 69,15,92,208 ; subps %xmm8,%xmm10 DB 69,15,84,209 ; andps %xmm9,%xmm10 DB 69,15,85,200 ; andnps %xmm8,%xmm9 @@ -27829,18 +27993,18 @@ _sk_xy_to_radius_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax -PUBLIC _sk_xy_to_2pt_conical_sse2 -_sk_xy_to_2pt_conical_sse2 LABEL PROC +PUBLIC _sk_xy_to_2pt_conical_quadratic_sse2 +_sk_xy_to_2pt_conical_quadratic_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 243,68,15,16,16 ; movss (%rax),%xmm10 - DB 243,68,15,16,72,4 ; movss 0x4(%rax),%xmm9 + DB 243,68,15,16,80,32 ; movss 0x20(%rax),%xmm10 + DB 243,68,15,16,72,36 ; movss 0x24(%rax),%xmm9 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 - DB 243,68,15,16,88,8 ; movss 0x8(%rax),%xmm11 - DB 243,68,15,16,64,12 ; movss 0xc(%rax),%xmm8 + DB 243,68,15,16,88,40 ; movss 0x28(%rax),%xmm11 + DB 243,68,15,16,64,44 ; movss 0x2c(%rax),%xmm8 DB 243,69,15,89,195 ; mulss %xmm11,%xmm8 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 DB 68,15,88,192 ; addps %xmm0,%xmm8 - DB 68,15,89,5,154,22,0,0 ; mulps 0x169a(%rip),%xmm8 # 7210 <_sk_callback_sse2+0x12a8> + DB 68,15,89,5,57,23,0,0 ; mulps 0x1739(%rip),%xmm8 # 72b0 <_sk_callback_sse2+0x12a7> DB 15,89,192 ; mulps %xmm0,%xmm0 DB 68,15,40,225 ; movaps %xmm1,%xmm12 DB 69,15,89,228 ; mulps %xmm12,%xmm12 @@ -27848,7 +28012,7 @@ _sk_xy_to_2pt_conical_sse2 LABEL PROC DB 243,69,15,89,219 ; mulss %xmm11,%xmm11 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,92,227 ; subps %xmm11,%xmm12 - DB 68,15,89,21,133,22,0,0 ; mulps 0x1685(%rip),%xmm10 # 7220 <_sk_callback_sse2+0x12b8> + DB 68,15,89,21,36,23,0,0 ; mulps 0x1724(%rip),%xmm10 # 72c0 <_sk_callback_sse2+0x12b7> DB 69,15,89,212 ; mulps %xmm12,%xmm10 DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 15,89,192 ; mulps %xmm0,%xmm0 @@ -27857,9 +28021,9 @@ _sk_xy_to_2pt_conical_sse2 LABEL PROC DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 65,15,92,192 ; subps %xmm8,%xmm0 - DB 68,15,87,5,109,22,0,0 ; xorps 0x166d(%rip),%xmm8 # 7230 <_sk_callback_sse2+0x12c8> + DB 68,15,87,5,12,23,0,0 ; xorps 0x170c(%rip),%xmm8 # 72d0 <_sk_callback_sse2+0x12c7> DB 65,15,89,193 ; mulps %xmm9,%xmm0 - DB 68,15,40,29,113,22,0,0 ; movaps 0x1671(%rip),%xmm11 # 7240 <_sk_callback_sse2+0x12d8> + DB 68,15,40,29,16,23,0,0 ; movaps 0x1710(%rip),%xmm11 # 72e0 <_sk_callback_sse2+0x12d7> DB 65,15,89,195 ; mulps %xmm11,%xmm0 DB 69,15,92,194 ; subps %xmm10,%xmm8 DB 69,15,89,193 ; mulps %xmm9,%xmm8 @@ -27868,10 +28032,55 @@ _sk_xy_to_2pt_conical_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax +PUBLIC _sk_xy_to_2pt_conical_linear_sse2 +_sk_xy_to_2pt_conical_linear_sse2 LABEL PROC + DB 72,173 ; lods %ds:(%rsi),%rax + DB 243,68,15,16,64,40 ; movss 0x28(%rax),%xmm8 + DB 243,68,15,16,72,44 ; movss 0x2c(%rax),%xmm9 + DB 69,15,40,209 ; movaps %xmm9,%xmm10 + DB 243,69,15,89,208 ; mulss %xmm8,%xmm10 + DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 + DB 68,15,88,208 ; addps %xmm0,%xmm10 + DB 68,15,89,21,224,22,0,0 ; mulps 0x16e0(%rip),%xmm10 # 72f0 <_sk_callback_sse2+0x12e7> + DB 15,89,192 ; mulps %xmm0,%xmm0 + DB 15,89,201 ; mulps %xmm1,%xmm1 + DB 15,88,200 ; addps %xmm0,%xmm1 + DB 65,15,40,192 ; movaps %xmm8,%xmm0 + DB 243,15,89,192 ; mulss %xmm0,%xmm0 + DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0 + DB 15,92,200 ; subps %xmm0,%xmm1 + DB 15,87,13,209,22,0,0 ; xorps 0x16d1(%rip),%xmm1 # 7300 <_sk_callback_sse2+0x12f7> + DB 65,15,94,202 ; divps %xmm10,%xmm1 + DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 + DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 + DB 68,15,89,201 ; mulps %xmm1,%xmm9 + DB 69,15,88,200 ; addps %xmm8,%xmm9 + DB 69,15,87,192 ; xorps %xmm8,%xmm8 + DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9 + DB 68,15,194,193,3 ; cmpunordps %xmm1,%xmm8 + DB 69,15,86,193 ; orps %xmm9,%xmm8 + DB 68,15,85,5,177,22,0,0 ; andnps 0x16b1(%rip),%xmm8 # 7310 <_sk_callback_sse2+0x1307> + DB 68,15,17,0 ; movups %xmm8,(%rax) + DB 72,173 ; lods %ds:(%rsi),%rax + DB 15,40,193 ; movaps %xmm1,%xmm0 + DB 65,15,40,200 ; movaps %xmm8,%xmm1 + DB 255,224 ; jmpq *%rax + +PUBLIC _sk_vector_scale_sse2 +_sk_vector_scale_sse2 LABEL PROC + DB 72,173 ; lods %ds:(%rsi),%rax + DB 68,15,16,0 ; movups (%rax),%xmm8 + DB 65,15,89,192 ; mulps %xmm8,%xmm0 + DB 65,15,89,200 ; mulps %xmm8,%xmm1 + DB 65,15,89,208 ; mulps %xmm8,%xmm2 + DB 65,15,89,216 ; mulps %xmm8,%xmm3 + DB 72,173 ; lods %ds:(%rsi),%rax + DB 255,224 ; jmpq *%rax + PUBLIC _sk_save_xy_sse2 _sk_save_xy_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,95,22,0,0 ; movaps 0x165f(%rip),%xmm8 # 7250 <_sk_callback_sse2+0x12e8> + DB 68,15,40,5,142,22,0,0 ; movaps 0x168e(%rip),%xmm8 # 7320 <_sk_callback_sse2+0x1317> DB 15,17,0 ; movups %xmm0,(%rax) DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,88,200 ; addps %xmm8,%xmm9 @@ -27879,7 +28088,7 @@ _sk_save_xy_sse2 LABEL PROC DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 DB 69,15,40,217 ; movaps %xmm9,%xmm11 DB 69,15,194,218,1 ; cmpltps %xmm10,%xmm11 - DB 68,15,40,37,74,22,0,0 ; movaps 0x164a(%rip),%xmm12 # 7260 <_sk_callback_sse2+0x12f8> + DB 68,15,40,37,121,22,0,0 ; movaps 0x1679(%rip),%xmm12 # 7330 <_sk_callback_sse2+0x1327> DB 69,15,84,220 ; andps %xmm12,%xmm11 DB 69,15,92,211 ; subps %xmm11,%xmm10 DB 69,15,92,202 ; subps %xmm10,%xmm9 @@ -27922,8 +28131,8 @@ _sk_bilinear_nx_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,195,21,0,0 ; addps 0x15c3(%rip),%xmm0 # 7270 <_sk_callback_sse2+0x1308> - DB 68,15,40,13,203,21,0,0 ; movaps 0x15cb(%rip),%xmm9 # 7280 <_sk_callback_sse2+0x1318> + DB 15,88,5,242,21,0,0 ; addps 0x15f2(%rip),%xmm0 # 7340 <_sk_callback_sse2+0x1337> + DB 68,15,40,13,250,21,0,0 ; movaps 0x15fa(%rip),%xmm9 # 7350 <_sk_callback_sse2+0x1347> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -27934,7 +28143,7 @@ _sk_bilinear_px_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,186,21,0,0 ; addps 0x15ba(%rip),%xmm0 # 7290 <_sk_callback_sse2+0x1328> + DB 15,88,5,233,21,0,0 ; addps 0x15e9(%rip),%xmm0 # 7360 <_sk_callback_sse2+0x1357> DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -27944,8 +28153,8 @@ _sk_bilinear_ny_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,172,21,0,0 ; addps 0x15ac(%rip),%xmm1 # 72a0 <_sk_callback_sse2+0x1338> - DB 68,15,40,13,180,21,0,0 ; movaps 0x15b4(%rip),%xmm9 # 72b0 <_sk_callback_sse2+0x1348> + DB 15,88,13,219,21,0,0 ; addps 0x15db(%rip),%xmm1 # 7370 <_sk_callback_sse2+0x1367> + DB 68,15,40,13,227,21,0,0 ; movaps 0x15e3(%rip),%xmm9 # 7380 <_sk_callback_sse2+0x1377> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -27956,7 +28165,7 @@ _sk_bilinear_py_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,162,21,0,0 ; addps 0x15a2(%rip),%xmm1 # 72c0 <_sk_callback_sse2+0x1358> + DB 15,88,13,209,21,0,0 ; addps 0x15d1(%rip),%xmm1 # 7390 <_sk_callback_sse2+0x1387> DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -27966,13 +28175,13 @@ _sk_bicubic_n3x_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,149,21,0,0 ; addps 0x1595(%rip),%xmm0 # 72d0 <_sk_callback_sse2+0x1368> - DB 68,15,40,13,157,21,0,0 ; movaps 0x159d(%rip),%xmm9 # 72e0 <_sk_callback_sse2+0x1378> + DB 15,88,5,196,21,0,0 ; addps 0x15c4(%rip),%xmm0 # 73a0 <_sk_callback_sse2+0x1397> + DB 68,15,40,13,204,21,0,0 ; movaps 0x15cc(%rip),%xmm9 # 73b0 <_sk_callback_sse2+0x13a7> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 69,15,89,192 ; mulps %xmm8,%xmm8 - DB 68,15,89,13,153,21,0,0 ; mulps 0x1599(%rip),%xmm9 # 72f0 <_sk_callback_sse2+0x1388> - DB 68,15,88,13,161,21,0,0 ; addps 0x15a1(%rip),%xmm9 # 7300 <_sk_callback_sse2+0x1398> + DB 68,15,89,13,200,21,0,0 ; mulps 0x15c8(%rip),%xmm9 # 73c0 <_sk_callback_sse2+0x13b7> + DB 68,15,88,13,208,21,0,0 ; addps 0x15d0(%rip),%xmm9 # 73d0 <_sk_callback_sse2+0x13c7> DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -27983,16 +28192,16 @@ _sk_bicubic_n1x_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,144,21,0,0 ; addps 0x1590(%rip),%xmm0 # 7310 <_sk_callback_sse2+0x13a8> - DB 68,15,40,13,152,21,0,0 ; movaps 0x1598(%rip),%xmm9 # 7320 <_sk_callback_sse2+0x13b8> + DB 15,88,5,191,21,0,0 ; addps 0x15bf(%rip),%xmm0 # 73e0 <_sk_callback_sse2+0x13d7> + DB 68,15,40,13,199,21,0,0 ; movaps 0x15c7(%rip),%xmm9 # 73f0 <_sk_callback_sse2+0x13e7> DB 69,15,92,200 ; subps %xmm8,%xmm9 - DB 68,15,40,5,156,21,0,0 ; movaps 0x159c(%rip),%xmm8 # 7330 <_sk_callback_sse2+0x13c8> + DB 68,15,40,5,203,21,0,0 ; movaps 0x15cb(%rip),%xmm8 # 7400 <_sk_callback_sse2+0x13f7> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,160,21,0,0 ; addps 0x15a0(%rip),%xmm8 # 7340 <_sk_callback_sse2+0x13d8> + DB 68,15,88,5,207,21,0,0 ; addps 0x15cf(%rip),%xmm8 # 7410 <_sk_callback_sse2+0x1407> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,164,21,0,0 ; addps 0x15a4(%rip),%xmm8 # 7350 <_sk_callback_sse2+0x13e8> + DB 68,15,88,5,211,21,0,0 ; addps 0x15d3(%rip),%xmm8 # 7420 <_sk_callback_sse2+0x1417> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,168,21,0,0 ; addps 0x15a8(%rip),%xmm8 # 7360 <_sk_callback_sse2+0x13f8> + DB 68,15,88,5,215,21,0,0 ; addps 0x15d7(%rip),%xmm8 # 7430 <_sk_callback_sse2+0x1427> DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -28000,17 +28209,17 @@ _sk_bicubic_n1x_sse2 LABEL PROC PUBLIC _sk_bicubic_p1x_sse2 _sk_bicubic_p1x_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,162,21,0,0 ; movaps 0x15a2(%rip),%xmm8 # 7370 <_sk_callback_sse2+0x1408> + DB 68,15,40,5,209,21,0,0 ; movaps 0x15d1(%rip),%xmm8 # 7440 <_sk_callback_sse2+0x1437> DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9 DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,21,158,21,0,0 ; movaps 0x159e(%rip),%xmm10 # 7380 <_sk_callback_sse2+0x1418> + DB 68,15,40,21,205,21,0,0 ; movaps 0x15cd(%rip),%xmm10 # 7450 <_sk_callback_sse2+0x1447> DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,162,21,0,0 ; addps 0x15a2(%rip),%xmm10 # 7390 <_sk_callback_sse2+0x1428> + DB 68,15,88,21,209,21,0,0 ; addps 0x15d1(%rip),%xmm10 # 7460 <_sk_callback_sse2+0x1457> DB 69,15,89,209 ; mulps %xmm9,%xmm10 DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,158,21,0,0 ; addps 0x159e(%rip),%xmm10 # 73a0 <_sk_callback_sse2+0x1438> + DB 68,15,88,21,205,21,0,0 ; addps 0x15cd(%rip),%xmm10 # 7470 <_sk_callback_sse2+0x1467> DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -28020,11 +28229,11 @@ _sk_bicubic_p3x_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,145,21,0,0 ; addps 0x1591(%rip),%xmm0 # 73b0 <_sk_callback_sse2+0x1448> + DB 15,88,5,192,21,0,0 ; addps 0x15c0(%rip),%xmm0 # 7480 <_sk_callback_sse2+0x1477> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 69,15,89,201 ; mulps %xmm9,%xmm9 - DB 68,15,89,5,145,21,0,0 ; mulps 0x1591(%rip),%xmm8 # 73c0 <_sk_callback_sse2+0x1458> - DB 68,15,88,5,153,21,0,0 ; addps 0x1599(%rip),%xmm8 # 73d0 <_sk_callback_sse2+0x1468> + DB 68,15,89,5,192,21,0,0 ; mulps 0x15c0(%rip),%xmm8 # 7490 <_sk_callback_sse2+0x1487> + DB 68,15,88,5,200,21,0,0 ; addps 0x15c8(%rip),%xmm8 # 74a0 <_sk_callback_sse2+0x1497> DB 69,15,89,193 ; mulps %xmm9,%xmm8 DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -28035,13 +28244,13 @@ _sk_bicubic_n3y_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,135,21,0,0 ; addps 0x1587(%rip),%xmm1 # 73e0 <_sk_callback_sse2+0x1478> - DB 68,15,40,13,143,21,0,0 ; movaps 0x158f(%rip),%xmm9 # 73f0 <_sk_callback_sse2+0x1488> + DB 15,88,13,182,21,0,0 ; addps 0x15b6(%rip),%xmm1 # 74b0 <_sk_callback_sse2+0x14a7> + DB 68,15,40,13,190,21,0,0 ; movaps 0x15be(%rip),%xmm9 # 74c0 <_sk_callback_sse2+0x14b7> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 69,15,89,192 ; mulps %xmm8,%xmm8 - DB 68,15,89,13,139,21,0,0 ; mulps 0x158b(%rip),%xmm9 # 7400 <_sk_callback_sse2+0x1498> - DB 68,15,88,13,147,21,0,0 ; addps 0x1593(%rip),%xmm9 # 7410 <_sk_callback_sse2+0x14a8> + DB 68,15,89,13,186,21,0,0 ; mulps 0x15ba(%rip),%xmm9 # 74d0 <_sk_callback_sse2+0x14c7> + DB 68,15,88,13,194,21,0,0 ; addps 0x15c2(%rip),%xmm9 # 74e0 <_sk_callback_sse2+0x14d7> DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -28052,16 +28261,16 @@ _sk_bicubic_n1y_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,129,21,0,0 ; addps 0x1581(%rip),%xmm1 # 7420 <_sk_callback_sse2+0x14b8> - DB 68,15,40,13,137,21,0,0 ; movaps 0x1589(%rip),%xmm9 # 7430 <_sk_callback_sse2+0x14c8> + DB 15,88,13,176,21,0,0 ; addps 0x15b0(%rip),%xmm1 # 74f0 <_sk_callback_sse2+0x14e7> + DB 68,15,40,13,184,21,0,0 ; movaps 0x15b8(%rip),%xmm9 # 7500 <_sk_callback_sse2+0x14f7> DB 69,15,92,200 ; subps %xmm8,%xmm9 - DB 68,15,40,5,141,21,0,0 ; movaps 0x158d(%rip),%xmm8 # 7440 <_sk_callback_sse2+0x14d8> + DB 68,15,40,5,188,21,0,0 ; movaps 0x15bc(%rip),%xmm8 # 7510 <_sk_callback_sse2+0x1507> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,145,21,0,0 ; addps 0x1591(%rip),%xmm8 # 7450 <_sk_callback_sse2+0x14e8> + DB 68,15,88,5,192,21,0,0 ; addps 0x15c0(%rip),%xmm8 # 7520 <_sk_callback_sse2+0x1517> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,149,21,0,0 ; addps 0x1595(%rip),%xmm8 # 7460 <_sk_callback_sse2+0x14f8> + DB 68,15,88,5,196,21,0,0 ; addps 0x15c4(%rip),%xmm8 # 7530 <_sk_callback_sse2+0x1527> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,153,21,0,0 ; addps 0x1599(%rip),%xmm8 # 7470 <_sk_callback_sse2+0x1508> + DB 68,15,88,5,200,21,0,0 ; addps 0x15c8(%rip),%xmm8 # 7540 <_sk_callback_sse2+0x1537> DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -28069,17 +28278,17 @@ _sk_bicubic_n1y_sse2 LABEL PROC PUBLIC _sk_bicubic_p1y_sse2 _sk_bicubic_p1y_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,147,21,0,0 ; movaps 0x1593(%rip),%xmm8 # 7480 <_sk_callback_sse2+0x1518> + DB 68,15,40,5,194,21,0,0 ; movaps 0x15c2(%rip),%xmm8 # 7550 <_sk_callback_sse2+0x1547> DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9 DB 65,15,88,200 ; addps %xmm8,%xmm1 - DB 68,15,40,21,142,21,0,0 ; movaps 0x158e(%rip),%xmm10 # 7490 <_sk_callback_sse2+0x1528> + DB 68,15,40,21,189,21,0,0 ; movaps 0x15bd(%rip),%xmm10 # 7560 <_sk_callback_sse2+0x1557> DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,146,21,0,0 ; addps 0x1592(%rip),%xmm10 # 74a0 <_sk_callback_sse2+0x1538> + DB 68,15,88,21,193,21,0,0 ; addps 0x15c1(%rip),%xmm10 # 7570 <_sk_callback_sse2+0x1567> DB 69,15,89,209 ; mulps %xmm9,%xmm10 DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,142,21,0,0 ; addps 0x158e(%rip),%xmm10 # 74b0 <_sk_callback_sse2+0x1548> + DB 68,15,88,21,189,21,0,0 ; addps 0x15bd(%rip),%xmm10 # 7580 <_sk_callback_sse2+0x1577> DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -28089,11 +28298,11 @@ _sk_bicubic_p3y_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,128,21,0,0 ; addps 0x1580(%rip),%xmm1 # 74c0 <_sk_callback_sse2+0x1558> + DB 15,88,13,175,21,0,0 ; addps 0x15af(%rip),%xmm1 # 7590 <_sk_callback_sse2+0x1587> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 69,15,89,201 ; mulps %xmm9,%xmm9 - DB 68,15,89,5,128,21,0,0 ; mulps 0x1580(%rip),%xmm8 # 74d0 <_sk_callback_sse2+0x1568> - DB 68,15,88,5,136,21,0,0 ; addps 0x1588(%rip),%xmm8 # 74e0 <_sk_callback_sse2+0x1578> + DB 68,15,89,5,175,21,0,0 ; mulps 0x15af(%rip),%xmm8 # 75a0 <_sk_callback_sse2+0x1597> + DB 68,15,88,5,183,21,0,0 ; addps 0x15b7(%rip),%xmm8 # 75b0 <_sk_callback_sse2+0x15a7> DB 69,15,89,193 ; mulps %xmm9,%xmm8 DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -28311,11 +28520,11 @@ ALIGN 16 DB 128,191,0,0,128,191,0 ; cmpb $0x0,-0x40800000(%rdi) DB 0,224 ; add %ah,%al DB 64,0,0 ; add %al,(%rax) - DB 224,64 ; loopne 6218 <.literal16+0x1d8> + DB 224,64 ; loopne 62b8 <.literal16+0x1d8> DB 0,0 ; add %al,(%rax) - DB 224,64 ; loopne 621c <.literal16+0x1dc> + DB 224,64 ; loopne 62bc <.literal16+0x1dc> DB 0,0 ; add %al,(%rax) - DB 224,64 ; loopne 6220 <.literal16+0x1e0> + DB 224,64 ; loopne 62c0 <.literal16+0x1e0> DB 154 ; (bad) DB 153 ; cltd DB 153 ; cltd @@ -28335,13 +28544,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 6241 <.literal16+0x201> + DB 71,225,61 ; rex.RXB loope 62e1 <.literal16+0x201> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 6245 <.literal16+0x205> + DB 71,225,61 ; rex.RXB loope 62e5 <.literal16+0x205> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 6249 <.literal16+0x209> + DB 71,225,61 ; rex.RXB loope 62e9 <.literal16+0x209> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 624d <.literal16+0x20d> + DB 71,225,61 ; rex.RXB loope 62ed <.literal16+0x20d> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -28366,13 +28575,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 6281 <.literal16+0x241> + DB 71,225,61 ; rex.RXB loope 6321 <.literal16+0x241> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 6285 <.literal16+0x245> + DB 71,225,61 ; rex.RXB loope 6325 <.literal16+0x245> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 6289 <.literal16+0x249> + DB 71,225,61 ; rex.RXB loope 6329 <.literal16+0x249> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 628d <.literal16+0x24d> + DB 71,225,61 ; rex.RXB loope 632d <.literal16+0x24d> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -28397,13 +28606,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 62c1 <.literal16+0x281> + DB 71,225,61 ; rex.RXB loope 6361 <.literal16+0x281> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 62c5 <.literal16+0x285> + DB 71,225,61 ; rex.RXB loope 6365 <.literal16+0x285> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 62c9 <.literal16+0x289> + DB 71,225,61 ; rex.RXB loope 6369 <.literal16+0x289> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 62cd <.literal16+0x28d> + DB 71,225,61 ; rex.RXB loope 636d <.literal16+0x28d> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -28428,13 +28637,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 6301 <.literal16+0x2c1> + DB 71,225,61 ; rex.RXB loope 63a1 <.literal16+0x2c1> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 6305 <.literal16+0x2c5> + DB 71,225,61 ; rex.RXB loope 63a5 <.literal16+0x2c5> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 6309 <.literal16+0x2c9> + DB 71,225,61 ; rex.RXB loope 63a9 <.literal16+0x2c9> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 630d <.literal16+0x2cd> + DB 71,225,61 ; rex.RXB loope 63ad <.literal16+0x2cd> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -28455,11 +28664,11 @@ ALIGN 16 DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax) DB 67,0,0 ; rex.XB add %al,(%r8) - DB 127,67 ; jg 634b <.literal16+0x30b> + DB 127,67 ; jg 63eb <.literal16+0x30b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 634f <.literal16+0x30f> + DB 127,67 ; jg 63ef <.literal16+0x30f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6353 <.literal16+0x313> + DB 127,67 ; jg 63f3 <.literal16+0x313> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -28746,13 +28955,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 6599 <.literal16+0x559> + DB 224,7 ; loopne 6639 <.literal16+0x559> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 659d <.literal16+0x55d> + DB 224,7 ; loopne 663d <.literal16+0x55d> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 65a1 <.literal16+0x561> + DB 224,7 ; loopne 6641 <.literal16+0x561> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 65a5 <.literal16+0x565> + DB 224,7 ; loopne 6645 <.literal16+0x565> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -28817,11 +29026,11 @@ ALIGN 16 DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,127,67 ; add %bh,0x43(%rdi) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 667b <.literal16+0x63b> + DB 127,67 ; jg 671b <.literal16+0x63b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 667f <.literal16+0x63f> + DB 127,67 ; jg 671f <.literal16+0x63f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6683 <.literal16+0x643> + DB 127,67 ; jg 6723 <.literal16+0x643> DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax) DB 128,59,129 ; cmpb $0x81,(%rbx) DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%rax) @@ -28836,16 +29045,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 6674 <.literal16+0x634> + DB 127,0 ; jg 6714 <.literal16+0x634> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 6678 <.literal16+0x638> + DB 127,0 ; jg 6718 <.literal16+0x638> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 667c <.literal16+0x63c> + DB 127,0 ; jg 671c <.literal16+0x63c> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 6680 <.literal16+0x640> + DB 127,0 ; jg 6720 <.literal16+0x640> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -28854,7 +29063,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 6705 <.literal16+0x6c5> + DB 119,115 ; ja 67a5 <.literal16+0x6c5> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -28865,7 +29074,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 6669 <.literal16+0x629> + DB 117,191 ; jne 6709 <.literal16+0x629> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -28877,7 +29086,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a3a6aa <_sk_callback_sse2+0xffffffffe9a34742> + DB 233,220,63,163,233 ; jmpq ffffffffe9a3a74a <_sk_callback_sse2+0xffffffffe9a34741> DB 220,63 ; fdivrl (%rdi) DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) @@ -28931,16 +29140,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 6744 <.literal16+0x704> + DB 127,0 ; jg 67e4 <.literal16+0x704> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 6748 <.literal16+0x708> + DB 127,0 ; jg 67e8 <.literal16+0x708> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 674c <.literal16+0x70c> + DB 127,0 ; jg 67ec <.literal16+0x70c> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 6750 <.literal16+0x710> + DB 127,0 ; jg 67f0 <.literal16+0x710> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -28949,7 +29158,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 67d5 <.literal16+0x795> + DB 119,115 ; ja 6875 <.literal16+0x795> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -28960,7 +29169,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 6739 <.literal16+0x6f9> + DB 117,191 ; jne 67d9 <.literal16+0x6f9> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -28972,7 +29181,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a3a77a <_sk_callback_sse2+0xffffffffe9a34812> + DB 233,220,63,163,233 ; jmpq ffffffffe9a3a81a <_sk_callback_sse2+0xffffffffe9a34811> DB 220,63 ; fdivrl (%rdi) DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) @@ -29026,16 +29235,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 6814 <.literal16+0x7d4> + DB 127,0 ; jg 68b4 <.literal16+0x7d4> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 6818 <.literal16+0x7d8> + DB 127,0 ; jg 68b8 <.literal16+0x7d8> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 681c <.literal16+0x7dc> + DB 127,0 ; jg 68bc <.literal16+0x7dc> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 6820 <.literal16+0x7e0> + DB 127,0 ; jg 68c0 <.literal16+0x7e0> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -29044,7 +29253,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 68a5 <.literal16+0x865> + DB 119,115 ; ja 6945 <.literal16+0x865> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -29055,7 +29264,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 6809 <.literal16+0x7c9> + DB 117,191 ; jne 68a9 <.literal16+0x7c9> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -29067,7 +29276,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a3a84a <_sk_callback_sse2+0xffffffffe9a348e2> + DB 233,220,63,163,233 ; jmpq ffffffffe9a3a8ea <_sk_callback_sse2+0xffffffffe9a348e1> DB 220,63 ; fdivrl (%rdi) DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) @@ -29121,16 +29330,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 68e4 <.literal16+0x8a4> + DB 127,0 ; jg 6984 <.literal16+0x8a4> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 68e8 <.literal16+0x8a8> + DB 127,0 ; jg 6988 <.literal16+0x8a8> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 68ec <.literal16+0x8ac> + DB 127,0 ; jg 698c <.literal16+0x8ac> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 68f0 <.literal16+0x8b0> + DB 127,0 ; jg 6990 <.literal16+0x8b0> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -29139,7 +29348,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 6975 <.literal16+0x935> + DB 119,115 ; ja 6a15 <.literal16+0x935> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -29150,7 +29359,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 68d9 <.literal16+0x899> + DB 117,191 ; jne 6979 <.literal16+0x899> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -29162,7 +29371,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a3a91a <_sk_callback_sse2+0xffffffffe9a349b2> + DB 233,220,63,163,233 ; jmpq ffffffffe9a3a9ba <_sk_callback_sse2+0xffffffffe9a349b1> DB 220,63 ; fdivrl (%rdi) DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) @@ -29212,13 +29421,13 @@ ALIGN 16 DB 200,66,0,0 ; enterq $0x42,$0x0 DB 200,66,0,0 ; enterq $0x42,$0x0 DB 200,66,0,0 ; enterq $0x42,$0x0 - DB 127,67 ; jg 69f7 <.literal16+0x9b7> + DB 127,67 ; jg 6a97 <.literal16+0x9b7> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 69fb <.literal16+0x9bb> + DB 127,67 ; jg 6a9b <.literal16+0x9bb> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 69ff <.literal16+0x9bf> + DB 127,67 ; jg 6a9f <.literal16+0x9bf> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6a03 <.literal16+0x9c3> + DB 127,67 ; jg 6aa3 <.literal16+0x9c3> DB 0,0 ; add %al,(%rax) DB 0,195 ; add %al,%bl DB 0,0 ; add %al,(%rax) @@ -29265,16 +29474,16 @@ ALIGN 16 DB 128,3,62 ; addb $0x3e,(%rbx) DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 6a83 <.literal16+0xa43> + DB 118,63 ; jbe 6b23 <.literal16+0xa43> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 6a87 <.literal16+0xa47> + DB 118,63 ; jbe 6b27 <.literal16+0xa47> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 6a8b <.literal16+0xa4b> + DB 118,63 ; jbe 6b2b <.literal16+0xa4b> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 6a8f <.literal16+0xa4f> + DB 118,63 ; jbe 6b2f <.literal16+0xa4f> DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 246,64,83,63 ; testb $0x3f,0x53(%rax) @@ -29303,11 +29512,11 @@ ALIGN 16 DB 128,59,0 ; cmpb $0x0,(%rbx) DB 0,127,67 ; add %bh,0x43(%rdi) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6afb <.literal16+0xabb> + DB 127,67 ; jg 6b9b <.literal16+0xabb> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6aff <.literal16+0xabf> + DB 127,67 ; jg 6b9f <.literal16+0xabf> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6b03 <.literal16+0xac3> + DB 127,67 ; jg 6ba3 <.literal16+0xac3> DB 255,0 ; incl (%rax) DB 0,0 ; add %al,(%rax) DB 255,0 ; incl (%rax) @@ -29378,13 +29587,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 6b99 <.literal16+0xb59> + DB 224,7 ; loopne 6c39 <.literal16+0xb59> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6b9d <.literal16+0xb5d> + DB 224,7 ; loopne 6c3d <.literal16+0xb5d> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6ba1 <.literal16+0xb61> + DB 224,7 ; loopne 6c41 <.literal16+0xb61> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6ba5 <.literal16+0xb65> + DB 224,7 ; loopne 6c45 <.literal16+0xb65> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -29430,13 +29639,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 6c09 <.literal16+0xbc9> + DB 224,7 ; loopne 6ca9 <.literal16+0xbc9> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6c0d <.literal16+0xbcd> + DB 224,7 ; loopne 6cad <.literal16+0xbcd> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6c11 <.literal16+0xbd1> + DB 224,7 ; loopne 6cb1 <.literal16+0xbd1> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6c15 <.literal16+0xbd5> + DB 224,7 ; loopne 6cb5 <.literal16+0xbd5> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -29482,13 +29691,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 6c79 <.literal16+0xc39> + DB 224,7 ; loopne 6d19 <.literal16+0xc39> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6c7d <.literal16+0xc3d> + DB 224,7 ; loopne 6d1d <.literal16+0xc3d> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6c81 <.literal16+0xc41> + DB 224,7 ; loopne 6d21 <.literal16+0xc41> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6c85 <.literal16+0xc45> + DB 224,7 ; loopne 6d25 <.literal16+0xc45> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -29526,13 +29735,13 @@ ALIGN 16 DB 65,0,0 ; add %al,(%r8) DB 248 ; clc DB 65,0,0 ; add %al,(%r8) - DB 124,66 ; jl 6d16 <.literal16+0xcd6> + DB 124,66 ; jl 6db6 <.literal16+0xcd6> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 6d1a <.literal16+0xcda> + DB 124,66 ; jl 6dba <.literal16+0xcda> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 6d1e <.literal16+0xcde> + DB 124,66 ; jl 6dbe <.literal16+0xcde> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 6d22 <.literal16+0xce2> + DB 124,66 ; jl 6dc2 <.literal16+0xce2> DB 0,240 ; add %dh,%al DB 0,0 ; add %al,(%rax) DB 0,240 ; add %dh,%al @@ -29666,13 +29875,13 @@ ALIGN 16 DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax) DB 61,137,136,136,61 ; cmp $0x3d888889,%eax DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 6ea5 <.literal16+0xe65> + DB 112,65 ; jo 6f45 <.literal16+0xe65> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 6ea9 <.literal16+0xe69> + DB 112,65 ; jo 6f49 <.literal16+0xe69> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 6ead <.literal16+0xe6d> + DB 112,65 ; jo 6f4d <.literal16+0xe6d> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 6eb1 <.literal16+0xe71> + DB 112,65 ; jo 6f51 <.literal16+0xe71> DB 255,0 ; incl (%rax) DB 0,0 ; add %al,(%rax) DB 255,0 ; incl (%rax) @@ -29703,11 +29912,11 @@ ALIGN 16 DB 128,59,129 ; cmpb $0x81,(%rbx) DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%rax) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6f1b <.literal16+0xedb> + DB 127,67 ; jg 6fbb <.literal16+0xedb> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6f1f <.literal16+0xedf> + DB 127,67 ; jg 6fbf <.literal16+0xedf> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6f23 <.literal16+0xee3> + DB 127,67 ; jg 6fc3 <.literal16+0xee3> DB 255,0 ; incl (%rax) DB 0,0 ; add %al,(%rax) DB 255,0 ; incl (%rax) @@ -29738,11 +29947,11 @@ ALIGN 16 DB 128,59,129 ; cmpb $0x81,(%rbx) DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%rax) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6f8b <.literal16+0xf4b> + DB 127,67 ; jg 702b <.literal16+0xf4b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6f8f <.literal16+0xf4f> + DB 127,67 ; jg 702f <.literal16+0xf4f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6f93 <.literal16+0xf53> + DB 127,67 ; jg 7033 <.literal16+0xf53> DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax) DB 0,0 ; add %al,(%rax) DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax) @@ -29838,13 +30047,13 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 255 ; (bad) - DB 127,71 ; jg 70bb <.literal16+0x107b> + DB 127,71 ; jg 715b <.literal16+0x107b> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 70bf <.literal16+0x107f> + DB 127,71 ; jg 715f <.literal16+0x107f> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 70c3 <.literal16+0x1083> + DB 127,71 ; jg 7163 <.literal16+0x1083> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 70c7 <.literal16+0x1087> + DB 127,71 ; jg 7167 <.literal16+0x1087> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -29921,10 +30130,10 @@ ALIGN 16 DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax DB 152 ; cwtl DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx) - DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc0825a <_sk_callback_sse2+0x2dc022f2> + DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc082fa <_sk_callback_sse2+0x2dc022f1> DB 17,192 ; adc %eax,%eax DB 45,16,17,192,18 ; sub $0x12c01110,%eax - DB 120,57 ; js 718c <.literal16+0x114c> + DB 120,57 ; js 722c <.literal16+0x114c> DB 64,18,120,57 ; adc 0x39(%rax),%dil DB 64,18,120,57 ; adc 0x39(%rax),%dil DB 64,18,120,57 ; adc 0x39(%rax),%dil @@ -30015,7 +30224,25 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) - DB 0,63 ; add %bh,(%rdi) + DB 0,192 ; add %al,%al + DB 0,0 ; add %al,(%rax) + DB 0,192 ; add %al,%al + DB 0,0 ; add %al,(%rax) + DB 0,192 ; add %al,%al + DB 0,0 ; add %al,(%rax) + DB 0,192 ; add %al,%al + DB 0,0 ; add %al,(%rax) + DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax) + DB 0,0 ; add %al,(%rax) + DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax) + DB 0,0 ; add %al,(%rax) + DB 128,63,0 ; cmpb $0x0,(%rdi) + DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) + DB 63 ; (bad) + DB 0,0 ; add %al,(%rax) + DB 128,63,0 ; cmpb $0x0,(%rdi) + DB 0,0 ; add %al,(%rax) + DB 63 ; (bad) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -30075,11 +30302,11 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 128,63,114 ; cmpb $0x72,(%rdi) DB 28,199 ; sbb $0xc7,%al - DB 62,114,28 ; jb,pt 7312 <.literal16+0x12d2> + DB 62,114,28 ; jb,pt 73e2 <.literal16+0x1302> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 7316 <.literal16+0x12d6> + DB 62,114,28 ; jb,pt 73e6 <.literal16+0x1306> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 731a <.literal16+0x12da> + DB 62,114,28 ; jb,pt 73ea <.literal16+0x130a> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -30123,7 +30350,7 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d6401a5 <_sk_callback_sse2+0x3d63a23d> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640275 <_sk_callback_sse2+0x3d63a26c> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -30149,7 +30376,7 @@ ALIGN 16 DB 0,192 ; add %al,%al DB 63 ; (bad) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d6401e5 <_sk_callback_sse2+0x3d63a27d> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d6402b5 <_sk_callback_sse2+0x3d63a2ac> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al @@ -30158,13 +30385,13 @@ ALIGN 16 DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al DB 63 ; (bad) - DB 114,28 ; jb 73de <.literal16+0x139e> + DB 114,28 ; jb 74ae <.literal16+0x13ce> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 73e2 <.literal16+0x13a2> + DB 62,114,28 ; jb,pt 74b2 <.literal16+0x13d2> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 73e6 <.literal16+0x13a6> + DB 62,114,28 ; jb,pt 74b6 <.literal16+0x13d6> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 73ea <.literal16+0x13aa> + DB 62,114,28 ; jb,pt 74ba <.literal16+0x13da> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -30185,11 +30412,11 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 128,63,114 ; cmpb $0x72,(%rdi) DB 28,199 ; sbb $0xc7,%al - DB 62,114,28 ; jb,pt 7422 <.literal16+0x13e2> + DB 62,114,28 ; jb,pt 74f2 <.literal16+0x1412> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 7426 <.literal16+0x13e6> + DB 62,114,28 ; jb,pt 74f6 <.literal16+0x1416> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 742a <.literal16+0x13ea> + DB 62,114,28 ; jb,pt 74fa <.literal16+0x141a> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -30233,7 +30460,7 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d6402b5 <_sk_callback_sse2+0x3d63a34d> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640385 <_sk_callback_sse2+0x3d63a37c> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -30259,7 +30486,7 @@ ALIGN 16 DB 0,192 ; add %al,%al DB 63 ; (bad) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d6402f5 <_sk_callback_sse2+0x3d63a38d> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d6403c5 <_sk_callback_sse2+0x3d63a3bc> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al @@ -30268,13 +30495,13 @@ ALIGN 16 DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al DB 63 ; (bad) - DB 114,28 ; jb 74ee <.literal16+0x14ae> + DB 114,28 ; jb 75be <.literal16+0x14de> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 74f2 <_sk_callback_sse2+0x158a> + DB 62,114,28 ; jb,pt 75c2 <_sk_callback_sse2+0x15b9> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 74f6 <_sk_callback_sse2+0x158e> + DB 62,114,28 ; jb,pt 75c6 <_sk_callback_sse2+0x15bd> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 74fa <_sk_callback_sse2+0x1592> + DB 62,114,28 ; jb,pt 75ca <_sk_callback_sse2+0x15c1> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) diff --git a/src/jumper/SkJumper_stages.cpp b/src/jumper/SkJumper_stages.cpp index ca004cabfc..10aa9a57f4 100644 --- a/src/jumper/SkJumper_stages.cpp +++ b/src/jumper/SkJumper_stages.cpp @@ -1208,7 +1208,7 @@ STAGE(xy_to_radius) { r = sqrt_(X2 + Y2); } -STAGE(xy_to_2pt_conical) { +STAGE(xy_to_2pt_conical_quadratic) { auto* c = (const SkJumper_2PtConicalCtx*)ctx; // At this point, (x, y) is mapped into a synthetic gradient space with @@ -1255,6 +1255,31 @@ STAGE(xy_to_2pt_conical) { (-coeffB - sqrt_disc) * invCoeffA * .5f); } +STAGE(xy_to_2pt_conical_linear) { + auto* c = (SkJumper_2PtConicalCtx*)ctx; + + const F coeffB = -2 * (r + c->fDR * c->fR0), + coeffC = r * r + g * g - c->fR0 * c->fR0; + + r = -coeffC / coeffB; + + // Compute and save a mask for degenerate values. + g = 1.0f; + g = if_then_else(mad(r, c->fDR, c->fR0) < 0, F(0), g); // R(t) < 0 + g = if_then_else(r != r , F(0), g); // NaN + + unaligned_store(&c->fMask, g); +} + +STAGE(vector_scale) { + const F scale = unaligned_load<F>((const float*)ctx); + + r = r * scale; + g = g * scale; + b = b * scale; + a = a * scale; +} + STAGE(save_xy) { auto c = (SkJumper_SamplerCtx*)ctx; diff --git a/src/shaders/gradients/SkGradientShader.cpp b/src/shaders/gradients/SkGradientShader.cpp index 9d4a250b46..40da6940fe 100644 --- a/src/shaders/gradients/SkGradientShader.cpp +++ b/src/shaders/gradients/SkGradientShader.cpp @@ -375,8 +375,9 @@ bool SkGradientShaderBase::onAppendStages(SkRasterPipeline* p, return false; } - SkRasterPipeline_<256> subclass; - if (!this->adjustMatrixAndAppendStages(alloc, &matrix, &subclass)) { + SkRasterPipeline_<256> tPipeline; + SkRasterPipeline_<256> postPipeline; + if (!this->adjustMatrixAndAppendStages(alloc, &matrix, &tPipeline, &postPipeline)) { return this->INHERITED::onAppendStages(p, dstCS, alloc, ctm, paint, localM); } @@ -390,7 +391,7 @@ bool SkGradientShaderBase::onAppendStages(SkRasterPipeline* p, p->append(SkRasterPipeline::matrix_perspective, m); } - p->extend(subclass); + p->extend(tPipeline); switch(fTileMode) { case kMirror_TileMode: p->append(SkRasterPipeline::mirror_x_1); break; @@ -496,6 +497,8 @@ bool SkGradientShaderBase::onAppendStages(SkRasterPipeline* p, p->append(SkRasterPipeline::premul); } + p->extend(postPipeline); + return true; } diff --git a/src/shaders/gradients/SkGradientShaderPriv.h b/src/shaders/gradients/SkGradientShaderPriv.h index 3322982708..6e6e7df074 100644 --- a/src/shaders/gradients/SkGradientShaderPriv.h +++ b/src/shaders/gradients/SkGradientShaderPriv.h @@ -239,7 +239,10 @@ protected: virtual bool adjustMatrixAndAppendStages(SkArenaAlloc* alloc, SkMatrix* matrix, - SkRasterPipeline* p) const { return false; } + SkRasterPipeline* tPipeline, + SkRasterPipeline* postPipeline) const { + return false; + } template <typename T, typename... Args> static Context* CheckedMakeContext(SkArenaAlloc* alloc, Args&&... args) { diff --git a/src/shaders/gradients/SkLinearGradient.cpp b/src/shaders/gradients/SkLinearGradient.cpp index d6875ce691..9863b92179 100644 --- a/src/shaders/gradients/SkLinearGradient.cpp +++ b/src/shaders/gradients/SkLinearGradient.cpp @@ -81,7 +81,8 @@ SkShaderBase::Context* SkLinearGradient::onMakeBurstPipelineContext( bool SkLinearGradient::adjustMatrixAndAppendStages(SkArenaAlloc* alloc, SkMatrix* matrix, - SkRasterPipeline* p) const { + SkRasterPipeline* p, + SkRasterPipeline*) const { *matrix = SkMatrix::Concat(fPtsToUnit, *matrix); // If the gradient is less than a quarter of a pixel, this falls into the // subpixel gradient code handled on a different path. diff --git a/src/shaders/gradients/SkLinearGradient.h b/src/shaders/gradients/SkLinearGradient.h index caa8100c86..abc3e0d692 100644 --- a/src/shaders/gradients/SkLinearGradient.h +++ b/src/shaders/gradients/SkLinearGradient.h @@ -66,7 +66,8 @@ protected: bool adjustMatrixAndAppendStages(SkArenaAlloc* alloc, SkMatrix* matrix, - SkRasterPipeline* p) const final; + SkRasterPipeline* tPipeline, + SkRasterPipeline* postPipeline) const final; sk_sp<SkShader> onMakeColorSpace(SkColorSpaceXformer* xformer) const override; diff --git a/src/shaders/gradients/SkRadialGradient.cpp b/src/shaders/gradients/SkRadialGradient.cpp index 8e12c88f04..7142b5898e 100644 --- a/src/shaders/gradients/SkRadialGradient.cpp +++ b/src/shaders/gradients/SkRadialGradient.cpp @@ -382,7 +382,8 @@ sk_sp<SkShader> SkRadialGradient::onMakeColorSpace(SkColorSpaceXformer* xformer) bool SkRadialGradient::adjustMatrixAndAppendStages(SkArenaAlloc* alloc, SkMatrix* matrix, - SkRasterPipeline* p) const { + SkRasterPipeline* p, + SkRasterPipeline*) const { matrix->postTranslate(-fCenter.fX, -fCenter.fY); matrix->postScale(1/fRadius, 1/fRadius); diff --git a/src/shaders/gradients/SkRadialGradient.h b/src/shaders/gradients/SkRadialGradient.h index 69ec4b1285..c0353cf153 100644 --- a/src/shaders/gradients/SkRadialGradient.h +++ b/src/shaders/gradients/SkRadialGradient.h @@ -40,7 +40,8 @@ protected: bool adjustMatrixAndAppendStages(SkArenaAlloc* alloc, SkMatrix* matrix, - SkRasterPipeline* p) const final; + SkRasterPipeline* tPipeline, + SkRasterPipeline* postPipeline) const final; private: const SkPoint fCenter; diff --git a/src/shaders/gradients/SkSweepGradient.cpp b/src/shaders/gradients/SkSweepGradient.cpp index 58e34fdaa6..64a0218540 100644 --- a/src/shaders/gradients/SkSweepGradient.cpp +++ b/src/shaders/gradients/SkSweepGradient.cpp @@ -301,7 +301,8 @@ void SkSweepGradient::toString(SkString* str) const { bool SkSweepGradient::adjustMatrixAndAppendStages(SkArenaAlloc* alloc, SkMatrix* matrix, - SkRasterPipeline* p) const { + SkRasterPipeline* p, + SkRasterPipeline*) const { matrix->postTranslate(-fCenter.fX, -fCenter.fY); p->append(SkRasterPipeline::xy_to_unit_angle); diff --git a/src/shaders/gradients/SkSweepGradient.h b/src/shaders/gradients/SkSweepGradient.h index b7ed7e5bb9..599b833868 100644 --- a/src/shaders/gradients/SkSweepGradient.h +++ b/src/shaders/gradients/SkSweepGradient.h @@ -40,7 +40,8 @@ protected: bool adjustMatrixAndAppendStages(SkArenaAlloc* alloc, SkMatrix* matrix, - SkRasterPipeline* p) const final; + SkRasterPipeline* tPipeline, + SkRasterPipeline* postPipeline) const final; bool isRasterPipelineOnly() const final; diff --git a/src/shaders/gradients/SkTwoPointConicalGradient.cpp b/src/shaders/gradients/SkTwoPointConicalGradient.cpp index d33fbac868..0f48cc20e3 100644 --- a/src/shaders/gradients/SkTwoPointConicalGradient.cpp +++ b/src/shaders/gradients/SkTwoPointConicalGradient.cpp @@ -428,7 +428,8 @@ void SkTwoPointConicalGradient::toString(SkString* str) const { bool SkTwoPointConicalGradient::adjustMatrixAndAppendStages(SkArenaAlloc* alloc, SkMatrix* matrix, - SkRasterPipeline* p) const { + SkRasterPipeline* p, + SkRasterPipeline* postPipeline) const { const auto dCenter = (fCenter1 - fCenter2).length(); const auto dRadius = fRadius2 - fRadius1; SkASSERT(dRadius >= 0); @@ -468,17 +469,21 @@ bool SkTwoPointConicalGradient::adjustMatrixAndAppendStages(SkArenaAlloc* alloc, // Since we've squashed the centers into a unit vector, we must also scale // all the coefficient variables by (1 / dCenter). const auto coeffA = 1 - dRadius * dRadius / (dCenter * dCenter); - if (SkScalarNearlyZero(coeffA)) { - // We only handle well behaved quadratic cases for now. - return false; - } - auto* ctx = alloc->make<SkJumper_2PtConicalCtx>(); ctx->fCoeffA = coeffA; ctx->fInvCoeffA = 1 / coeffA; ctx->fR0 = fRadius1 / dCenter; ctx->fDR = dRadius / dCenter; - p->append(SkRasterPipeline::xy_to_2pt_conical, ctx); + if (SkScalarNearlyZero(coeffA)) { + // The focal point is on the edge of the end circle. + p->append(SkRasterPipeline::xy_to_2pt_conical_linear, ctx); + // To handle degenerate values (NaN, r < 0), the t stage sets up a scale/mask + // context, which we post-apply to force transparent black. + postPipeline->append(SkRasterPipeline::vector_scale, &ctx->fMask); + } else { + p->append(SkRasterPipeline::xy_to_2pt_conical_quadratic, ctx); + } + return true; } diff --git a/src/shaders/gradients/SkTwoPointConicalGradient.h b/src/shaders/gradients/SkTwoPointConicalGradient.h index 8b61b8e9d2..3c50055405 100644 --- a/src/shaders/gradients/SkTwoPointConicalGradient.h +++ b/src/shaders/gradients/SkTwoPointConicalGradient.h @@ -81,7 +81,8 @@ protected: bool adjustMatrixAndAppendStages(SkArenaAlloc* alloc, SkMatrix* matrix, - SkRasterPipeline* p) const final; + SkRasterPipeline* tPipeline, + SkRasterPipeline* postPipeline) const final; private: SkPoint fCenter1; |