diff options
Diffstat (limited to 'src/jumper/SkJumper_generated.S')
-rw-r--r-- | src/jumper/SkJumper_generated.S | 3950 |
1 files changed, 2255 insertions, 1695 deletions
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S index 4d755b69e0..40dee85487 100644 --- a/src/jumper/SkJumper_generated.S +++ b/src/jumper/SkJumper_generated.S @@ -1236,6 +1236,52 @@ _sk_luminosity_aarch64: .long 0x4eb0d703 // fsub v3.4s, v24.4s, v16.4s .long 0xd61f0060 // br x3 +HIDDEN _sk_srcover_rgba_8888_aarch64 +.globl _sk_srcover_rgba_8888_aarch64 +FUNCTION(_sk_srcover_rgba_8888_aarch64) +_sk_srcover_rgba_8888_aarch64: + .long 0xf9400028 // ldr x8, [x1] + .long 0xd37ef409 // lsl x9, x0, #2 + .long 0x6f00e625 // movi v5.2d, #0xff000000ff + .long 0x4f03f604 // fmov v4.4s, #1.000000000000000000e+00 + .long 0xf9400108 // ldr x8, [x8] + .long 0x52a86fea // mov w10, #0x437f0000 + .long 0x4ea3d490 // fsub v16.4s, v4.4s, v3.4s + .long 0x4e040d44 // dup v4.4s, w10 + .long 0x3ce96906 // ldr q6, [x8, x9] + .long 0x6e24dc00 // fmul v0.4s, v0.4s, v4.4s + .long 0x6e24dc21 // fmul v1.4s, v1.4s, v4.4s + .long 0x6e24dc42 // fmul v2.4s, v2.4s, v4.4s + .long 0x6f3804c7 // ushr v7.4s, v6.4s, #8 + .long 0x6f3004d1 // ushr v17.4s, v6.4s, #16 + .long 0x4e251cf2 // and v18.16b, v7.16b, v5.16b + .long 0x6e24dc63 // fmul v3.4s, v3.4s, v4.4s + .long 0x4e251cc4 // and v4.16b, v6.16b, v5.16b + .long 0x4e251e31 // and v17.16b, v17.16b, v5.16b + .long 0x4e21da45 // scvtf v5.4s, v18.4s + .long 0x6f2804c6 // ushr v6.4s, v6.4s, #24 + .long 0x4e21d884 // scvtf v4.4s, v4.4s + .long 0x4e25ce01 // fmla v1.4s, v16.4s, v5.4s + .long 0x4e21d8c7 // scvtf v7.4s, v6.4s + .long 0x4e21da26 // scvtf v6.4s, v17.4s + .long 0x4e24ce00 // fmla v0.4s, v16.4s, v4.4s + .long 0x6e21a831 // fcvtnu v17.4s, v1.4s + .long 0x4e27ce03 // fmla v3.4s, v16.4s, v7.4s + .long 0x4e26ce02 // fmla v2.4s, v16.4s, v6.4s + .long 0x6e21a810 // fcvtnu v16.4s, v0.4s + .long 0x4f285631 // shl v17.4s, v17.4s, #8 + .long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b + .long 0x6e21a851 // fcvtnu v17.4s, v2.4s + .long 0x4f305631 // shl v17.4s, v17.4s, #16 + .long 0x4eb11e10 // orr v16.16b, v16.16b, v17.16b + .long 0x6e21a871 // fcvtnu v17.4s, v3.4s + .long 0x4f385631 // shl v17.4s, v17.4s, #24 + .long 0x4eb11e10 // orr v16.16b, v16.16b, v17.16b + .long 0x3ca96910 // str q16, [x8, x9] + .long 0xf9400423 // ldr x3, [x1, #8] + .long 0x91004021 // add x1, x1, #0x10 + .long 0xd61f0060 // br x3 + HIDDEN _sk_clamp_0_aarch64 .globl _sk_clamp_0_aarch64 FUNCTION(_sk_clamp_0_aarch64) @@ -2706,9 +2752,9 @@ FUNCTION(_sk_gather_i8_aarch64) _sk_gather_i8_aarch64: .long 0xaa0103e8 // mov x8, x1 .long 0xf8408429 // ldr x9, [x1], #8 - .long 0xb4000069 // cbz x9, 2444 <sk_gather_i8_aarch64+0x14> + .long 0xb4000069 // cbz x9, 24e8 <sk_gather_i8_aarch64+0x14> .long 0xaa0903ea // mov x10, x9 - .long 0x14000003 // b 244c <sk_gather_i8_aarch64+0x1c> + .long 0x14000003 // b 24f0 <sk_gather_i8_aarch64+0x1c> .long 0xf940050a // ldr x10, [x8, #8] .long 0x91004101 // add x1, x8, #0x10 .long 0xf8410548 // ldr x8, [x10], #16 @@ -3734,7 +3780,7 @@ _sk_gradient_aarch64: .long 0x6f00e411 // movi v17.2d, #0x0 .long 0xf9400109 // ldr x9, [x8] .long 0xf100093f // cmp x9, #0x2 - .long 0x540001c3 // b.cc 31c4 <sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last + .long 0x540001c3 // b.cc 3268 <sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last .long 0xf940250a // ldr x10, [x8, #72] .long 0xd1000529 // sub x9, x9, #0x1 .long 0x6f00e401 // movi v1.2d, #0x0 @@ -3745,7 +3791,7 @@ _sk_gradient_aarch64: .long 0x6e23e403 // fcmge v3.4s, v0.4s, v3.4s .long 0x4e221c63 // and v3.16b, v3.16b, v2.16b .long 0x4ea18461 // add v1.4s, v3.4s, v1.4s - .long 0xb5ffff69 // cbnz x9, 31a4 <sk_gradient_aarch64+0x38> + .long 0xb5ffff69 // cbnz x9, 3248 <sk_gradient_aarch64+0x38> .long 0x6f20a431 // uxtl2 v17.2d, v1.4s .long 0x2f20a421 // uxtl v1.2d, v1.2s .long 0xa940b10a // ldp x10, x12, [x8, #8] @@ -5609,6 +5655,59 @@ _sk_luminosity_vfp4: .long 0x3de147ae // .word 0x3de147ae .long 0x3de147ae // .word 0x3de147ae +HIDDEN _sk_srcover_rgba_8888_vfp4 +.globl _sk_srcover_rgba_8888_vfp4 +FUNCTION(_sk_srcover_rgba_8888_vfp4) +_sk_srcover_rgba_8888_vfp4: + .long 0xe5913000 // ldr r3, [r1] + .long 0xf2c72f10 // vmov.f32 d18, #1 + .long 0xf3c7101f // vmov.i32 d17, #255 + .long 0xeddf6b29 // vldr d22, [pc, #164] + .long 0xf2622d83 // vsub.f32 d18, d18, d3 + .long 0xe5933000 // ldr r3, [r3] + .long 0xf3033d36 // vmul.f32 d3, d3, d22 + .long 0xf3011d36 // vmul.f32 d1, d1, d22 + .long 0xe0833100 // add r3, r3, r0, lsl #2 + .long 0xf3000d36 // vmul.f32 d0, d0, d22 + .long 0xf3022d36 // vmul.f32 d2, d2, d22 + .long 0xedd30b00 // vldr d16, [r3] + .long 0xf3f83030 // vshr.u32 d19, d16, #8 + .long 0xf3e84030 // vshr.u32 d20, d16, #24 + .long 0xf3f05030 // vshr.u32 d21, d16, #16 + .long 0xf24331b1 // vand d19, d19, d17 + .long 0xf3bb7624 // vcvt.f32.s32 d7, d20 + .long 0xf24001b1 // vand d16, d16, d17 + .long 0xf24511b1 // vand d17, d21, d17 + .long 0xf3bb5623 // vcvt.f32.s32 d5, d19 + .long 0xf3bb4620 // vcvt.f32.s32 d4, d16 + .long 0xf3bb6621 // vcvt.f32.s32 d6, d17 + .long 0xf2073c32 // vfma.f32 d3, d7, d18 + .long 0xf2051c32 // vfma.f32 d1, d5, d18 + .long 0xf2040c32 // vfma.f32 d0, d4, d18 + .long 0xf2062c32 // vfma.f32 d2, d6, d18 + .long 0xf2c3061f // vmov.i32 d16, #1056964608 + .long 0xf2431d20 // vadd.f32 d17, d3, d16 + .long 0xf2413d20 // vadd.f32 d19, d1, d16 + .long 0xf2402d20 // vadd.f32 d18, d0, d16 + .long 0xf2420d20 // vadd.f32 d16, d2, d16 + .long 0xf3fb17a1 // vcvt.u32.f32 d17, d17 + .long 0xf3fb37a3 // vcvt.u32.f32 d19, d19 + .long 0xf3fb27a2 // vcvt.u32.f32 d18, d18 + .long 0xf3fb07a0 // vcvt.u32.f32 d16, d16 + .long 0xf2f81531 // vshl.s32 d17, d17, #24 + .long 0xf26111b2 // vorr d17, d17, d18 + .long 0xf2e82533 // vshl.s32 d18, d19, #8 + .long 0xf2f00530 // vshl.s32 d16, d16, #16 + .long 0xf26111b2 // vorr d17, d17, d18 + .long 0xf26101b0 // vorr d16, d17, d16 + .long 0xedc30b00 // vstr d16, [r3] + .long 0xe2813008 // add r3, r1, #8 + .long 0xe591c004 // ldr ip, [r1, #4] + .long 0xe1a01003 // mov r1, r3 + .long 0xe12fff1c // bx ip + .long 0x437f0000 // .word 0x437f0000 + .long 0x437f0000 // .word 0x437f0000 + HIDDEN _sk_clamp_0_vfp4 .globl _sk_clamp_0_vfp4 FUNCTION(_sk_clamp_0_vfp4) @@ -8331,7 +8430,7 @@ _sk_gradient_vfp4: .long 0xf2c00010 // vmov.i32 d16, #0 .long 0xe59c3000 // ldr r3, [ip] .long 0xe3530002 // cmp r3, #2 - .long 0x3a00000b // bcc 37c0 <sk_gradient_vfp4+0x50> + .long 0x3a00000b // bcc 3880 <sk_gradient_vfp4+0x50> .long 0xe59c4024 // ldr r4, [ip, #36] .long 0xf2c01010 // vmov.i32 d17, #0 .long 0xf2c02011 // vmov.i32 d18, #1 @@ -8343,7 +8442,7 @@ _sk_gradient_vfp4: .long 0xf3403e23 // vcge.f32 d19, d0, d19 .long 0xf35231b1 // vbsl d19, d18, d17 .long 0xf26308a0 // vadd.i32 d16, d19, d16 - .long 0x1afffff9 // bne 37a8 <sk_gradient_vfp4+0x38> + .long 0x1afffff9 // bne 3868 <sk_gradient_vfp4+0x38> .long 0xee303b90 // vmov.32 r3, d16[1] .long 0xe59c7010 // ldr r7, [ip, #16] .long 0xee10eb90 // vmov.32 lr, d16[0] @@ -8935,14 +9034,14 @@ _sk_seed_shader_hsw: .byte 197,249,110,199 // vmovd %edi,%xmm0 .byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,1,72,0,0 // vbroadcastss 0x4801(%rip),%ymm1 # 48c4 <_sk_callback_hsw+0x126> + .byte 196,226,125,24,13,29,73,0,0 // vbroadcastss 0x491d(%rip),%ymm1 # 49e0 <_sk_callback_hsw+0x126> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,88,2 // vaddps (%rdx),%ymm0,%ymm0 .byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,21,229,71,0,0 // vbroadcastss 0x47e5(%rip),%ymm2 # 48c8 <_sk_callback_hsw+0x12a> + .byte 196,226,125,24,21,1,73,0,0 // vbroadcastss 0x4901(%rip),%ymm2 # 49e4 <_sk_callback_hsw+0x12a> .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 @@ -8961,13 +9060,13 @@ _sk_dither_hsw: .byte 76,139,0 // mov (%rax),%r8 .byte 196,66,125,88,8 // vpbroadcastd (%r8),%ymm9 .byte 196,65,61,239,201 // vpxor %ymm9,%ymm8,%ymm9 - .byte 196,98,125,88,21,173,71,0,0 // vpbroadcastd 0x47ad(%rip),%ymm10 # 48cc <_sk_callback_hsw+0x12e> + .byte 196,98,125,88,21,201,72,0,0 // vpbroadcastd 0x48c9(%rip),%ymm10 # 49e8 <_sk_callback_hsw+0x12e> .byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11 .byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11 .byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10 .byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10 - .byte 196,98,125,88,37,146,71,0,0 // vpbroadcastd 0x4792(%rip),%ymm12 # 48d0 <_sk_callback_hsw+0x132> - .byte 196,98,125,88,45,141,71,0,0 // vpbroadcastd 0x478d(%rip),%ymm13 # 48d4 <_sk_callback_hsw+0x136> + .byte 196,98,125,88,37,174,72,0,0 // vpbroadcastd 0x48ae(%rip),%ymm12 # 49ec <_sk_callback_hsw+0x132> + .byte 196,98,125,88,45,169,72,0,0 // vpbroadcastd 0x48a9(%rip),%ymm13 # 49f0 <_sk_callback_hsw+0x136> .byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14 .byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14 .byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13 @@ -8982,8 +9081,8 @@ _sk_dither_hsw: .byte 196,65,13,235,201 // vpor %ymm9,%ymm14,%ymm9 .byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,63,71,0,0 // vbroadcastss 0x473f(%rip),%ymm9 # 48d8 <_sk_callback_hsw+0x13a> - .byte 196,98,125,24,21,58,71,0,0 // vbroadcastss 0x473a(%rip),%ymm10 # 48dc <_sk_callback_hsw+0x13e> + .byte 196,98,125,24,13,91,72,0,0 // vbroadcastss 0x485b(%rip),%ymm9 # 49f4 <_sk_callback_hsw+0x13a> + .byte 196,98,125,24,21,86,72,0,0 // vbroadcastss 0x4856(%rip),%ymm10 # 49f8 <_sk_callback_hsw+0x13e> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 196,98,125,24,64,8 // vbroadcastss 0x8(%rax),%ymm8 .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 @@ -9052,7 +9151,7 @@ HIDDEN _sk_srcatop_hsw FUNCTION(_sk_srcatop_hsw) _sk_srcatop_hsw: .byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0 - .byte 196,98,125,24,5,145,70,0,0 // vbroadcastss 0x4691(%rip),%ymm8 # 48e0 <_sk_callback_hsw+0x142> + .byte 196,98,125,24,5,173,71,0,0 // vbroadcastss 0x47ad(%rip),%ymm8 # 49fc <_sk_callback_hsw+0x142> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0 .byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1 @@ -9068,7 +9167,7 @@ HIDDEN _sk_dstatop_hsw .globl _sk_dstatop_hsw FUNCTION(_sk_dstatop_hsw) _sk_dstatop_hsw: - .byte 196,98,125,24,5,100,70,0,0 // vbroadcastss 0x4664(%rip),%ymm8 # 48e4 <_sk_callback_hsw+0x146> + .byte 196,98,125,24,5,128,71,0,0 // vbroadcastss 0x4780(%rip),%ymm8 # 4a00 <_sk_callback_hsw+0x146> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0 @@ -9107,7 +9206,7 @@ HIDDEN _sk_srcout_hsw .globl _sk_srcout_hsw FUNCTION(_sk_srcout_hsw) _sk_srcout_hsw: - .byte 196,98,125,24,5,11,70,0,0 // vbroadcastss 0x460b(%rip),%ymm8 # 48e8 <_sk_callback_hsw+0x14a> + .byte 196,98,125,24,5,39,71,0,0 // vbroadcastss 0x4727(%rip),%ymm8 # 4a04 <_sk_callback_hsw+0x14a> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -9120,7 +9219,7 @@ HIDDEN _sk_dstout_hsw .globl _sk_dstout_hsw FUNCTION(_sk_dstout_hsw) _sk_dstout_hsw: - .byte 196,226,125,24,5,238,69,0,0 // vbroadcastss 0x45ee(%rip),%ymm0 # 48ec <_sk_callback_hsw+0x14e> + .byte 196,226,125,24,5,10,71,0,0 // vbroadcastss 0x470a(%rip),%ymm0 # 4a08 <_sk_callback_hsw+0x14e> .byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3 .byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0 .byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1 @@ -9133,7 +9232,7 @@ HIDDEN _sk_srcover_hsw .globl _sk_srcover_hsw FUNCTION(_sk_srcover_hsw) _sk_srcover_hsw: - .byte 196,98,125,24,5,209,69,0,0 // vbroadcastss 0x45d1(%rip),%ymm8 # 48f0 <_sk_callback_hsw+0x152> + .byte 196,98,125,24,5,237,70,0,0 // vbroadcastss 0x46ed(%rip),%ymm8 # 4a0c <_sk_callback_hsw+0x152> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0 .byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1 @@ -9146,7 +9245,7 @@ HIDDEN _sk_dstover_hsw .globl _sk_dstover_hsw FUNCTION(_sk_dstover_hsw) _sk_dstover_hsw: - .byte 196,98,125,24,5,176,69,0,0 // vbroadcastss 0x45b0(%rip),%ymm8 # 48f4 <_sk_callback_hsw+0x156> + .byte 196,98,125,24,5,204,70,0,0 // vbroadcastss 0x46cc(%rip),%ymm8 # 4a10 <_sk_callback_hsw+0x156> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0 .byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1 @@ -9170,7 +9269,7 @@ HIDDEN _sk_multiply_hsw .globl _sk_multiply_hsw FUNCTION(_sk_multiply_hsw) _sk_multiply_hsw: - .byte 196,98,125,24,5,123,69,0,0 // vbroadcastss 0x457b(%rip),%ymm8 # 48f8 <_sk_callback_hsw+0x15a> + .byte 196,98,125,24,5,151,70,0,0 // vbroadcastss 0x4697(%rip),%ymm8 # 4a14 <_sk_callback_hsw+0x15a> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -9218,7 +9317,7 @@ HIDDEN _sk_xor__hsw .globl _sk_xor__hsw FUNCTION(_sk_xor__hsw) _sk_xor__hsw: - .byte 196,98,125,24,5,246,68,0,0 // vbroadcastss 0x44f6(%rip),%ymm8 # 48fc <_sk_callback_hsw+0x15e> + .byte 196,98,125,24,5,18,70,0,0 // vbroadcastss 0x4612(%rip),%ymm8 # 4a18 <_sk_callback_hsw+0x15e> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -9252,7 +9351,7 @@ _sk_darken_hsw: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,126,68,0,0 // vbroadcastss 0x447e(%rip),%ymm8 # 4900 <_sk_callback_hsw+0x162> + .byte 196,98,125,24,5,154,69,0,0 // vbroadcastss 0x459a(%rip),%ymm8 # 4a1c <_sk_callback_hsw+0x162> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -9277,7 +9376,7 @@ _sk_lighten_hsw: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,45,68,0,0 // vbroadcastss 0x442d(%rip),%ymm8 # 4904 <_sk_callback_hsw+0x166> + .byte 196,98,125,24,5,73,69,0,0 // vbroadcastss 0x4549(%rip),%ymm8 # 4a20 <_sk_callback_hsw+0x166> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -9305,7 +9404,7 @@ _sk_difference_hsw: .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,208,67,0,0 // vbroadcastss 0x43d0(%rip),%ymm8 # 4908 <_sk_callback_hsw+0x16a> + .byte 196,98,125,24,5,236,68,0,0 // vbroadcastss 0x44ec(%rip),%ymm8 # 4a24 <_sk_callback_hsw+0x16a> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -9327,7 +9426,7 @@ _sk_exclusion_hsw: .byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,142,67,0,0 // vbroadcastss 0x438e(%rip),%ymm8 # 490c <_sk_callback_hsw+0x16e> + .byte 196,98,125,24,5,170,68,0,0 // vbroadcastss 0x44aa(%rip),%ymm8 # 4a28 <_sk_callback_hsw+0x16e> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -9337,7 +9436,7 @@ HIDDEN _sk_colorburn_hsw .globl _sk_colorburn_hsw FUNCTION(_sk_colorburn_hsw) _sk_colorburn_hsw: - .byte 196,98,125,24,5,124,67,0,0 // vbroadcastss 0x437c(%rip),%ymm8 # 4910 <_sk_callback_hsw+0x172> + .byte 196,98,125,24,5,152,68,0,0 // vbroadcastss 0x4498(%rip),%ymm8 # 4a2c <_sk_callback_hsw+0x172> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11 .byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10 @@ -9395,7 +9494,7 @@ HIDDEN _sk_colordodge_hsw FUNCTION(_sk_colordodge_hsw) _sk_colordodge_hsw: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,13,135,66,0,0 // vbroadcastss 0x4287(%rip),%ymm9 # 4914 <_sk_callback_hsw+0x176> + .byte 196,98,125,24,13,163,67,0,0 // vbroadcastss 0x43a3(%rip),%ymm9 # 4a30 <_sk_callback_hsw+0x176> .byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9 @@ -9448,7 +9547,7 @@ HIDDEN _sk_hardlight_hsw .globl _sk_hardlight_hsw FUNCTION(_sk_hardlight_hsw) _sk_hardlight_hsw: - .byte 196,98,125,24,5,168,65,0,0 // vbroadcastss 0x41a8(%rip),%ymm8 # 4918 <_sk_callback_hsw+0x17a> + .byte 196,98,125,24,5,196,66,0,0 // vbroadcastss 0x42c4(%rip),%ymm8 # 4a34 <_sk_callback_hsw+0x17a> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -9499,7 +9598,7 @@ HIDDEN _sk_overlay_hsw .globl _sk_overlay_hsw FUNCTION(_sk_overlay_hsw) _sk_overlay_hsw: - .byte 196,98,125,24,5,224,64,0,0 // vbroadcastss 0x40e0(%rip),%ymm8 # 491c <_sk_callback_hsw+0x17e> + .byte 196,98,125,24,5,252,65,0,0 // vbroadcastss 0x41fc(%rip),%ymm8 # 4a38 <_sk_callback_hsw+0x17e> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -9560,10 +9659,10 @@ _sk_softlight_hsw: .byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8 .byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8 .byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,29,235,63,0,0 // vbroadcastss 0x3feb(%rip),%ymm11 # 4924 <_sk_callback_hsw+0x186> + .byte 196,98,125,24,29,7,65,0,0 // vbroadcastss 0x4107(%rip),%ymm11 # 4a40 <_sk_callback_hsw+0x186> .byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12 .byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8 - .byte 196,98,125,24,37,220,63,0,0 // vbroadcastss 0x3fdc(%rip),%ymm12 # 4928 <_sk_callback_hsw+0x18a> + .byte 196,98,125,24,37,248,64,0,0 // vbroadcastss 0x40f8(%rip),%ymm12 # 4a44 <_sk_callback_hsw+0x18a> .byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8 .byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14 .byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14 @@ -9573,7 +9672,7 @@ _sk_softlight_hsw: .byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15 .byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14 .byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15 - .byte 196,98,125,24,5,159,63,0,0 // vbroadcastss 0x3f9f(%rip),%ymm8 # 4920 <_sk_callback_hsw+0x182> + .byte 196,98,125,24,5,187,64,0,0 // vbroadcastss 0x40bb(%rip),%ymm8 # 4a3c <_sk_callback_hsw+0x182> .byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13 .byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0 .byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13 @@ -9686,11 +9785,11 @@ _sk_hue_hsw: .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10 .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10 .byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - .byte 196,98,125,24,53,163,61,0,0 // vbroadcastss 0x3da3(%rip),%ymm14 # 492c <_sk_callback_hsw+0x18e> - .byte 196,98,125,24,61,158,61,0,0 // vbroadcastss 0x3d9e(%rip),%ymm15 # 4930 <_sk_callback_hsw+0x192> + .byte 196,98,125,24,53,191,62,0,0 // vbroadcastss 0x3ebf(%rip),%ymm14 # 4a48 <_sk_callback_hsw+0x18e> + .byte 196,98,125,24,61,186,62,0,0 // vbroadcastss 0x3eba(%rip),%ymm15 # 4a4c <_sk_callback_hsw+0x192> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13 - .byte 196,226,125,24,5,143,61,0,0 // vbroadcastss 0x3d8f(%rip),%ymm0 # 4934 <_sk_callback_hsw+0x196> + .byte 196,226,125,24,5,171,62,0,0 // vbroadcastss 0x3eab(%rip),%ymm0 # 4a50 <_sk_callback_hsw+0x196> .byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13 .byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10 .byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -9745,7 +9844,7 @@ _sk_hue_hsw: .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 .byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9 .byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8 - .byte 196,226,125,24,13,124,60,0,0 // vbroadcastss 0x3c7c(%rip),%ymm1 # 4938 <_sk_callback_hsw+0x19a> + .byte 196,226,125,24,13,152,61,0,0 // vbroadcastss 0x3d98(%rip),%ymm1 # 4a54 <_sk_callback_hsw+0x19a> .byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11 @@ -9799,11 +9898,11 @@ _sk_saturation_hsw: .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10 .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10 .byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - .byte 196,98,125,24,53,147,59,0,0 // vbroadcastss 0x3b93(%rip),%ymm14 # 493c <_sk_callback_hsw+0x19e> - .byte 196,98,125,24,61,142,59,0,0 // vbroadcastss 0x3b8e(%rip),%ymm15 # 4940 <_sk_callback_hsw+0x1a2> + .byte 196,98,125,24,53,175,60,0,0 // vbroadcastss 0x3caf(%rip),%ymm14 # 4a58 <_sk_callback_hsw+0x19e> + .byte 196,98,125,24,61,170,60,0,0 // vbroadcastss 0x3caa(%rip),%ymm15 # 4a5c <_sk_callback_hsw+0x1a2> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13 - .byte 196,226,125,24,5,127,59,0,0 // vbroadcastss 0x3b7f(%rip),%ymm0 # 4944 <_sk_callback_hsw+0x1a6> + .byte 196,226,125,24,5,155,60,0,0 // vbroadcastss 0x3c9b(%rip),%ymm0 # 4a60 <_sk_callback_hsw+0x1a6> .byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13 .byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10 .byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -9858,7 +9957,7 @@ _sk_saturation_hsw: .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 .byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9 .byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8 - .byte 196,226,125,24,13,108,58,0,0 // vbroadcastss 0x3a6c(%rip),%ymm1 # 4948 <_sk_callback_hsw+0x1aa> + .byte 196,226,125,24,13,136,59,0,0 // vbroadcastss 0x3b88(%rip),%ymm1 # 4a64 <_sk_callback_hsw+0x1aa> .byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11 @@ -9886,11 +9985,11 @@ _sk_color_hsw: .byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8 .byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10 .byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11 - .byte 196,98,125,24,45,5,58,0,0 // vbroadcastss 0x3a05(%rip),%ymm13 # 494c <_sk_callback_hsw+0x1ae> - .byte 196,98,125,24,53,0,58,0,0 // vbroadcastss 0x3a00(%rip),%ymm14 # 4950 <_sk_callback_hsw+0x1b2> + .byte 196,98,125,24,45,33,59,0,0 // vbroadcastss 0x3b21(%rip),%ymm13 # 4a68 <_sk_callback_hsw+0x1ae> + .byte 196,98,125,24,53,28,59,0,0 // vbroadcastss 0x3b1c(%rip),%ymm14 # 4a6c <_sk_callback_hsw+0x1b2> .byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12 .byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12 - .byte 196,98,125,24,61,241,57,0,0 // vbroadcastss 0x39f1(%rip),%ymm15 # 4954 <_sk_callback_hsw+0x1b6> + .byte 196,98,125,24,61,13,59,0,0 // vbroadcastss 0x3b0d(%rip),%ymm15 # 4a70 <_sk_callback_hsw+0x1b6> .byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12 .byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9 .byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -9946,7 +10045,7 @@ _sk_color_hsw: .byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1 .byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8 .byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9 - .byte 196,226,125,24,5,211,56,0,0 // vbroadcastss 0x38d3(%rip),%ymm0 # 4958 <_sk_callback_hsw+0x1ba> + .byte 196,226,125,24,5,239,57,0,0 // vbroadcastss 0x39ef(%rip),%ymm0 # 4a74 <_sk_callback_hsw+0x1ba> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -9974,11 +10073,11 @@ _sk_luminosity_hsw: .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 .byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10 .byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11 - .byte 196,98,125,24,45,108,56,0,0 // vbroadcastss 0x386c(%rip),%ymm13 # 495c <_sk_callback_hsw+0x1be> - .byte 196,98,125,24,53,103,56,0,0 // vbroadcastss 0x3867(%rip),%ymm14 # 4960 <_sk_callback_hsw+0x1c2> + .byte 196,98,125,24,45,136,57,0,0 // vbroadcastss 0x3988(%rip),%ymm13 # 4a78 <_sk_callback_hsw+0x1be> + .byte 196,98,125,24,53,131,57,0,0 // vbroadcastss 0x3983(%rip),%ymm14 # 4a7c <_sk_callback_hsw+0x1c2> .byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12 .byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12 - .byte 196,98,125,24,61,88,56,0,0 // vbroadcastss 0x3858(%rip),%ymm15 # 4964 <_sk_callback_hsw+0x1c6> + .byte 196,98,125,24,61,116,57,0,0 // vbroadcastss 0x3974(%rip),%ymm15 # 4a80 <_sk_callback_hsw+0x1c6> .byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12 .byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9 .byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -10034,7 +10133,7 @@ _sk_luminosity_hsw: .byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1 .byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8 .byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9 - .byte 196,226,125,24,5,58,55,0,0 // vbroadcastss 0x373a(%rip),%ymm0 # 4968 <_sk_callback_hsw+0x1ca> + .byte 196,226,125,24,5,86,56,0,0 // vbroadcastss 0x3856(%rip),%ymm0 # 4a84 <_sk_callback_hsw+0x1ca> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -10051,6 +10150,71 @@ _sk_luminosity_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax +HIDDEN _sk_srcover_rgba_8888_hsw +.globl _sk_srcover_rgba_8888_hsw +FUNCTION(_sk_srcover_rgba_8888_hsw) +_sk_srcover_rgba_8888_hsw: + .byte 73,137,200 // mov %rcx,%r8 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9 + .byte 76,3,8 // add (%rax),%r9 + .byte 77,133,192 // test %r8,%r8 + .byte 15,133,180,0,0,0 // jne 133d <_sk_srcover_rgba_8888_hsw+0xcd> + .byte 196,193,126,111,57 // vmovdqu (%r9),%ymm7 + .byte 197,197,219,37,106,59,0,0 // vpand 0x3b6a(%rip),%ymm7,%ymm4 # 4e00 <_sk_callback_hsw+0x546> + .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 + .byte 196,226,69,0,45,125,59,0,0 // vpshufb 0x3b7d(%rip),%ymm7,%ymm5 # 4e20 <_sk_callback_hsw+0x566> + .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 + .byte 196,226,69,0,53,144,59,0,0 // vpshufb 0x3b90(%rip),%ymm7,%ymm6 # 4e40 <_sk_callback_hsw+0x586> + .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 + .byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7 + .byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7 + .byte 196,98,125,24,5,194,55,0,0 // vbroadcastss 0x37c2(%rip),%ymm8 # 4a88 <_sk_callback_hsw+0x1ce> + .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 + .byte 196,98,125,24,13,185,55,0,0 // vbroadcastss 0x37b9(%rip),%ymm9 # 4a8c <_sk_callback_hsw+0x1d2> + .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 + .byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0 + .byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1 + .byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1 + .byte 196,193,108,89,209 // vmulps %ymm9,%ymm2,%ymm2 + .byte 196,194,77,184,208 // vfmadd231ps %ymm8,%ymm6,%ymm2 + .byte 196,193,100,89,217 // vmulps %ymm9,%ymm3,%ymm3 + .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 + .byte 197,125,91,192 // vcvtps2dq %ymm0,%ymm8 + .byte 197,125,91,201 // vcvtps2dq %ymm1,%ymm9 + .byte 196,193,53,114,241,8 // vpslld $0x8,%ymm9,%ymm9 + .byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8 + .byte 197,125,91,202 // vcvtps2dq %ymm2,%ymm9 + .byte 196,193,53,114,241,16 // vpslld $0x10,%ymm9,%ymm9 + .byte 197,125,91,211 // vcvtps2dq %ymm3,%ymm10 + .byte 196,193,45,114,242,24 // vpslld $0x18,%ymm10,%ymm10 + .byte 196,65,53,235,202 // vpor %ymm10,%ymm9,%ymm9 + .byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8 + .byte 77,133,192 // test %r8,%r8 + .byte 117,53 // jne 1366 <_sk_srcover_rgba_8888_hsw+0xf6> + .byte 196,65,126,127,1 // vmovdqu %ymm8,(%r9) + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 76,137,193 // mov %r8,%rcx + .byte 255,224 // jmpq *%rax + .byte 185,8,0,0,0 // mov $0x8,%ecx + .byte 68,41,193 // sub %r8d,%ecx + .byte 192,225,3 // shl $0x3,%cl + .byte 72,199,192,255,255,255,255 // mov $0xffffffffffffffff,%rax + .byte 72,211,232 // shr %cl,%rax + .byte 196,225,249,110,224 // vmovq %rax,%xmm4 + .byte 196,226,125,33,228 // vpmovsxbd %xmm4,%ymm4 + .byte 196,194,93,140,57 // vpmaskmovd (%r9),%ymm4,%ymm7 + .byte 233,40,255,255,255 // jmpq 128e <_sk_srcover_rgba_8888_hsw+0x1e> + .byte 185,8,0,0,0 // mov $0x8,%ecx + .byte 68,41,193 // sub %r8d,%ecx + .byte 192,225,3 // shl $0x3,%cl + .byte 72,199,192,255,255,255,255 // mov $0xffffffffffffffff,%rax + .byte 72,211,232 // shr %cl,%rax + .byte 196,97,249,110,200 // vmovq %rax,%xmm9 + .byte 196,66,125,33,201 // vpmovsxbd %xmm9,%ymm9 + .byte 196,66,53,142,1 // vpmaskmovd %ymm8,%ymm9,(%r9) + .byte 235,170 // jmp 1336 <_sk_srcover_rgba_8888_hsw+0xc6> + HIDDEN _sk_clamp_0_hsw .globl _sk_clamp_0_hsw FUNCTION(_sk_clamp_0_hsw) @@ -10067,7 +10231,7 @@ HIDDEN _sk_clamp_1_hsw .globl _sk_clamp_1_hsw FUNCTION(_sk_clamp_1_hsw) _sk_clamp_1_hsw: - .byte 196,98,125,24,5,214,54,0,0 // vbroadcastss 0x36d6(%rip),%ymm8 # 496c <_sk_callback_hsw+0x1ce> + .byte 196,98,125,24,5,222,54,0,0 // vbroadcastss 0x36de(%rip),%ymm8 # 4a90 <_sk_callback_hsw+0x1d6> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 @@ -10079,7 +10243,7 @@ HIDDEN _sk_clamp_a_hsw .globl _sk_clamp_a_hsw FUNCTION(_sk_clamp_a_hsw) _sk_clamp_a_hsw: - .byte 196,98,125,24,5,185,54,0,0 // vbroadcastss 0x36b9(%rip),%ymm8 # 4970 <_sk_callback_hsw+0x1d2> + .byte 196,98,125,24,5,193,54,0,0 // vbroadcastss 0x36c1(%rip),%ymm8 # 4a94 <_sk_callback_hsw+0x1da> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0 .byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1 @@ -10165,7 +10329,7 @@ FUNCTION(_sk_unpremul_hsw) _sk_unpremul_hsw: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9 - .byte 196,98,125,24,21,1,54,0,0 // vbroadcastss 0x3601(%rip),%ymm10 # 4974 <_sk_callback_hsw+0x1d6> + .byte 196,98,125,24,21,9,54,0,0 // vbroadcastss 0x3609(%rip),%ymm10 # 4a98 <_sk_callback_hsw+0x1de> .byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10 .byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 @@ -10178,16 +10342,16 @@ HIDDEN _sk_from_srgb_hsw .globl _sk_from_srgb_hsw FUNCTION(_sk_from_srgb_hsw) _sk_from_srgb_hsw: - .byte 196,98,125,24,5,226,53,0,0 // vbroadcastss 0x35e2(%rip),%ymm8 # 4978 <_sk_callback_hsw+0x1da> + .byte 196,98,125,24,5,234,53,0,0 // vbroadcastss 0x35ea(%rip),%ymm8 # 4a9c <_sk_callback_hsw+0x1e2> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10 - .byte 196,98,125,24,29,212,53,0,0 // vbroadcastss 0x35d4(%rip),%ymm11 # 497c <_sk_callback_hsw+0x1de> - .byte 196,98,125,24,37,207,53,0,0 // vbroadcastss 0x35cf(%rip),%ymm12 # 4980 <_sk_callback_hsw+0x1e2> + .byte 196,98,125,24,29,220,53,0,0 // vbroadcastss 0x35dc(%rip),%ymm11 # 4aa0 <_sk_callback_hsw+0x1e6> + .byte 196,98,125,24,37,215,53,0,0 // vbroadcastss 0x35d7(%rip),%ymm12 # 4aa4 <_sk_callback_hsw+0x1ea> .byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13 .byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13 - .byte 196,98,125,24,53,192,53,0,0 // vbroadcastss 0x35c0(%rip),%ymm14 # 4984 <_sk_callback_hsw+0x1e6> + .byte 196,98,125,24,53,200,53,0,0 // vbroadcastss 0x35c8(%rip),%ymm14 # 4aa8 <_sk_callback_hsw+0x1ee> .byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13 - .byte 196,98,125,24,21,182,53,0,0 // vbroadcastss 0x35b6(%rip),%ymm10 # 4988 <_sk_callback_hsw+0x1ea> + .byte 196,98,125,24,21,190,53,0,0 // vbroadcastss 0x35be(%rip),%ymm10 # 4aac <_sk_callback_hsw+0x1f2> .byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0 .byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0 .byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9 @@ -10211,19 +10375,19 @@ HIDDEN _sk_to_srgb_hsw FUNCTION(_sk_to_srgb_hsw) _sk_to_srgb_hsw: .byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9 - .byte 196,98,125,24,5,90,53,0,0 // vbroadcastss 0x355a(%rip),%ymm8 # 498c <_sk_callback_hsw+0x1ee> + .byte 196,98,125,24,5,98,53,0,0 // vbroadcastss 0x3562(%rip),%ymm8 # 4ab0 <_sk_callback_hsw+0x1f6> .byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10 - .byte 196,98,125,24,29,80,53,0,0 // vbroadcastss 0x3550(%rip),%ymm11 # 4990 <_sk_callback_hsw+0x1f2> - .byte 196,98,125,24,37,75,53,0,0 // vbroadcastss 0x354b(%rip),%ymm12 # 4994 <_sk_callback_hsw+0x1f6> + .byte 196,98,125,24,29,88,53,0,0 // vbroadcastss 0x3558(%rip),%ymm11 # 4ab4 <_sk_callback_hsw+0x1fa> + .byte 196,98,125,24,37,83,53,0,0 // vbroadcastss 0x3553(%rip),%ymm12 # 4ab8 <_sk_callback_hsw+0x1fe> .byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13 .byte 196,66,53,168,235 // vfmadd213ps %ymm11,%ymm9,%ymm13 - .byte 196,98,125,24,53,60,53,0,0 // vbroadcastss 0x353c(%rip),%ymm14 # 4998 <_sk_callback_hsw+0x1fa> + .byte 196,98,125,24,53,68,53,0,0 // vbroadcastss 0x3544(%rip),%ymm14 # 4abc <_sk_callback_hsw+0x202> .byte 196,66,53,168,238 // vfmadd213ps %ymm14,%ymm9,%ymm13 - .byte 196,98,125,24,61,50,53,0,0 // vbroadcastss 0x3532(%rip),%ymm15 # 499c <_sk_callback_hsw+0x1fe> + .byte 196,98,125,24,61,58,53,0,0 // vbroadcastss 0x353a(%rip),%ymm15 # 4ac0 <_sk_callback_hsw+0x206> .byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9 .byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9 .byte 196,65,20,89,201 // vmulps %ymm9,%ymm13,%ymm9 - .byte 196,98,125,24,45,30,53,0,0 // vbroadcastss 0x351e(%rip),%ymm13 # 49a0 <_sk_callback_hsw+0x202> + .byte 196,98,125,24,45,38,53,0,0 // vbroadcastss 0x3526(%rip),%ymm13 # 4ac4 <_sk_callback_hsw+0x20a> .byte 196,193,124,194,197,1 // vcmpltps %ymm13,%ymm0,%ymm0 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9 @@ -10257,26 +10421,26 @@ _sk_rgb_to_hsl_hsw: .byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9 .byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9 .byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,29,147,52,0,0 // vbroadcastss 0x3493(%rip),%ymm11 # 49a4 <_sk_callback_hsw+0x206> + .byte 196,98,125,24,29,155,52,0,0 // vbroadcastss 0x349b(%rip),%ymm11 # 4ac8 <_sk_callback_hsw+0x20e> .byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11 .byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12 .byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13 - .byte 196,98,125,24,53,128,52,0,0 // vbroadcastss 0x3480(%rip),%ymm14 # 49a8 <_sk_callback_hsw+0x20a> + .byte 196,98,125,24,53,136,52,0,0 // vbroadcastss 0x3488(%rip),%ymm14 # 4acc <_sk_callback_hsw+0x212> .byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15 .byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13 .byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12 .byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2 .byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13 - .byte 196,98,125,24,53,103,52,0,0 // vbroadcastss 0x3467(%rip),%ymm14 # 49b0 <_sk_callback_hsw+0x212> + .byte 196,98,125,24,53,111,52,0,0 // vbroadcastss 0x346f(%rip),%ymm14 # 4ad4 <_sk_callback_hsw+0x21a> .byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13 - .byte 196,98,125,24,53,85,52,0,0 // vbroadcastss 0x3455(%rip),%ymm14 # 49ac <_sk_callback_hsw+0x20e> + .byte 196,98,125,24,53,93,52,0,0 // vbroadcastss 0x345d(%rip),%ymm14 # 4ad0 <_sk_callback_hsw+0x216> .byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2 .byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1 .byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1 .byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0 .byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0 .byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1 - .byte 196,98,125,24,29,56,52,0,0 // vbroadcastss 0x3438(%rip),%ymm11 # 49b8 <_sk_callback_hsw+0x21a> + .byte 196,98,125,24,29,64,52,0,0 // vbroadcastss 0x3440(%rip),%ymm11 # 4adc <_sk_callback_hsw+0x222> .byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2 .byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11 .byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12 @@ -10286,7 +10450,7 @@ _sk_rgb_to_hsl_hsw: .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0 .byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1 - .byte 196,98,125,24,5,251,51,0,0 // vbroadcastss 0x33fb(%rip),%ymm8 # 49b4 <_sk_callback_hsw+0x216> + .byte 196,98,125,24,5,3,52,0,0 // vbroadcastss 0x3403(%rip),%ymm8 # 4ad8 <_sk_callback_hsw+0x21e> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -10303,30 +10467,30 @@ _sk_hsl_to_rgb_hsw: .byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp) .byte 197,252,40,233 // vmovaps %ymm1,%ymm5 .byte 197,252,40,224 // vmovaps %ymm0,%ymm4 - .byte 196,98,125,24,5,200,51,0,0 // vbroadcastss 0x33c8(%rip),%ymm8 # 49bc <_sk_callback_hsw+0x21e> + .byte 196,98,125,24,5,208,51,0,0 // vbroadcastss 0x33d0(%rip),%ymm8 # 4ae0 <_sk_callback_hsw+0x226> .byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9 .byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10 .byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11 .byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9 .byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10 - .byte 196,98,125,24,13,171,51,0,0 // vbroadcastss 0x33ab(%rip),%ymm9 # 49c0 <_sk_callback_hsw+0x222> + .byte 196,98,125,24,13,179,51,0,0 // vbroadcastss 0x33b3(%rip),%ymm9 # 4ae4 <_sk_callback_hsw+0x22a> .byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9 - .byte 196,98,125,24,29,161,51,0,0 // vbroadcastss 0x33a1(%rip),%ymm11 # 49c4 <_sk_callback_hsw+0x226> + .byte 196,98,125,24,29,169,51,0,0 // vbroadcastss 0x33a9(%rip),%ymm11 # 4ae8 <_sk_callback_hsw+0x22e> .byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11 .byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12 .byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15 .byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11 - .byte 196,98,125,24,45,139,51,0,0 // vbroadcastss 0x338b(%rip),%ymm13 # 49cc <_sk_callback_hsw+0x22e> + .byte 196,98,125,24,45,147,51,0,0 // vbroadcastss 0x3393(%rip),%ymm13 # 4af0 <_sk_callback_hsw+0x236> .byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0 - .byte 196,98,125,24,53,129,51,0,0 // vbroadcastss 0x3381(%rip),%ymm14 # 49d0 <_sk_callback_hsw+0x232> + .byte 196,98,125,24,53,137,51,0,0 // vbroadcastss 0x3389(%rip),%ymm14 # 4af4 <_sk_callback_hsw+0x23a> .byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12 .byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12 - .byte 196,226,125,24,29,103,51,0,0 // vbroadcastss 0x3367(%rip),%ymm3 # 49c8 <_sk_callback_hsw+0x22a> + .byte 196,226,125,24,29,111,51,0,0 // vbroadcastss 0x336f(%rip),%ymm3 # 4aec <_sk_callback_hsw+0x232> .byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7 .byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7 .byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12 .byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7 - .byte 196,98,125,24,37,82,51,0,0 // vbroadcastss 0x3352(%rip),%ymm12 # 49d4 <_sk_callback_hsw+0x236> + .byte 196,98,125,24,37,90,51,0,0 // vbroadcastss 0x335a(%rip),%ymm12 # 4af8 <_sk_callback_hsw+0x23e> .byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15 .byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0 .byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15 @@ -10342,7 +10506,7 @@ _sk_hsl_to_rgb_hsw: .byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0 .byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7 .byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1 - .byte 196,226,125,24,5,254,50,0,0 // vbroadcastss 0x32fe(%rip),%ymm0 # 49d8 <_sk_callback_hsw+0x23a> + .byte 196,226,125,24,5,6,51,0,0 // vbroadcastss 0x3306(%rip),%ymm0 # 4afc <_sk_callback_hsw+0x242> .byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0 .byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 @@ -10392,11 +10556,11 @@ _sk_scale_u8_hsw: .byte 72,139,0 // mov (%rax),%rax .byte 72,1,248 // add %rdi,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,51 // jne 17ba <_sk_scale_u8_hsw+0x43> + .byte 117,51 // jne 18d6 <_sk_scale_u8_hsw+0x43> .byte 197,122,126,0 // vmovq (%rax),%xmm8 .byte 196,66,125,49,192 // vpmovzxbd %xmm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,62,50,0,0 // vbroadcastss 0x323e(%rip),%ymm9 # 49dc <_sk_callback_hsw+0x23e> + .byte 196,98,125,24,13,70,50,0,0 // vbroadcastss 0x3246(%rip),%ymm9 # 4b00 <_sk_callback_hsw+0x246> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -10414,9 +10578,9 @@ _sk_scale_u8_hsw: .byte 77,9,217 // or %r11,%r9 .byte 72,131,193,8 // add $0x8,%rcx .byte 73,255,202 // dec %r10 - .byte 117,234 // jne 17c2 <_sk_scale_u8_hsw+0x4b> + .byte 117,234 // jne 18de <_sk_scale_u8_hsw+0x4b> .byte 196,65,249,110,193 // vmovq %r9,%xmm8 - .byte 235,172 // jmp 178b <_sk_scale_u8_hsw+0x14> + .byte 235,172 // jmp 18a7 <_sk_scale_u8_hsw+0x14> HIDDEN _sk_lerp_1_float_hsw .globl _sk_lerp_1_float_hsw @@ -10444,11 +10608,11 @@ _sk_lerp_u8_hsw: .byte 72,139,0 // mov (%rax),%rax .byte 72,1,248 // add %rdi,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,71 // jne 1865 <_sk_lerp_u8_hsw+0x57> + .byte 117,71 // jne 1981 <_sk_lerp_u8_hsw+0x57> .byte 197,122,126,0 // vmovq (%rax),%xmm8 .byte 196,66,125,49,192 // vpmovzxbd %xmm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,171,49,0,0 // vbroadcastss 0x31ab(%rip),%ymm9 # 49e0 <_sk_callback_hsw+0x242> + .byte 196,98,125,24,13,179,49,0,0 // vbroadcastss 0x31b3(%rip),%ymm9 # 4b04 <_sk_callback_hsw+0x24a> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0 @@ -10470,9 +10634,9 @@ _sk_lerp_u8_hsw: .byte 77,9,217 // or %r11,%r9 .byte 72,131,193,8 // add $0x8,%rcx .byte 73,255,202 // dec %r10 - .byte 117,234 // jne 186d <_sk_lerp_u8_hsw+0x5f> + .byte 117,234 // jne 1989 <_sk_lerp_u8_hsw+0x5f> .byte 196,65,249,110,193 // vmovq %r9,%xmm8 - .byte 235,152 // jmp 1822 <_sk_lerp_u8_hsw+0x14> + .byte 235,152 // jmp 193e <_sk_lerp_u8_hsw+0x14> HIDDEN _sk_lerp_565_hsw .globl _sk_lerp_565_hsw @@ -10481,23 +10645,23 @@ _sk_lerp_565_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,169,0,0,0 // jne 1941 <_sk_lerp_565_hsw+0xb7> + .byte 15,133,169,0,0,0 // jne 1a5d <_sk_lerp_565_hsw+0xb7> .byte 196,65,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm8 .byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8 - .byte 196,98,125,88,13,56,49,0,0 // vpbroadcastd 0x3138(%rip),%ymm9 # 49e4 <_sk_callback_hsw+0x246> + .byte 196,98,125,88,13,64,49,0,0 // vpbroadcastd 0x3140(%rip),%ymm9 # 4b08 <_sk_callback_hsw+0x24e> .byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9 .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9 - .byte 196,98,125,24,21,41,49,0,0 // vbroadcastss 0x3129(%rip),%ymm10 # 49e8 <_sk_callback_hsw+0x24a> + .byte 196,98,125,24,21,49,49,0,0 // vbroadcastss 0x3131(%rip),%ymm10 # 4b0c <_sk_callback_hsw+0x252> .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,88,21,31,49,0,0 // vpbroadcastd 0x311f(%rip),%ymm10 # 49ec <_sk_callback_hsw+0x24e> + .byte 196,98,125,88,21,39,49,0,0 // vpbroadcastd 0x3127(%rip),%ymm10 # 4b10 <_sk_callback_hsw+0x256> .byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10 .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10 - .byte 196,98,125,24,29,16,49,0,0 // vbroadcastss 0x3110(%rip),%ymm11 # 49f0 <_sk_callback_hsw+0x252> + .byte 196,98,125,24,29,24,49,0,0 // vbroadcastss 0x3118(%rip),%ymm11 # 4b14 <_sk_callback_hsw+0x25a> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,88,29,6,49,0,0 // vpbroadcastd 0x3106(%rip),%ymm11 # 49f4 <_sk_callback_hsw+0x256> + .byte 196,98,125,88,29,14,49,0,0 // vpbroadcastd 0x310e(%rip),%ymm11 # 4b18 <_sk_callback_hsw+0x25e> .byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,29,247,48,0,0 // vbroadcastss 0x30f7(%rip),%ymm11 # 49f8 <_sk_callback_hsw+0x25a> + .byte 196,98,125,24,29,255,48,0,0 // vbroadcastss 0x30ff(%rip),%ymm11 # 4b1c <_sk_callback_hsw+0x262> .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,226,53,168,196 // vfmadd213ps %ymm4,%ymm9,%ymm0 @@ -10518,9 +10682,9 @@ _sk_lerp_565_hsw: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 15,135,68,255,255,255 // ja 189e <_sk_lerp_565_hsw+0x14> + .byte 15,135,68,255,255,255 // ja 19ba <_sk_lerp_565_hsw+0x14> .byte 69,15,182,192 // movzbl %r8b,%r8d - .byte 76,141,13,75,0,0,0 // lea 0x4b(%rip),%r9 # 19b0 <_sk_lerp_565_hsw+0x126> + .byte 76,141,13,75,0,0,0 // lea 0x4b(%rip),%r9 # 1acc <_sk_lerp_565_hsw+0x126> .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax @@ -10532,12 +10696,12 @@ _sk_lerp_565_hsw: .byte 196,65,57,196,68,122,4,2 // vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm8,%xmm8 .byte 196,65,57,196,68,122,2,1 // vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm8,%xmm8 .byte 196,65,57,196,4,122,0 // vpinsrw $0x0,(%r10,%rdi,2),%xmm8,%xmm8 - .byte 233,239,254,255,255 // jmpq 189e <_sk_lerp_565_hsw+0x14> + .byte 233,239,254,255,255 // jmpq 19ba <_sk_lerp_565_hsw+0x14> .byte 144 // nop .byte 243,255 // repz (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 235,255 // jmp 19b5 <_sk_lerp_565_hsw+0x12b> + .byte 235,255 // jmp 1ad1 <_sk_lerp_565_hsw+0x12b> .byte 255 // (bad) .byte 255,227 // jmpq *%rbx .byte 255 // (bad) @@ -10566,23 +10730,23 @@ _sk_load_tables_hsw: .byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9 .byte 76,3,8 // add (%rax),%r9 .byte 77,133,192 // test %r8,%r8 - .byte 117,105 // jne 1a4a <_sk_load_tables_hsw+0x7e> + .byte 117,105 // jne 1b66 <_sk_load_tables_hsw+0x7e> .byte 196,193,126,111,25 // vmovdqu (%r9),%ymm3 - .byte 197,229,219,13,242,50,0,0 // vpand 0x32f2(%rip),%ymm3,%ymm1 # 4ce0 <_sk_callback_hsw+0x542> + .byte 197,229,219,13,86,51,0,0 // vpand 0x3356(%rip),%ymm3,%ymm1 # 4e60 <_sk_callback_hsw+0x5a6> .byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8 .byte 72,139,72,8 // mov 0x8(%rax),%rcx .byte 76,139,72,16 // mov 0x10(%rax),%r9 .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2 .byte 196,226,109,146,4,137 // vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0 - .byte 196,226,101,0,21,242,50,0,0 // vpshufb 0x32f2(%rip),%ymm3,%ymm2 # 4d00 <_sk_callback_hsw+0x562> + .byte 196,226,101,0,21,86,51,0,0 // vpshufb 0x3356(%rip),%ymm3,%ymm2 # 4e80 <_sk_callback_hsw+0x5c6> .byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9 .byte 196,194,53,146,12,145 // vgatherdps %ymm9,(%r9,%ymm2,4),%ymm1 .byte 72,139,64,24 // mov 0x18(%rax),%rax - .byte 196,98,101,0,13,250,50,0,0 // vpshufb 0x32fa(%rip),%ymm3,%ymm9 # 4d20 <_sk_callback_hsw+0x582> + .byte 196,98,101,0,13,94,51,0,0 // vpshufb 0x335e(%rip),%ymm3,%ymm9 # 4ea0 <_sk_callback_hsw+0x5e6> .byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,190,47,0,0 // vbroadcastss 0x2fbe(%rip),%ymm8 # 49fc <_sk_callback_hsw+0x25e> + .byte 196,98,125,24,5,198,47,0,0 // vbroadcastss 0x2fc6(%rip),%ymm8 # 4b20 <_sk_callback_hsw+0x266> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,137,193 // mov %r8,%rcx @@ -10595,7 +10759,7 @@ _sk_load_tables_hsw: .byte 196,193,249,110,194 // vmovq %r10,%xmm0 .byte 196,226,125,33,192 // vpmovsxbd %xmm0,%ymm0 .byte 196,194,125,140,25 // vpmaskmovd (%r9),%ymm0,%ymm3 - .byte 233,115,255,255,255 // jmpq 19e6 <_sk_load_tables_hsw+0x1a> + .byte 233,115,255,255,255 // jmpq 1b02 <_sk_load_tables_hsw+0x1a> HIDDEN _sk_load_tables_u16_be_hsw .globl _sk_load_tables_u16_be_hsw @@ -10605,7 +10769,7 @@ _sk_load_tables_u16_be_hsw: .byte 76,139,0 // mov (%rax),%r8 .byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9 .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,201,0,0,0 // jne 1b52 <_sk_load_tables_u16_be_hsw+0xdf> + .byte 15,133,201,0,0,0 // jne 1c6e <_sk_load_tables_u16_be_hsw+0xdf> .byte 196,1,121,16,4,72 // vmovupd (%r8,%r9,2),%xmm8 .byte 196,129,121,16,84,72,16 // vmovupd 0x10(%r8,%r9,2),%xmm2 .byte 196,129,121,16,92,72,32 // vmovupd 0x20(%r8,%r9,2),%xmm3 @@ -10621,7 +10785,7 @@ _sk_load_tables_u16_be_hsw: .byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1 .byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2 .byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8 - .byte 197,121,111,21,134,51,0,0 // vmovdqa 0x3386(%rip),%xmm10 # 4e60 <_sk_callback_hsw+0x6c2> + .byte 197,121,111,21,234,51,0,0 // vmovdqa 0x33ea(%rip),%xmm10 # 4fe0 <_sk_callback_hsw+0x726> .byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0 .byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1 .byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11 @@ -10643,36 +10807,36 @@ _sk_load_tables_u16_be_hsw: .byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3 .byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,183,46,0,0 // vbroadcastss 0x2eb7(%rip),%ymm8 # 4a00 <_sk_callback_hsw+0x262> + .byte 196,98,125,24,5,191,46,0,0 // vbroadcastss 0x2ebf(%rip),%ymm8 # 4b24 <_sk_callback_hsw+0x26a> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 196,1,123,16,4,72 // vmovsd (%r8,%r9,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 116,85 // je 1bb8 <_sk_load_tables_u16_be_hsw+0x145> + .byte 116,85 // je 1cd4 <_sk_load_tables_u16_be_hsw+0x145> .byte 196,1,57,22,68,72,8 // vmovhpd 0x8(%r8,%r9,2),%xmm8,%xmm8 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,72 // jb 1bb8 <_sk_load_tables_u16_be_hsw+0x145> + .byte 114,72 // jb 1cd4 <_sk_load_tables_u16_be_hsw+0x145> .byte 196,129,123,16,84,72,16 // vmovsd 0x10(%r8,%r9,2),%xmm2 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 116,72 // je 1bc5 <_sk_load_tables_u16_be_hsw+0x152> + .byte 116,72 // je 1ce1 <_sk_load_tables_u16_be_hsw+0x152> .byte 196,129,105,22,84,72,24 // vmovhpd 0x18(%r8,%r9,2),%xmm2,%xmm2 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,59 // jb 1bc5 <_sk_load_tables_u16_be_hsw+0x152> + .byte 114,59 // jb 1ce1 <_sk_load_tables_u16_be_hsw+0x152> .byte 196,129,123,16,92,72,32 // vmovsd 0x20(%r8,%r9,2),%xmm3 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 15,132,9,255,255,255 // je 1aa4 <_sk_load_tables_u16_be_hsw+0x31> + .byte 15,132,9,255,255,255 // je 1bc0 <_sk_load_tables_u16_be_hsw+0x31> .byte 196,129,97,22,92,72,40 // vmovhpd 0x28(%r8,%r9,2),%xmm3,%xmm3 .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 15,130,248,254,255,255 // jb 1aa4 <_sk_load_tables_u16_be_hsw+0x31> + .byte 15,130,248,254,255,255 // jb 1bc0 <_sk_load_tables_u16_be_hsw+0x31> .byte 196,1,122,126,76,72,48 // vmovq 0x30(%r8,%r9,2),%xmm9 - .byte 233,236,254,255,255 // jmpq 1aa4 <_sk_load_tables_u16_be_hsw+0x31> + .byte 233,236,254,255,255 // jmpq 1bc0 <_sk_load_tables_u16_be_hsw+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,223,254,255,255 // jmpq 1aa4 <_sk_load_tables_u16_be_hsw+0x31> + .byte 233,223,254,255,255 // jmpq 1bc0 <_sk_load_tables_u16_be_hsw+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,214,254,255,255 // jmpq 1aa4 <_sk_load_tables_u16_be_hsw+0x31> + .byte 233,214,254,255,255 // jmpq 1bc0 <_sk_load_tables_u16_be_hsw+0x31> HIDDEN _sk_load_tables_rgb_u16_be_hsw .globl _sk_load_tables_rgb_u16_be_hsw @@ -10682,7 +10846,7 @@ _sk_load_tables_rgb_u16_be_hsw: .byte 76,139,0 // mov (%rax),%r8 .byte 76,141,12,127 // lea (%rdi,%rdi,2),%r9 .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,193,0,0,0 // jne 1ca1 <_sk_load_tables_rgb_u16_be_hsw+0xd3> + .byte 15,133,193,0,0,0 // jne 1dbd <_sk_load_tables_rgb_u16_be_hsw+0xd3> .byte 196,129,122,111,4,72 // vmovdqu (%r8,%r9,2),%xmm0 .byte 196,129,122,111,84,72,12 // vmovdqu 0xc(%r8,%r9,2),%xmm2 .byte 196,129,122,111,76,72,24 // vmovdqu 0x18(%r8,%r9,2),%xmm1 @@ -10703,7 +10867,7 @@ _sk_load_tables_rgb_u16_be_hsw: .byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3 .byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2 .byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8 - .byte 197,121,111,13,38,50,0,0 // vmovdqa 0x3226(%rip),%xmm9 # 4e70 <_sk_callback_hsw+0x6d2> + .byte 197,121,111,13,138,50,0,0 // vmovdqa 0x328a(%rip),%xmm9 # 4ff0 <_sk_callback_hsw+0x736> .byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0 .byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1 .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3 @@ -10720,41 +10884,41 @@ _sk_load_tables_rgb_u16_be_hsw: .byte 196,98,125,51,194 // vpmovzxwd %xmm2,%ymm8 .byte 196,162,101,146,20,128 // vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,101,45,0,0 // vbroadcastss 0x2d65(%rip),%ymm3 # 4a04 <_sk_callback_hsw+0x266> + .byte 196,226,125,24,29,109,45,0,0 // vbroadcastss 0x2d6d(%rip),%ymm3 # 4b28 <_sk_callback_hsw+0x26e> .byte 255,224 // jmpq *%rax .byte 196,129,121,110,4,72 // vmovd (%r8,%r9,2),%xmm0 .byte 196,129,121,196,68,72,4,2 // vpinsrw $0x2,0x4(%r8,%r9,2),%xmm0,%xmm0 .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 117,5 // jne 1cba <_sk_load_tables_rgb_u16_be_hsw+0xec> - .byte 233,90,255,255,255 // jmpq 1c14 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 117,5 // jne 1dd6 <_sk_load_tables_rgb_u16_be_hsw+0xec> + .byte 233,90,255,255,255 // jmpq 1d30 <_sk_load_tables_rgb_u16_be_hsw+0x46> .byte 196,129,121,110,76,72,6 // vmovd 0x6(%r8,%r9,2),%xmm1 .byte 196,1,113,196,68,72,10,2 // vpinsrw $0x2,0xa(%r8,%r9,2),%xmm1,%xmm8 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,26 // jb 1ce9 <_sk_load_tables_rgb_u16_be_hsw+0x11b> + .byte 114,26 // jb 1e05 <_sk_load_tables_rgb_u16_be_hsw+0x11b> .byte 196,129,121,110,76,72,12 // vmovd 0xc(%r8,%r9,2),%xmm1 .byte 196,129,113,196,84,72,16,2 // vpinsrw $0x2,0x10(%r8,%r9,2),%xmm1,%xmm2 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 117,10 // jne 1cee <_sk_load_tables_rgb_u16_be_hsw+0x120> - .byte 233,43,255,255,255 // jmpq 1c14 <_sk_load_tables_rgb_u16_be_hsw+0x46> - .byte 233,38,255,255,255 // jmpq 1c14 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 117,10 // jne 1e0a <_sk_load_tables_rgb_u16_be_hsw+0x120> + .byte 233,43,255,255,255 // jmpq 1d30 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 233,38,255,255,255 // jmpq 1d30 <_sk_load_tables_rgb_u16_be_hsw+0x46> .byte 196,129,121,110,76,72,18 // vmovd 0x12(%r8,%r9,2),%xmm1 .byte 196,1,113,196,76,72,22,2 // vpinsrw $0x2,0x16(%r8,%r9,2),%xmm1,%xmm9 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,26 // jb 1d1d <_sk_load_tables_rgb_u16_be_hsw+0x14f> + .byte 114,26 // jb 1e39 <_sk_load_tables_rgb_u16_be_hsw+0x14f> .byte 196,129,121,110,76,72,24 // vmovd 0x18(%r8,%r9,2),%xmm1 .byte 196,129,113,196,76,72,28,2 // vpinsrw $0x2,0x1c(%r8,%r9,2),%xmm1,%xmm1 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 117,10 // jne 1d22 <_sk_load_tables_rgb_u16_be_hsw+0x154> - .byte 233,247,254,255,255 // jmpq 1c14 <_sk_load_tables_rgb_u16_be_hsw+0x46> - .byte 233,242,254,255,255 // jmpq 1c14 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 117,10 // jne 1e3e <_sk_load_tables_rgb_u16_be_hsw+0x154> + .byte 233,247,254,255,255 // jmpq 1d30 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 233,242,254,255,255 // jmpq 1d30 <_sk_load_tables_rgb_u16_be_hsw+0x46> .byte 196,129,121,110,92,72,30 // vmovd 0x1e(%r8,%r9,2),%xmm3 .byte 196,1,97,196,92,72,34,2 // vpinsrw $0x2,0x22(%r8,%r9,2),%xmm3,%xmm11 .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 114,20 // jb 1d4b <_sk_load_tables_rgb_u16_be_hsw+0x17d> + .byte 114,20 // jb 1e67 <_sk_load_tables_rgb_u16_be_hsw+0x17d> .byte 196,129,121,110,92,72,36 // vmovd 0x24(%r8,%r9,2),%xmm3 .byte 196,129,97,196,92,72,40,2 // vpinsrw $0x2,0x28(%r8,%r9,2),%xmm3,%xmm3 - .byte 233,201,254,255,255 // jmpq 1c14 <_sk_load_tables_rgb_u16_be_hsw+0x46> - .byte 233,196,254,255,255 // jmpq 1c14 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 233,201,254,255,255 // jmpq 1d30 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 233,196,254,255,255 // jmpq 1d30 <_sk_load_tables_rgb_u16_be_hsw+0x46> HIDDEN _sk_byte_tables_hsw .globl _sk_byte_tables_hsw @@ -10767,7 +10931,7 @@ _sk_byte_tables_hsw: .byte 65,84 // push %r12 .byte 83 // push %rbx .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,163,44,0,0 // vbroadcastss 0x2ca3(%rip),%ymm8 # 4a08 <_sk_callback_hsw+0x26a> + .byte 196,98,125,24,5,171,44,0,0 // vbroadcastss 0x2cab(%rip),%ymm8 # 4b2c <_sk_callback_hsw+0x272> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0 .byte 196,195,249,22,192,1 // vpextrq $0x1,%xmm0,%r8 @@ -10804,7 +10968,7 @@ _sk_byte_tables_hsw: .byte 196,227,121,32,197,7 // vpinsrb $0x7,%ebp,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,244,43,0,0 // vbroadcastss 0x2bf4(%rip),%ymm9 # 4a0c <_sk_callback_hsw+0x26e> + .byte 196,98,125,24,13,252,43,0,0 // vbroadcastss 0x2bfc(%rip),%ymm9 # 4b30 <_sk_callback_hsw+0x276> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 @@ -10965,7 +11129,7 @@ _sk_byte_tables_rgb_hsw: .byte 196,227,121,32,197,7 // vpinsrb $0x7,%ebp,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,45,41,0,0 // vbroadcastss 0x292d(%rip),%ymm9 # 4a10 <_sk_callback_hsw+0x272> + .byte 196,98,125,24,13,53,41,0,0 // vbroadcastss 0x2935(%rip),%ymm9 # 4b34 <_sk_callback_hsw+0x27a> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 @@ -11128,33 +11292,33 @@ _sk_parametric_r_hsw: .byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10 .byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,224,38,0,0 // vbroadcastss 0x26e0(%rip),%ymm12 # 4a14 <_sk_callback_hsw+0x276> - .byte 196,98,125,24,45,219,38,0,0 // vbroadcastss 0x26db(%rip),%ymm13 # 4a18 <_sk_callback_hsw+0x27a> + .byte 196,98,125,24,37,232,38,0,0 // vbroadcastss 0x26e8(%rip),%ymm12 # 4b38 <_sk_callback_hsw+0x27e> + .byte 196,98,125,24,45,227,38,0,0 // vbroadcastss 0x26e3(%rip),%ymm13 # 4b3c <_sk_callback_hsw+0x282> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,209,38,0,0 // vbroadcastss 0x26d1(%rip),%ymm13 # 4a1c <_sk_callback_hsw+0x27e> + .byte 196,98,125,24,45,217,38,0,0 // vbroadcastss 0x26d9(%rip),%ymm13 # 4b40 <_sk_callback_hsw+0x286> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,199,38,0,0 // vbroadcastss 0x26c7(%rip),%ymm13 # 4a20 <_sk_callback_hsw+0x282> + .byte 196,98,125,24,45,207,38,0,0 // vbroadcastss 0x26cf(%rip),%ymm13 # 4b44 <_sk_callback_hsw+0x28a> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,189,38,0,0 // vbroadcastss 0x26bd(%rip),%ymm11 # 4a24 <_sk_callback_hsw+0x286> + .byte 196,98,125,24,29,197,38,0,0 // vbroadcastss 0x26c5(%rip),%ymm11 # 4b48 <_sk_callback_hsw+0x28e> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,179,38,0,0 // vbroadcastss 0x26b3(%rip),%ymm12 # 4a28 <_sk_callback_hsw+0x28a> + .byte 196,98,125,24,37,187,38,0,0 // vbroadcastss 0x26bb(%rip),%ymm12 # 4b4c <_sk_callback_hsw+0x292> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,169,38,0,0 // vbroadcastss 0x26a9(%rip),%ymm12 # 4a2c <_sk_callback_hsw+0x28e> + .byte 196,98,125,24,37,177,38,0,0 // vbroadcastss 0x26b1(%rip),%ymm12 # 4b50 <_sk_callback_hsw+0x296> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 - .byte 196,98,125,24,29,138,38,0,0 // vbroadcastss 0x268a(%rip),%ymm11 # 4a30 <_sk_callback_hsw+0x292> + .byte 196,98,125,24,29,146,38,0,0 // vbroadcastss 0x2692(%rip),%ymm11 # 4b54 <_sk_callback_hsw+0x29a> .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,128,38,0,0 // vbroadcastss 0x2680(%rip),%ymm11 # 4a34 <_sk_callback_hsw+0x296> + .byte 196,98,125,24,29,136,38,0,0 // vbroadcastss 0x2688(%rip),%ymm11 # 4b58 <_sk_callback_hsw+0x29e> .byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11 - .byte 196,226,125,24,5,118,38,0,0 // vbroadcastss 0x2676(%rip),%ymm0 # 4a38 <_sk_callback_hsw+0x29a> + .byte 196,226,125,24,5,126,38,0,0 // vbroadcastss 0x267e(%rip),%ymm0 # 4b5c <_sk_callback_hsw+0x2a2> .byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0 - .byte 196,98,125,24,21,108,38,0,0 // vbroadcastss 0x266c(%rip),%ymm10 # 4a3c <_sk_callback_hsw+0x29e> + .byte 196,98,125,24,21,116,38,0,0 // vbroadcastss 0x2674(%rip),%ymm10 # 4b60 <_sk_callback_hsw+0x2a6> .byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0 .byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0 - .byte 196,98,125,24,21,95,38,0,0 // vbroadcastss 0x265f(%rip),%ymm10 # 4a40 <_sk_callback_hsw+0x2a2> + .byte 196,98,125,24,21,103,38,0,0 // vbroadcastss 0x2667(%rip),%ymm10 # 4b64 <_sk_callback_hsw+0x2aa> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -11162,7 +11326,7 @@ _sk_parametric_r_hsw: .byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,54,38,0,0 // vbroadcastss 0x2636(%rip),%ymm8 # 4a44 <_sk_callback_hsw+0x2a6> + .byte 196,98,125,24,5,62,38,0,0 // vbroadcastss 0x263e(%rip),%ymm8 # 4b68 <_sk_callback_hsw+0x2ae> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11182,33 +11346,33 @@ _sk_parametric_g_hsw: .byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10 .byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,238,37,0,0 // vbroadcastss 0x25ee(%rip),%ymm12 # 4a48 <_sk_callback_hsw+0x2aa> - .byte 196,98,125,24,45,233,37,0,0 // vbroadcastss 0x25e9(%rip),%ymm13 # 4a4c <_sk_callback_hsw+0x2ae> + .byte 196,98,125,24,37,246,37,0,0 // vbroadcastss 0x25f6(%rip),%ymm12 # 4b6c <_sk_callback_hsw+0x2b2> + .byte 196,98,125,24,45,241,37,0,0 // vbroadcastss 0x25f1(%rip),%ymm13 # 4b70 <_sk_callback_hsw+0x2b6> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,223,37,0,0 // vbroadcastss 0x25df(%rip),%ymm13 # 4a50 <_sk_callback_hsw+0x2b2> + .byte 196,98,125,24,45,231,37,0,0 // vbroadcastss 0x25e7(%rip),%ymm13 # 4b74 <_sk_callback_hsw+0x2ba> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,213,37,0,0 // vbroadcastss 0x25d5(%rip),%ymm13 # 4a54 <_sk_callback_hsw+0x2b6> + .byte 196,98,125,24,45,221,37,0,0 // vbroadcastss 0x25dd(%rip),%ymm13 # 4b78 <_sk_callback_hsw+0x2be> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,203,37,0,0 // vbroadcastss 0x25cb(%rip),%ymm11 # 4a58 <_sk_callback_hsw+0x2ba> + .byte 196,98,125,24,29,211,37,0,0 // vbroadcastss 0x25d3(%rip),%ymm11 # 4b7c <_sk_callback_hsw+0x2c2> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,193,37,0,0 // vbroadcastss 0x25c1(%rip),%ymm12 # 4a5c <_sk_callback_hsw+0x2be> + .byte 196,98,125,24,37,201,37,0,0 // vbroadcastss 0x25c9(%rip),%ymm12 # 4b80 <_sk_callback_hsw+0x2c6> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,183,37,0,0 // vbroadcastss 0x25b7(%rip),%ymm12 # 4a60 <_sk_callback_hsw+0x2c2> + .byte 196,98,125,24,37,191,37,0,0 // vbroadcastss 0x25bf(%rip),%ymm12 # 4b84 <_sk_callback_hsw+0x2ca> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10 .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10 - .byte 196,98,125,24,29,152,37,0,0 // vbroadcastss 0x2598(%rip),%ymm11 # 4a64 <_sk_callback_hsw+0x2c6> + .byte 196,98,125,24,29,160,37,0,0 // vbroadcastss 0x25a0(%rip),%ymm11 # 4b88 <_sk_callback_hsw+0x2ce> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,142,37,0,0 // vbroadcastss 0x258e(%rip),%ymm11 # 4a68 <_sk_callback_hsw+0x2ca> + .byte 196,98,125,24,29,150,37,0,0 // vbroadcastss 0x2596(%rip),%ymm11 # 4b8c <_sk_callback_hsw+0x2d2> .byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11 - .byte 196,226,125,24,13,132,37,0,0 // vbroadcastss 0x2584(%rip),%ymm1 # 4a6c <_sk_callback_hsw+0x2ce> + .byte 196,226,125,24,13,140,37,0,0 // vbroadcastss 0x258c(%rip),%ymm1 # 4b90 <_sk_callback_hsw+0x2d6> .byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1 - .byte 196,98,125,24,21,122,37,0,0 // vbroadcastss 0x257a(%rip),%ymm10 # 4a70 <_sk_callback_hsw+0x2d2> + .byte 196,98,125,24,21,130,37,0,0 // vbroadcastss 0x2582(%rip),%ymm10 # 4b94 <_sk_callback_hsw+0x2da> .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1 - .byte 196,98,125,24,21,109,37,0,0 // vbroadcastss 0x256d(%rip),%ymm10 # 4a74 <_sk_callback_hsw+0x2d6> + .byte 196,98,125,24,21,117,37,0,0 // vbroadcastss 0x2575(%rip),%ymm10 # 4b98 <_sk_callback_hsw+0x2de> .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -11216,7 +11380,7 @@ _sk_parametric_g_hsw: .byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,5,68,37,0,0 // vbroadcastss 0x2544(%rip),%ymm8 # 4a78 <_sk_callback_hsw+0x2da> + .byte 196,98,125,24,5,76,37,0,0 // vbroadcastss 0x254c(%rip),%ymm8 # 4b9c <_sk_callback_hsw+0x2e2> .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11236,33 +11400,33 @@ _sk_parametric_b_hsw: .byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10 .byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,252,36,0,0 // vbroadcastss 0x24fc(%rip),%ymm12 # 4a7c <_sk_callback_hsw+0x2de> - .byte 196,98,125,24,45,247,36,0,0 // vbroadcastss 0x24f7(%rip),%ymm13 # 4a80 <_sk_callback_hsw+0x2e2> + .byte 196,98,125,24,37,4,37,0,0 // vbroadcastss 0x2504(%rip),%ymm12 # 4ba0 <_sk_callback_hsw+0x2e6> + .byte 196,98,125,24,45,255,36,0,0 // vbroadcastss 0x24ff(%rip),%ymm13 # 4ba4 <_sk_callback_hsw+0x2ea> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,237,36,0,0 // vbroadcastss 0x24ed(%rip),%ymm13 # 4a84 <_sk_callback_hsw+0x2e6> + .byte 196,98,125,24,45,245,36,0,0 // vbroadcastss 0x24f5(%rip),%ymm13 # 4ba8 <_sk_callback_hsw+0x2ee> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,227,36,0,0 // vbroadcastss 0x24e3(%rip),%ymm13 # 4a88 <_sk_callback_hsw+0x2ea> + .byte 196,98,125,24,45,235,36,0,0 // vbroadcastss 0x24eb(%rip),%ymm13 # 4bac <_sk_callback_hsw+0x2f2> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,217,36,0,0 // vbroadcastss 0x24d9(%rip),%ymm11 # 4a8c <_sk_callback_hsw+0x2ee> + .byte 196,98,125,24,29,225,36,0,0 // vbroadcastss 0x24e1(%rip),%ymm11 # 4bb0 <_sk_callback_hsw+0x2f6> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,207,36,0,0 // vbroadcastss 0x24cf(%rip),%ymm12 # 4a90 <_sk_callback_hsw+0x2f2> + .byte 196,98,125,24,37,215,36,0,0 // vbroadcastss 0x24d7(%rip),%ymm12 # 4bb4 <_sk_callback_hsw+0x2fa> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,197,36,0,0 // vbroadcastss 0x24c5(%rip),%ymm12 # 4a94 <_sk_callback_hsw+0x2f6> + .byte 196,98,125,24,37,205,36,0,0 // vbroadcastss 0x24cd(%rip),%ymm12 # 4bb8 <_sk_callback_hsw+0x2fe> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10 .byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10 - .byte 196,98,125,24,29,166,36,0,0 // vbroadcastss 0x24a6(%rip),%ymm11 # 4a98 <_sk_callback_hsw+0x2fa> + .byte 196,98,125,24,29,174,36,0,0 // vbroadcastss 0x24ae(%rip),%ymm11 # 4bbc <_sk_callback_hsw+0x302> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,156,36,0,0 // vbroadcastss 0x249c(%rip),%ymm11 # 4a9c <_sk_callback_hsw+0x2fe> + .byte 196,98,125,24,29,164,36,0,0 // vbroadcastss 0x24a4(%rip),%ymm11 # 4bc0 <_sk_callback_hsw+0x306> .byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11 - .byte 196,226,125,24,21,146,36,0,0 // vbroadcastss 0x2492(%rip),%ymm2 # 4aa0 <_sk_callback_hsw+0x302> + .byte 196,226,125,24,21,154,36,0,0 // vbroadcastss 0x249a(%rip),%ymm2 # 4bc4 <_sk_callback_hsw+0x30a> .byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2 - .byte 196,98,125,24,21,136,36,0,0 // vbroadcastss 0x2488(%rip),%ymm10 # 4aa4 <_sk_callback_hsw+0x306> + .byte 196,98,125,24,21,144,36,0,0 // vbroadcastss 0x2490(%rip),%ymm10 # 4bc8 <_sk_callback_hsw+0x30e> .byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2 .byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2 - .byte 196,98,125,24,21,123,36,0,0 // vbroadcastss 0x247b(%rip),%ymm10 # 4aa8 <_sk_callback_hsw+0x30a> + .byte 196,98,125,24,21,131,36,0,0 // vbroadcastss 0x2483(%rip),%ymm10 # 4bcc <_sk_callback_hsw+0x312> .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -11270,7 +11434,7 @@ _sk_parametric_b_hsw: .byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,82,36,0,0 // vbroadcastss 0x2452(%rip),%ymm8 # 4aac <_sk_callback_hsw+0x30e> + .byte 196,98,125,24,5,90,36,0,0 // vbroadcastss 0x245a(%rip),%ymm8 # 4bd0 <_sk_callback_hsw+0x316> .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11290,33 +11454,33 @@ _sk_parametric_a_hsw: .byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10 .byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,10,36,0,0 // vbroadcastss 0x240a(%rip),%ymm12 # 4ab0 <_sk_callback_hsw+0x312> - .byte 196,98,125,24,45,5,36,0,0 // vbroadcastss 0x2405(%rip),%ymm13 # 4ab4 <_sk_callback_hsw+0x316> + .byte 196,98,125,24,37,18,36,0,0 // vbroadcastss 0x2412(%rip),%ymm12 # 4bd4 <_sk_callback_hsw+0x31a> + .byte 196,98,125,24,45,13,36,0,0 // vbroadcastss 0x240d(%rip),%ymm13 # 4bd8 <_sk_callback_hsw+0x31e> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,251,35,0,0 // vbroadcastss 0x23fb(%rip),%ymm13 # 4ab8 <_sk_callback_hsw+0x31a> + .byte 196,98,125,24,45,3,36,0,0 // vbroadcastss 0x2403(%rip),%ymm13 # 4bdc <_sk_callback_hsw+0x322> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,241,35,0,0 // vbroadcastss 0x23f1(%rip),%ymm13 # 4abc <_sk_callback_hsw+0x31e> + .byte 196,98,125,24,45,249,35,0,0 // vbroadcastss 0x23f9(%rip),%ymm13 # 4be0 <_sk_callback_hsw+0x326> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,231,35,0,0 // vbroadcastss 0x23e7(%rip),%ymm11 # 4ac0 <_sk_callback_hsw+0x322> + .byte 196,98,125,24,29,239,35,0,0 // vbroadcastss 0x23ef(%rip),%ymm11 # 4be4 <_sk_callback_hsw+0x32a> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,221,35,0,0 // vbroadcastss 0x23dd(%rip),%ymm12 # 4ac4 <_sk_callback_hsw+0x326> + .byte 196,98,125,24,37,229,35,0,0 // vbroadcastss 0x23e5(%rip),%ymm12 # 4be8 <_sk_callback_hsw+0x32e> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,211,35,0,0 // vbroadcastss 0x23d3(%rip),%ymm12 # 4ac8 <_sk_callback_hsw+0x32a> + .byte 196,98,125,24,37,219,35,0,0 // vbroadcastss 0x23db(%rip),%ymm12 # 4bec <_sk_callback_hsw+0x332> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10 .byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10 - .byte 196,98,125,24,29,180,35,0,0 // vbroadcastss 0x23b4(%rip),%ymm11 # 4acc <_sk_callback_hsw+0x32e> + .byte 196,98,125,24,29,188,35,0,0 // vbroadcastss 0x23bc(%rip),%ymm11 # 4bf0 <_sk_callback_hsw+0x336> .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,170,35,0,0 // vbroadcastss 0x23aa(%rip),%ymm11 # 4ad0 <_sk_callback_hsw+0x332> + .byte 196,98,125,24,29,178,35,0,0 // vbroadcastss 0x23b2(%rip),%ymm11 # 4bf4 <_sk_callback_hsw+0x33a> .byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11 - .byte 196,226,125,24,29,160,35,0,0 // vbroadcastss 0x23a0(%rip),%ymm3 # 4ad4 <_sk_callback_hsw+0x336> + .byte 196,226,125,24,29,168,35,0,0 // vbroadcastss 0x23a8(%rip),%ymm3 # 4bf8 <_sk_callback_hsw+0x33e> .byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3 - .byte 196,98,125,24,21,150,35,0,0 // vbroadcastss 0x2396(%rip),%ymm10 # 4ad8 <_sk_callback_hsw+0x33a> + .byte 196,98,125,24,21,158,35,0,0 // vbroadcastss 0x239e(%rip),%ymm10 # 4bfc <_sk_callback_hsw+0x342> .byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3 .byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3 - .byte 196,98,125,24,21,137,35,0,0 // vbroadcastss 0x2389(%rip),%ymm10 # 4adc <_sk_callback_hsw+0x33e> + .byte 196,98,125,24,21,145,35,0,0 // vbroadcastss 0x2391(%rip),%ymm10 # 4c00 <_sk_callback_hsw+0x346> .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -11324,7 +11488,7 @@ _sk_parametric_a_hsw: .byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3 - .byte 196,98,125,24,5,96,35,0,0 // vbroadcastss 0x2360(%rip),%ymm8 # 4ae0 <_sk_callback_hsw+0x342> + .byte 196,98,125,24,5,104,35,0,0 // vbroadcastss 0x2368(%rip),%ymm8 # 4c04 <_sk_callback_hsw+0x34a> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11333,26 +11497,26 @@ HIDDEN _sk_lab_to_xyz_hsw .globl _sk_lab_to_xyz_hsw FUNCTION(_sk_lab_to_xyz_hsw) _sk_lab_to_xyz_hsw: - .byte 196,98,125,24,5,82,35,0,0 // vbroadcastss 0x2352(%rip),%ymm8 # 4ae4 <_sk_callback_hsw+0x346> - .byte 196,98,125,24,13,77,35,0,0 // vbroadcastss 0x234d(%rip),%ymm9 # 4ae8 <_sk_callback_hsw+0x34a> - .byte 196,98,125,24,21,72,35,0,0 // vbroadcastss 0x2348(%rip),%ymm10 # 4aec <_sk_callback_hsw+0x34e> + .byte 196,98,125,24,5,90,35,0,0 // vbroadcastss 0x235a(%rip),%ymm8 # 4c08 <_sk_callback_hsw+0x34e> + .byte 196,98,125,24,13,85,35,0,0 // vbroadcastss 0x2355(%rip),%ymm9 # 4c0c <_sk_callback_hsw+0x352> + .byte 196,98,125,24,21,80,35,0,0 // vbroadcastss 0x2350(%rip),%ymm10 # 4c10 <_sk_callback_hsw+0x356> .byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1 .byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2 - .byte 196,98,125,24,13,57,35,0,0 // vbroadcastss 0x2339(%rip),%ymm9 # 4af0 <_sk_callback_hsw+0x352> + .byte 196,98,125,24,13,65,35,0,0 // vbroadcastss 0x2341(%rip),%ymm9 # 4c14 <_sk_callback_hsw+0x35a> .byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9 - .byte 196,226,125,24,5,47,35,0,0 // vbroadcastss 0x232f(%rip),%ymm0 # 4af4 <_sk_callback_hsw+0x356> + .byte 196,226,125,24,5,55,35,0,0 // vbroadcastss 0x2337(%rip),%ymm0 # 4c18 <_sk_callback_hsw+0x35e> .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 - .byte 196,98,125,24,5,38,35,0,0 // vbroadcastss 0x2326(%rip),%ymm8 # 4af8 <_sk_callback_hsw+0x35a> + .byte 196,98,125,24,5,46,35,0,0 // vbroadcastss 0x232e(%rip),%ymm8 # 4c1c <_sk_callback_hsw+0x362> .byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8 - .byte 196,98,125,24,13,28,35,0,0 // vbroadcastss 0x231c(%rip),%ymm9 # 4afc <_sk_callback_hsw+0x35e> + .byte 196,98,125,24,13,36,35,0,0 // vbroadcastss 0x2324(%rip),%ymm9 # 4c20 <_sk_callback_hsw+0x366> .byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9 .byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 - .byte 196,226,125,24,21,9,35,0,0 // vbroadcastss 0x2309(%rip),%ymm2 # 4b00 <_sk_callback_hsw+0x362> + .byte 196,226,125,24,21,17,35,0,0 // vbroadcastss 0x2311(%rip),%ymm2 # 4c24 <_sk_callback_hsw+0x36a> .byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10 - .byte 196,98,125,24,29,255,34,0,0 // vbroadcastss 0x22ff(%rip),%ymm11 # 4b04 <_sk_callback_hsw+0x366> + .byte 196,98,125,24,29,7,35,0,0 // vbroadcastss 0x2307(%rip),%ymm11 # 4c28 <_sk_callback_hsw+0x36e> .byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8 - .byte 196,98,125,24,37,245,34,0,0 // vbroadcastss 0x22f5(%rip),%ymm12 # 4b08 <_sk_callback_hsw+0x36a> + .byte 196,98,125,24,37,253,34,0,0 // vbroadcastss 0x22fd(%rip),%ymm12 # 4c2c <_sk_callback_hsw+0x372> .byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8 .byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8 .byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1 @@ -11367,9 +11531,9 @@ _sk_lab_to_xyz_hsw: .byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9 .byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9 .byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2 - .byte 196,226,125,24,5,170,34,0,0 // vbroadcastss 0x22aa(%rip),%ymm0 # 4b0c <_sk_callback_hsw+0x36e> + .byte 196,226,125,24,5,178,34,0,0 // vbroadcastss 0x22b2(%rip),%ymm0 # 4c30 <_sk_callback_hsw+0x376> .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,161,34,0,0 // vbroadcastss 0x22a1(%rip),%ymm8 # 4b10 <_sk_callback_hsw+0x372> + .byte 196,98,125,24,5,169,34,0,0 // vbroadcastss 0x22a9(%rip),%ymm8 # 4c34 <_sk_callback_hsw+0x37a> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11383,11 +11547,11 @@ _sk_load_a8_hsw: .byte 72,139,0 // mov (%rax),%rax .byte 72,1,248 // add %rdi,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,45 // jne 28b5 <_sk_load_a8_hsw+0x3d> + .byte 117,45 // jne 29d1 <_sk_load_a8_hsw+0x3d> .byte 197,250,126,0 // vmovq (%rax),%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,118,34,0,0 // vbroadcastss 0x2276(%rip),%ymm1 # 4b14 <_sk_callback_hsw+0x376> + .byte 196,226,125,24,13,126,34,0,0 // vbroadcastss 0x227e(%rip),%ymm1 # 4c38 <_sk_callback_hsw+0x37e> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -11404,9 +11568,9 @@ _sk_load_a8_hsw: .byte 77,9,217 // or %r11,%r9 .byte 72,131,193,8 // add $0x8,%rcx .byte 73,255,202 // dec %r10 - .byte 117,234 // jne 28bd <_sk_load_a8_hsw+0x45> + .byte 117,234 // jne 29d9 <_sk_load_a8_hsw+0x45> .byte 196,193,249,110,193 // vmovq %r9,%xmm0 - .byte 235,178 // jmp 288c <_sk_load_a8_hsw+0x14> + .byte 235,178 // jmp 29a8 <_sk_load_a8_hsw+0x14> HIDDEN _sk_gather_a8_hsw .globl _sk_gather_a8_hsw @@ -11452,7 +11616,7 @@ _sk_gather_a8_hsw: .byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,129,33,0,0 // vbroadcastss 0x2181(%rip),%ymm1 # 4b18 <_sk_callback_hsw+0x37a> + .byte 196,226,125,24,13,137,33,0,0 // vbroadcastss 0x2189(%rip),%ymm1 # 4c3c <_sk_callback_hsw+0x382> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -11470,14 +11634,14 @@ FUNCTION(_sk_store_a8_hsw) _sk_store_a8_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 196,98,125,24,5,92,33,0,0 // vbroadcastss 0x215c(%rip),%ymm8 # 4b1c <_sk_callback_hsw+0x37e> + .byte 196,98,125,24,5,100,33,0,0 // vbroadcastss 0x2164(%rip),%ymm8 # 4c40 <_sk_callback_hsw+0x386> .byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8 .byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8 .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8 .byte 72,133,201 // test %rcx,%rcx - .byte 117,10 // jne 29e9 <_sk_store_a8_hsw+0x37> + .byte 117,10 // jne 2b05 <_sk_store_a8_hsw+0x37> .byte 196,65,123,17,4,58 // vmovsd %xmm8,(%r10,%rdi,1) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11485,10 +11649,10 @@ _sk_store_a8_hsw: .byte 65,128,224,7 // and $0x7,%r8b .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 119,236 // ja 29e5 <_sk_store_a8_hsw+0x33> + .byte 119,236 // ja 2b01 <_sk_store_a8_hsw+0x33> .byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8 .byte 69,15,182,192 // movzbl %r8b,%r8d - .byte 76,141,13,67,0,0,0 // lea 0x43(%rip),%r9 # 2a4c <_sk_store_a8_hsw+0x9a> + .byte 76,141,13,67,0,0,0 // lea 0x43(%rip),%r9 # 2b68 <_sk_store_a8_hsw+0x9a> .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax @@ -11499,7 +11663,7 @@ _sk_store_a8_hsw: .byte 196,67,121,20,68,58,2,4 // vpextrb $0x4,%xmm8,0x2(%r10,%rdi,1) .byte 196,67,121,20,68,58,1,2 // vpextrb $0x2,%xmm8,0x1(%r10,%rdi,1) .byte 196,67,121,20,4,58,0 // vpextrb $0x0,%xmm8,(%r10,%rdi,1) - .byte 235,154 // jmp 29e5 <_sk_store_a8_hsw+0x33> + .byte 235,154 // jmp 2b01 <_sk_store_a8_hsw+0x33> .byte 144 // nop .byte 246,255 // idiv %bh .byte 255 // (bad) @@ -11533,14 +11697,14 @@ _sk_load_g8_hsw: .byte 72,139,0 // mov (%rax),%rax .byte 72,1,248 // add %rdi,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,50 // jne 2aaa <_sk_load_g8_hsw+0x42> + .byte 117,50 // jne 2bc6 <_sk_load_g8_hsw+0x42> .byte 197,250,126,0 // vmovq (%rax),%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,146,32,0,0 // vbroadcastss 0x2092(%rip),%ymm1 # 4b20 <_sk_callback_hsw+0x382> + .byte 196,226,125,24,13,154,32,0,0 // vbroadcastss 0x209a(%rip),%ymm1 # 4c44 <_sk_callback_hsw+0x38a> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,135,32,0,0 // vbroadcastss 0x2087(%rip),%ymm3 # 4b24 <_sk_callback_hsw+0x386> + .byte 196,226,125,24,29,143,32,0,0 // vbroadcastss 0x208f(%rip),%ymm3 # 4c48 <_sk_callback_hsw+0x38e> .byte 76,137,193 // mov %r8,%rcx .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 @@ -11554,9 +11718,9 @@ _sk_load_g8_hsw: .byte 77,9,217 // or %r11,%r9 .byte 72,131,193,8 // add $0x8,%rcx .byte 73,255,202 // dec %r10 - .byte 117,234 // jne 2ab2 <_sk_load_g8_hsw+0x4a> + .byte 117,234 // jne 2bce <_sk_load_g8_hsw+0x4a> .byte 196,193,249,110,193 // vmovq %r9,%xmm0 - .byte 235,173 // jmp 2a7c <_sk_load_g8_hsw+0x14> + .byte 235,173 // jmp 2b98 <_sk_load_g8_hsw+0x14> HIDDEN _sk_gather_g8_hsw .globl _sk_gather_g8_hsw @@ -11602,10 +11766,10 @@ _sk_gather_g8_hsw: .byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,156,31,0,0 // vbroadcastss 0x1f9c(%rip),%ymm1 # 4b28 <_sk_callback_hsw+0x38a> + .byte 196,226,125,24,13,164,31,0,0 // vbroadcastss 0x1fa4(%rip),%ymm1 # 4c4c <_sk_callback_hsw+0x392> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,145,31,0,0 // vbroadcastss 0x1f91(%rip),%ymm3 # 4b2c <_sk_callback_hsw+0x38e> + .byte 196,226,125,24,29,153,31,0,0 // vbroadcastss 0x1f99(%rip),%ymm3 # 4c50 <_sk_callback_hsw+0x396> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 91 // pop %rbx @@ -11621,9 +11785,9 @@ _sk_gather_i8_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 73,137,192 // mov %rax,%r8 .byte 77,133,192 // test %r8,%r8 - .byte 116,5 // je 2bbb <_sk_gather_i8_hsw+0xf> + .byte 116,5 // je 2cd7 <_sk_gather_i8_hsw+0xf> .byte 76,137,192 // mov %r8,%rax - .byte 235,2 // jmp 2bbd <_sk_gather_i8_hsw+0x11> + .byte 235,2 // jmp 2cd9 <_sk_gather_i8_hsw+0x11> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,87 // push %r15 .byte 65,86 // push %r14 @@ -11661,14 +11825,14 @@ _sk_gather_i8_hsw: .byte 73,139,64,8 // mov 0x8(%r8),%rax .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,226,117,144,28,128 // vpgatherdd %ymm1,(%rax,%ymm0,4),%ymm3 - .byte 197,229,219,5,213,32,0,0 // vpand 0x20d5(%rip),%ymm3,%ymm0 # 4d40 <_sk_callback_hsw+0x5a2> + .byte 197,229,219,5,57,33,0,0 // vpand 0x2139(%rip),%ymm3,%ymm0 # 4ec0 <_sk_callback_hsw+0x606> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,184,30,0,0 // vbroadcastss 0x1eb8(%rip),%ymm8 # 4b30 <_sk_callback_hsw+0x392> + .byte 196,98,125,24,5,192,30,0,0 // vbroadcastss 0x1ec0(%rip),%ymm8 # 4c54 <_sk_callback_hsw+0x39a> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,226,101,0,13,218,32,0,0 // vpshufb 0x20da(%rip),%ymm3,%ymm1 # 4d60 <_sk_callback_hsw+0x5c2> + .byte 196,226,101,0,13,62,33,0,0 // vpshufb 0x213e(%rip),%ymm3,%ymm1 # 4ee0 <_sk_callback_hsw+0x626> .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,226,101,0,21,232,32,0,0 // vpshufb 0x20e8(%rip),%ymm3,%ymm2 # 4d80 <_sk_callback_hsw+0x5e2> + .byte 196,226,101,0,21,76,33,0,0 // vpshufb 0x214c(%rip),%ymm3,%ymm2 # 4f00 <_sk_callback_hsw+0x646> .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -11689,35 +11853,35 @@ _sk_load_565_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 72,133,201 // test %rcx,%rcx - .byte 117,114 // jne 2d38 <_sk_load_565_hsw+0x7c> + .byte 117,114 // jne 2e54 <_sk_load_565_hsw+0x7c> .byte 196,193,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm0 .byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2 - .byte 196,226,125,88,5,90,30,0,0 // vpbroadcastd 0x1e5a(%rip),%ymm0 # 4b34 <_sk_callback_hsw+0x396> + .byte 196,226,125,88,5,98,30,0,0 // vpbroadcastd 0x1e62(%rip),%ymm0 # 4c58 <_sk_callback_hsw+0x39e> .byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,77,30,0,0 // vbroadcastss 0x1e4d(%rip),%ymm1 # 4b38 <_sk_callback_hsw+0x39a> + .byte 196,226,125,24,13,85,30,0,0 // vbroadcastss 0x1e55(%rip),%ymm1 # 4c5c <_sk_callback_hsw+0x3a2> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,68,30,0,0 // vpbroadcastd 0x1e44(%rip),%ymm1 # 4b3c <_sk_callback_hsw+0x39e> + .byte 196,226,125,88,13,76,30,0,0 // vpbroadcastd 0x1e4c(%rip),%ymm1 # 4c60 <_sk_callback_hsw+0x3a6> .byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,55,30,0,0 // vbroadcastss 0x1e37(%rip),%ymm3 # 4b40 <_sk_callback_hsw+0x3a2> + .byte 196,226,125,24,29,63,30,0,0 // vbroadcastss 0x1e3f(%rip),%ymm3 # 4c64 <_sk_callback_hsw+0x3aa> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,88,29,46,30,0,0 // vpbroadcastd 0x1e2e(%rip),%ymm3 # 4b44 <_sk_callback_hsw+0x3a6> + .byte 196,226,125,88,29,54,30,0,0 // vpbroadcastd 0x1e36(%rip),%ymm3 # 4c68 <_sk_callback_hsw+0x3ae> .byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,33,30,0,0 // vbroadcastss 0x1e21(%rip),%ymm3 # 4b48 <_sk_callback_hsw+0x3aa> + .byte 196,226,125,24,29,41,30,0,0 // vbroadcastss 0x1e29(%rip),%ymm3 # 4c6c <_sk_callback_hsw+0x3b2> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,22,30,0,0 // vbroadcastss 0x1e16(%rip),%ymm3 # 4b4c <_sk_callback_hsw+0x3ae> + .byte 196,226,125,24,29,30,30,0,0 // vbroadcastss 0x1e1e(%rip),%ymm3 # 4c70 <_sk_callback_hsw+0x3b6> .byte 255,224 // jmpq *%rax .byte 65,137,200 // mov %ecx,%r8d .byte 65,128,224,7 // and $0x7,%r8b .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 119,128 // ja 2ccc <_sk_load_565_hsw+0x10> + .byte 119,128 // ja 2de8 <_sk_load_565_hsw+0x10> .byte 69,15,182,192 // movzbl %r8b,%r8d - .byte 76,141,13,73,0,0,0 // lea 0x49(%rip),%r9 # 2da0 <_sk_load_565_hsw+0xe4> + .byte 76,141,13,73,0,0,0 // lea 0x49(%rip),%r9 # 2ebc <_sk_load_565_hsw+0xe4> .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax @@ -11729,7 +11893,7 @@ _sk_load_565_hsw: .byte 196,193,121,196,68,122,4,2 // vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm0,%xmm0 .byte 196,193,121,196,68,122,2,1 // vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm0,%xmm0 .byte 196,193,121,196,4,122,0 // vpinsrw $0x0,(%r10,%rdi,2),%xmm0,%xmm0 - .byte 233,44,255,255,255 // jmpq 2ccc <_sk_load_565_hsw+0x10> + .byte 233,44,255,255,255 // jmpq 2de8 <_sk_load_565_hsw+0x10> .byte 244 // hlt .byte 255 // (bad) .byte 255 // (bad) @@ -11799,23 +11963,23 @@ _sk_gather_565_hsw: .byte 65,15,183,4,88 // movzwl (%r8,%rbx,2),%eax .byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2 - .byte 196,226,125,88,5,217,28,0,0 // vpbroadcastd 0x1cd9(%rip),%ymm0 # 4b50 <_sk_callback_hsw+0x3b2> + .byte 196,226,125,88,5,225,28,0,0 // vpbroadcastd 0x1ce1(%rip),%ymm0 # 4c74 <_sk_callback_hsw+0x3ba> .byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,204,28,0,0 // vbroadcastss 0x1ccc(%rip),%ymm1 # 4b54 <_sk_callback_hsw+0x3b6> + .byte 196,226,125,24,13,212,28,0,0 // vbroadcastss 0x1cd4(%rip),%ymm1 # 4c78 <_sk_callback_hsw+0x3be> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,195,28,0,0 // vpbroadcastd 0x1cc3(%rip),%ymm1 # 4b58 <_sk_callback_hsw+0x3ba> + .byte 196,226,125,88,13,203,28,0,0 // vpbroadcastd 0x1ccb(%rip),%ymm1 # 4c7c <_sk_callback_hsw+0x3c2> .byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,182,28,0,0 // vbroadcastss 0x1cb6(%rip),%ymm3 # 4b5c <_sk_callback_hsw+0x3be> + .byte 196,226,125,24,29,190,28,0,0 // vbroadcastss 0x1cbe(%rip),%ymm3 # 4c80 <_sk_callback_hsw+0x3c6> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,88,29,173,28,0,0 // vpbroadcastd 0x1cad(%rip),%ymm3 # 4b60 <_sk_callback_hsw+0x3c2> + .byte 196,226,125,88,29,181,28,0,0 // vpbroadcastd 0x1cb5(%rip),%ymm3 # 4c84 <_sk_callback_hsw+0x3ca> .byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,160,28,0,0 // vbroadcastss 0x1ca0(%rip),%ymm3 # 4b64 <_sk_callback_hsw+0x3c6> + .byte 196,226,125,24,29,168,28,0,0 // vbroadcastss 0x1ca8(%rip),%ymm3 # 4c88 <_sk_callback_hsw+0x3ce> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,149,28,0,0 // vbroadcastss 0x1c95(%rip),%ymm3 # 4b68 <_sk_callback_hsw+0x3ca> + .byte 196,226,125,24,29,157,28,0,0 // vbroadcastss 0x1c9d(%rip),%ymm3 # 4c8c <_sk_callback_hsw+0x3d2> .byte 91 // pop %rbx .byte 65,92 // pop %r12 .byte 65,94 // pop %r14 @@ -11828,11 +11992,11 @@ FUNCTION(_sk_store_565_hsw) _sk_store_565_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 196,98,125,24,5,130,28,0,0 // vbroadcastss 0x1c82(%rip),%ymm8 # 4b6c <_sk_callback_hsw+0x3ce> + .byte 196,98,125,24,5,138,28,0,0 // vbroadcastss 0x1c8a(%rip),%ymm8 # 4c90 <_sk_callback_hsw+0x3d6> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9 - .byte 196,98,125,24,21,109,28,0,0 // vbroadcastss 0x1c6d(%rip),%ymm10 # 4b70 <_sk_callback_hsw+0x3d2> + .byte 196,98,125,24,21,117,28,0,0 // vbroadcastss 0x1c75(%rip),%ymm10 # 4c94 <_sk_callback_hsw+0x3da> .byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10 .byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10 .byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10 @@ -11843,7 +12007,7 @@ _sk_store_565_hsw: .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 72,133,201 // test %rcx,%rcx - .byte 117,10 // jne 2f41 <_sk_store_565_hsw+0x65> + .byte 117,10 // jne 305d <_sk_store_565_hsw+0x65> .byte 196,65,122,127,4,122 // vmovdqu %xmm8,(%r10,%rdi,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11851,9 +12015,9 @@ _sk_store_565_hsw: .byte 65,128,224,7 // and $0x7,%r8b .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 119,236 // ja 2f3d <_sk_store_565_hsw+0x61> + .byte 119,236 // ja 3059 <_sk_store_565_hsw+0x61> .byte 69,15,182,192 // movzbl %r8b,%r8d - .byte 76,141,13,68,0,0,0 // lea 0x44(%rip),%r9 # 2fa0 <_sk_store_565_hsw+0xc4> + .byte 76,141,13,68,0,0,0 // lea 0x44(%rip),%r9 # 30bc <_sk_store_565_hsw+0xc4> .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax @@ -11864,7 +12028,7 @@ _sk_store_565_hsw: .byte 196,67,121,21,68,122,4,2 // vpextrw $0x2,%xmm8,0x4(%r10,%rdi,2) .byte 196,67,121,21,68,122,2,1 // vpextrw $0x1,%xmm8,0x2(%r10,%rdi,2) .byte 196,67,121,21,4,122,0 // vpextrw $0x0,%xmm8,(%r10,%rdi,2) - .byte 235,159 // jmp 2f3d <_sk_store_565_hsw+0x61> + .byte 235,159 // jmp 3059 <_sk_store_565_hsw+0x61> .byte 102,144 // xchg %ax,%ax .byte 245 // cmc .byte 255 // (bad) @@ -11897,28 +12061,28 @@ _sk_load_4444_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,138,0,0,0 // jne 3054 <_sk_load_4444_hsw+0x98> + .byte 15,133,138,0,0,0 // jne 3170 <_sk_load_4444_hsw+0x98> .byte 196,193,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm0 .byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3 - .byte 196,226,125,88,5,150,27,0,0 // vpbroadcastd 0x1b96(%rip),%ymm0 # 4b74 <_sk_callback_hsw+0x3d6> + .byte 196,226,125,88,5,158,27,0,0 // vpbroadcastd 0x1b9e(%rip),%ymm0 # 4c98 <_sk_callback_hsw+0x3de> .byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,137,27,0,0 // vbroadcastss 0x1b89(%rip),%ymm1 # 4b78 <_sk_callback_hsw+0x3da> + .byte 196,226,125,24,13,145,27,0,0 // vbroadcastss 0x1b91(%rip),%ymm1 # 4c9c <_sk_callback_hsw+0x3e2> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,128,27,0,0 // vpbroadcastd 0x1b80(%rip),%ymm1 # 4b7c <_sk_callback_hsw+0x3de> + .byte 196,226,125,88,13,136,27,0,0 // vpbroadcastd 0x1b88(%rip),%ymm1 # 4ca0 <_sk_callback_hsw+0x3e6> .byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,115,27,0,0 // vbroadcastss 0x1b73(%rip),%ymm2 # 4b80 <_sk_callback_hsw+0x3e2> + .byte 196,226,125,24,21,123,27,0,0 // vbroadcastss 0x1b7b(%rip),%ymm2 # 4ca4 <_sk_callback_hsw+0x3ea> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,88,21,106,27,0,0 // vpbroadcastd 0x1b6a(%rip),%ymm2 # 4b84 <_sk_callback_hsw+0x3e6> + .byte 196,226,125,88,21,114,27,0,0 // vpbroadcastd 0x1b72(%rip),%ymm2 # 4ca8 <_sk_callback_hsw+0x3ee> .byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,93,27,0,0 // vbroadcastss 0x1b5d(%rip),%ymm8 # 4b88 <_sk_callback_hsw+0x3ea> + .byte 196,98,125,24,5,101,27,0,0 // vbroadcastss 0x1b65(%rip),%ymm8 # 4cac <_sk_callback_hsw+0x3f2> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,88,5,83,27,0,0 // vpbroadcastd 0x1b53(%rip),%ymm8 # 4b8c <_sk_callback_hsw+0x3ee> + .byte 196,98,125,88,5,91,27,0,0 // vpbroadcastd 0x1b5b(%rip),%ymm8 # 4cb0 <_sk_callback_hsw+0x3f6> .byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,69,27,0,0 // vbroadcastss 0x1b45(%rip),%ymm8 # 4b90 <_sk_callback_hsw+0x3f2> + .byte 196,98,125,24,5,77,27,0,0 // vbroadcastss 0x1b4d(%rip),%ymm8 # 4cb4 <_sk_callback_hsw+0x3fa> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11927,9 +12091,9 @@ _sk_load_4444_hsw: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 15,135,100,255,255,255 // ja 2fd0 <_sk_load_4444_hsw+0x14> + .byte 15,135,100,255,255,255 // ja 30ec <_sk_load_4444_hsw+0x14> .byte 69,15,182,192 // movzbl %r8b,%r8d - .byte 76,141,13,73,0,0,0 // lea 0x49(%rip),%r9 # 30c0 <_sk_load_4444_hsw+0x104> + .byte 76,141,13,73,0,0,0 // lea 0x49(%rip),%r9 # 31dc <_sk_load_4444_hsw+0x104> .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax @@ -11941,7 +12105,7 @@ _sk_load_4444_hsw: .byte 196,193,121,196,68,122,4,2 // vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm0,%xmm0 .byte 196,193,121,196,68,122,2,1 // vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm0,%xmm0 .byte 196,193,121,196,4,122,0 // vpinsrw $0x0,(%r10,%rdi,2),%xmm0,%xmm0 - .byte 233,16,255,255,255 // jmpq 2fd0 <_sk_load_4444_hsw+0x14> + .byte 233,16,255,255,255 // jmpq 30ec <_sk_load_4444_hsw+0x14> .byte 244 // hlt .byte 255 // (bad) .byte 255 // (bad) @@ -12011,25 +12175,25 @@ _sk_gather_4444_hsw: .byte 65,15,183,4,88 // movzwl (%r8,%rbx,2),%eax .byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3 - .byte 196,226,125,88,5,253,25,0,0 // vpbroadcastd 0x19fd(%rip),%ymm0 # 4b94 <_sk_callback_hsw+0x3f6> + .byte 196,226,125,88,5,5,26,0,0 // vpbroadcastd 0x1a05(%rip),%ymm0 # 4cb8 <_sk_callback_hsw+0x3fe> .byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,240,25,0,0 // vbroadcastss 0x19f0(%rip),%ymm1 # 4b98 <_sk_callback_hsw+0x3fa> + .byte 196,226,125,24,13,248,25,0,0 // vbroadcastss 0x19f8(%rip),%ymm1 # 4cbc <_sk_callback_hsw+0x402> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,231,25,0,0 // vpbroadcastd 0x19e7(%rip),%ymm1 # 4b9c <_sk_callback_hsw+0x3fe> + .byte 196,226,125,88,13,239,25,0,0 // vpbroadcastd 0x19ef(%rip),%ymm1 # 4cc0 <_sk_callback_hsw+0x406> .byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,218,25,0,0 // vbroadcastss 0x19da(%rip),%ymm2 # 4ba0 <_sk_callback_hsw+0x402> + .byte 196,226,125,24,21,226,25,0,0 // vbroadcastss 0x19e2(%rip),%ymm2 # 4cc4 <_sk_callback_hsw+0x40a> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,88,21,209,25,0,0 // vpbroadcastd 0x19d1(%rip),%ymm2 # 4ba4 <_sk_callback_hsw+0x406> + .byte 196,226,125,88,21,217,25,0,0 // vpbroadcastd 0x19d9(%rip),%ymm2 # 4cc8 <_sk_callback_hsw+0x40e> .byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,196,25,0,0 // vbroadcastss 0x19c4(%rip),%ymm8 # 4ba8 <_sk_callback_hsw+0x40a> + .byte 196,98,125,24,5,204,25,0,0 // vbroadcastss 0x19cc(%rip),%ymm8 # 4ccc <_sk_callback_hsw+0x412> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,88,5,186,25,0,0 // vpbroadcastd 0x19ba(%rip),%ymm8 # 4bac <_sk_callback_hsw+0x40e> + .byte 196,98,125,88,5,194,25,0,0 // vpbroadcastd 0x19c2(%rip),%ymm8 # 4cd0 <_sk_callback_hsw+0x416> .byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,172,25,0,0 // vbroadcastss 0x19ac(%rip),%ymm8 # 4bb0 <_sk_callback_hsw+0x412> + .byte 196,98,125,24,5,180,25,0,0 // vbroadcastss 0x19b4(%rip),%ymm8 # 4cd4 <_sk_callback_hsw+0x41a> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -12044,7 +12208,7 @@ FUNCTION(_sk_store_4444_hsw) _sk_store_4444_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 196,98,125,24,5,146,25,0,0 // vbroadcastss 0x1992(%rip),%ymm8 # 4bb4 <_sk_callback_hsw+0x416> + .byte 196,98,125,24,5,154,25,0,0 // vbroadcastss 0x199a(%rip),%ymm8 # 4cd8 <_sk_callback_hsw+0x41e> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9 @@ -12062,7 +12226,7 @@ _sk_store_4444_hsw: .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 72,133,201 // test %rcx,%rcx - .byte 117,10 // jne 3285 <_sk_store_4444_hsw+0x71> + .byte 117,10 // jne 33a1 <_sk_store_4444_hsw+0x71> .byte 196,65,122,127,4,122 // vmovdqu %xmm8,(%r10,%rdi,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -12070,9 +12234,9 @@ _sk_store_4444_hsw: .byte 65,128,224,7 // and $0x7,%r8b .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 119,236 // ja 3281 <_sk_store_4444_hsw+0x6d> + .byte 119,236 // ja 339d <_sk_store_4444_hsw+0x6d> .byte 69,15,182,192 // movzbl %r8b,%r8d - .byte 76,141,13,68,0,0,0 // lea 0x44(%rip),%r9 # 32e4 <_sk_store_4444_hsw+0xd0> + .byte 76,141,13,68,0,0,0 // lea 0x44(%rip),%r9 # 3400 <_sk_store_4444_hsw+0xd0> .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax @@ -12083,7 +12247,7 @@ _sk_store_4444_hsw: .byte 196,67,121,21,68,122,4,2 // vpextrw $0x2,%xmm8,0x4(%r10,%rdi,2) .byte 196,67,121,21,68,122,2,1 // vpextrw $0x1,%xmm8,0x2(%r10,%rdi,2) .byte 196,67,121,21,4,122,0 // vpextrw $0x0,%xmm8,(%r10,%rdi,2) - .byte 235,159 // jmp 3281 <_sk_store_4444_hsw+0x6d> + .byte 235,159 // jmp 339d <_sk_store_4444_hsw+0x6d> .byte 102,144 // xchg %ax,%ax .byte 245 // cmc .byte 255 // (bad) @@ -12118,16 +12282,16 @@ _sk_load_8888_hsw: .byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9 .byte 76,3,8 // add (%rax),%r9 .byte 77,133,192 // test %r8,%r8 - .byte 117,88 // jne 336d <_sk_load_8888_hsw+0x6d> + .byte 117,88 // jne 3489 <_sk_load_8888_hsw+0x6d> .byte 196,193,126,111,25 // vmovdqu (%r9),%ymm3 - .byte 197,229,219,5,126,26,0,0 // vpand 0x1a7e(%rip),%ymm3,%ymm0 # 4da0 <_sk_callback_hsw+0x602> + .byte 197,229,219,5,226,26,0,0 // vpand 0x1ae2(%rip),%ymm3,%ymm0 # 4f20 <_sk_callback_hsw+0x666> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,137,24,0,0 // vbroadcastss 0x1889(%rip),%ymm8 # 4bb8 <_sk_callback_hsw+0x41a> + .byte 196,98,125,24,5,145,24,0,0 // vbroadcastss 0x1891(%rip),%ymm8 # 4cdc <_sk_callback_hsw+0x422> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,226,101,0,13,131,26,0,0 // vpshufb 0x1a83(%rip),%ymm3,%ymm1 # 4dc0 <_sk_callback_hsw+0x622> + .byte 196,226,101,0,13,231,26,0,0 // vpshufb 0x1ae7(%rip),%ymm3,%ymm1 # 4f40 <_sk_callback_hsw+0x686> .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,226,101,0,21,145,26,0,0 // vpshufb 0x1a91(%rip),%ymm3,%ymm2 # 4de0 <_sk_callback_hsw+0x642> + .byte 196,226,101,0,21,245,26,0,0 // vpshufb 0x1af5(%rip),%ymm3,%ymm2 # 4f60 <_sk_callback_hsw+0x6a6> .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -12144,7 +12308,7 @@ _sk_load_8888_hsw: .byte 196,225,249,110,192 // vmovq %rax,%xmm0 .byte 196,226,125,33,192 // vpmovsxbd %xmm0,%ymm0 .byte 196,194,125,140,25 // vpmaskmovd (%r9),%ymm0,%ymm3 - .byte 235,135 // jmp 331a <_sk_load_8888_hsw+0x1a> + .byte 235,135 // jmp 3436 <_sk_load_8888_hsw+0x1a> HIDDEN _sk_gather_8888_hsw .globl _sk_gather_8888_hsw @@ -12159,14 +12323,14 @@ _sk_gather_8888_hsw: .byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,194,117,144,28,128 // vpgatherdd %ymm1,(%r8,%ymm0,4),%ymm3 - .byte 197,229,219,5,63,26,0,0 // vpand 0x1a3f(%rip),%ymm3,%ymm0 # 4e00 <_sk_callback_hsw+0x662> + .byte 197,229,219,5,163,26,0,0 // vpand 0x1aa3(%rip),%ymm3,%ymm0 # 4f80 <_sk_callback_hsw+0x6c6> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,238,23,0,0 // vbroadcastss 0x17ee(%rip),%ymm8 # 4bbc <_sk_callback_hsw+0x41e> + .byte 196,98,125,24,5,246,23,0,0 // vbroadcastss 0x17f6(%rip),%ymm8 # 4ce0 <_sk_callback_hsw+0x426> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,226,101,0,13,68,26,0,0 // vpshufb 0x1a44(%rip),%ymm3,%ymm1 # 4e20 <_sk_callback_hsw+0x682> + .byte 196,226,101,0,13,168,26,0,0 // vpshufb 0x1aa8(%rip),%ymm3,%ymm1 # 4fa0 <_sk_callback_hsw+0x6e6> .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,226,101,0,21,82,26,0,0 // vpshufb 0x1a52(%rip),%ymm3,%ymm2 # 4e40 <_sk_callback_hsw+0x6a2> + .byte 196,226,101,0,21,182,26,0,0 // vpshufb 0x1ab6(%rip),%ymm3,%ymm2 # 4fc0 <_sk_callback_hsw+0x706> .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -12183,7 +12347,7 @@ _sk_store_8888_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9 .byte 76,3,8 // add (%rax),%r9 - .byte 196,98,125,24,5,158,23,0,0 // vbroadcastss 0x179e(%rip),%ymm8 # 4bc0 <_sk_callback_hsw+0x422> + .byte 196,98,125,24,5,166,23,0,0 // vbroadcastss 0x17a6(%rip),%ymm8 # 4ce4 <_sk_callback_hsw+0x42a> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10 @@ -12199,7 +12363,7 @@ _sk_store_8888_hsw: .byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8 .byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,12 // jne 347c <_sk_store_8888_hsw+0x73> + .byte 117,12 // jne 3598 <_sk_store_8888_hsw+0x73> .byte 196,65,126,127,1 // vmovdqu %ymm8,(%r9) .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,137,193 // mov %r8,%rcx @@ -12212,7 +12376,7 @@ _sk_store_8888_hsw: .byte 196,97,249,110,200 // vmovq %rax,%xmm9 .byte 196,66,125,33,201 // vpmovsxbd %xmm9,%ymm9 .byte 196,66,53,142,1 // vpmaskmovd %ymm8,%ymm9,(%r9) - .byte 235,211 // jmp 3475 <_sk_store_8888_hsw+0x6c> + .byte 235,211 // jmp 3591 <_sk_store_8888_hsw+0x6c> HIDDEN _sk_load_f16_hsw .globl _sk_load_f16_hsw @@ -12221,7 +12385,7 @@ _sk_load_f16_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 72,133,201 // test %rcx,%rcx - .byte 117,97 // jne 350d <_sk_load_f16_hsw+0x6b> + .byte 117,97 // jne 3629 <_sk_load_f16_hsw+0x6b> .byte 197,121,16,4,248 // vmovupd (%rax,%rdi,8),%xmm8 .byte 197,249,16,84,248,16 // vmovupd 0x10(%rax,%rdi,8),%xmm2 .byte 197,249,16,92,248,32 // vmovupd 0x20(%rax,%rdi,8),%xmm3 @@ -12247,29 +12411,29 @@ _sk_load_f16_hsw: .byte 197,123,16,4,248 // vmovsd (%rax,%rdi,8),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 116,79 // je 356c <_sk_load_f16_hsw+0xca> + .byte 116,79 // je 3688 <_sk_load_f16_hsw+0xca> .byte 197,57,22,68,248,8 // vmovhpd 0x8(%rax,%rdi,8),%xmm8,%xmm8 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,67 // jb 356c <_sk_load_f16_hsw+0xca> + .byte 114,67 // jb 3688 <_sk_load_f16_hsw+0xca> .byte 197,251,16,84,248,16 // vmovsd 0x10(%rax,%rdi,8),%xmm2 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 116,68 // je 3579 <_sk_load_f16_hsw+0xd7> + .byte 116,68 // je 3695 <_sk_load_f16_hsw+0xd7> .byte 197,233,22,84,248,24 // vmovhpd 0x18(%rax,%rdi,8),%xmm2,%xmm2 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,56 // jb 3579 <_sk_load_f16_hsw+0xd7> + .byte 114,56 // jb 3695 <_sk_load_f16_hsw+0xd7> .byte 197,251,16,92,248,32 // vmovsd 0x20(%rax,%rdi,8),%xmm3 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 15,132,114,255,255,255 // je 34c3 <_sk_load_f16_hsw+0x21> + .byte 15,132,114,255,255,255 // je 35df <_sk_load_f16_hsw+0x21> .byte 197,225,22,92,248,40 // vmovhpd 0x28(%rax,%rdi,8),%xmm3,%xmm3 .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 15,130,98,255,255,255 // jb 34c3 <_sk_load_f16_hsw+0x21> + .byte 15,130,98,255,255,255 // jb 35df <_sk_load_f16_hsw+0x21> .byte 197,122,126,76,248,48 // vmovq 0x30(%rax,%rdi,8),%xmm9 - .byte 233,87,255,255,255 // jmpq 34c3 <_sk_load_f16_hsw+0x21> + .byte 233,87,255,255,255 // jmpq 35df <_sk_load_f16_hsw+0x21> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,74,255,255,255 // jmpq 34c3 <_sk_load_f16_hsw+0x21> + .byte 233,74,255,255,255 // jmpq 35df <_sk_load_f16_hsw+0x21> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,65,255,255,255 // jmpq 34c3 <_sk_load_f16_hsw+0x21> + .byte 233,65,255,255,255 // jmpq 35df <_sk_load_f16_hsw+0x21> HIDDEN _sk_gather_f16_hsw .globl _sk_gather_f16_hsw @@ -12327,7 +12491,7 @@ _sk_store_f16_hsw: .byte 196,65,57,98,205 // vpunpckldq %xmm13,%xmm8,%xmm9 .byte 196,65,57,106,197 // vpunpckhdq %xmm13,%xmm8,%xmm8 .byte 72,133,201 // test %rcx,%rcx - .byte 117,27 // jne 3671 <_sk_store_f16_hsw+0x65> + .byte 117,27 // jne 378d <_sk_store_f16_hsw+0x65> .byte 197,120,17,28,248 // vmovups %xmm11,(%rax,%rdi,8) .byte 197,120,17,84,248,16 // vmovups %xmm10,0x10(%rax,%rdi,8) .byte 197,120,17,76,248,32 // vmovups %xmm9,0x20(%rax,%rdi,8) @@ -12336,22 +12500,22 @@ _sk_store_f16_hsw: .byte 255,224 // jmpq *%rax .byte 197,121,214,28,248 // vmovq %xmm11,(%rax,%rdi,8) .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 116,241 // je 366d <_sk_store_f16_hsw+0x61> + .byte 116,241 // je 3789 <_sk_store_f16_hsw+0x61> .byte 197,121,23,92,248,8 // vmovhpd %xmm11,0x8(%rax,%rdi,8) .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,229 // jb 366d <_sk_store_f16_hsw+0x61> + .byte 114,229 // jb 3789 <_sk_store_f16_hsw+0x61> .byte 197,121,214,84,248,16 // vmovq %xmm10,0x10(%rax,%rdi,8) - .byte 116,221 // je 366d <_sk_store_f16_hsw+0x61> + .byte 116,221 // je 3789 <_sk_store_f16_hsw+0x61> .byte 197,121,23,84,248,24 // vmovhpd %xmm10,0x18(%rax,%rdi,8) .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,209 // jb 366d <_sk_store_f16_hsw+0x61> + .byte 114,209 // jb 3789 <_sk_store_f16_hsw+0x61> .byte 197,121,214,76,248,32 // vmovq %xmm9,0x20(%rax,%rdi,8) - .byte 116,201 // je 366d <_sk_store_f16_hsw+0x61> + .byte 116,201 // je 3789 <_sk_store_f16_hsw+0x61> .byte 197,121,23,76,248,40 // vmovhpd %xmm9,0x28(%rax,%rdi,8) .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 114,189 // jb 366d <_sk_store_f16_hsw+0x61> + .byte 114,189 // jb 3789 <_sk_store_f16_hsw+0x61> .byte 197,121,214,68,248,48 // vmovq %xmm8,0x30(%rax,%rdi,8) - .byte 235,181 // jmp 366d <_sk_store_f16_hsw+0x61> + .byte 235,181 // jmp 3789 <_sk_store_f16_hsw+0x61> HIDDEN _sk_load_u16_be_hsw .globl _sk_load_u16_be_hsw @@ -12361,7 +12525,7 @@ _sk_load_u16_be_hsw: .byte 76,139,0 // mov (%rax),%r8 .byte 72,141,4,189,0,0,0,0 // lea 0x0(,%rdi,4),%rax .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,204,0,0,0 // jne 379a <_sk_load_u16_be_hsw+0xe2> + .byte 15,133,204,0,0,0 // jne 38b6 <_sk_load_u16_be_hsw+0xe2> .byte 196,65,121,16,4,64 // vmovupd (%r8,%rax,2),%xmm8 .byte 196,193,121,16,84,64,16 // vmovupd 0x10(%r8,%rax,2),%xmm2 .byte 196,193,121,16,92,64,32 // vmovupd 0x20(%r8,%rax,2),%xmm3 @@ -12380,7 +12544,7 @@ _sk_load_u16_be_hsw: .byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0 .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,21,149,20,0,0 // vbroadcastss 0x1495(%rip),%ymm10 # 4bc4 <_sk_callback_hsw+0x426> + .byte 196,98,125,24,21,157,20,0,0 // vbroadcastss 0x149d(%rip),%ymm10 # 4ce8 <_sk_callback_hsw+0x42e> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -12408,29 +12572,29 @@ _sk_load_u16_be_hsw: .byte 196,65,123,16,4,64 // vmovsd (%r8,%rax,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 116,85 // je 3800 <_sk_load_u16_be_hsw+0x148> + .byte 116,85 // je 391c <_sk_load_u16_be_hsw+0x148> .byte 196,65,57,22,68,64,8 // vmovhpd 0x8(%r8,%rax,2),%xmm8,%xmm8 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,72 // jb 3800 <_sk_load_u16_be_hsw+0x148> + .byte 114,72 // jb 391c <_sk_load_u16_be_hsw+0x148> .byte 196,193,123,16,84,64,16 // vmovsd 0x10(%r8,%rax,2),%xmm2 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 116,72 // je 380d <_sk_load_u16_be_hsw+0x155> + .byte 116,72 // je 3929 <_sk_load_u16_be_hsw+0x155> .byte 196,193,105,22,84,64,24 // vmovhpd 0x18(%r8,%rax,2),%xmm2,%xmm2 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,59 // jb 380d <_sk_load_u16_be_hsw+0x155> + .byte 114,59 // jb 3929 <_sk_load_u16_be_hsw+0x155> .byte 196,193,123,16,92,64,32 // vmovsd 0x20(%r8,%rax,2),%xmm3 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 15,132,6,255,255,255 // je 36e9 <_sk_load_u16_be_hsw+0x31> + .byte 15,132,6,255,255,255 // je 3805 <_sk_load_u16_be_hsw+0x31> .byte 196,193,97,22,92,64,40 // vmovhpd 0x28(%r8,%rax,2),%xmm3,%xmm3 .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 15,130,245,254,255,255 // jb 36e9 <_sk_load_u16_be_hsw+0x31> + .byte 15,130,245,254,255,255 // jb 3805 <_sk_load_u16_be_hsw+0x31> .byte 196,65,122,126,76,64,48 // vmovq 0x30(%r8,%rax,2),%xmm9 - .byte 233,233,254,255,255 // jmpq 36e9 <_sk_load_u16_be_hsw+0x31> + .byte 233,233,254,255,255 // jmpq 3805 <_sk_load_u16_be_hsw+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,220,254,255,255 // jmpq 36e9 <_sk_load_u16_be_hsw+0x31> + .byte 233,220,254,255,255 // jmpq 3805 <_sk_load_u16_be_hsw+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,211,254,255,255 // jmpq 36e9 <_sk_load_u16_be_hsw+0x31> + .byte 233,211,254,255,255 // jmpq 3805 <_sk_load_u16_be_hsw+0x31> HIDDEN _sk_load_rgb_u16_be_hsw .globl _sk_load_rgb_u16_be_hsw @@ -12440,7 +12604,7 @@ _sk_load_rgb_u16_be_hsw: .byte 76,139,0 // mov (%rax),%r8 .byte 72,141,4,127 // lea (%rdi,%rdi,2),%rax .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,204,0,0,0 // jne 38f4 <_sk_load_rgb_u16_be_hsw+0xde> + .byte 15,133,204,0,0,0 // jne 3a10 <_sk_load_rgb_u16_be_hsw+0xde> .byte 196,193,122,111,4,64 // vmovdqu (%r8,%rax,2),%xmm0 .byte 196,193,122,111,84,64,12 // vmovdqu 0xc(%r8,%rax,2),%xmm2 .byte 196,193,122,111,76,64,24 // vmovdqu 0x18(%r8,%rax,2),%xmm1 @@ -12464,7 +12628,7 @@ _sk_load_rgb_u16_be_hsw: .byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0 .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,21,38,19,0,0 // vbroadcastss 0x1326(%rip),%ymm10 # 4bc8 <_sk_callback_hsw+0x42a> + .byte 196,98,125,24,21,46,19,0,0 // vbroadcastss 0x132e(%rip),%ymm10 # 4cec <_sk_callback_hsw+0x432> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -12481,41 +12645,41 @@ _sk_load_rgb_u16_be_hsw: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,218,18,0,0 // vbroadcastss 0x12da(%rip),%ymm3 # 4bcc <_sk_callback_hsw+0x42e> + .byte 196,226,125,24,29,226,18,0,0 // vbroadcastss 0x12e2(%rip),%ymm3 # 4cf0 <_sk_callback_hsw+0x436> .byte 255,224 // jmpq *%rax .byte 196,193,121,110,4,64 // vmovd (%r8,%rax,2),%xmm0 .byte 196,193,121,196,68,64,4,2 // vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm0 .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 117,5 // jne 390d <_sk_load_rgb_u16_be_hsw+0xf7> - .byte 233,79,255,255,255 // jmpq 385c <_sk_load_rgb_u16_be_hsw+0x46> + .byte 117,5 // jne 3a29 <_sk_load_rgb_u16_be_hsw+0xf7> + .byte 233,79,255,255,255 // jmpq 3978 <_sk_load_rgb_u16_be_hsw+0x46> .byte 196,193,121,110,76,64,6 // vmovd 0x6(%r8,%rax,2),%xmm1 .byte 196,65,113,196,68,64,10,2 // vpinsrw $0x2,0xa(%r8,%rax,2),%xmm1,%xmm8 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,26 // jb 393c <_sk_load_rgb_u16_be_hsw+0x126> + .byte 114,26 // jb 3a58 <_sk_load_rgb_u16_be_hsw+0x126> .byte 196,193,121,110,76,64,12 // vmovd 0xc(%r8,%rax,2),%xmm1 .byte 196,193,113,196,84,64,16,2 // vpinsrw $0x2,0x10(%r8,%rax,2),%xmm1,%xmm2 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 117,10 // jne 3941 <_sk_load_rgb_u16_be_hsw+0x12b> - .byte 233,32,255,255,255 // jmpq 385c <_sk_load_rgb_u16_be_hsw+0x46> - .byte 233,27,255,255,255 // jmpq 385c <_sk_load_rgb_u16_be_hsw+0x46> + .byte 117,10 // jne 3a5d <_sk_load_rgb_u16_be_hsw+0x12b> + .byte 233,32,255,255,255 // jmpq 3978 <_sk_load_rgb_u16_be_hsw+0x46> + .byte 233,27,255,255,255 // jmpq 3978 <_sk_load_rgb_u16_be_hsw+0x46> .byte 196,193,121,110,76,64,18 // vmovd 0x12(%r8,%rax,2),%xmm1 .byte 196,65,113,196,76,64,22,2 // vpinsrw $0x2,0x16(%r8,%rax,2),%xmm1,%xmm9 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,26 // jb 3970 <_sk_load_rgb_u16_be_hsw+0x15a> + .byte 114,26 // jb 3a8c <_sk_load_rgb_u16_be_hsw+0x15a> .byte 196,193,121,110,76,64,24 // vmovd 0x18(%r8,%rax,2),%xmm1 .byte 196,193,113,196,76,64,28,2 // vpinsrw $0x2,0x1c(%r8,%rax,2),%xmm1,%xmm1 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 117,10 // jne 3975 <_sk_load_rgb_u16_be_hsw+0x15f> - .byte 233,236,254,255,255 // jmpq 385c <_sk_load_rgb_u16_be_hsw+0x46> - .byte 233,231,254,255,255 // jmpq 385c <_sk_load_rgb_u16_be_hsw+0x46> + .byte 117,10 // jne 3a91 <_sk_load_rgb_u16_be_hsw+0x15f> + .byte 233,236,254,255,255 // jmpq 3978 <_sk_load_rgb_u16_be_hsw+0x46> + .byte 233,231,254,255,255 // jmpq 3978 <_sk_load_rgb_u16_be_hsw+0x46> .byte 196,193,121,110,92,64,30 // vmovd 0x1e(%r8,%rax,2),%xmm3 .byte 196,65,97,196,92,64,34,2 // vpinsrw $0x2,0x22(%r8,%rax,2),%xmm3,%xmm11 .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 114,20 // jb 399e <_sk_load_rgb_u16_be_hsw+0x188> + .byte 114,20 // jb 3aba <_sk_load_rgb_u16_be_hsw+0x188> .byte 196,193,121,110,92,64,36 // vmovd 0x24(%r8,%rax,2),%xmm3 .byte 196,193,97,196,92,64,40,2 // vpinsrw $0x2,0x28(%r8,%rax,2),%xmm3,%xmm3 - .byte 233,190,254,255,255 // jmpq 385c <_sk_load_rgb_u16_be_hsw+0x46> - .byte 233,185,254,255,255 // jmpq 385c <_sk_load_rgb_u16_be_hsw+0x46> + .byte 233,190,254,255,255 // jmpq 3978 <_sk_load_rgb_u16_be_hsw+0x46> + .byte 233,185,254,255,255 // jmpq 3978 <_sk_load_rgb_u16_be_hsw+0x46> HIDDEN _sk_store_u16_be_hsw .globl _sk_store_u16_be_hsw @@ -12524,7 +12688,7 @@ _sk_store_u16_be_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,0 // mov (%rax),%r8 .byte 72,141,4,189,0,0,0,0 // lea 0x0(,%rdi,4),%rax - .byte 196,98,125,24,5,23,18,0,0 // vbroadcastss 0x1217(%rip),%ymm8 # 4bd0 <_sk_callback_hsw+0x432> + .byte 196,98,125,24,5,31,18,0,0 // vbroadcastss 0x121f(%rip),%ymm8 # 4cf4 <_sk_callback_hsw+0x43a> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10 @@ -12562,7 +12726,7 @@ _sk_store_u16_be_hsw: .byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9 .byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8 .byte 72,133,201 // test %rcx,%rcx - .byte 117,31 // jne 3a9d <_sk_store_u16_be_hsw+0xfa> + .byte 117,31 // jne 3bb9 <_sk_store_u16_be_hsw+0xfa> .byte 196,65,120,17,28,64 // vmovups %xmm11,(%r8,%rax,2) .byte 196,65,120,17,84,64,16 // vmovups %xmm10,0x10(%r8,%rax,2) .byte 196,65,120,17,76,64,32 // vmovups %xmm9,0x20(%r8,%rax,2) @@ -12571,22 +12735,22 @@ _sk_store_u16_be_hsw: .byte 255,224 // jmpq *%rax .byte 196,65,121,214,28,64 // vmovq %xmm11,(%r8,%rax,2) .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 116,240 // je 3a99 <_sk_store_u16_be_hsw+0xf6> + .byte 116,240 // je 3bb5 <_sk_store_u16_be_hsw+0xf6> .byte 196,65,121,23,92,64,8 // vmovhpd %xmm11,0x8(%r8,%rax,2) .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,227 // jb 3a99 <_sk_store_u16_be_hsw+0xf6> + .byte 114,227 // jb 3bb5 <_sk_store_u16_be_hsw+0xf6> .byte 196,65,121,214,84,64,16 // vmovq %xmm10,0x10(%r8,%rax,2) - .byte 116,218 // je 3a99 <_sk_store_u16_be_hsw+0xf6> + .byte 116,218 // je 3bb5 <_sk_store_u16_be_hsw+0xf6> .byte 196,65,121,23,84,64,24 // vmovhpd %xmm10,0x18(%r8,%rax,2) .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,205 // jb 3a99 <_sk_store_u16_be_hsw+0xf6> + .byte 114,205 // jb 3bb5 <_sk_store_u16_be_hsw+0xf6> .byte 196,65,121,214,76,64,32 // vmovq %xmm9,0x20(%r8,%rax,2) - .byte 116,196 // je 3a99 <_sk_store_u16_be_hsw+0xf6> + .byte 116,196 // je 3bb5 <_sk_store_u16_be_hsw+0xf6> .byte 196,65,121,23,76,64,40 // vmovhpd %xmm9,0x28(%r8,%rax,2) .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 114,183 // jb 3a99 <_sk_store_u16_be_hsw+0xf6> + .byte 114,183 // jb 3bb5 <_sk_store_u16_be_hsw+0xf6> .byte 196,65,121,214,68,64,48 // vmovq %xmm8,0x30(%r8,%rax,2) - .byte 235,174 // jmp 3a99 <_sk_store_u16_be_hsw+0xf6> + .byte 235,174 // jmp 3bb5 <_sk_store_u16_be_hsw+0xf6> HIDDEN _sk_load_f32_hsw .globl _sk_load_f32_hsw @@ -12594,10 +12758,10 @@ FUNCTION(_sk_load_f32_hsw) _sk_load_f32_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 119,110 // ja 3b61 <_sk_load_f32_hsw+0x76> + .byte 119,110 // ja 3c7d <_sk_load_f32_hsw+0x76> .byte 76,139,0 // mov (%rax),%r8 .byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9 - .byte 76,141,21,135,0,0,0 // lea 0x87(%rip),%r10 # 3b8c <_sk_load_f32_hsw+0xa1> + .byte 76,141,21,135,0,0,0 // lea 0x87(%rip),%r10 # 3ca8 <_sk_load_f32_hsw+0xa1> .byte 73,99,4,138 // movslq (%r10,%rcx,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax @@ -12658,7 +12822,7 @@ _sk_store_f32_hsw: .byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8 .byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11 .byte 72,133,201 // test %rcx,%rcx - .byte 117,55 // jne 3c19 <_sk_store_f32_hsw+0x6d> + .byte 117,55 // jne 3d35 <_sk_store_f32_hsw+0x6d> .byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12 .byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13 .byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9 @@ -12671,22 +12835,22 @@ _sk_store_f32_hsw: .byte 255,224 // jmpq *%rax .byte 196,65,121,17,20,128 // vmovupd %xmm10,(%r8,%rax,4) .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 116,240 // je 3c15 <_sk_store_f32_hsw+0x69> + .byte 116,240 // je 3d31 <_sk_store_f32_hsw+0x69> .byte 196,65,121,17,76,128,16 // vmovupd %xmm9,0x10(%r8,%rax,4) .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,227 // jb 3c15 <_sk_store_f32_hsw+0x69> + .byte 114,227 // jb 3d31 <_sk_store_f32_hsw+0x69> .byte 196,65,121,17,68,128,32 // vmovupd %xmm8,0x20(%r8,%rax,4) - .byte 116,218 // je 3c15 <_sk_store_f32_hsw+0x69> + .byte 116,218 // je 3d31 <_sk_store_f32_hsw+0x69> .byte 196,65,121,17,92,128,48 // vmovupd %xmm11,0x30(%r8,%rax,4) .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,205 // jb 3c15 <_sk_store_f32_hsw+0x69> + .byte 114,205 // jb 3d31 <_sk_store_f32_hsw+0x69> .byte 196,67,125,25,84,128,64,1 // vextractf128 $0x1,%ymm10,0x40(%r8,%rax,4) - .byte 116,195 // je 3c15 <_sk_store_f32_hsw+0x69> + .byte 116,195 // je 3d31 <_sk_store_f32_hsw+0x69> .byte 196,67,125,25,76,128,80,1 // vextractf128 $0x1,%ymm9,0x50(%r8,%rax,4) .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 114,181 // jb 3c15 <_sk_store_f32_hsw+0x69> + .byte 114,181 // jb 3d31 <_sk_store_f32_hsw+0x69> .byte 196,67,125,25,68,128,96,1 // vextractf128 $0x1,%ymm8,0x60(%r8,%rax,4) - .byte 235,171 // jmp 3c15 <_sk_store_f32_hsw+0x69> + .byte 235,171 // jmp 3d31 <_sk_store_f32_hsw+0x69> HIDDEN _sk_clamp_x_hsw .globl _sk_clamp_x_hsw @@ -12784,7 +12948,7 @@ FUNCTION(_sk_clamp_x_1_hsw) _sk_clamp_x_1_hsw: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,106,14,0,0 // vbroadcastss 0xe6a(%rip),%ymm8 # 4bd4 <_sk_callback_hsw+0x436> + .byte 196,98,125,24,5,114,14,0,0 // vbroadcastss 0xe72(%rip),%ymm8 # 4cf8 <_sk_callback_hsw+0x43e> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -12802,9 +12966,9 @@ HIDDEN _sk_mirror_x_1_hsw .globl _sk_mirror_x_1_hsw FUNCTION(_sk_mirror_x_1_hsw) _sk_mirror_x_1_hsw: - .byte 196,98,125,24,5,77,14,0,0 // vbroadcastss 0xe4d(%rip),%ymm8 # 4bd8 <_sk_callback_hsw+0x43a> + .byte 196,98,125,24,5,85,14,0,0 // vbroadcastss 0xe55(%rip),%ymm8 # 4cfc <_sk_callback_hsw+0x442> .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,13,67,14,0,0 // vbroadcastss 0xe43(%rip),%ymm9 # 4bdc <_sk_callback_hsw+0x43e> + .byte 196,98,125,24,13,75,14,0,0 // vbroadcastss 0xe4b(%rip),%ymm9 # 4d00 <_sk_callback_hsw+0x446> .byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9 .byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9 .byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9 @@ -12820,11 +12984,11 @@ HIDDEN _sk_luminance_to_alpha_hsw .globl _sk_luminance_to_alpha_hsw FUNCTION(_sk_luminance_to_alpha_hsw) _sk_luminance_to_alpha_hsw: - .byte 196,226,125,24,29,19,14,0,0 // vbroadcastss 0xe13(%rip),%ymm3 # 4be0 <_sk_callback_hsw+0x442> - .byte 196,98,125,24,5,14,14,0,0 // vbroadcastss 0xe0e(%rip),%ymm8 # 4be4 <_sk_callback_hsw+0x446> + .byte 196,226,125,24,29,27,14,0,0 // vbroadcastss 0xe1b(%rip),%ymm3 # 4d04 <_sk_callback_hsw+0x44a> + .byte 196,98,125,24,5,22,14,0,0 // vbroadcastss 0xe16(%rip),%ymm8 # 4d08 <_sk_callback_hsw+0x44e> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 .byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1 - .byte 196,226,125,24,29,255,13,0,0 // vbroadcastss 0xdff(%rip),%ymm3 # 4be8 <_sk_callback_hsw+0x44a> + .byte 196,226,125,24,29,7,14,0,0 // vbroadcastss 0xe07(%rip),%ymm3 # 4d0c <_sk_callback_hsw+0x452> .byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -12997,9 +13161,9 @@ _sk_evenly_spaced_gradient_hsw: .byte 76,139,64,8 // mov 0x8(%rax),%r8 .byte 77,137,202 // mov %r9,%r10 .byte 73,255,202 // dec %r10 - .byte 120,7 // js 40a1 <_sk_evenly_spaced_gradient_hsw+0x18> + .byte 120,7 // js 41bd <_sk_evenly_spaced_gradient_hsw+0x18> .byte 196,193,242,42,202 // vcvtsi2ss %r10,%xmm1,%xmm1 - .byte 235,22 // jmp 40b7 <_sk_evenly_spaced_gradient_hsw+0x2e> + .byte 235,22 // jmp 41d3 <_sk_evenly_spaced_gradient_hsw+0x2e> .byte 77,137,211 // mov %r10,%r11 .byte 73,209,235 // shr %r11 .byte 65,131,226,1 // and $0x1,%r10d @@ -13010,7 +13174,7 @@ _sk_evenly_spaced_gradient_hsw: .byte 197,244,89,200 // vmulps %ymm0,%ymm1,%ymm1 .byte 197,126,91,217 // vcvttps2dq %ymm1,%ymm11 .byte 73,131,249,8 // cmp $0x8,%r9 - .byte 119,70 // ja 4110 <_sk_evenly_spaced_gradient_hsw+0x87> + .byte 119,70 // ja 422c <_sk_evenly_spaced_gradient_hsw+0x87> .byte 196,66,37,22,0 // vpermps (%r8),%ymm11,%ymm8 .byte 76,139,64,40 // mov 0x28(%rax),%r8 .byte 196,66,37,22,8 // vpermps (%r8),%ymm11,%ymm9 @@ -13026,7 +13190,7 @@ _sk_evenly_spaced_gradient_hsw: .byte 196,194,37,22,24 // vpermps (%r8),%ymm11,%ymm3 .byte 72,139,64,64 // mov 0x40(%rax),%rax .byte 196,98,37,22,40 // vpermps (%rax),%ymm11,%ymm13 - .byte 235,110 // jmp 417e <_sk_evenly_spaced_gradient_hsw+0xf5> + .byte 235,110 // jmp 429a <_sk_evenly_spaced_gradient_hsw+0xf5> .byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,2,117,146,4,152 // vgatherdps %ymm1,(%r8,%ymm11,4),%ymm8 @@ -13062,14 +13226,14 @@ HIDDEN _sk_gauss_a_to_rgba_hsw .globl _sk_gauss_a_to_rgba_hsw FUNCTION(_sk_gauss_a_to_rgba_hsw) _sk_gauss_a_to_rgba_hsw: - .byte 196,226,125,24,5,73,10,0,0 // vbroadcastss 0xa49(%rip),%ymm0 # 4bec <_sk_callback_hsw+0x44e> - .byte 196,226,125,24,13,68,10,0,0 // vbroadcastss 0xa44(%rip),%ymm1 # 4bf0 <_sk_callback_hsw+0x452> + .byte 196,226,125,24,5,81,10,0,0 // vbroadcastss 0xa51(%rip),%ymm0 # 4d10 <_sk_callback_hsw+0x456> + .byte 196,226,125,24,13,76,10,0,0 // vbroadcastss 0xa4c(%rip),%ymm1 # 4d14 <_sk_callback_hsw+0x45a> .byte 196,226,101,168,200 // vfmadd213ps %ymm0,%ymm3,%ymm1 - .byte 196,226,125,24,5,58,10,0,0 // vbroadcastss 0xa3a(%rip),%ymm0 # 4bf4 <_sk_callback_hsw+0x456> + .byte 196,226,125,24,5,66,10,0,0 // vbroadcastss 0xa42(%rip),%ymm0 # 4d18 <_sk_callback_hsw+0x45e> .byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0 - .byte 196,226,125,24,13,48,10,0,0 // vbroadcastss 0xa30(%rip),%ymm1 # 4bf8 <_sk_callback_hsw+0x45a> + .byte 196,226,125,24,13,56,10,0,0 // vbroadcastss 0xa38(%rip),%ymm1 # 4d1c <_sk_callback_hsw+0x462> .byte 196,226,101,184,200 // vfmadd231ps %ymm0,%ymm3,%ymm1 - .byte 196,226,125,24,5,38,10,0,0 // vbroadcastss 0xa26(%rip),%ymm0 # 4bfc <_sk_callback_hsw+0x45e> + .byte 196,226,125,24,5,46,10,0,0 // vbroadcastss 0xa2e(%rip),%ymm0 # 4d20 <_sk_callback_hsw+0x466> .byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 @@ -13084,11 +13248,11 @@ _sk_gradient_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,0 // mov (%rax),%r8 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 15,134,180,0,0,0 // jbe 42ae <_sk_gradient_hsw+0xc3> + .byte 15,134,180,0,0,0 // jbe 43ca <_sk_gradient_hsw+0xc3> .byte 76,139,72,72 // mov 0x48(%rax),%r9 .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 65,186,1,0,0,0 // mov $0x1,%r10d - .byte 196,226,125,24,21,239,9,0,0 // vbroadcastss 0x9ef(%rip),%ymm2 # 4c00 <_sk_callback_hsw+0x462> + .byte 196,226,125,24,21,247,9,0,0 // vbroadcastss 0x9f7(%rip),%ymm2 # 4d24 <_sk_callback_hsw+0x46a> .byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9 .byte 196,130,125,24,28,145 // vbroadcastss (%r9,%r10,4),%ymm3 .byte 197,228,194,216,2 // vcmpleps %ymm0,%ymm3,%ymm3 @@ -13096,10 +13260,10 @@ _sk_gradient_hsw: .byte 196,65,101,254,201 // vpaddd %ymm9,%ymm3,%ymm9 .byte 73,255,194 // inc %r10 .byte 77,57,208 // cmp %r10,%r8 - .byte 117,226 // jne 4216 <_sk_gradient_hsw+0x2b> + .byte 117,226 // jne 4332 <_sk_gradient_hsw+0x2b> .byte 76,139,72,8 // mov 0x8(%rax),%r9 .byte 73,131,248,8 // cmp $0x8,%r8 - .byte 118,121 // jbe 42b7 <_sk_gradient_hsw+0xcc> + .byte 118,121 // jbe 43d3 <_sk_gradient_hsw+0xcc> .byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,2,117,146,4,137 // vgatherdps %ymm1,(%r9,%ymm9,4),%ymm8 @@ -13123,7 +13287,7 @@ _sk_gradient_hsw: .byte 196,130,21,146,28,136 // vgatherdps %ymm13,(%r8,%ymm9,4),%ymm3 .byte 72,139,64,64 // mov 0x40(%rax),%rax .byte 196,34,13,146,44,136 // vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13 - .byte 235,77 // jmp 42fb <_sk_gradient_hsw+0x110> + .byte 235,77 // jmp 4417 <_sk_gradient_hsw+0x110> .byte 76,139,72,8 // mov 0x8(%rax),%r9 .byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9 .byte 196,66,53,22,1 // vpermps (%r9),%ymm9,%ymm8 @@ -13183,24 +13347,24 @@ _sk_xy_to_unit_angle_hsw: .byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12 .byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11 .byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12 - .byte 196,98,125,24,45,110,8,0,0 // vbroadcastss 0x86e(%rip),%ymm13 # 4c04 <_sk_callback_hsw+0x466> - .byte 196,98,125,24,53,105,8,0,0 // vbroadcastss 0x869(%rip),%ymm14 # 4c08 <_sk_callback_hsw+0x46a> + .byte 196,98,125,24,45,118,8,0,0 // vbroadcastss 0x876(%rip),%ymm13 # 4d28 <_sk_callback_hsw+0x46e> + .byte 196,98,125,24,53,113,8,0,0 // vbroadcastss 0x871(%rip),%ymm14 # 4d2c <_sk_callback_hsw+0x472> .byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14 - .byte 196,98,125,24,45,95,8,0,0 // vbroadcastss 0x85f(%rip),%ymm13 # 4c0c <_sk_callback_hsw+0x46e> + .byte 196,98,125,24,45,103,8,0,0 // vbroadcastss 0x867(%rip),%ymm13 # 4d30 <_sk_callback_hsw+0x476> .byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13 - .byte 196,98,125,24,53,85,8,0,0 // vbroadcastss 0x855(%rip),%ymm14 # 4c10 <_sk_callback_hsw+0x472> + .byte 196,98,125,24,53,93,8,0,0 // vbroadcastss 0x85d(%rip),%ymm14 # 4d34 <_sk_callback_hsw+0x47a> .byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14 .byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11 .byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,64,8,0,0 // vbroadcastss 0x840(%rip),%ymm10 # 4c14 <_sk_callback_hsw+0x476> + .byte 196,98,125,24,21,72,8,0,0 // vbroadcastss 0x848(%rip),%ymm10 # 4d38 <_sk_callback_hsw+0x47e> .byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10 .byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9 .byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,21,42,8,0,0 // vbroadcastss 0x82a(%rip),%ymm10 # 4c18 <_sk_callback_hsw+0x47a> + .byte 196,98,125,24,21,50,8,0,0 // vbroadcastss 0x832(%rip),%ymm10 # 4d3c <_sk_callback_hsw+0x482> .byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9 - .byte 196,98,125,24,21,20,8,0,0 // vbroadcastss 0x814(%rip),%ymm10 # 4c1c <_sk_callback_hsw+0x47e> + .byte 196,98,125,24,21,28,8,0,0 // vbroadcastss 0x81c(%rip),%ymm10 # 4d40 <_sk_callback_hsw+0x486> .byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10 .byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0 .byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9 @@ -13223,7 +13387,7 @@ HIDDEN _sk_save_xy_hsw FUNCTION(_sk_save_xy_hsw) _sk_save_xy_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,225,7,0,0 // vbroadcastss 0x7e1(%rip),%ymm8 # 4c20 <_sk_callback_hsw+0x482> + .byte 196,98,125,24,5,233,7,0,0 // vbroadcastss 0x7e9(%rip),%ymm8 # 4d44 <_sk_callback_hsw+0x48a> .byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9 .byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 @@ -13257,9 +13421,9 @@ HIDDEN _sk_bilinear_nx_hsw FUNCTION(_sk_bilinear_nx_hsw) _sk_bilinear_nx_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,117,7,0,0 // vbroadcastss 0x775(%rip),%ymm0 # 4c24 <_sk_callback_hsw+0x486> + .byte 196,226,125,24,5,125,7,0,0 // vbroadcastss 0x77d(%rip),%ymm0 # 4d48 <_sk_callback_hsw+0x48e> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,108,7,0,0 // vbroadcastss 0x76c(%rip),%ymm8 # 4c28 <_sk_callback_hsw+0x48a> + .byte 196,98,125,24,5,116,7,0,0 // vbroadcastss 0x774(%rip),%ymm8 # 4d4c <_sk_callback_hsw+0x492> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -13270,7 +13434,7 @@ HIDDEN _sk_bilinear_px_hsw FUNCTION(_sk_bilinear_px_hsw) _sk_bilinear_px_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,84,7,0,0 // vbroadcastss 0x754(%rip),%ymm0 # 4c2c <_sk_callback_hsw+0x48e> + .byte 196,226,125,24,5,92,7,0,0 // vbroadcastss 0x75c(%rip),%ymm0 # 4d50 <_sk_callback_hsw+0x496> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -13282,9 +13446,9 @@ HIDDEN _sk_bilinear_ny_hsw FUNCTION(_sk_bilinear_ny_hsw) _sk_bilinear_ny_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,56,7,0,0 // vbroadcastss 0x738(%rip),%ymm1 # 4c30 <_sk_callback_hsw+0x492> + .byte 196,226,125,24,13,64,7,0,0 // vbroadcastss 0x740(%rip),%ymm1 # 4d54 <_sk_callback_hsw+0x49a> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,46,7,0,0 // vbroadcastss 0x72e(%rip),%ymm8 # 4c34 <_sk_callback_hsw+0x496> + .byte 196,98,125,24,5,54,7,0,0 // vbroadcastss 0x736(%rip),%ymm8 # 4d58 <_sk_callback_hsw+0x49e> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -13295,7 +13459,7 @@ HIDDEN _sk_bilinear_py_hsw FUNCTION(_sk_bilinear_py_hsw) _sk_bilinear_py_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,22,7,0,0 // vbroadcastss 0x716(%rip),%ymm1 # 4c38 <_sk_callback_hsw+0x49a> + .byte 196,226,125,24,13,30,7,0,0 // vbroadcastss 0x71e(%rip),%ymm1 # 4d5c <_sk_callback_hsw+0x4a2> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -13307,13 +13471,13 @@ HIDDEN _sk_bicubic_n3x_hsw FUNCTION(_sk_bicubic_n3x_hsw) _sk_bicubic_n3x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,249,6,0,0 // vbroadcastss 0x6f9(%rip),%ymm0 # 4c3c <_sk_callback_hsw+0x49e> + .byte 196,226,125,24,5,1,7,0,0 // vbroadcastss 0x701(%rip),%ymm0 # 4d60 <_sk_callback_hsw+0x4a6> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,240,6,0,0 // vbroadcastss 0x6f0(%rip),%ymm8 # 4c40 <_sk_callback_hsw+0x4a2> + .byte 196,98,125,24,5,248,6,0,0 // vbroadcastss 0x6f8(%rip),%ymm8 # 4d64 <_sk_callback_hsw+0x4aa> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,225,6,0,0 // vbroadcastss 0x6e1(%rip),%ymm10 # 4c44 <_sk_callback_hsw+0x4a6> - .byte 196,98,125,24,29,220,6,0,0 // vbroadcastss 0x6dc(%rip),%ymm11 # 4c48 <_sk_callback_hsw+0x4aa> + .byte 196,98,125,24,21,233,6,0,0 // vbroadcastss 0x6e9(%rip),%ymm10 # 4d68 <_sk_callback_hsw+0x4ae> + .byte 196,98,125,24,29,228,6,0,0 // vbroadcastss 0x6e4(%rip),%ymm11 # 4d6c <_sk_callback_hsw+0x4b2> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -13325,16 +13489,16 @@ HIDDEN _sk_bicubic_n1x_hsw FUNCTION(_sk_bicubic_n1x_hsw) _sk_bicubic_n1x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,191,6,0,0 // vbroadcastss 0x6bf(%rip),%ymm0 # 4c4c <_sk_callback_hsw+0x4ae> + .byte 196,226,125,24,5,199,6,0,0 // vbroadcastss 0x6c7(%rip),%ymm0 # 4d70 <_sk_callback_hsw+0x4b6> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,182,6,0,0 // vbroadcastss 0x6b6(%rip),%ymm8 # 4c50 <_sk_callback_hsw+0x4b2> + .byte 196,98,125,24,5,190,6,0,0 // vbroadcastss 0x6be(%rip),%ymm8 # 4d74 <_sk_callback_hsw+0x4ba> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,172,6,0,0 // vbroadcastss 0x6ac(%rip),%ymm9 # 4c54 <_sk_callback_hsw+0x4b6> - .byte 196,98,125,24,21,167,6,0,0 // vbroadcastss 0x6a7(%rip),%ymm10 # 4c58 <_sk_callback_hsw+0x4ba> + .byte 196,98,125,24,13,180,6,0,0 // vbroadcastss 0x6b4(%rip),%ymm9 # 4d78 <_sk_callback_hsw+0x4be> + .byte 196,98,125,24,21,175,6,0,0 // vbroadcastss 0x6af(%rip),%ymm10 # 4d7c <_sk_callback_hsw+0x4c2> .byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,13,157,6,0,0 // vbroadcastss 0x69d(%rip),%ymm9 # 4c5c <_sk_callback_hsw+0x4be> + .byte 196,98,125,24,13,165,6,0,0 // vbroadcastss 0x6a5(%rip),%ymm9 # 4d80 <_sk_callback_hsw+0x4c6> .byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9 - .byte 196,98,125,24,21,147,6,0,0 // vbroadcastss 0x693(%rip),%ymm10 # 4c60 <_sk_callback_hsw+0x4c2> + .byte 196,98,125,24,21,155,6,0,0 // vbroadcastss 0x69b(%rip),%ymm10 # 4d84 <_sk_callback_hsw+0x4ca> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -13345,14 +13509,14 @@ HIDDEN _sk_bicubic_p1x_hsw FUNCTION(_sk_bicubic_p1x_hsw) _sk_bicubic_p1x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,123,6,0,0 // vbroadcastss 0x67b(%rip),%ymm8 # 4c64 <_sk_callback_hsw+0x4c6> + .byte 196,98,125,24,5,131,6,0,0 // vbroadcastss 0x683(%rip),%ymm8 # 4d88 <_sk_callback_hsw+0x4ce> .byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0 .byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9 - .byte 196,98,125,24,21,109,6,0,0 // vbroadcastss 0x66d(%rip),%ymm10 # 4c68 <_sk_callback_hsw+0x4ca> - .byte 196,98,125,24,29,104,6,0,0 // vbroadcastss 0x668(%rip),%ymm11 # 4c6c <_sk_callback_hsw+0x4ce> + .byte 196,98,125,24,21,117,6,0,0 // vbroadcastss 0x675(%rip),%ymm10 # 4d8c <_sk_callback_hsw+0x4d2> + .byte 196,98,125,24,29,112,6,0,0 // vbroadcastss 0x670(%rip),%ymm11 # 4d90 <_sk_callback_hsw+0x4d6> .byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11 .byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11 - .byte 196,98,125,24,5,89,6,0,0 // vbroadcastss 0x659(%rip),%ymm8 # 4c70 <_sk_callback_hsw+0x4d2> + .byte 196,98,125,24,5,97,6,0,0 // vbroadcastss 0x661(%rip),%ymm8 # 4d94 <_sk_callback_hsw+0x4da> .byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -13363,12 +13527,12 @@ HIDDEN _sk_bicubic_p3x_hsw FUNCTION(_sk_bicubic_p3x_hsw) _sk_bicubic_p3x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,65,6,0,0 // vbroadcastss 0x641(%rip),%ymm0 # 4c74 <_sk_callback_hsw+0x4d6> + .byte 196,226,125,24,5,73,6,0,0 // vbroadcastss 0x649(%rip),%ymm0 # 4d98 <_sk_callback_hsw+0x4de> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,46,6,0,0 // vbroadcastss 0x62e(%rip),%ymm10 # 4c78 <_sk_callback_hsw+0x4da> - .byte 196,98,125,24,29,41,6,0,0 // vbroadcastss 0x629(%rip),%ymm11 # 4c7c <_sk_callback_hsw+0x4de> + .byte 196,98,125,24,21,54,6,0,0 // vbroadcastss 0x636(%rip),%ymm10 # 4d9c <_sk_callback_hsw+0x4e2> + .byte 196,98,125,24,29,49,6,0,0 // vbroadcastss 0x631(%rip),%ymm11 # 4da0 <_sk_callback_hsw+0x4e6> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -13380,13 +13544,13 @@ HIDDEN _sk_bicubic_n3y_hsw FUNCTION(_sk_bicubic_n3y_hsw) _sk_bicubic_n3y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,12,6,0,0 // vbroadcastss 0x60c(%rip),%ymm1 # 4c80 <_sk_callback_hsw+0x4e2> + .byte 196,226,125,24,13,20,6,0,0 // vbroadcastss 0x614(%rip),%ymm1 # 4da4 <_sk_callback_hsw+0x4ea> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,2,6,0,0 // vbroadcastss 0x602(%rip),%ymm8 # 4c84 <_sk_callback_hsw+0x4e6> + .byte 196,98,125,24,5,10,6,0,0 // vbroadcastss 0x60a(%rip),%ymm8 # 4da8 <_sk_callback_hsw+0x4ee> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,243,5,0,0 // vbroadcastss 0x5f3(%rip),%ymm10 # 4c88 <_sk_callback_hsw+0x4ea> - .byte 196,98,125,24,29,238,5,0,0 // vbroadcastss 0x5ee(%rip),%ymm11 # 4c8c <_sk_callback_hsw+0x4ee> + .byte 196,98,125,24,21,251,5,0,0 // vbroadcastss 0x5fb(%rip),%ymm10 # 4dac <_sk_callback_hsw+0x4f2> + .byte 196,98,125,24,29,246,5,0,0 // vbroadcastss 0x5f6(%rip),%ymm11 # 4db0 <_sk_callback_hsw+0x4f6> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -13398,16 +13562,16 @@ HIDDEN _sk_bicubic_n1y_hsw FUNCTION(_sk_bicubic_n1y_hsw) _sk_bicubic_n1y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,209,5,0,0 // vbroadcastss 0x5d1(%rip),%ymm1 # 4c90 <_sk_callback_hsw+0x4f2> + .byte 196,226,125,24,13,217,5,0,0 // vbroadcastss 0x5d9(%rip),%ymm1 # 4db4 <_sk_callback_hsw+0x4fa> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,199,5,0,0 // vbroadcastss 0x5c7(%rip),%ymm8 # 4c94 <_sk_callback_hsw+0x4f6> + .byte 196,98,125,24,5,207,5,0,0 // vbroadcastss 0x5cf(%rip),%ymm8 # 4db8 <_sk_callback_hsw+0x4fe> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,189,5,0,0 // vbroadcastss 0x5bd(%rip),%ymm9 # 4c98 <_sk_callback_hsw+0x4fa> - .byte 196,98,125,24,21,184,5,0,0 // vbroadcastss 0x5b8(%rip),%ymm10 # 4c9c <_sk_callback_hsw+0x4fe> + .byte 196,98,125,24,13,197,5,0,0 // vbroadcastss 0x5c5(%rip),%ymm9 # 4dbc <_sk_callback_hsw+0x502> + .byte 196,98,125,24,21,192,5,0,0 // vbroadcastss 0x5c0(%rip),%ymm10 # 4dc0 <_sk_callback_hsw+0x506> .byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,13,174,5,0,0 // vbroadcastss 0x5ae(%rip),%ymm9 # 4ca0 <_sk_callback_hsw+0x502> + .byte 196,98,125,24,13,182,5,0,0 // vbroadcastss 0x5b6(%rip),%ymm9 # 4dc4 <_sk_callback_hsw+0x50a> .byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9 - .byte 196,98,125,24,21,164,5,0,0 // vbroadcastss 0x5a4(%rip),%ymm10 # 4ca4 <_sk_callback_hsw+0x506> + .byte 196,98,125,24,21,172,5,0,0 // vbroadcastss 0x5ac(%rip),%ymm10 # 4dc8 <_sk_callback_hsw+0x50e> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -13418,14 +13582,14 @@ HIDDEN _sk_bicubic_p1y_hsw FUNCTION(_sk_bicubic_p1y_hsw) _sk_bicubic_p1y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,140,5,0,0 // vbroadcastss 0x58c(%rip),%ymm8 # 4ca8 <_sk_callback_hsw+0x50a> + .byte 196,98,125,24,5,148,5,0,0 // vbroadcastss 0x594(%rip),%ymm8 # 4dcc <_sk_callback_hsw+0x512> .byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1 .byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9 - .byte 196,98,125,24,21,125,5,0,0 // vbroadcastss 0x57d(%rip),%ymm10 # 4cac <_sk_callback_hsw+0x50e> - .byte 196,98,125,24,29,120,5,0,0 // vbroadcastss 0x578(%rip),%ymm11 # 4cb0 <_sk_callback_hsw+0x512> + .byte 196,98,125,24,21,133,5,0,0 // vbroadcastss 0x585(%rip),%ymm10 # 4dd0 <_sk_callback_hsw+0x516> + .byte 196,98,125,24,29,128,5,0,0 // vbroadcastss 0x580(%rip),%ymm11 # 4dd4 <_sk_callback_hsw+0x51a> .byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11 .byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11 - .byte 196,98,125,24,5,105,5,0,0 // vbroadcastss 0x569(%rip),%ymm8 # 4cb4 <_sk_callback_hsw+0x516> + .byte 196,98,125,24,5,113,5,0,0 // vbroadcastss 0x571(%rip),%ymm8 # 4dd8 <_sk_callback_hsw+0x51e> .byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -13436,12 +13600,12 @@ HIDDEN _sk_bicubic_p3y_hsw FUNCTION(_sk_bicubic_p3y_hsw) _sk_bicubic_p3y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,81,5,0,0 // vbroadcastss 0x551(%rip),%ymm1 # 4cb8 <_sk_callback_hsw+0x51a> + .byte 196,226,125,24,13,89,5,0,0 // vbroadcastss 0x559(%rip),%ymm1 # 4ddc <_sk_callback_hsw+0x522> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,61,5,0,0 // vbroadcastss 0x53d(%rip),%ymm10 # 4cbc <_sk_callback_hsw+0x51e> - .byte 196,98,125,24,29,56,5,0,0 // vbroadcastss 0x538(%rip),%ymm11 # 4cc0 <_sk_callback_hsw+0x522> + .byte 196,98,125,24,21,69,5,0,0 // vbroadcastss 0x545(%rip),%ymm10 # 4de0 <_sk_callback_hsw+0x526> + .byte 196,98,125,24,29,64,5,0,0 // vbroadcastss 0x540(%rip),%ymm11 # 4de4 <_sk_callback_hsw+0x52a> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -13565,31 +13729,33 @@ BALIGN4 .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 4975 <.literal4+0xb1> + .byte 71,225,61 // rex.RXB loope 4a91 <.literal4+0xb1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 4985 <.literal4+0xc1> + .byte 71,225,61 // rex.RXB loope 4aa1 <.literal4+0xc1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 4995 <.literal4+0xd1> + .byte 71,225,61 // rex.RXB loope 4ab1 <.literal4+0xd1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 49a5 <.literal4+0xe1> + .byte 71,225,61 // rex.RXB loope 4ac1 <.literal4+0xe1> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax) + .byte 67,0,0 // rex.XB add %al,(%r8) + .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) .byte 63 // (bad) - .byte 0,0 // add %al,(%rax) - .byte 128,63,145 // cmpb $0x91,(%rdi) + .byte 145 // xchg %eax,%ecx .byte 131,158,61,92,143,50,63 // sbbl $0x3f,0x328f5c3d(%rsi) .byte 154 // (bad) .byte 153 // cltd @@ -13631,7 +13797,7 @@ BALIGN4 .byte 190,129,128,128,59 // mov $0x3b808081,%esi .byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 49f5 <.literal4+0x131> + .byte 224,7 // loopne 4b19 <.literal4+0x139> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -13647,10 +13813,10 @@ BALIGN4 .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) .byte 0,52,255 // add %dh,(%rdi,%rdi,8) .byte 255 // (bad) - .byte 127,0 // jg 4a1c <.literal4+0x158> + .byte 127,0 // jg 4b40 <.literal4+0x160> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4a95 <.literal4+0x1d1> + .byte 119,115 // ja 4bb9 <.literal4+0x1d9> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -13664,10 +13830,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 4a50 <.literal4+0x18c> + .byte 127,0 // jg 4b74 <.literal4+0x194> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4ac9 <.literal4+0x205> + .byte 119,115 // ja 4bed <.literal4+0x20d> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -13681,10 +13847,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 4a84 <.literal4+0x1c0> + .byte 127,0 // jg 4ba8 <.literal4+0x1c8> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4afd <.literal4+0x239> + .byte 119,115 // ja 4c21 <.literal4+0x241> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -13698,10 +13864,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 4ab8 <.literal4+0x1f4> + .byte 127,0 // jg 4bdc <.literal4+0x1fc> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4b31 <.literal4+0x26d> + .byte 119,115 // ja 4c55 <.literal4+0x275> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -13714,7 +13880,7 @@ BALIGN4 .byte 0,75,0 // add %cl,0x0(%rbx) .byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax) .byte 66,0,0 // rex.X add %al,(%rax) - .byte 127,67 // jg 4b2f <.literal4+0x26b> + .byte 127,67 // jg 4c53 <.literal4+0x273> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -13726,10 +13892,10 @@ BALIGN4 .byte 190,80,128,3,62 // mov $0x3e038050,%esi .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 4b4f <.literal4+0x28b> + .byte 118,63 // jbe 4c73 <.literal4+0x293> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) - .byte 127,67 // jg 4b63 <.literal4+0x29f> + .byte 127,67 // jg 4c87 <.literal4+0x2a7> .byte 129,128,128,59,0,0,128,63,129,128 // addl $0x80813f80,0x3b80(%rax) .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,128,63,129,128,128 // add %al,-0x7f7f7ec1(%rax) @@ -13738,7 +13904,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 4b45 <.literal4+0x281> + .byte 224,7 // loopne 4c69 <.literal4+0x289> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -13750,7 +13916,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 4b61 <.literal4+0x29d> + .byte 224,7 // loopne 4c85 <.literal4+0x2a5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -13761,7 +13927,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 4bb6 <.literal4+0x2f2> + .byte 124,66 // jl 4cda <.literal4+0x2fa> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax) @@ -13779,9 +13945,9 @@ BALIGN4 .byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax) .byte 0,0 // add %al,(%rax) .byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax) - .byte 112,65 // jo 4bf9 <.literal4+0x335> + .byte 112,65 // jo 4d1d <.literal4+0x33d> .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) - .byte 127,67 // jg 4c07 <.literal4+0x343> + .byte 127,67 // jg 4d2b <.literal4+0x34b> .byte 128,0,128 // addb $0x80,(%rax) .byte 55 // (bad) .byte 128,0,128 // addb $0x80,(%rax) @@ -13789,7 +13955,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 255 // (bad) - .byte 127,71 // jg 4c1b <.literal4+0x357> + .byte 127,71 // jg 4d3f <.literal4+0x35f> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,191,0,0,0 // add %al,0xbf(%rax) @@ -13897,16 +14063,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004d08 <_sk_callback_hsw+0xa00056a> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004e28 <_sk_callback_hsw+0xa00056e> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004d10 <_sk_callback_hsw+0x12000572> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004e30 <_sk_callback_hsw+0x12000576> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004d18 <_sk_callback_hsw+0x1a00057a> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004e38 <_sk_callback_hsw+0x1a00057e> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004d20 <_sk_callback_hsw+0x3000582> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004e40 <_sk_callback_hsw+0x3000586> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -13949,16 +14115,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004d68 <_sk_callback_hsw+0xa0005ca> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004e88 <_sk_callback_hsw+0xa0005ce> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004d70 <_sk_callback_hsw+0x120005d2> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004e90 <_sk_callback_hsw+0x120005d6> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004d78 <_sk_callback_hsw+0x1a0005da> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004e98 <_sk_callback_hsw+0x1a0005de> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004d80 <_sk_callback_hsw+0x30005e2> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004ea0 <_sk_callback_hsw+0x30005e6> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -14001,16 +14167,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004dc8 <_sk_callback_hsw+0xa00062a> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004ee8 <_sk_callback_hsw+0xa00062e> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004dd0 <_sk_callback_hsw+0x12000632> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004ef0 <_sk_callback_hsw+0x12000636> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004dd8 <_sk_callback_hsw+0x1a00063a> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004ef8 <_sk_callback_hsw+0x1a00063e> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004de0 <_sk_callback_hsw+0x3000642> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004f00 <_sk_callback_hsw+0x3000646> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -14053,16 +14219,68 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004e28 <_sk_callback_hsw+0xa00068a> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004f48 <_sk_callback_hsw+0xa00068e> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004e30 <_sk_callback_hsw+0x12000692> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004f50 <_sk_callback_hsw+0x12000696> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004e38 <_sk_callback_hsw+0x1a00069a> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004f58 <_sk_callback_hsw+0x1a00069e> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004e40 <_sk_callback_hsw+0x30006a2> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004f60 <_sk_callback_hsw+0x30006a6> + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,6 // incl (%rsi) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,10 // decl (%rdx) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,14 // decl (%rsi) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,18 // callq *(%rdx) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,22 // callq *(%rsi) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,26 // lcall *(%rdx) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,30 // lcall *(%rsi) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 1,255 // add %edi,%edi + .byte 255 // (bad) + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004fa8 <_sk_callback_hsw+0xa0006ee> + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004fb0 <_sk_callback_hsw+0x120006f6> + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004fb8 <_sk_callback_hsw+0x1a0006fe> + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004fc0 <_sk_callback_hsw+0x3000706> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -14183,14 +14401,14 @@ _sk_seed_shader_avx: .byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,23,100,0,0 // vbroadcastss 0x6417(%rip),%ymm1 # 64e0 <_sk_callback_avx+0x128> + .byte 196,226,125,24,13,171,102,0,0 // vbroadcastss 0x66ab(%rip),%ymm1 # 6774 <_sk_callback_avx+0x128> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,88,2 // vaddps (%rdx),%ymm0,%ymm0 .byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,21,251,99,0,0 // vbroadcastss 0x63fb(%rip),%ymm2 # 64e4 <_sk_callback_avx+0x12c> + .byte 196,226,125,24,21,143,102,0,0 // vbroadcastss 0x668f(%rip),%ymm2 # 6778 <_sk_callback_avx+0x12c> .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 @@ -14213,7 +14431,7 @@ _sk_dither_avx: .byte 76,139,0 // mov (%rax),%r8 .byte 196,66,125,24,8 // vbroadcastss (%r8),%ymm9 .byte 196,65,60,87,209 // vxorps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,29,172,99,0,0 // vbroadcastss 0x63ac(%rip),%ymm11 # 64e8 <_sk_callback_avx+0x130> + .byte 196,98,125,24,29,64,102,0,0 // vbroadcastss 0x6640(%rip),%ymm11 # 677c <_sk_callback_avx+0x130> .byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9 .byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12 .byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9 @@ -14224,8 +14442,8 @@ _sk_dither_avx: .byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11 .byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11 .byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11 - .byte 196,98,125,24,37,109,99,0,0 // vbroadcastss 0x636d(%rip),%ymm12 # 64ec <_sk_callback_avx+0x134> - .byte 196,98,125,24,45,104,99,0,0 // vbroadcastss 0x6368(%rip),%ymm13 # 64f0 <_sk_callback_avx+0x138> + .byte 196,98,125,24,37,1,102,0,0 // vbroadcastss 0x6601(%rip),%ymm12 # 6780 <_sk_callback_avx+0x134> + .byte 196,98,125,24,45,252,101,0,0 // vbroadcastss 0x65fc(%rip),%ymm13 # 6784 <_sk_callback_avx+0x138> .byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14 .byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15 .byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14 @@ -14252,9 +14470,9 @@ _sk_dither_avx: .byte 196,65,12,86,202 // vorps %ymm10,%ymm14,%ymm9 .byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,211,98,0,0 // vbroadcastss 0x62d3(%rip),%ymm9 # 64f4 <_sk_callback_avx+0x13c> + .byte 196,98,125,24,13,103,101,0,0 // vbroadcastss 0x6567(%rip),%ymm9 # 6788 <_sk_callback_avx+0x13c> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,201,98,0,0 // vbroadcastss 0x62c9(%rip),%ymm9 # 64f8 <_sk_callback_avx+0x140> + .byte 196,98,125,24,13,93,101,0,0 // vbroadcastss 0x655d(%rip),%ymm9 # 678c <_sk_callback_avx+0x140> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 196,98,125,24,72,8 // vbroadcastss 0x8(%rax),%ymm9 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 @@ -14323,7 +14541,7 @@ HIDDEN _sk_srcatop_avx FUNCTION(_sk_srcatop_avx) _sk_srcatop_avx: .byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0 - .byte 196,98,125,24,5,32,98,0,0 // vbroadcastss 0x6220(%rip),%ymm8 # 64fc <_sk_callback_avx+0x144> + .byte 196,98,125,24,5,180,100,0,0 // vbroadcastss 0x64b4(%rip),%ymm8 # 6790 <_sk_callback_avx+0x144> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -14344,7 +14562,7 @@ HIDDEN _sk_dstatop_avx FUNCTION(_sk_dstatop_avx) _sk_dstatop_avx: .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 - .byte 196,98,125,24,13,226,97,0,0 // vbroadcastss 0x61e2(%rip),%ymm9 # 6500 <_sk_callback_avx+0x148> + .byte 196,98,125,24,13,118,100,0,0 // vbroadcastss 0x6476(%rip),%ymm9 # 6794 <_sk_callback_avx+0x148> .byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0 @@ -14386,7 +14604,7 @@ HIDDEN _sk_srcout_avx .globl _sk_srcout_avx FUNCTION(_sk_srcout_avx) _sk_srcout_avx: - .byte 196,98,125,24,5,129,97,0,0 // vbroadcastss 0x6181(%rip),%ymm8 # 6504 <_sk_callback_avx+0x14c> + .byte 196,98,125,24,5,21,100,0,0 // vbroadcastss 0x6415(%rip),%ymm8 # 6798 <_sk_callback_avx+0x14c> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -14399,7 +14617,7 @@ HIDDEN _sk_dstout_avx .globl _sk_dstout_avx FUNCTION(_sk_dstout_avx) _sk_dstout_avx: - .byte 196,226,125,24,5,100,97,0,0 // vbroadcastss 0x6164(%rip),%ymm0 # 6508 <_sk_callback_avx+0x150> + .byte 196,226,125,24,5,248,99,0,0 // vbroadcastss 0x63f8(%rip),%ymm0 # 679c <_sk_callback_avx+0x150> .byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3 .byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0 .byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1 @@ -14412,7 +14630,7 @@ HIDDEN _sk_srcover_avx .globl _sk_srcover_avx FUNCTION(_sk_srcover_avx) _sk_srcover_avx: - .byte 196,98,125,24,5,71,97,0,0 // vbroadcastss 0x6147(%rip),%ymm8 # 650c <_sk_callback_avx+0x154> + .byte 196,98,125,24,5,219,99,0,0 // vbroadcastss 0x63db(%rip),%ymm8 # 67a0 <_sk_callback_avx+0x154> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -14429,7 +14647,7 @@ HIDDEN _sk_dstover_avx .globl _sk_dstover_avx FUNCTION(_sk_dstover_avx) _sk_dstover_avx: - .byte 196,98,125,24,5,26,97,0,0 // vbroadcastss 0x611a(%rip),%ymm8 # 6510 <_sk_callback_avx+0x158> + .byte 196,98,125,24,5,174,99,0,0 // vbroadcastss 0x63ae(%rip),%ymm8 # 67a4 <_sk_callback_avx+0x158> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0 @@ -14457,7 +14675,7 @@ HIDDEN _sk_multiply_avx .globl _sk_multiply_avx FUNCTION(_sk_multiply_avx) _sk_multiply_avx: - .byte 196,98,125,24,5,217,96,0,0 // vbroadcastss 0x60d9(%rip),%ymm8 # 6514 <_sk_callback_avx+0x15c> + .byte 196,98,125,24,5,109,99,0,0 // vbroadcastss 0x636d(%rip),%ymm8 # 67a8 <_sk_callback_avx+0x15c> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -14517,7 +14735,7 @@ HIDDEN _sk_xor__avx .globl _sk_xor__avx FUNCTION(_sk_xor__avx) _sk_xor__avx: - .byte 196,98,125,24,5,40,96,0,0 // vbroadcastss 0x6028(%rip),%ymm8 # 6518 <_sk_callback_avx+0x160> + .byte 196,98,125,24,5,188,98,0,0 // vbroadcastss 0x62bc(%rip),%ymm8 # 67ac <_sk_callback_avx+0x160> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -14554,7 +14772,7 @@ _sk_darken_avx: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,168,95,0,0 // vbroadcastss 0x5fa8(%rip),%ymm8 # 651c <_sk_callback_avx+0x164> + .byte 196,98,125,24,5,60,98,0,0 // vbroadcastss 0x623c(%rip),%ymm8 # 67b0 <_sk_callback_avx+0x164> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -14580,7 +14798,7 @@ _sk_lighten_avx: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,84,95,0,0 // vbroadcastss 0x5f54(%rip),%ymm8 # 6520 <_sk_callback_avx+0x168> + .byte 196,98,125,24,5,232,97,0,0 // vbroadcastss 0x61e8(%rip),%ymm8 # 67b4 <_sk_callback_avx+0x168> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -14609,7 +14827,7 @@ _sk_difference_avx: .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,244,94,0,0 // vbroadcastss 0x5ef4(%rip),%ymm8 # 6524 <_sk_callback_avx+0x16c> + .byte 196,98,125,24,5,136,97,0,0 // vbroadcastss 0x6188(%rip),%ymm8 # 67b8 <_sk_callback_avx+0x16c> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -14632,7 +14850,7 @@ _sk_exclusion_avx: .byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,175,94,0,0 // vbroadcastss 0x5eaf(%rip),%ymm8 # 6528 <_sk_callback_avx+0x170> + .byte 196,98,125,24,5,67,97,0,0 // vbroadcastss 0x6143(%rip),%ymm8 # 67bc <_sk_callback_avx+0x170> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -14643,7 +14861,7 @@ HIDDEN _sk_colorburn_avx .globl _sk_colorburn_avx FUNCTION(_sk_colorburn_avx) _sk_colorburn_avx: - .byte 196,98,125,24,5,154,94,0,0 // vbroadcastss 0x5e9a(%rip),%ymm8 # 652c <_sk_callback_avx+0x174> + .byte 196,98,125,24,5,46,97,0,0 // vbroadcastss 0x612e(%rip),%ymm8 # 67c0 <_sk_callback_avx+0x174> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11 .byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10 @@ -14705,7 +14923,7 @@ HIDDEN _sk_colordodge_avx FUNCTION(_sk_colordodge_avx) _sk_colordodge_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,13,150,93,0,0 // vbroadcastss 0x5d96(%rip),%ymm9 # 6530 <_sk_callback_avx+0x178> + .byte 196,98,125,24,13,42,96,0,0 // vbroadcastss 0x602a(%rip),%ymm9 # 67c4 <_sk_callback_avx+0x178> .byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9 @@ -14762,7 +14980,7 @@ HIDDEN _sk_hardlight_avx .globl _sk_hardlight_avx FUNCTION(_sk_hardlight_avx) _sk_hardlight_avx: - .byte 196,98,125,24,5,168,92,0,0 // vbroadcastss 0x5ca8(%rip),%ymm8 # 6534 <_sk_callback_avx+0x17c> + .byte 196,98,125,24,5,60,95,0,0 // vbroadcastss 0x5f3c(%rip),%ymm8 # 67c8 <_sk_callback_avx+0x17c> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -14817,7 +15035,7 @@ HIDDEN _sk_overlay_avx .globl _sk_overlay_avx FUNCTION(_sk_overlay_avx) _sk_overlay_avx: - .byte 196,98,125,24,5,209,91,0,0 // vbroadcastss 0x5bd1(%rip),%ymm8 # 6538 <_sk_callback_avx+0x180> + .byte 196,98,125,24,5,101,94,0,0 // vbroadcastss 0x5e65(%rip),%ymm8 # 67cc <_sk_callback_avx+0x180> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -14883,10 +15101,10 @@ _sk_softlight_avx: .byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8 .byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11 .byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8 - .byte 196,98,125,24,29,200,90,0,0 // vbroadcastss 0x5ac8(%rip),%ymm11 # 6540 <_sk_callback_avx+0x188> + .byte 196,98,125,24,29,92,93,0,0 // vbroadcastss 0x5d5c(%rip),%ymm11 # 67d4 <_sk_callback_avx+0x188> .byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13 .byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8 - .byte 196,98,125,24,45,185,90,0,0 // vbroadcastss 0x5ab9(%rip),%ymm13 # 6544 <_sk_callback_avx+0x18c> + .byte 196,98,125,24,45,77,93,0,0 // vbroadcastss 0x5d4d(%rip),%ymm13 # 67d8 <_sk_callback_avx+0x18c> .byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14 .byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8 .byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14 @@ -14897,7 +15115,7 @@ _sk_softlight_avx: .byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15 .byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14 .byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15 - .byte 196,98,125,24,5,119,90,0,0 // vbroadcastss 0x5a77(%rip),%ymm8 # 653c <_sk_callback_avx+0x184> + .byte 196,98,125,24,5,11,93,0,0 // vbroadcastss 0x5d0b(%rip),%ymm8 # 67d0 <_sk_callback_avx+0x184> .byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12 .byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0 .byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12 @@ -15024,12 +15242,12 @@ _sk_hue_avx: .byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11 .byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11 .byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - .byte 196,98,125,24,53,70,88,0,0 // vbroadcastss 0x5846(%rip),%ymm14 # 6548 <_sk_callback_avx+0x190> + .byte 196,98,125,24,53,218,90,0,0 // vbroadcastss 0x5ada(%rip),%ymm14 # 67dc <_sk_callback_avx+0x190> .byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11 - .byte 196,98,125,24,61,60,88,0,0 // vbroadcastss 0x583c(%rip),%ymm15 # 654c <_sk_callback_avx+0x194> + .byte 196,98,125,24,61,208,90,0,0 // vbroadcastss 0x5ad0(%rip),%ymm15 # 67e0 <_sk_callback_avx+0x194> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 - .byte 196,226,125,24,5,45,88,0,0 // vbroadcastss 0x582d(%rip),%ymm0 # 6550 <_sk_callback_avx+0x198> + .byte 196,226,125,24,5,193,90,0,0 // vbroadcastss 0x5ac1(%rip),%ymm0 # 67e4 <_sk_callback_avx+0x198> .byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 .byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13 @@ -15090,7 +15308,7 @@ _sk_hue_avx: .byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10 .byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,6,87,0,0 // vbroadcastss 0x5706(%rip),%ymm8 # 6554 <_sk_callback_avx+0x19c> + .byte 196,98,125,24,5,154,89,0,0 // vbroadcastss 0x599a(%rip),%ymm8 # 67e8 <_sk_callback_avx+0x19c> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -15147,12 +15365,12 @@ _sk_saturation_avx: .byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11 .byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11 .byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - .byte 196,98,125,24,53,20,86,0,0 // vbroadcastss 0x5614(%rip),%ymm14 # 6558 <_sk_callback_avx+0x1a0> + .byte 196,98,125,24,53,168,88,0,0 // vbroadcastss 0x58a8(%rip),%ymm14 # 67ec <_sk_callback_avx+0x1a0> .byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11 - .byte 196,98,125,24,61,10,86,0,0 // vbroadcastss 0x560a(%rip),%ymm15 # 655c <_sk_callback_avx+0x1a4> + .byte 196,98,125,24,61,158,88,0,0 // vbroadcastss 0x589e(%rip),%ymm15 # 67f0 <_sk_callback_avx+0x1a4> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 - .byte 196,226,125,24,5,251,85,0,0 // vbroadcastss 0x55fb(%rip),%ymm0 # 6560 <_sk_callback_avx+0x1a8> + .byte 196,226,125,24,5,143,88,0,0 // vbroadcastss 0x588f(%rip),%ymm0 # 67f4 <_sk_callback_avx+0x1a8> .byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 .byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13 @@ -15213,7 +15431,7 @@ _sk_saturation_avx: .byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10 .byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,212,84,0,0 // vbroadcastss 0x54d4(%rip),%ymm8 # 6564 <_sk_callback_avx+0x1ac> + .byte 196,98,125,24,5,104,87,0,0 // vbroadcastss 0x5768(%rip),%ymm8 # 67f8 <_sk_callback_avx+0x1ac> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -15242,12 +15460,12 @@ _sk_color_avx: .byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp) .byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8 .byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9 - .byte 196,98,125,24,45,106,84,0,0 // vbroadcastss 0x546a(%rip),%ymm13 # 6568 <_sk_callback_avx+0x1b0> + .byte 196,98,125,24,45,254,86,0,0 // vbroadcastss 0x56fe(%rip),%ymm13 # 67fc <_sk_callback_avx+0x1b0> .byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10 - .byte 196,98,125,24,53,96,84,0,0 // vbroadcastss 0x5460(%rip),%ymm14 # 656c <_sk_callback_avx+0x1b4> + .byte 196,98,125,24,53,244,86,0,0 // vbroadcastss 0x56f4(%rip),%ymm14 # 6800 <_sk_callback_avx+0x1b4> .byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11 .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,61,81,84,0,0 // vbroadcastss 0x5451(%rip),%ymm15 # 6570 <_sk_callback_avx+0x1b8> + .byte 196,98,125,24,61,229,86,0,0 // vbroadcastss 0x56e5(%rip),%ymm15 # 6804 <_sk_callback_avx+0x1b8> .byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11 .byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0 .byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11 @@ -15310,7 +15528,7 @@ _sk_color_avx: .byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9 .byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0 .byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8 - .byte 196,226,125,24,5,24,83,0,0 // vbroadcastss 0x5318(%rip),%ymm0 # 6574 <_sk_callback_avx+0x1bc> + .byte 196,226,125,24,5,172,85,0,0 // vbroadcastss 0x55ac(%rip),%ymm0 # 6808 <_sk_callback_avx+0x1bc> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -15340,12 +15558,12 @@ _sk_luminosity_avx: .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 .byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9 - .byte 196,98,125,24,45,170,82,0,0 // vbroadcastss 0x52aa(%rip),%ymm13 # 6578 <_sk_callback_avx+0x1c0> + .byte 196,98,125,24,45,62,85,0,0 // vbroadcastss 0x553e(%rip),%ymm13 # 680c <_sk_callback_avx+0x1c0> .byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10 - .byte 196,98,125,24,53,160,82,0,0 // vbroadcastss 0x52a0(%rip),%ymm14 # 657c <_sk_callback_avx+0x1c4> + .byte 196,98,125,24,53,52,85,0,0 // vbroadcastss 0x5534(%rip),%ymm14 # 6810 <_sk_callback_avx+0x1c4> .byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11 .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,61,145,82,0,0 // vbroadcastss 0x5291(%rip),%ymm15 # 6580 <_sk_callback_avx+0x1c8> + .byte 196,98,125,24,61,37,85,0,0 // vbroadcastss 0x5525(%rip),%ymm15 # 6814 <_sk_callback_avx+0x1c8> .byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11 .byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0 .byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11 @@ -15408,7 +15626,7 @@ _sk_luminosity_avx: .byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9 .byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0 .byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8 - .byte 196,226,125,24,5,88,81,0,0 // vbroadcastss 0x5158(%rip),%ymm0 # 6584 <_sk_callback_avx+0x1cc> + .byte 196,226,125,24,5,236,83,0,0 // vbroadcastss 0x53ec(%rip),%ymm0 # 6818 <_sk_callback_avx+0x1cc> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -15428,6 +15646,159 @@ _sk_luminosity_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax +HIDDEN _sk_srcover_rgba_8888_avx +.globl _sk_srcover_rgba_8888_avx +FUNCTION(_sk_srcover_rgba_8888_avx) +_sk_srcover_rgba_8888_avx: + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 76,139,16 // mov (%rax),%r10 + .byte 72,133,201 // test %rcx,%rcx + .byte 15,133,46,1,0,0 // jne 15b3 <_sk_srcover_rgba_8888_avx+0x13c> + .byte 196,65,124,16,4,186 // vmovups (%r10,%rdi,4),%ymm8 + .byte 197,124,40,13,45,87,0,0 // vmovaps 0x572d(%rip),%ymm9 # 6bc0 <_sk_callback_avx+0x574> + .byte 196,193,60,84,225 // vandps %ymm9,%ymm8,%ymm4 + .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 + .byte 196,193,81,114,208,8 // vpsrld $0x8,%xmm8,%xmm5 + .byte 196,99,125,25,199,1 // vextractf128 $0x1,%ymm8,%xmm7 + .byte 197,201,114,215,8 // vpsrld $0x8,%xmm7,%xmm6 + .byte 196,227,85,24,238,1 // vinsertf128 $0x1,%xmm6,%ymm5,%ymm5 + .byte 196,193,84,84,233 // vandps %ymm9,%ymm5,%ymm5 + .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 + .byte 196,193,41,114,208,16 // vpsrld $0x10,%xmm8,%xmm10 + .byte 197,201,114,215,16 // vpsrld $0x10,%xmm7,%xmm6 + .byte 196,227,45,24,246,1 // vinsertf128 $0x1,%xmm6,%ymm10,%ymm6 + .byte 196,193,76,84,241 // vandps %ymm9,%ymm6,%ymm6 + .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 + .byte 196,193,57,114,208,24 // vpsrld $0x18,%xmm8,%xmm8 + .byte 197,193,114,215,24 // vpsrld $0x18,%xmm7,%xmm7 + .byte 196,227,61,24,255,1 // vinsertf128 $0x1,%xmm7,%ymm8,%ymm7 + .byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7 + .byte 196,98,125,24,5,40,83,0,0 // vbroadcastss 0x5328(%rip),%ymm8 # 681c <_sk_callback_avx+0x1d0> + .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 + .byte 196,98,125,24,13,31,83,0,0 // vbroadcastss 0x531f(%rip),%ymm9 # 6820 <_sk_callback_avx+0x1d4> + .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 + .byte 197,60,89,212 // vmulps %ymm4,%ymm8,%ymm10 + .byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0 + .byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1 + .byte 197,60,89,213 // vmulps %ymm5,%ymm8,%ymm10 + .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1 + .byte 196,193,108,89,209 // vmulps %ymm9,%ymm2,%ymm2 + .byte 197,60,89,214 // vmulps %ymm6,%ymm8,%ymm10 + .byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2 + .byte 196,193,100,89,217 // vmulps %ymm9,%ymm3,%ymm3 + .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 + .byte 196,193,100,88,216 // vaddps %ymm8,%ymm3,%ymm3 + .byte 197,125,91,192 // vcvtps2dq %ymm0,%ymm8 + .byte 197,125,91,201 // vcvtps2dq %ymm1,%ymm9 + .byte 196,193,41,114,241,8 // vpslld $0x8,%xmm9,%xmm10 + .byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9 + .byte 196,193,49,114,241,8 // vpslld $0x8,%xmm9,%xmm9 + .byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 + .byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8 + .byte 197,125,91,202 // vcvtps2dq %ymm2,%ymm9 + .byte 196,193,41,114,241,16 // vpslld $0x10,%xmm9,%xmm10 + .byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9 + .byte 196,193,49,114,241,16 // vpslld $0x10,%xmm9,%xmm9 + .byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 + .byte 197,125,91,211 // vcvtps2dq %ymm3,%ymm10 + .byte 196,193,33,114,242,24 // vpslld $0x18,%xmm10,%xmm11 + .byte 196,67,125,25,210,1 // vextractf128 $0x1,%ymm10,%xmm10 + .byte 196,193,41,114,242,24 // vpslld $0x18,%xmm10,%xmm10 + .byte 196,67,37,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm11,%ymm10 + .byte 196,65,53,86,202 // vorpd %ymm10,%ymm9,%ymm9 + .byte 196,65,61,86,193 // vorpd %ymm9,%ymm8,%ymm8 + .byte 72,133,201 // test %rcx,%rcx + .byte 15,133,183,0,0,0 // jne 1660 <_sk_srcover_rgba_8888_avx+0x1e9> + .byte 196,65,124,17,4,186 // vmovups %ymm8,(%r10,%rdi,4) + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + .byte 65,137,200 // mov %ecx,%r8d + .byte 65,128,224,7 // and $0x7,%r8b + .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 + .byte 65,254,200 // dec %r8b + .byte 65,128,248,6 // cmp $0x6,%r8b + .byte 15,135,191,254,255,255 // ja 148b <_sk_srcover_rgba_8888_avx+0x14> + .byte 69,15,182,192 // movzbl %r8b,%r8d + .byte 76,141,13,253,0,0,0 // lea 0xfd(%rip),%r9 # 16d4 <_sk_srcover_rgba_8888_avx+0x25d> + .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax + .byte 76,1,200 // add %r9,%rax + .byte 255,224 // jmpq *%rax + .byte 196,193,121,110,100,186,24 // vmovd 0x18(%r10,%rdi,4),%xmm4 + .byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4 + .byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4 + .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 + .byte 196,99,85,12,196,64 // vblendps $0x40,%ymm4,%ymm5,%ymm8 + .byte 196,99,125,25,196,1 // vextractf128 $0x1,%ymm8,%xmm4 + .byte 196,195,89,34,100,186,20,1 // vpinsrd $0x1,0x14(%r10,%rdi,4),%xmm4,%xmm4 + .byte 196,99,61,24,196,1 // vinsertf128 $0x1,%xmm4,%ymm8,%ymm8 + .byte 196,99,125,25,196,1 // vextractf128 $0x1,%ymm8,%xmm4 + .byte 196,195,89,34,100,186,16,0 // vpinsrd $0x0,0x10(%r10,%rdi,4),%xmm4,%xmm4 + .byte 196,99,61,24,196,1 // vinsertf128 $0x1,%xmm4,%ymm8,%ymm8 + .byte 196,195,57,34,100,186,12,3 // vpinsrd $0x3,0xc(%r10,%rdi,4),%xmm8,%xmm4 + .byte 196,99,61,12,196,15 // vblendps $0xf,%ymm4,%ymm8,%ymm8 + .byte 196,195,57,34,100,186,8,2 // vpinsrd $0x2,0x8(%r10,%rdi,4),%xmm8,%xmm4 + .byte 196,99,61,12,196,15 // vblendps $0xf,%ymm4,%ymm8,%ymm8 + .byte 196,195,57,34,100,186,4,1 // vpinsrd $0x1,0x4(%r10,%rdi,4),%xmm8,%xmm4 + .byte 196,99,61,12,196,15 // vblendps $0xf,%ymm4,%ymm8,%ymm8 + .byte 196,195,57,34,36,186,0 // vpinsrd $0x0,(%r10,%rdi,4),%xmm8,%xmm4 + .byte 196,99,61,12,196,15 // vblendps $0xf,%ymm4,%ymm8,%ymm8 + .byte 233,43,254,255,255 // jmpq 148b <_sk_srcover_rgba_8888_avx+0x14> + .byte 65,137,200 // mov %ecx,%r8d + .byte 65,128,224,7 // and $0x7,%r8b + .byte 65,254,200 // dec %r8b + .byte 65,128,248,6 // cmp $0x6,%r8b + .byte 15,135,59,255,255,255 // ja 15af <_sk_srcover_rgba_8888_avx+0x138> + .byte 65,15,182,192 // movzbl %r8b,%eax + .byte 76,141,5,113,0,0,0 // lea 0x71(%rip),%r8 # 16f0 <_sk_srcover_rgba_8888_avx+0x279> + .byte 73,99,4,128 // movslq (%r8,%rax,4),%rax + .byte 76,1,192 // add %r8,%rax + .byte 255,224 // jmpq *%rax + .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 + .byte 196,67,121,22,76,186,24,2 // vpextrd $0x2,%xmm9,0x18(%r10,%rdi,4) + .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 + .byte 196,67,121,22,76,186,20,1 // vpextrd $0x1,%xmm9,0x14(%r10,%rdi,4) + .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 + .byte 196,65,122,17,76,186,16 // vmovss %xmm9,0x10(%r10,%rdi,4) + .byte 196,67,121,22,68,186,12,3 // vpextrd $0x3,%xmm8,0xc(%r10,%rdi,4) + .byte 196,67,121,22,68,186,8,2 // vpextrd $0x2,%xmm8,0x8(%r10,%rdi,4) + .byte 196,67,121,22,68,186,4,1 // vpextrd $0x1,%xmm8,0x4(%r10,%rdi,4) + .byte 196,65,121,126,4,186 // vmovd %xmm8,(%r10,%rdi,4) + .byte 233,219,254,255,255 // jmpq 15af <_sk_srcover_rgba_8888_avx+0x138> + .byte 122,255 // jp 16d5 <_sk_srcover_rgba_8888_avx+0x25e> + .byte 255 // (bad) + .byte 255,108,255,255 // ljmp *-0x1(%rdi,%rdi,8) + .byte 255,94,255 // lcall *-0x1(%rsi) + .byte 255 // (bad) + .byte 255,80,255 // callq *-0x1(%rax) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 60,255 // cmp $0xff,%al + .byte 255 // (bad) + .byte 255,40 // ljmp *(%rax) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,12,255 // decl (%rdi,%rdi,8) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 217,255 // fcos + .byte 255 // (bad) + .byte 255,209 // callq *%rcx + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,201 // dec %ecx + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,193 // inc %ecx + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,180,255,255,255,166,255 // pushq -0x590001(%rdi,%rdi,8) + .byte 255 // (bad) + .byte 255 // .byte 0xff + .byte 152 // cwtl + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255 // .byte 0xff + HIDDEN _sk_clamp_0_avx .globl _sk_clamp_0_avx FUNCTION(_sk_clamp_0_avx) @@ -15444,7 +15815,7 @@ HIDDEN _sk_clamp_1_avx .globl _sk_clamp_1_avx FUNCTION(_sk_clamp_1_avx) _sk_clamp_1_avx: - .byte 196,98,125,24,5,235,80,0,0 // vbroadcastss 0x50eb(%rip),%ymm8 # 6588 <_sk_callback_avx+0x1d0> + .byte 196,98,125,24,5,242,80,0,0 // vbroadcastss 0x50f2(%rip),%ymm8 # 6824 <_sk_callback_avx+0x1d8> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 @@ -15456,7 +15827,7 @@ HIDDEN _sk_clamp_a_avx .globl _sk_clamp_a_avx FUNCTION(_sk_clamp_a_avx) _sk_clamp_a_avx: - .byte 196,98,125,24,5,206,80,0,0 // vbroadcastss 0x50ce(%rip),%ymm8 # 658c <_sk_callback_avx+0x1d4> + .byte 196,98,125,24,5,213,80,0,0 // vbroadcastss 0x50d5(%rip),%ymm8 # 6828 <_sk_callback_avx+0x1dc> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0 .byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1 @@ -15542,7 +15913,7 @@ FUNCTION(_sk_unpremul_avx) _sk_unpremul_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9 - .byte 196,98,125,24,21,22,80,0,0 // vbroadcastss 0x5016(%rip),%ymm10 # 6590 <_sk_callback_avx+0x1d8> + .byte 196,98,125,24,21,29,80,0,0 // vbroadcastss 0x501d(%rip),%ymm10 # 682c <_sk_callback_avx+0x1e0> .byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10 .byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 @@ -15555,17 +15926,17 @@ HIDDEN _sk_from_srgb_avx .globl _sk_from_srgb_avx FUNCTION(_sk_from_srgb_avx) _sk_from_srgb_avx: - .byte 196,98,125,24,5,247,79,0,0 // vbroadcastss 0x4ff7(%rip),%ymm8 # 6594 <_sk_callback_avx+0x1dc> + .byte 196,98,125,24,5,254,79,0,0 // vbroadcastss 0x4ffe(%rip),%ymm8 # 6830 <_sk_callback_avx+0x1e4> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10 - .byte 196,98,125,24,29,233,79,0,0 // vbroadcastss 0x4fe9(%rip),%ymm11 # 6598 <_sk_callback_avx+0x1e0> + .byte 196,98,125,24,29,240,79,0,0 // vbroadcastss 0x4ff0(%rip),%ymm11 # 6834 <_sk_callback_avx+0x1e8> .byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12 - .byte 196,98,125,24,45,223,79,0,0 // vbroadcastss 0x4fdf(%rip),%ymm13 # 659c <_sk_callback_avx+0x1e4> + .byte 196,98,125,24,45,230,79,0,0 // vbroadcastss 0x4fe6(%rip),%ymm13 # 6838 <_sk_callback_avx+0x1ec> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,208,79,0,0 // vbroadcastss 0x4fd0(%rip),%ymm12 # 65a0 <_sk_callback_avx+0x1e8> + .byte 196,98,125,24,37,215,79,0,0 // vbroadcastss 0x4fd7(%rip),%ymm12 # 683c <_sk_callback_avx+0x1f0> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,53,198,79,0,0 // vbroadcastss 0x4fc6(%rip),%ymm14 # 65a4 <_sk_callback_avx+0x1ec> + .byte 196,98,125,24,53,205,79,0,0 // vbroadcastss 0x4fcd(%rip),%ymm14 # 6840 <_sk_callback_avx+0x1f4> .byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0 .byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0 .byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9 @@ -15592,20 +15963,20 @@ HIDDEN _sk_to_srgb_avx FUNCTION(_sk_to_srgb_avx) _sk_to_srgb_avx: .byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9 - .byte 196,98,125,24,5,91,79,0,0 // vbroadcastss 0x4f5b(%rip),%ymm8 # 65a8 <_sk_callback_avx+0x1f0> + .byte 196,98,125,24,5,98,79,0,0 // vbroadcastss 0x4f62(%rip),%ymm8 # 6844 <_sk_callback_avx+0x1f8> .byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10 - .byte 196,98,125,24,29,81,79,0,0 // vbroadcastss 0x4f51(%rip),%ymm11 # 65ac <_sk_callback_avx+0x1f4> + .byte 196,98,125,24,29,88,79,0,0 // vbroadcastss 0x4f58(%rip),%ymm11 # 6848 <_sk_callback_avx+0x1fc> .byte 196,65,52,89,227 // vmulps %ymm11,%ymm9,%ymm12 - .byte 196,98,125,24,45,71,79,0,0 // vbroadcastss 0x4f47(%rip),%ymm13 # 65b0 <_sk_callback_avx+0x1f8> + .byte 196,98,125,24,45,78,79,0,0 // vbroadcastss 0x4f4e(%rip),%ymm13 # 684c <_sk_callback_avx+0x200> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,52,89,228 // vmulps %ymm12,%ymm9,%ymm12 - .byte 196,98,125,24,53,56,79,0,0 // vbroadcastss 0x4f38(%rip),%ymm14 # 65b4 <_sk_callback_avx+0x1fc> + .byte 196,98,125,24,53,63,79,0,0 // vbroadcastss 0x4f3f(%rip),%ymm14 # 6850 <_sk_callback_avx+0x204> .byte 196,65,28,88,230 // vaddps %ymm14,%ymm12,%ymm12 - .byte 196,98,125,24,61,46,79,0,0 // vbroadcastss 0x4f2e(%rip),%ymm15 # 65b8 <_sk_callback_avx+0x200> + .byte 196,98,125,24,61,53,79,0,0 // vbroadcastss 0x4f35(%rip),%ymm15 # 6854 <_sk_callback_avx+0x208> .byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9 .byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9 .byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9 - .byte 196,98,125,24,37,26,79,0,0 // vbroadcastss 0x4f1a(%rip),%ymm12 # 65bc <_sk_callback_avx+0x204> + .byte 196,98,125,24,37,33,79,0,0 // vbroadcastss 0x4f21(%rip),%ymm12 # 6858 <_sk_callback_avx+0x20c> .byte 196,193,124,194,196,1 // vcmpltps %ymm12,%ymm0,%ymm0 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9 @@ -15642,7 +16013,7 @@ _sk_rgb_to_hsl_avx: .byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9 .byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9 .byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,29,128,78,0,0 // vbroadcastss 0x4e80(%rip),%ymm11 # 65c0 <_sk_callback_avx+0x208> + .byte 196,98,125,24,29,135,78,0,0 // vbroadcastss 0x4e87(%rip),%ymm11 # 685c <_sk_callback_avx+0x210> .byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11 .byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12 .byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12 @@ -15652,19 +16023,19 @@ _sk_rgb_to_hsl_avx: .byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2 .byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1 .byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,89,78,0,0 // vbroadcastss 0x4e59(%rip),%ymm11 # 65cc <_sk_callback_avx+0x214> + .byte 196,98,125,24,29,96,78,0,0 // vbroadcastss 0x4e60(%rip),%ymm11 # 6868 <_sk_callback_avx+0x21c> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,71,78,0,0 // vbroadcastss 0x4e47(%rip),%ymm11 # 65c8 <_sk_callback_avx+0x210> + .byte 196,98,125,24,29,78,78,0,0 // vbroadcastss 0x4e4e(%rip),%ymm11 # 6864 <_sk_callback_avx+0x218> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,47,78,0,0 // vbroadcastss 0x4e2f(%rip),%ymm2 # 65c4 <_sk_callback_avx+0x20c> + .byte 196,226,125,24,21,54,78,0,0 // vbroadcastss 0x4e36(%rip),%ymm2 # 6860 <_sk_callback_avx+0x214> .byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14 .byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2 .byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0 .byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2 .byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0 .byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1 - .byte 196,98,125,24,37,22,78,0,0 // vbroadcastss 0x4e16(%rip),%ymm12 # 65d4 <_sk_callback_avx+0x21c> + .byte 196,98,125,24,37,29,78,0,0 // vbroadcastss 0x4e1d(%rip),%ymm12 # 6870 <_sk_callback_avx+0x224> .byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2 .byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12 .byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11 @@ -15674,7 +16045,7 @@ _sk_rgb_to_hsl_avx: .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0 .byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1 - .byte 196,98,125,24,5,217,77,0,0 // vbroadcastss 0x4dd9(%rip),%ymm8 # 65d0 <_sk_callback_avx+0x218> + .byte 196,98,125,24,5,224,77,0,0 // vbroadcastss 0x4de0(%rip),%ymm8 # 686c <_sk_callback_avx+0x220> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -15691,7 +16062,7 @@ _sk_hsl_to_rgb_avx: .byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp) .byte 197,252,40,225 // vmovaps %ymm1,%ymm4 .byte 197,252,40,216 // vmovaps %ymm0,%ymm3 - .byte 196,98,125,24,5,166,77,0,0 // vbroadcastss 0x4da6(%rip),%ymm8 # 65d8 <_sk_callback_avx+0x220> + .byte 196,98,125,24,5,173,77,0,0 // vbroadcastss 0x4dad(%rip),%ymm8 # 6874 <_sk_callback_avx+0x228> .byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9 .byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10 .byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11 @@ -15699,23 +16070,23 @@ _sk_hsl_to_rgb_avx: .byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10 .byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,29,128,77,0,0 // vbroadcastss 0x4d80(%rip),%ymm11 # 65dc <_sk_callback_avx+0x224> + .byte 196,98,125,24,29,135,77,0,0 // vbroadcastss 0x4d87(%rip),%ymm11 # 6878 <_sk_callback_avx+0x22c> .byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11 .byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12 .byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15 .byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11 - .byte 196,98,125,24,37,106,77,0,0 // vbroadcastss 0x4d6a(%rip),%ymm12 # 65e4 <_sk_callback_avx+0x22c> + .byte 196,98,125,24,37,113,77,0,0 // vbroadcastss 0x4d71(%rip),%ymm12 # 6880 <_sk_callback_avx+0x234> .byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0 - .byte 196,98,125,24,45,96,77,0,0 // vbroadcastss 0x4d60(%rip),%ymm13 # 65e8 <_sk_callback_avx+0x230> + .byte 196,98,125,24,45,103,77,0,0 // vbroadcastss 0x4d67(%rip),%ymm13 # 6884 <_sk_callback_avx+0x238> .byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14 .byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14 .byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14 - .byte 196,226,125,24,13,65,77,0,0 // vbroadcastss 0x4d41(%rip),%ymm1 # 65e0 <_sk_callback_avx+0x228> + .byte 196,226,125,24,13,72,77,0,0 // vbroadcastss 0x4d48(%rip),%ymm1 # 687c <_sk_callback_avx+0x230> .byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7 .byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7 .byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14 .byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7 - .byte 196,98,125,24,53,44,77,0,0 // vbroadcastss 0x4d2c(%rip),%ymm14 # 65ec <_sk_callback_avx+0x234> + .byte 196,98,125,24,53,51,77,0,0 // vbroadcastss 0x4d33(%rip),%ymm14 # 6888 <_sk_callback_avx+0x23c> .byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15 .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -15734,7 +16105,7 @@ _sk_hsl_to_rgb_avx: .byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6 .byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6 .byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5 - .byte 196,226,125,24,5,206,76,0,0 // vbroadcastss 0x4cce(%rip),%ymm0 # 65f0 <_sk_callback_avx+0x238> + .byte 196,226,125,24,5,213,76,0,0 // vbroadcastss 0x4cd5(%rip),%ymm0 # 688c <_sk_callback_avx+0x240> .byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0 .byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3 .byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0 @@ -15786,14 +16157,14 @@ _sk_scale_u8_avx: .byte 72,139,0 // mov (%rax),%rax .byte 72,1,248 // add %rdi,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,68 // jne 1a19 <_sk_scale_u8_avx+0x54> + .byte 117,68 // jne 1cae <_sk_scale_u8_avx+0x54> .byte 197,122,126,0 // vmovq (%rax),%xmm8 .byte 196,66,121,49,200 // vpmovzxbd %xmm8,%xmm9 .byte 196,67,121,4,192,229 // vpermilps $0xe5,%xmm8,%xmm8 .byte 196,66,121,49,192 // vpmovzxbd %xmm8,%xmm8 .byte 196,67,53,24,192,1 // vinsertf128 $0x1,%xmm8,%ymm9,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,247,75,0,0 // vbroadcastss 0x4bf7(%rip),%ymm9 # 65f4 <_sk_callback_avx+0x23c> + .byte 196,98,125,24,13,254,75,0,0 // vbroadcastss 0x4bfe(%rip),%ymm9 # 6890 <_sk_callback_avx+0x244> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -15811,9 +16182,9 @@ _sk_scale_u8_avx: .byte 77,9,217 // or %r11,%r9 .byte 72,131,193,8 // add $0x8,%rcx .byte 73,255,202 // dec %r10 - .byte 117,234 // jne 1a21 <_sk_scale_u8_avx+0x5c> + .byte 117,234 // jne 1cb6 <_sk_scale_u8_avx+0x5c> .byte 196,65,249,110,193 // vmovq %r9,%xmm8 - .byte 235,155 // jmp 19d9 <_sk_scale_u8_avx+0x14> + .byte 235,155 // jmp 1c6e <_sk_scale_u8_avx+0x14> HIDDEN _sk_lerp_1_float_avx .globl _sk_lerp_1_float_avx @@ -15845,14 +16216,14 @@ _sk_lerp_u8_avx: .byte 72,139,0 // mov (%rax),%rax .byte 72,1,248 // add %rdi,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,104 // jne 1af5 <_sk_lerp_u8_avx+0x78> + .byte 117,104 // jne 1d8a <_sk_lerp_u8_avx+0x78> .byte 197,122,126,0 // vmovq (%rax),%xmm8 .byte 196,66,121,49,200 // vpmovzxbd %xmm8,%xmm9 .byte 196,67,121,4,192,229 // vpermilps $0xe5,%xmm8,%xmm8 .byte 196,66,121,49,192 // vpmovzxbd %xmm8,%xmm8 .byte 196,67,53,24,192,1 // vinsertf128 $0x1,%xmm8,%ymm9,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,67,75,0,0 // vbroadcastss 0x4b43(%rip),%ymm9 # 65f8 <_sk_callback_avx+0x240> + .byte 196,98,125,24,13,74,75,0,0 // vbroadcastss 0x4b4a(%rip),%ymm9 # 6894 <_sk_callback_avx+0x248> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 @@ -15878,9 +16249,9 @@ _sk_lerp_u8_avx: .byte 77,9,217 // or %r11,%r9 .byte 72,131,193,8 // add $0x8,%rcx .byte 73,255,202 // dec %r10 - .byte 117,234 // jne 1afd <_sk_lerp_u8_avx+0x80> + .byte 117,234 // jne 1d92 <_sk_lerp_u8_avx+0x80> .byte 196,65,249,110,193 // vmovq %r9,%xmm8 - .byte 233,116,255,255,255 // jmpq 1a91 <_sk_lerp_u8_avx+0x14> + .byte 233,116,255,255,255 // jmpq 1d26 <_sk_lerp_u8_avx+0x14> HIDDEN _sk_lerp_565_avx .globl _sk_lerp_565_avx @@ -15889,26 +16260,26 @@ _sk_lerp_565_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,208,0,0,0 // jne 1bfb <_sk_lerp_565_avx+0xde> + .byte 15,133,208,0,0,0 // jne 1e90 <_sk_lerp_565_avx+0xde> .byte 196,65,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9 .byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8 .byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,173,74,0,0 // vbroadcastss 0x4aad(%rip),%ymm9 # 65fc <_sk_callback_avx+0x244> + .byte 196,98,125,24,13,180,74,0,0 // vbroadcastss 0x4ab4(%rip),%ymm9 # 6898 <_sk_callback_avx+0x24c> .byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9 .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9 - .byte 196,98,125,24,21,158,74,0,0 // vbroadcastss 0x4a9e(%rip),%ymm10 # 6600 <_sk_callback_avx+0x248> + .byte 196,98,125,24,21,165,74,0,0 // vbroadcastss 0x4aa5(%rip),%ymm10 # 689c <_sk_callback_avx+0x250> .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,148,74,0,0 // vbroadcastss 0x4a94(%rip),%ymm10 # 6604 <_sk_callback_avx+0x24c> + .byte 196,98,125,24,21,155,74,0,0 // vbroadcastss 0x4a9b(%rip),%ymm10 # 68a0 <_sk_callback_avx+0x254> .byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10 .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10 - .byte 196,98,125,24,29,133,74,0,0 // vbroadcastss 0x4a85(%rip),%ymm11 # 6608 <_sk_callback_avx+0x250> + .byte 196,98,125,24,29,140,74,0,0 // vbroadcastss 0x4a8c(%rip),%ymm11 # 68a4 <_sk_callback_avx+0x258> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,29,123,74,0,0 // vbroadcastss 0x4a7b(%rip),%ymm11 # 660c <_sk_callback_avx+0x254> + .byte 196,98,125,24,29,130,74,0,0 // vbroadcastss 0x4a82(%rip),%ymm11 # 68a8 <_sk_callback_avx+0x25c> .byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,29,108,74,0,0 // vbroadcastss 0x4a6c(%rip),%ymm11 # 6610 <_sk_callback_avx+0x258> + .byte 196,98,125,24,29,115,74,0,0 // vbroadcastss 0x4a73(%rip),%ymm11 # 68ac <_sk_callback_avx+0x260> .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 @@ -15935,9 +16306,9 @@ _sk_lerp_565_avx: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 15,135,29,255,255,255 // ja 1b31 <_sk_lerp_565_avx+0x14> + .byte 15,135,29,255,255,255 // ja 1dc6 <_sk_lerp_565_avx+0x14> .byte 69,15,182,192 // movzbl %r8b,%r8d - .byte 76,141,13,77,0,0,0 // lea 0x4d(%rip),%r9 # 1c6c <_sk_lerp_565_avx+0x14f> + .byte 76,141,13,76,0,0,0 // lea 0x4c(%rip),%r9 # 1f00 <_sk_lerp_565_avx+0x14e> .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax @@ -15949,26 +16320,28 @@ _sk_lerp_565_avx: .byte 196,65,57,196,68,122,4,2 // vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm8,%xmm8 .byte 196,65,57,196,68,122,2,1 // vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm8,%xmm8 .byte 196,65,57,196,4,122,0 // vpinsrw $0x0,(%r10,%rdi,2),%xmm8,%xmm8 - .byte 233,200,254,255,255 // jmpq 1b31 <_sk_lerp_565_avx+0x14> - .byte 15,31,0 // nopl (%rax) - .byte 241 // icebp + .byte 233,200,254,255,255 // jmpq 1dc6 <_sk_lerp_565_avx+0x14> + .byte 102,144 // xchg %ax,%ax + .byte 242,255 // repnz (bad) .byte 255 // (bad) .byte 255 // (bad) + .byte 234 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,225 // jmpq ffffffffe2001c74 <_sk_callback_avx+0xffffffffe1ffb8bc> .byte 255 // (bad) + .byte 255,226 // jmpq *%rdx .byte 255 // (bad) .byte 255 // (bad) - .byte 217,255 // fcos .byte 255 // (bad) - .byte 255,209 // callq *%rcx + .byte 218,255 // (bad) .byte 255 // (bad) + .byte 255,210 // callq *%rdx .byte 255 // (bad) - .byte 255,201 // dec %ecx + .byte 255 // (bad) + .byte 255,202 // dec %edx .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 188 // .byte 0xbc + .byte 189 // .byte 0xbd .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -15980,7 +16353,7 @@ _sk_load_tables_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,0 // mov (%rax),%r8 .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,26,2,0,0 // jne 1eb0 <_sk_load_tables_avx+0x228> + .byte 15,133,26,2,0,0 // jne 2144 <_sk_load_tables_avx+0x228> .byte 196,65,124,16,4,184 // vmovups (%r8,%rdi,4),%ymm8 .byte 85 // push %rbp .byte 65,87 // push %r15 @@ -15988,7 +16361,7 @@ _sk_load_tables_avx: .byte 65,85 // push %r13 .byte 65,84 // push %r12 .byte 83 // push %rbx - .byte 197,124,40,13,114,76,0,0 // vmovaps 0x4c72(%rip),%ymm9 # 6920 <_sk_callback_avx+0x568> + .byte 197,124,40,13,158,76,0,0 // vmovaps 0x4c9e(%rip),%ymm9 # 6be0 <_sk_callback_avx+0x594> .byte 196,193,60,84,193 // vandps %ymm9,%ymm8,%ymm0 .byte 196,193,249,126,193 // vmovq %xmm0,%r9 .byte 69,137,203 // mov %r9d,%r11d @@ -16080,7 +16453,7 @@ _sk_load_tables_avx: .byte 196,193,97,114,210,24 // vpsrld $0x18,%xmm10,%xmm3 .byte 196,227,61,24,219,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,119,71,0,0 // vbroadcastss 0x4777(%rip),%ymm8 # 6614 <_sk_callback_avx+0x25c> + .byte 196,98,125,24,5,127,71,0,0 // vbroadcastss 0x477f(%rip),%ymm8 # 68b0 <_sk_callback_avx+0x264> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -16095,9 +16468,9 @@ _sk_load_tables_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 15,135,211,253,255,255 // ja 1c9c <_sk_load_tables_avx+0x14> + .byte 15,135,211,253,255,255 // ja 1f30 <_sk_load_tables_avx+0x14> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,140,0,0,0 // lea 0x8c(%rip),%r10 # 1f60 <_sk_load_tables_avx+0x2d8> + .byte 76,141,21,140,0,0,0 // lea 0x8c(%rip),%r10 # 21f4 <_sk_load_tables_avx+0x2d8> .byte 79,99,12,138 // movslq (%r10,%r9,4),%r9 .byte 77,1,209 // add %r10,%r9 .byte 65,255,225 // jmpq *%r9 @@ -16120,7 +16493,7 @@ _sk_load_tables_avx: .byte 196,99,61,12,192,15 // vblendps $0xf,%ymm0,%ymm8,%ymm8 .byte 196,195,57,34,4,184,0 // vpinsrd $0x0,(%r8,%rdi,4),%xmm8,%xmm0 .byte 196,99,61,12,192,15 // vblendps $0xf,%ymm0,%ymm8,%ymm8 - .byte 233,62,253,255,255 // jmpq 1c9c <_sk_load_tables_avx+0x14> + .byte 233,62,253,255,255 // jmpq 1f30 <_sk_load_tables_avx+0x14> .byte 102,144 // xchg %ax,%ax .byte 236 // in (%dx),%al .byte 255 // (bad) @@ -16138,7 +16511,7 @@ _sk_load_tables_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 126,255 // jle 1f79 <_sk_load_tables_avx+0x2f1> + .byte 126,255 // jle 220d <_sk_load_tables_avx+0x2f1> .byte 255 // (bad) .byte 255 // .byte 0xff @@ -16150,7 +16523,7 @@ _sk_load_tables_u16_be_avx: .byte 76,139,0 // mov (%rax),%r8 .byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9 .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,113,2,0,0 // jne 2203 <_sk_load_tables_u16_be_avx+0x287> + .byte 15,133,113,2,0,0 // jne 2497 <_sk_load_tables_u16_be_avx+0x287> .byte 196,1,121,16,4,72 // vmovupd (%r8,%r9,2),%xmm8 .byte 196,129,121,16,84,72,16 // vmovupd 0x10(%r8,%r9,2),%xmm2 .byte 196,129,121,16,92,72,32 // vmovupd 0x20(%r8,%r9,2),%xmm3 @@ -16172,7 +16545,7 @@ _sk_load_tables_u16_be_avx: .byte 197,177,108,208 // vpunpcklqdq %xmm0,%xmm9,%xmm2 .byte 197,177,109,200 // vpunpckhqdq %xmm0,%xmm9,%xmm1 .byte 196,65,57,108,212 // vpunpcklqdq %xmm12,%xmm8,%xmm10 - .byte 197,121,111,29,178,73,0,0 // vmovdqa 0x49b2(%rip),%xmm11 # 69a0 <_sk_callback_avx+0x5e8> + .byte 197,121,111,29,222,73,0,0 // vmovdqa 0x49de(%rip),%xmm11 # 6c60 <_sk_callback_avx+0x614> .byte 196,193,105,219,195 // vpand %xmm11,%xmm2,%xmm0 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 196,193,121,105,209 // vpunpckhwd %xmm9,%xmm0,%xmm2 @@ -16271,7 +16644,7 @@ _sk_load_tables_u16_be_avx: .byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3 .byte 196,195,101,24,216,1 // vinsertf128 $0x1,%xmm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,40,68,0,0 // vbroadcastss 0x4428(%rip),%ymm8 # 6618 <_sk_callback_avx+0x260> + .byte 196,98,125,24,5,48,68,0,0 // vbroadcastss 0x4430(%rip),%ymm8 # 68b4 <_sk_callback_avx+0x268> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -16284,29 +16657,29 @@ _sk_load_tables_u16_be_avx: .byte 196,1,123,16,4,72 // vmovsd (%r8,%r9,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 116,85 // je 2269 <_sk_load_tables_u16_be_avx+0x2ed> + .byte 116,85 // je 24fd <_sk_load_tables_u16_be_avx+0x2ed> .byte 196,1,57,22,68,72,8 // vmovhpd 0x8(%r8,%r9,2),%xmm8,%xmm8 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,72 // jb 2269 <_sk_load_tables_u16_be_avx+0x2ed> + .byte 114,72 // jb 24fd <_sk_load_tables_u16_be_avx+0x2ed> .byte 196,129,123,16,84,72,16 // vmovsd 0x10(%r8,%r9,2),%xmm2 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 116,72 // je 2276 <_sk_load_tables_u16_be_avx+0x2fa> + .byte 116,72 // je 250a <_sk_load_tables_u16_be_avx+0x2fa> .byte 196,129,105,22,84,72,24 // vmovhpd 0x18(%r8,%r9,2),%xmm2,%xmm2 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,59 // jb 2276 <_sk_load_tables_u16_be_avx+0x2fa> + .byte 114,59 // jb 250a <_sk_load_tables_u16_be_avx+0x2fa> .byte 196,129,123,16,92,72,32 // vmovsd 0x20(%r8,%r9,2),%xmm3 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 15,132,97,253,255,255 // je 1fad <_sk_load_tables_u16_be_avx+0x31> + .byte 15,132,97,253,255,255 // je 2241 <_sk_load_tables_u16_be_avx+0x31> .byte 196,129,97,22,92,72,40 // vmovhpd 0x28(%r8,%r9,2),%xmm3,%xmm3 .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 15,130,80,253,255,255 // jb 1fad <_sk_load_tables_u16_be_avx+0x31> + .byte 15,130,80,253,255,255 // jb 2241 <_sk_load_tables_u16_be_avx+0x31> .byte 196,1,122,126,76,72,48 // vmovq 0x30(%r8,%r9,2),%xmm9 - .byte 233,68,253,255,255 // jmpq 1fad <_sk_load_tables_u16_be_avx+0x31> + .byte 233,68,253,255,255 // jmpq 2241 <_sk_load_tables_u16_be_avx+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,55,253,255,255 // jmpq 1fad <_sk_load_tables_u16_be_avx+0x31> + .byte 233,55,253,255,255 // jmpq 2241 <_sk_load_tables_u16_be_avx+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,46,253,255,255 // jmpq 1fad <_sk_load_tables_u16_be_avx+0x31> + .byte 233,46,253,255,255 // jmpq 2241 <_sk_load_tables_u16_be_avx+0x31> HIDDEN _sk_load_tables_rgb_u16_be_avx .globl _sk_load_tables_rgb_u16_be_avx @@ -16316,7 +16689,7 @@ _sk_load_tables_rgb_u16_be_avx: .byte 76,139,0 // mov (%rax),%r8 .byte 76,141,12,127 // lea (%rdi,%rdi,2),%r9 .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,93,2,0,0 // jne 24ee <_sk_load_tables_rgb_u16_be_avx+0x26f> + .byte 15,133,93,2,0,0 // jne 2782 <_sk_load_tables_rgb_u16_be_avx+0x26f> .byte 196,129,122,111,4,72 // vmovdqu (%r8,%r9,2),%xmm0 .byte 196,129,122,111,84,72,12 // vmovdqu 0xc(%r8,%r9,2),%xmm2 .byte 196,129,122,111,76,72,24 // vmovdqu 0x18(%r8,%r9,2),%xmm1 @@ -16343,7 +16716,7 @@ _sk_load_tables_rgb_u16_be_avx: .byte 197,185,108,202 // vpunpcklqdq %xmm2,%xmm8,%xmm1 .byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2 .byte 197,121,108,195 // vpunpcklqdq %xmm3,%xmm0,%xmm8 - .byte 197,121,111,13,171,70,0,0 // vmovdqa 0x46ab(%rip),%xmm9 # 69b0 <_sk_callback_avx+0x5f8> + .byte 197,121,111,13,215,70,0,0 // vmovdqa 0x46d7(%rip),%xmm9 # 6c70 <_sk_callback_avx+0x624> .byte 196,193,113,219,193 // vpand %xmm9,%xmm1,%xmm0 .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10 .byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1 @@ -16435,7 +16808,7 @@ _sk_load_tables_rgb_u16_be_avx: .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2 .byte 196,195,109,24,208,1 // vinsertf128 $0x1,%xmm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,58,65,0,0 // vbroadcastss 0x413a(%rip),%ymm3 # 661c <_sk_callback_avx+0x264> + .byte 196,226,125,24,29,66,65,0,0 // vbroadcastss 0x4142(%rip),%ymm3 # 68b8 <_sk_callback_avx+0x26c> .byte 91 // pop %rbx .byte 65,92 // pop %r12 .byte 65,93 // pop %r13 @@ -16446,36 +16819,36 @@ _sk_load_tables_rgb_u16_be_avx: .byte 196,129,121,110,4,72 // vmovd (%r8,%r9,2),%xmm0 .byte 196,129,121,196,68,72,4,2 // vpinsrw $0x2,0x4(%r8,%r9,2),%xmm0,%xmm0 .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 117,5 // jne 2507 <_sk_load_tables_rgb_u16_be_avx+0x288> - .byte 233,190,253,255,255 // jmpq 22c5 <_sk_load_tables_rgb_u16_be_avx+0x46> + .byte 117,5 // jne 279b <_sk_load_tables_rgb_u16_be_avx+0x288> + .byte 233,190,253,255,255 // jmpq 2559 <_sk_load_tables_rgb_u16_be_avx+0x46> .byte 196,129,121,110,76,72,6 // vmovd 0x6(%r8,%r9,2),%xmm1 .byte 196,1,113,196,68,72,10,2 // vpinsrw $0x2,0xa(%r8,%r9,2),%xmm1,%xmm8 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,26 // jb 2536 <_sk_load_tables_rgb_u16_be_avx+0x2b7> + .byte 114,26 // jb 27ca <_sk_load_tables_rgb_u16_be_avx+0x2b7> .byte 196,129,121,110,76,72,12 // vmovd 0xc(%r8,%r9,2),%xmm1 .byte 196,129,113,196,84,72,16,2 // vpinsrw $0x2,0x10(%r8,%r9,2),%xmm1,%xmm2 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 117,10 // jne 253b <_sk_load_tables_rgb_u16_be_avx+0x2bc> - .byte 233,143,253,255,255 // jmpq 22c5 <_sk_load_tables_rgb_u16_be_avx+0x46> - .byte 233,138,253,255,255 // jmpq 22c5 <_sk_load_tables_rgb_u16_be_avx+0x46> + .byte 117,10 // jne 27cf <_sk_load_tables_rgb_u16_be_avx+0x2bc> + .byte 233,143,253,255,255 // jmpq 2559 <_sk_load_tables_rgb_u16_be_avx+0x46> + .byte 233,138,253,255,255 // jmpq 2559 <_sk_load_tables_rgb_u16_be_avx+0x46> .byte 196,129,121,110,76,72,18 // vmovd 0x12(%r8,%r9,2),%xmm1 .byte 196,1,113,196,76,72,22,2 // vpinsrw $0x2,0x16(%r8,%r9,2),%xmm1,%xmm9 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,26 // jb 256a <_sk_load_tables_rgb_u16_be_avx+0x2eb> + .byte 114,26 // jb 27fe <_sk_load_tables_rgb_u16_be_avx+0x2eb> .byte 196,129,121,110,76,72,24 // vmovd 0x18(%r8,%r9,2),%xmm1 .byte 196,129,113,196,76,72,28,2 // vpinsrw $0x2,0x1c(%r8,%r9,2),%xmm1,%xmm1 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 117,10 // jne 256f <_sk_load_tables_rgb_u16_be_avx+0x2f0> - .byte 233,91,253,255,255 // jmpq 22c5 <_sk_load_tables_rgb_u16_be_avx+0x46> - .byte 233,86,253,255,255 // jmpq 22c5 <_sk_load_tables_rgb_u16_be_avx+0x46> + .byte 117,10 // jne 2803 <_sk_load_tables_rgb_u16_be_avx+0x2f0> + .byte 233,91,253,255,255 // jmpq 2559 <_sk_load_tables_rgb_u16_be_avx+0x46> + .byte 233,86,253,255,255 // jmpq 2559 <_sk_load_tables_rgb_u16_be_avx+0x46> .byte 196,129,121,110,92,72,30 // vmovd 0x1e(%r8,%r9,2),%xmm3 .byte 196,1,97,196,92,72,34,2 // vpinsrw $0x2,0x22(%r8,%r9,2),%xmm3,%xmm11 .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 114,20 // jb 2598 <_sk_load_tables_rgb_u16_be_avx+0x319> + .byte 114,20 // jb 282c <_sk_load_tables_rgb_u16_be_avx+0x319> .byte 196,129,121,110,92,72,36 // vmovd 0x24(%r8,%r9,2),%xmm3 .byte 196,129,97,196,92,72,40,2 // vpinsrw $0x2,0x28(%r8,%r9,2),%xmm3,%xmm3 - .byte 233,45,253,255,255 // jmpq 22c5 <_sk_load_tables_rgb_u16_be_avx+0x46> - .byte 233,40,253,255,255 // jmpq 22c5 <_sk_load_tables_rgb_u16_be_avx+0x46> + .byte 233,45,253,255,255 // jmpq 2559 <_sk_load_tables_rgb_u16_be_avx+0x46> + .byte 233,40,253,255,255 // jmpq 2559 <_sk_load_tables_rgb_u16_be_avx+0x46> HIDDEN _sk_byte_tables_avx .globl _sk_byte_tables_avx @@ -16488,7 +16861,7 @@ _sk_byte_tables_avx: .byte 65,84 // push %r12 .byte 83 // push %rbx .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,110,64,0,0 // vbroadcastss 0x406e(%rip),%ymm8 # 6620 <_sk_callback_avx+0x268> + .byte 196,98,125,24,5,118,64,0,0 // vbroadcastss 0x4076(%rip),%ymm8 # 68bc <_sk_callback_avx+0x270> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0 .byte 196,195,249,22,192,1 // vpextrq $0x1,%xmm0,%r8 @@ -16525,7 +16898,7 @@ _sk_byte_tables_avx: .byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0 .byte 196,227,53,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,188,63,0,0 // vbroadcastss 0x3fbc(%rip),%ymm9 # 6624 <_sk_callback_avx+0x26c> + .byte 196,98,125,24,13,196,63,0,0 // vbroadcastss 0x3fc4(%rip),%ymm9 # 68c0 <_sk_callback_avx+0x274> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 @@ -16687,7 +17060,7 @@ _sk_byte_tables_rgb_avx: .byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0 .byte 196,227,53,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,226,60,0,0 // vbroadcastss 0x3ce2(%rip),%ymm9 # 6628 <_sk_callback_avx+0x270> + .byte 196,98,125,24,13,234,60,0,0 // vbroadcastss 0x3cea(%rip),%ymm9 # 68c4 <_sk_callback_avx+0x278> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 @@ -16984,36 +17357,36 @@ _sk_parametric_r_avx: .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11 - .byte 196,98,125,24,37,64,56,0,0 // vbroadcastss 0x3840(%rip),%ymm12 # 662c <_sk_callback_avx+0x274> + .byte 196,98,125,24,37,72,56,0,0 // vbroadcastss 0x3848(%rip),%ymm12 # 68c8 <_sk_callback_avx+0x27c> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,54,56,0,0 // vbroadcastss 0x3836(%rip),%ymm12 # 6630 <_sk_callback_avx+0x278> + .byte 196,98,125,24,37,62,56,0,0 // vbroadcastss 0x383e(%rip),%ymm12 # 68cc <_sk_callback_avx+0x280> .byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,44,56,0,0 // vbroadcastss 0x382c(%rip),%ymm12 # 6634 <_sk_callback_avx+0x27c> + .byte 196,98,125,24,37,52,56,0,0 // vbroadcastss 0x3834(%rip),%ymm12 # 68d0 <_sk_callback_avx+0x284> .byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,34,56,0,0 // vbroadcastss 0x3822(%rip),%ymm12 # 6638 <_sk_callback_avx+0x280> + .byte 196,98,125,24,37,42,56,0,0 // vbroadcastss 0x382a(%rip),%ymm12 # 68d4 <_sk_callback_avx+0x288> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,24,56,0,0 // vbroadcastss 0x3818(%rip),%ymm12 # 663c <_sk_callback_avx+0x284> + .byte 196,98,125,24,37,32,56,0,0 // vbroadcastss 0x3820(%rip),%ymm12 # 68d8 <_sk_callback_avx+0x28c> .byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,9,56,0,0 // vbroadcastss 0x3809(%rip),%ymm12 # 6640 <_sk_callback_avx+0x288> + .byte 196,98,125,24,37,17,56,0,0 // vbroadcastss 0x3811(%rip),%ymm12 # 68dc <_sk_callback_avx+0x290> .byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,255,55,0,0 // vbroadcastss 0x37ff(%rip),%ymm12 # 6644 <_sk_callback_avx+0x28c> + .byte 196,98,125,24,37,7,56,0,0 // vbroadcastss 0x3807(%rip),%ymm12 # 68e0 <_sk_callback_avx+0x294> .byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0 .byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0 .byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0 .byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 - .byte 196,98,125,24,29,227,55,0,0 // vbroadcastss 0x37e3(%rip),%ymm11 # 6648 <_sk_callback_avx+0x290> + .byte 196,98,125,24,29,235,55,0,0 // vbroadcastss 0x37eb(%rip),%ymm11 # 68e4 <_sk_callback_avx+0x298> .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,217,55,0,0 // vbroadcastss 0x37d9(%rip),%ymm11 # 664c <_sk_callback_avx+0x294> + .byte 196,98,125,24,29,225,55,0,0 // vbroadcastss 0x37e1(%rip),%ymm11 # 68e8 <_sk_callback_avx+0x29c> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,202,55,0,0 // vbroadcastss 0x37ca(%rip),%ymm11 # 6650 <_sk_callback_avx+0x298> + .byte 196,98,125,24,29,210,55,0,0 // vbroadcastss 0x37d2(%rip),%ymm11 # 68ec <_sk_callback_avx+0x2a0> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,192,55,0,0 // vbroadcastss 0x37c0(%rip),%ymm11 # 6654 <_sk_callback_avx+0x29c> + .byte 196,98,125,24,29,200,55,0,0 // vbroadcastss 0x37c8(%rip),%ymm11 # 68f0 <_sk_callback_avx+0x2a4> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0 - .byte 196,98,125,24,21,177,55,0,0 // vbroadcastss 0x37b1(%rip),%ymm10 # 6658 <_sk_callback_avx+0x2a0> + .byte 196,98,125,24,21,185,55,0,0 // vbroadcastss 0x37b9(%rip),%ymm10 # 68f4 <_sk_callback_avx+0x2a8> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -17021,7 +17394,7 @@ _sk_parametric_r_avx: .byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,136,55,0,0 // vbroadcastss 0x3788(%rip),%ymm8 # 665c <_sk_callback_avx+0x2a4> + .byte 196,98,125,24,5,144,55,0,0 // vbroadcastss 0x3790(%rip),%ymm8 # 68f8 <_sk_callback_avx+0x2ac> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -17043,36 +17416,36 @@ _sk_parametric_g_avx: .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11 - .byte 196,98,125,24,37,57,55,0,0 // vbroadcastss 0x3739(%rip),%ymm12 # 6660 <_sk_callback_avx+0x2a8> + .byte 196,98,125,24,37,65,55,0,0 // vbroadcastss 0x3741(%rip),%ymm12 # 68fc <_sk_callback_avx+0x2b0> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,47,55,0,0 // vbroadcastss 0x372f(%rip),%ymm12 # 6664 <_sk_callback_avx+0x2ac> + .byte 196,98,125,24,37,55,55,0,0 // vbroadcastss 0x3737(%rip),%ymm12 # 6900 <_sk_callback_avx+0x2b4> .byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,37,55,0,0 // vbroadcastss 0x3725(%rip),%ymm12 # 6668 <_sk_callback_avx+0x2b0> + .byte 196,98,125,24,37,45,55,0,0 // vbroadcastss 0x372d(%rip),%ymm12 # 6904 <_sk_callback_avx+0x2b8> .byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,27,55,0,0 // vbroadcastss 0x371b(%rip),%ymm12 # 666c <_sk_callback_avx+0x2b4> + .byte 196,98,125,24,37,35,55,0,0 // vbroadcastss 0x3723(%rip),%ymm12 # 6908 <_sk_callback_avx+0x2bc> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,17,55,0,0 // vbroadcastss 0x3711(%rip),%ymm12 # 6670 <_sk_callback_avx+0x2b8> + .byte 196,98,125,24,37,25,55,0,0 // vbroadcastss 0x3719(%rip),%ymm12 # 690c <_sk_callback_avx+0x2c0> .byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,2,55,0,0 // vbroadcastss 0x3702(%rip),%ymm12 # 6674 <_sk_callback_avx+0x2bc> + .byte 196,98,125,24,37,10,55,0,0 // vbroadcastss 0x370a(%rip),%ymm12 # 6910 <_sk_callback_avx+0x2c4> .byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,248,54,0,0 // vbroadcastss 0x36f8(%rip),%ymm12 # 6678 <_sk_callback_avx+0x2c0> + .byte 196,98,125,24,37,0,55,0,0 // vbroadcastss 0x3700(%rip),%ymm12 # 6914 <_sk_callback_avx+0x2c8> .byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1 .byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1 .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1 .byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10 .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10 - .byte 196,98,125,24,29,220,54,0,0 // vbroadcastss 0x36dc(%rip),%ymm11 # 667c <_sk_callback_avx+0x2c4> + .byte 196,98,125,24,29,228,54,0,0 // vbroadcastss 0x36e4(%rip),%ymm11 # 6918 <_sk_callback_avx+0x2cc> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,210,54,0,0 // vbroadcastss 0x36d2(%rip),%ymm11 # 6680 <_sk_callback_avx+0x2c8> + .byte 196,98,125,24,29,218,54,0,0 // vbroadcastss 0x36da(%rip),%ymm11 # 691c <_sk_callback_avx+0x2d0> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,195,54,0,0 // vbroadcastss 0x36c3(%rip),%ymm11 # 6684 <_sk_callback_avx+0x2cc> + .byte 196,98,125,24,29,203,54,0,0 // vbroadcastss 0x36cb(%rip),%ymm11 # 6920 <_sk_callback_avx+0x2d4> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,185,54,0,0 // vbroadcastss 0x36b9(%rip),%ymm11 # 6688 <_sk_callback_avx+0x2d0> + .byte 196,98,125,24,29,193,54,0,0 // vbroadcastss 0x36c1(%rip),%ymm11 # 6924 <_sk_callback_avx+0x2d8> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1 - .byte 196,98,125,24,21,170,54,0,0 // vbroadcastss 0x36aa(%rip),%ymm10 # 668c <_sk_callback_avx+0x2d4> + .byte 196,98,125,24,21,178,54,0,0 // vbroadcastss 0x36b2(%rip),%ymm10 # 6928 <_sk_callback_avx+0x2dc> .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -17080,7 +17453,7 @@ _sk_parametric_g_avx: .byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,5,129,54,0,0 // vbroadcastss 0x3681(%rip),%ymm8 # 6690 <_sk_callback_avx+0x2d8> + .byte 196,98,125,24,5,137,54,0,0 // vbroadcastss 0x3689(%rip),%ymm8 # 692c <_sk_callback_avx+0x2e0> .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -17102,36 +17475,36 @@ _sk_parametric_b_avx: .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11 - .byte 196,98,125,24,37,50,54,0,0 // vbroadcastss 0x3632(%rip),%ymm12 # 6694 <_sk_callback_avx+0x2dc> + .byte 196,98,125,24,37,58,54,0,0 // vbroadcastss 0x363a(%rip),%ymm12 # 6930 <_sk_callback_avx+0x2e4> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,40,54,0,0 // vbroadcastss 0x3628(%rip),%ymm12 # 6698 <_sk_callback_avx+0x2e0> + .byte 196,98,125,24,37,48,54,0,0 // vbroadcastss 0x3630(%rip),%ymm12 # 6934 <_sk_callback_avx+0x2e8> .byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,30,54,0,0 // vbroadcastss 0x361e(%rip),%ymm12 # 669c <_sk_callback_avx+0x2e4> + .byte 196,98,125,24,37,38,54,0,0 // vbroadcastss 0x3626(%rip),%ymm12 # 6938 <_sk_callback_avx+0x2ec> .byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,20,54,0,0 // vbroadcastss 0x3614(%rip),%ymm12 # 66a0 <_sk_callback_avx+0x2e8> + .byte 196,98,125,24,37,28,54,0,0 // vbroadcastss 0x361c(%rip),%ymm12 # 693c <_sk_callback_avx+0x2f0> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,10,54,0,0 // vbroadcastss 0x360a(%rip),%ymm12 # 66a4 <_sk_callback_avx+0x2ec> + .byte 196,98,125,24,37,18,54,0,0 // vbroadcastss 0x3612(%rip),%ymm12 # 6940 <_sk_callback_avx+0x2f4> .byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,251,53,0,0 // vbroadcastss 0x35fb(%rip),%ymm12 # 66a8 <_sk_callback_avx+0x2f0> + .byte 196,98,125,24,37,3,54,0,0 // vbroadcastss 0x3603(%rip),%ymm12 # 6944 <_sk_callback_avx+0x2f8> .byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,241,53,0,0 // vbroadcastss 0x35f1(%rip),%ymm12 # 66ac <_sk_callback_avx+0x2f4> + .byte 196,98,125,24,37,249,53,0,0 // vbroadcastss 0x35f9(%rip),%ymm12 # 6948 <_sk_callback_avx+0x2fc> .byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2 .byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10 .byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10 - .byte 196,98,125,24,29,213,53,0,0 // vbroadcastss 0x35d5(%rip),%ymm11 # 66b0 <_sk_callback_avx+0x2f8> + .byte 196,98,125,24,29,221,53,0,0 // vbroadcastss 0x35dd(%rip),%ymm11 # 694c <_sk_callback_avx+0x300> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,203,53,0,0 // vbroadcastss 0x35cb(%rip),%ymm11 # 66b4 <_sk_callback_avx+0x2fc> + .byte 196,98,125,24,29,211,53,0,0 // vbroadcastss 0x35d3(%rip),%ymm11 # 6950 <_sk_callback_avx+0x304> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,188,53,0,0 // vbroadcastss 0x35bc(%rip),%ymm11 # 66b8 <_sk_callback_avx+0x300> + .byte 196,98,125,24,29,196,53,0,0 // vbroadcastss 0x35c4(%rip),%ymm11 # 6954 <_sk_callback_avx+0x308> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,178,53,0,0 // vbroadcastss 0x35b2(%rip),%ymm11 # 66bc <_sk_callback_avx+0x304> + .byte 196,98,125,24,29,186,53,0,0 // vbroadcastss 0x35ba(%rip),%ymm11 # 6958 <_sk_callback_avx+0x30c> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2 - .byte 196,98,125,24,21,163,53,0,0 // vbroadcastss 0x35a3(%rip),%ymm10 # 66c0 <_sk_callback_avx+0x308> + .byte 196,98,125,24,21,171,53,0,0 // vbroadcastss 0x35ab(%rip),%ymm10 # 695c <_sk_callback_avx+0x310> .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -17139,7 +17512,7 @@ _sk_parametric_b_avx: .byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,122,53,0,0 // vbroadcastss 0x357a(%rip),%ymm8 # 66c4 <_sk_callback_avx+0x30c> + .byte 196,98,125,24,5,130,53,0,0 // vbroadcastss 0x3582(%rip),%ymm8 # 6960 <_sk_callback_avx+0x314> .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -17161,36 +17534,36 @@ _sk_parametric_a_avx: .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11 - .byte 196,98,125,24,37,43,53,0,0 // vbroadcastss 0x352b(%rip),%ymm12 # 66c8 <_sk_callback_avx+0x310> + .byte 196,98,125,24,37,51,53,0,0 // vbroadcastss 0x3533(%rip),%ymm12 # 6964 <_sk_callback_avx+0x318> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,33,53,0,0 // vbroadcastss 0x3521(%rip),%ymm12 # 66cc <_sk_callback_avx+0x314> + .byte 196,98,125,24,37,41,53,0,0 // vbroadcastss 0x3529(%rip),%ymm12 # 6968 <_sk_callback_avx+0x31c> .byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,23,53,0,0 // vbroadcastss 0x3517(%rip),%ymm12 # 66d0 <_sk_callback_avx+0x318> + .byte 196,98,125,24,37,31,53,0,0 // vbroadcastss 0x351f(%rip),%ymm12 # 696c <_sk_callback_avx+0x320> .byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,13,53,0,0 // vbroadcastss 0x350d(%rip),%ymm12 # 66d4 <_sk_callback_avx+0x31c> + .byte 196,98,125,24,37,21,53,0,0 // vbroadcastss 0x3515(%rip),%ymm12 # 6970 <_sk_callback_avx+0x324> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,3,53,0,0 // vbroadcastss 0x3503(%rip),%ymm12 # 66d8 <_sk_callback_avx+0x320> + .byte 196,98,125,24,37,11,53,0,0 // vbroadcastss 0x350b(%rip),%ymm12 # 6974 <_sk_callback_avx+0x328> .byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,244,52,0,0 // vbroadcastss 0x34f4(%rip),%ymm12 # 66dc <_sk_callback_avx+0x324> + .byte 196,98,125,24,37,252,52,0,0 // vbroadcastss 0x34fc(%rip),%ymm12 # 6978 <_sk_callback_avx+0x32c> .byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,234,52,0,0 // vbroadcastss 0x34ea(%rip),%ymm12 # 66e0 <_sk_callback_avx+0x328> + .byte 196,98,125,24,37,242,52,0,0 // vbroadcastss 0x34f2(%rip),%ymm12 # 697c <_sk_callback_avx+0x330> .byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3 .byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3 .byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3 .byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10 .byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10 - .byte 196,98,125,24,29,206,52,0,0 // vbroadcastss 0x34ce(%rip),%ymm11 # 66e4 <_sk_callback_avx+0x32c> + .byte 196,98,125,24,29,214,52,0,0 // vbroadcastss 0x34d6(%rip),%ymm11 # 6980 <_sk_callback_avx+0x334> .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,196,52,0,0 // vbroadcastss 0x34c4(%rip),%ymm11 # 66e8 <_sk_callback_avx+0x330> + .byte 196,98,125,24,29,204,52,0,0 // vbroadcastss 0x34cc(%rip),%ymm11 # 6984 <_sk_callback_avx+0x338> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,181,52,0,0 // vbroadcastss 0x34b5(%rip),%ymm11 # 66ec <_sk_callback_avx+0x334> + .byte 196,98,125,24,29,189,52,0,0 // vbroadcastss 0x34bd(%rip),%ymm11 # 6988 <_sk_callback_avx+0x33c> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,171,52,0,0 // vbroadcastss 0x34ab(%rip),%ymm11 # 66f0 <_sk_callback_avx+0x338> + .byte 196,98,125,24,29,179,52,0,0 // vbroadcastss 0x34b3(%rip),%ymm11 # 698c <_sk_callback_avx+0x340> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3 - .byte 196,98,125,24,21,156,52,0,0 // vbroadcastss 0x349c(%rip),%ymm10 # 66f4 <_sk_callback_avx+0x33c> + .byte 196,98,125,24,21,164,52,0,0 // vbroadcastss 0x34a4(%rip),%ymm10 # 6990 <_sk_callback_avx+0x344> .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -17198,7 +17571,7 @@ _sk_parametric_a_avx: .byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3 - .byte 196,98,125,24,5,115,52,0,0 // vbroadcastss 0x3473(%rip),%ymm8 # 66f8 <_sk_callback_avx+0x340> + .byte 196,98,125,24,5,123,52,0,0 // vbroadcastss 0x347b(%rip),%ymm8 # 6994 <_sk_callback_avx+0x348> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -17207,31 +17580,31 @@ HIDDEN _sk_lab_to_xyz_avx .globl _sk_lab_to_xyz_avx FUNCTION(_sk_lab_to_xyz_avx) _sk_lab_to_xyz_avx: - .byte 196,98,125,24,5,101,52,0,0 // vbroadcastss 0x3465(%rip),%ymm8 # 66fc <_sk_callback_avx+0x344> + .byte 196,98,125,24,5,109,52,0,0 // vbroadcastss 0x346d(%rip),%ymm8 # 6998 <_sk_callback_avx+0x34c> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,91,52,0,0 // vbroadcastss 0x345b(%rip),%ymm8 # 6700 <_sk_callback_avx+0x348> + .byte 196,98,125,24,5,99,52,0,0 // vbroadcastss 0x3463(%rip),%ymm8 # 699c <_sk_callback_avx+0x350> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,13,81,52,0,0 // vbroadcastss 0x3451(%rip),%ymm9 # 6704 <_sk_callback_avx+0x34c> + .byte 196,98,125,24,13,89,52,0,0 // vbroadcastss 0x3459(%rip),%ymm9 # 69a0 <_sk_callback_avx+0x354> .byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2 - .byte 196,98,125,24,5,61,52,0,0 // vbroadcastss 0x343d(%rip),%ymm8 # 6708 <_sk_callback_avx+0x350> + .byte 196,98,125,24,5,69,52,0,0 // vbroadcastss 0x3445(%rip),%ymm8 # 69a4 <_sk_callback_avx+0x358> .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,51,52,0,0 // vbroadcastss 0x3433(%rip),%ymm8 # 670c <_sk_callback_avx+0x354> + .byte 196,98,125,24,5,59,52,0,0 // vbroadcastss 0x343b(%rip),%ymm8 # 69a8 <_sk_callback_avx+0x35c> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,41,52,0,0 // vbroadcastss 0x3429(%rip),%ymm8 # 6710 <_sk_callback_avx+0x358> + .byte 196,98,125,24,5,49,52,0,0 // vbroadcastss 0x3431(%rip),%ymm8 # 69ac <_sk_callback_avx+0x360> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 .byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1 - .byte 196,98,125,24,5,27,52,0,0 // vbroadcastss 0x341b(%rip),%ymm8 # 6714 <_sk_callback_avx+0x35c> + .byte 196,98,125,24,5,35,52,0,0 // vbroadcastss 0x3423(%rip),%ymm8 # 69b0 <_sk_callback_avx+0x364> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2 .byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8 .byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8 - .byte 196,98,125,24,13,4,52,0,0 // vbroadcastss 0x3404(%rip),%ymm9 # 6718 <_sk_callback_avx+0x360> + .byte 196,98,125,24,13,12,52,0,0 // vbroadcastss 0x340c(%rip),%ymm9 # 69b4 <_sk_callback_avx+0x368> .byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10 - .byte 196,98,125,24,29,249,51,0,0 // vbroadcastss 0x33f9(%rip),%ymm11 # 671c <_sk_callback_avx+0x364> + .byte 196,98,125,24,29,1,52,0,0 // vbroadcastss 0x3401(%rip),%ymm11 # 69b8 <_sk_callback_avx+0x36c> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,37,239,51,0,0 // vbroadcastss 0x33ef(%rip),%ymm12 # 6720 <_sk_callback_avx+0x368> + .byte 196,98,125,24,37,247,51,0,0 // vbroadcastss 0x33f7(%rip),%ymm12 # 69bc <_sk_callback_avx+0x370> .byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1 .byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8 .byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1 @@ -17246,9 +17619,9 @@ _sk_lab_to_xyz_avx: .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2 .byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2 - .byte 196,226,125,24,5,165,51,0,0 // vbroadcastss 0x33a5(%rip),%ymm0 # 6724 <_sk_callback_avx+0x36c> + .byte 196,226,125,24,5,173,51,0,0 // vbroadcastss 0x33ad(%rip),%ymm0 # 69c0 <_sk_callback_avx+0x374> .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,156,51,0,0 // vbroadcastss 0x339c(%rip),%ymm8 # 6728 <_sk_callback_avx+0x370> + .byte 196,98,125,24,5,164,51,0,0 // vbroadcastss 0x33a4(%rip),%ymm8 # 69c4 <_sk_callback_avx+0x378> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -17262,14 +17635,14 @@ _sk_load_a8_avx: .byte 72,139,0 // mov (%rax),%rax .byte 72,1,248 // add %rdi,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,62 // jne 33e3 <_sk_load_a8_avx+0x4e> + .byte 117,62 // jne 3677 <_sk_load_a8_avx+0x4e> .byte 197,250,126,0 // vmovq (%rax),%xmm0 .byte 196,226,121,49,200 // vpmovzxbd %xmm0,%xmm1 .byte 196,227,121,4,192,229 // vpermilps $0xe5,%xmm0,%xmm0 .byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,96,51,0,0 // vbroadcastss 0x3360(%rip),%ymm1 # 672c <_sk_callback_avx+0x374> + .byte 196,226,125,24,13,104,51,0,0 // vbroadcastss 0x3368(%rip),%ymm1 # 69c8 <_sk_callback_avx+0x37c> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -17286,9 +17659,9 @@ _sk_load_a8_avx: .byte 77,9,217 // or %r11,%r9 .byte 72,131,193,8 // add $0x8,%rcx .byte 73,255,202 // dec %r10 - .byte 117,234 // jne 33eb <_sk_load_a8_avx+0x56> + .byte 117,234 // jne 367f <_sk_load_a8_avx+0x56> .byte 196,193,249,110,193 // vmovq %r9,%xmm0 - .byte 235,161 // jmp 33a9 <_sk_load_a8_avx+0x14> + .byte 235,161 // jmp 363d <_sk_load_a8_avx+0x14> HIDDEN _sk_gather_a8_avx .globl _sk_gather_a8_avx @@ -17338,7 +17711,7 @@ _sk_gather_a8_avx: .byte 196,226,121,49,201 // vpmovzxbd %xmm1,%xmm1 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,85,50,0,0 // vbroadcastss 0x3255(%rip),%ymm1 # 6730 <_sk_callback_avx+0x378> + .byte 196,226,125,24,13,93,50,0,0 // vbroadcastss 0x325d(%rip),%ymm1 # 69cc <_sk_callback_avx+0x380> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -17356,14 +17729,14 @@ FUNCTION(_sk_store_a8_avx) _sk_store_a8_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 196,98,125,24,5,48,50,0,0 // vbroadcastss 0x3230(%rip),%ymm8 # 6734 <_sk_callback_avx+0x37c> + .byte 196,98,125,24,5,56,50,0,0 // vbroadcastss 0x3238(%rip),%ymm8 # 69d0 <_sk_callback_avx+0x384> .byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8 .byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8 .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8 .byte 72,133,201 // test %rcx,%rcx - .byte 117,10 // jne 352d <_sk_store_a8_avx+0x37> + .byte 117,10 // jne 37c1 <_sk_store_a8_avx+0x37> .byte 196,65,123,17,4,58 // vmovsd %xmm8,(%r10,%rdi,1) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -17371,10 +17744,10 @@ _sk_store_a8_avx: .byte 65,128,224,7 // and $0x7,%r8b .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 119,236 // ja 3529 <_sk_store_a8_avx+0x33> + .byte 119,236 // ja 37bd <_sk_store_a8_avx+0x33> .byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8 .byte 69,15,182,192 // movzbl %r8b,%r8d - .byte 76,141,13,67,0,0,0 // lea 0x43(%rip),%r9 # 3590 <_sk_store_a8_avx+0x9a> + .byte 76,141,13,67,0,0,0 // lea 0x43(%rip),%r9 # 3824 <_sk_store_a8_avx+0x9a> .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax @@ -17385,7 +17758,7 @@ _sk_store_a8_avx: .byte 196,67,121,20,68,58,2,4 // vpextrb $0x4,%xmm8,0x2(%r10,%rdi,1) .byte 196,67,121,20,68,58,1,2 // vpextrb $0x2,%xmm8,0x1(%r10,%rdi,1) .byte 196,67,121,20,4,58,0 // vpextrb $0x0,%xmm8,(%r10,%rdi,1) - .byte 235,154 // jmp 3529 <_sk_store_a8_avx+0x33> + .byte 235,154 // jmp 37bd <_sk_store_a8_avx+0x33> .byte 144 // nop .byte 246,255 // idiv %bh .byte 255 // (bad) @@ -17419,17 +17792,17 @@ _sk_load_g8_avx: .byte 72,139,0 // mov (%rax),%rax .byte 72,1,248 // add %rdi,%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,67 // jne 35ff <_sk_load_g8_avx+0x53> + .byte 117,67 // jne 3893 <_sk_load_g8_avx+0x53> .byte 197,250,126,0 // vmovq (%rax),%xmm0 .byte 196,226,121,49,200 // vpmovzxbd %xmm0,%xmm1 .byte 196,227,121,4,192,229 // vpermilps $0xe5,%xmm0,%xmm0 .byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,85,49,0,0 // vbroadcastss 0x3155(%rip),%ymm1 # 6738 <_sk_callback_avx+0x380> + .byte 196,226,125,24,13,93,49,0,0 // vbroadcastss 0x315d(%rip),%ymm1 # 69d4 <_sk_callback_avx+0x388> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,74,49,0,0 // vbroadcastss 0x314a(%rip),%ymm3 # 673c <_sk_callback_avx+0x384> + .byte 196,226,125,24,29,82,49,0,0 // vbroadcastss 0x3152(%rip),%ymm3 # 69d8 <_sk_callback_avx+0x38c> .byte 76,137,193 // mov %r8,%rcx .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 @@ -17443,9 +17816,9 @@ _sk_load_g8_avx: .byte 77,9,217 // or %r11,%r9 .byte 72,131,193,8 // add $0x8,%rcx .byte 73,255,202 // dec %r10 - .byte 117,234 // jne 3607 <_sk_load_g8_avx+0x5b> + .byte 117,234 // jne 389b <_sk_load_g8_avx+0x5b> .byte 196,193,249,110,193 // vmovq %r9,%xmm0 - .byte 235,156 // jmp 35c0 <_sk_load_g8_avx+0x14> + .byte 235,156 // jmp 3854 <_sk_load_g8_avx+0x14> HIDDEN _sk_gather_g8_avx .globl _sk_gather_g8_avx @@ -17495,10 +17868,10 @@ _sk_gather_g8_avx: .byte 196,226,121,49,201 // vpmovzxbd %xmm1,%xmm1 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,73,48,0,0 // vbroadcastss 0x3049(%rip),%ymm1 # 6740 <_sk_callback_avx+0x388> + .byte 196,226,125,24,13,81,48,0,0 // vbroadcastss 0x3051(%rip),%ymm1 # 69dc <_sk_callback_avx+0x390> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,62,48,0,0 // vbroadcastss 0x303e(%rip),%ymm3 # 6744 <_sk_callback_avx+0x38c> + .byte 196,226,125,24,29,70,48,0,0 // vbroadcastss 0x3046(%rip),%ymm3 # 69e0 <_sk_callback_avx+0x394> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 91 // pop %rbx @@ -17514,9 +17887,9 @@ _sk_gather_i8_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 73,137,192 // mov %rax,%r8 .byte 77,133,192 // test %r8,%r8 - .byte 116,5 // je 3726 <_sk_gather_i8_avx+0xf> + .byte 116,5 // je 39ba <_sk_gather_i8_avx+0xf> .byte 76,137,192 // mov %r8,%rax - .byte 235,2 // jmp 3728 <_sk_gather_i8_avx+0x11> + .byte 235,2 // jmp 39bc <_sk_gather_i8_avx+0x11> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,87 // push %r15 .byte 65,86 // push %r14 @@ -17578,10 +17951,10 @@ _sk_gather_i8_avx: .byte 196,163,121,34,4,163,2 // vpinsrd $0x2,(%rbx,%r12,4),%xmm0,%xmm0 .byte 196,163,121,34,28,19,3 // vpinsrd $0x3,(%rbx,%r10,1),%xmm0,%xmm3 .byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - .byte 197,124,40,21,238,48,0,0 // vmovaps 0x30ee(%rip),%ymm10 # 6940 <_sk_callback_avx+0x588> + .byte 197,124,40,21,26,49,0,0 // vmovaps 0x311a(%rip),%ymm10 # 6c00 <_sk_callback_avx+0x5b4> .byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,228,46,0,0 // vbroadcastss 0x2ee4(%rip),%ymm9 # 6748 <_sk_callback_avx+0x390> + .byte 196,98,125,24,13,236,46,0,0 // vbroadcastss 0x2eec(%rip),%ymm9 # 69e4 <_sk_callback_avx+0x398> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1 .byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2 @@ -17615,38 +17988,38 @@ _sk_load_565_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,128,0,0,0 // jne 395c <_sk_load_565_avx+0x8e> + .byte 15,133,128,0,0,0 // jne 3bf0 <_sk_load_565_avx+0x8e> .byte 196,193,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm0 .byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1 .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - .byte 196,226,125,24,5,78,46,0,0 // vbroadcastss 0x2e4e(%rip),%ymm0 # 674c <_sk_callback_avx+0x394> + .byte 196,226,125,24,5,86,46,0,0 // vbroadcastss 0x2e56(%rip),%ymm0 # 69e8 <_sk_callback_avx+0x39c> .byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,65,46,0,0 // vbroadcastss 0x2e41(%rip),%ymm1 # 6750 <_sk_callback_avx+0x398> + .byte 196,226,125,24,13,73,46,0,0 // vbroadcastss 0x2e49(%rip),%ymm1 # 69ec <_sk_callback_avx+0x3a0> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,56,46,0,0 // vbroadcastss 0x2e38(%rip),%ymm1 # 6754 <_sk_callback_avx+0x39c> + .byte 196,226,125,24,13,64,46,0,0 // vbroadcastss 0x2e40(%rip),%ymm1 # 69f0 <_sk_callback_avx+0x3a4> .byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,43,46,0,0 // vbroadcastss 0x2e2b(%rip),%ymm3 # 6758 <_sk_callback_avx+0x3a0> + .byte 196,226,125,24,29,51,46,0,0 // vbroadcastss 0x2e33(%rip),%ymm3 # 69f4 <_sk_callback_avx+0x3a8> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,24,29,34,46,0,0 // vbroadcastss 0x2e22(%rip),%ymm3 # 675c <_sk_callback_avx+0x3a4> + .byte 196,226,125,24,29,42,46,0,0 // vbroadcastss 0x2e2a(%rip),%ymm3 # 69f8 <_sk_callback_avx+0x3ac> .byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,21,46,0,0 // vbroadcastss 0x2e15(%rip),%ymm3 # 6760 <_sk_callback_avx+0x3a8> + .byte 196,226,125,24,29,29,46,0,0 // vbroadcastss 0x2e1d(%rip),%ymm3 # 69fc <_sk_callback_avx+0x3b0> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,10,46,0,0 // vbroadcastss 0x2e0a(%rip),%ymm3 # 6764 <_sk_callback_avx+0x3ac> + .byte 196,226,125,24,29,18,46,0,0 // vbroadcastss 0x2e12(%rip),%ymm3 # 6a00 <_sk_callback_avx+0x3b4> .byte 255,224 // jmpq *%rax .byte 65,137,200 // mov %ecx,%r8d .byte 65,128,224,7 // and $0x7,%r8b .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 15,135,110,255,255,255 // ja 38e2 <_sk_load_565_avx+0x14> + .byte 15,135,110,255,255,255 // ja 3b76 <_sk_load_565_avx+0x14> .byte 69,15,182,192 // movzbl %r8b,%r8d - .byte 76,141,13,73,0,0,0 // lea 0x49(%rip),%r9 # 39c8 <_sk_load_565_avx+0xfa> + .byte 76,141,13,73,0,0,0 // lea 0x49(%rip),%r9 # 3c5c <_sk_load_565_avx+0xfa> .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax @@ -17658,7 +18031,7 @@ _sk_load_565_avx: .byte 196,193,121,196,68,122,4,2 // vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm0,%xmm0 .byte 196,193,121,196,68,122,2,1 // vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm0,%xmm0 .byte 196,193,121,196,4,122,0 // vpinsrw $0x0,(%r10,%rdi,2),%xmm0,%xmm0 - .byte 233,26,255,255,255 // jmpq 38e2 <_sk_load_565_avx+0x14> + .byte 233,26,255,255,255 // jmpq 3b76 <_sk_load_565_avx+0x14> .byte 244 // hlt .byte 255 // (bad) .byte 255 // (bad) @@ -17736,23 +18109,23 @@ _sk_gather_565_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - .byte 196,226,125,24,5,170,44,0,0 // vbroadcastss 0x2caa(%rip),%ymm0 # 6768 <_sk_callback_avx+0x3b0> + .byte 196,226,125,24,5,178,44,0,0 // vbroadcastss 0x2cb2(%rip),%ymm0 # 6a04 <_sk_callback_avx+0x3b8> .byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,157,44,0,0 // vbroadcastss 0x2c9d(%rip),%ymm1 # 676c <_sk_callback_avx+0x3b4> + .byte 196,226,125,24,13,165,44,0,0 // vbroadcastss 0x2ca5(%rip),%ymm1 # 6a08 <_sk_callback_avx+0x3bc> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,148,44,0,0 // vbroadcastss 0x2c94(%rip),%ymm1 # 6770 <_sk_callback_avx+0x3b8> + .byte 196,226,125,24,13,156,44,0,0 // vbroadcastss 0x2c9c(%rip),%ymm1 # 6a0c <_sk_callback_avx+0x3c0> .byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,135,44,0,0 // vbroadcastss 0x2c87(%rip),%ymm3 # 6774 <_sk_callback_avx+0x3bc> + .byte 196,226,125,24,29,143,44,0,0 // vbroadcastss 0x2c8f(%rip),%ymm3 # 6a10 <_sk_callback_avx+0x3c4> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,24,29,126,44,0,0 // vbroadcastss 0x2c7e(%rip),%ymm3 # 6778 <_sk_callback_avx+0x3c0> + .byte 196,226,125,24,29,134,44,0,0 // vbroadcastss 0x2c86(%rip),%ymm3 # 6a14 <_sk_callback_avx+0x3c8> .byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,113,44,0,0 // vbroadcastss 0x2c71(%rip),%ymm3 # 677c <_sk_callback_avx+0x3c4> + .byte 196,226,125,24,29,121,44,0,0 // vbroadcastss 0x2c79(%rip),%ymm3 # 6a18 <_sk_callback_avx+0x3cc> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,102,44,0,0 // vbroadcastss 0x2c66(%rip),%ymm3 # 6780 <_sk_callback_avx+0x3c8> + .byte 196,226,125,24,29,110,44,0,0 // vbroadcastss 0x2c6e(%rip),%ymm3 # 6a1c <_sk_callback_avx+0x3d0> .byte 91 // pop %rbx .byte 65,92 // pop %r12 .byte 65,94 // pop %r14 @@ -17766,14 +18139,14 @@ FUNCTION(_sk_store_565_avx) _sk_store_565_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 196,98,125,24,5,82,44,0,0 // vbroadcastss 0x2c52(%rip),%ymm8 # 6784 <_sk_callback_avx+0x3cc> + .byte 196,98,125,24,5,90,44,0,0 // vbroadcastss 0x2c5a(%rip),%ymm8 # 6a20 <_sk_callback_avx+0x3d4> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10 .byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9 .byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9 .byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 - .byte 196,98,125,24,21,43,44,0,0 // vbroadcastss 0x2c2b(%rip),%ymm10 # 6788 <_sk_callback_avx+0x3d0> + .byte 196,98,125,24,21,51,44,0,0 // vbroadcastss 0x2c33(%rip),%ymm10 # 6a24 <_sk_callback_avx+0x3d8> .byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10 .byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10 .byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11 @@ -17787,7 +18160,7 @@ _sk_store_565_avx: .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 72,133,201 // test %rcx,%rcx - .byte 117,10 // jne 3bad <_sk_store_565_avx+0x89> + .byte 117,10 // jne 3e41 <_sk_store_565_avx+0x89> .byte 196,65,122,127,4,122 // vmovdqu %xmm8,(%r10,%rdi,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -17795,9 +18168,9 @@ _sk_store_565_avx: .byte 65,128,224,7 // and $0x7,%r8b .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 119,236 // ja 3ba9 <_sk_store_565_avx+0x85> + .byte 119,236 // ja 3e3d <_sk_store_565_avx+0x85> .byte 69,15,182,192 // movzbl %r8b,%r8d - .byte 76,141,13,68,0,0,0 // lea 0x44(%rip),%r9 # 3c0c <_sk_store_565_avx+0xe8> + .byte 76,141,13,68,0,0,0 // lea 0x44(%rip),%r9 # 3ea0 <_sk_store_565_avx+0xe8> .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax @@ -17808,7 +18181,7 @@ _sk_store_565_avx: .byte 196,67,121,21,68,122,4,2 // vpextrw $0x2,%xmm8,0x4(%r10,%rdi,2) .byte 196,67,121,21,68,122,2,1 // vpextrw $0x1,%xmm8,0x2(%r10,%rdi,2) .byte 196,67,121,21,4,122,0 // vpextrw $0x0,%xmm8,(%r10,%rdi,2) - .byte 235,159 // jmp 3ba9 <_sk_store_565_avx+0x85> + .byte 235,159 // jmp 3e3d <_sk_store_565_avx+0x85> .byte 102,144 // xchg %ax,%ax .byte 245 // cmc .byte 255 // (bad) @@ -17841,31 +18214,31 @@ _sk_load_4444_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,152,0,0,0 // jne 3cce <_sk_load_4444_avx+0xa6> + .byte 15,133,152,0,0,0 // jne 3f62 <_sk_load_4444_avx+0xa6> .byte 196,193,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm0 .byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1 .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - .byte 196,226,125,24,5,52,43,0,0 // vbroadcastss 0x2b34(%rip),%ymm0 # 678c <_sk_callback_avx+0x3d4> + .byte 196,226,125,24,5,60,43,0,0 // vbroadcastss 0x2b3c(%rip),%ymm0 # 6a28 <_sk_callback_avx+0x3dc> .byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,39,43,0,0 // vbroadcastss 0x2b27(%rip),%ymm1 # 6790 <_sk_callback_avx+0x3d8> + .byte 196,226,125,24,13,47,43,0,0 // vbroadcastss 0x2b2f(%rip),%ymm1 # 6a2c <_sk_callback_avx+0x3e0> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,30,43,0,0 // vbroadcastss 0x2b1e(%rip),%ymm1 # 6794 <_sk_callback_avx+0x3dc> + .byte 196,226,125,24,13,38,43,0,0 // vbroadcastss 0x2b26(%rip),%ymm1 # 6a30 <_sk_callback_avx+0x3e4> .byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,17,43,0,0 // vbroadcastss 0x2b11(%rip),%ymm2 # 6798 <_sk_callback_avx+0x3e0> + .byte 196,226,125,24,21,25,43,0,0 // vbroadcastss 0x2b19(%rip),%ymm2 # 6a34 <_sk_callback_avx+0x3e8> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,8,43,0,0 // vbroadcastss 0x2b08(%rip),%ymm2 # 679c <_sk_callback_avx+0x3e4> + .byte 196,226,125,24,21,16,43,0,0 // vbroadcastss 0x2b10(%rip),%ymm2 # 6a38 <_sk_callback_avx+0x3ec> .byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,251,42,0,0 // vbroadcastss 0x2afb(%rip),%ymm8 # 67a0 <_sk_callback_avx+0x3e8> + .byte 196,98,125,24,5,3,43,0,0 // vbroadcastss 0x2b03(%rip),%ymm8 # 6a3c <_sk_callback_avx+0x3f0> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,241,42,0,0 // vbroadcastss 0x2af1(%rip),%ymm8 # 67a4 <_sk_callback_avx+0x3ec> + .byte 196,98,125,24,5,249,42,0,0 // vbroadcastss 0x2af9(%rip),%ymm8 # 6a40 <_sk_callback_avx+0x3f4> .byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,227,42,0,0 // vbroadcastss 0x2ae3(%rip),%ymm8 # 67a8 <_sk_callback_avx+0x3f0> + .byte 196,98,125,24,5,235,42,0,0 // vbroadcastss 0x2aeb(%rip),%ymm8 # 6a44 <_sk_callback_avx+0x3f8> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -17874,9 +18247,9 @@ _sk_load_4444_avx: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 15,135,86,255,255,255 // ja 3c3c <_sk_load_4444_avx+0x14> + .byte 15,135,86,255,255,255 // ja 3ed0 <_sk_load_4444_avx+0x14> .byte 69,15,182,192 // movzbl %r8b,%r8d - .byte 76,141,13,75,0,0,0 // lea 0x4b(%rip),%r9 # 3d3c <_sk_load_4444_avx+0x114> + .byte 76,141,13,75,0,0,0 // lea 0x4b(%rip),%r9 # 3fd0 <_sk_load_4444_avx+0x114> .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax @@ -17888,7 +18261,7 @@ _sk_load_4444_avx: .byte 196,193,121,196,68,122,4,2 // vpinsrw $0x2,0x4(%r10,%rdi,2),%xmm0,%xmm0 .byte 196,193,121,196,68,122,2,1 // vpinsrw $0x1,0x2(%r10,%rdi,2),%xmm0,%xmm0 .byte 196,193,121,196,4,122,0 // vpinsrw $0x0,(%r10,%rdi,2),%xmm0,%xmm0 - .byte 233,2,255,255,255 // jmpq 3c3c <_sk_load_4444_avx+0x14> + .byte 233,2,255,255,255 // jmpq 3ed0 <_sk_load_4444_avx+0x14> .byte 102,144 // xchg %ax,%ax .byte 242,255 // repnz (bad) .byte 255 // (bad) @@ -17967,25 +18340,25 @@ _sk_gather_4444_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - .byte 196,226,125,24,5,122,41,0,0 // vbroadcastss 0x297a(%rip),%ymm0 # 67ac <_sk_callback_avx+0x3f4> + .byte 196,226,125,24,5,130,41,0,0 // vbroadcastss 0x2982(%rip),%ymm0 # 6a48 <_sk_callback_avx+0x3fc> .byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,109,41,0,0 // vbroadcastss 0x296d(%rip),%ymm1 # 67b0 <_sk_callback_avx+0x3f8> + .byte 196,226,125,24,13,117,41,0,0 // vbroadcastss 0x2975(%rip),%ymm1 # 6a4c <_sk_callback_avx+0x400> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,100,41,0,0 // vbroadcastss 0x2964(%rip),%ymm1 # 67b4 <_sk_callback_avx+0x3fc> + .byte 196,226,125,24,13,108,41,0,0 // vbroadcastss 0x296c(%rip),%ymm1 # 6a50 <_sk_callback_avx+0x404> .byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,87,41,0,0 // vbroadcastss 0x2957(%rip),%ymm2 # 67b8 <_sk_callback_avx+0x400> + .byte 196,226,125,24,21,95,41,0,0 // vbroadcastss 0x295f(%rip),%ymm2 # 6a54 <_sk_callback_avx+0x408> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,78,41,0,0 // vbroadcastss 0x294e(%rip),%ymm2 # 67bc <_sk_callback_avx+0x404> + .byte 196,226,125,24,21,86,41,0,0 // vbroadcastss 0x2956(%rip),%ymm2 # 6a58 <_sk_callback_avx+0x40c> .byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,65,41,0,0 // vbroadcastss 0x2941(%rip),%ymm8 # 67c0 <_sk_callback_avx+0x408> + .byte 196,98,125,24,5,73,41,0,0 // vbroadcastss 0x2949(%rip),%ymm8 # 6a5c <_sk_callback_avx+0x410> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,55,41,0,0 // vbroadcastss 0x2937(%rip),%ymm8 # 67c4 <_sk_callback_avx+0x40c> + .byte 196,98,125,24,5,63,41,0,0 // vbroadcastss 0x293f(%rip),%ymm8 # 6a60 <_sk_callback_avx+0x414> .byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,41,41,0,0 // vbroadcastss 0x2929(%rip),%ymm8 # 67c8 <_sk_callback_avx+0x410> + .byte 196,98,125,24,5,49,41,0,0 // vbroadcastss 0x2931(%rip),%ymm8 # 6a64 <_sk_callback_avx+0x418> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -18001,7 +18374,7 @@ FUNCTION(_sk_store_4444_avx) _sk_store_4444_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 196,98,125,24,5,14,41,0,0 // vbroadcastss 0x290e(%rip),%ymm8 # 67cc <_sk_callback_avx+0x414> + .byte 196,98,125,24,5,22,41,0,0 // vbroadcastss 0x2916(%rip),%ymm8 # 6a68 <_sk_callback_avx+0x41c> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10 @@ -18028,7 +18401,7 @@ _sk_store_4444_avx: .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 72,133,201 // test %rcx,%rcx - .byte 117,10 // jne 3f57 <_sk_store_4444_avx+0xa7> + .byte 117,10 // jne 41eb <_sk_store_4444_avx+0xa7> .byte 196,65,122,127,4,122 // vmovdqu %xmm8,(%r10,%rdi,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -18036,9 +18409,9 @@ _sk_store_4444_avx: .byte 65,128,224,7 // and $0x7,%r8b .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 119,236 // ja 3f53 <_sk_store_4444_avx+0xa3> + .byte 119,236 // ja 41e7 <_sk_store_4444_avx+0xa3> .byte 69,15,182,192 // movzbl %r8b,%r8d - .byte 76,141,13,66,0,0,0 // lea 0x42(%rip),%r9 # 3fb4 <_sk_store_4444_avx+0x104> + .byte 76,141,13,66,0,0,0 // lea 0x42(%rip),%r9 # 4248 <_sk_store_4444_avx+0x104> .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax @@ -18049,7 +18422,7 @@ _sk_store_4444_avx: .byte 196,67,121,21,68,122,4,2 // vpextrw $0x2,%xmm8,0x4(%r10,%rdi,2) .byte 196,67,121,21,68,122,2,1 // vpextrw $0x1,%xmm8,0x2(%r10,%rdi,2) .byte 196,67,121,21,4,122,0 // vpextrw $0x0,%xmm8,(%r10,%rdi,2) - .byte 235,159 // jmp 3f53 <_sk_store_4444_avx+0xa3> + .byte 235,159 // jmp 41e7 <_sk_store_4444_avx+0xa3> .byte 247,255 // idiv %edi .byte 255 // (bad) .byte 255 // (bad) @@ -18080,12 +18453,12 @@ _sk_load_8888_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,135,0,0,0 // jne 4065 <_sk_load_8888_avx+0x95> + .byte 15,133,135,0,0,0 // jne 42f9 <_sk_load_8888_avx+0x95> .byte 196,65,124,16,12,186 // vmovups (%r10,%rdi,4),%ymm9 - .byte 197,124,40,21,116,41,0,0 // vmovaps 0x2974(%rip),%ymm10 # 6960 <_sk_callback_avx+0x5a8> + .byte 197,124,40,21,160,41,0,0 // vmovaps 0x29a0(%rip),%ymm10 # 6c20 <_sk_callback_avx+0x5d4> .byte 196,193,52,84,194 // vandps %ymm10,%ymm9,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,210,39,0,0 // vbroadcastss 0x27d2(%rip),%ymm8 # 67d0 <_sk_callback_avx+0x418> + .byte 196,98,125,24,5,218,39,0,0 // vbroadcastss 0x27da(%rip),%ymm8 # 6a6c <_sk_callback_avx+0x420> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 196,193,113,114,209,8 // vpsrld $0x8,%xmm9,%xmm1 .byte 196,99,125,25,203,1 // vextractf128 $0x1,%ymm9,%xmm3 @@ -18112,9 +18485,9 @@ _sk_load_8888_avx: .byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9 .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 15,135,102,255,255,255 // ja 3fe4 <_sk_load_8888_avx+0x14> + .byte 15,135,102,255,255,255 // ja 4278 <_sk_load_8888_avx+0x14> .byte 69,15,182,192 // movzbl %r8b,%r8d - .byte 76,141,13,139,0,0,0 // lea 0x8b(%rip),%r9 # 4114 <_sk_load_8888_avx+0x144> + .byte 76,141,13,139,0,0,0 // lea 0x8b(%rip),%r9 # 43a8 <_sk_load_8888_avx+0x144> .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax @@ -18137,7 +18510,7 @@ _sk_load_8888_avx: .byte 196,99,53,12,200,15 // vblendps $0xf,%ymm0,%ymm9,%ymm9 .byte 196,195,49,34,4,186,0 // vpinsrd $0x0,(%r10,%rdi,4),%xmm9,%xmm0 .byte 196,99,53,12,200,15 // vblendps $0xf,%ymm0,%ymm9,%ymm9 - .byte 233,210,254,255,255 // jmpq 3fe4 <_sk_load_8888_avx+0x14> + .byte 233,210,254,255,255 // jmpq 4278 <_sk_load_8888_avx+0x14> .byte 102,144 // xchg %ax,%ax .byte 236 // in (%dx),%al .byte 255 // (bad) @@ -18155,7 +18528,7 @@ _sk_load_8888_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 126,255 // jle 412d <_sk_load_8888_avx+0x15d> + .byte 126,255 // jle 43c1 <_sk_load_8888_avx+0x15d> .byte 255 // (bad) .byte 255 // .byte 0xff @@ -18200,10 +18573,10 @@ _sk_gather_8888_avx: .byte 196,131,121,34,4,152,2 // vpinsrd $0x2,(%r8,%r11,4),%xmm0,%xmm0 .byte 196,131,121,34,28,144,3 // vpinsrd $0x3,(%r8,%r10,4),%xmm0,%xmm3 .byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - .byte 197,124,40,21,158,39,0,0 // vmovaps 0x279e(%rip),%ymm10 # 6980 <_sk_callback_avx+0x5c8> + .byte 197,124,40,21,202,39,0,0 // vmovaps 0x27ca(%rip),%ymm10 # 6c40 <_sk_callback_avx+0x5f4> .byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,224,37,0,0 // vbroadcastss 0x25e0(%rip),%ymm9 # 67d4 <_sk_callback_avx+0x41c> + .byte 196,98,125,24,13,232,37,0,0 // vbroadcastss 0x25e8(%rip),%ymm9 # 6a70 <_sk_callback_avx+0x424> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1 .byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2 @@ -18235,7 +18608,7 @@ FUNCTION(_sk_store_8888_avx) _sk_store_8888_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 196,98,125,24,5,110,37,0,0 // vbroadcastss 0x256e(%rip),%ymm8 # 67d8 <_sk_callback_avx+0x420> + .byte 196,98,125,24,5,118,37,0,0 // vbroadcastss 0x2576(%rip),%ymm8 # 6a74 <_sk_callback_avx+0x428> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10 @@ -18260,7 +18633,7 @@ _sk_store_8888_avx: .byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8 .byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8 .byte 72,133,201 // test %rcx,%rcx - .byte 117,10 // jne 42f8 <_sk_store_8888_avx+0x9c> + .byte 117,10 // jne 458c <_sk_store_8888_avx+0x9c> .byte 196,65,124,17,4,186 // vmovups %ymm8,(%r10,%rdi,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -18268,9 +18641,9 @@ _sk_store_8888_avx: .byte 65,128,224,7 // and $0x7,%r8b .byte 65,254,200 // dec %r8b .byte 65,128,248,6 // cmp $0x6,%r8b - .byte 119,236 // ja 42f4 <_sk_store_8888_avx+0x98> + .byte 119,236 // ja 4588 <_sk_store_8888_avx+0x98> .byte 69,15,182,192 // movzbl %r8b,%r8d - .byte 76,141,13,85,0,0,0 // lea 0x55(%rip),%r9 # 4368 <_sk_store_8888_avx+0x10c> + .byte 76,141,13,85,0,0,0 // lea 0x55(%rip),%r9 # 45fc <_sk_store_8888_avx+0x10c> .byte 75,99,4,129 // movslq (%r9,%r8,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax @@ -18284,7 +18657,7 @@ _sk_store_8888_avx: .byte 196,67,121,22,68,186,8,2 // vpextrd $0x2,%xmm8,0x8(%r10,%rdi,4) .byte 196,67,121,22,68,186,4,1 // vpextrd $0x1,%xmm8,0x4(%r10,%rdi,4) .byte 196,65,121,126,4,186 // vmovd %xmm8,(%r10,%rdi,4) - .byte 235,143 // jmp 42f4 <_sk_store_8888_avx+0x98> + .byte 235,143 // jmp 4588 <_sk_store_8888_avx+0x98> .byte 15,31,0 // nopl (%rax) .byte 245 // cmc .byte 255 // (bad) @@ -18322,7 +18695,7 @@ _sk_load_f16_avx: .byte 197,252,17,116,36,192 // vmovups %ymm6,-0x40(%rsp) .byte 197,252,17,108,36,160 // vmovups %ymm5,-0x60(%rsp) .byte 197,254,127,100,36,128 // vmovdqu %ymm4,-0x80(%rsp) - .byte 15,133,141,2,0,0 // jne 463b <_sk_load_f16_avx+0x2b7> + .byte 15,133,141,2,0,0 // jne 48cf <_sk_load_f16_avx+0x2b7> .byte 197,121,16,4,248 // vmovupd (%rax,%rdi,8),%xmm8 .byte 197,249,16,84,248,16 // vmovupd 0x10(%rax,%rdi,8),%xmm2 .byte 197,249,16,76,248,32 // vmovupd 0x20(%rax,%rdi,8),%xmm1 @@ -18340,13 +18713,13 @@ _sk_load_f16_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 - .byte 196,98,125,24,37,213,35,0,0 // vbroadcastss 0x23d5(%rip),%ymm12 # 67dc <_sk_callback_avx+0x424> + .byte 196,98,125,24,37,221,35,0,0 // vbroadcastss 0x23dd(%rip),%ymm12 # 6a78 <_sk_callback_avx+0x42c> .byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1 .byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0 .byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14 - .byte 196,98,121,24,29,193,35,0,0 // vbroadcastss 0x23c1(%rip),%xmm11 # 67e0 <_sk_callback_avx+0x428> + .byte 196,98,121,24,29,201,35,0,0 // vbroadcastss 0x23c9(%rip),%xmm11 # 6a7c <_sk_callback_avx+0x430> .byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3 - .byte 196,98,121,24,45,183,35,0,0 // vbroadcastss 0x23b7(%rip),%xmm13 # 67e4 <_sk_callback_avx+0x42c> + .byte 196,98,121,24,45,191,35,0,0 // vbroadcastss 0x23bf(%rip),%xmm13 # 6a80 <_sk_callback_avx+0x434> .byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3 .byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10 .byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -18360,7 +18733,7 @@ _sk_load_f16_avx: .byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 .byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0 .byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1 - .byte 196,226,121,24,29,109,35,0,0 // vbroadcastss 0x236d(%rip),%xmm3 # 67e8 <_sk_callback_avx+0x430> + .byte 196,226,121,24,29,117,35,0,0 // vbroadcastss 0x2375(%rip),%xmm3 # 6a84 <_sk_callback_avx+0x438> .byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1 .byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 @@ -18453,29 +18826,29 @@ _sk_load_f16_avx: .byte 197,123,16,4,248 // vmovsd (%rax,%rdi,8),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 116,79 // je 469a <_sk_load_f16_avx+0x316> + .byte 116,79 // je 492e <_sk_load_f16_avx+0x316> .byte 197,57,22,68,248,8 // vmovhpd 0x8(%rax,%rdi,8),%xmm8,%xmm8 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,67 // jb 469a <_sk_load_f16_avx+0x316> + .byte 114,67 // jb 492e <_sk_load_f16_avx+0x316> .byte 197,251,16,84,248,16 // vmovsd 0x10(%rax,%rdi,8),%xmm2 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 116,68 // je 46a7 <_sk_load_f16_avx+0x323> + .byte 116,68 // je 493b <_sk_load_f16_avx+0x323> .byte 197,233,22,84,248,24 // vmovhpd 0x18(%rax,%rdi,8),%xmm2,%xmm2 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,56 // jb 46a7 <_sk_load_f16_avx+0x323> + .byte 114,56 // jb 493b <_sk_load_f16_avx+0x323> .byte 197,251,16,76,248,32 // vmovsd 0x20(%rax,%rdi,8),%xmm1 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 15,132,70,253,255,255 // je 43c5 <_sk_load_f16_avx+0x41> + .byte 15,132,70,253,255,255 // je 4659 <_sk_load_f16_avx+0x41> .byte 197,241,22,76,248,40 // vmovhpd 0x28(%rax,%rdi,8),%xmm1,%xmm1 .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 15,130,54,253,255,255 // jb 43c5 <_sk_load_f16_avx+0x41> + .byte 15,130,54,253,255,255 // jb 4659 <_sk_load_f16_avx+0x41> .byte 197,122,126,76,248,48 // vmovq 0x30(%rax,%rdi,8),%xmm9 - .byte 233,43,253,255,255 // jmpq 43c5 <_sk_load_f16_avx+0x41> + .byte 233,43,253,255,255 // jmpq 4659 <_sk_load_f16_avx+0x41> .byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,30,253,255,255 // jmpq 43c5 <_sk_load_f16_avx+0x41> + .byte 233,30,253,255,255 // jmpq 4659 <_sk_load_f16_avx+0x41> .byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1 - .byte 233,21,253,255,255 // jmpq 43c5 <_sk_load_f16_avx+0x41> + .byte 233,21,253,255,255 // jmpq 4659 <_sk_load_f16_avx+0x41> HIDDEN _sk_gather_f16_avx .globl _sk_gather_f16_avx @@ -18539,13 +18912,13 @@ _sk_gather_f16_avx: .byte 197,249,105,210 // vpunpckhwd %xmm2,%xmm0,%xmm2 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,194,1 // vinsertf128 $0x1,%xmm2,%ymm0,%ymm0 - .byte 196,98,125,24,37,49,32,0,0 // vbroadcastss 0x2031(%rip),%ymm12 # 67ec <_sk_callback_avx+0x434> + .byte 196,98,125,24,37,57,32,0,0 // vbroadcastss 0x2039(%rip),%ymm12 # 6a88 <_sk_callback_avx+0x43c> .byte 196,193,124,84,212 // vandps %ymm12,%ymm0,%ymm2 .byte 197,252,87,194 // vxorps %ymm2,%ymm0,%ymm0 .byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14 - .byte 196,98,121,24,29,29,32,0,0 // vbroadcastss 0x201d(%rip),%xmm11 # 67f0 <_sk_callback_avx+0x438> + .byte 196,98,121,24,29,37,32,0,0 // vbroadcastss 0x2025(%rip),%xmm11 # 6a8c <_sk_callback_avx+0x440> .byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3 - .byte 196,98,121,24,45,19,32,0,0 // vbroadcastss 0x2013(%rip),%xmm13 # 67f4 <_sk_callback_avx+0x43c> + .byte 196,98,121,24,45,27,32,0,0 // vbroadcastss 0x201b(%rip),%xmm13 # 6a90 <_sk_callback_avx+0x444> .byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3 .byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10 .byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -18559,7 +18932,7 @@ _sk_gather_f16_avx: .byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 .byte 197,252,86,194 // vorps %ymm2,%ymm0,%ymm0 .byte 196,227,125,25,194,1 // vextractf128 $0x1,%ymm0,%xmm2 - .byte 196,226,121,24,29,201,31,0,0 // vbroadcastss 0x1fc9(%rip),%xmm3 # 67f8 <_sk_callback_avx+0x440> + .byte 196,226,121,24,29,209,31,0,0 // vbroadcastss 0x1fd1(%rip),%xmm3 # 6a94 <_sk_callback_avx+0x448> .byte 197,233,254,211 // vpaddd %xmm3,%xmm2,%xmm2 .byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0 .byte 196,227,125,24,194,1 // vinsertf128 $0x1,%xmm2,%ymm0,%ymm0 @@ -18663,12 +19036,12 @@ _sk_store_f16_avx: .byte 197,252,17,52,36 // vmovups %ymm6,(%rsp) .byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp) .byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp) - .byte 196,98,125,24,13,226,29,0,0 // vbroadcastss 0x1de2(%rip),%ymm9 # 67fc <_sk_callback_avx+0x444> + .byte 196,98,125,24,13,234,29,0,0 // vbroadcastss 0x1dea(%rip),%ymm9 # 6a98 <_sk_callback_avx+0x44c> .byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10 .byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp) .byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11 .byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12 - .byte 196,98,121,24,5,199,29,0,0 // vbroadcastss 0x1dc7(%rip),%xmm8 # 6800 <_sk_callback_avx+0x448> + .byte 196,98,121,24,5,207,29,0,0 // vbroadcastss 0x1dcf(%rip),%xmm8 # 6a9c <_sk_callback_avx+0x450> .byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13 .byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14 .byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13 @@ -18678,7 +19051,7 @@ _sk_store_f16_avx: .byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14 .byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11 .byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12 - .byte 196,98,125,24,21,142,29,0,0 // vbroadcastss 0x1d8e(%rip),%ymm10 # 6804 <_sk_callback_avx+0x44c> + .byte 196,98,125,24,21,150,29,0,0 // vbroadcastss 0x1d96(%rip),%ymm10 # 6aa0 <_sk_callback_avx+0x454> .byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14 .byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15 .byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12 @@ -18760,7 +19133,7 @@ _sk_store_f16_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 72,133,201 // test %rcx,%rcx - .byte 117,66 // jne 4c54 <_sk_store_f16_avx+0x25e> + .byte 117,66 // jne 4ee8 <_sk_store_f16_avx+0x25e> .byte 197,120,17,28,248 // vmovups %xmm11,(%rax,%rdi,8) .byte 197,120,17,84,248,16 // vmovups %xmm10,0x10(%rax,%rdi,8) .byte 197,120,17,76,248,32 // vmovups %xmm9,0x20(%rax,%rdi,8) @@ -18776,22 +19149,22 @@ _sk_store_f16_avx: .byte 255,224 // jmpq *%rax .byte 197,121,214,28,248 // vmovq %xmm11,(%rax,%rdi,8) .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 116,202 // je 4c29 <_sk_store_f16_avx+0x233> + .byte 116,202 // je 4ebd <_sk_store_f16_avx+0x233> .byte 197,121,23,92,248,8 // vmovhpd %xmm11,0x8(%rax,%rdi,8) .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,190 // jb 4c29 <_sk_store_f16_avx+0x233> + .byte 114,190 // jb 4ebd <_sk_store_f16_avx+0x233> .byte 197,121,214,84,248,16 // vmovq %xmm10,0x10(%rax,%rdi,8) - .byte 116,182 // je 4c29 <_sk_store_f16_avx+0x233> + .byte 116,182 // je 4ebd <_sk_store_f16_avx+0x233> .byte 197,121,23,84,248,24 // vmovhpd %xmm10,0x18(%rax,%rdi,8) .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,170 // jb 4c29 <_sk_store_f16_avx+0x233> + .byte 114,170 // jb 4ebd <_sk_store_f16_avx+0x233> .byte 197,121,214,76,248,32 // vmovq %xmm9,0x20(%rax,%rdi,8) - .byte 116,162 // je 4c29 <_sk_store_f16_avx+0x233> + .byte 116,162 // je 4ebd <_sk_store_f16_avx+0x233> .byte 197,121,23,76,248,40 // vmovhpd %xmm9,0x28(%rax,%rdi,8) .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 114,150 // jb 4c29 <_sk_store_f16_avx+0x233> + .byte 114,150 // jb 4ebd <_sk_store_f16_avx+0x233> .byte 197,121,214,68,248,48 // vmovq %xmm8,0x30(%rax,%rdi,8) - .byte 235,142 // jmp 4c29 <_sk_store_f16_avx+0x233> + .byte 235,142 // jmp 4ebd <_sk_store_f16_avx+0x233> HIDDEN _sk_load_u16_be_avx .globl _sk_load_u16_be_avx @@ -18801,7 +19174,7 @@ _sk_load_u16_be_avx: .byte 76,139,0 // mov (%rax),%r8 .byte 72,141,4,189,0,0,0,0 // lea 0x0(,%rdi,4),%rax .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,253,0,0,0 // jne 4dae <_sk_load_u16_be_avx+0x113> + .byte 15,133,253,0,0,0 // jne 5042 <_sk_load_u16_be_avx+0x113> .byte 196,65,121,16,4,64 // vmovupd (%r8,%rax,2),%xmm8 .byte 196,193,121,16,84,64,16 // vmovupd 0x10(%r8,%rax,2),%xmm2 .byte 196,193,121,16,92,64,32 // vmovupd 0x20(%r8,%rax,2),%xmm3 @@ -18823,7 +19196,7 @@ _sk_load_u16_be_avx: .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,29,230,26,0,0 // vbroadcastss 0x1ae6(%rip),%ymm11 # 6808 <_sk_callback_avx+0x450> + .byte 196,98,125,24,29,238,26,0,0 // vbroadcastss 0x1aee(%rip),%ymm11 # 6aa4 <_sk_callback_avx+0x458> .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -18857,29 +19230,29 @@ _sk_load_u16_be_avx: .byte 196,65,123,16,4,64 // vmovsd (%r8,%rax,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 116,85 // je 4e14 <_sk_load_u16_be_avx+0x179> + .byte 116,85 // je 50a8 <_sk_load_u16_be_avx+0x179> .byte 196,65,57,22,68,64,8 // vmovhpd 0x8(%r8,%rax,2),%xmm8,%xmm8 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,72 // jb 4e14 <_sk_load_u16_be_avx+0x179> + .byte 114,72 // jb 50a8 <_sk_load_u16_be_avx+0x179> .byte 196,193,123,16,84,64,16 // vmovsd 0x10(%r8,%rax,2),%xmm2 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 116,72 // je 4e21 <_sk_load_u16_be_avx+0x186> + .byte 116,72 // je 50b5 <_sk_load_u16_be_avx+0x186> .byte 196,193,105,22,84,64,24 // vmovhpd 0x18(%r8,%rax,2),%xmm2,%xmm2 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,59 // jb 4e21 <_sk_load_u16_be_avx+0x186> + .byte 114,59 // jb 50b5 <_sk_load_u16_be_avx+0x186> .byte 196,193,123,16,92,64,32 // vmovsd 0x20(%r8,%rax,2),%xmm3 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 15,132,213,254,255,255 // je 4ccc <_sk_load_u16_be_avx+0x31> + .byte 15,132,213,254,255,255 // je 4f60 <_sk_load_u16_be_avx+0x31> .byte 196,193,97,22,92,64,40 // vmovhpd 0x28(%r8,%rax,2),%xmm3,%xmm3 .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 15,130,196,254,255,255 // jb 4ccc <_sk_load_u16_be_avx+0x31> + .byte 15,130,196,254,255,255 // jb 4f60 <_sk_load_u16_be_avx+0x31> .byte 196,65,122,126,76,64,48 // vmovq 0x30(%r8,%rax,2),%xmm9 - .byte 233,184,254,255,255 // jmpq 4ccc <_sk_load_u16_be_avx+0x31> + .byte 233,184,254,255,255 // jmpq 4f60 <_sk_load_u16_be_avx+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,171,254,255,255 // jmpq 4ccc <_sk_load_u16_be_avx+0x31> + .byte 233,171,254,255,255 // jmpq 4f60 <_sk_load_u16_be_avx+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,162,254,255,255 // jmpq 4ccc <_sk_load_u16_be_avx+0x31> + .byte 233,162,254,255,255 // jmpq 4f60 <_sk_load_u16_be_avx+0x31> HIDDEN _sk_load_rgb_u16_be_avx .globl _sk_load_rgb_u16_be_avx @@ -18889,7 +19262,7 @@ _sk_load_rgb_u16_be_avx: .byte 76,139,0 // mov (%rax),%r8 .byte 72,141,4,127 // lea (%rdi,%rdi,2),%rax .byte 72,133,201 // test %rcx,%rcx - .byte 15,133,243,0,0,0 // jne 4f2f <_sk_load_rgb_u16_be_avx+0x105> + .byte 15,133,243,0,0,0 // jne 51c3 <_sk_load_rgb_u16_be_avx+0x105> .byte 196,193,122,111,4,64 // vmovdqu (%r8,%rax,2),%xmm0 .byte 196,193,122,111,84,64,12 // vmovdqu 0xc(%r8,%rax,2),%xmm2 .byte 196,193,122,111,76,64,24 // vmovdqu 0x18(%r8,%rax,2),%xmm1 @@ -18916,7 +19289,7 @@ _sk_load_rgb_u16_be_avx: .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,29,70,25,0,0 // vbroadcastss 0x1946(%rip),%ymm11 # 680c <_sk_callback_avx+0x454> + .byte 196,98,125,24,29,78,25,0,0 // vbroadcastss 0x194e(%rip),%ymm11 # 6aa8 <_sk_callback_avx+0x45c> .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -18937,41 +19310,41 @@ _sk_load_rgb_u16_be_avx: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,227,24,0,0 // vbroadcastss 0x18e3(%rip),%ymm3 # 6810 <_sk_callback_avx+0x458> + .byte 196,226,125,24,29,235,24,0,0 // vbroadcastss 0x18eb(%rip),%ymm3 # 6aac <_sk_callback_avx+0x460> .byte 255,224 // jmpq *%rax .byte 196,193,121,110,4,64 // vmovd (%r8,%rax,2),%xmm0 .byte 196,193,121,196,68,64,4,2 // vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm0 .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 117,5 // jne 4f48 <_sk_load_rgb_u16_be_avx+0x11e> - .byte 233,40,255,255,255 // jmpq 4e70 <_sk_load_rgb_u16_be_avx+0x46> + .byte 117,5 // jne 51dc <_sk_load_rgb_u16_be_avx+0x11e> + .byte 233,40,255,255,255 // jmpq 5104 <_sk_load_rgb_u16_be_avx+0x46> .byte 196,193,121,110,76,64,6 // vmovd 0x6(%r8,%rax,2),%xmm1 .byte 196,65,113,196,68,64,10,2 // vpinsrw $0x2,0xa(%r8,%rax,2),%xmm1,%xmm8 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,26 // jb 4f77 <_sk_load_rgb_u16_be_avx+0x14d> + .byte 114,26 // jb 520b <_sk_load_rgb_u16_be_avx+0x14d> .byte 196,193,121,110,76,64,12 // vmovd 0xc(%r8,%rax,2),%xmm1 .byte 196,193,113,196,84,64,16,2 // vpinsrw $0x2,0x10(%r8,%rax,2),%xmm1,%xmm2 .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 117,10 // jne 4f7c <_sk_load_rgb_u16_be_avx+0x152> - .byte 233,249,254,255,255 // jmpq 4e70 <_sk_load_rgb_u16_be_avx+0x46> - .byte 233,244,254,255,255 // jmpq 4e70 <_sk_load_rgb_u16_be_avx+0x46> + .byte 117,10 // jne 5210 <_sk_load_rgb_u16_be_avx+0x152> + .byte 233,249,254,255,255 // jmpq 5104 <_sk_load_rgb_u16_be_avx+0x46> + .byte 233,244,254,255,255 // jmpq 5104 <_sk_load_rgb_u16_be_avx+0x46> .byte 196,193,121,110,76,64,18 // vmovd 0x12(%r8,%rax,2),%xmm1 .byte 196,65,113,196,76,64,22,2 // vpinsrw $0x2,0x16(%r8,%rax,2),%xmm1,%xmm9 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,26 // jb 4fab <_sk_load_rgb_u16_be_avx+0x181> + .byte 114,26 // jb 523f <_sk_load_rgb_u16_be_avx+0x181> .byte 196,193,121,110,76,64,24 // vmovd 0x18(%r8,%rax,2),%xmm1 .byte 196,193,113,196,76,64,28,2 // vpinsrw $0x2,0x1c(%r8,%rax,2),%xmm1,%xmm1 .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 117,10 // jne 4fb0 <_sk_load_rgb_u16_be_avx+0x186> - .byte 233,197,254,255,255 // jmpq 4e70 <_sk_load_rgb_u16_be_avx+0x46> - .byte 233,192,254,255,255 // jmpq 4e70 <_sk_load_rgb_u16_be_avx+0x46> + .byte 117,10 // jne 5244 <_sk_load_rgb_u16_be_avx+0x186> + .byte 233,197,254,255,255 // jmpq 5104 <_sk_load_rgb_u16_be_avx+0x46> + .byte 233,192,254,255,255 // jmpq 5104 <_sk_load_rgb_u16_be_avx+0x46> .byte 196,193,121,110,92,64,30 // vmovd 0x1e(%r8,%rax,2),%xmm3 .byte 196,65,97,196,92,64,34,2 // vpinsrw $0x2,0x22(%r8,%rax,2),%xmm3,%xmm11 .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 114,20 // jb 4fd9 <_sk_load_rgb_u16_be_avx+0x1af> + .byte 114,20 // jb 526d <_sk_load_rgb_u16_be_avx+0x1af> .byte 196,193,121,110,92,64,36 // vmovd 0x24(%r8,%rax,2),%xmm3 .byte 196,193,97,196,92,64,40,2 // vpinsrw $0x2,0x28(%r8,%rax,2),%xmm3,%xmm3 - .byte 233,151,254,255,255 // jmpq 4e70 <_sk_load_rgb_u16_be_avx+0x46> - .byte 233,146,254,255,255 // jmpq 4e70 <_sk_load_rgb_u16_be_avx+0x46> + .byte 233,151,254,255,255 // jmpq 5104 <_sk_load_rgb_u16_be_avx+0x46> + .byte 233,146,254,255,255 // jmpq 5104 <_sk_load_rgb_u16_be_avx+0x46> HIDDEN _sk_store_u16_be_avx .globl _sk_store_u16_be_avx @@ -18980,7 +19353,7 @@ _sk_store_u16_be_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,0 // mov (%rax),%r8 .byte 72,141,4,189,0,0,0,0 // lea 0x0(,%rdi,4),%rax - .byte 196,98,125,24,5,32,24,0,0 // vbroadcastss 0x1820(%rip),%ymm8 # 6814 <_sk_callback_avx+0x45c> + .byte 196,98,125,24,5,40,24,0,0 // vbroadcastss 0x1828(%rip),%ymm8 # 6ab0 <_sk_callback_avx+0x464> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10 @@ -19018,7 +19391,7 @@ _sk_store_u16_be_avx: .byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9 .byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8 .byte 72,133,201 // test %rcx,%rcx - .byte 117,31 // jne 50d8 <_sk_store_u16_be_avx+0xfa> + .byte 117,31 // jne 536c <_sk_store_u16_be_avx+0xfa> .byte 196,65,120,17,28,64 // vmovups %xmm11,(%r8,%rax,2) .byte 196,65,120,17,84,64,16 // vmovups %xmm10,0x10(%r8,%rax,2) .byte 196,65,120,17,76,64,32 // vmovups %xmm9,0x20(%r8,%rax,2) @@ -19027,22 +19400,22 @@ _sk_store_u16_be_avx: .byte 255,224 // jmpq *%rax .byte 196,65,121,214,28,64 // vmovq %xmm11,(%r8,%rax,2) .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 116,240 // je 50d4 <_sk_store_u16_be_avx+0xf6> + .byte 116,240 // je 5368 <_sk_store_u16_be_avx+0xf6> .byte 196,65,121,23,92,64,8 // vmovhpd %xmm11,0x8(%r8,%rax,2) .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,227 // jb 50d4 <_sk_store_u16_be_avx+0xf6> + .byte 114,227 // jb 5368 <_sk_store_u16_be_avx+0xf6> .byte 196,65,121,214,84,64,16 // vmovq %xmm10,0x10(%r8,%rax,2) - .byte 116,218 // je 50d4 <_sk_store_u16_be_avx+0xf6> + .byte 116,218 // je 5368 <_sk_store_u16_be_avx+0xf6> .byte 196,65,121,23,84,64,24 // vmovhpd %xmm10,0x18(%r8,%rax,2) .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,205 // jb 50d4 <_sk_store_u16_be_avx+0xf6> + .byte 114,205 // jb 5368 <_sk_store_u16_be_avx+0xf6> .byte 196,65,121,214,76,64,32 // vmovq %xmm9,0x20(%r8,%rax,2) - .byte 116,196 // je 50d4 <_sk_store_u16_be_avx+0xf6> + .byte 116,196 // je 5368 <_sk_store_u16_be_avx+0xf6> .byte 196,65,121,23,76,64,40 // vmovhpd %xmm9,0x28(%r8,%rax,2) .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 114,183 // jb 50d4 <_sk_store_u16_be_avx+0xf6> + .byte 114,183 // jb 5368 <_sk_store_u16_be_avx+0xf6> .byte 196,65,121,214,68,64,48 // vmovq %xmm8,0x30(%r8,%rax,2) - .byte 235,174 // jmp 50d4 <_sk_store_u16_be_avx+0xf6> + .byte 235,174 // jmp 5368 <_sk_store_u16_be_avx+0xf6> HIDDEN _sk_load_f32_avx .globl _sk_load_f32_avx @@ -19050,10 +19423,10 @@ FUNCTION(_sk_load_f32_avx) _sk_load_f32_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 119,110 // ja 519c <_sk_load_f32_avx+0x76> + .byte 119,110 // ja 5430 <_sk_load_f32_avx+0x76> .byte 76,139,0 // mov (%rax),%r8 .byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9 - .byte 76,141,21,132,0,0,0 // lea 0x84(%rip),%r10 # 51c4 <_sk_load_f32_avx+0x9e> + .byte 76,141,21,132,0,0,0 // lea 0x84(%rip),%r10 # 5458 <_sk_load_f32_avx+0x9e> .byte 73,99,4,138 // movslq (%r10,%rcx,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax @@ -19112,7 +19485,7 @@ _sk_store_f32_avx: .byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8 .byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11 .byte 72,133,201 // test %rcx,%rcx - .byte 117,55 // jne 5251 <_sk_store_f32_avx+0x6d> + .byte 117,55 // jne 54e5 <_sk_store_f32_avx+0x6d> .byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12 .byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13 .byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9 @@ -19125,22 +19498,22 @@ _sk_store_f32_avx: .byte 255,224 // jmpq *%rax .byte 196,65,121,17,20,128 // vmovupd %xmm10,(%r8,%rax,4) .byte 72,131,249,1 // cmp $0x1,%rcx - .byte 116,240 // je 524d <_sk_store_f32_avx+0x69> + .byte 116,240 // je 54e1 <_sk_store_f32_avx+0x69> .byte 196,65,121,17,76,128,16 // vmovupd %xmm9,0x10(%r8,%rax,4) .byte 72,131,249,3 // cmp $0x3,%rcx - .byte 114,227 // jb 524d <_sk_store_f32_avx+0x69> + .byte 114,227 // jb 54e1 <_sk_store_f32_avx+0x69> .byte 196,65,121,17,68,128,32 // vmovupd %xmm8,0x20(%r8,%rax,4) - .byte 116,218 // je 524d <_sk_store_f32_avx+0x69> + .byte 116,218 // je 54e1 <_sk_store_f32_avx+0x69> .byte 196,65,121,17,92,128,48 // vmovupd %xmm11,0x30(%r8,%rax,4) .byte 72,131,249,5 // cmp $0x5,%rcx - .byte 114,205 // jb 524d <_sk_store_f32_avx+0x69> + .byte 114,205 // jb 54e1 <_sk_store_f32_avx+0x69> .byte 196,67,125,25,84,128,64,1 // vextractf128 $0x1,%ymm10,0x40(%r8,%rax,4) - .byte 116,195 // je 524d <_sk_store_f32_avx+0x69> + .byte 116,195 // je 54e1 <_sk_store_f32_avx+0x69> .byte 196,67,125,25,76,128,80,1 // vextractf128 $0x1,%ymm9,0x50(%r8,%rax,4) .byte 72,131,249,7 // cmp $0x7,%rcx - .byte 114,181 // jb 524d <_sk_store_f32_avx+0x69> + .byte 114,181 // jb 54e1 <_sk_store_f32_avx+0x69> .byte 196,67,125,25,68,128,96,1 // vextractf128 $0x1,%ymm8,0x60(%r8,%rax,4) - .byte 235,171 // jmp 524d <_sk_store_f32_avx+0x69> + .byte 235,171 // jmp 54e1 <_sk_store_f32_avx+0x69> HIDDEN _sk_clamp_x_avx .globl _sk_clamp_x_avx @@ -19244,7 +19617,7 @@ FUNCTION(_sk_clamp_x_1_avx) _sk_clamp_x_1_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,82,20,0,0 // vbroadcastss 0x1452(%rip),%ymm8 # 6818 <_sk_callback_avx+0x460> + .byte 196,98,125,24,5,90,20,0,0 // vbroadcastss 0x145a(%rip),%ymm8 # 6ab4 <_sk_callback_avx+0x468> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -19262,9 +19635,9 @@ HIDDEN _sk_mirror_x_1_avx .globl _sk_mirror_x_1_avx FUNCTION(_sk_mirror_x_1_avx) _sk_mirror_x_1_avx: - .byte 196,98,125,24,5,53,20,0,0 // vbroadcastss 0x1435(%rip),%ymm8 # 681c <_sk_callback_avx+0x464> + .byte 196,98,125,24,5,61,20,0,0 // vbroadcastss 0x143d(%rip),%ymm8 # 6ab8 <_sk_callback_avx+0x46c> .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,13,43,20,0,0 // vbroadcastss 0x142b(%rip),%ymm9 # 6820 <_sk_callback_avx+0x468> + .byte 196,98,125,24,13,51,20,0,0 // vbroadcastss 0x1433(%rip),%ymm9 # 6abc <_sk_callback_avx+0x470> .byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9 .byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9 .byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9 @@ -19280,12 +19653,12 @@ HIDDEN _sk_luminance_to_alpha_avx .globl _sk_luminance_to_alpha_avx FUNCTION(_sk_luminance_to_alpha_avx) _sk_luminance_to_alpha_avx: - .byte 196,226,125,24,29,251,19,0,0 // vbroadcastss 0x13fb(%rip),%ymm3 # 6824 <_sk_callback_avx+0x46c> + .byte 196,226,125,24,29,3,20,0,0 // vbroadcastss 0x1403(%rip),%ymm3 # 6ac0 <_sk_callback_avx+0x474> .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,29,242,19,0,0 // vbroadcastss 0x13f2(%rip),%ymm3 # 6828 <_sk_callback_avx+0x470> + .byte 196,226,125,24,29,250,19,0,0 // vbroadcastss 0x13fa(%rip),%ymm3 # 6ac4 <_sk_callback_avx+0x478> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,229,19,0,0 // vbroadcastss 0x13e5(%rip),%ymm1 # 682c <_sk_callback_avx+0x474> + .byte 196,226,125,24,13,237,19,0,0 // vbroadcastss 0x13ed(%rip),%ymm1 # 6ac8 <_sk_callback_avx+0x47c> .byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1 .byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -19504,9 +19877,9 @@ _sk_evenly_spaced_gradient_avx: .byte 72,139,24 // mov (%rax),%rbx .byte 72,139,104,8 // mov 0x8(%rax),%rbp .byte 72,255,203 // dec %rbx - .byte 120,7 // js 579d <_sk_evenly_spaced_gradient_avx+0x1f> + .byte 120,7 // js 5a31 <_sk_evenly_spaced_gradient_avx+0x1f> .byte 196,225,242,42,203 // vcvtsi2ss %rbx,%xmm1,%xmm1 - .byte 235,21 // jmp 57b2 <_sk_evenly_spaced_gradient_avx+0x34> + .byte 235,21 // jmp 5a46 <_sk_evenly_spaced_gradient_avx+0x34> .byte 73,137,216 // mov %rbx,%r8 .byte 73,209,232 // shr %r8 .byte 131,227,1 // and $0x1,%ebx @@ -19663,18 +20036,18 @@ HIDDEN _sk_gauss_a_to_rgba_avx .globl _sk_gauss_a_to_rgba_avx FUNCTION(_sk_gauss_a_to_rgba_avx) _sk_gauss_a_to_rgba_avx: - .byte 196,226,125,24,5,80,13,0,0 // vbroadcastss 0xd50(%rip),%ymm0 # 6830 <_sk_callback_avx+0x478> + .byte 196,226,125,24,5,88,13,0,0 // vbroadcastss 0xd58(%rip),%ymm0 # 6acc <_sk_callback_avx+0x480> .byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0 - .byte 196,226,125,24,13,71,13,0,0 // vbroadcastss 0xd47(%rip),%ymm1 # 6834 <_sk_callback_avx+0x47c> + .byte 196,226,125,24,13,79,13,0,0 // vbroadcastss 0xd4f(%rip),%ymm1 # 6ad0 <_sk_callback_avx+0x484> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,13,58,13,0,0 // vbroadcastss 0xd3a(%rip),%ymm1 # 6838 <_sk_callback_avx+0x480> + .byte 196,226,125,24,13,66,13,0,0 // vbroadcastss 0xd42(%rip),%ymm1 # 6ad4 <_sk_callback_avx+0x488> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,13,45,13,0,0 // vbroadcastss 0xd2d(%rip),%ymm1 # 683c <_sk_callback_avx+0x484> + .byte 196,226,125,24,13,53,13,0,0 // vbroadcastss 0xd35(%rip),%ymm1 # 6ad8 <_sk_callback_avx+0x48c> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,13,32,13,0,0 // vbroadcastss 0xd20(%rip),%ymm1 # 6840 <_sk_callback_avx+0x488> + .byte 196,226,125,24,13,40,13,0,0 // vbroadcastss 0xd28(%rip),%ymm1 # 6adc <_sk_callback_avx+0x490> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 @@ -19696,12 +20069,12 @@ _sk_gradient_avx: .byte 76,139,0 // mov (%rax),%r8 .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 73,131,248,2 // cmp $0x2,%r8 - .byte 114,80 // jb 5b9d <_sk_gradient_avx+0x69> + .byte 114,80 // jb 5e31 <_sk_gradient_avx+0x69> .byte 72,139,88,72 // mov 0x48(%rax),%rbx .byte 73,255,200 // dec %r8 .byte 72,131,195,4 // add $0x4,%rbx .byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9 - .byte 196,98,125,24,21,222,12,0,0 // vbroadcastss 0xcde(%rip),%ymm10 # 6844 <_sk_callback_avx+0x48c> + .byte 196,98,125,24,21,230,12,0,0 // vbroadcastss 0xce6(%rip),%ymm10 # 6ae0 <_sk_callback_avx+0x494> .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 196,98,125,24,3 // vbroadcastss (%rbx),%ymm8 .byte 197,60,194,192,2 // vcmpleps %ymm0,%ymm8,%ymm8 @@ -19713,7 +20086,7 @@ _sk_gradient_avx: .byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1 .byte 72,131,195,4 // add $0x4,%rbx .byte 73,255,200 // dec %r8 - .byte 117,205 // jne 5b6a <_sk_gradient_avx+0x36> + .byte 117,205 // jne 5dfe <_sk_gradient_avx+0x36> .byte 196,195,249,22,200,1 // vpextrq $0x1,%xmm1,%r8 .byte 69,137,193 // mov %r8d,%r9d .byte 73,193,232,32 // shr $0x20,%r8 @@ -19895,27 +20268,27 @@ _sk_xy_to_unit_angle_avx: .byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12 .byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11 .byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12 - .byte 196,98,125,24,45,2,9,0,0 // vbroadcastss 0x902(%rip),%ymm13 # 6848 <_sk_callback_avx+0x490> + .byte 196,98,125,24,45,10,9,0,0 // vbroadcastss 0x90a(%rip),%ymm13 # 6ae4 <_sk_callback_avx+0x498> .byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13 - .byte 196,98,125,24,53,248,8,0,0 // vbroadcastss 0x8f8(%rip),%ymm14 # 684c <_sk_callback_avx+0x494> + .byte 196,98,125,24,53,0,9,0,0 // vbroadcastss 0x900(%rip),%ymm14 # 6ae8 <_sk_callback_avx+0x49c> .byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13 .byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13 - .byte 196,98,125,24,53,233,8,0,0 // vbroadcastss 0x8e9(%rip),%ymm14 # 6850 <_sk_callback_avx+0x498> + .byte 196,98,125,24,53,241,8,0,0 // vbroadcastss 0x8f1(%rip),%ymm14 # 6aec <_sk_callback_avx+0x4a0> .byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13 .byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12 - .byte 196,98,125,24,45,218,8,0,0 // vbroadcastss 0x8da(%rip),%ymm13 # 6854 <_sk_callback_avx+0x49c> + .byte 196,98,125,24,45,226,8,0,0 // vbroadcastss 0x8e2(%rip),%ymm13 # 6af0 <_sk_callback_avx+0x4a4> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 .byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,197,8,0,0 // vbroadcastss 0x8c5(%rip),%ymm10 # 6858 <_sk_callback_avx+0x4a0> + .byte 196,98,125,24,21,205,8,0,0 // vbroadcastss 0x8cd(%rip),%ymm10 # 6af4 <_sk_callback_avx+0x4a8> .byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10 .byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9 .byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,21,175,8,0,0 // vbroadcastss 0x8af(%rip),%ymm10 # 685c <_sk_callback_avx+0x4a4> + .byte 196,98,125,24,21,183,8,0,0 // vbroadcastss 0x8b7(%rip),%ymm10 # 6af8 <_sk_callback_avx+0x4ac> .byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9 - .byte 196,98,125,24,21,153,8,0,0 // vbroadcastss 0x899(%rip),%ymm10 # 6860 <_sk_callback_avx+0x4a8> + .byte 196,98,125,24,21,161,8,0,0 // vbroadcastss 0x8a1(%rip),%ymm10 # 6afc <_sk_callback_avx+0x4b0> .byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10 .byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0 .byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9 @@ -19939,7 +20312,7 @@ HIDDEN _sk_save_xy_avx FUNCTION(_sk_save_xy_avx) _sk_save_xy_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,99,8,0,0 // vbroadcastss 0x863(%rip),%ymm8 # 6864 <_sk_callback_avx+0x4ac> + .byte 196,98,125,24,5,107,8,0,0 // vbroadcastss 0x86b(%rip),%ymm8 # 6b00 <_sk_callback_avx+0x4b4> .byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9 .byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 @@ -19976,9 +20349,9 @@ HIDDEN _sk_bilinear_nx_avx FUNCTION(_sk_bilinear_nx_avx) _sk_bilinear_nx_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,239,7,0,0 // vbroadcastss 0x7ef(%rip),%ymm0 # 6868 <_sk_callback_avx+0x4b0> + .byte 196,226,125,24,5,247,7,0,0 // vbroadcastss 0x7f7(%rip),%ymm0 # 6b04 <_sk_callback_avx+0x4b8> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,230,7,0,0 // vbroadcastss 0x7e6(%rip),%ymm8 # 686c <_sk_callback_avx+0x4b4> + .byte 196,98,125,24,5,238,7,0,0 // vbroadcastss 0x7ee(%rip),%ymm8 # 6b08 <_sk_callback_avx+0x4bc> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -19989,7 +20362,7 @@ HIDDEN _sk_bilinear_px_avx FUNCTION(_sk_bilinear_px_avx) _sk_bilinear_px_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,206,7,0,0 // vbroadcastss 0x7ce(%rip),%ymm0 # 6870 <_sk_callback_avx+0x4b8> + .byte 196,226,125,24,5,214,7,0,0 // vbroadcastss 0x7d6(%rip),%ymm0 # 6b0c <_sk_callback_avx+0x4c0> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -20001,9 +20374,9 @@ HIDDEN _sk_bilinear_ny_avx FUNCTION(_sk_bilinear_ny_avx) _sk_bilinear_ny_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,178,7,0,0 // vbroadcastss 0x7b2(%rip),%ymm1 # 6874 <_sk_callback_avx+0x4bc> + .byte 196,226,125,24,13,186,7,0,0 // vbroadcastss 0x7ba(%rip),%ymm1 # 6b10 <_sk_callback_avx+0x4c4> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,168,7,0,0 // vbroadcastss 0x7a8(%rip),%ymm8 # 6878 <_sk_callback_avx+0x4c0> + .byte 196,98,125,24,5,176,7,0,0 // vbroadcastss 0x7b0(%rip),%ymm8 # 6b14 <_sk_callback_avx+0x4c8> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -20014,7 +20387,7 @@ HIDDEN _sk_bilinear_py_avx FUNCTION(_sk_bilinear_py_avx) _sk_bilinear_py_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,144,7,0,0 // vbroadcastss 0x790(%rip),%ymm1 # 687c <_sk_callback_avx+0x4c4> + .byte 196,226,125,24,13,152,7,0,0 // vbroadcastss 0x798(%rip),%ymm1 # 6b18 <_sk_callback_avx+0x4cc> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -20026,14 +20399,14 @@ HIDDEN _sk_bicubic_n3x_avx FUNCTION(_sk_bicubic_n3x_avx) _sk_bicubic_n3x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,115,7,0,0 // vbroadcastss 0x773(%rip),%ymm0 # 6880 <_sk_callback_avx+0x4c8> + .byte 196,226,125,24,5,123,7,0,0 // vbroadcastss 0x77b(%rip),%ymm0 # 6b1c <_sk_callback_avx+0x4d0> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,106,7,0,0 // vbroadcastss 0x76a(%rip),%ymm8 # 6884 <_sk_callback_avx+0x4cc> + .byte 196,98,125,24,5,114,7,0,0 // vbroadcastss 0x772(%rip),%ymm8 # 6b20 <_sk_callback_avx+0x4d4> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,91,7,0,0 // vbroadcastss 0x75b(%rip),%ymm10 # 6888 <_sk_callback_avx+0x4d0> + .byte 196,98,125,24,21,99,7,0,0 // vbroadcastss 0x763(%rip),%ymm10 # 6b24 <_sk_callback_avx+0x4d8> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,81,7,0,0 // vbroadcastss 0x751(%rip),%ymm10 # 688c <_sk_callback_avx+0x4d4> + .byte 196,98,125,24,21,89,7,0,0 // vbroadcastss 0x759(%rip),%ymm10 # 6b28 <_sk_callback_avx+0x4dc> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -20045,19 +20418,19 @@ HIDDEN _sk_bicubic_n1x_avx FUNCTION(_sk_bicubic_n1x_avx) _sk_bicubic_n1x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,52,7,0,0 // vbroadcastss 0x734(%rip),%ymm0 # 6890 <_sk_callback_avx+0x4d8> + .byte 196,226,125,24,5,60,7,0,0 // vbroadcastss 0x73c(%rip),%ymm0 # 6b2c <_sk_callback_avx+0x4e0> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,43,7,0,0 // vbroadcastss 0x72b(%rip),%ymm8 # 6894 <_sk_callback_avx+0x4dc> + .byte 196,98,125,24,5,51,7,0,0 // vbroadcastss 0x733(%rip),%ymm8 # 6b30 <_sk_callback_avx+0x4e4> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,33,7,0,0 // vbroadcastss 0x721(%rip),%ymm9 # 6898 <_sk_callback_avx+0x4e0> + .byte 196,98,125,24,13,41,7,0,0 // vbroadcastss 0x729(%rip),%ymm9 # 6b34 <_sk_callback_avx+0x4e8> .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,23,7,0,0 // vbroadcastss 0x717(%rip),%ymm10 # 689c <_sk_callback_avx+0x4e4> + .byte 196,98,125,24,21,31,7,0,0 // vbroadcastss 0x71f(%rip),%ymm10 # 6b38 <_sk_callback_avx+0x4ec> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,8,7,0,0 // vbroadcastss 0x708(%rip),%ymm10 # 68a0 <_sk_callback_avx+0x4e8> + .byte 196,98,125,24,21,16,7,0,0 // vbroadcastss 0x710(%rip),%ymm10 # 6b3c <_sk_callback_avx+0x4f0> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,249,6,0,0 // vbroadcastss 0x6f9(%rip),%ymm9 # 68a4 <_sk_callback_avx+0x4ec> + .byte 196,98,125,24,13,1,7,0,0 // vbroadcastss 0x701(%rip),%ymm9 # 6b40 <_sk_callback_avx+0x4f4> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -20068,17 +20441,17 @@ HIDDEN _sk_bicubic_p1x_avx FUNCTION(_sk_bicubic_p1x_avx) _sk_bicubic_p1x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,225,6,0,0 // vbroadcastss 0x6e1(%rip),%ymm8 # 68a8 <_sk_callback_avx+0x4f0> + .byte 196,98,125,24,5,233,6,0,0 // vbroadcastss 0x6e9(%rip),%ymm8 # 6b44 <_sk_callback_avx+0x4f8> .byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0 .byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9 - .byte 196,98,125,24,21,211,6,0,0 // vbroadcastss 0x6d3(%rip),%ymm10 # 68ac <_sk_callback_avx+0x4f4> + .byte 196,98,125,24,21,219,6,0,0 // vbroadcastss 0x6db(%rip),%ymm10 # 6b48 <_sk_callback_avx+0x4fc> .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 - .byte 196,98,125,24,29,201,6,0,0 // vbroadcastss 0x6c9(%rip),%ymm11 # 68b0 <_sk_callback_avx+0x4f8> + .byte 196,98,125,24,29,209,6,0,0 // vbroadcastss 0x6d1(%rip),%ymm11 # 6b4c <_sk_callback_avx+0x500> .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 .byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 - .byte 196,98,125,24,13,176,6,0,0 // vbroadcastss 0x6b0(%rip),%ymm9 # 68b4 <_sk_callback_avx+0x4fc> + .byte 196,98,125,24,13,184,6,0,0 // vbroadcastss 0x6b8(%rip),%ymm9 # 6b50 <_sk_callback_avx+0x504> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -20089,13 +20462,13 @@ HIDDEN _sk_bicubic_p3x_avx FUNCTION(_sk_bicubic_p3x_avx) _sk_bicubic_p3x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,152,6,0,0 // vbroadcastss 0x698(%rip),%ymm0 # 68b8 <_sk_callback_avx+0x500> + .byte 196,226,125,24,5,160,6,0,0 // vbroadcastss 0x6a0(%rip),%ymm0 # 6b54 <_sk_callback_avx+0x508> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,133,6,0,0 // vbroadcastss 0x685(%rip),%ymm10 # 68bc <_sk_callback_avx+0x504> + .byte 196,98,125,24,21,141,6,0,0 // vbroadcastss 0x68d(%rip),%ymm10 # 6b58 <_sk_callback_avx+0x50c> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,123,6,0,0 // vbroadcastss 0x67b(%rip),%ymm10 # 68c0 <_sk_callback_avx+0x508> + .byte 196,98,125,24,21,131,6,0,0 // vbroadcastss 0x683(%rip),%ymm10 # 6b5c <_sk_callback_avx+0x510> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -20107,14 +20480,14 @@ HIDDEN _sk_bicubic_n3y_avx FUNCTION(_sk_bicubic_n3y_avx) _sk_bicubic_n3y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,94,6,0,0 // vbroadcastss 0x65e(%rip),%ymm1 # 68c4 <_sk_callback_avx+0x50c> + .byte 196,226,125,24,13,102,6,0,0 // vbroadcastss 0x666(%rip),%ymm1 # 6b60 <_sk_callback_avx+0x514> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,84,6,0,0 // vbroadcastss 0x654(%rip),%ymm8 # 68c8 <_sk_callback_avx+0x510> + .byte 196,98,125,24,5,92,6,0,0 // vbroadcastss 0x65c(%rip),%ymm8 # 6b64 <_sk_callback_avx+0x518> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,69,6,0,0 // vbroadcastss 0x645(%rip),%ymm10 # 68cc <_sk_callback_avx+0x514> + .byte 196,98,125,24,21,77,6,0,0 // vbroadcastss 0x64d(%rip),%ymm10 # 6b68 <_sk_callback_avx+0x51c> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,59,6,0,0 // vbroadcastss 0x63b(%rip),%ymm10 # 68d0 <_sk_callback_avx+0x518> + .byte 196,98,125,24,21,67,6,0,0 // vbroadcastss 0x643(%rip),%ymm10 # 6b6c <_sk_callback_avx+0x520> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -20126,19 +20499,19 @@ HIDDEN _sk_bicubic_n1y_avx FUNCTION(_sk_bicubic_n1y_avx) _sk_bicubic_n1y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,30,6,0,0 // vbroadcastss 0x61e(%rip),%ymm1 # 68d4 <_sk_callback_avx+0x51c> + .byte 196,226,125,24,13,38,6,0,0 // vbroadcastss 0x626(%rip),%ymm1 # 6b70 <_sk_callback_avx+0x524> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,20,6,0,0 // vbroadcastss 0x614(%rip),%ymm8 # 68d8 <_sk_callback_avx+0x520> + .byte 196,98,125,24,5,28,6,0,0 // vbroadcastss 0x61c(%rip),%ymm8 # 6b74 <_sk_callback_avx+0x528> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,10,6,0,0 // vbroadcastss 0x60a(%rip),%ymm9 # 68dc <_sk_callback_avx+0x524> + .byte 196,98,125,24,13,18,6,0,0 // vbroadcastss 0x612(%rip),%ymm9 # 6b78 <_sk_callback_avx+0x52c> .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,0,6,0,0 // vbroadcastss 0x600(%rip),%ymm10 # 68e0 <_sk_callback_avx+0x528> + .byte 196,98,125,24,21,8,6,0,0 // vbroadcastss 0x608(%rip),%ymm10 # 6b7c <_sk_callback_avx+0x530> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,241,5,0,0 // vbroadcastss 0x5f1(%rip),%ymm10 # 68e4 <_sk_callback_avx+0x52c> + .byte 196,98,125,24,21,249,5,0,0 // vbroadcastss 0x5f9(%rip),%ymm10 # 6b80 <_sk_callback_avx+0x534> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,226,5,0,0 // vbroadcastss 0x5e2(%rip),%ymm9 # 68e8 <_sk_callback_avx+0x530> + .byte 196,98,125,24,13,234,5,0,0 // vbroadcastss 0x5ea(%rip),%ymm9 # 6b84 <_sk_callback_avx+0x538> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -20149,17 +20522,17 @@ HIDDEN _sk_bicubic_p1y_avx FUNCTION(_sk_bicubic_p1y_avx) _sk_bicubic_p1y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,202,5,0,0 // vbroadcastss 0x5ca(%rip),%ymm8 # 68ec <_sk_callback_avx+0x534> + .byte 196,98,125,24,5,210,5,0,0 // vbroadcastss 0x5d2(%rip),%ymm8 # 6b88 <_sk_callback_avx+0x53c> .byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1 .byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9 - .byte 196,98,125,24,21,187,5,0,0 // vbroadcastss 0x5bb(%rip),%ymm10 # 68f0 <_sk_callback_avx+0x538> + .byte 196,98,125,24,21,195,5,0,0 // vbroadcastss 0x5c3(%rip),%ymm10 # 6b8c <_sk_callback_avx+0x540> .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 - .byte 196,98,125,24,29,177,5,0,0 // vbroadcastss 0x5b1(%rip),%ymm11 # 68f4 <_sk_callback_avx+0x53c> + .byte 196,98,125,24,29,185,5,0,0 // vbroadcastss 0x5b9(%rip),%ymm11 # 6b90 <_sk_callback_avx+0x544> .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 .byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 - .byte 196,98,125,24,13,152,5,0,0 // vbroadcastss 0x598(%rip),%ymm9 # 68f8 <_sk_callback_avx+0x540> + .byte 196,98,125,24,13,160,5,0,0 // vbroadcastss 0x5a0(%rip),%ymm9 # 6b94 <_sk_callback_avx+0x548> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -20170,13 +20543,13 @@ HIDDEN _sk_bicubic_p3y_avx FUNCTION(_sk_bicubic_p3y_avx) _sk_bicubic_p3y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,128,5,0,0 // vbroadcastss 0x580(%rip),%ymm1 # 68fc <_sk_callback_avx+0x544> + .byte 196,226,125,24,13,136,5,0,0 // vbroadcastss 0x588(%rip),%ymm1 # 6b98 <_sk_callback_avx+0x54c> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,108,5,0,0 // vbroadcastss 0x56c(%rip),%ymm10 # 6900 <_sk_callback_avx+0x548> + .byte 196,98,125,24,21,116,5,0,0 // vbroadcastss 0x574(%rip),%ymm10 # 6b9c <_sk_callback_avx+0x550> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,98,5,0,0 // vbroadcastss 0x562(%rip),%ymm10 # 6904 <_sk_callback_avx+0x54c> + .byte 196,98,125,24,21,106,5,0,0 // vbroadcastss 0x56a(%rip),%ymm10 # 6ba0 <_sk_callback_avx+0x554> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -20300,31 +20673,33 @@ BALIGN4 .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 6591 <.literal4+0xb1> + .byte 71,225,61 // rex.RXB loope 6825 <.literal4+0xb1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 65a1 <.literal4+0xc1> + .byte 71,225,61 // rex.RXB loope 6835 <.literal4+0xc1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 65b1 <.literal4+0xd1> + .byte 71,225,61 // rex.RXB loope 6845 <.literal4+0xd1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 65c1 <.literal4+0xe1> + .byte 71,225,61 // rex.RXB loope 6855 <.literal4+0xe1> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax) + .byte 67,0,0 // rex.XB add %al,(%r8) + .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) .byte 63 // (bad) - .byte 0,0 // add %al,(%rax) - .byte 128,63,145 // cmpb $0x91,(%rdi) + .byte 145 // xchg %eax,%ecx .byte 131,158,61,154,153,153,62 // sbbl $0x3e,-0x666665c3(%rsi) .byte 92 // pop %rsp .byte 143 // (bad) @@ -20368,7 +20743,7 @@ BALIGN4 .byte 190,129,128,128,59 // mov $0x3b808081,%esi .byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 660d <.literal4+0x12d> + .byte 224,7 // loopne 68a9 <.literal4+0x135> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -20384,10 +20759,10 @@ BALIGN4 .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) .byte 0,52,255 // add %dh,(%rdi,%rdi,8) .byte 255 // (bad) - .byte 127,0 // jg 6634 <.literal4+0x154> + .byte 127,0 // jg 68d0 <.literal4+0x15c> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 66ad <.literal4+0x1cd> + .byte 119,115 // ja 6949 <.literal4+0x1d5> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -20401,10 +20776,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 6668 <.literal4+0x188> + .byte 127,0 // jg 6904 <.literal4+0x190> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 66e1 <.literal4+0x201> + .byte 119,115 // ja 697d <.literal4+0x209> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -20418,10 +20793,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 669c <.literal4+0x1bc> + .byte 127,0 // jg 6938 <.literal4+0x1c4> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6715 <.literal4+0x235> + .byte 119,115 // ja 69b1 <.literal4+0x23d> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -20435,10 +20810,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 66d0 <.literal4+0x1f0> + .byte 127,0 // jg 696c <.literal4+0x1f8> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6749 <.literal4+0x269> + .byte 119,115 // ja 69e5 <.literal4+0x271> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -20451,7 +20826,7 @@ BALIGN4 .byte 0,75,0 // add %cl,0x0(%rbx) .byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax) .byte 66,0,0 // rex.X add %al,(%rax) - .byte 127,67 // jg 6747 <.literal4+0x267> + .byte 127,67 // jg 69e3 <.literal4+0x26f> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -20463,10 +20838,10 @@ BALIGN4 .byte 190,80,128,3,62 // mov $0x3e038050,%esi .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 6767 <.literal4+0x287> + .byte 118,63 // jbe 6a03 <.literal4+0x28f> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) - .byte 127,67 // jg 677b <.literal4+0x29b> + .byte 127,67 // jg 6a17 <.literal4+0x2a3> .byte 129,128,128,59,0,0,128,63,129,128 // addl $0x80813f80,0x3b80(%rax) .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,128,63,129,128,128 // add %al,-0x7f7f7ec1(%rax) @@ -20475,7 +20850,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 675d <.literal4+0x27d> + .byte 224,7 // loopne 69f9 <.literal4+0x285> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -20487,7 +20862,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 6779 <.literal4+0x299> + .byte 224,7 // loopne 6a15 <.literal4+0x2a1> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -20498,7 +20873,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 67ce <.literal4+0x2ee> + .byte 124,66 // jl 6a6a <.literal4+0x2f6> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax) @@ -20516,9 +20891,9 @@ BALIGN4 .byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax) .byte 0,0 // add %al,(%rax) .byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax) - .byte 112,65 // jo 6811 <.literal4+0x331> + .byte 112,65 // jo 6aad <.literal4+0x339> .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) - .byte 127,67 // jg 681f <.literal4+0x33f> + .byte 127,67 // jg 6abb <.literal4+0x347> .byte 0,128,0,0,0,0 // add %al,0x0(%rax) .byte 0,128,0,4,0,128 // add %al,-0x7ffffc00(%rax) .byte 0,0 // add %al,(%rax) @@ -20534,7 +20909,7 @@ BALIGN4 .byte 0,128,55,0,0,128 // add %al,-0x7fffffc9(%rax) .byte 63 // (bad) .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 685f <.literal4+0x37f> + .byte 127,71 // jg 6afb <.literal4+0x387> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,191,0,0,0 // add %al,0xbf(%rax) @@ -20695,6 +21070,22 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 255,0 // incl (%rax) .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) + .byte 255,0 // incl (%rax) + .byte 0,0 // add %al,(%rax) BALIGN16 .byte 255,0 // incl (%rax) @@ -20773,7 +21164,7 @@ _sk_seed_shader_sse41: .byte 102,15,110,199 // movd %edi,%xmm0 .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0 .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 - .byte 15,40,21,228,71,0,0 // movaps 0x47e4(%rip),%xmm2 # 4860 <_sk_callback_sse41+0xe2> + .byte 15,40,21,180,72,0,0 // movaps 0x48b4(%rip),%xmm2 # 4930 <_sk_callback_sse41+0xe2> .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,16,2 // movups (%rdx),%xmm0 .byte 15,88,193 // addps %xmm1,%xmm0 @@ -20782,7 +21173,7 @@ _sk_seed_shader_sse41: .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,21,211,71,0,0 // movaps 0x47d3(%rip),%xmm2 # 4870 <_sk_callback_sse41+0xf2> + .byte 15,40,21,163,72,0,0 // movaps 0x48a3(%rip),%xmm2 # 4940 <_sk_callback_sse41+0xf2> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,87,237 // xorps %xmm5,%xmm5 @@ -20803,14 +21194,14 @@ _sk_dither_sse41: .byte 102,68,15,110,1 // movd (%rcx),%xmm8 .byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8 .byte 102,69,15,239,193 // pxor %xmm9,%xmm8 - .byte 102,68,15,111,21,158,71,0,0 // movdqa 0x479e(%rip),%xmm10 # 4880 <_sk_callback_sse41+0x102> + .byte 102,68,15,111,21,110,72,0,0 // movdqa 0x486e(%rip),%xmm10 # 4950 <_sk_callback_sse41+0x102> .byte 102,69,15,111,216 // movdqa %xmm8,%xmm11 .byte 102,69,15,219,218 // pand %xmm10,%xmm11 .byte 102,65,15,114,243,5 // pslld $0x5,%xmm11 .byte 102,69,15,219,209 // pand %xmm9,%xmm10 .byte 102,65,15,114,242,4 // pslld $0x4,%xmm10 - .byte 102,68,15,111,37,138,71,0,0 // movdqa 0x478a(%rip),%xmm12 # 4890 <_sk_callback_sse41+0x112> - .byte 102,68,15,111,45,145,71,0,0 // movdqa 0x4791(%rip),%xmm13 # 48a0 <_sk_callback_sse41+0x122> + .byte 102,68,15,111,37,90,72,0,0 // movdqa 0x485a(%rip),%xmm12 # 4960 <_sk_callback_sse41+0x112> + .byte 102,68,15,111,45,97,72,0,0 // movdqa 0x4861(%rip),%xmm13 # 4970 <_sk_callback_sse41+0x122> .byte 102,69,15,111,240 // movdqa %xmm8,%xmm14 .byte 102,69,15,219,245 // pand %xmm13,%xmm14 .byte 102,65,15,114,246,2 // pslld $0x2,%xmm14 @@ -20826,8 +21217,8 @@ _sk_dither_sse41: .byte 102,69,15,235,198 // por %xmm14,%xmm8 .byte 102,69,15,235,197 // por %xmm13,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,76,71,0,0 // mulps 0x474c(%rip),%xmm8 # 48b0 <_sk_callback_sse41+0x132> - .byte 68,15,88,5,84,71,0,0 // addps 0x4754(%rip),%xmm8 # 48c0 <_sk_callback_sse41+0x142> + .byte 68,15,89,5,28,72,0,0 // mulps 0x481c(%rip),%xmm8 # 4980 <_sk_callback_sse41+0x132> + .byte 68,15,88,5,36,72,0,0 // addps 0x4824(%rip),%xmm8 # 4990 <_sk_callback_sse41+0x142> .byte 243,68,15,16,80,8 // movss 0x8(%rax),%xmm10 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 @@ -20904,7 +21295,7 @@ HIDDEN _sk_srcatop_sse41 FUNCTION(_sk_srcatop_sse41) _sk_srcatop_sse41: .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 68,15,40,5,173,70,0,0 // movaps 0x46ad(%rip),%xmm8 # 48d0 <_sk_callback_sse41+0x152> + .byte 68,15,40,5,125,71,0,0 // movaps 0x477d(%rip),%xmm8 # 49a0 <_sk_callback_sse41+0x152> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -20929,7 +21320,7 @@ FUNCTION(_sk_dstatop_sse41) _sk_dstatop_sse41: .byte 68,15,40,195 // movaps %xmm3,%xmm8 .byte 68,15,89,196 // mulps %xmm4,%xmm8 - .byte 68,15,40,13,112,70,0,0 // movaps 0x4670(%rip),%xmm9 # 48e0 <_sk_callback_sse41+0x162> + .byte 68,15,40,13,64,71,0,0 // movaps 0x4740(%rip),%xmm9 # 49b0 <_sk_callback_sse41+0x162> .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 @@ -20976,7 +21367,7 @@ HIDDEN _sk_srcout_sse41 .globl _sk_srcout_sse41 FUNCTION(_sk_srcout_sse41) _sk_srcout_sse41: - .byte 68,15,40,5,20,70,0,0 // movaps 0x4614(%rip),%xmm8 # 48f0 <_sk_callback_sse41+0x172> + .byte 68,15,40,5,228,70,0,0 // movaps 0x46e4(%rip),%xmm8 # 49c0 <_sk_callback_sse41+0x172> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 @@ -20989,7 +21380,7 @@ HIDDEN _sk_dstout_sse41 .globl _sk_dstout_sse41 FUNCTION(_sk_dstout_sse41) _sk_dstout_sse41: - .byte 68,15,40,5,4,70,0,0 // movaps 0x4604(%rip),%xmm8 # 4900 <_sk_callback_sse41+0x182> + .byte 68,15,40,5,212,70,0,0 // movaps 0x46d4(%rip),%xmm8 # 49d0 <_sk_callback_sse41+0x182> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 @@ -21006,7 +21397,7 @@ HIDDEN _sk_srcover_sse41 .globl _sk_srcover_sse41 FUNCTION(_sk_srcover_sse41) _sk_srcover_sse41: - .byte 68,15,40,5,231,69,0,0 // movaps 0x45e7(%rip),%xmm8 # 4910 <_sk_callback_sse41+0x192> + .byte 68,15,40,5,183,70,0,0 // movaps 0x46b7(%rip),%xmm8 # 49e0 <_sk_callback_sse41+0x192> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -21026,7 +21417,7 @@ HIDDEN _sk_dstover_sse41 .globl _sk_dstover_sse41 FUNCTION(_sk_dstover_sse41) _sk_dstover_sse41: - .byte 68,15,40,5,187,69,0,0 // movaps 0x45bb(%rip),%xmm8 # 4920 <_sk_callback_sse41+0x1a2> + .byte 68,15,40,5,139,70,0,0 // movaps 0x468b(%rip),%xmm8 # 49f0 <_sk_callback_sse41+0x1a2> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -21054,7 +21445,7 @@ HIDDEN _sk_multiply_sse41 .globl _sk_multiply_sse41 FUNCTION(_sk_multiply_sse41) _sk_multiply_sse41: - .byte 68,15,40,5,143,69,0,0 // movaps 0x458f(%rip),%xmm8 # 4930 <_sk_callback_sse41+0x1b2> + .byte 68,15,40,5,95,70,0,0 // movaps 0x465f(%rip),%xmm8 # 4a00 <_sk_callback_sse41+0x1b2> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 69,15,40,209 // movaps %xmm9,%xmm10 @@ -21130,7 +21521,7 @@ HIDDEN _sk_xor__sse41 FUNCTION(_sk_xor__sse41) _sk_xor__sse41: .byte 68,15,40,195 // movaps %xmm3,%xmm8 - .byte 15,40,29,192,68,0,0 // movaps 0x44c0(%rip),%xmm3 # 4940 <_sk_callback_sse41+0x1c2> + .byte 15,40,29,144,69,0,0 // movaps 0x4590(%rip),%xmm3 # 4a10 <_sk_callback_sse41+0x1c2> .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 @@ -21178,7 +21569,7 @@ _sk_darken_sse41: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,95,209 // maxps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,43,68,0,0 // movaps 0x442b(%rip),%xmm2 # 4950 <_sk_callback_sse41+0x1d2> + .byte 15,40,21,251,68,0,0 // movaps 0x44fb(%rip),%xmm2 # 4a20 <_sk_callback_sse41+0x1d2> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -21212,7 +21603,7 @@ _sk_lighten_sse41: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,208,67,0,0 // movaps 0x43d0(%rip),%xmm2 # 4960 <_sk_callback_sse41+0x1e2> + .byte 15,40,21,160,68,0,0 // movaps 0x44a0(%rip),%xmm2 # 4a30 <_sk_callback_sse41+0x1e2> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -21249,7 +21640,7 @@ _sk_difference_sse41: .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,106,67,0,0 // movaps 0x436a(%rip),%xmm2 # 4970 <_sk_callback_sse41+0x1f2> + .byte 15,40,21,58,68,0,0 // movaps 0x443a(%rip),%xmm2 # 4a40 <_sk_callback_sse41+0x1f2> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -21276,7 +21667,7 @@ _sk_exclusion_sse41: .byte 15,89,214 // mulps %xmm6,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,202 // subps %xmm2,%xmm9 - .byte 15,40,13,43,67,0,0 // movaps 0x432b(%rip),%xmm1 # 4980 <_sk_callback_sse41+0x202> + .byte 15,40,13,251,67,0,0 // movaps 0x43fb(%rip),%xmm1 # 4a50 <_sk_callback_sse41+0x202> .byte 15,92,203 // subps %xmm3,%xmm1 .byte 15,89,207 // mulps %xmm7,%xmm1 .byte 15,88,217 // addps %xmm1,%xmm3 @@ -21290,7 +21681,7 @@ HIDDEN _sk_colorburn_sse41 FUNCTION(_sk_colorburn_sse41) _sk_colorburn_sse41: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,21,26,67,0,0 // movaps 0x431a(%rip),%xmm10 # 4990 <_sk_callback_sse41+0x212> + .byte 68,15,40,21,234,67,0,0 // movaps 0x43ea(%rip),%xmm10 # 4a60 <_sk_callback_sse41+0x212> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 69,15,40,203 // movaps %xmm11,%xmm9 @@ -21372,7 +21763,7 @@ HIDDEN _sk_colordodge_sse41 FUNCTION(_sk_colordodge_sse41) _sk_colordodge_sse41: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,21,248,65,0,0 // movaps 0x41f8(%rip),%xmm10 # 49a0 <_sk_callback_sse41+0x222> + .byte 68,15,40,21,200,66,0,0 // movaps 0x42c8(%rip),%xmm10 # 4a70 <_sk_callback_sse41+0x222> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 69,15,40,227 // movaps %xmm11,%xmm12 @@ -21454,7 +21845,7 @@ _sk_hardlight_sse41: .byte 15,40,244 // movaps %xmm4,%xmm6 .byte 15,40,227 // movaps %xmm3,%xmm4 .byte 68,15,40,200 // movaps %xmm0,%xmm9 - .byte 68,15,40,21,209,64,0,0 // movaps 0x40d1(%rip),%xmm10 # 49b0 <_sk_callback_sse41+0x232> + .byte 68,15,40,21,161,65,0,0 // movaps 0x41a1(%rip),%xmm10 # 4a80 <_sk_callback_sse41+0x232> .byte 65,15,40,234 // movaps %xmm10,%xmm5 .byte 15,92,239 // subps %xmm7,%xmm5 .byte 15,40,197 // movaps %xmm5,%xmm0 @@ -21537,7 +21928,7 @@ FUNCTION(_sk_overlay_sse41) _sk_overlay_sse41: .byte 68,15,40,201 // movaps %xmm1,%xmm9 .byte 68,15,40,240 // movaps %xmm0,%xmm14 - .byte 68,15,40,21,182,63,0,0 // movaps 0x3fb6(%rip),%xmm10 # 49c0 <_sk_callback_sse41+0x242> + .byte 68,15,40,21,134,64,0,0 // movaps 0x4086(%rip),%xmm10 # 4a90 <_sk_callback_sse41+0x242> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 65,15,40,195 // movaps %xmm11,%xmm0 @@ -21622,7 +22013,7 @@ _sk_softlight_sse41: .byte 15,40,198 // movaps %xmm6,%xmm0 .byte 15,94,199 // divps %xmm7,%xmm0 .byte 65,15,84,193 // andps %xmm9,%xmm0 - .byte 15,40,13,141,62,0,0 // movaps 0x3e8d(%rip),%xmm1 # 49d0 <_sk_callback_sse41+0x252> + .byte 15,40,13,93,63,0,0 // movaps 0x3f5d(%rip),%xmm1 # 4aa0 <_sk_callback_sse41+0x252> .byte 68,15,40,209 // movaps %xmm1,%xmm10 .byte 68,15,92,208 // subps %xmm0,%xmm10 .byte 68,15,40,240 // movaps %xmm0,%xmm14 @@ -21635,10 +22026,10 @@ _sk_softlight_sse41: .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,89,210 // mulps %xmm2,%xmm2 .byte 15,88,208 // addps %xmm0,%xmm2 - .byte 68,15,40,45,107,62,0,0 // movaps 0x3e6b(%rip),%xmm13 # 49e0 <_sk_callback_sse41+0x262> + .byte 68,15,40,45,59,63,0,0 // movaps 0x3f3b(%rip),%xmm13 # 4ab0 <_sk_callback_sse41+0x262> .byte 69,15,88,245 // addps %xmm13,%xmm14 .byte 68,15,89,242 // mulps %xmm2,%xmm14 - .byte 68,15,40,37,107,62,0,0 // movaps 0x3e6b(%rip),%xmm12 # 49f0 <_sk_callback_sse41+0x272> + .byte 68,15,40,37,59,63,0,0 // movaps 0x3f3b(%rip),%xmm12 # 4ac0 <_sk_callback_sse41+0x272> .byte 69,15,89,252 // mulps %xmm12,%xmm15 .byte 69,15,88,254 // addps %xmm14,%xmm15 .byte 15,40,198 // movaps %xmm6,%xmm0 @@ -21824,12 +22215,12 @@ _sk_hue_sse41: .byte 68,15,84,208 // andps %xmm0,%xmm10 .byte 15,84,200 // andps %xmm0,%xmm1 .byte 68,15,84,232 // andps %xmm0,%xmm13 - .byte 15,40,5,214,59,0,0 // movaps 0x3bd6(%rip),%xmm0 # 4a00 <_sk_callback_sse41+0x282> + .byte 15,40,5,166,60,0,0 // movaps 0x3ca6(%rip),%xmm0 # 4ad0 <_sk_callback_sse41+0x282> .byte 68,15,89,224 // mulps %xmm0,%xmm12 - .byte 15,40,21,219,59,0,0 // movaps 0x3bdb(%rip),%xmm2 # 4a10 <_sk_callback_sse41+0x292> + .byte 15,40,21,171,60,0,0 // movaps 0x3cab(%rip),%xmm2 # 4ae0 <_sk_callback_sse41+0x292> .byte 15,89,250 // mulps %xmm2,%xmm7 .byte 65,15,88,252 // addps %xmm12,%xmm7 - .byte 68,15,40,53,220,59,0,0 // movaps 0x3bdc(%rip),%xmm14 # 4a20 <_sk_callback_sse41+0x2a2> + .byte 68,15,40,53,172,60,0,0 // movaps 0x3cac(%rip),%xmm14 # 4af0 <_sk_callback_sse41+0x2a2> .byte 68,15,40,252 // movaps %xmm4,%xmm15 .byte 69,15,89,254 // mulps %xmm14,%xmm15 .byte 68,15,88,255 // addps %xmm7,%xmm15 @@ -21912,7 +22303,7 @@ _sk_hue_sse41: .byte 65,15,88,214 // addps %xmm14,%xmm2 .byte 15,40,196 // movaps %xmm4,%xmm0 .byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1 - .byte 68,15,40,13,160,58,0,0 // movaps 0x3aa0(%rip),%xmm9 # 4a30 <_sk_callback_sse41+0x2b2> + .byte 68,15,40,13,112,59,0,0 // movaps 0x3b70(%rip),%xmm9 # 4b00 <_sk_callback_sse41+0x2b2> .byte 65,15,40,225 // movaps %xmm9,%xmm4 .byte 15,92,229 // subps %xmm5,%xmm4 .byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0 @@ -22006,14 +22397,14 @@ _sk_saturation_sse41: .byte 68,15,84,215 // andps %xmm7,%xmm10 .byte 68,15,84,223 // andps %xmm7,%xmm11 .byte 68,15,84,199 // andps %xmm7,%xmm8 - .byte 15,40,21,90,57,0,0 // movaps 0x395a(%rip),%xmm2 # 4a40 <_sk_callback_sse41+0x2c2> + .byte 15,40,21,42,58,0,0 // movaps 0x3a2a(%rip),%xmm2 # 4b10 <_sk_callback_sse41+0x2c2> .byte 15,40,221 // movaps %xmm5,%xmm3 .byte 15,89,218 // mulps %xmm2,%xmm3 - .byte 15,40,13,93,57,0,0 // movaps 0x395d(%rip),%xmm1 # 4a50 <_sk_callback_sse41+0x2d2> + .byte 15,40,13,45,58,0,0 // movaps 0x3a2d(%rip),%xmm1 # 4b20 <_sk_callback_sse41+0x2d2> .byte 15,40,254 // movaps %xmm6,%xmm7 .byte 15,89,249 // mulps %xmm1,%xmm7 .byte 15,88,251 // addps %xmm3,%xmm7 - .byte 68,15,40,45,92,57,0,0 // movaps 0x395c(%rip),%xmm13 # 4a60 <_sk_callback_sse41+0x2e2> + .byte 68,15,40,45,44,58,0,0 // movaps 0x3a2c(%rip),%xmm13 # 4b30 <_sk_callback_sse41+0x2e2> .byte 69,15,89,245 // mulps %xmm13,%xmm14 .byte 68,15,88,247 // addps %xmm7,%xmm14 .byte 65,15,40,218 // movaps %xmm10,%xmm3 @@ -22094,7 +22485,7 @@ _sk_saturation_sse41: .byte 65,15,88,253 // addps %xmm13,%xmm7 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11 - .byte 68,15,40,13,34,56,0,0 // movaps 0x3822(%rip),%xmm9 # 4a70 <_sk_callback_sse41+0x2f2> + .byte 68,15,40,13,242,56,0,0 // movaps 0x38f2(%rip),%xmm9 # 4b40 <_sk_callback_sse41+0x2f2> .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 68,15,92,204 // subps %xmm4,%xmm9 .byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7 @@ -22149,14 +22540,14 @@ _sk_color_sse41: .byte 15,40,231 // movaps %xmm7,%xmm4 .byte 68,15,89,244 // mulps %xmm4,%xmm14 .byte 15,89,204 // mulps %xmm4,%xmm1 - .byte 68,15,40,13,109,55,0,0 // movaps 0x376d(%rip),%xmm9 # 4a80 <_sk_callback_sse41+0x302> + .byte 68,15,40,13,61,56,0,0 // movaps 0x383d(%rip),%xmm9 # 4b50 <_sk_callback_sse41+0x302> .byte 65,15,40,250 // movaps %xmm10,%xmm7 .byte 65,15,89,249 // mulps %xmm9,%xmm7 - .byte 68,15,40,21,109,55,0,0 // movaps 0x376d(%rip),%xmm10 # 4a90 <_sk_callback_sse41+0x312> + .byte 68,15,40,21,61,56,0,0 // movaps 0x383d(%rip),%xmm10 # 4b60 <_sk_callback_sse41+0x312> .byte 65,15,40,219 // movaps %xmm11,%xmm3 .byte 65,15,89,218 // mulps %xmm10,%xmm3 .byte 15,88,223 // addps %xmm7,%xmm3 - .byte 68,15,40,29,106,55,0,0 // movaps 0x376a(%rip),%xmm11 # 4aa0 <_sk_callback_sse41+0x322> + .byte 68,15,40,29,58,56,0,0 // movaps 0x383a(%rip),%xmm11 # 4b70 <_sk_callback_sse41+0x322> .byte 69,15,40,236 // movaps %xmm12,%xmm13 .byte 69,15,89,235 // mulps %xmm11,%xmm13 .byte 68,15,88,235 // addps %xmm3,%xmm13 @@ -22241,7 +22632,7 @@ _sk_color_sse41: .byte 65,15,88,251 // addps %xmm11,%xmm7 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1 - .byte 68,15,40,13,38,54,0,0 // movaps 0x3626(%rip),%xmm9 # 4ab0 <_sk_callback_sse41+0x332> + .byte 68,15,40,13,246,54,0,0 // movaps 0x36f6(%rip),%xmm9 # 4b80 <_sk_callback_sse41+0x332> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,92,196 // subps %xmm4,%xmm0 .byte 68,15,89,192 // mulps %xmm0,%xmm8 @@ -22293,13 +22684,13 @@ _sk_luminosity_sse41: .byte 69,15,89,216 // mulps %xmm8,%xmm11 .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,89,205 // mulps %xmm5,%xmm9 - .byte 68,15,40,5,126,53,0,0 // movaps 0x357e(%rip),%xmm8 # 4ac0 <_sk_callback_sse41+0x342> + .byte 68,15,40,5,78,54,0,0 // movaps 0x364e(%rip),%xmm8 # 4b90 <_sk_callback_sse41+0x342> .byte 65,15,89,192 // mulps %xmm8,%xmm0 - .byte 68,15,40,21,130,53,0,0 // movaps 0x3582(%rip),%xmm10 # 4ad0 <_sk_callback_sse41+0x352> + .byte 68,15,40,21,82,54,0,0 // movaps 0x3652(%rip),%xmm10 # 4ba0 <_sk_callback_sse41+0x352> .byte 15,40,233 // movaps %xmm1,%xmm5 .byte 65,15,89,234 // mulps %xmm10,%xmm5 .byte 15,88,232 // addps %xmm0,%xmm5 - .byte 68,15,40,37,128,53,0,0 // movaps 0x3580(%rip),%xmm12 # 4ae0 <_sk_callback_sse41+0x362> + .byte 68,15,40,37,80,54,0,0 // movaps 0x3650(%rip),%xmm12 # 4bb0 <_sk_callback_sse41+0x362> .byte 68,15,40,242 // movaps %xmm2,%xmm14 .byte 69,15,89,244 // mulps %xmm12,%xmm14 .byte 68,15,88,245 // addps %xmm5,%xmm14 @@ -22384,7 +22775,7 @@ _sk_luminosity_sse41: .byte 65,15,88,244 // addps %xmm12,%xmm6 .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9 - .byte 15,40,5,54,52,0,0 // movaps 0x3436(%rip),%xmm0 # 4af0 <_sk_callback_sse41+0x372> + .byte 15,40,5,6,53,0,0 // movaps 0x3506(%rip),%xmm0 # 4bc0 <_sk_callback_sse41+0x372> .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,92,215 // subps %xmm7,%xmm2 .byte 15,89,226 // mulps %xmm2,%xmm4 @@ -22417,6 +22808,60 @@ _sk_luminosity_sse41: .byte 65,15,40,226 // movaps %xmm10,%xmm4 .byte 255,224 // jmpq *%rax +HIDDEN _sk_srcover_rgba_8888_sse41 +.globl _sk_srcover_rgba_8888_sse41 +FUNCTION(_sk_srcover_rgba_8888_sse41) +_sk_srcover_rgba_8888_sse41: + .byte 68,15,40,195 // movaps %xmm3,%xmm8 + .byte 68,15,40,201 // movaps %xmm1,%xmm9 + .byte 15,40,200 // movaps %xmm0,%xmm1 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 72,139,0 // mov (%rax),%rax + .byte 15,16,4,184 // movups (%rax,%rdi,4),%xmm0 + .byte 15,40,29,142,52,0,0 // movaps 0x348e(%rip),%xmm3 # 4bd0 <_sk_callback_sse41+0x382> + .byte 15,84,216 // andps %xmm0,%xmm3 + .byte 15,91,227 // cvtdq2ps %xmm3,%xmm4 + .byte 15,40,216 // movaps %xmm0,%xmm3 + .byte 102,15,56,0,29,140,52,0,0 // pshufb 0x348c(%rip),%xmm3 # 4be0 <_sk_callback_sse41+0x392> + .byte 15,91,235 // cvtdq2ps %xmm3,%xmm5 + .byte 15,40,216 // movaps %xmm0,%xmm3 + .byte 102,15,56,0,29,141,52,0,0 // pshufb 0x348d(%rip),%xmm3 # 4bf0 <_sk_callback_sse41+0x3a2> + .byte 15,91,243 // cvtdq2ps %xmm3,%xmm6 + .byte 102,15,114,208,24 // psrld $0x18,%xmm0 + .byte 15,91,248 // cvtdq2ps %xmm0,%xmm7 + .byte 15,40,29,139,52,0,0 // movaps 0x348b(%rip),%xmm3 # 4c00 <_sk_callback_sse41+0x3b2> + .byte 65,15,92,216 // subps %xmm8,%xmm3 + .byte 68,15,40,21,143,52,0,0 // movaps 0x348f(%rip),%xmm10 # 4c10 <_sk_callback_sse41+0x3c2> + .byte 65,15,89,202 // mulps %xmm10,%xmm1 + .byte 15,40,195 // movaps %xmm3,%xmm0 + .byte 15,89,196 // mulps %xmm4,%xmm0 + .byte 15,88,193 // addps %xmm1,%xmm0 + .byte 69,15,89,202 // mulps %xmm10,%xmm9 + .byte 15,40,203 // movaps %xmm3,%xmm1 + .byte 15,89,205 // mulps %xmm5,%xmm1 + .byte 65,15,88,201 // addps %xmm9,%xmm1 + .byte 65,15,89,210 // mulps %xmm10,%xmm2 + .byte 68,15,40,203 // movaps %xmm3,%xmm9 + .byte 68,15,89,206 // mulps %xmm6,%xmm9 + .byte 68,15,88,202 // addps %xmm2,%xmm9 + .byte 69,15,89,194 // mulps %xmm10,%xmm8 + .byte 15,89,223 // mulps %xmm7,%xmm3 + .byte 65,15,88,216 // addps %xmm8,%xmm3 + .byte 102,68,15,91,192 // cvtps2dq %xmm0,%xmm8 + .byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10 + .byte 102,65,15,114,242,8 // pslld $0x8,%xmm10 + .byte 102,69,15,235,208 // por %xmm8,%xmm10 + .byte 102,69,15,91,193 // cvtps2dq %xmm9,%xmm8 + .byte 102,65,15,114,240,16 // pslld $0x10,%xmm8 + .byte 102,15,91,211 // cvtps2dq %xmm3,%xmm2 + .byte 102,15,114,242,24 // pslld $0x18,%xmm2 + .byte 102,65,15,235,208 // por %xmm8,%xmm2 + .byte 102,65,15,235,210 // por %xmm10,%xmm2 + .byte 243,15,127,20,184 // movdqu %xmm2,(%rax,%rdi,4) + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 65,15,40,209 // movaps %xmm9,%xmm2 + .byte 255,224 // jmpq *%rax + HIDDEN _sk_clamp_0_sse41 .globl _sk_clamp_0_sse41 FUNCTION(_sk_clamp_0_sse41) @@ -22433,7 +22878,7 @@ HIDDEN _sk_clamp_1_sse41 .globl _sk_clamp_1_sse41 FUNCTION(_sk_clamp_1_sse41) _sk_clamp_1_sse41: - .byte 68,15,40,5,185,51,0,0 // movaps 0x33b9(%rip),%xmm8 # 4b00 <_sk_callback_sse41+0x382> + .byte 68,15,40,5,9,52,0,0 // movaps 0x3409(%rip),%xmm8 # 4c20 <_sk_callback_sse41+0x3d2> .byte 65,15,93,192 // minps %xmm8,%xmm0 .byte 65,15,93,200 // minps %xmm8,%xmm1 .byte 65,15,93,208 // minps %xmm8,%xmm2 @@ -22445,7 +22890,7 @@ HIDDEN _sk_clamp_a_sse41 .globl _sk_clamp_a_sse41 FUNCTION(_sk_clamp_a_sse41) _sk_clamp_a_sse41: - .byte 15,93,29,174,51,0,0 // minps 0x33ae(%rip),%xmm3 # 4b10 <_sk_callback_sse41+0x392> + .byte 15,93,29,254,51,0,0 // minps 0x33fe(%rip),%xmm3 # 4c30 <_sk_callback_sse41+0x3e2> .byte 15,93,195 // minps %xmm3,%xmm0 .byte 15,93,203 // minps %xmm3,%xmm1 .byte 15,93,211 // minps %xmm3,%xmm2 @@ -22532,7 +22977,7 @@ HIDDEN _sk_unpremul_sse41 FUNCTION(_sk_unpremul_sse41) _sk_unpremul_sse41: .byte 69,15,87,192 // xorps %xmm8,%xmm8 - .byte 68,15,40,13,25,51,0,0 // movaps 0x3319(%rip),%xmm9 # 4b20 <_sk_callback_sse41+0x3a2> + .byte 68,15,40,13,105,51,0,0 // movaps 0x3369(%rip),%xmm9 # 4c40 <_sk_callback_sse41+0x3f2> .byte 68,15,94,203 // divps %xmm3,%xmm9 .byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8 .byte 69,15,84,193 // andps %xmm9,%xmm8 @@ -22546,20 +22991,20 @@ HIDDEN _sk_from_srgb_sse41 .globl _sk_from_srgb_sse41 FUNCTION(_sk_from_srgb_sse41) _sk_from_srgb_sse41: - .byte 68,15,40,29,4,51,0,0 // movaps 0x3304(%rip),%xmm11 # 4b30 <_sk_callback_sse41+0x3b2> + .byte 68,15,40,29,84,51,0,0 // movaps 0x3354(%rip),%xmm11 # 4c50 <_sk_callback_sse41+0x402> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 .byte 68,15,40,208 // movaps %xmm0,%xmm10 .byte 69,15,89,210 // mulps %xmm10,%xmm10 - .byte 68,15,40,37,252,50,0,0 // movaps 0x32fc(%rip),%xmm12 # 4b40 <_sk_callback_sse41+0x3c2> + .byte 68,15,40,37,76,51,0,0 // movaps 0x334c(%rip),%xmm12 # 4c60 <_sk_callback_sse41+0x412> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,196 // mulps %xmm12,%xmm8 - .byte 68,15,40,45,252,50,0,0 // movaps 0x32fc(%rip),%xmm13 # 4b50 <_sk_callback_sse41+0x3d2> + .byte 68,15,40,45,76,51,0,0 // movaps 0x334c(%rip),%xmm13 # 4c70 <_sk_callback_sse41+0x422> .byte 69,15,88,197 // addps %xmm13,%xmm8 .byte 69,15,89,194 // mulps %xmm10,%xmm8 - .byte 68,15,40,53,252,50,0,0 // movaps 0x32fc(%rip),%xmm14 # 4b60 <_sk_callback_sse41+0x3e2> + .byte 68,15,40,53,76,51,0,0 // movaps 0x334c(%rip),%xmm14 # 4c80 <_sk_callback_sse41+0x432> .byte 69,15,88,198 // addps %xmm14,%xmm8 - .byte 68,15,40,61,0,51,0,0 // movaps 0x3300(%rip),%xmm15 # 4b70 <_sk_callback_sse41+0x3f2> + .byte 68,15,40,61,80,51,0,0 // movaps 0x3350(%rip),%xmm15 # 4c90 <_sk_callback_sse41+0x442> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 68,15,40,209 // movaps %xmm1,%xmm10 @@ -22602,22 +23047,22 @@ _sk_to_srgb_sse41: .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 68,15,82,192 // rsqrtps %xmm0,%xmm8 - .byte 68,15,40,29,120,50,0,0 // movaps 0x3278(%rip),%xmm11 # 4b80 <_sk_callback_sse41+0x402> + .byte 68,15,40,29,200,50,0,0 // movaps 0x32c8(%rip),%xmm11 # 4ca0 <_sk_callback_sse41+0x452> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 - .byte 68,15,40,37,120,50,0,0 // movaps 0x3278(%rip),%xmm12 # 4b90 <_sk_callback_sse41+0x412> + .byte 68,15,40,37,200,50,0,0 // movaps 0x32c8(%rip),%xmm12 # 4cb0 <_sk_callback_sse41+0x462> .byte 69,15,40,248 // movaps %xmm8,%xmm15 .byte 69,15,89,252 // mulps %xmm12,%xmm15 - .byte 68,15,40,21,120,50,0,0 // movaps 0x3278(%rip),%xmm10 # 4ba0 <_sk_callback_sse41+0x422> + .byte 68,15,40,21,200,50,0,0 // movaps 0x32c8(%rip),%xmm10 # 4cc0 <_sk_callback_sse41+0x472> .byte 69,15,88,250 // addps %xmm10,%xmm15 .byte 69,15,89,248 // mulps %xmm8,%xmm15 - .byte 68,15,40,45,120,50,0,0 // movaps 0x3278(%rip),%xmm13 # 4bb0 <_sk_callback_sse41+0x432> + .byte 68,15,40,45,200,50,0,0 // movaps 0x32c8(%rip),%xmm13 # 4cd0 <_sk_callback_sse41+0x482> .byte 69,15,88,253 // addps %xmm13,%xmm15 - .byte 68,15,40,53,124,50,0,0 // movaps 0x327c(%rip),%xmm14 # 4bc0 <_sk_callback_sse41+0x442> + .byte 68,15,40,53,204,50,0,0 // movaps 0x32cc(%rip),%xmm14 # 4ce0 <_sk_callback_sse41+0x492> .byte 69,15,88,198 // addps %xmm14,%xmm8 .byte 69,15,83,192 // rcpps %xmm8,%xmm8 .byte 69,15,89,199 // mulps %xmm15,%xmm8 - .byte 68,15,40,61,120,50,0,0 // movaps 0x3278(%rip),%xmm15 # 4bd0 <_sk_callback_sse41+0x452> + .byte 68,15,40,61,200,50,0,0 // movaps 0x32c8(%rip),%xmm15 # 4cf0 <_sk_callback_sse41+0x4a2> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 68,15,82,202 // rsqrtps %xmm2,%xmm9 @@ -22670,7 +23115,7 @@ _sk_rgb_to_hsl_sse41: .byte 68,15,93,226 // minps %xmm2,%xmm12 .byte 65,15,40,203 // movaps %xmm11,%xmm1 .byte 65,15,92,204 // subps %xmm12,%xmm1 - .byte 68,15,40,53,197,49,0,0 // movaps 0x31c5(%rip),%xmm14 # 4be0 <_sk_callback_sse41+0x462> + .byte 68,15,40,53,21,50,0,0 // movaps 0x3215(%rip),%xmm14 # 4d00 <_sk_callback_sse41+0x4b2> .byte 68,15,94,241 // divps %xmm1,%xmm14 .byte 69,15,40,211 // movaps %xmm11,%xmm10 .byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10 @@ -22679,27 +23124,27 @@ _sk_rgb_to_hsl_sse41: .byte 65,15,89,198 // mulps %xmm14,%xmm0 .byte 69,15,40,249 // movaps %xmm9,%xmm15 .byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15 - .byte 68,15,84,61,172,49,0,0 // andps 0x31ac(%rip),%xmm15 # 4bf0 <_sk_callback_sse41+0x472> + .byte 68,15,84,61,252,49,0,0 // andps 0x31fc(%rip),%xmm15 # 4d10 <_sk_callback_sse41+0x4c2> .byte 68,15,88,248 // addps %xmm0,%xmm15 .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0 .byte 65,15,92,208 // subps %xmm8,%xmm2 .byte 65,15,89,214 // mulps %xmm14,%xmm2 - .byte 68,15,40,45,159,49,0,0 // movaps 0x319f(%rip),%xmm13 # 4c00 <_sk_callback_sse41+0x482> + .byte 68,15,40,45,239,49,0,0 // movaps 0x31ef(%rip),%xmm13 # 4d20 <_sk_callback_sse41+0x4d2> .byte 65,15,88,213 // addps %xmm13,%xmm2 .byte 69,15,92,193 // subps %xmm9,%xmm8 .byte 69,15,89,198 // mulps %xmm14,%xmm8 - .byte 68,15,88,5,155,49,0,0 // addps 0x319b(%rip),%xmm8 # 4c10 <_sk_callback_sse41+0x492> + .byte 68,15,88,5,235,49,0,0 // addps 0x31eb(%rip),%xmm8 # 4d30 <_sk_callback_sse41+0x4e2> .byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8 - .byte 68,15,89,5,147,49,0,0 // mulps 0x3193(%rip),%xmm8 # 4c20 <_sk_callback_sse41+0x4a2> + .byte 68,15,89,5,227,49,0,0 // mulps 0x31e3(%rip),%xmm8 # 4d40 <_sk_callback_sse41+0x4f2> .byte 69,15,40,203 // movaps %xmm11,%xmm9 .byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9 .byte 69,15,84,193 // andps %xmm9,%xmm8 .byte 69,15,92,235 // subps %xmm11,%xmm13 .byte 69,15,88,220 // addps %xmm12,%xmm11 - .byte 15,40,5,135,49,0,0 // movaps 0x3187(%rip),%xmm0 # 4c30 <_sk_callback_sse41+0x4b2> + .byte 15,40,5,215,49,0,0 // movaps 0x31d7(%rip),%xmm0 # 4d50 <_sk_callback_sse41+0x502> .byte 65,15,40,211 // movaps %xmm11,%xmm2 .byte 15,89,208 // mulps %xmm0,%xmm2 .byte 15,194,194,1 // cmpltps %xmm2,%xmm0 @@ -22721,7 +23166,7 @@ _sk_hsl_to_rgb_sse41: .byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp) .byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp) .byte 68,15,40,208 // movaps %xmm0,%xmm10 - .byte 68,15,40,13,77,49,0,0 // movaps 0x314d(%rip),%xmm9 # 4c40 <_sk_callback_sse41+0x4c2> + .byte 68,15,40,13,157,49,0,0 // movaps 0x319d(%rip),%xmm9 # 4d60 <_sk_callback_sse41+0x512> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,194,194,2 // cmpleps %xmm2,%xmm0 .byte 15,40,217 // movaps %xmm1,%xmm3 @@ -22734,19 +23179,19 @@ _sk_hsl_to_rgb_sse41: .byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp) .byte 69,15,88,192 // addps %xmm8,%xmm8 .byte 68,15,92,197 // subps %xmm5,%xmm8 - .byte 68,15,40,53,40,49,0,0 // movaps 0x3128(%rip),%xmm14 # 4c50 <_sk_callback_sse41+0x4d2> + .byte 68,15,40,53,120,49,0,0 // movaps 0x3178(%rip),%xmm14 # 4d70 <_sk_callback_sse41+0x522> .byte 69,15,88,242 // addps %xmm10,%xmm14 .byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0 .byte 68,15,92,240 // subps %xmm0,%xmm14 - .byte 68,15,40,29,33,49,0,0 // movaps 0x3121(%rip),%xmm11 # 4c60 <_sk_callback_sse41+0x4e2> + .byte 68,15,40,29,113,49,0,0 // movaps 0x3171(%rip),%xmm11 # 4d80 <_sk_callback_sse41+0x532> .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 15,40,245 // movaps %xmm5,%xmm6 .byte 65,15,92,240 // subps %xmm8,%xmm6 - .byte 15,40,61,26,49,0,0 // movaps 0x311a(%rip),%xmm7 # 4c70 <_sk_callback_sse41+0x4f2> + .byte 15,40,61,106,49,0,0 // movaps 0x316a(%rip),%xmm7 # 4d90 <_sk_callback_sse41+0x542> .byte 69,15,40,238 // movaps %xmm14,%xmm13 .byte 68,15,89,239 // mulps %xmm7,%xmm13 - .byte 15,40,29,27,49,0,0 // movaps 0x311b(%rip),%xmm3 # 4c80 <_sk_callback_sse41+0x502> + .byte 15,40,29,107,49,0,0 // movaps 0x316b(%rip),%xmm3 # 4da0 <_sk_callback_sse41+0x552> .byte 68,15,40,227 // movaps %xmm3,%xmm12 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 68,15,89,230 // mulps %xmm6,%xmm12 @@ -22756,7 +23201,7 @@ _sk_hsl_to_rgb_sse41: .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 68,15,40,253 // movaps %xmm5,%xmm15 .byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15 - .byte 68,15,40,37,250,48,0,0 // movaps 0x30fa(%rip),%xmm12 # 4c90 <_sk_callback_sse41+0x512> + .byte 68,15,40,37,74,49,0,0 // movaps 0x314a(%rip),%xmm12 # 4db0 <_sk_callback_sse41+0x562> .byte 65,15,40,196 // movaps %xmm12,%xmm0 .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 68,15,89,238 // mulps %xmm6,%xmm13 @@ -22790,7 +23235,7 @@ _sk_hsl_to_rgb_sse41: .byte 65,15,40,198 // movaps %xmm14,%xmm0 .byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2 .byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1 - .byte 68,15,88,21,114,48,0,0 // addps 0x3072(%rip),%xmm10 # 4ca0 <_sk_callback_sse41+0x522> + .byte 68,15,88,21,194,48,0,0 // addps 0x30c2(%rip),%xmm10 # 4dc0 <_sk_callback_sse41+0x572> .byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0 .byte 68,15,92,208 // subps %xmm0,%xmm10 .byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11 @@ -22842,7 +23287,7 @@ _sk_scale_u8_sse41: .byte 72,139,0 // mov (%rax),%rax .byte 102,68,15,56,49,4,56 // pmovzxbd (%rax,%rdi,1),%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,207,47,0,0 // mulps 0x2fcf(%rip),%xmm8 # 4cb0 <_sk_callback_sse41+0x532> + .byte 68,15,89,5,31,48,0,0 // mulps 0x301f(%rip),%xmm8 # 4dd0 <_sk_callback_sse41+0x582> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 @@ -22880,7 +23325,7 @@ _sk_lerp_u8_sse41: .byte 72,139,0 // mov (%rax),%rax .byte 102,68,15,56,49,4,56 // pmovzxbd (%rax,%rdi,1),%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,123,47,0,0 // mulps 0x2f7b(%rip),%xmm8 # 4cc0 <_sk_callback_sse41+0x542> + .byte 68,15,89,5,203,47,0,0 // mulps 0x2fcb(%rip),%xmm8 # 4de0 <_sk_callback_sse41+0x592> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -22903,17 +23348,17 @@ _sk_lerp_565_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 102,68,15,56,51,20,120 // pmovzxwd (%rax,%rdi,2),%xmm10 - .byte 102,68,15,111,5,74,47,0,0 // movdqa 0x2f4a(%rip),%xmm8 # 4cd0 <_sk_callback_sse41+0x552> + .byte 102,68,15,111,5,154,47,0,0 // movdqa 0x2f9a(%rip),%xmm8 # 4df0 <_sk_callback_sse41+0x5a2> .byte 102,69,15,219,194 // pand %xmm10,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,73,47,0,0 // mulps 0x2f49(%rip),%xmm8 # 4ce0 <_sk_callback_sse41+0x562> - .byte 102,68,15,111,13,80,47,0,0 // movdqa 0x2f50(%rip),%xmm9 # 4cf0 <_sk_callback_sse41+0x572> + .byte 68,15,89,5,153,47,0,0 // mulps 0x2f99(%rip),%xmm8 # 4e00 <_sk_callback_sse41+0x5b2> + .byte 102,68,15,111,13,160,47,0,0 // movdqa 0x2fa0(%rip),%xmm9 # 4e10 <_sk_callback_sse41+0x5c2> .byte 102,69,15,219,202 // pand %xmm10,%xmm9 .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9 - .byte 68,15,89,13,79,47,0,0 // mulps 0x2f4f(%rip),%xmm9 # 4d00 <_sk_callback_sse41+0x582> - .byte 102,68,15,219,21,86,47,0,0 // pand 0x2f56(%rip),%xmm10 # 4d10 <_sk_callback_sse41+0x592> + .byte 68,15,89,13,159,47,0,0 // mulps 0x2f9f(%rip),%xmm9 # 4e20 <_sk_callback_sse41+0x5d2> + .byte 102,68,15,219,21,166,47,0,0 // pand 0x2fa6(%rip),%xmm10 # 4e30 <_sk_callback_sse41+0x5e2> .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 - .byte 68,15,89,21,90,47,0,0 // mulps 0x2f5a(%rip),%xmm10 # 4d20 <_sk_callback_sse41+0x5a2> + .byte 68,15,89,21,170,47,0,0 // mulps 0x2faa(%rip),%xmm10 # 4e40 <_sk_callback_sse41+0x5f2> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -22944,7 +23389,7 @@ _sk_load_tables_sse41: .byte 76,139,0 // mov (%rax),%r8 .byte 76,139,72,8 // mov 0x8(%rax),%r9 .byte 243,69,15,111,4,184 // movdqu (%r8,%rdi,4),%xmm8 - .byte 102,15,111,5,11,47,0,0 // movdqa 0x2f0b(%rip),%xmm0 # 4d30 <_sk_callback_sse41+0x5b2> + .byte 102,15,111,5,91,47,0,0 // movdqa 0x2f5b(%rip),%xmm0 # 4e50 <_sk_callback_sse41+0x602> .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,73,15,58,22,192,1 // pextrq $0x1,%xmm0,%r8 .byte 102,72,15,126,193 // movq %xmm0,%rcx @@ -22959,7 +23404,7 @@ _sk_load_tables_sse41: .byte 102,15,58,33,193,48 // insertps $0x30,%xmm1,%xmm0 .byte 76,139,64,16 // mov 0x10(%rax),%r8 .byte 102,65,15,111,200 // movdqa %xmm8,%xmm1 - .byte 102,15,56,0,13,198,46,0,0 // pshufb 0x2ec6(%rip),%xmm1 # 4d40 <_sk_callback_sse41+0x5c2> + .byte 102,15,56,0,13,22,47,0,0 // pshufb 0x2f16(%rip),%xmm1 # 4e60 <_sk_callback_sse41+0x612> .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,201 // movq %xmm1,%rcx .byte 68,15,182,209 // movzbl %cl,%r10d @@ -22974,7 +23419,7 @@ _sk_load_tables_sse41: .byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1 .byte 76,139,64,24 // mov 0x18(%rax),%r8 .byte 102,65,15,111,208 // movdqa %xmm8,%xmm2 - .byte 102,15,56,0,21,130,46,0,0 // pshufb 0x2e82(%rip),%xmm2 # 4d50 <_sk_callback_sse41+0x5d2> + .byte 102,15,56,0,21,210,46,0,0 // pshufb 0x2ed2(%rip),%xmm2 # 4e70 <_sk_callback_sse41+0x622> .byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx .byte 102,72,15,126,208 // movq %xmm2,%rax .byte 68,15,182,200 // movzbl %al,%r9d @@ -22989,7 +23434,7 @@ _sk_load_tables_sse41: .byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2 .byte 102,65,15,114,208,24 // psrld $0x18,%xmm8 .byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3 - .byte 15,89,29,63,46,0,0 // mulps 0x2e3f(%rip),%xmm3 # 4d60 <_sk_callback_sse41+0x5e2> + .byte 15,89,29,143,46,0,0 // mulps 0x2e8f(%rip),%xmm3 # 4e80 <_sk_callback_sse41+0x632> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -23008,7 +23453,7 @@ _sk_load_tables_u16_be_sse41: .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 - .byte 102,68,15,111,5,18,46,0,0 // movdqa 0x2e12(%rip),%xmm8 # 4d70 <_sk_callback_sse41+0x5f2> + .byte 102,68,15,111,5,98,46,0,0 // movdqa 0x2e62(%rip),%xmm8 # 4e90 <_sk_callback_sse41+0x642> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 @@ -23025,7 +23470,7 @@ _sk_load_tables_u16_be_sse41: .byte 243,67,15,16,20,8 // movss (%r8,%r9,1),%xmm2 .byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0 .byte 76,139,64,16 // mov 0x10(%rax),%r8 - .byte 102,15,56,0,13,197,45,0,0 // pshufb 0x2dc5(%rip),%xmm1 # 4d80 <_sk_callback_sse41+0x602> + .byte 102,15,56,0,13,21,46,0,0 // pshufb 0x2e15(%rip),%xmm1 # 4ea0 <_sk_callback_sse41+0x652> .byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1 .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,201 // movq %xmm1,%rcx @@ -23061,7 +23506,7 @@ _sk_load_tables_u16_be_sse41: .byte 102,65,15,235,216 // por %xmm8,%xmm3 .byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,19,45,0,0 // mulps 0x2d13(%rip),%xmm3 # 4d90 <_sk_callback_sse41+0x612> + .byte 15,89,29,99,45,0,0 // mulps 0x2d63(%rip),%xmm3 # 4eb0 <_sk_callback_sse41+0x662> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -23083,7 +23528,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9 .byte 102,15,111,202 // movdqa %xmm2,%xmm1 .byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1 - .byte 102,68,15,111,5,213,44,0,0 // movdqa 0x2cd5(%rip),%xmm8 # 4da0 <_sk_callback_sse41+0x622> + .byte 102,68,15,111,5,37,45,0,0 // movdqa 0x2d25(%rip),%xmm8 # 4ec0 <_sk_callback_sse41+0x672> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 @@ -23100,7 +23545,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 243,67,15,16,28,8 // movss (%r8,%r9,1),%xmm3 .byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0 .byte 76,139,64,16 // mov 0x10(%rax),%r8 - .byte 102,15,56,0,13,136,44,0,0 // pshufb 0x2c88(%rip),%xmm1 # 4db0 <_sk_callback_sse41+0x632> + .byte 102,15,56,0,13,216,44,0,0 // pshufb 0x2cd8(%rip),%xmm1 # 4ed0 <_sk_callback_sse41+0x682> .byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1 .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,201 // movq %xmm1,%rcx @@ -23131,7 +23576,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 243,65,15,16,28,8 // movss (%r8,%rcx,1),%xmm3 .byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,243,43,0,0 // movaps 0x2bf3(%rip),%xmm3 # 4dc0 <_sk_callback_sse41+0x642> + .byte 15,40,29,67,44,0,0 // movaps 0x2c43(%rip),%xmm3 # 4ee0 <_sk_callback_sse41+0x692> .byte 255,224 // jmpq *%rax HIDDEN _sk_byte_tables_sse41 @@ -23141,7 +23586,7 @@ _sk_byte_tables_sse41: .byte 65,86 // push %r14 .byte 83 // push %rbx .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,244,43,0,0 // movaps 0x2bf4(%rip),%xmm8 # 4dd0 <_sk_callback_sse41+0x652> + .byte 68,15,40,5,68,44,0,0 // movaps 0x2c44(%rip),%xmm8 # 4ef0 <_sk_callback_sse41+0x6a2> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx @@ -23160,7 +23605,7 @@ _sk_byte_tables_sse41: .byte 102,15,58,32,193,3 // pinsrb $0x3,%ecx,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,13,165,43,0,0 // movaps 0x2ba5(%rip),%xmm9 # 4de0 <_sk_callback_sse41+0x662> + .byte 68,15,40,13,245,43,0,0 // movaps 0x2bf5(%rip),%xmm9 # 4f00 <_sk_callback_sse41+0x6b2> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -23251,7 +23696,7 @@ _sk_byte_tables_rgb_sse41: .byte 102,15,58,32,193,3 // pinsrb $0x3,%ecx,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,13,45,42,0,0 // movaps 0x2a2d(%rip),%xmm9 # 4df0 <_sk_callback_sse41+0x672> + .byte 68,15,40,13,125,42,0,0 // movaps 0x2a7d(%rip),%xmm9 # 4f10 <_sk_callback_sse41+0x6c2> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -23428,31 +23873,31 @@ _sk_parametric_r_sse41: .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8 - .byte 68,15,89,5,132,39,0,0 // mulps 0x2784(%rip),%xmm8 # 4e00 <_sk_callback_sse41+0x682> - .byte 68,15,84,21,140,39,0,0 // andps 0x278c(%rip),%xmm10 # 4e10 <_sk_callback_sse41+0x692> - .byte 68,15,86,21,148,39,0,0 // orps 0x2794(%rip),%xmm10 # 4e20 <_sk_callback_sse41+0x6a2> - .byte 68,15,88,5,156,39,0,0 // addps 0x279c(%rip),%xmm8 # 4e30 <_sk_callback_sse41+0x6b2> - .byte 68,15,40,37,164,39,0,0 // movaps 0x27a4(%rip),%xmm12 # 4e40 <_sk_callback_sse41+0x6c2> + .byte 68,15,89,5,212,39,0,0 // mulps 0x27d4(%rip),%xmm8 # 4f20 <_sk_callback_sse41+0x6d2> + .byte 68,15,84,21,220,39,0,0 // andps 0x27dc(%rip),%xmm10 # 4f30 <_sk_callback_sse41+0x6e2> + .byte 68,15,86,21,228,39,0,0 // orps 0x27e4(%rip),%xmm10 # 4f40 <_sk_callback_sse41+0x6f2> + .byte 68,15,88,5,236,39,0,0 // addps 0x27ec(%rip),%xmm8 # 4f50 <_sk_callback_sse41+0x702> + .byte 68,15,40,37,244,39,0,0 // movaps 0x27f4(%rip),%xmm12 # 4f60 <_sk_callback_sse41+0x712> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,196 // subps %xmm12,%xmm8 - .byte 68,15,88,21,164,39,0,0 // addps 0x27a4(%rip),%xmm10 # 4e50 <_sk_callback_sse41+0x6d2> - .byte 68,15,40,37,172,39,0,0 // movaps 0x27ac(%rip),%xmm12 # 4e60 <_sk_callback_sse41+0x6e2> + .byte 68,15,88,21,244,39,0,0 // addps 0x27f4(%rip),%xmm10 # 4f70 <_sk_callback_sse41+0x722> + .byte 68,15,40,37,252,39,0,0 // movaps 0x27fc(%rip),%xmm12 # 4f80 <_sk_callback_sse41+0x732> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,196 // subps %xmm12,%xmm8 .byte 69,15,89,195 // mulps %xmm11,%xmm8 .byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10 .byte 69,15,40,216 // movaps %xmm8,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,5,153,39,0,0 // addps 0x2799(%rip),%xmm8 # 4e70 <_sk_callback_sse41+0x6f2> - .byte 68,15,40,21,161,39,0,0 // movaps 0x27a1(%rip),%xmm10 # 4e80 <_sk_callback_sse41+0x702> + .byte 68,15,88,5,233,39,0,0 // addps 0x27e9(%rip),%xmm8 # 4f90 <_sk_callback_sse41+0x742> + .byte 68,15,40,21,241,39,0,0 // movaps 0x27f1(%rip),%xmm10 # 4fa0 <_sk_callback_sse41+0x752> .byte 69,15,89,211 // mulps %xmm11,%xmm10 .byte 69,15,92,194 // subps %xmm10,%xmm8 - .byte 68,15,40,21,161,39,0,0 // movaps 0x27a1(%rip),%xmm10 # 4e90 <_sk_callback_sse41+0x712> + .byte 68,15,40,21,241,39,0,0 // movaps 0x27f1(%rip),%xmm10 # 4fb0 <_sk_callback_sse41+0x762> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 68,15,40,29,165,39,0,0 // movaps 0x27a5(%rip),%xmm11 # 4ea0 <_sk_callback_sse41+0x722> + .byte 68,15,40,29,245,39,0,0 // movaps 0x27f5(%rip),%xmm11 # 4fc0 <_sk_callback_sse41+0x772> .byte 69,15,94,218 // divps %xmm10,%xmm11 .byte 69,15,88,216 // addps %xmm8,%xmm11 - .byte 68,15,89,29,165,39,0,0 // mulps 0x27a5(%rip),%xmm11 # 4eb0 <_sk_callback_sse41+0x732> + .byte 68,15,89,29,245,39,0,0 // mulps 0x27f5(%rip),%xmm11 # 4fd0 <_sk_callback_sse41+0x782> .byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10 .byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 @@ -23460,7 +23905,7 @@ _sk_parametric_r_sse41: .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 68,15,95,192 // maxps %xmm0,%xmm8 - .byte 68,15,93,5,140,39,0,0 // minps 0x278c(%rip),%xmm8 # 4ec0 <_sk_callback_sse41+0x742> + .byte 68,15,93,5,220,39,0,0 // minps 0x27dc(%rip),%xmm8 # 4fe0 <_sk_callback_sse41+0x792> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -23490,31 +23935,31 @@ _sk_parametric_g_sse41: .byte 68,15,88,217 // addps %xmm1,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,45,39,0,0 // mulps 0x272d(%rip),%xmm12 # 4ed0 <_sk_callback_sse41+0x752> - .byte 68,15,84,29,53,39,0,0 // andps 0x2735(%rip),%xmm11 # 4ee0 <_sk_callback_sse41+0x762> - .byte 68,15,86,29,61,39,0,0 // orps 0x273d(%rip),%xmm11 # 4ef0 <_sk_callback_sse41+0x772> - .byte 68,15,88,37,69,39,0,0 // addps 0x2745(%rip),%xmm12 # 4f00 <_sk_callback_sse41+0x782> - .byte 15,40,13,78,39,0,0 // movaps 0x274e(%rip),%xmm1 # 4f10 <_sk_callback_sse41+0x792> + .byte 68,15,89,37,125,39,0,0 // mulps 0x277d(%rip),%xmm12 # 4ff0 <_sk_callback_sse41+0x7a2> + .byte 68,15,84,29,133,39,0,0 // andps 0x2785(%rip),%xmm11 # 5000 <_sk_callback_sse41+0x7b2> + .byte 68,15,86,29,141,39,0,0 // orps 0x278d(%rip),%xmm11 # 5010 <_sk_callback_sse41+0x7c2> + .byte 68,15,88,37,149,39,0,0 // addps 0x2795(%rip),%xmm12 # 5020 <_sk_callback_sse41+0x7d2> + .byte 15,40,13,158,39,0,0 // movaps 0x279e(%rip),%xmm1 # 5030 <_sk_callback_sse41+0x7e2> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 - .byte 68,15,88,29,78,39,0,0 // addps 0x274e(%rip),%xmm11 # 4f20 <_sk_callback_sse41+0x7a2> - .byte 15,40,13,87,39,0,0 // movaps 0x2757(%rip),%xmm1 # 4f30 <_sk_callback_sse41+0x7b2> + .byte 68,15,88,29,158,39,0,0 // addps 0x279e(%rip),%xmm11 # 5040 <_sk_callback_sse41+0x7f2> + .byte 15,40,13,167,39,0,0 // movaps 0x27a7(%rip),%xmm1 # 5050 <_sk_callback_sse41+0x802> .byte 65,15,94,203 // divps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,68,39,0,0 // addps 0x2744(%rip),%xmm12 # 4f40 <_sk_callback_sse41+0x7c2> - .byte 15,40,13,77,39,0,0 // movaps 0x274d(%rip),%xmm1 # 4f50 <_sk_callback_sse41+0x7d2> + .byte 68,15,88,37,148,39,0,0 // addps 0x2794(%rip),%xmm12 # 5060 <_sk_callback_sse41+0x812> + .byte 15,40,13,157,39,0,0 // movaps 0x279d(%rip),%xmm1 # 5070 <_sk_callback_sse41+0x822> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 - .byte 68,15,40,21,77,39,0,0 // movaps 0x274d(%rip),%xmm10 # 4f60 <_sk_callback_sse41+0x7e2> + .byte 68,15,40,21,157,39,0,0 // movaps 0x279d(%rip),%xmm10 # 5080 <_sk_callback_sse41+0x832> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,13,82,39,0,0 // movaps 0x2752(%rip),%xmm1 # 4f70 <_sk_callback_sse41+0x7f2> + .byte 15,40,13,162,39,0,0 // movaps 0x27a2(%rip),%xmm1 # 5090 <_sk_callback_sse41+0x842> .byte 65,15,94,202 // divps %xmm10,%xmm1 .byte 65,15,88,204 // addps %xmm12,%xmm1 - .byte 15,89,13,83,39,0,0 // mulps 0x2753(%rip),%xmm1 # 4f80 <_sk_callback_sse41+0x802> + .byte 15,89,13,163,39,0,0 // mulps 0x27a3(%rip),%xmm1 # 50a0 <_sk_callback_sse41+0x852> .byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10 .byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1 .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1 @@ -23522,7 +23967,7 @@ _sk_parametric_g_sse41: .byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,200 // maxps %xmm0,%xmm1 - .byte 15,93,13,62,39,0,0 // minps 0x273e(%rip),%xmm1 # 4f90 <_sk_callback_sse41+0x812> + .byte 15,93,13,142,39,0,0 // minps 0x278e(%rip),%xmm1 # 50b0 <_sk_callback_sse41+0x862> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -23552,31 +23997,31 @@ _sk_parametric_b_sse41: .byte 68,15,88,218 // addps %xmm2,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,223,38,0,0 // mulps 0x26df(%rip),%xmm12 # 4fa0 <_sk_callback_sse41+0x822> - .byte 68,15,84,29,231,38,0,0 // andps 0x26e7(%rip),%xmm11 # 4fb0 <_sk_callback_sse41+0x832> - .byte 68,15,86,29,239,38,0,0 // orps 0x26ef(%rip),%xmm11 # 4fc0 <_sk_callback_sse41+0x842> - .byte 68,15,88,37,247,38,0,0 // addps 0x26f7(%rip),%xmm12 # 4fd0 <_sk_callback_sse41+0x852> - .byte 15,40,21,0,39,0,0 // movaps 0x2700(%rip),%xmm2 # 4fe0 <_sk_callback_sse41+0x862> + .byte 68,15,89,37,47,39,0,0 // mulps 0x272f(%rip),%xmm12 # 50c0 <_sk_callback_sse41+0x872> + .byte 68,15,84,29,55,39,0,0 // andps 0x2737(%rip),%xmm11 # 50d0 <_sk_callback_sse41+0x882> + .byte 68,15,86,29,63,39,0,0 // orps 0x273f(%rip),%xmm11 # 50e0 <_sk_callback_sse41+0x892> + .byte 68,15,88,37,71,39,0,0 // addps 0x2747(%rip),%xmm12 # 50f0 <_sk_callback_sse41+0x8a2> + .byte 15,40,21,80,39,0,0 // movaps 0x2750(%rip),%xmm2 # 5100 <_sk_callback_sse41+0x8b2> .byte 65,15,89,211 // mulps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 - .byte 68,15,88,29,0,39,0,0 // addps 0x2700(%rip),%xmm11 # 4ff0 <_sk_callback_sse41+0x872> - .byte 15,40,21,9,39,0,0 // movaps 0x2709(%rip),%xmm2 # 5000 <_sk_callback_sse41+0x882> + .byte 68,15,88,29,80,39,0,0 // addps 0x2750(%rip),%xmm11 # 5110 <_sk_callback_sse41+0x8c2> + .byte 15,40,21,89,39,0,0 // movaps 0x2759(%rip),%xmm2 # 5120 <_sk_callback_sse41+0x8d2> .byte 65,15,94,211 // divps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,246,38,0,0 // addps 0x26f6(%rip),%xmm12 # 5010 <_sk_callback_sse41+0x892> - .byte 15,40,21,255,38,0,0 // movaps 0x26ff(%rip),%xmm2 # 5020 <_sk_callback_sse41+0x8a2> + .byte 68,15,88,37,70,39,0,0 // addps 0x2746(%rip),%xmm12 # 5130 <_sk_callback_sse41+0x8e2> + .byte 15,40,21,79,39,0,0 // movaps 0x274f(%rip),%xmm2 # 5140 <_sk_callback_sse41+0x8f2> .byte 65,15,89,211 // mulps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 - .byte 68,15,40,21,255,38,0,0 // movaps 0x26ff(%rip),%xmm10 # 5030 <_sk_callback_sse41+0x8b2> + .byte 68,15,40,21,79,39,0,0 // movaps 0x274f(%rip),%xmm10 # 5150 <_sk_callback_sse41+0x902> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,21,4,39,0,0 // movaps 0x2704(%rip),%xmm2 # 5040 <_sk_callback_sse41+0x8c2> + .byte 15,40,21,84,39,0,0 // movaps 0x2754(%rip),%xmm2 # 5160 <_sk_callback_sse41+0x912> .byte 65,15,94,210 // divps %xmm10,%xmm2 .byte 65,15,88,212 // addps %xmm12,%xmm2 - .byte 15,89,21,5,39,0,0 // mulps 0x2705(%rip),%xmm2 # 5050 <_sk_callback_sse41+0x8d2> + .byte 15,89,21,85,39,0,0 // mulps 0x2755(%rip),%xmm2 # 5170 <_sk_callback_sse41+0x922> .byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10 .byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2 .byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2 @@ -23584,7 +24029,7 @@ _sk_parametric_b_sse41: .byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,208 // maxps %xmm0,%xmm2 - .byte 15,93,21,240,38,0,0 // minps 0x26f0(%rip),%xmm2 # 5060 <_sk_callback_sse41+0x8e2> + .byte 15,93,21,64,39,0,0 // minps 0x2740(%rip),%xmm2 # 5180 <_sk_callback_sse41+0x932> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -23614,31 +24059,31 @@ _sk_parametric_a_sse41: .byte 68,15,88,219 // addps %xmm3,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,145,38,0,0 // mulps 0x2691(%rip),%xmm12 # 5070 <_sk_callback_sse41+0x8f2> - .byte 68,15,84,29,153,38,0,0 // andps 0x2699(%rip),%xmm11 # 5080 <_sk_callback_sse41+0x902> - .byte 68,15,86,29,161,38,0,0 // orps 0x26a1(%rip),%xmm11 # 5090 <_sk_callback_sse41+0x912> - .byte 68,15,88,37,169,38,0,0 // addps 0x26a9(%rip),%xmm12 # 50a0 <_sk_callback_sse41+0x922> - .byte 15,40,29,178,38,0,0 // movaps 0x26b2(%rip),%xmm3 # 50b0 <_sk_callback_sse41+0x932> + .byte 68,15,89,37,225,38,0,0 // mulps 0x26e1(%rip),%xmm12 # 5190 <_sk_callback_sse41+0x942> + .byte 68,15,84,29,233,38,0,0 // andps 0x26e9(%rip),%xmm11 # 51a0 <_sk_callback_sse41+0x952> + .byte 68,15,86,29,241,38,0,0 // orps 0x26f1(%rip),%xmm11 # 51b0 <_sk_callback_sse41+0x962> + .byte 68,15,88,37,249,38,0,0 // addps 0x26f9(%rip),%xmm12 # 51c0 <_sk_callback_sse41+0x972> + .byte 15,40,29,2,39,0,0 // movaps 0x2702(%rip),%xmm3 # 51d0 <_sk_callback_sse41+0x982> .byte 65,15,89,219 // mulps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 - .byte 68,15,88,29,178,38,0,0 // addps 0x26b2(%rip),%xmm11 # 50c0 <_sk_callback_sse41+0x942> - .byte 15,40,29,187,38,0,0 // movaps 0x26bb(%rip),%xmm3 # 50d0 <_sk_callback_sse41+0x952> + .byte 68,15,88,29,2,39,0,0 // addps 0x2702(%rip),%xmm11 # 51e0 <_sk_callback_sse41+0x992> + .byte 15,40,29,11,39,0,0 // movaps 0x270b(%rip),%xmm3 # 51f0 <_sk_callback_sse41+0x9a2> .byte 65,15,94,219 // divps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,168,38,0,0 // addps 0x26a8(%rip),%xmm12 # 50e0 <_sk_callback_sse41+0x962> - .byte 15,40,29,177,38,0,0 // movaps 0x26b1(%rip),%xmm3 # 50f0 <_sk_callback_sse41+0x972> + .byte 68,15,88,37,248,38,0,0 // addps 0x26f8(%rip),%xmm12 # 5200 <_sk_callback_sse41+0x9b2> + .byte 15,40,29,1,39,0,0 // movaps 0x2701(%rip),%xmm3 # 5210 <_sk_callback_sse41+0x9c2> .byte 65,15,89,219 // mulps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 - .byte 68,15,40,21,177,38,0,0 // movaps 0x26b1(%rip),%xmm10 # 5100 <_sk_callback_sse41+0x982> + .byte 68,15,40,21,1,39,0,0 // movaps 0x2701(%rip),%xmm10 # 5220 <_sk_callback_sse41+0x9d2> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,29,182,38,0,0 // movaps 0x26b6(%rip),%xmm3 # 5110 <_sk_callback_sse41+0x992> + .byte 15,40,29,6,39,0,0 // movaps 0x2706(%rip),%xmm3 # 5230 <_sk_callback_sse41+0x9e2> .byte 65,15,94,218 // divps %xmm10,%xmm3 .byte 65,15,88,220 // addps %xmm12,%xmm3 - .byte 15,89,29,183,38,0,0 // mulps 0x26b7(%rip),%xmm3 # 5120 <_sk_callback_sse41+0x9a2> + .byte 15,89,29,7,39,0,0 // mulps 0x2707(%rip),%xmm3 # 5240 <_sk_callback_sse41+0x9f2> .byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10 .byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 @@ -23646,7 +24091,7 @@ _sk_parametric_a_sse41: .byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,216 // maxps %xmm0,%xmm3 - .byte 15,93,29,162,38,0,0 // minps 0x26a2(%rip),%xmm3 # 5130 <_sk_callback_sse41+0x9b2> + .byte 15,93,29,242,38,0,0 // minps 0x26f2(%rip),%xmm3 # 5250 <_sk_callback_sse41+0xa02> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -23656,29 +24101,29 @@ HIDDEN _sk_lab_to_xyz_sse41 FUNCTION(_sk_lab_to_xyz_sse41) _sk_lab_to_xyz_sse41: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,89,5,158,38,0,0 // mulps 0x269e(%rip),%xmm8 # 5140 <_sk_callback_sse41+0x9c2> - .byte 68,15,40,13,166,38,0,0 // movaps 0x26a6(%rip),%xmm9 # 5150 <_sk_callback_sse41+0x9d2> + .byte 68,15,89,5,238,38,0,0 // mulps 0x26ee(%rip),%xmm8 # 5260 <_sk_callback_sse41+0xa12> + .byte 68,15,40,13,246,38,0,0 // movaps 0x26f6(%rip),%xmm9 # 5270 <_sk_callback_sse41+0xa22> .byte 65,15,89,201 // mulps %xmm9,%xmm1 - .byte 15,40,5,171,38,0,0 // movaps 0x26ab(%rip),%xmm0 # 5160 <_sk_callback_sse41+0x9e2> + .byte 15,40,5,251,38,0,0 // movaps 0x26fb(%rip),%xmm0 # 5280 <_sk_callback_sse41+0xa32> .byte 15,88,200 // addps %xmm0,%xmm1 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 15,88,208 // addps %xmm0,%xmm2 - .byte 68,15,88,5,169,38,0,0 // addps 0x26a9(%rip),%xmm8 # 5170 <_sk_callback_sse41+0x9f2> - .byte 68,15,89,5,177,38,0,0 // mulps 0x26b1(%rip),%xmm8 # 5180 <_sk_callback_sse41+0xa02> - .byte 15,89,13,186,38,0,0 // mulps 0x26ba(%rip),%xmm1 # 5190 <_sk_callback_sse41+0xa12> + .byte 68,15,88,5,249,38,0,0 // addps 0x26f9(%rip),%xmm8 # 5290 <_sk_callback_sse41+0xa42> + .byte 68,15,89,5,1,39,0,0 // mulps 0x2701(%rip),%xmm8 # 52a0 <_sk_callback_sse41+0xa52> + .byte 15,89,13,10,39,0,0 // mulps 0x270a(%rip),%xmm1 # 52b0 <_sk_callback_sse41+0xa62> .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 15,89,21,191,38,0,0 // mulps 0x26bf(%rip),%xmm2 # 51a0 <_sk_callback_sse41+0xa22> + .byte 15,89,21,15,39,0,0 // mulps 0x270f(%rip),%xmm2 # 52c0 <_sk_callback_sse41+0xa72> .byte 69,15,40,208 // movaps %xmm8,%xmm10 .byte 68,15,92,210 // subps %xmm2,%xmm10 .byte 68,15,40,217 // movaps %xmm1,%xmm11 .byte 69,15,89,219 // mulps %xmm11,%xmm11 .byte 68,15,89,217 // mulps %xmm1,%xmm11 - .byte 68,15,40,13,179,38,0,0 // movaps 0x26b3(%rip),%xmm9 # 51b0 <_sk_callback_sse41+0xa32> + .byte 68,15,40,13,3,39,0,0 // movaps 0x2703(%rip),%xmm9 # 52d0 <_sk_callback_sse41+0xa82> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0 - .byte 15,40,21,179,38,0,0 // movaps 0x26b3(%rip),%xmm2 # 51c0 <_sk_callback_sse41+0xa42> + .byte 15,40,21,3,39,0,0 // movaps 0x2703(%rip),%xmm2 # 52e0 <_sk_callback_sse41+0xa92> .byte 15,88,202 // addps %xmm2,%xmm1 - .byte 68,15,40,37,184,38,0,0 // movaps 0x26b8(%rip),%xmm12 # 51d0 <_sk_callback_sse41+0xa52> + .byte 68,15,40,37,8,39,0,0 // movaps 0x2708(%rip),%xmm12 # 52f0 <_sk_callback_sse41+0xaa2> .byte 65,15,89,204 // mulps %xmm12,%xmm1 .byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1 .byte 69,15,40,216 // movaps %xmm8,%xmm11 @@ -23697,8 +24142,8 @@ _sk_lab_to_xyz_sse41: .byte 65,15,89,212 // mulps %xmm12,%xmm2 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2 - .byte 15,89,13,113,38,0,0 // mulps 0x2671(%rip),%xmm1 # 51e0 <_sk_callback_sse41+0xa62> - .byte 15,89,21,122,38,0,0 // mulps 0x267a(%rip),%xmm2 # 51f0 <_sk_callback_sse41+0xa72> + .byte 15,89,13,193,38,0,0 // mulps 0x26c1(%rip),%xmm1 # 5300 <_sk_callback_sse41+0xab2> + .byte 15,89,21,202,38,0,0 // mulps 0x26ca(%rip),%xmm2 # 5310 <_sk_callback_sse41+0xac2> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 65,15,40,200 // movaps %xmm8,%xmm1 @@ -23712,7 +24157,7 @@ _sk_load_a8_sse41: .byte 72,139,0 // mov (%rax),%rax .byte 102,15,56,49,4,56 // pmovzxbd (%rax,%rdi,1),%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,106,38,0,0 // mulps 0x266a(%rip),%xmm3 # 5200 <_sk_callback_sse41+0xa82> + .byte 15,89,29,186,38,0,0 // mulps 0x26ba(%rip),%xmm3 # 5320 <_sk_callback_sse41+0xad2> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,87,201 // xorps %xmm1,%xmm1 @@ -23745,7 +24190,7 @@ _sk_gather_a8_sse41: .byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,254,37,0,0 // mulps 0x25fe(%rip),%xmm3 # 5210 <_sk_callback_sse41+0xa92> + .byte 15,89,29,78,38,0,0 // mulps 0x264e(%rip),%xmm3 # 5330 <_sk_callback_sse41+0xae2> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -23758,7 +24203,7 @@ FUNCTION(_sk_store_a8_sse41) _sk_store_a8_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,242,37,0,0 // movaps 0x25f2(%rip),%xmm8 # 5220 <_sk_callback_sse41+0xaa2> + .byte 68,15,40,5,66,38,0,0 // movaps 0x2642(%rip),%xmm8 # 5340 <_sk_callback_sse41+0xaf2> .byte 68,15,89,195 // mulps %xmm3,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 .byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8 @@ -23775,9 +24220,9 @@ _sk_load_g8_sse41: .byte 72,139,0 // mov (%rax),%rax .byte 102,15,56,49,4,56 // pmovzxbd (%rax,%rdi,1),%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,207,37,0,0 // mulps 0x25cf(%rip),%xmm0 # 5230 <_sk_callback_sse41+0xab2> + .byte 15,89,5,31,38,0,0 // mulps 0x261f(%rip),%xmm0 # 5350 <_sk_callback_sse41+0xb02> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,214,37,0,0 // movaps 0x25d6(%rip),%xmm3 # 5240 <_sk_callback_sse41+0xac2> + .byte 15,40,29,38,38,0,0 // movaps 0x2626(%rip),%xmm3 # 5360 <_sk_callback_sse41+0xb12> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,224 // jmpq *%rax @@ -23808,9 +24253,9 @@ _sk_gather_g8_sse41: .byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,111,37,0,0 // mulps 0x256f(%rip),%xmm0 # 5250 <_sk_callback_sse41+0xad2> + .byte 15,89,5,191,37,0,0 // mulps 0x25bf(%rip),%xmm0 # 5370 <_sk_callback_sse41+0xb22> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,118,37,0,0 // movaps 0x2576(%rip),%xmm3 # 5260 <_sk_callback_sse41+0xae2> + .byte 15,40,29,198,37,0,0 // movaps 0x25c6(%rip),%xmm3 # 5380 <_sk_callback_sse41+0xb32> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,224 // jmpq *%rax @@ -23822,9 +24267,9 @@ _sk_gather_i8_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 73,137,192 // mov %rax,%r8 .byte 77,133,192 // test %r8,%r8 - .byte 116,5 // je 2d01 <_sk_gather_i8_sse41+0xf> + .byte 116,5 // je 2dd1 <_sk_gather_i8_sse41+0xf> .byte 76,137,192 // mov %r8,%rax - .byte 235,2 // jmp 2d03 <_sk_gather_i8_sse41+0x11> + .byte 235,2 // jmp 2dd3 <_sk_gather_i8_sse41+0x11> .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1 @@ -23855,17 +24300,17 @@ _sk_gather_i8_sse41: .byte 102,15,58,34,28,8,1 // pinsrd $0x1,(%rax,%rcx,1),%xmm3 .byte 102,66,15,58,34,28,144,2 // pinsrd $0x2,(%rax,%r10,4),%xmm3 .byte 102,66,15,58,34,28,8,3 // pinsrd $0x3,(%rax,%r9,1),%xmm3 - .byte 102,15,111,5,205,36,0,0 // movdqa 0x24cd(%rip),%xmm0 # 5270 <_sk_callback_sse41+0xaf2> + .byte 102,15,111,5,29,37,0,0 // movdqa 0x251d(%rip),%xmm0 # 5390 <_sk_callback_sse41+0xb42> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,206,36,0,0 // movaps 0x24ce(%rip),%xmm8 # 5280 <_sk_callback_sse41+0xb02> + .byte 68,15,40,5,30,37,0,0 // movaps 0x251e(%rip),%xmm8 # 53a0 <_sk_callback_sse41+0xb52> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 - .byte 102,15,56,0,13,205,36,0,0 // pshufb 0x24cd(%rip),%xmm1 # 5290 <_sk_callback_sse41+0xb12> + .byte 102,15,56,0,13,29,37,0,0 // pshufb 0x251d(%rip),%xmm1 # 53b0 <_sk_callback_sse41+0xb62> .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,211 // movdqa %xmm3,%xmm2 - .byte 102,15,56,0,21,201,36,0,0 // pshufb 0x24c9(%rip),%xmm2 # 52a0 <_sk_callback_sse41+0xb22> + .byte 102,15,56,0,21,25,37,0,0 // pshufb 0x2519(%rip),%xmm2 # 53c0 <_sk_callback_sse41+0xb72> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -23881,19 +24326,19 @@ _sk_load_565_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 102,15,56,51,20,120 // pmovzxwd (%rax,%rdi,2),%xmm2 - .byte 102,15,111,5,175,36,0,0 // movdqa 0x24af(%rip),%xmm0 # 52b0 <_sk_callback_sse41+0xb32> + .byte 102,15,111,5,255,36,0,0 // movdqa 0x24ff(%rip),%xmm0 # 53d0 <_sk_callback_sse41+0xb82> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,177,36,0,0 // mulps 0x24b1(%rip),%xmm0 # 52c0 <_sk_callback_sse41+0xb42> - .byte 102,15,111,13,185,36,0,0 // movdqa 0x24b9(%rip),%xmm1 # 52d0 <_sk_callback_sse41+0xb52> + .byte 15,89,5,1,37,0,0 // mulps 0x2501(%rip),%xmm0 # 53e0 <_sk_callback_sse41+0xb92> + .byte 102,15,111,13,9,37,0,0 // movdqa 0x2509(%rip),%xmm1 # 53f0 <_sk_callback_sse41+0xba2> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,187,36,0,0 // mulps 0x24bb(%rip),%xmm1 # 52e0 <_sk_callback_sse41+0xb62> - .byte 102,15,219,21,195,36,0,0 // pand 0x24c3(%rip),%xmm2 # 52f0 <_sk_callback_sse41+0xb72> + .byte 15,89,13,11,37,0,0 // mulps 0x250b(%rip),%xmm1 # 5400 <_sk_callback_sse41+0xbb2> + .byte 102,15,219,21,19,37,0,0 // pand 0x2513(%rip),%xmm2 # 5410 <_sk_callback_sse41+0xbc2> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,201,36,0,0 // mulps 0x24c9(%rip),%xmm2 # 5300 <_sk_callback_sse41+0xb82> + .byte 15,89,21,25,37,0,0 // mulps 0x2519(%rip),%xmm2 # 5420 <_sk_callback_sse41+0xbd2> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,208,36,0,0 // movaps 0x24d0(%rip),%xmm3 # 5310 <_sk_callback_sse41+0xb92> + .byte 15,40,29,32,37,0,0 // movaps 0x2520(%rip),%xmm3 # 5430 <_sk_callback_sse41+0xbe2> .byte 255,224 // jmpq *%rax HIDDEN _sk_gather_565_sse41 @@ -23921,19 +24366,19 @@ _sk_gather_565_sse41: .byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax .byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0 .byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2 - .byte 102,15,111,5,117,36,0,0 // movdqa 0x2475(%rip),%xmm0 # 5320 <_sk_callback_sse41+0xba2> + .byte 102,15,111,5,197,36,0,0 // movdqa 0x24c5(%rip),%xmm0 # 5440 <_sk_callback_sse41+0xbf2> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,119,36,0,0 // mulps 0x2477(%rip),%xmm0 # 5330 <_sk_callback_sse41+0xbb2> - .byte 102,15,111,13,127,36,0,0 // movdqa 0x247f(%rip),%xmm1 # 5340 <_sk_callback_sse41+0xbc2> + .byte 15,89,5,199,36,0,0 // mulps 0x24c7(%rip),%xmm0 # 5450 <_sk_callback_sse41+0xc02> + .byte 102,15,111,13,207,36,0,0 // movdqa 0x24cf(%rip),%xmm1 # 5460 <_sk_callback_sse41+0xc12> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,129,36,0,0 // mulps 0x2481(%rip),%xmm1 # 5350 <_sk_callback_sse41+0xbd2> - .byte 102,15,219,21,137,36,0,0 // pand 0x2489(%rip),%xmm2 # 5360 <_sk_callback_sse41+0xbe2> + .byte 15,89,13,209,36,0,0 // mulps 0x24d1(%rip),%xmm1 # 5470 <_sk_callback_sse41+0xc22> + .byte 102,15,219,21,217,36,0,0 // pand 0x24d9(%rip),%xmm2 # 5480 <_sk_callback_sse41+0xc32> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,143,36,0,0 // mulps 0x248f(%rip),%xmm2 # 5370 <_sk_callback_sse41+0xbf2> + .byte 15,89,21,223,36,0,0 // mulps 0x24df(%rip),%xmm2 # 5490 <_sk_callback_sse41+0xc42> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,150,36,0,0 // movaps 0x2496(%rip),%xmm3 # 5380 <_sk_callback_sse41+0xc02> + .byte 15,40,29,230,36,0,0 // movaps 0x24e6(%rip),%xmm3 # 54a0 <_sk_callback_sse41+0xc52> .byte 255,224 // jmpq *%rax HIDDEN _sk_store_565_sse41 @@ -23942,12 +24387,12 @@ FUNCTION(_sk_store_565_sse41) _sk_store_565_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,151,36,0,0 // movaps 0x2497(%rip),%xmm8 # 5390 <_sk_callback_sse41+0xc12> + .byte 68,15,40,5,231,36,0,0 // movaps 0x24e7(%rip),%xmm8 # 54b0 <_sk_callback_sse41+0xc62> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 .byte 102,65,15,114,241,11 // pslld $0xb,%xmm9 - .byte 68,15,40,21,140,36,0,0 // movaps 0x248c(%rip),%xmm10 # 53a0 <_sk_callback_sse41+0xc22> + .byte 68,15,40,21,220,36,0,0 // movaps 0x24dc(%rip),%xmm10 # 54c0 <_sk_callback_sse41+0xc72> .byte 68,15,89,209 // mulps %xmm1,%xmm10 .byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10 .byte 102,65,15,114,242,5 // pslld $0x5,%xmm10 @@ -23967,21 +24412,21 @@ _sk_load_4444_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 102,15,56,51,28,120 // pmovzxwd (%rax,%rdi,2),%xmm3 - .byte 102,15,111,5,87,36,0,0 // movdqa 0x2457(%rip),%xmm0 # 53b0 <_sk_callback_sse41+0xc32> + .byte 102,15,111,5,167,36,0,0 // movdqa 0x24a7(%rip),%xmm0 # 54d0 <_sk_callback_sse41+0xc82> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,89,36,0,0 // mulps 0x2459(%rip),%xmm0 # 53c0 <_sk_callback_sse41+0xc42> - .byte 102,15,111,13,97,36,0,0 // movdqa 0x2461(%rip),%xmm1 # 53d0 <_sk_callback_sse41+0xc52> + .byte 15,89,5,169,36,0,0 // mulps 0x24a9(%rip),%xmm0 # 54e0 <_sk_callback_sse41+0xc92> + .byte 102,15,111,13,177,36,0,0 // movdqa 0x24b1(%rip),%xmm1 # 54f0 <_sk_callback_sse41+0xca2> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,99,36,0,0 // mulps 0x2463(%rip),%xmm1 # 53e0 <_sk_callback_sse41+0xc62> - .byte 102,15,111,21,107,36,0,0 // movdqa 0x246b(%rip),%xmm2 # 53f0 <_sk_callback_sse41+0xc72> + .byte 15,89,13,179,36,0,0 // mulps 0x24b3(%rip),%xmm1 # 5500 <_sk_callback_sse41+0xcb2> + .byte 102,15,111,21,187,36,0,0 // movdqa 0x24bb(%rip),%xmm2 # 5510 <_sk_callback_sse41+0xcc2> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,109,36,0,0 // mulps 0x246d(%rip),%xmm2 # 5400 <_sk_callback_sse41+0xc82> - .byte 102,15,219,29,117,36,0,0 // pand 0x2475(%rip),%xmm3 # 5410 <_sk_callback_sse41+0xc92> + .byte 15,89,21,189,36,0,0 // mulps 0x24bd(%rip),%xmm2 # 5520 <_sk_callback_sse41+0xcd2> + .byte 102,15,219,29,197,36,0,0 // pand 0x24c5(%rip),%xmm3 # 5530 <_sk_callback_sse41+0xce2> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,123,36,0,0 // mulps 0x247b(%rip),%xmm3 # 5420 <_sk_callback_sse41+0xca2> + .byte 15,89,29,203,36,0,0 // mulps 0x24cb(%rip),%xmm3 # 5540 <_sk_callback_sse41+0xcf2> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -24010,21 +24455,21 @@ _sk_gather_4444_sse41: .byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax .byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0 .byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3 - .byte 102,15,111,5,30,36,0,0 // movdqa 0x241e(%rip),%xmm0 # 5430 <_sk_callback_sse41+0xcb2> + .byte 102,15,111,5,110,36,0,0 // movdqa 0x246e(%rip),%xmm0 # 5550 <_sk_callback_sse41+0xd02> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,32,36,0,0 // mulps 0x2420(%rip),%xmm0 # 5440 <_sk_callback_sse41+0xcc2> - .byte 102,15,111,13,40,36,0,0 // movdqa 0x2428(%rip),%xmm1 # 5450 <_sk_callback_sse41+0xcd2> + .byte 15,89,5,112,36,0,0 // mulps 0x2470(%rip),%xmm0 # 5560 <_sk_callback_sse41+0xd12> + .byte 102,15,111,13,120,36,0,0 // movdqa 0x2478(%rip),%xmm1 # 5570 <_sk_callback_sse41+0xd22> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,42,36,0,0 // mulps 0x242a(%rip),%xmm1 # 5460 <_sk_callback_sse41+0xce2> - .byte 102,15,111,21,50,36,0,0 // movdqa 0x2432(%rip),%xmm2 # 5470 <_sk_callback_sse41+0xcf2> + .byte 15,89,13,122,36,0,0 // mulps 0x247a(%rip),%xmm1 # 5580 <_sk_callback_sse41+0xd32> + .byte 102,15,111,21,130,36,0,0 // movdqa 0x2482(%rip),%xmm2 # 5590 <_sk_callback_sse41+0xd42> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,52,36,0,0 // mulps 0x2434(%rip),%xmm2 # 5480 <_sk_callback_sse41+0xd02> - .byte 102,15,219,29,60,36,0,0 // pand 0x243c(%rip),%xmm3 # 5490 <_sk_callback_sse41+0xd12> + .byte 15,89,21,132,36,0,0 // mulps 0x2484(%rip),%xmm2 # 55a0 <_sk_callback_sse41+0xd52> + .byte 102,15,219,29,140,36,0,0 // pand 0x248c(%rip),%xmm3 # 55b0 <_sk_callback_sse41+0xd62> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,66,36,0,0 // mulps 0x2442(%rip),%xmm3 # 54a0 <_sk_callback_sse41+0xd22> + .byte 15,89,29,146,36,0,0 // mulps 0x2492(%rip),%xmm3 # 55c0 <_sk_callback_sse41+0xd72> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -24034,7 +24479,7 @@ FUNCTION(_sk_store_4444_sse41) _sk_store_4444_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,65,36,0,0 // movaps 0x2441(%rip),%xmm8 # 54b0 <_sk_callback_sse41+0xd32> + .byte 68,15,40,5,145,36,0,0 // movaps 0x2491(%rip),%xmm8 # 55d0 <_sk_callback_sse41+0xd82> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -24064,17 +24509,17 @@ _sk_load_8888_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 15,16,28,184 // movups (%rax,%rdi,4),%xmm3 - .byte 15,40,5,224,35,0,0 // movaps 0x23e0(%rip),%xmm0 # 54c0 <_sk_callback_sse41+0xd42> + .byte 15,40,5,48,36,0,0 // movaps 0x2430(%rip),%xmm0 # 55e0 <_sk_callback_sse41+0xd92> .byte 15,84,195 // andps %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,226,35,0,0 // movaps 0x23e2(%rip),%xmm8 # 54d0 <_sk_callback_sse41+0xd52> + .byte 68,15,40,5,50,36,0,0 // movaps 0x2432(%rip),%xmm8 # 55f0 <_sk_callback_sse41+0xda2> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,40,203 // movaps %xmm3,%xmm1 - .byte 102,15,56,0,13,226,35,0,0 // pshufb 0x23e2(%rip),%xmm1 # 54e0 <_sk_callback_sse41+0xd62> + .byte 102,15,56,0,13,50,36,0,0 // pshufb 0x2432(%rip),%xmm1 # 5600 <_sk_callback_sse41+0xdb2> .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 15,40,211 // movaps %xmm3,%xmm2 - .byte 102,15,56,0,21,223,35,0,0 // pshufb 0x23df(%rip),%xmm2 # 54f0 <_sk_callback_sse41+0xd72> + .byte 102,15,56,0,21,47,36,0,0 // pshufb 0x242f(%rip),%xmm2 # 5610 <_sk_callback_sse41+0xdc2> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -24105,17 +24550,17 @@ _sk_gather_8888_sse41: .byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3 .byte 102,67,15,58,34,28,145,2 // pinsrd $0x2,(%r9,%r10,4),%xmm3 .byte 102,65,15,58,34,28,137,3 // pinsrd $0x3,(%r9,%rcx,4),%xmm3 - .byte 102,15,111,5,120,35,0,0 // movdqa 0x2378(%rip),%xmm0 # 5500 <_sk_callback_sse41+0xd82> + .byte 102,15,111,5,200,35,0,0 // movdqa 0x23c8(%rip),%xmm0 # 5620 <_sk_callback_sse41+0xdd2> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,121,35,0,0 // movaps 0x2379(%rip),%xmm8 # 5510 <_sk_callback_sse41+0xd92> + .byte 68,15,40,5,201,35,0,0 // movaps 0x23c9(%rip),%xmm8 # 5630 <_sk_callback_sse41+0xde2> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 - .byte 102,15,56,0,13,120,35,0,0 // pshufb 0x2378(%rip),%xmm1 # 5520 <_sk_callback_sse41+0xda2> + .byte 102,15,56,0,13,200,35,0,0 // pshufb 0x23c8(%rip),%xmm1 # 5640 <_sk_callback_sse41+0xdf2> .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,211 // movdqa %xmm3,%xmm2 - .byte 102,15,56,0,21,116,35,0,0 // pshufb 0x2374(%rip),%xmm2 # 5530 <_sk_callback_sse41+0xdb2> + .byte 102,15,56,0,21,196,35,0,0 // pshufb 0x23c4(%rip),%xmm2 # 5650 <_sk_callback_sse41+0xe02> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -24130,7 +24575,7 @@ FUNCTION(_sk_store_8888_sse41) _sk_store_8888_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,96,35,0,0 // movaps 0x2360(%rip),%xmm8 # 5540 <_sk_callback_sse41+0xdc2> + .byte 68,15,40,5,176,35,0,0 // movaps 0x23b0(%rip),%xmm8 # 5660 <_sk_callback_sse41+0xe12> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -24167,18 +24612,18 @@ _sk_load_f16_sse41: .byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 .byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1 - .byte 102,68,15,111,5,217,34,0,0 // movdqa 0x22d9(%rip),%xmm8 # 5550 <_sk_callback_sse41+0xdd2> + .byte 102,68,15,111,5,41,35,0,0 // movdqa 0x2329(%rip),%xmm8 # 5670 <_sk_callback_sse41+0xe22> .byte 102,15,111,209 // movdqa %xmm1,%xmm2 .byte 102,65,15,219,208 // pand %xmm8,%xmm2 .byte 102,15,239,202 // pxor %xmm2,%xmm1 - .byte 102,15,111,29,212,34,0,0 // movdqa 0x22d4(%rip),%xmm3 # 5560 <_sk_callback_sse41+0xde2> + .byte 102,15,111,29,36,35,0,0 // movdqa 0x2324(%rip),%xmm3 # 5680 <_sk_callback_sse41+0xe32> .byte 102,15,114,242,16 // pslld $0x10,%xmm2 .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0 .byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0 .byte 102,15,114,241,13 // pslld $0xd,%xmm1 .byte 102,15,235,202 // por %xmm2,%xmm1 - .byte 102,68,15,111,21,192,34,0,0 // movdqa 0x22c0(%rip),%xmm10 # 5570 <_sk_callback_sse41+0xdf2> + .byte 102,68,15,111,21,16,35,0,0 // movdqa 0x2310(%rip),%xmm10 # 5690 <_sk_callback_sse41+0xe42> .byte 102,65,15,254,202 // paddd %xmm10,%xmm1 .byte 102,15,219,193 // pand %xmm1,%xmm0 .byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11 @@ -24251,18 +24696,18 @@ _sk_gather_f16_sse41: .byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11 .byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9 .byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1 - .byte 102,68,15,111,5,126,33,0,0 // movdqa 0x217e(%rip),%xmm8 # 5580 <_sk_callback_sse41+0xe02> + .byte 102,68,15,111,5,206,33,0,0 // movdqa 0x21ce(%rip),%xmm8 # 56a0 <_sk_callback_sse41+0xe52> .byte 102,15,111,209 // movdqa %xmm1,%xmm2 .byte 102,65,15,219,208 // pand %xmm8,%xmm2 .byte 102,15,239,202 // pxor %xmm2,%xmm1 - .byte 102,15,111,29,121,33,0,0 // movdqa 0x2179(%rip),%xmm3 # 5590 <_sk_callback_sse41+0xe12> + .byte 102,15,111,29,201,33,0,0 // movdqa 0x21c9(%rip),%xmm3 # 56b0 <_sk_callback_sse41+0xe62> .byte 102,15,114,242,16 // pslld $0x10,%xmm2 .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0 .byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0 .byte 102,15,114,241,13 // pslld $0xd,%xmm1 .byte 102,15,235,202 // por %xmm2,%xmm1 - .byte 102,68,15,111,21,101,33,0,0 // movdqa 0x2165(%rip),%xmm10 # 55a0 <_sk_callback_sse41+0xe22> + .byte 102,68,15,111,21,181,33,0,0 // movdqa 0x21b5(%rip),%xmm10 # 56c0 <_sk_callback_sse41+0xe72> .byte 102,65,15,254,202 // paddd %xmm10,%xmm1 .byte 102,15,219,193 // pand %xmm1,%xmm0 .byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11 @@ -24310,17 +24755,17 @@ FUNCTION(_sk_store_f16_sse41) _sk_store_f16_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 102,68,15,111,21,155,32,0,0 // movdqa 0x209b(%rip),%xmm10 # 55b0 <_sk_callback_sse41+0xe32> + .byte 102,68,15,111,21,235,32,0,0 // movdqa 0x20eb(%rip),%xmm10 # 56d0 <_sk_callback_sse41+0xe82> .byte 102,68,15,111,224 // movdqa %xmm0,%xmm12 .byte 102,68,15,111,232 // movdqa %xmm0,%xmm13 .byte 102,69,15,219,234 // pand %xmm10,%xmm13 .byte 102,69,15,239,229 // pxor %xmm13,%xmm12 - .byte 102,68,15,111,13,142,32,0,0 // movdqa 0x208e(%rip),%xmm9 # 55c0 <_sk_callback_sse41+0xe42> + .byte 102,68,15,111,13,222,32,0,0 // movdqa 0x20de(%rip),%xmm9 # 56e0 <_sk_callback_sse41+0xe92> .byte 102,65,15,114,213,16 // psrld $0x10,%xmm13 .byte 102,69,15,111,193 // movdqa %xmm9,%xmm8 .byte 102,69,15,102,196 // pcmpgtd %xmm12,%xmm8 .byte 102,65,15,114,212,13 // psrld $0xd,%xmm12 - .byte 102,68,15,111,29,127,32,0,0 // movdqa 0x207f(%rip),%xmm11 # 55d0 <_sk_callback_sse41+0xe52> + .byte 102,68,15,111,29,207,32,0,0 // movdqa 0x20cf(%rip),%xmm11 # 56f0 <_sk_callback_sse41+0xea2> .byte 102,69,15,235,235 // por %xmm11,%xmm13 .byte 102,69,15,254,236 // paddd %xmm12,%xmm13 .byte 102,69,15,223,197 // pandn %xmm13,%xmm8 @@ -24390,7 +24835,7 @@ _sk_load_u16_be_sse41: .byte 102,15,235,200 // por %xmm0,%xmm1 .byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,78,31,0,0 // movaps 0x1f4e(%rip),%xmm8 # 55e0 <_sk_callback_sse41+0xe62> + .byte 68,15,40,5,158,31,0,0 // movaps 0x1f9e(%rip),%xmm8 # 5700 <_sk_callback_sse41+0xeb2> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -24442,7 +24887,7 @@ _sk_load_rgb_u16_be_sse41: .byte 102,15,235,193 // por %xmm1,%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,143,30,0,0 // movaps 0x1e8f(%rip),%xmm8 # 55f0 <_sk_callback_sse41+0xe72> + .byte 68,15,40,5,223,30,0,0 // movaps 0x1edf(%rip),%xmm8 # 5710 <_sk_callback_sse41+0xec2> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -24459,7 +24904,7 @@ _sk_load_rgb_u16_be_sse41: .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,86,30,0,0 // movaps 0x1e56(%rip),%xmm3 # 5600 <_sk_callback_sse41+0xe82> + .byte 15,40,29,166,30,0,0 // movaps 0x1ea6(%rip),%xmm3 # 5720 <_sk_callback_sse41+0xed2> .byte 255,224 // jmpq *%rax HIDDEN _sk_store_u16_be_sse41 @@ -24468,7 +24913,7 @@ FUNCTION(_sk_store_u16_be_sse41) _sk_store_u16_be_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,13,87,30,0,0 // movaps 0x1e57(%rip),%xmm9 # 5610 <_sk_callback_sse41+0xe92> + .byte 68,15,40,13,167,30,0,0 // movaps 0x1ea7(%rip),%xmm9 # 5730 <_sk_callback_sse41+0xee2> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 @@ -24676,7 +25121,7 @@ FUNCTION(_sk_clamp_x_1_sse41) _sk_clamp_x_1_sse41: .byte 69,15,87,192 // xorps %xmm8,%xmm8 .byte 68,15,95,192 // maxps %xmm0,%xmm8 - .byte 68,15,93,5,189,27,0,0 // minps 0x1bbd(%rip),%xmm8 # 5620 <_sk_callback_sse41+0xea2> + .byte 68,15,93,5,13,28,0,0 // minps 0x1c0d(%rip),%xmm8 # 5740 <_sk_callback_sse41+0xef2> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -24694,9 +25139,9 @@ HIDDEN _sk_mirror_x_1_sse41 .globl _sk_mirror_x_1_sse41 FUNCTION(_sk_mirror_x_1_sse41) _sk_mirror_x_1_sse41: - .byte 68,15,40,5,174,27,0,0 // movaps 0x1bae(%rip),%xmm8 # 5630 <_sk_callback_sse41+0xeb2> + .byte 68,15,40,5,254,27,0,0 // movaps 0x1bfe(%rip),%xmm8 # 5750 <_sk_callback_sse41+0xf02> .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,13,178,27,0,0 // movaps 0x1bb2(%rip),%xmm9 # 5640 <_sk_callback_sse41+0xec2> + .byte 68,15,40,13,2,28,0,0 // movaps 0x1c02(%rip),%xmm9 # 5760 <_sk_callback_sse41+0xf12> .byte 68,15,89,200 // mulps %xmm0,%xmm9 .byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9 .byte 69,15,88,201 // addps %xmm9,%xmm9 @@ -24713,10 +25158,10 @@ HIDDEN _sk_luminance_to_alpha_sse41 FUNCTION(_sk_luminance_to_alpha_sse41) _sk_luminance_to_alpha_sse41: .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 15,89,5,145,27,0,0 // mulps 0x1b91(%rip),%xmm0 # 5650 <_sk_callback_sse41+0xed2> - .byte 15,89,13,154,27,0,0 // mulps 0x1b9a(%rip),%xmm1 # 5660 <_sk_callback_sse41+0xee2> + .byte 15,89,5,225,27,0,0 // mulps 0x1be1(%rip),%xmm0 # 5770 <_sk_callback_sse41+0xf22> + .byte 15,89,13,234,27,0,0 // mulps 0x1bea(%rip),%xmm1 # 5780 <_sk_callback_sse41+0xf32> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,29,160,27,0,0 // mulps 0x1ba0(%rip),%xmm3 # 5670 <_sk_callback_sse41+0xef2> + .byte 15,89,29,240,27,0,0 // mulps 0x1bf0(%rip),%xmm3 # 5790 <_sk_callback_sse41+0xf42> .byte 15,88,217 // addps %xmm1,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 @@ -24992,9 +25437,9 @@ _sk_evenly_spaced_gradient_sse41: .byte 72,139,8 // mov (%rax),%rcx .byte 76,139,88,8 // mov 0x8(%rax),%r11 .byte 72,255,201 // dec %rcx - .byte 120,7 // js 3f09 <_sk_evenly_spaced_gradient_sse41+0x15> + .byte 120,7 // js 3fd9 <_sk_evenly_spaced_gradient_sse41+0x15> .byte 243,72,15,42,201 // cvtsi2ss %rcx,%xmm1 - .byte 235,21 // jmp 3f1e <_sk_evenly_spaced_gradient_sse41+0x2a> + .byte 235,21 // jmp 3fee <_sk_evenly_spaced_gradient_sse41+0x2a> .byte 73,137,200 // mov %rcx,%r8 .byte 73,209,232 // shr %r8 .byte 131,225,1 // and $0x1,%ecx @@ -25081,15 +25526,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse41 .globl _sk_gauss_a_to_rgba_sse41 FUNCTION(_sk_gauss_a_to_rgba_sse41) _sk_gauss_a_to_rgba_sse41: - .byte 15,40,5,185,21,0,0 // movaps 0x15b9(%rip),%xmm0 # 5680 <_sk_callback_sse41+0xf02> + .byte 15,40,5,9,22,0,0 // movaps 0x1609(%rip),%xmm0 # 57a0 <_sk_callback_sse41+0xf52> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,191,21,0,0 // addps 0x15bf(%rip),%xmm0 # 5690 <_sk_callback_sse41+0xf12> + .byte 15,88,5,15,22,0,0 // addps 0x160f(%rip),%xmm0 # 57b0 <_sk_callback_sse41+0xf62> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,197,21,0,0 // addps 0x15c5(%rip),%xmm0 # 56a0 <_sk_callback_sse41+0xf22> + .byte 15,88,5,21,22,0,0 // addps 0x1615(%rip),%xmm0 # 57c0 <_sk_callback_sse41+0xf72> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,203,21,0,0 // addps 0x15cb(%rip),%xmm0 # 56b0 <_sk_callback_sse41+0xf32> + .byte 15,88,5,27,22,0,0 // addps 0x161b(%rip),%xmm0 # 57d0 <_sk_callback_sse41+0xf82> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,209,21,0,0 // addps 0x15d1(%rip),%xmm0 # 56c0 <_sk_callback_sse41+0xf42> + .byte 15,88,5,33,22,0,0 // addps 0x1621(%rip),%xmm0 # 57e0 <_sk_callback_sse41+0xf92> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 @@ -25104,12 +25549,12 @@ _sk_gradient_sse41: .byte 76,139,0 // mov (%rax),%r8 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,2 // cmp $0x2,%r8 - .byte 114,50 // jb 413d <_sk_gradient_sse41+0x41> + .byte 114,50 // jb 420d <_sk_gradient_sse41+0x41> .byte 72,139,72,72 // mov 0x48(%rax),%rcx .byte 73,255,200 // dec %r8 .byte 72,131,193,4 // add $0x4,%rcx .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 15,40,21,175,21,0,0 // movaps 0x15af(%rip),%xmm2 # 56d0 <_sk_callback_sse41+0xf52> + .byte 15,40,21,255,21,0,0 // movaps 0x15ff(%rip),%xmm2 # 57f0 <_sk_callback_sse41+0xfa2> .byte 243,15,16,25 // movss (%rcx),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 @@ -25117,7 +25562,7 @@ _sk_gradient_sse41: .byte 102,15,254,203 // paddd %xmm3,%xmm1 .byte 72,131,193,4 // add $0x4,%rcx .byte 73,255,200 // dec %r8 - .byte 117,228 // jne 4121 <_sk_gradient_sse41+0x25> + .byte 117,228 // jne 41f1 <_sk_gradient_sse41+0x25> .byte 65,86 // push %r14 .byte 83 // push %rbx .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 @@ -25248,26 +25693,26 @@ _sk_xy_to_unit_angle_sse41: .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,40,236 // movaps %xmm12,%xmm13 .byte 69,15,89,237 // mulps %xmm13,%xmm13 - .byte 68,15,40,21,81,19,0,0 // movaps 0x1351(%rip),%xmm10 # 56e0 <_sk_callback_sse41+0xf62> + .byte 68,15,40,21,161,19,0,0 // movaps 0x13a1(%rip),%xmm10 # 5800 <_sk_callback_sse41+0xfb2> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,85,19,0,0 // addps 0x1355(%rip),%xmm10 # 56f0 <_sk_callback_sse41+0xf72> + .byte 68,15,88,21,165,19,0,0 // addps 0x13a5(%rip),%xmm10 # 5810 <_sk_callback_sse41+0xfc2> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,89,19,0,0 // addps 0x1359(%rip),%xmm10 # 5700 <_sk_callback_sse41+0xf82> + .byte 68,15,88,21,169,19,0,0 // addps 0x13a9(%rip),%xmm10 # 5820 <_sk_callback_sse41+0xfd2> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,93,19,0,0 // addps 0x135d(%rip),%xmm10 # 5710 <_sk_callback_sse41+0xf92> + .byte 68,15,88,21,173,19,0,0 // addps 0x13ad(%rip),%xmm10 # 5830 <_sk_callback_sse41+0xfe2> .byte 69,15,89,212 // mulps %xmm12,%xmm10 .byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0 - .byte 68,15,40,29,92,19,0,0 // movaps 0x135c(%rip),%xmm11 # 5720 <_sk_callback_sse41+0xfa2> + .byte 68,15,40,29,172,19,0,0 // movaps 0x13ac(%rip),%xmm11 # 5840 <_sk_callback_sse41+0xff2> .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10 .byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9 - .byte 68,15,40,29,85,19,0,0 // movaps 0x1355(%rip),%xmm11 # 5730 <_sk_callback_sse41+0xfb2> + .byte 68,15,40,29,165,19,0,0 // movaps 0x13a5(%rip),%xmm11 # 5850 <_sk_callback_sse41+0x1002> .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10 .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0 - .byte 68,15,40,13,71,19,0,0 // movaps 0x1347(%rip),%xmm9 # 5740 <_sk_callback_sse41+0xfc2> + .byte 68,15,40,13,151,19,0,0 // movaps 0x1397(%rip),%xmm9 # 5860 <_sk_callback_sse41+0x1012> .byte 69,15,92,202 // subps %xmm10,%xmm9 .byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10 .byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8 @@ -25293,7 +25738,7 @@ HIDDEN _sk_save_xy_sse41 FUNCTION(_sk_save_xy_sse41) _sk_save_xy_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,27,19,0,0 // movaps 0x131b(%rip),%xmm8 # 5750 <_sk_callback_sse41+0xfd2> + .byte 68,15,40,5,107,19,0,0 // movaps 0x136b(%rip),%xmm8 # 5870 <_sk_callback_sse41+0x1022> .byte 15,17,0 // movups %xmm0,(%rax) .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,88,200 // addps %xmm8,%xmm9 @@ -25337,8 +25782,8 @@ _sk_bilinear_nx_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,157,18,0,0 // addps 0x129d(%rip),%xmm0 # 5760 <_sk_callback_sse41+0xfe2> - .byte 68,15,40,13,165,18,0,0 // movaps 0x12a5(%rip),%xmm9 # 5770 <_sk_callback_sse41+0xff2> + .byte 15,88,5,237,18,0,0 // addps 0x12ed(%rip),%xmm0 # 5880 <_sk_callback_sse41+0x1032> + .byte 68,15,40,13,245,18,0,0 // movaps 0x12f5(%rip),%xmm9 # 5890 <_sk_callback_sse41+0x1042> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -25351,7 +25796,7 @@ _sk_bilinear_px_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,148,18,0,0 // addps 0x1294(%rip),%xmm0 # 5780 <_sk_callback_sse41+0x1002> + .byte 15,88,5,228,18,0,0 // addps 0x12e4(%rip),%xmm0 # 58a0 <_sk_callback_sse41+0x1052> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -25363,8 +25808,8 @@ _sk_bilinear_ny_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,134,18,0,0 // addps 0x1286(%rip),%xmm1 # 5790 <_sk_callback_sse41+0x1012> - .byte 68,15,40,13,142,18,0,0 // movaps 0x128e(%rip),%xmm9 # 57a0 <_sk_callback_sse41+0x1022> + .byte 15,88,13,214,18,0,0 // addps 0x12d6(%rip),%xmm1 # 58b0 <_sk_callback_sse41+0x1062> + .byte 68,15,40,13,222,18,0,0 // movaps 0x12de(%rip),%xmm9 # 58c0 <_sk_callback_sse41+0x1072> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -25377,7 +25822,7 @@ _sk_bilinear_py_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,124,18,0,0 // addps 0x127c(%rip),%xmm1 # 57b0 <_sk_callback_sse41+0x1032> + .byte 15,88,13,204,18,0,0 // addps 0x12cc(%rip),%xmm1 # 58d0 <_sk_callback_sse41+0x1082> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -25389,13 +25834,13 @@ _sk_bicubic_n3x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,111,18,0,0 // addps 0x126f(%rip),%xmm0 # 57c0 <_sk_callback_sse41+0x1042> - .byte 68,15,40,13,119,18,0,0 // movaps 0x1277(%rip),%xmm9 # 57d0 <_sk_callback_sse41+0x1052> + .byte 15,88,5,191,18,0,0 // addps 0x12bf(%rip),%xmm0 # 58e0 <_sk_callback_sse41+0x1092> + .byte 68,15,40,13,199,18,0,0 // movaps 0x12c7(%rip),%xmm9 # 58f0 <_sk_callback_sse41+0x10a2> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,115,18,0,0 // mulps 0x1273(%rip),%xmm9 # 57e0 <_sk_callback_sse41+0x1062> - .byte 68,15,88,13,123,18,0,0 // addps 0x127b(%rip),%xmm9 # 57f0 <_sk_callback_sse41+0x1072> + .byte 68,15,89,13,195,18,0,0 // mulps 0x12c3(%rip),%xmm9 # 5900 <_sk_callback_sse41+0x10b2> + .byte 68,15,88,13,203,18,0,0 // addps 0x12cb(%rip),%xmm9 # 5910 <_sk_callback_sse41+0x10c2> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -25408,16 +25853,16 @@ _sk_bicubic_n1x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,106,18,0,0 // addps 0x126a(%rip),%xmm0 # 5800 <_sk_callback_sse41+0x1082> - .byte 68,15,40,13,114,18,0,0 // movaps 0x1272(%rip),%xmm9 # 5810 <_sk_callback_sse41+0x1092> + .byte 15,88,5,186,18,0,0 // addps 0x12ba(%rip),%xmm0 # 5920 <_sk_callback_sse41+0x10d2> + .byte 68,15,40,13,194,18,0,0 // movaps 0x12c2(%rip),%xmm9 # 5930 <_sk_callback_sse41+0x10e2> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,118,18,0,0 // movaps 0x1276(%rip),%xmm8 # 5820 <_sk_callback_sse41+0x10a2> + .byte 68,15,40,5,198,18,0,0 // movaps 0x12c6(%rip),%xmm8 # 5940 <_sk_callback_sse41+0x10f2> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,122,18,0,0 // addps 0x127a(%rip),%xmm8 # 5830 <_sk_callback_sse41+0x10b2> + .byte 68,15,88,5,202,18,0,0 // addps 0x12ca(%rip),%xmm8 # 5950 <_sk_callback_sse41+0x1102> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,126,18,0,0 // addps 0x127e(%rip),%xmm8 # 5840 <_sk_callback_sse41+0x10c2> + .byte 68,15,88,5,206,18,0,0 // addps 0x12ce(%rip),%xmm8 # 5960 <_sk_callback_sse41+0x1112> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,130,18,0,0 // addps 0x1282(%rip),%xmm8 # 5850 <_sk_callback_sse41+0x10d2> + .byte 68,15,88,5,210,18,0,0 // addps 0x12d2(%rip),%xmm8 # 5970 <_sk_callback_sse41+0x1122> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -25427,17 +25872,17 @@ HIDDEN _sk_bicubic_p1x_sse41 FUNCTION(_sk_bicubic_p1x_sse41) _sk_bicubic_p1x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,124,18,0,0 // movaps 0x127c(%rip),%xmm8 # 5860 <_sk_callback_sse41+0x10e2> + .byte 68,15,40,5,204,18,0,0 // movaps 0x12cc(%rip),%xmm8 # 5980 <_sk_callback_sse41+0x1132> .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,21,120,18,0,0 // movaps 0x1278(%rip),%xmm10 # 5870 <_sk_callback_sse41+0x10f2> + .byte 68,15,40,21,200,18,0,0 // movaps 0x12c8(%rip),%xmm10 # 5990 <_sk_callback_sse41+0x1142> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,124,18,0,0 // addps 0x127c(%rip),%xmm10 # 5880 <_sk_callback_sse41+0x1102> + .byte 68,15,88,21,204,18,0,0 // addps 0x12cc(%rip),%xmm10 # 59a0 <_sk_callback_sse41+0x1152> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,120,18,0,0 // addps 0x1278(%rip),%xmm10 # 5890 <_sk_callback_sse41+0x1112> + .byte 68,15,88,21,200,18,0,0 // addps 0x12c8(%rip),%xmm10 # 59b0 <_sk_callback_sse41+0x1162> .byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -25449,11 +25894,11 @@ _sk_bicubic_p3x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,107,18,0,0 // addps 0x126b(%rip),%xmm0 # 58a0 <_sk_callback_sse41+0x1122> + .byte 15,88,5,187,18,0,0 // addps 0x12bb(%rip),%xmm0 # 59c0 <_sk_callback_sse41+0x1172> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,107,18,0,0 // mulps 0x126b(%rip),%xmm8 # 58b0 <_sk_callback_sse41+0x1132> - .byte 68,15,88,5,115,18,0,0 // addps 0x1273(%rip),%xmm8 # 58c0 <_sk_callback_sse41+0x1142> + .byte 68,15,89,5,187,18,0,0 // mulps 0x12bb(%rip),%xmm8 # 59d0 <_sk_callback_sse41+0x1182> + .byte 68,15,88,5,195,18,0,0 // addps 0x12c3(%rip),%xmm8 # 59e0 <_sk_callback_sse41+0x1192> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -25466,13 +25911,13 @@ _sk_bicubic_n3y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,97,18,0,0 // addps 0x1261(%rip),%xmm1 # 58d0 <_sk_callback_sse41+0x1152> - .byte 68,15,40,13,105,18,0,0 // movaps 0x1269(%rip),%xmm9 # 58e0 <_sk_callback_sse41+0x1162> + .byte 15,88,13,177,18,0,0 // addps 0x12b1(%rip),%xmm1 # 59f0 <_sk_callback_sse41+0x11a2> + .byte 68,15,40,13,185,18,0,0 // movaps 0x12b9(%rip),%xmm9 # 5a00 <_sk_callback_sse41+0x11b2> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,101,18,0,0 // mulps 0x1265(%rip),%xmm9 # 58f0 <_sk_callback_sse41+0x1172> - .byte 68,15,88,13,109,18,0,0 // addps 0x126d(%rip),%xmm9 # 5900 <_sk_callback_sse41+0x1182> + .byte 68,15,89,13,181,18,0,0 // mulps 0x12b5(%rip),%xmm9 # 5a10 <_sk_callback_sse41+0x11c2> + .byte 68,15,88,13,189,18,0,0 // addps 0x12bd(%rip),%xmm9 # 5a20 <_sk_callback_sse41+0x11d2> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -25485,16 +25930,16 @@ _sk_bicubic_n1y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,91,18,0,0 // addps 0x125b(%rip),%xmm1 # 5910 <_sk_callback_sse41+0x1192> - .byte 68,15,40,13,99,18,0,0 // movaps 0x1263(%rip),%xmm9 # 5920 <_sk_callback_sse41+0x11a2> + .byte 15,88,13,171,18,0,0 // addps 0x12ab(%rip),%xmm1 # 5a30 <_sk_callback_sse41+0x11e2> + .byte 68,15,40,13,179,18,0,0 // movaps 0x12b3(%rip),%xmm9 # 5a40 <_sk_callback_sse41+0x11f2> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,103,18,0,0 // movaps 0x1267(%rip),%xmm8 # 5930 <_sk_callback_sse41+0x11b2> + .byte 68,15,40,5,183,18,0,0 // movaps 0x12b7(%rip),%xmm8 # 5a50 <_sk_callback_sse41+0x1202> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,107,18,0,0 // addps 0x126b(%rip),%xmm8 # 5940 <_sk_callback_sse41+0x11c2> + .byte 68,15,88,5,187,18,0,0 // addps 0x12bb(%rip),%xmm8 # 5a60 <_sk_callback_sse41+0x1212> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,111,18,0,0 // addps 0x126f(%rip),%xmm8 # 5950 <_sk_callback_sse41+0x11d2> + .byte 68,15,88,5,191,18,0,0 // addps 0x12bf(%rip),%xmm8 # 5a70 <_sk_callback_sse41+0x1222> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,115,18,0,0 // addps 0x1273(%rip),%xmm8 # 5960 <_sk_callback_sse41+0x11e2> + .byte 68,15,88,5,195,18,0,0 // addps 0x12c3(%rip),%xmm8 # 5a80 <_sk_callback_sse41+0x1232> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -25504,17 +25949,17 @@ HIDDEN _sk_bicubic_p1y_sse41 FUNCTION(_sk_bicubic_p1y_sse41) _sk_bicubic_p1y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,109,18,0,0 // movaps 0x126d(%rip),%xmm8 # 5970 <_sk_callback_sse41+0x11f2> + .byte 68,15,40,5,189,18,0,0 // movaps 0x12bd(%rip),%xmm8 # 5a90 <_sk_callback_sse41+0x1242> .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9 .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 68,15,40,21,104,18,0,0 // movaps 0x1268(%rip),%xmm10 # 5980 <_sk_callback_sse41+0x1202> + .byte 68,15,40,21,184,18,0,0 // movaps 0x12b8(%rip),%xmm10 # 5aa0 <_sk_callback_sse41+0x1252> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,108,18,0,0 // addps 0x126c(%rip),%xmm10 # 5990 <_sk_callback_sse41+0x1212> + .byte 68,15,88,21,188,18,0,0 // addps 0x12bc(%rip),%xmm10 # 5ab0 <_sk_callback_sse41+0x1262> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,104,18,0,0 // addps 0x1268(%rip),%xmm10 # 59a0 <_sk_callback_sse41+0x1222> + .byte 68,15,88,21,184,18,0,0 // addps 0x12b8(%rip),%xmm10 # 5ac0 <_sk_callback_sse41+0x1272> .byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -25526,11 +25971,11 @@ _sk_bicubic_p3y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,90,18,0,0 // addps 0x125a(%rip),%xmm1 # 59b0 <_sk_callback_sse41+0x1232> + .byte 15,88,13,170,18,0,0 // addps 0x12aa(%rip),%xmm1 # 5ad0 <_sk_callback_sse41+0x1282> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,90,18,0,0 // mulps 0x125a(%rip),%xmm8 # 59c0 <_sk_callback_sse41+0x1242> - .byte 68,15,88,5,98,18,0,0 // addps 0x1262(%rip),%xmm8 # 59d0 <_sk_callback_sse41+0x1252> + .byte 68,15,89,5,170,18,0,0 // mulps 0x12aa(%rip),%xmm8 # 5ae0 <_sk_callback_sse41+0x1292> + .byte 68,15,88,5,178,18,0,0 // addps 0x12b2(%rip),%xmm8 # 5af0 <_sk_callback_sse41+0x12a2> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -25749,11 +26194,11 @@ BALIGN16 .byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%rdi) .byte 0,224 // add %ah,%al .byte 64,0,0 // add %al,(%rax) - .byte 224,64 // loopne 4a38 <.literal16+0x1d8> + .byte 224,64 // loopne 4b08 <.literal16+0x1d8> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 4a3c <.literal16+0x1dc> + .byte 224,64 // loopne 4b0c <.literal16+0x1dc> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 4a40 <.literal16+0x1e0> + .byte 224,64 // loopne 4b10 <.literal16+0x1e0> .byte 154 // (bad) .byte 153 // cltd .byte 153 // cltd @@ -25773,13 +26218,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a61 <.literal16+0x201> + .byte 71,225,61 // rex.RXB loope 4b31 <.literal16+0x201> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a65 <.literal16+0x205> + .byte 71,225,61 // rex.RXB loope 4b35 <.literal16+0x205> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a69 <.literal16+0x209> + .byte 71,225,61 // rex.RXB loope 4b39 <.literal16+0x209> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a6d <.literal16+0x20d> + .byte 71,225,61 // rex.RXB loope 4b3d <.literal16+0x20d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -25804,13 +26249,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4aa1 <.literal16+0x241> + .byte 71,225,61 // rex.RXB loope 4b71 <.literal16+0x241> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4aa5 <.literal16+0x245> + .byte 71,225,61 // rex.RXB loope 4b75 <.literal16+0x245> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4aa9 <.literal16+0x249> + .byte 71,225,61 // rex.RXB loope 4b79 <.literal16+0x249> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4aad <.literal16+0x24d> + .byte 71,225,61 // rex.RXB loope 4b7d <.literal16+0x24d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -25835,13 +26280,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4ae1 <.literal16+0x281> + .byte 71,225,61 // rex.RXB loope 4bb1 <.literal16+0x281> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4ae5 <.literal16+0x285> + .byte 71,225,61 // rex.RXB loope 4bb5 <.literal16+0x285> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4ae9 <.literal16+0x289> + .byte 71,225,61 // rex.RXB loope 4bb9 <.literal16+0x289> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4aed <.literal16+0x28d> + .byte 71,225,61 // rex.RXB loope 4bbd <.literal16+0x28d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -25866,23 +26311,58 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4b21 <.literal16+0x2c1> + .byte 71,225,61 // rex.RXB loope 4bf1 <.literal16+0x2c1> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4b25 <.literal16+0x2c5> + .byte 71,225,61 // rex.RXB loope 4bf5 <.literal16+0x2c5> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4b29 <.literal16+0x2c9> + .byte 71,225,61 // rex.RXB loope 4bf9 <.literal16+0x2c9> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4b2d <.literal16+0x2cd> + .byte 71,225,61 // rex.RXB loope 4bfd <.literal16+0x2cd> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) .byte 63 // (bad) .byte 0,0 // add %al,(%rax) - .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 128,63,255 // cmpb $0xff,(%rdi) + .byte 0,0 // add %al,(%rax) + .byte 0,255 // add %bh,%bh + .byte 0,0 // add %al,(%rax) + .byte 0,255 // add %bh,%bh + .byte 0,0 // add %al,(%rax) + .byte 0,255 // add %bh,%bh + .byte 0,0 // add %al,(%rax) + .byte 0,1 // add %al,(%rcx) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004be8 <_sk_callback_sse41+0xa00039a> + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3004bf0 <_sk_callback_sse41+0x30003a2> + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,6 // incl (%rsi) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,10 // decl (%rdx) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,14 // decl (%rsi) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,0 // incl (%rax) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) .byte 63 // (bad) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax) + .byte 67,0,0 // rex.XB add %al,(%r8) + .byte 127,67 // jg 4c5b <.literal16+0x32b> + .byte 0,0 // add %al,(%rax) + .byte 127,67 // jg 4c5f <.literal16+0x32f> + .byte 0,0 // add %al,(%rax) + .byte 127,67 // jg 4c63 <.literal16+0x333> + .byte 0,0 // add %al,(%rax) + .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) .byte 63 // (bad) .byte 0,0 // add %al,(%rax) @@ -25894,7 +26374,10 @@ BALIGN16 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) .byte 63 // (bad) .byte 0,0 // add %al,(%rax) - .byte 128,63,145 // cmpb $0x91,(%rdi) + .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) + .byte 63 // (bad) + .byte 145 // xchg %eax,%ecx .byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%rsi) .byte 145 // xchg %eax,%ecx .byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%rsi) @@ -26099,13 +26582,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 4cf9 <.literal16+0x499> + .byte 224,7 // loopne 4e19 <.literal16+0x4e9> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 4cfd <.literal16+0x49d> + .byte 224,7 // loopne 4e1d <.literal16+0x4ed> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 4d01 <.literal16+0x4a1> + .byte 224,7 // loopne 4e21 <.literal16+0x4f1> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 4d05 <.literal16+0x4a5> + .byte 224,7 // loopne 4e25 <.literal16+0x4f5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -26139,10 +26622,10 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004d48 <_sk_callback_sse41+0xa0005ca> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004e68 <_sk_callback_sse41+0xa00061a> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3004d50 <_sk_callback_sse41+0x30005d2> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3004e70 <_sk_callback_sse41+0x3000622> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -26197,11 +26680,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 4e1b <.literal16+0x5bb> + .byte 127,67 // jg 4f3b <.literal16+0x60b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 4e1f <.literal16+0x5bf> + .byte 127,67 // jg 4f3f <.literal16+0x60f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 4e23 <.literal16+0x5c3> + .byte 127,67 // jg 4f43 <.literal16+0x613> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax) @@ -26216,16 +26699,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 4e14 <.literal16+0x5b4> + .byte 127,0 // jg 4f34 <.literal16+0x604> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4e18 <.literal16+0x5b8> + .byte 127,0 // jg 4f38 <.literal16+0x608> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4e1c <.literal16+0x5bc> + .byte 127,0 // jg 4f3c <.literal16+0x60c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4e20 <.literal16+0x5c0> + .byte 127,0 // jg 4f40 <.literal16+0x610> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -26234,7 +26717,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4ea5 <.literal16+0x645> + .byte 119,115 // ja 4fc5 <.literal16+0x695> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -26245,7 +26728,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 4e09 <.literal16+0x5a9> + .byte 117,191 // jne 4f29 <.literal16+0x5f9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -26257,7 +26740,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a38e4a <_sk_callback_sse41+0xffffffffe9a346cc> + .byte 233,220,63,163,233 // jmpq ffffffffe9a38f6a <_sk_callback_sse41+0xffffffffe9a3471c> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -26312,16 +26795,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 4ee4 <.literal16+0x684> + .byte 127,0 // jg 5004 <.literal16+0x6d4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4ee8 <.literal16+0x688> + .byte 127,0 // jg 5008 <.literal16+0x6d8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4eec <.literal16+0x68c> + .byte 127,0 // jg 500c <.literal16+0x6dc> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4ef0 <.literal16+0x690> + .byte 127,0 // jg 5010 <.literal16+0x6e0> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -26330,7 +26813,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4f75 <.literal16+0x715> + .byte 119,115 // ja 5095 <.literal16+0x765> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -26341,7 +26824,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 4ed9 <.literal16+0x679> + .byte 117,191 // jne 4ff9 <.literal16+0x6c9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -26353,7 +26836,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a38f1a <_sk_callback_sse41+0xffffffffe9a3479c> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3903a <_sk_callback_sse41+0xffffffffe9a347ec> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -26408,16 +26891,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 4fb4 <.literal16+0x754> + .byte 127,0 // jg 50d4 <.literal16+0x7a4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4fb8 <.literal16+0x758> + .byte 127,0 // jg 50d8 <.literal16+0x7a8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4fbc <.literal16+0x75c> + .byte 127,0 // jg 50dc <.literal16+0x7ac> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4fc0 <.literal16+0x760> + .byte 127,0 // jg 50e0 <.literal16+0x7b0> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -26426,7 +26909,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5045 <.literal16+0x7e5> + .byte 119,115 // ja 5165 <.literal16+0x835> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -26437,7 +26920,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 4fa9 <.literal16+0x749> + .byte 117,191 // jne 50c9 <.literal16+0x799> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -26449,7 +26932,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a38fea <_sk_callback_sse41+0xffffffffe9a3486c> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3910a <_sk_callback_sse41+0xffffffffe9a348bc> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -26504,16 +26987,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5084 <.literal16+0x824> + .byte 127,0 // jg 51a4 <.literal16+0x874> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5088 <.literal16+0x828> + .byte 127,0 // jg 51a8 <.literal16+0x878> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 508c <.literal16+0x82c> + .byte 127,0 // jg 51ac <.literal16+0x87c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5090 <.literal16+0x830> + .byte 127,0 // jg 51b0 <.literal16+0x880> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -26522,7 +27005,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5115 <.literal16+0x8b5> + .byte 119,115 // ja 5235 <.literal16+0x905> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -26533,7 +27016,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 5079 <.literal16+0x819> + .byte 117,191 // jne 5199 <.literal16+0x869> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -26545,7 +27028,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a390ba <_sk_callback_sse41+0xffffffffe9a3493c> + .byte 233,220,63,163,233 // jmpq ffffffffe9a391da <_sk_callback_sse41+0xffffffffe9a3498c> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -26596,13 +27079,13 @@ BALIGN16 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 - .byte 127,67 // jg 5197 <.literal16+0x937> + .byte 127,67 // jg 52b7 <.literal16+0x987> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 519b <.literal16+0x93b> + .byte 127,67 // jg 52bb <.literal16+0x98b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 519f <.literal16+0x93f> + .byte 127,67 // jg 52bf <.literal16+0x98f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 51a3 <.literal16+0x943> + .byte 127,67 // jg 52c3 <.literal16+0x993> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -26649,16 +27132,16 @@ BALIGN16 .byte 128,3,62 // addb $0x3e,(%rbx) .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 5223 <.literal16+0x9c3> + .byte 118,63 // jbe 5343 <.literal16+0xa13> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 5227 <.literal16+0x9c7> + .byte 118,63 // jbe 5347 <.literal16+0xa17> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 522b <.literal16+0x9cb> + .byte 118,63 // jbe 534b <.literal16+0xa1b> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 522f <.literal16+0x9cf> + .byte 118,63 // jbe 534f <.literal16+0xa1f> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) @@ -26670,11 +27153,11 @@ BALIGN16 .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 526b <.literal16+0xa0b> + .byte 127,67 // jg 538b <.literal16+0xa5b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 526f <.literal16+0xa0f> + .byte 127,67 // jg 538f <.literal16+0xa5f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5273 <.literal16+0xa13> + .byte 127,67 // jg 5393 <.literal16+0xa63> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,0,0,128,63 // addb $0x3f,-0x7fffffc5(%rax) @@ -26703,7 +27186,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30052a0 <_sk_callback_sse41+0x3000b22> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30053c0 <_sk_callback_sse41+0x3000b72> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -26732,13 +27215,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 52d9 <.literal16+0xa79> + .byte 224,7 // loopne 53f9 <.literal16+0xac9> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 52dd <.literal16+0xa7d> + .byte 224,7 // loopne 53fd <.literal16+0xacd> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 52e1 <.literal16+0xa81> + .byte 224,7 // loopne 5401 <.literal16+0xad1> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 52e5 <.literal16+0xa85> + .byte 224,7 // loopne 5405 <.literal16+0xad5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -26784,13 +27267,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 5349 <.literal16+0xae9> + .byte 224,7 // loopne 5469 <.literal16+0xb39> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 534d <.literal16+0xaed> + .byte 224,7 // loopne 546d <.literal16+0xb3d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5351 <.literal16+0xaf1> + .byte 224,7 // loopne 5471 <.literal16+0xb41> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5355 <.literal16+0xaf5> + .byte 224,7 // loopne 5475 <.literal16+0xb45> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -26828,13 +27311,13 @@ BALIGN16 .byte 65,0,0 // add %al,(%r8) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 53e6 <.literal16+0xb86> + .byte 124,66 // jl 5506 <.literal16+0xbd6> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 53ea <.literal16+0xb8a> + .byte 124,66 // jl 550a <.literal16+0xbda> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 53ee <.literal16+0xb8e> + .byte 124,66 // jl 550e <.literal16+0xbde> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 53f2 <.literal16+0xb92> + .byte 124,66 // jl 5512 <.literal16+0xbe2> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 0,240 // add %dh,%al @@ -26924,13 +27407,13 @@ BALIGN16 .byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax) .byte 61,137,136,136,61 // cmp $0x3d888889,%eax .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 54f5 <.literal16+0xc95> + .byte 112,65 // jo 5615 <.literal16+0xce5> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 54f9 <.literal16+0xc99> + .byte 112,65 // jo 5619 <.literal16+0xce9> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 54fd <.literal16+0xc9d> + .byte 112,65 // jo 561d <.literal16+0xced> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 5501 <.literal16+0xca1> + .byte 112,65 // jo 5621 <.literal16+0xcf1> .byte 255,0 // incl (%rax) .byte 0,0 // add %al,(%rax) .byte 255,0 // incl (%rax) @@ -26945,7 +27428,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30054f0 <_sk_callback_sse41+0x3000d72> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005610 <_sk_callback_sse41+0x3000dc2> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -26972,7 +27455,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005530 <_sk_callback_sse41+0x3000db2> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005650 <_sk_callback_sse41+0x3000e02> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -26987,11 +27470,11 @@ BALIGN16 .byte 255,0 // incl (%rax) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 558b <.literal16+0xd2b> + .byte 127,67 // jg 56ab <.literal16+0xd7b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 558f <.literal16+0xd2f> + .byte 127,67 // jg 56af <.literal16+0xd7f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5593 <.literal16+0xd33> + .byte 127,67 // jg 56b3 <.literal16+0xd83> .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) .byte 0,0 // add %al,(%rax) .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) @@ -27067,13 +27550,13 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 255 // (bad) - .byte 127,71 // jg 565b <.literal16+0xdfb> + .byte 127,71 // jg 577b <.literal16+0xe4b> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 565f <.literal16+0xdff> + .byte 127,71 // jg 577f <.literal16+0xe4f> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 5663 <.literal16+0xe03> + .byte 127,71 // jg 5783 <.literal16+0xe53> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 5667 <.literal16+0xe07> + .byte 127,71 // jg 5787 <.literal16+0xe57> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -27119,10 +27602,10 @@ BALIGN16 .byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax .byte 152 // cwtl .byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx) - .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0679a <_sk_callback_sse41+0x2dc0201c> + .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc068ba <_sk_callback_sse41+0x2dc0206c> .byte 17,192 // adc %eax,%eax .byte 45,16,17,192,18 // sub $0x12c01110,%eax - .byte 120,57 // js 56cc <.literal16+0xe6c> + .byte 120,57 // js 57ec <.literal16+0xebc> .byte 64,18,120,57 // adc 0x39(%rax),%dil .byte 64,18,120,57 // adc 0x39(%rax),%dil .byte 64,18,120,57 // adc 0x39(%rax),%dil @@ -27244,11 +27727,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 5802 <.literal16+0xfa2> + .byte 62,114,28 // jb,pt 5922 <.literal16+0xff2> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5806 <.literal16+0xfa6> + .byte 62,114,28 // jb,pt 5926 <.literal16+0xff6> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 580a <.literal16+0xfaa> + .byte 62,114,28 // jb,pt 592a <.literal16+0xffa> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -27292,7 +27775,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e695 <_sk_callback_sse41+0x3d639f17> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e7b5 <_sk_callback_sse41+0x3d639f67> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -27318,7 +27801,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e6d5 <_sk_callback_sse41+0x3d639f57> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e7f5 <_sk_callback_sse41+0x3d639fa7> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -27327,13 +27810,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 58ce <.literal16+0x106e> + .byte 114,28 // jb 59ee <.literal16+0x10be> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 58d2 <.literal16+0x1072> + .byte 62,114,28 // jb,pt 59f2 <.literal16+0x10c2> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 58d6 <.literal16+0x1076> + .byte 62,114,28 // jb,pt 59f6 <.literal16+0x10c6> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 58da <.literal16+0x107a> + .byte 62,114,28 // jb,pt 59fa <.literal16+0x10ca> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -27354,11 +27837,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 5912 <.literal16+0x10b2> + .byte 62,114,28 // jb,pt 5a32 <.literal16+0x1102> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5916 <.literal16+0x10b6> + .byte 62,114,28 // jb,pt 5a36 <.literal16+0x1106> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 591a <.literal16+0x10ba> + .byte 62,114,28 // jb,pt 5a3a <.literal16+0x110a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -27402,7 +27885,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e7a5 <_sk_callback_sse41+0x3d63a027> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e8c5 <_sk_callback_sse41+0x3d63a077> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -27428,7 +27911,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e7e5 <_sk_callback_sse41+0x3d63a067> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e905 <_sk_callback_sse41+0x3d63a0b7> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -27437,13 +27920,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 59de <.literal16+0x117e> + .byte 114,28 // jb 5afe <.literal16+0x11ce> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 59e2 <_sk_callback_sse41+0x1264> + .byte 62,114,28 // jb,pt 5b02 <_sk_callback_sse41+0x12b4> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 59e6 <_sk_callback_sse41+0x1268> + .byte 62,114,28 // jb,pt 5b06 <_sk_callback_sse41+0x12b8> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 59ea <_sk_callback_sse41+0x126c> + .byte 62,114,28 // jb,pt 5b0a <_sk_callback_sse41+0x12bc> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -27513,7 +27996,7 @@ _sk_seed_shader_sse2: .byte 102,15,110,199 // movd %edi,%xmm0 .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0 .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 - .byte 15,40,21,116,76,0,0 // movaps 0x4c74(%rip),%xmm2 # 4cf0 <_sk_callback_sse2+0xd9> + .byte 15,40,21,84,77,0,0 // movaps 0x4d54(%rip),%xmm2 # 4dd0 <_sk_callback_sse2+0xe4> .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,16,2 // movups (%rdx),%xmm0 .byte 15,88,193 // addps %xmm1,%xmm0 @@ -27522,7 +28005,7 @@ _sk_seed_shader_sse2: .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,21,99,76,0,0 // movaps 0x4c63(%rip),%xmm2 # 4d00 <_sk_callback_sse2+0xe9> + .byte 15,40,21,67,77,0,0 // movaps 0x4d43(%rip),%xmm2 # 4de0 <_sk_callback_sse2+0xf4> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,87,237 // xorps %xmm5,%xmm5 @@ -27543,14 +28026,14 @@ _sk_dither_sse2: .byte 102,68,15,110,1 // movd (%rcx),%xmm8 .byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8 .byte 102,69,15,239,193 // pxor %xmm9,%xmm8 - .byte 102,68,15,111,21,46,76,0,0 // movdqa 0x4c2e(%rip),%xmm10 # 4d10 <_sk_callback_sse2+0xf9> + .byte 102,68,15,111,21,14,77,0,0 // movdqa 0x4d0e(%rip),%xmm10 # 4df0 <_sk_callback_sse2+0x104> .byte 102,69,15,111,216 // movdqa %xmm8,%xmm11 .byte 102,69,15,219,218 // pand %xmm10,%xmm11 .byte 102,65,15,114,243,5 // pslld $0x5,%xmm11 .byte 102,69,15,219,209 // pand %xmm9,%xmm10 .byte 102,65,15,114,242,4 // pslld $0x4,%xmm10 - .byte 102,68,15,111,37,26,76,0,0 // movdqa 0x4c1a(%rip),%xmm12 # 4d20 <_sk_callback_sse2+0x109> - .byte 102,68,15,111,45,33,76,0,0 // movdqa 0x4c21(%rip),%xmm13 # 4d30 <_sk_callback_sse2+0x119> + .byte 102,68,15,111,37,250,76,0,0 // movdqa 0x4cfa(%rip),%xmm12 # 4e00 <_sk_callback_sse2+0x114> + .byte 102,68,15,111,45,1,77,0,0 // movdqa 0x4d01(%rip),%xmm13 # 4e10 <_sk_callback_sse2+0x124> .byte 102,69,15,111,240 // movdqa %xmm8,%xmm14 .byte 102,69,15,219,245 // pand %xmm13,%xmm14 .byte 102,65,15,114,246,2 // pslld $0x2,%xmm14 @@ -27566,8 +28049,8 @@ _sk_dither_sse2: .byte 102,69,15,235,198 // por %xmm14,%xmm8 .byte 102,69,15,235,197 // por %xmm13,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,220,75,0,0 // mulps 0x4bdc(%rip),%xmm8 # 4d40 <_sk_callback_sse2+0x129> - .byte 68,15,88,5,228,75,0,0 // addps 0x4be4(%rip),%xmm8 # 4d50 <_sk_callback_sse2+0x139> + .byte 68,15,89,5,188,76,0,0 // mulps 0x4cbc(%rip),%xmm8 # 4e20 <_sk_callback_sse2+0x134> + .byte 68,15,88,5,196,76,0,0 // addps 0x4cc4(%rip),%xmm8 # 4e30 <_sk_callback_sse2+0x144> .byte 243,68,15,16,80,8 // movss 0x8(%rax),%xmm10 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 @@ -27644,7 +28127,7 @@ HIDDEN _sk_srcatop_sse2 FUNCTION(_sk_srcatop_sse2) _sk_srcatop_sse2: .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 68,15,40,5,61,75,0,0 // movaps 0x4b3d(%rip),%xmm8 # 4d60 <_sk_callback_sse2+0x149> + .byte 68,15,40,5,29,76,0,0 // movaps 0x4c1d(%rip),%xmm8 # 4e40 <_sk_callback_sse2+0x154> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -27669,7 +28152,7 @@ FUNCTION(_sk_dstatop_sse2) _sk_dstatop_sse2: .byte 68,15,40,195 // movaps %xmm3,%xmm8 .byte 68,15,89,196 // mulps %xmm4,%xmm8 - .byte 68,15,40,13,0,75,0,0 // movaps 0x4b00(%rip),%xmm9 # 4d70 <_sk_callback_sse2+0x159> + .byte 68,15,40,13,224,75,0,0 // movaps 0x4be0(%rip),%xmm9 # 4e50 <_sk_callback_sse2+0x164> .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 @@ -27716,7 +28199,7 @@ HIDDEN _sk_srcout_sse2 .globl _sk_srcout_sse2 FUNCTION(_sk_srcout_sse2) _sk_srcout_sse2: - .byte 68,15,40,5,164,74,0,0 // movaps 0x4aa4(%rip),%xmm8 # 4d80 <_sk_callback_sse2+0x169> + .byte 68,15,40,5,132,75,0,0 // movaps 0x4b84(%rip),%xmm8 # 4e60 <_sk_callback_sse2+0x174> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 @@ -27729,7 +28212,7 @@ HIDDEN _sk_dstout_sse2 .globl _sk_dstout_sse2 FUNCTION(_sk_dstout_sse2) _sk_dstout_sse2: - .byte 68,15,40,5,148,74,0,0 // movaps 0x4a94(%rip),%xmm8 # 4d90 <_sk_callback_sse2+0x179> + .byte 68,15,40,5,116,75,0,0 // movaps 0x4b74(%rip),%xmm8 # 4e70 <_sk_callback_sse2+0x184> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 @@ -27746,7 +28229,7 @@ HIDDEN _sk_srcover_sse2 .globl _sk_srcover_sse2 FUNCTION(_sk_srcover_sse2) _sk_srcover_sse2: - .byte 68,15,40,5,119,74,0,0 // movaps 0x4a77(%rip),%xmm8 # 4da0 <_sk_callback_sse2+0x189> + .byte 68,15,40,5,87,75,0,0 // movaps 0x4b57(%rip),%xmm8 # 4e80 <_sk_callback_sse2+0x194> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -27766,7 +28249,7 @@ HIDDEN _sk_dstover_sse2 .globl _sk_dstover_sse2 FUNCTION(_sk_dstover_sse2) _sk_dstover_sse2: - .byte 68,15,40,5,75,74,0,0 // movaps 0x4a4b(%rip),%xmm8 # 4db0 <_sk_callback_sse2+0x199> + .byte 68,15,40,5,43,75,0,0 // movaps 0x4b2b(%rip),%xmm8 # 4e90 <_sk_callback_sse2+0x1a4> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -27794,7 +28277,7 @@ HIDDEN _sk_multiply_sse2 .globl _sk_multiply_sse2 FUNCTION(_sk_multiply_sse2) _sk_multiply_sse2: - .byte 68,15,40,5,31,74,0,0 // movaps 0x4a1f(%rip),%xmm8 # 4dc0 <_sk_callback_sse2+0x1a9> + .byte 68,15,40,5,255,74,0,0 // movaps 0x4aff(%rip),%xmm8 # 4ea0 <_sk_callback_sse2+0x1b4> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 69,15,40,209 // movaps %xmm9,%xmm10 @@ -27870,7 +28353,7 @@ HIDDEN _sk_xor__sse2 FUNCTION(_sk_xor__sse2) _sk_xor__sse2: .byte 68,15,40,195 // movaps %xmm3,%xmm8 - .byte 15,40,29,80,73,0,0 // movaps 0x4950(%rip),%xmm3 # 4dd0 <_sk_callback_sse2+0x1b9> + .byte 15,40,29,48,74,0,0 // movaps 0x4a30(%rip),%xmm3 # 4eb0 <_sk_callback_sse2+0x1c4> .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 @@ -27918,7 +28401,7 @@ _sk_darken_sse2: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,95,209 // maxps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,187,72,0,0 // movaps 0x48bb(%rip),%xmm2 # 4de0 <_sk_callback_sse2+0x1c9> + .byte 15,40,21,155,73,0,0 // movaps 0x499b(%rip),%xmm2 # 4ec0 <_sk_callback_sse2+0x1d4> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -27952,7 +28435,7 @@ _sk_lighten_sse2: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,96,72,0,0 // movaps 0x4860(%rip),%xmm2 # 4df0 <_sk_callback_sse2+0x1d9> + .byte 15,40,21,64,73,0,0 // movaps 0x4940(%rip),%xmm2 # 4ed0 <_sk_callback_sse2+0x1e4> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -27989,7 +28472,7 @@ _sk_difference_sse2: .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,250,71,0,0 // movaps 0x47fa(%rip),%xmm2 # 4e00 <_sk_callback_sse2+0x1e9> + .byte 15,40,21,218,72,0,0 // movaps 0x48da(%rip),%xmm2 # 4ee0 <_sk_callback_sse2+0x1f4> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -28016,7 +28499,7 @@ _sk_exclusion_sse2: .byte 15,89,214 // mulps %xmm6,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,202 // subps %xmm2,%xmm9 - .byte 15,40,13,187,71,0,0 // movaps 0x47bb(%rip),%xmm1 # 4e10 <_sk_callback_sse2+0x1f9> + .byte 15,40,13,155,72,0,0 // movaps 0x489b(%rip),%xmm1 # 4ef0 <_sk_callback_sse2+0x204> .byte 15,92,203 // subps %xmm3,%xmm1 .byte 15,89,207 // mulps %xmm7,%xmm1 .byte 15,88,217 // addps %xmm1,%xmm3 @@ -28030,7 +28513,7 @@ HIDDEN _sk_colorburn_sse2 FUNCTION(_sk_colorburn_sse2) _sk_colorburn_sse2: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,21,170,71,0,0 // movaps 0x47aa(%rip),%xmm10 # 4e20 <_sk_callback_sse2+0x209> + .byte 68,15,40,21,138,72,0,0 // movaps 0x488a(%rip),%xmm10 # 4f00 <_sk_callback_sse2+0x214> .byte 69,15,40,202 // movaps %xmm10,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 69,15,40,217 // movaps %xmm9,%xmm11 @@ -28124,7 +28607,7 @@ HIDDEN _sk_colordodge_sse2 FUNCTION(_sk_colordodge_sse2) _sk_colordodge_sse2: .byte 68,15,40,200 // movaps %xmm0,%xmm9 - .byte 68,15,40,21,96,70,0,0 // movaps 0x4660(%rip),%xmm10 # 4e30 <_sk_callback_sse2+0x219> + .byte 68,15,40,21,64,71,0,0 // movaps 0x4740(%rip),%xmm10 # 4f10 <_sk_callback_sse2+0x224> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 69,15,40,227 // movaps %xmm11,%xmm12 @@ -28218,7 +28701,7 @@ _sk_hardlight_sse2: .byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp) .byte 15,40,245 // movaps %xmm5,%xmm6 .byte 15,40,236 // movaps %xmm4,%xmm5 - .byte 68,15,40,29,21,69,0,0 // movaps 0x4515(%rip),%xmm11 # 4e40 <_sk_callback_sse2+0x229> + .byte 68,15,40,29,245,69,0,0 // movaps 0x45f5(%rip),%xmm11 # 4f20 <_sk_callback_sse2+0x234> .byte 69,15,40,211 // movaps %xmm11,%xmm10 .byte 68,15,92,215 // subps %xmm7,%xmm10 .byte 69,15,40,194 // movaps %xmm10,%xmm8 @@ -28306,7 +28789,7 @@ FUNCTION(_sk_overlay_sse2) _sk_overlay_sse2: .byte 68,15,40,193 // movaps %xmm1,%xmm8 .byte 68,15,40,232 // movaps %xmm0,%xmm13 - .byte 68,15,40,13,227,67,0,0 // movaps 0x43e3(%rip),%xmm9 # 4e50 <_sk_callback_sse2+0x239> + .byte 68,15,40,13,195,68,0,0 // movaps 0x44c3(%rip),%xmm9 # 4f30 <_sk_callback_sse2+0x244> .byte 69,15,40,209 // movaps %xmm9,%xmm10 .byte 68,15,92,215 // subps %xmm7,%xmm10 .byte 69,15,40,218 // movaps %xmm10,%xmm11 @@ -28397,7 +28880,7 @@ _sk_softlight_sse2: .byte 68,15,40,213 // movaps %xmm5,%xmm10 .byte 68,15,94,215 // divps %xmm7,%xmm10 .byte 69,15,84,212 // andps %xmm12,%xmm10 - .byte 68,15,40,13,160,66,0,0 // movaps 0x42a0(%rip),%xmm9 # 4e60 <_sk_callback_sse2+0x249> + .byte 68,15,40,13,128,67,0,0 // movaps 0x4380(%rip),%xmm9 # 4f40 <_sk_callback_sse2+0x254> .byte 69,15,40,249 // movaps %xmm9,%xmm15 .byte 69,15,92,250 // subps %xmm10,%xmm15 .byte 69,15,40,218 // movaps %xmm10,%xmm11 @@ -28410,10 +28893,10 @@ _sk_softlight_sse2: .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 65,15,88,194 // addps %xmm10,%xmm0 - .byte 68,15,40,53,122,66,0,0 // movaps 0x427a(%rip),%xmm14 # 4e70 <_sk_callback_sse2+0x259> + .byte 68,15,40,53,90,67,0,0 // movaps 0x435a(%rip),%xmm14 # 4f50 <_sk_callback_sse2+0x264> .byte 69,15,88,222 // addps %xmm14,%xmm11 .byte 68,15,89,216 // mulps %xmm0,%xmm11 - .byte 68,15,40,21,122,66,0,0 // movaps 0x427a(%rip),%xmm10 # 4e80 <_sk_callback_sse2+0x269> + .byte 68,15,40,21,90,67,0,0 // movaps 0x435a(%rip),%xmm10 # 4f60 <_sk_callback_sse2+0x274> .byte 69,15,89,234 // mulps %xmm10,%xmm13 .byte 69,15,88,235 // addps %xmm11,%xmm13 .byte 15,88,228 // addps %xmm4,%xmm4 @@ -28558,7 +29041,7 @@ _sk_hue_sse2: .byte 68,15,40,209 // movaps %xmm1,%xmm10 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 68,15,89,211 // mulps %xmm3,%xmm10 - .byte 68,15,40,5,189,64,0,0 // movaps 0x40bd(%rip),%xmm8 # 4ec0 <_sk_callback_sse2+0x2a9> + .byte 68,15,40,5,157,65,0,0 // movaps 0x419d(%rip),%xmm8 # 4fa0 <_sk_callback_sse2+0x2b4> .byte 69,15,40,216 // movaps %xmm8,%xmm11 .byte 15,40,207 // movaps %xmm7,%xmm1 .byte 68,15,92,217 // subps %xmm1,%xmm11 @@ -28604,12 +29087,12 @@ _sk_hue_sse2: .byte 69,15,84,206 // andps %xmm14,%xmm9 .byte 69,15,84,214 // andps %xmm14,%xmm10 .byte 65,15,84,214 // andps %xmm14,%xmm2 - .byte 68,15,40,61,209,63,0,0 // movaps 0x3fd1(%rip),%xmm15 # 4e90 <_sk_callback_sse2+0x279> + .byte 68,15,40,61,177,64,0,0 // movaps 0x40b1(%rip),%xmm15 # 4f70 <_sk_callback_sse2+0x284> .byte 65,15,89,231 // mulps %xmm15,%xmm4 - .byte 15,40,5,214,63,0,0 // movaps 0x3fd6(%rip),%xmm0 # 4ea0 <_sk_callback_sse2+0x289> + .byte 15,40,5,182,64,0,0 // movaps 0x40b6(%rip),%xmm0 # 4f80 <_sk_callback_sse2+0x294> .byte 15,89,240 // mulps %xmm0,%xmm6 .byte 15,88,244 // addps %xmm4,%xmm6 - .byte 68,15,40,53,216,63,0,0 // movaps 0x3fd8(%rip),%xmm14 # 4eb0 <_sk_callback_sse2+0x299> + .byte 68,15,40,53,184,64,0,0 // movaps 0x40b8(%rip),%xmm14 # 4f90 <_sk_callback_sse2+0x2a4> .byte 68,15,40,239 // movaps %xmm7,%xmm13 .byte 69,15,89,238 // mulps %xmm14,%xmm13 .byte 68,15,88,238 // addps %xmm6,%xmm13 @@ -28786,14 +29269,14 @@ _sk_saturation_sse2: .byte 68,15,84,211 // andps %xmm3,%xmm10 .byte 68,15,84,203 // andps %xmm3,%xmm9 .byte 15,84,195 // andps %xmm3,%xmm0 - .byte 68,15,40,5,109,61,0,0 // movaps 0x3d6d(%rip),%xmm8 # 4ed0 <_sk_callback_sse2+0x2b9> + .byte 68,15,40,5,77,62,0,0 // movaps 0x3e4d(%rip),%xmm8 # 4fb0 <_sk_callback_sse2+0x2c4> .byte 15,40,214 // movaps %xmm6,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 - .byte 15,40,13,111,61,0,0 // movaps 0x3d6f(%rip),%xmm1 # 4ee0 <_sk_callback_sse2+0x2c9> + .byte 15,40,13,79,62,0,0 // movaps 0x3e4f(%rip),%xmm1 # 4fc0 <_sk_callback_sse2+0x2d4> .byte 15,40,221 // movaps %xmm5,%xmm3 .byte 15,89,217 // mulps %xmm1,%xmm3 .byte 15,88,218 // addps %xmm2,%xmm3 - .byte 68,15,40,37,110,61,0,0 // movaps 0x3d6e(%rip),%xmm12 # 4ef0 <_sk_callback_sse2+0x2d9> + .byte 68,15,40,37,78,62,0,0 // movaps 0x3e4e(%rip),%xmm12 # 4fd0 <_sk_callback_sse2+0x2e4> .byte 69,15,89,236 // mulps %xmm12,%xmm13 .byte 68,15,88,235 // addps %xmm3,%xmm13 .byte 65,15,40,210 // movaps %xmm10,%xmm2 @@ -28838,7 +29321,7 @@ _sk_saturation_sse2: .byte 15,40,223 // movaps %xmm7,%xmm3 .byte 15,40,236 // movaps %xmm4,%xmm5 .byte 15,89,221 // mulps %xmm5,%xmm3 - .byte 68,15,40,5,211,60,0,0 // movaps 0x3cd3(%rip),%xmm8 # 4f00 <_sk_callback_sse2+0x2e9> + .byte 68,15,40,5,179,61,0,0 // movaps 0x3db3(%rip),%xmm8 # 4fe0 <_sk_callback_sse2+0x2f4> .byte 65,15,40,224 // movaps %xmm8,%xmm4 .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 15,88,253 // addps %xmm5,%xmm7 @@ -28939,14 +29422,14 @@ _sk_color_sse2: .byte 68,15,40,213 // movaps %xmm5,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 .byte 65,15,40,208 // movaps %xmm8,%xmm2 - .byte 68,15,40,45,113,59,0,0 // movaps 0x3b71(%rip),%xmm13 # 4f10 <_sk_callback_sse2+0x2f9> + .byte 68,15,40,45,81,60,0,0 // movaps 0x3c51(%rip),%xmm13 # 4ff0 <_sk_callback_sse2+0x304> .byte 68,15,40,198 // movaps %xmm6,%xmm8 .byte 69,15,89,197 // mulps %xmm13,%xmm8 - .byte 68,15,40,53,113,59,0,0 // movaps 0x3b71(%rip),%xmm14 # 4f20 <_sk_callback_sse2+0x309> + .byte 68,15,40,53,81,60,0,0 // movaps 0x3c51(%rip),%xmm14 # 5000 <_sk_callback_sse2+0x314> .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,89,198 // mulps %xmm14,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,29,109,59,0,0 // movaps 0x3b6d(%rip),%xmm11 # 4f30 <_sk_callback_sse2+0x319> + .byte 68,15,40,29,77,60,0,0 // movaps 0x3c4d(%rip),%xmm11 # 5010 <_sk_callback_sse2+0x324> .byte 69,15,89,227 // mulps %xmm11,%xmm12 .byte 68,15,88,224 // addps %xmm0,%xmm12 .byte 65,15,40,193 // movaps %xmm9,%xmm0 @@ -28954,7 +29437,7 @@ _sk_color_sse2: .byte 69,15,40,250 // movaps %xmm10,%xmm15 .byte 69,15,89,254 // mulps %xmm14,%xmm15 .byte 68,15,88,248 // addps %xmm0,%xmm15 - .byte 68,15,40,5,89,59,0,0 // movaps 0x3b59(%rip),%xmm8 # 4f40 <_sk_callback_sse2+0x329> + .byte 68,15,40,5,57,60,0,0 // movaps 0x3c39(%rip),%xmm8 # 5020 <_sk_callback_sse2+0x334> .byte 65,15,40,224 // movaps %xmm8,%xmm4 .byte 15,92,226 // subps %xmm2,%xmm4 .byte 15,89,252 // mulps %xmm4,%xmm7 @@ -29090,15 +29573,15 @@ _sk_luminosity_sse2: .byte 68,15,40,205 // movaps %xmm5,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 .byte 15,89,222 // mulps %xmm6,%xmm3 - .byte 68,15,40,37,112,57,0,0 // movaps 0x3970(%rip),%xmm12 # 4f50 <_sk_callback_sse2+0x339> + .byte 68,15,40,37,80,58,0,0 // movaps 0x3a50(%rip),%xmm12 # 5030 <_sk_callback_sse2+0x344> .byte 68,15,40,199 // movaps %xmm7,%xmm8 .byte 69,15,89,196 // mulps %xmm12,%xmm8 - .byte 68,15,40,45,112,57,0,0 // movaps 0x3970(%rip),%xmm13 # 4f60 <_sk_callback_sse2+0x349> + .byte 68,15,40,45,80,58,0,0 // movaps 0x3a50(%rip),%xmm13 # 5040 <_sk_callback_sse2+0x354> .byte 68,15,40,241 // movaps %xmm1,%xmm14 .byte 69,15,89,245 // mulps %xmm13,%xmm14 .byte 69,15,88,240 // addps %xmm8,%xmm14 - .byte 68,15,40,29,108,57,0,0 // movaps 0x396c(%rip),%xmm11 # 4f70 <_sk_callback_sse2+0x359> - .byte 68,15,40,5,116,57,0,0 // movaps 0x3974(%rip),%xmm8 # 4f80 <_sk_callback_sse2+0x369> + .byte 68,15,40,29,76,58,0,0 // movaps 0x3a4c(%rip),%xmm11 # 5050 <_sk_callback_sse2+0x364> + .byte 68,15,40,5,84,58,0,0 // movaps 0x3a54(%rip),%xmm8 # 5060 <_sk_callback_sse2+0x374> .byte 69,15,40,248 // movaps %xmm8,%xmm15 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 68,15,92,248 // subps %xmm0,%xmm15 @@ -29227,6 +29710,63 @@ _sk_luminosity_sse2: .byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7 .byte 255,224 // jmpq *%rax +HIDDEN _sk_srcover_rgba_8888_sse2 +.globl _sk_srcover_rgba_8888_sse2 +FUNCTION(_sk_srcover_rgba_8888_sse2) +_sk_srcover_rgba_8888_sse2: + .byte 68,15,40,200 // movaps %xmm0,%xmm9 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 72,139,0 // mov (%rax),%rax + .byte 15,16,4,184 // movups (%rax,%rdi,4),%xmm0 + .byte 15,40,53,105,56,0,0 // movaps 0x3869(%rip),%xmm6 # 5070 <_sk_callback_sse2+0x384> + .byte 15,40,224 // movaps %xmm0,%xmm4 + .byte 15,84,230 // andps %xmm6,%xmm4 + .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 + .byte 15,40,232 // movaps %xmm0,%xmm5 + .byte 102,15,114,213,8 // psrld $0x8,%xmm5 + .byte 102,15,219,238 // pand %xmm6,%xmm5 + .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 + .byte 15,40,248 // movaps %xmm0,%xmm7 + .byte 102,15,114,215,16 // psrld $0x10,%xmm7 + .byte 102,15,219,254 // pand %xmm6,%xmm7 + .byte 15,91,247 // cvtdq2ps %xmm7,%xmm6 + .byte 102,15,114,208,24 // psrld $0x18,%xmm0 + .byte 15,91,248 // cvtdq2ps %xmm0,%xmm7 + .byte 68,15,40,5,66,56,0,0 // movaps 0x3842(%rip),%xmm8 # 5080 <_sk_callback_sse2+0x394> + .byte 68,15,92,195 // subps %xmm3,%xmm8 + .byte 68,15,40,29,70,56,0,0 // movaps 0x3846(%rip),%xmm11 # 5090 <_sk_callback_sse2+0x3a4> + .byte 69,15,89,203 // mulps %xmm11,%xmm9 + .byte 65,15,40,192 // movaps %xmm8,%xmm0 + .byte 15,89,196 // mulps %xmm4,%xmm0 + .byte 65,15,88,193 // addps %xmm9,%xmm0 + .byte 65,15,89,203 // mulps %xmm11,%xmm1 + .byte 69,15,40,200 // movaps %xmm8,%xmm9 + .byte 68,15,89,205 // mulps %xmm5,%xmm9 + .byte 68,15,88,201 // addps %xmm1,%xmm9 + .byte 65,15,89,211 // mulps %xmm11,%xmm2 + .byte 69,15,40,208 // movaps %xmm8,%xmm10 + .byte 68,15,89,214 // mulps %xmm6,%xmm10 + .byte 68,15,88,210 // addps %xmm2,%xmm10 + .byte 65,15,89,219 // mulps %xmm11,%xmm3 + .byte 68,15,89,199 // mulps %xmm7,%xmm8 + .byte 68,15,88,195 // addps %xmm3,%xmm8 + .byte 102,15,91,200 // cvtps2dq %xmm0,%xmm1 + .byte 102,65,15,91,209 // cvtps2dq %xmm9,%xmm2 + .byte 102,15,114,242,8 // pslld $0x8,%xmm2 + .byte 102,15,235,209 // por %xmm1,%xmm2 + .byte 102,65,15,91,202 // cvtps2dq %xmm10,%xmm1 + .byte 102,15,114,241,16 // pslld $0x10,%xmm1 + .byte 102,65,15,91,216 // cvtps2dq %xmm8,%xmm3 + .byte 102,15,114,243,24 // pslld $0x18,%xmm3 + .byte 102,15,235,217 // por %xmm1,%xmm3 + .byte 102,15,235,218 // por %xmm2,%xmm3 + .byte 243,15,127,28,184 // movdqu %xmm3,(%rax,%rdi,4) + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 65,15,40,201 // movaps %xmm9,%xmm1 + .byte 65,15,40,210 // movaps %xmm10,%xmm2 + .byte 65,15,40,216 // movaps %xmm8,%xmm3 + .byte 255,224 // jmpq *%rax + HIDDEN _sk_clamp_0_sse2 .globl _sk_clamp_0_sse2 FUNCTION(_sk_clamp_0_sse2) @@ -29243,7 +29783,7 @@ HIDDEN _sk_clamp_1_sse2 .globl _sk_clamp_1_sse2 FUNCTION(_sk_clamp_1_sse2) _sk_clamp_1_sse2: - .byte 68,15,40,5,125,55,0,0 // movaps 0x377d(%rip),%xmm8 # 4f90 <_sk_callback_sse2+0x379> + .byte 68,15,40,5,184,55,0,0 // movaps 0x37b8(%rip),%xmm8 # 50a0 <_sk_callback_sse2+0x3b4> .byte 65,15,93,192 // minps %xmm8,%xmm0 .byte 65,15,93,200 // minps %xmm8,%xmm1 .byte 65,15,93,208 // minps %xmm8,%xmm2 @@ -29255,7 +29795,7 @@ HIDDEN _sk_clamp_a_sse2 .globl _sk_clamp_a_sse2 FUNCTION(_sk_clamp_a_sse2) _sk_clamp_a_sse2: - .byte 15,93,29,114,55,0,0 // minps 0x3772(%rip),%xmm3 # 4fa0 <_sk_callback_sse2+0x389> + .byte 15,93,29,173,55,0,0 // minps 0x37ad(%rip),%xmm3 # 50b0 <_sk_callback_sse2+0x3c4> .byte 15,93,195 // minps %xmm3,%xmm0 .byte 15,93,203 // minps %xmm3,%xmm1 .byte 15,93,211 // minps %xmm3,%xmm2 @@ -29342,7 +29882,7 @@ HIDDEN _sk_unpremul_sse2 FUNCTION(_sk_unpremul_sse2) _sk_unpremul_sse2: .byte 69,15,87,192 // xorps %xmm8,%xmm8 - .byte 68,15,40,13,221,54,0,0 // movaps 0x36dd(%rip),%xmm9 # 4fb0 <_sk_callback_sse2+0x399> + .byte 68,15,40,13,24,55,0,0 // movaps 0x3718(%rip),%xmm9 # 50c0 <_sk_callback_sse2+0x3d4> .byte 68,15,94,203 // divps %xmm3,%xmm9 .byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8 .byte 69,15,84,193 // andps %xmm9,%xmm8 @@ -29356,20 +29896,20 @@ HIDDEN _sk_from_srgb_sse2 .globl _sk_from_srgb_sse2 FUNCTION(_sk_from_srgb_sse2) _sk_from_srgb_sse2: - .byte 68,15,40,5,200,54,0,0 // movaps 0x36c8(%rip),%xmm8 # 4fc0 <_sk_callback_sse2+0x3a9> + .byte 68,15,40,5,3,55,0,0 // movaps 0x3703(%rip),%xmm8 # 50d0 <_sk_callback_sse2+0x3e4> .byte 68,15,40,232 // movaps %xmm0,%xmm13 .byte 69,15,89,232 // mulps %xmm8,%xmm13 .byte 68,15,40,216 // movaps %xmm0,%xmm11 .byte 69,15,89,219 // mulps %xmm11,%xmm11 - .byte 68,15,40,13,192,54,0,0 // movaps 0x36c0(%rip),%xmm9 # 4fd0 <_sk_callback_sse2+0x3b9> + .byte 68,15,40,13,251,54,0,0 // movaps 0x36fb(%rip),%xmm9 # 50e0 <_sk_callback_sse2+0x3f4> .byte 68,15,40,240 // movaps %xmm0,%xmm14 .byte 69,15,89,241 // mulps %xmm9,%xmm14 - .byte 68,15,40,21,192,54,0,0 // movaps 0x36c0(%rip),%xmm10 # 4fe0 <_sk_callback_sse2+0x3c9> + .byte 68,15,40,21,251,54,0,0 // movaps 0x36fb(%rip),%xmm10 # 50f0 <_sk_callback_sse2+0x404> .byte 69,15,88,242 // addps %xmm10,%xmm14 .byte 69,15,89,243 // mulps %xmm11,%xmm14 - .byte 68,15,40,29,192,54,0,0 // movaps 0x36c0(%rip),%xmm11 # 4ff0 <_sk_callback_sse2+0x3d9> + .byte 68,15,40,29,251,54,0,0 // movaps 0x36fb(%rip),%xmm11 # 5100 <_sk_callback_sse2+0x414> .byte 69,15,88,243 // addps %xmm11,%xmm14 - .byte 68,15,40,37,196,54,0,0 // movaps 0x36c4(%rip),%xmm12 # 5000 <_sk_callback_sse2+0x3e9> + .byte 68,15,40,37,255,54,0,0 // movaps 0x36ff(%rip),%xmm12 # 5110 <_sk_callback_sse2+0x424> .byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0 .byte 68,15,84,232 // andps %xmm0,%xmm13 .byte 65,15,85,198 // andnps %xmm14,%xmm0 @@ -29406,22 +29946,22 @@ HIDDEN _sk_to_srgb_sse2 FUNCTION(_sk_to_srgb_sse2) _sk_to_srgb_sse2: .byte 68,15,82,232 // rsqrtps %xmm0,%xmm13 - .byte 68,15,40,5,81,54,0,0 // movaps 0x3651(%rip),%xmm8 # 5010 <_sk_callback_sse2+0x3f9> + .byte 68,15,40,5,140,54,0,0 // movaps 0x368c(%rip),%xmm8 # 5120 <_sk_callback_sse2+0x434> .byte 68,15,40,240 // movaps %xmm0,%xmm14 .byte 69,15,89,240 // mulps %xmm8,%xmm14 - .byte 68,15,40,13,81,54,0,0 // movaps 0x3651(%rip),%xmm9 # 5020 <_sk_callback_sse2+0x409> + .byte 68,15,40,13,140,54,0,0 // movaps 0x368c(%rip),%xmm9 # 5130 <_sk_callback_sse2+0x444> .byte 69,15,40,253 // movaps %xmm13,%xmm15 .byte 69,15,89,249 // mulps %xmm9,%xmm15 - .byte 68,15,40,21,81,54,0,0 // movaps 0x3651(%rip),%xmm10 # 5030 <_sk_callback_sse2+0x419> + .byte 68,15,40,21,140,54,0,0 // movaps 0x368c(%rip),%xmm10 # 5140 <_sk_callback_sse2+0x454> .byte 69,15,88,250 // addps %xmm10,%xmm15 .byte 69,15,89,253 // mulps %xmm13,%xmm15 - .byte 68,15,40,29,81,54,0,0 // movaps 0x3651(%rip),%xmm11 # 5040 <_sk_callback_sse2+0x429> + .byte 68,15,40,29,140,54,0,0 // movaps 0x368c(%rip),%xmm11 # 5150 <_sk_callback_sse2+0x464> .byte 69,15,88,251 // addps %xmm11,%xmm15 - .byte 68,15,40,37,85,54,0,0 // movaps 0x3655(%rip),%xmm12 # 5050 <_sk_callback_sse2+0x439> + .byte 68,15,40,37,144,54,0,0 // movaps 0x3690(%rip),%xmm12 # 5160 <_sk_callback_sse2+0x474> .byte 69,15,88,236 // addps %xmm12,%xmm13 .byte 69,15,83,237 // rcpps %xmm13,%xmm13 .byte 69,15,89,239 // mulps %xmm15,%xmm13 - .byte 68,15,40,61,81,54,0,0 // movaps 0x3651(%rip),%xmm15 # 5060 <_sk_callback_sse2+0x449> + .byte 68,15,40,61,140,54,0,0 // movaps 0x368c(%rip),%xmm15 # 5170 <_sk_callback_sse2+0x484> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 68,15,84,240 // andps %xmm0,%xmm14 .byte 65,15,85,197 // andnps %xmm13,%xmm0 @@ -29471,7 +30011,7 @@ _sk_rgb_to_hsl_sse2: .byte 68,15,93,218 // minps %xmm2,%xmm11 .byte 65,15,40,202 // movaps %xmm10,%xmm1 .byte 65,15,92,203 // subps %xmm11,%xmm1 - .byte 68,15,40,45,170,53,0,0 // movaps 0x35aa(%rip),%xmm13 # 5070 <_sk_callback_sse2+0x459> + .byte 68,15,40,45,229,53,0,0 // movaps 0x35e5(%rip),%xmm13 # 5180 <_sk_callback_sse2+0x494> .byte 68,15,94,233 // divps %xmm1,%xmm13 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0 @@ -29480,30 +30020,30 @@ _sk_rgb_to_hsl_sse2: .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,40,241 // movaps %xmm9,%xmm14 .byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14 - .byte 68,15,84,53,144,53,0,0 // andps 0x3590(%rip),%xmm14 # 5080 <_sk_callback_sse2+0x469> + .byte 68,15,84,53,203,53,0,0 // andps 0x35cb(%rip),%xmm14 # 5190 <_sk_callback_sse2+0x4a4> .byte 69,15,88,244 // addps %xmm12,%xmm14 .byte 69,15,40,250 // movaps %xmm10,%xmm15 .byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15 .byte 65,15,92,208 // subps %xmm8,%xmm2 .byte 65,15,89,213 // mulps %xmm13,%xmm2 - .byte 68,15,40,37,131,53,0,0 // movaps 0x3583(%rip),%xmm12 # 5090 <_sk_callback_sse2+0x479> + .byte 68,15,40,37,190,53,0,0 // movaps 0x35be(%rip),%xmm12 # 51a0 <_sk_callback_sse2+0x4b4> .byte 65,15,88,212 // addps %xmm12,%xmm2 .byte 69,15,92,193 // subps %xmm9,%xmm8 .byte 69,15,89,197 // mulps %xmm13,%xmm8 - .byte 68,15,88,5,127,53,0,0 // addps 0x357f(%rip),%xmm8 # 50a0 <_sk_callback_sse2+0x489> + .byte 68,15,88,5,186,53,0,0 // addps 0x35ba(%rip),%xmm8 # 51b0 <_sk_callback_sse2+0x4c4> .byte 65,15,84,215 // andps %xmm15,%xmm2 .byte 69,15,85,248 // andnps %xmm8,%xmm15 .byte 68,15,86,250 // orps %xmm2,%xmm15 .byte 68,15,84,240 // andps %xmm0,%xmm14 .byte 65,15,85,199 // andnps %xmm15,%xmm0 .byte 65,15,86,198 // orps %xmm14,%xmm0 - .byte 15,89,5,112,53,0,0 // mulps 0x3570(%rip),%xmm0 # 50b0 <_sk_callback_sse2+0x499> + .byte 15,89,5,171,53,0,0 // mulps 0x35ab(%rip),%xmm0 # 51c0 <_sk_callback_sse2+0x4d4> .byte 69,15,40,194 // movaps %xmm10,%xmm8 .byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8 .byte 65,15,84,192 // andps %xmm8,%xmm0 .byte 69,15,92,226 // subps %xmm10,%xmm12 .byte 69,15,88,211 // addps %xmm11,%xmm10 - .byte 68,15,40,13,99,53,0,0 // movaps 0x3563(%rip),%xmm9 # 50c0 <_sk_callback_sse2+0x4a9> + .byte 68,15,40,13,158,53,0,0 // movaps 0x359e(%rip),%xmm9 # 51d0 <_sk_callback_sse2+0x4e4> .byte 65,15,40,210 // movaps %xmm10,%xmm2 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9 @@ -29527,7 +30067,7 @@ _sk_hsl_to_rgb_sse2: .byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp) .byte 68,15,40,218 // movaps %xmm2,%xmm11 .byte 15,40,240 // movaps %xmm0,%xmm6 - .byte 68,15,40,13,34,53,0,0 // movaps 0x3522(%rip),%xmm9 # 50d0 <_sk_callback_sse2+0x4b9> + .byte 68,15,40,13,93,53,0,0 // movaps 0x355d(%rip),%xmm9 # 51e0 <_sk_callback_sse2+0x4f4> .byte 69,15,40,209 // movaps %xmm9,%xmm10 .byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10 .byte 15,40,193 // movaps %xmm1,%xmm0 @@ -29544,28 +30084,28 @@ _sk_hsl_to_rgb_sse2: .byte 69,15,88,211 // addps %xmm11,%xmm10 .byte 69,15,88,219 // addps %xmm11,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 15,40,5,235,52,0,0 // movaps 0x34eb(%rip),%xmm0 # 50e0 <_sk_callback_sse2+0x4c9> + .byte 15,40,5,38,53,0,0 // movaps 0x3526(%rip),%xmm0 # 51f0 <_sk_callback_sse2+0x504> .byte 15,88,198 // addps %xmm6,%xmm0 .byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,40,216 // movaps %xmm0,%xmm3 .byte 15,194,217,1 // cmpltps %xmm1,%xmm3 - .byte 15,84,29,227,52,0,0 // andps 0x34e3(%rip),%xmm3 # 50f0 <_sk_callback_sse2+0x4d9> + .byte 15,84,29,30,53,0,0 // andps 0x351e(%rip),%xmm3 # 5200 <_sk_callback_sse2+0x514> .byte 15,92,203 // subps %xmm3,%xmm1 .byte 15,92,193 // subps %xmm1,%xmm0 - .byte 68,15,40,45,229,52,0,0 // movaps 0x34e5(%rip),%xmm13 # 5100 <_sk_callback_sse2+0x4e9> + .byte 68,15,40,45,32,53,0,0 // movaps 0x3520(%rip),%xmm13 # 5210 <_sk_callback_sse2+0x524> .byte 69,15,40,197 // movaps %xmm13,%xmm8 .byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8 .byte 69,15,40,242 // movaps %xmm10,%xmm14 .byte 69,15,92,243 // subps %xmm11,%xmm14 .byte 65,15,40,217 // movaps %xmm9,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 - .byte 15,40,21,245,52,0,0 // movaps 0x34f5(%rip),%xmm2 # 5130 <_sk_callback_sse2+0x519> + .byte 15,40,21,48,53,0,0 // movaps 0x3530(%rip),%xmm2 # 5240 <_sk_callback_sse2+0x554> .byte 68,15,40,250 // movaps %xmm2,%xmm15 .byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15 - .byte 15,40,13,197,52,0,0 // movaps 0x34c5(%rip),%xmm1 # 5110 <_sk_callback_sse2+0x4f9> + .byte 15,40,13,0,53,0,0 // movaps 0x3500(%rip),%xmm1 # 5220 <_sk_callback_sse2+0x534> .byte 15,89,193 // mulps %xmm1,%xmm0 - .byte 15,40,45,203,52,0,0 // movaps 0x34cb(%rip),%xmm5 # 5120 <_sk_callback_sse2+0x509> + .byte 15,40,45,6,53,0,0 // movaps 0x3506(%rip),%xmm5 # 5230 <_sk_callback_sse2+0x544> .byte 15,40,229 // movaps %xmm5,%xmm4 .byte 15,92,224 // subps %xmm0,%xmm4 .byte 65,15,89,230 // mulps %xmm14,%xmm4 @@ -29588,7 +30128,7 @@ _sk_hsl_to_rgb_sse2: .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,222 // movaps %xmm6,%xmm3 .byte 15,194,216,1 // cmpltps %xmm0,%xmm3 - .byte 15,84,29,64,52,0,0 // andps 0x3440(%rip),%xmm3 # 50f0 <_sk_callback_sse2+0x4d9> + .byte 15,84,29,123,52,0,0 // andps 0x347b(%rip),%xmm3 # 5200 <_sk_callback_sse2+0x514> .byte 15,92,195 // subps %xmm3,%xmm0 .byte 68,15,40,230 // movaps %xmm6,%xmm12 .byte 68,15,92,224 // subps %xmm0,%xmm12 @@ -29618,12 +30158,12 @@ _sk_hsl_to_rgb_sse2: .byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7 .byte 15,40,231 // movaps %xmm7,%xmm4 .byte 15,85,227 // andnps %xmm3,%xmm4 - .byte 15,88,53,24,52,0,0 // addps 0x3418(%rip),%xmm6 # 5140 <_sk_callback_sse2+0x529> + .byte 15,88,53,83,52,0,0 // addps 0x3453(%rip),%xmm6 # 5250 <_sk_callback_sse2+0x564> .byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,222 // movaps %xmm6,%xmm3 .byte 15,194,216,1 // cmpltps %xmm0,%xmm3 - .byte 15,84,29,179,51,0,0 // andps 0x33b3(%rip),%xmm3 # 50f0 <_sk_callback_sse2+0x4d9> + .byte 15,84,29,238,51,0,0 // andps 0x33ee(%rip),%xmm3 # 5200 <_sk_callback_sse2+0x514> .byte 15,92,195 // subps %xmm3,%xmm0 .byte 15,92,240 // subps %xmm0,%xmm6 .byte 15,89,206 // mulps %xmm6,%xmm1 @@ -29687,7 +30227,7 @@ _sk_scale_u8_sse2: .byte 102,69,15,96,193 // punpcklbw %xmm9,%xmm8 .byte 102,69,15,97,193 // punpcklwd %xmm9,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,65,51,0,0 // mulps 0x3341(%rip),%xmm8 # 5150 <_sk_callback_sse2+0x539> + .byte 68,15,89,5,124,51,0,0 // mulps 0x337c(%rip),%xmm8 # 5260 <_sk_callback_sse2+0x574> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 @@ -29728,7 +30268,7 @@ _sk_lerp_u8_sse2: .byte 102,69,15,96,193 // punpcklbw %xmm9,%xmm8 .byte 102,69,15,97,193 // punpcklwd %xmm9,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,223,50,0,0 // mulps 0x32df(%rip),%xmm8 # 5160 <_sk_callback_sse2+0x549> + .byte 68,15,89,5,26,51,0,0 // mulps 0x331a(%rip),%xmm8 # 5270 <_sk_callback_sse2+0x584> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -29753,17 +30293,17 @@ _sk_lerp_565_sse2: .byte 243,68,15,126,20,120 // movq (%rax,%rdi,2),%xmm10 .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,69,15,97,208 // punpcklwd %xmm8,%xmm10 - .byte 102,68,15,111,5,165,50,0,0 // movdqa 0x32a5(%rip),%xmm8 # 5170 <_sk_callback_sse2+0x559> + .byte 102,68,15,111,5,224,50,0,0 // movdqa 0x32e0(%rip),%xmm8 # 5280 <_sk_callback_sse2+0x594> .byte 102,69,15,219,194 // pand %xmm10,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,164,50,0,0 // mulps 0x32a4(%rip),%xmm8 # 5180 <_sk_callback_sse2+0x569> - .byte 102,68,15,111,13,171,50,0,0 // movdqa 0x32ab(%rip),%xmm9 # 5190 <_sk_callback_sse2+0x579> + .byte 68,15,89,5,223,50,0,0 // mulps 0x32df(%rip),%xmm8 # 5290 <_sk_callback_sse2+0x5a4> + .byte 102,68,15,111,13,230,50,0,0 // movdqa 0x32e6(%rip),%xmm9 # 52a0 <_sk_callback_sse2+0x5b4> .byte 102,69,15,219,202 // pand %xmm10,%xmm9 .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9 - .byte 68,15,89,13,170,50,0,0 // mulps 0x32aa(%rip),%xmm9 # 51a0 <_sk_callback_sse2+0x589> - .byte 102,68,15,219,21,177,50,0,0 // pand 0x32b1(%rip),%xmm10 # 51b0 <_sk_callback_sse2+0x599> + .byte 68,15,89,13,229,50,0,0 // mulps 0x32e5(%rip),%xmm9 # 52b0 <_sk_callback_sse2+0x5c4> + .byte 102,68,15,219,21,236,50,0,0 // pand 0x32ec(%rip),%xmm10 # 52c0 <_sk_callback_sse2+0x5d4> .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 - .byte 68,15,89,21,181,50,0,0 // mulps 0x32b5(%rip),%xmm10 # 51c0 <_sk_callback_sse2+0x5a9> + .byte 68,15,89,21,240,50,0,0 // mulps 0x32f0(%rip),%xmm10 # 52d0 <_sk_callback_sse2+0x5e4> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -29794,7 +30334,7 @@ _sk_load_tables_sse2: .byte 76,139,0 // mov (%rax),%r8 .byte 76,139,72,8 // mov 0x8(%rax),%r9 .byte 243,69,15,111,12,184 // movdqu (%r8,%rdi,4),%xmm9 - .byte 102,68,15,111,5,101,50,0,0 // movdqa 0x3265(%rip),%xmm8 # 51d0 <_sk_callback_sse2+0x5b9> + .byte 102,68,15,111,5,160,50,0,0 // movdqa 0x32a0(%rip),%xmm8 # 52e0 <_sk_callback_sse2+0x5f4> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 @@ -29849,7 +30389,7 @@ _sk_load_tables_sse2: .byte 65,15,20,208 // unpcklps %xmm8,%xmm2 .byte 102,65,15,114,209,24 // psrld $0x18,%xmm9 .byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3 - .byte 15,89,29,114,49,0,0 // mulps 0x3172(%rip),%xmm3 # 51e0 <_sk_callback_sse2+0x5c9> + .byte 15,89,29,173,49,0,0 // mulps 0x31ad(%rip),%xmm3 # 52f0 <_sk_callback_sse2+0x604> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -29868,7 +30408,7 @@ _sk_load_tables_u16_be_sse2: .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 - .byte 102,68,15,111,21,69,49,0,0 // movdqa 0x3145(%rip),%xmm10 # 51f0 <_sk_callback_sse2+0x5d9> + .byte 102,68,15,111,21,128,49,0,0 // movdqa 0x3180(%rip),%xmm10 # 5300 <_sk_callback_sse2+0x614> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,194 // pand %xmm10,%xmm0 .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 @@ -29929,7 +30469,7 @@ _sk_load_tables_u16_be_sse2: .byte 102,65,15,235,217 // por %xmm9,%xmm3 .byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,52,48,0,0 // mulps 0x3034(%rip),%xmm3 # 5200 <_sk_callback_sse2+0x5e9> + .byte 15,89,29,111,48,0,0 // mulps 0x306f(%rip),%xmm3 # 5310 <_sk_callback_sse2+0x624> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -29951,7 +30491,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10 .byte 102,65,15,111,195 // movdqa %xmm11,%xmm0 .byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0 - .byte 102,68,15,111,5,244,47,0,0 // movdqa 0x2ff4(%rip),%xmm8 # 5210 <_sk_callback_sse2+0x5f9> + .byte 102,68,15,111,5,47,48,0,0 // movdqa 0x302f(%rip),%xmm8 # 5320 <_sk_callback_sse2+0x634> .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 @@ -30006,7 +30546,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 15,20,211 // unpcklps %xmm3,%xmm2 .byte 65,15,20,208 // unpcklps %xmm8,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,3,47,0,0 // movaps 0x2f03(%rip),%xmm3 # 5220 <_sk_callback_sse2+0x609> + .byte 15,40,29,62,47,0,0 // movaps 0x2f3e(%rip),%xmm3 # 5330 <_sk_callback_sse2+0x644> .byte 255,224 // jmpq *%rax HIDDEN _sk_byte_tables_sse2 @@ -30016,7 +30556,7 @@ _sk_byte_tables_sse2: .byte 65,86 // push %r14 .byte 83 // push %rbx .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,4,47,0,0 // movaps 0x2f04(%rip),%xmm8 # 5230 <_sk_callback_sse2+0x619> + .byte 68,15,40,5,63,47,0,0 // movaps 0x2f3f(%rip),%xmm8 # 5340 <_sk_callback_sse2+0x654> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 102,72,15,126,193 // movq %xmm0,%rcx @@ -30043,7 +30583,7 @@ _sk_byte_tables_sse2: .byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0 .byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,21,161,46,0,0 // movaps 0x2ea1(%rip),%xmm10 # 5240 <_sk_callback_sse2+0x629> + .byte 68,15,40,21,220,46,0,0 // movaps 0x2edc(%rip),%xmm10 # 5350 <_sk_callback_sse2+0x664> .byte 65,15,89,194 // mulps %xmm10,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -30159,7 +30699,7 @@ _sk_byte_tables_rgb_sse2: .byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0 .byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,21,244,44,0,0 // movaps 0x2cf4(%rip),%xmm10 # 5250 <_sk_callback_sse2+0x639> + .byte 68,15,40,21,47,45,0,0 // movaps 0x2d2f(%rip),%xmm10 # 5360 <_sk_callback_sse2+0x674> .byte 65,15,89,194 // mulps %xmm10,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -30356,15 +30896,15 @@ _sk_parametric_r_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,51,42,0,0 // mulps 0x2a33(%rip),%xmm9 # 5260 <_sk_callback_sse2+0x649> - .byte 68,15,84,21,59,42,0,0 // andps 0x2a3b(%rip),%xmm10 # 5270 <_sk_callback_sse2+0x659> - .byte 68,15,86,21,67,42,0,0 // orps 0x2a43(%rip),%xmm10 # 5280 <_sk_callback_sse2+0x669> - .byte 68,15,88,13,75,42,0,0 // addps 0x2a4b(%rip),%xmm9 # 5290 <_sk_callback_sse2+0x679> - .byte 68,15,40,37,83,42,0,0 // movaps 0x2a53(%rip),%xmm12 # 52a0 <_sk_callback_sse2+0x689> + .byte 68,15,89,13,110,42,0,0 // mulps 0x2a6e(%rip),%xmm9 # 5370 <_sk_callback_sse2+0x684> + .byte 68,15,84,21,118,42,0,0 // andps 0x2a76(%rip),%xmm10 # 5380 <_sk_callback_sse2+0x694> + .byte 68,15,86,21,126,42,0,0 // orps 0x2a7e(%rip),%xmm10 # 5390 <_sk_callback_sse2+0x6a4> + .byte 68,15,88,13,134,42,0,0 // addps 0x2a86(%rip),%xmm9 # 53a0 <_sk_callback_sse2+0x6b4> + .byte 68,15,40,37,142,42,0,0 // movaps 0x2a8e(%rip),%xmm12 # 53b0 <_sk_callback_sse2+0x6c4> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,83,42,0,0 // addps 0x2a53(%rip),%xmm10 # 52b0 <_sk_callback_sse2+0x699> - .byte 68,15,40,37,91,42,0,0 // movaps 0x2a5b(%rip),%xmm12 # 52c0 <_sk_callback_sse2+0x6a9> + .byte 68,15,88,21,142,42,0,0 // addps 0x2a8e(%rip),%xmm10 # 53c0 <_sk_callback_sse2+0x6d4> + .byte 68,15,40,37,150,42,0,0 // movaps 0x2a96(%rip),%xmm12 # 53d0 <_sk_callback_sse2+0x6e4> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -30372,22 +30912,22 @@ _sk_parametric_r_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,69,42,0,0 // movaps 0x2a45(%rip),%xmm10 # 52d0 <_sk_callback_sse2+0x6b9> + .byte 68,15,40,21,128,42,0,0 // movaps 0x2a80(%rip),%xmm10 # 53e0 <_sk_callback_sse2+0x6f4> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,57,42,0,0 // addps 0x2a39(%rip),%xmm9 # 52e0 <_sk_callback_sse2+0x6c9> - .byte 68,15,40,37,65,42,0,0 // movaps 0x2a41(%rip),%xmm12 # 52f0 <_sk_callback_sse2+0x6d9> + .byte 68,15,88,13,116,42,0,0 // addps 0x2a74(%rip),%xmm9 # 53f0 <_sk_callback_sse2+0x704> + .byte 68,15,40,37,124,42,0,0 // movaps 0x2a7c(%rip),%xmm12 # 5400 <_sk_callback_sse2+0x714> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,65,42,0,0 // movaps 0x2a41(%rip),%xmm12 # 5300 <_sk_callback_sse2+0x6e9> + .byte 68,15,40,37,124,42,0,0 // movaps 0x2a7c(%rip),%xmm12 # 5410 <_sk_callback_sse2+0x724> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,69,42,0,0 // movaps 0x2a45(%rip),%xmm13 # 5310 <_sk_callback_sse2+0x6f9> + .byte 68,15,40,45,128,42,0,0 // movaps 0x2a80(%rip),%xmm13 # 5420 <_sk_callback_sse2+0x734> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,69,42,0,0 // mulps 0x2a45(%rip),%xmm13 # 5320 <_sk_callback_sse2+0x709> + .byte 68,15,89,45,128,42,0,0 // mulps 0x2a80(%rip),%xmm13 # 5430 <_sk_callback_sse2+0x744> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -30423,15 +30963,15 @@ _sk_parametric_g_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,197,41,0,0 // mulps 0x29c5(%rip),%xmm9 # 5330 <_sk_callback_sse2+0x719> - .byte 68,15,84,21,205,41,0,0 // andps 0x29cd(%rip),%xmm10 # 5340 <_sk_callback_sse2+0x729> - .byte 68,15,86,21,213,41,0,0 // orps 0x29d5(%rip),%xmm10 # 5350 <_sk_callback_sse2+0x739> - .byte 68,15,88,13,221,41,0,0 // addps 0x29dd(%rip),%xmm9 # 5360 <_sk_callback_sse2+0x749> - .byte 68,15,40,37,229,41,0,0 // movaps 0x29e5(%rip),%xmm12 # 5370 <_sk_callback_sse2+0x759> + .byte 68,15,89,13,0,42,0,0 // mulps 0x2a00(%rip),%xmm9 # 5440 <_sk_callback_sse2+0x754> + .byte 68,15,84,21,8,42,0,0 // andps 0x2a08(%rip),%xmm10 # 5450 <_sk_callback_sse2+0x764> + .byte 68,15,86,21,16,42,0,0 // orps 0x2a10(%rip),%xmm10 # 5460 <_sk_callback_sse2+0x774> + .byte 68,15,88,13,24,42,0,0 // addps 0x2a18(%rip),%xmm9 # 5470 <_sk_callback_sse2+0x784> + .byte 68,15,40,37,32,42,0,0 // movaps 0x2a20(%rip),%xmm12 # 5480 <_sk_callback_sse2+0x794> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,229,41,0,0 // addps 0x29e5(%rip),%xmm10 # 5380 <_sk_callback_sse2+0x769> - .byte 68,15,40,37,237,41,0,0 // movaps 0x29ed(%rip),%xmm12 # 5390 <_sk_callback_sse2+0x779> + .byte 68,15,88,21,32,42,0,0 // addps 0x2a20(%rip),%xmm10 # 5490 <_sk_callback_sse2+0x7a4> + .byte 68,15,40,37,40,42,0,0 // movaps 0x2a28(%rip),%xmm12 # 54a0 <_sk_callback_sse2+0x7b4> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -30439,22 +30979,22 @@ _sk_parametric_g_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,215,41,0,0 // movaps 0x29d7(%rip),%xmm10 # 53a0 <_sk_callback_sse2+0x789> + .byte 68,15,40,21,18,42,0,0 // movaps 0x2a12(%rip),%xmm10 # 54b0 <_sk_callback_sse2+0x7c4> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,203,41,0,0 // addps 0x29cb(%rip),%xmm9 # 53b0 <_sk_callback_sse2+0x799> - .byte 68,15,40,37,211,41,0,0 // movaps 0x29d3(%rip),%xmm12 # 53c0 <_sk_callback_sse2+0x7a9> + .byte 68,15,88,13,6,42,0,0 // addps 0x2a06(%rip),%xmm9 # 54c0 <_sk_callback_sse2+0x7d4> + .byte 68,15,40,37,14,42,0,0 // movaps 0x2a0e(%rip),%xmm12 # 54d0 <_sk_callback_sse2+0x7e4> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,211,41,0,0 // movaps 0x29d3(%rip),%xmm12 # 53d0 <_sk_callback_sse2+0x7b9> + .byte 68,15,40,37,14,42,0,0 // movaps 0x2a0e(%rip),%xmm12 # 54e0 <_sk_callback_sse2+0x7f4> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,215,41,0,0 // movaps 0x29d7(%rip),%xmm13 # 53e0 <_sk_callback_sse2+0x7c9> + .byte 68,15,40,45,18,42,0,0 // movaps 0x2a12(%rip),%xmm13 # 54f0 <_sk_callback_sse2+0x804> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,215,41,0,0 // mulps 0x29d7(%rip),%xmm13 # 53f0 <_sk_callback_sse2+0x7d9> + .byte 68,15,89,45,18,42,0,0 // mulps 0x2a12(%rip),%xmm13 # 5500 <_sk_callback_sse2+0x814> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -30490,15 +31030,15 @@ _sk_parametric_b_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,87,41,0,0 // mulps 0x2957(%rip),%xmm9 # 5400 <_sk_callback_sse2+0x7e9> - .byte 68,15,84,21,95,41,0,0 // andps 0x295f(%rip),%xmm10 # 5410 <_sk_callback_sse2+0x7f9> - .byte 68,15,86,21,103,41,0,0 // orps 0x2967(%rip),%xmm10 # 5420 <_sk_callback_sse2+0x809> - .byte 68,15,88,13,111,41,0,0 // addps 0x296f(%rip),%xmm9 # 5430 <_sk_callback_sse2+0x819> - .byte 68,15,40,37,119,41,0,0 // movaps 0x2977(%rip),%xmm12 # 5440 <_sk_callback_sse2+0x829> + .byte 68,15,89,13,146,41,0,0 // mulps 0x2992(%rip),%xmm9 # 5510 <_sk_callback_sse2+0x824> + .byte 68,15,84,21,154,41,0,0 // andps 0x299a(%rip),%xmm10 # 5520 <_sk_callback_sse2+0x834> + .byte 68,15,86,21,162,41,0,0 // orps 0x29a2(%rip),%xmm10 # 5530 <_sk_callback_sse2+0x844> + .byte 68,15,88,13,170,41,0,0 // addps 0x29aa(%rip),%xmm9 # 5540 <_sk_callback_sse2+0x854> + .byte 68,15,40,37,178,41,0,0 // movaps 0x29b2(%rip),%xmm12 # 5550 <_sk_callback_sse2+0x864> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,119,41,0,0 // addps 0x2977(%rip),%xmm10 # 5450 <_sk_callback_sse2+0x839> - .byte 68,15,40,37,127,41,0,0 // movaps 0x297f(%rip),%xmm12 # 5460 <_sk_callback_sse2+0x849> + .byte 68,15,88,21,178,41,0,0 // addps 0x29b2(%rip),%xmm10 # 5560 <_sk_callback_sse2+0x874> + .byte 68,15,40,37,186,41,0,0 // movaps 0x29ba(%rip),%xmm12 # 5570 <_sk_callback_sse2+0x884> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -30506,22 +31046,22 @@ _sk_parametric_b_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,105,41,0,0 // movaps 0x2969(%rip),%xmm10 # 5470 <_sk_callback_sse2+0x859> + .byte 68,15,40,21,164,41,0,0 // movaps 0x29a4(%rip),%xmm10 # 5580 <_sk_callback_sse2+0x894> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,93,41,0,0 // addps 0x295d(%rip),%xmm9 # 5480 <_sk_callback_sse2+0x869> - .byte 68,15,40,37,101,41,0,0 // movaps 0x2965(%rip),%xmm12 # 5490 <_sk_callback_sse2+0x879> + .byte 68,15,88,13,152,41,0,0 // addps 0x2998(%rip),%xmm9 # 5590 <_sk_callback_sse2+0x8a4> + .byte 68,15,40,37,160,41,0,0 // movaps 0x29a0(%rip),%xmm12 # 55a0 <_sk_callback_sse2+0x8b4> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,101,41,0,0 // movaps 0x2965(%rip),%xmm12 # 54a0 <_sk_callback_sse2+0x889> + .byte 68,15,40,37,160,41,0,0 // movaps 0x29a0(%rip),%xmm12 # 55b0 <_sk_callback_sse2+0x8c4> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,105,41,0,0 // movaps 0x2969(%rip),%xmm13 # 54b0 <_sk_callback_sse2+0x899> + .byte 68,15,40,45,164,41,0,0 // movaps 0x29a4(%rip),%xmm13 # 55c0 <_sk_callback_sse2+0x8d4> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,105,41,0,0 // mulps 0x2969(%rip),%xmm13 # 54c0 <_sk_callback_sse2+0x8a9> + .byte 68,15,89,45,164,41,0,0 // mulps 0x29a4(%rip),%xmm13 # 55d0 <_sk_callback_sse2+0x8e4> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -30557,15 +31097,15 @@ _sk_parametric_a_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,233,40,0,0 // mulps 0x28e9(%rip),%xmm9 # 54d0 <_sk_callback_sse2+0x8b9> - .byte 68,15,84,21,241,40,0,0 // andps 0x28f1(%rip),%xmm10 # 54e0 <_sk_callback_sse2+0x8c9> - .byte 68,15,86,21,249,40,0,0 // orps 0x28f9(%rip),%xmm10 # 54f0 <_sk_callback_sse2+0x8d9> - .byte 68,15,88,13,1,41,0,0 // addps 0x2901(%rip),%xmm9 # 5500 <_sk_callback_sse2+0x8e9> - .byte 68,15,40,37,9,41,0,0 // movaps 0x2909(%rip),%xmm12 # 5510 <_sk_callback_sse2+0x8f9> + .byte 68,15,89,13,36,41,0,0 // mulps 0x2924(%rip),%xmm9 # 55e0 <_sk_callback_sse2+0x8f4> + .byte 68,15,84,21,44,41,0,0 // andps 0x292c(%rip),%xmm10 # 55f0 <_sk_callback_sse2+0x904> + .byte 68,15,86,21,52,41,0,0 // orps 0x2934(%rip),%xmm10 # 5600 <_sk_callback_sse2+0x914> + .byte 68,15,88,13,60,41,0,0 // addps 0x293c(%rip),%xmm9 # 5610 <_sk_callback_sse2+0x924> + .byte 68,15,40,37,68,41,0,0 // movaps 0x2944(%rip),%xmm12 # 5620 <_sk_callback_sse2+0x934> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,9,41,0,0 // addps 0x2909(%rip),%xmm10 # 5520 <_sk_callback_sse2+0x909> - .byte 68,15,40,37,17,41,0,0 // movaps 0x2911(%rip),%xmm12 # 5530 <_sk_callback_sse2+0x919> + .byte 68,15,88,21,68,41,0,0 // addps 0x2944(%rip),%xmm10 # 5630 <_sk_callback_sse2+0x944> + .byte 68,15,40,37,76,41,0,0 // movaps 0x294c(%rip),%xmm12 # 5640 <_sk_callback_sse2+0x954> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -30573,22 +31113,22 @@ _sk_parametric_a_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,251,40,0,0 // movaps 0x28fb(%rip),%xmm10 # 5540 <_sk_callback_sse2+0x929> + .byte 68,15,40,21,54,41,0,0 // movaps 0x2936(%rip),%xmm10 # 5650 <_sk_callback_sse2+0x964> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,239,40,0,0 // addps 0x28ef(%rip),%xmm9 # 5550 <_sk_callback_sse2+0x939> - .byte 68,15,40,37,247,40,0,0 // movaps 0x28f7(%rip),%xmm12 # 5560 <_sk_callback_sse2+0x949> + .byte 68,15,88,13,42,41,0,0 // addps 0x292a(%rip),%xmm9 # 5660 <_sk_callback_sse2+0x974> + .byte 68,15,40,37,50,41,0,0 // movaps 0x2932(%rip),%xmm12 # 5670 <_sk_callback_sse2+0x984> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,247,40,0,0 // movaps 0x28f7(%rip),%xmm12 # 5570 <_sk_callback_sse2+0x959> + .byte 68,15,40,37,50,41,0,0 // movaps 0x2932(%rip),%xmm12 # 5680 <_sk_callback_sse2+0x994> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,251,40,0,0 // movaps 0x28fb(%rip),%xmm13 # 5580 <_sk_callback_sse2+0x969> + .byte 68,15,40,45,54,41,0,0 // movaps 0x2936(%rip),%xmm13 # 5690 <_sk_callback_sse2+0x9a4> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,251,40,0,0 // mulps 0x28fb(%rip),%xmm13 # 5590 <_sk_callback_sse2+0x979> + .byte 68,15,89,45,54,41,0,0 // mulps 0x2936(%rip),%xmm13 # 56a0 <_sk_callback_sse2+0x9b4> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -30605,29 +31145,29 @@ HIDDEN _sk_lab_to_xyz_sse2 .globl _sk_lab_to_xyz_sse2 FUNCTION(_sk_lab_to_xyz_sse2) _sk_lab_to_xyz_sse2: - .byte 15,89,5,216,40,0,0 // mulps 0x28d8(%rip),%xmm0 # 55a0 <_sk_callback_sse2+0x989> - .byte 68,15,40,5,224,40,0,0 // movaps 0x28e0(%rip),%xmm8 # 55b0 <_sk_callback_sse2+0x999> + .byte 15,89,5,19,41,0,0 // mulps 0x2913(%rip),%xmm0 # 56b0 <_sk_callback_sse2+0x9c4> + .byte 68,15,40,5,27,41,0,0 // movaps 0x291b(%rip),%xmm8 # 56c0 <_sk_callback_sse2+0x9d4> .byte 65,15,89,200 // mulps %xmm8,%xmm1 - .byte 68,15,40,13,228,40,0,0 // movaps 0x28e4(%rip),%xmm9 # 55c0 <_sk_callback_sse2+0x9a9> + .byte 68,15,40,13,31,41,0,0 // movaps 0x291f(%rip),%xmm9 # 56d0 <_sk_callback_sse2+0x9e4> .byte 65,15,88,201 // addps %xmm9,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 65,15,88,209 // addps %xmm9,%xmm2 - .byte 15,88,5,225,40,0,0 // addps 0x28e1(%rip),%xmm0 # 55d0 <_sk_callback_sse2+0x9b9> - .byte 15,89,5,234,40,0,0 // mulps 0x28ea(%rip),%xmm0 # 55e0 <_sk_callback_sse2+0x9c9> - .byte 15,89,13,243,40,0,0 // mulps 0x28f3(%rip),%xmm1 # 55f0 <_sk_callback_sse2+0x9d9> + .byte 15,88,5,28,41,0,0 // addps 0x291c(%rip),%xmm0 # 56e0 <_sk_callback_sse2+0x9f4> + .byte 15,89,5,37,41,0,0 // mulps 0x2925(%rip),%xmm0 # 56f0 <_sk_callback_sse2+0xa04> + .byte 15,89,13,46,41,0,0 // mulps 0x292e(%rip),%xmm1 # 5700 <_sk_callback_sse2+0xa14> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,21,249,40,0,0 // mulps 0x28f9(%rip),%xmm2 # 5600 <_sk_callback_sse2+0x9e9> + .byte 15,89,21,52,41,0,0 // mulps 0x2934(%rip),%xmm2 # 5710 <_sk_callback_sse2+0xa24> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 68,15,92,202 // subps %xmm2,%xmm9 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 .byte 68,15,89,225 // mulps %xmm1,%xmm12 - .byte 15,40,21,238,40,0,0 // movaps 0x28ee(%rip),%xmm2 # 5610 <_sk_callback_sse2+0x9f9> + .byte 15,40,21,41,41,0,0 // movaps 0x2929(%rip),%xmm2 # 5720 <_sk_callback_sse2+0xa34> .byte 68,15,40,194 // movaps %xmm2,%xmm8 .byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8 - .byte 68,15,40,21,237,40,0,0 // movaps 0x28ed(%rip),%xmm10 # 5620 <_sk_callback_sse2+0xa09> + .byte 68,15,40,21,40,41,0,0 // movaps 0x2928(%rip),%xmm10 # 5730 <_sk_callback_sse2+0xa44> .byte 65,15,88,202 // addps %xmm10,%xmm1 - .byte 68,15,40,29,241,40,0,0 // movaps 0x28f1(%rip),%xmm11 # 5630 <_sk_callback_sse2+0xa19> + .byte 68,15,40,29,44,41,0,0 // movaps 0x292c(%rip),%xmm11 # 5740 <_sk_callback_sse2+0xa54> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 69,15,84,224 // andps %xmm8,%xmm12 .byte 68,15,85,193 // andnps %xmm1,%xmm8 @@ -30651,8 +31191,8 @@ _sk_lab_to_xyz_sse2: .byte 15,84,194 // andps %xmm2,%xmm0 .byte 65,15,85,209 // andnps %xmm9,%xmm2 .byte 15,86,208 // orps %xmm0,%xmm2 - .byte 68,15,89,5,161,40,0,0 // mulps 0x28a1(%rip),%xmm8 # 5640 <_sk_callback_sse2+0xa29> - .byte 15,89,21,170,40,0,0 // mulps 0x28aa(%rip),%xmm2 # 5650 <_sk_callback_sse2+0xa39> + .byte 68,15,89,5,220,40,0,0 // mulps 0x28dc(%rip),%xmm8 # 5750 <_sk_callback_sse2+0xa64> + .byte 15,89,21,229,40,0,0 // mulps 0x28e5(%rip),%xmm2 # 5760 <_sk_callback_sse2+0xa74> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -30668,7 +31208,7 @@ _sk_load_a8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,146,40,0,0 // mulps 0x2892(%rip),%xmm3 # 5660 <_sk_callback_sse2+0xa49> + .byte 15,89,29,205,40,0,0 // mulps 0x28cd(%rip),%xmm3 # 5770 <_sk_callback_sse2+0xa84> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -30713,7 +31253,7 @@ _sk_gather_a8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,1,40,0,0 // mulps 0x2801(%rip),%xmm3 # 5670 <_sk_callback_sse2+0xa59> + .byte 15,89,29,60,40,0,0 // mulps 0x283c(%rip),%xmm3 # 5780 <_sk_callback_sse2+0xa94> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -30726,7 +31266,7 @@ FUNCTION(_sk_store_a8_sse2) _sk_store_a8_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,245,39,0,0 // movaps 0x27f5(%rip),%xmm8 # 5680 <_sk_callback_sse2+0xa69> + .byte 68,15,40,5,48,40,0,0 // movaps 0x2830(%rip),%xmm8 # 5790 <_sk_callback_sse2+0xaa4> .byte 68,15,89,195 // mulps %xmm3,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 .byte 102,65,15,114,240,16 // pslld $0x10,%xmm8 @@ -30748,9 +31288,9 @@ _sk_load_g8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,188,39,0,0 // mulps 0x27bc(%rip),%xmm0 # 5690 <_sk_callback_sse2+0xa79> + .byte 15,89,5,247,39,0,0 // mulps 0x27f7(%rip),%xmm0 # 57a0 <_sk_callback_sse2+0xab4> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,195,39,0,0 // movaps 0x27c3(%rip),%xmm3 # 56a0 <_sk_callback_sse2+0xa89> + .byte 15,40,29,254,39,0,0 // movaps 0x27fe(%rip),%xmm3 # 57b0 <_sk_callback_sse2+0xac4> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,224 // jmpq *%rax @@ -30793,9 +31333,9 @@ _sk_gather_g8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,56,39,0,0 // mulps 0x2738(%rip),%xmm0 # 56b0 <_sk_callback_sse2+0xa99> + .byte 15,89,5,115,39,0,0 // mulps 0x2773(%rip),%xmm0 # 57c0 <_sk_callback_sse2+0xad4> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,63,39,0,0 // movaps 0x273f(%rip),%xmm3 # 56c0 <_sk_callback_sse2+0xaa9> + .byte 15,40,29,122,39,0,0 // movaps 0x277a(%rip),%xmm3 # 57d0 <_sk_callback_sse2+0xae4> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,224 // jmpq *%rax @@ -30807,9 +31347,9 @@ _sk_gather_i8_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 73,137,192 // mov %rax,%r8 .byte 77,133,192 // test %r8,%r8 - .byte 116,5 // je 2f98 <_sk_gather_i8_sse2+0xf> + .byte 116,5 // je 306d <_sk_gather_i8_sse2+0xf> .byte 76,137,192 // mov %r8,%rax - .byte 235,2 // jmp 2f9a <_sk_gather_i8_sse2+0x11> + .byte 235,2 // jmp 306f <_sk_gather_i8_sse2+0x11> .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1 @@ -30858,11 +31398,11 @@ _sk_gather_i8_sse2: .byte 102,67,15,110,12,136 // movd (%r8,%r9,4),%xmm1 .byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9 .byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9 - .byte 102,15,111,21,94,38,0,0 // movdqa 0x265e(%rip),%xmm2 # 56d0 <_sk_callback_sse2+0xab9> + .byte 102,15,111,21,153,38,0,0 // movdqa 0x2699(%rip),%xmm2 # 57e0 <_sk_callback_sse2+0xaf4> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,90,38,0,0 // movaps 0x265a(%rip),%xmm8 # 56e0 <_sk_callback_sse2+0xac9> + .byte 68,15,40,5,149,38,0,0 // movaps 0x2695(%rip),%xmm8 # 57f0 <_sk_callback_sse2+0xb04> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -30889,19 +31429,19 @@ _sk_load_565_sse2: .byte 243,15,126,20,120 // movq (%rax,%rdi,2),%xmm2 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,5,16,38,0,0 // movdqa 0x2610(%rip),%xmm0 # 56f0 <_sk_callback_sse2+0xad9> + .byte 102,15,111,5,75,38,0,0 // movdqa 0x264b(%rip),%xmm0 # 5800 <_sk_callback_sse2+0xb14> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,18,38,0,0 // mulps 0x2612(%rip),%xmm0 # 5700 <_sk_callback_sse2+0xae9> - .byte 102,15,111,13,26,38,0,0 // movdqa 0x261a(%rip),%xmm1 # 5710 <_sk_callback_sse2+0xaf9> + .byte 15,89,5,77,38,0,0 // mulps 0x264d(%rip),%xmm0 # 5810 <_sk_callback_sse2+0xb24> + .byte 102,15,111,13,85,38,0,0 // movdqa 0x2655(%rip),%xmm1 # 5820 <_sk_callback_sse2+0xb34> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,28,38,0,0 // mulps 0x261c(%rip),%xmm1 # 5720 <_sk_callback_sse2+0xb09> - .byte 102,15,219,21,36,38,0,0 // pand 0x2624(%rip),%xmm2 # 5730 <_sk_callback_sse2+0xb19> + .byte 15,89,13,87,38,0,0 // mulps 0x2657(%rip),%xmm1 # 5830 <_sk_callback_sse2+0xb44> + .byte 102,15,219,21,95,38,0,0 // pand 0x265f(%rip),%xmm2 # 5840 <_sk_callback_sse2+0xb54> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,42,38,0,0 // mulps 0x262a(%rip),%xmm2 # 5740 <_sk_callback_sse2+0xb29> + .byte 15,89,21,101,38,0,0 // mulps 0x2665(%rip),%xmm2 # 5850 <_sk_callback_sse2+0xb64> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,49,38,0,0 // movaps 0x2631(%rip),%xmm3 # 5750 <_sk_callback_sse2+0xb39> + .byte 15,40,29,108,38,0,0 // movaps 0x266c(%rip),%xmm3 # 5860 <_sk_callback_sse2+0xb74> .byte 255,224 // jmpq *%rax HIDDEN _sk_gather_565_sse2 @@ -30936,19 +31476,19 @@ _sk_gather_565_sse2: .byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,5,186,37,0,0 // movdqa 0x25ba(%rip),%xmm0 # 5760 <_sk_callback_sse2+0xb49> + .byte 102,15,111,5,245,37,0,0 // movdqa 0x25f5(%rip),%xmm0 # 5870 <_sk_callback_sse2+0xb84> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,188,37,0,0 // mulps 0x25bc(%rip),%xmm0 # 5770 <_sk_callback_sse2+0xb59> - .byte 102,15,111,13,196,37,0,0 // movdqa 0x25c4(%rip),%xmm1 # 5780 <_sk_callback_sse2+0xb69> + .byte 15,89,5,247,37,0,0 // mulps 0x25f7(%rip),%xmm0 # 5880 <_sk_callback_sse2+0xb94> + .byte 102,15,111,13,255,37,0,0 // movdqa 0x25ff(%rip),%xmm1 # 5890 <_sk_callback_sse2+0xba4> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,198,37,0,0 // mulps 0x25c6(%rip),%xmm1 # 5790 <_sk_callback_sse2+0xb79> - .byte 102,15,219,21,206,37,0,0 // pand 0x25ce(%rip),%xmm2 # 57a0 <_sk_callback_sse2+0xb89> + .byte 15,89,13,1,38,0,0 // mulps 0x2601(%rip),%xmm1 # 58a0 <_sk_callback_sse2+0xbb4> + .byte 102,15,219,21,9,38,0,0 // pand 0x2609(%rip),%xmm2 # 58b0 <_sk_callback_sse2+0xbc4> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,212,37,0,0 // mulps 0x25d4(%rip),%xmm2 # 57b0 <_sk_callback_sse2+0xb99> + .byte 15,89,21,15,38,0,0 // mulps 0x260f(%rip),%xmm2 # 58c0 <_sk_callback_sse2+0xbd4> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,219,37,0,0 // movaps 0x25db(%rip),%xmm3 # 57c0 <_sk_callback_sse2+0xba9> + .byte 15,40,29,22,38,0,0 // movaps 0x2616(%rip),%xmm3 # 58d0 <_sk_callback_sse2+0xbe4> .byte 255,224 // jmpq *%rax HIDDEN _sk_store_565_sse2 @@ -30957,12 +31497,12 @@ FUNCTION(_sk_store_565_sse2) _sk_store_565_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,220,37,0,0 // movaps 0x25dc(%rip),%xmm8 # 57d0 <_sk_callback_sse2+0xbb9> + .byte 68,15,40,5,23,38,0,0 // movaps 0x2617(%rip),%xmm8 # 58e0 <_sk_callback_sse2+0xbf4> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 .byte 102,65,15,114,241,11 // pslld $0xb,%xmm9 - .byte 68,15,40,21,209,37,0,0 // movaps 0x25d1(%rip),%xmm10 # 57e0 <_sk_callback_sse2+0xbc9> + .byte 68,15,40,21,12,38,0,0 // movaps 0x260c(%rip),%xmm10 # 58f0 <_sk_callback_sse2+0xc04> .byte 68,15,89,209 // mulps %xmm1,%xmm10 .byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10 .byte 102,65,15,114,242,5 // pslld $0x5,%xmm10 @@ -30986,21 +31526,21 @@ _sk_load_4444_sse2: .byte 243,15,126,28,120 // movq (%rax,%rdi,2),%xmm3 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,5,138,37,0,0 // movdqa 0x258a(%rip),%xmm0 # 57f0 <_sk_callback_sse2+0xbd9> + .byte 102,15,111,5,197,37,0,0 // movdqa 0x25c5(%rip),%xmm0 # 5900 <_sk_callback_sse2+0xc14> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,140,37,0,0 // mulps 0x258c(%rip),%xmm0 # 5800 <_sk_callback_sse2+0xbe9> - .byte 102,15,111,13,148,37,0,0 // movdqa 0x2594(%rip),%xmm1 # 5810 <_sk_callback_sse2+0xbf9> + .byte 15,89,5,199,37,0,0 // mulps 0x25c7(%rip),%xmm0 # 5910 <_sk_callback_sse2+0xc24> + .byte 102,15,111,13,207,37,0,0 // movdqa 0x25cf(%rip),%xmm1 # 5920 <_sk_callback_sse2+0xc34> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,150,37,0,0 // mulps 0x2596(%rip),%xmm1 # 5820 <_sk_callback_sse2+0xc09> - .byte 102,15,111,21,158,37,0,0 // movdqa 0x259e(%rip),%xmm2 # 5830 <_sk_callback_sse2+0xc19> + .byte 15,89,13,209,37,0,0 // mulps 0x25d1(%rip),%xmm1 # 5930 <_sk_callback_sse2+0xc44> + .byte 102,15,111,21,217,37,0,0 // movdqa 0x25d9(%rip),%xmm2 # 5940 <_sk_callback_sse2+0xc54> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,160,37,0,0 // mulps 0x25a0(%rip),%xmm2 # 5840 <_sk_callback_sse2+0xc29> - .byte 102,15,219,29,168,37,0,0 // pand 0x25a8(%rip),%xmm3 # 5850 <_sk_callback_sse2+0xc39> + .byte 15,89,21,219,37,0,0 // mulps 0x25db(%rip),%xmm2 # 5950 <_sk_callback_sse2+0xc64> + .byte 102,15,219,29,227,37,0,0 // pand 0x25e3(%rip),%xmm3 # 5960 <_sk_callback_sse2+0xc74> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,174,37,0,0 // mulps 0x25ae(%rip),%xmm3 # 5860 <_sk_callback_sse2+0xc49> + .byte 15,89,29,233,37,0,0 // mulps 0x25e9(%rip),%xmm3 # 5970 <_sk_callback_sse2+0xc84> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -31036,21 +31576,21 @@ _sk_gather_4444_sse2: .byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,5,53,37,0,0 // movdqa 0x2535(%rip),%xmm0 # 5870 <_sk_callback_sse2+0xc59> + .byte 102,15,111,5,112,37,0,0 // movdqa 0x2570(%rip),%xmm0 # 5980 <_sk_callback_sse2+0xc94> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,55,37,0,0 // mulps 0x2537(%rip),%xmm0 # 5880 <_sk_callback_sse2+0xc69> - .byte 102,15,111,13,63,37,0,0 // movdqa 0x253f(%rip),%xmm1 # 5890 <_sk_callback_sse2+0xc79> + .byte 15,89,5,114,37,0,0 // mulps 0x2572(%rip),%xmm0 # 5990 <_sk_callback_sse2+0xca4> + .byte 102,15,111,13,122,37,0,0 // movdqa 0x257a(%rip),%xmm1 # 59a0 <_sk_callback_sse2+0xcb4> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,65,37,0,0 // mulps 0x2541(%rip),%xmm1 # 58a0 <_sk_callback_sse2+0xc89> - .byte 102,15,111,21,73,37,0,0 // movdqa 0x2549(%rip),%xmm2 # 58b0 <_sk_callback_sse2+0xc99> + .byte 15,89,13,124,37,0,0 // mulps 0x257c(%rip),%xmm1 # 59b0 <_sk_callback_sse2+0xcc4> + .byte 102,15,111,21,132,37,0,0 // movdqa 0x2584(%rip),%xmm2 # 59c0 <_sk_callback_sse2+0xcd4> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,75,37,0,0 // mulps 0x254b(%rip),%xmm2 # 58c0 <_sk_callback_sse2+0xca9> - .byte 102,15,219,29,83,37,0,0 // pand 0x2553(%rip),%xmm3 # 58d0 <_sk_callback_sse2+0xcb9> + .byte 15,89,21,134,37,0,0 // mulps 0x2586(%rip),%xmm2 # 59d0 <_sk_callback_sse2+0xce4> + .byte 102,15,219,29,142,37,0,0 // pand 0x258e(%rip),%xmm3 # 59e0 <_sk_callback_sse2+0xcf4> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,89,37,0,0 // mulps 0x2559(%rip),%xmm3 # 58e0 <_sk_callback_sse2+0xcc9> + .byte 15,89,29,148,37,0,0 // mulps 0x2594(%rip),%xmm3 # 59f0 <_sk_callback_sse2+0xd04> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -31060,7 +31600,7 @@ FUNCTION(_sk_store_4444_sse2) _sk_store_4444_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,88,37,0,0 // movaps 0x2558(%rip),%xmm8 # 58f0 <_sk_callback_sse2+0xcd9> + .byte 68,15,40,5,147,37,0,0 // movaps 0x2593(%rip),%xmm8 # 5a00 <_sk_callback_sse2+0xd14> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -31092,11 +31632,11 @@ _sk_load_8888_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 68,15,16,12,184 // movups (%rax,%rdi,4),%xmm9 - .byte 15,40,21,235,36,0,0 // movaps 0x24eb(%rip),%xmm2 # 5900 <_sk_callback_sse2+0xce9> + .byte 15,40,21,38,37,0,0 // movaps 0x2526(%rip),%xmm2 # 5a10 <_sk_callback_sse2+0xd24> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,84,194 // andps %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,233,36,0,0 // movaps 0x24e9(%rip),%xmm8 # 5910 <_sk_callback_sse2+0xcf9> + .byte 68,15,40,5,36,37,0,0 // movaps 0x2524(%rip),%xmm8 # 5a20 <_sk_callback_sse2+0xd34> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,40,201 // movaps %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -31145,11 +31685,11 @@ _sk_gather_8888_sse2: .byte 102,67,15,110,12,129 // movd (%r9,%r8,4),%xmm1 .byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9 .byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9 - .byte 102,15,111,21,58,36,0,0 // movdqa 0x243a(%rip),%xmm2 # 5920 <_sk_callback_sse2+0xd09> + .byte 102,15,111,21,117,36,0,0 // movdqa 0x2475(%rip),%xmm2 # 5a30 <_sk_callback_sse2+0xd44> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,54,36,0,0 // movaps 0x2436(%rip),%xmm8 # 5930 <_sk_callback_sse2+0xd19> + .byte 68,15,40,5,113,36,0,0 // movaps 0x2471(%rip),%xmm8 # 5a40 <_sk_callback_sse2+0xd54> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -31173,7 +31713,7 @@ FUNCTION(_sk_store_8888_sse2) _sk_store_8888_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,249,35,0,0 // movaps 0x23f9(%rip),%xmm8 # 5940 <_sk_callback_sse2+0xd29> + .byte 68,15,40,5,52,36,0,0 // movaps 0x2434(%rip),%xmm8 # 5a50 <_sk_callback_sse2+0xd64> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -31212,7 +31752,7 @@ _sk_load_f16_sse2: .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 .byte 102,65,15,111,206 // movdqa %xmm14,%xmm1 .byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1 - .byte 102,68,15,111,13,105,35,0,0 // movdqa 0x2369(%rip),%xmm9 # 5950 <_sk_callback_sse2+0xd39> + .byte 102,68,15,111,13,164,35,0,0 // movdqa 0x23a4(%rip),%xmm9 # 5a60 <_sk_callback_sse2+0xd74> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,193 // pand %xmm9,%xmm0 .byte 102,15,239,200 // pxor %xmm0,%xmm1 @@ -31220,11 +31760,11 @@ _sk_load_f16_sse2: .byte 102,68,15,111,233 // movdqa %xmm1,%xmm13 .byte 102,65,15,114,245,13 // pslld $0xd,%xmm13 .byte 102,68,15,235,232 // por %xmm0,%xmm13 - .byte 102,68,15,111,29,78,35,0,0 // movdqa 0x234e(%rip),%xmm11 # 5960 <_sk_callback_sse2+0xd49> + .byte 102,68,15,111,29,137,35,0,0 // movdqa 0x2389(%rip),%xmm11 # 5a70 <_sk_callback_sse2+0xd84> .byte 102,69,15,254,235 // paddd %xmm11,%xmm13 - .byte 102,68,15,111,37,80,35,0,0 // movdqa 0x2350(%rip),%xmm12 # 5970 <_sk_callback_sse2+0xd59> + .byte 102,68,15,111,37,139,35,0,0 // movdqa 0x238b(%rip),%xmm12 # 5a80 <_sk_callback_sse2+0xd94> .byte 102,65,15,239,204 // pxor %xmm12,%xmm1 - .byte 102,15,111,29,83,35,0,0 // movdqa 0x2353(%rip),%xmm3 # 5980 <_sk_callback_sse2+0xd69> + .byte 102,15,111,29,142,35,0,0 // movdqa 0x238e(%rip),%xmm3 # 5a90 <_sk_callback_sse2+0xda4> .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0 .byte 102,65,15,223,197 // pandn %xmm13,%xmm0 @@ -31310,7 +31850,7 @@ _sk_gather_f16_sse2: .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 .byte 102,65,15,111,206 // movdqa %xmm14,%xmm1 .byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1 - .byte 102,68,15,111,13,225,33,0,0 // movdqa 0x21e1(%rip),%xmm9 # 5990 <_sk_callback_sse2+0xd79> + .byte 102,68,15,111,13,28,34,0,0 // movdqa 0x221c(%rip),%xmm9 # 5aa0 <_sk_callback_sse2+0xdb4> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,193 // pand %xmm9,%xmm0 .byte 102,15,239,200 // pxor %xmm0,%xmm1 @@ -31318,11 +31858,11 @@ _sk_gather_f16_sse2: .byte 102,68,15,111,233 // movdqa %xmm1,%xmm13 .byte 102,65,15,114,245,13 // pslld $0xd,%xmm13 .byte 102,68,15,235,232 // por %xmm0,%xmm13 - .byte 102,68,15,111,29,198,33,0,0 // movdqa 0x21c6(%rip),%xmm11 # 59a0 <_sk_callback_sse2+0xd89> + .byte 102,68,15,111,29,1,34,0,0 // movdqa 0x2201(%rip),%xmm11 # 5ab0 <_sk_callback_sse2+0xdc4> .byte 102,69,15,254,235 // paddd %xmm11,%xmm13 - .byte 102,68,15,111,37,200,33,0,0 // movdqa 0x21c8(%rip),%xmm12 # 59b0 <_sk_callback_sse2+0xd99> + .byte 102,68,15,111,37,3,34,0,0 // movdqa 0x2203(%rip),%xmm12 # 5ac0 <_sk_callback_sse2+0xdd4> .byte 102,65,15,239,204 // pxor %xmm12,%xmm1 - .byte 102,15,111,29,203,33,0,0 // movdqa 0x21cb(%rip),%xmm3 # 59c0 <_sk_callback_sse2+0xda9> + .byte 102,15,111,29,6,34,0,0 // movdqa 0x2206(%rip),%xmm3 # 5ad0 <_sk_callback_sse2+0xde4> .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0 .byte 102,65,15,223,197 // pandn %xmm13,%xmm0 @@ -31375,17 +31915,17 @@ FUNCTION(_sk_store_f16_sse2) _sk_store_f16_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 102,68,15,111,21,243,32,0,0 // movdqa 0x20f3(%rip),%xmm10 # 59d0 <_sk_callback_sse2+0xdb9> + .byte 102,68,15,111,21,46,33,0,0 // movdqa 0x212e(%rip),%xmm10 # 5ae0 <_sk_callback_sse2+0xdf4> .byte 102,68,15,111,224 // movdqa %xmm0,%xmm12 .byte 102,68,15,111,232 // movdqa %xmm0,%xmm13 .byte 102,69,15,219,234 // pand %xmm10,%xmm13 .byte 102,69,15,239,229 // pxor %xmm13,%xmm12 - .byte 102,68,15,111,13,230,32,0,0 // movdqa 0x20e6(%rip),%xmm9 # 59e0 <_sk_callback_sse2+0xdc9> + .byte 102,68,15,111,13,33,33,0,0 // movdqa 0x2121(%rip),%xmm9 # 5af0 <_sk_callback_sse2+0xe04> .byte 102,65,15,114,213,16 // psrld $0x10,%xmm13 .byte 102,69,15,111,193 // movdqa %xmm9,%xmm8 .byte 102,69,15,102,196 // pcmpgtd %xmm12,%xmm8 .byte 102,65,15,114,212,13 // psrld $0xd,%xmm12 - .byte 102,68,15,111,29,215,32,0,0 // movdqa 0x20d7(%rip),%xmm11 # 59f0 <_sk_callback_sse2+0xdd9> + .byte 102,68,15,111,29,18,33,0,0 // movdqa 0x2112(%rip),%xmm11 # 5b00 <_sk_callback_sse2+0xe14> .byte 102,69,15,235,235 // por %xmm11,%xmm13 .byte 102,69,15,254,236 // paddd %xmm12,%xmm13 .byte 102,65,15,114,245,16 // pslld $0x10,%xmm13 @@ -31464,7 +32004,7 @@ _sk_load_u16_be_sse2: .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1 .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0 - .byte 68,15,40,5,117,31,0,0 // movaps 0x1f75(%rip),%xmm8 # 5a00 <_sk_callback_sse2+0xde9> + .byte 68,15,40,5,176,31,0,0 // movaps 0x1fb0(%rip),%xmm8 # 5b10 <_sk_callback_sse2+0xe24> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -31517,7 +32057,7 @@ _sk_load_rgb_u16_be_sse2: .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,65,15,97,192 // punpcklwd %xmm8,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,13,177,30,0,0 // movaps 0x1eb1(%rip),%xmm9 # 5a10 <_sk_callback_sse2+0xdf9> + .byte 68,15,40,13,236,30,0,0 // movaps 0x1eec(%rip),%xmm9 # 5b20 <_sk_callback_sse2+0xe34> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -31534,7 +32074,7 @@ _sk_load_rgb_u16_be_sse2: .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,120,30,0,0 // movaps 0x1e78(%rip),%xmm3 # 5a20 <_sk_callback_sse2+0xe09> + .byte 15,40,29,179,30,0,0 // movaps 0x1eb3(%rip),%xmm3 # 5b30 <_sk_callback_sse2+0xe44> .byte 255,224 // jmpq *%rax HIDDEN _sk_store_u16_be_sse2 @@ -31543,7 +32083,7 @@ FUNCTION(_sk_store_u16_be_sse2) _sk_store_u16_be_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,13,121,30,0,0 // movaps 0x1e79(%rip),%xmm9 # 5a30 <_sk_callback_sse2+0xe19> + .byte 68,15,40,13,180,30,0,0 // movaps 0x1eb4(%rip),%xmm9 # 5b40 <_sk_callback_sse2+0xe54> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 @@ -31689,7 +32229,7 @@ _sk_repeat_x_sse2: .byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10 .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,84,13,121,28,0,0 // andps 0x1c79(%rip),%xmm9 # 5a40 <_sk_callback_sse2+0xe29> + .byte 68,15,84,13,180,28,0,0 // andps 0x1cb4(%rip),%xmm9 # 5b50 <_sk_callback_sse2+0xe64> .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 .byte 65,15,92,194 // subps %xmm10,%xmm0 @@ -31708,7 +32248,7 @@ _sk_repeat_y_sse2: .byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10 .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,84,13,79,28,0,0 // andps 0x1c4f(%rip),%xmm9 # 5a50 <_sk_callback_sse2+0xe39> + .byte 68,15,84,13,138,28,0,0 // andps 0x1c8a(%rip),%xmm9 # 5b60 <_sk_callback_sse2+0xe74> .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 .byte 65,15,92,202 // subps %xmm10,%xmm1 @@ -31731,7 +32271,7 @@ _sk_mirror_x_sse2: .byte 243,69,15,91,218 // cvttps2dq %xmm10,%xmm11 .byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11 .byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10 - .byte 68,15,84,21,19,28,0,0 // andps 0x1c13(%rip),%xmm10 # 5a60 <_sk_callback_sse2+0xe49> + .byte 68,15,84,21,78,28,0,0 // andps 0x1c4e(%rip),%xmm10 # 5b70 <_sk_callback_sse2+0xe84> .byte 69,15,87,228 // xorps %xmm12,%xmm12 .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 69,15,89,216 // mulps %xmm8,%xmm11 @@ -31758,7 +32298,7 @@ _sk_mirror_y_sse2: .byte 243,69,15,91,218 // cvttps2dq %xmm10,%xmm11 .byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11 .byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10 - .byte 68,15,84,21,199,27,0,0 // andps 0x1bc7(%rip),%xmm10 # 5a70 <_sk_callback_sse2+0xe59> + .byte 68,15,84,21,2,28,0,0 // andps 0x1c02(%rip),%xmm10 # 5b80 <_sk_callback_sse2+0xe94> .byte 69,15,87,228 // xorps %xmm12,%xmm12 .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 69,15,89,216 // mulps %xmm8,%xmm11 @@ -31775,7 +32315,7 @@ FUNCTION(_sk_clamp_x_1_sse2) _sk_clamp_x_1_sse2: .byte 69,15,87,192 // xorps %xmm8,%xmm8 .byte 68,15,95,192 // maxps %xmm0,%xmm8 - .byte 68,15,93,5,167,27,0,0 // minps 0x1ba7(%rip),%xmm8 # 5a80 <_sk_callback_sse2+0xe69> + .byte 68,15,93,5,226,27,0,0 // minps 0x1be2(%rip),%xmm8 # 5b90 <_sk_callback_sse2+0xea4> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -31788,7 +32328,7 @@ _sk_repeat_x_1_sse2: .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9 - .byte 68,15,84,13,149,27,0,0 // andps 0x1b95(%rip),%xmm9 # 5a90 <_sk_callback_sse2+0xe79> + .byte 68,15,84,13,208,27,0,0 // andps 0x1bd0(%rip),%xmm9 # 5ba0 <_sk_callback_sse2+0xeb4> .byte 69,15,92,193 // subps %xmm9,%xmm8 .byte 65,15,92,192 // subps %xmm8,%xmm0 .byte 72,173 // lods %ds:(%rsi),%rax @@ -31798,14 +32338,14 @@ HIDDEN _sk_mirror_x_1_sse2 .globl _sk_mirror_x_1_sse2 FUNCTION(_sk_mirror_x_1_sse2) _sk_mirror_x_1_sse2: - .byte 68,15,40,5,145,27,0,0 // movaps 0x1b91(%rip),%xmm8 # 5aa0 <_sk_callback_sse2+0xe89> + .byte 68,15,40,5,204,27,0,0 // movaps 0x1bcc(%rip),%xmm8 # 5bb0 <_sk_callback_sse2+0xec4> .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,13,149,27,0,0 // movaps 0x1b95(%rip),%xmm9 # 5ab0 <_sk_callback_sse2+0xe99> + .byte 68,15,40,13,208,27,0,0 // movaps 0x1bd0(%rip),%xmm9 # 5bc0 <_sk_callback_sse2+0xed4> .byte 68,15,89,200 // mulps %xmm0,%xmm9 .byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10 .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,84,13,139,27,0,0 // andps 0x1b8b(%rip),%xmm9 # 5ac0 <_sk_callback_sse2+0xea9> + .byte 68,15,84,13,198,27,0,0 // andps 0x1bc6(%rip),%xmm9 # 5bd0 <_sk_callback_sse2+0xee4> .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,88,210 // addps %xmm10,%xmm10 @@ -31821,10 +32361,10 @@ HIDDEN _sk_luminance_to_alpha_sse2 FUNCTION(_sk_luminance_to_alpha_sse2) _sk_luminance_to_alpha_sse2: .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 15,89,5,113,27,0,0 // mulps 0x1b71(%rip),%xmm0 # 5ad0 <_sk_callback_sse2+0xeb9> - .byte 15,89,13,122,27,0,0 // mulps 0x1b7a(%rip),%xmm1 # 5ae0 <_sk_callback_sse2+0xec9> + .byte 15,89,5,172,27,0,0 // mulps 0x1bac(%rip),%xmm0 # 5be0 <_sk_callback_sse2+0xef4> + .byte 15,89,13,181,27,0,0 // mulps 0x1bb5(%rip),%xmm1 # 5bf0 <_sk_callback_sse2+0xf04> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,29,128,27,0,0 // mulps 0x1b80(%rip),%xmm3 # 5af0 <_sk_callback_sse2+0xed9> + .byte 15,89,29,187,27,0,0 // mulps 0x1bbb(%rip),%xmm3 # 5c00 <_sk_callback_sse2+0xf14> .byte 15,88,217 // addps %xmm1,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 @@ -32100,9 +32640,9 @@ _sk_evenly_spaced_gradient_sse2: .byte 72,139,8 // mov (%rax),%rcx .byte 76,139,88,8 // mov 0x8(%rax),%r11 .byte 72,255,201 // dec %rcx - .byte 120,7 // js 43a9 <_sk_evenly_spaced_gradient_sse2+0x15> + .byte 120,7 // js 447e <_sk_evenly_spaced_gradient_sse2+0x15> .byte 243,72,15,42,201 // cvtsi2ss %rcx,%xmm1 - .byte 235,21 // jmp 43be <_sk_evenly_spaced_gradient_sse2+0x2a> + .byte 235,21 // jmp 4493 <_sk_evenly_spaced_gradient_sse2+0x2a> .byte 73,137,200 // mov %rcx,%r8 .byte 73,209,232 // shr %r8 .byte 131,225,1 // and $0x1,%ecx @@ -32198,15 +32738,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse2 .globl _sk_gauss_a_to_rgba_sse2 FUNCTION(_sk_gauss_a_to_rgba_sse2) _sk_gauss_a_to_rgba_sse2: - .byte 15,40,5,185,21,0,0 // movaps 0x15b9(%rip),%xmm0 # 5b00 <_sk_callback_sse2+0xee9> + .byte 15,40,5,244,21,0,0 // movaps 0x15f4(%rip),%xmm0 # 5c10 <_sk_callback_sse2+0xf24> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,191,21,0,0 // addps 0x15bf(%rip),%xmm0 # 5b10 <_sk_callback_sse2+0xef9> + .byte 15,88,5,250,21,0,0 // addps 0x15fa(%rip),%xmm0 # 5c20 <_sk_callback_sse2+0xf34> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,197,21,0,0 // addps 0x15c5(%rip),%xmm0 # 5b20 <_sk_callback_sse2+0xf09> + .byte 15,88,5,0,22,0,0 // addps 0x1600(%rip),%xmm0 # 5c30 <_sk_callback_sse2+0xf44> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,203,21,0,0 // addps 0x15cb(%rip),%xmm0 # 5b30 <_sk_callback_sse2+0xf19> + .byte 15,88,5,6,22,0,0 // addps 0x1606(%rip),%xmm0 # 5c40 <_sk_callback_sse2+0xf54> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,209,21,0,0 // addps 0x15d1(%rip),%xmm0 # 5b40 <_sk_callback_sse2+0xf29> + .byte 15,88,5,12,22,0,0 // addps 0x160c(%rip),%xmm0 # 5c50 <_sk_callback_sse2+0xf64> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 @@ -32221,12 +32761,12 @@ _sk_gradient_sse2: .byte 76,139,0 // mov (%rax),%r8 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,2 // cmp $0x2,%r8 - .byte 114,50 // jb 45bd <_sk_gradient_sse2+0x41> + .byte 114,50 // jb 4692 <_sk_gradient_sse2+0x41> .byte 72,139,72,72 // mov 0x48(%rax),%rcx .byte 73,255,200 // dec %r8 .byte 72,131,193,4 // add $0x4,%rcx .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 15,40,21,175,21,0,0 // movaps 0x15af(%rip),%xmm2 # 5b50 <_sk_callback_sse2+0xf39> + .byte 15,40,21,234,21,0,0 // movaps 0x15ea(%rip),%xmm2 # 5c60 <_sk_callback_sse2+0xf74> .byte 243,15,16,25 // movss (%rcx),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 @@ -32234,7 +32774,7 @@ _sk_gradient_sse2: .byte 102,15,254,203 // paddd %xmm3,%xmm1 .byte 72,131,193,4 // add $0x4,%rcx .byte 73,255,200 // dec %r8 - .byte 117,228 // jne 45a1 <_sk_gradient_sse2+0x25> + .byte 117,228 // jne 4676 <_sk_gradient_sse2+0x25> .byte 65,86 // push %r14 .byte 83 // push %rbx .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2 @@ -32374,29 +32914,29 @@ _sk_xy_to_unit_angle_sse2: .byte 69,15,94,220 // divps %xmm12,%xmm11 .byte 69,15,40,227 // movaps %xmm11,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 - .byte 68,15,40,45,113,19,0,0 // movaps 0x1371(%rip),%xmm13 # 5b60 <_sk_callback_sse2+0xf49> + .byte 68,15,40,45,172,19,0,0 // movaps 0x13ac(%rip),%xmm13 # 5c70 <_sk_callback_sse2+0xf84> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,117,19,0,0 // addps 0x1375(%rip),%xmm13 # 5b70 <_sk_callback_sse2+0xf59> + .byte 68,15,88,45,176,19,0,0 // addps 0x13b0(%rip),%xmm13 # 5c80 <_sk_callback_sse2+0xf94> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,121,19,0,0 // addps 0x1379(%rip),%xmm13 # 5b80 <_sk_callback_sse2+0xf69> + .byte 68,15,88,45,180,19,0,0 // addps 0x13b4(%rip),%xmm13 # 5c90 <_sk_callback_sse2+0xfa4> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,125,19,0,0 // addps 0x137d(%rip),%xmm13 # 5b90 <_sk_callback_sse2+0xf79> + .byte 68,15,88,45,184,19,0,0 // addps 0x13b8(%rip),%xmm13 # 5ca0 <_sk_callback_sse2+0xfb4> .byte 69,15,89,235 // mulps %xmm11,%xmm13 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,40,21,124,19,0,0 // movaps 0x137c(%rip),%xmm10 # 5ba0 <_sk_callback_sse2+0xf89> + .byte 68,15,40,21,183,19,0,0 // movaps 0x13b7(%rip),%xmm10 # 5cb0 <_sk_callback_sse2+0xfc4> .byte 69,15,92,213 // subps %xmm13,%xmm10 .byte 69,15,84,209 // andps %xmm9,%xmm10 .byte 69,15,85,205 // andnps %xmm13,%xmm9 .byte 69,15,86,202 // orps %xmm10,%xmm9 .byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8 - .byte 68,15,40,21,111,19,0,0 // movaps 0x136f(%rip),%xmm10 # 5bb0 <_sk_callback_sse2+0xf99> + .byte 68,15,40,21,170,19,0,0 // movaps 0x13aa(%rip),%xmm10 # 5cc0 <_sk_callback_sse2+0xfd4> .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,84,208 // andps %xmm8,%xmm10 .byte 69,15,85,193 // andnps %xmm9,%xmm8 .byte 69,15,86,194 // orps %xmm10,%xmm8 .byte 68,15,40,201 // movaps %xmm1,%xmm9 .byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9 - .byte 68,15,40,21,94,19,0,0 // movaps 0x135e(%rip),%xmm10 # 5bc0 <_sk_callback_sse2+0xfa9> + .byte 68,15,40,21,153,19,0,0 // movaps 0x1399(%rip),%xmm10 # 5cd0 <_sk_callback_sse2+0xfe4> .byte 69,15,92,208 // subps %xmm8,%xmm10 .byte 69,15,84,209 // andps %xmm9,%xmm10 .byte 69,15,85,200 // andnps %xmm8,%xmm9 @@ -32423,7 +32963,7 @@ HIDDEN _sk_save_xy_sse2 FUNCTION(_sk_save_xy_sse2) _sk_save_xy_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,48,19,0,0 // movaps 0x1330(%rip),%xmm8 # 5bd0 <_sk_callback_sse2+0xfb9> + .byte 68,15,40,5,107,19,0,0 // movaps 0x136b(%rip),%xmm8 # 5ce0 <_sk_callback_sse2+0xff4> .byte 15,17,0 // movups %xmm0,(%rax) .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,88,200 // addps %xmm8,%xmm9 @@ -32431,7 +32971,7 @@ _sk_save_xy_sse2: .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,40,217 // movaps %xmm9,%xmm11 .byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11 - .byte 68,15,40,37,27,19,0,0 // movaps 0x131b(%rip),%xmm12 # 5be0 <_sk_callback_sse2+0xfc9> + .byte 68,15,40,37,86,19,0,0 // movaps 0x1356(%rip),%xmm12 # 5cf0 <_sk_callback_sse2+0x1004> .byte 69,15,84,220 // andps %xmm12,%xmm11 .byte 69,15,92,211 // subps %xmm11,%xmm10 .byte 69,15,92,202 // subps %xmm10,%xmm9 @@ -32478,8 +33018,8 @@ _sk_bilinear_nx_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,148,18,0,0 // addps 0x1294(%rip),%xmm0 # 5bf0 <_sk_callback_sse2+0xfd9> - .byte 68,15,40,13,156,18,0,0 // movaps 0x129c(%rip),%xmm9 # 5c00 <_sk_callback_sse2+0xfe9> + .byte 15,88,5,207,18,0,0 // addps 0x12cf(%rip),%xmm0 # 5d00 <_sk_callback_sse2+0x1014> + .byte 68,15,40,13,215,18,0,0 // movaps 0x12d7(%rip),%xmm9 # 5d10 <_sk_callback_sse2+0x1024> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -32492,7 +33032,7 @@ _sk_bilinear_px_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,139,18,0,0 // addps 0x128b(%rip),%xmm0 # 5c10 <_sk_callback_sse2+0xff9> + .byte 15,88,5,198,18,0,0 // addps 0x12c6(%rip),%xmm0 # 5d20 <_sk_callback_sse2+0x1034> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -32504,8 +33044,8 @@ _sk_bilinear_ny_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,125,18,0,0 // addps 0x127d(%rip),%xmm1 # 5c20 <_sk_callback_sse2+0x1009> - .byte 68,15,40,13,133,18,0,0 // movaps 0x1285(%rip),%xmm9 # 5c30 <_sk_callback_sse2+0x1019> + .byte 15,88,13,184,18,0,0 // addps 0x12b8(%rip),%xmm1 # 5d30 <_sk_callback_sse2+0x1044> + .byte 68,15,40,13,192,18,0,0 // movaps 0x12c0(%rip),%xmm9 # 5d40 <_sk_callback_sse2+0x1054> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -32518,7 +33058,7 @@ _sk_bilinear_py_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,115,18,0,0 // addps 0x1273(%rip),%xmm1 # 5c40 <_sk_callback_sse2+0x1029> + .byte 15,88,13,174,18,0,0 // addps 0x12ae(%rip),%xmm1 # 5d50 <_sk_callback_sse2+0x1064> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -32530,13 +33070,13 @@ _sk_bicubic_n3x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,102,18,0,0 // addps 0x1266(%rip),%xmm0 # 5c50 <_sk_callback_sse2+0x1039> - .byte 68,15,40,13,110,18,0,0 // movaps 0x126e(%rip),%xmm9 # 5c60 <_sk_callback_sse2+0x1049> + .byte 15,88,5,161,18,0,0 // addps 0x12a1(%rip),%xmm0 # 5d60 <_sk_callback_sse2+0x1074> + .byte 68,15,40,13,169,18,0,0 // movaps 0x12a9(%rip),%xmm9 # 5d70 <_sk_callback_sse2+0x1084> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,106,18,0,0 // mulps 0x126a(%rip),%xmm9 # 5c70 <_sk_callback_sse2+0x1059> - .byte 68,15,88,13,114,18,0,0 // addps 0x1272(%rip),%xmm9 # 5c80 <_sk_callback_sse2+0x1069> + .byte 68,15,89,13,165,18,0,0 // mulps 0x12a5(%rip),%xmm9 # 5d80 <_sk_callback_sse2+0x1094> + .byte 68,15,88,13,173,18,0,0 // addps 0x12ad(%rip),%xmm9 # 5d90 <_sk_callback_sse2+0x10a4> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -32549,16 +33089,16 @@ _sk_bicubic_n1x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,97,18,0,0 // addps 0x1261(%rip),%xmm0 # 5c90 <_sk_callback_sse2+0x1079> - .byte 68,15,40,13,105,18,0,0 // movaps 0x1269(%rip),%xmm9 # 5ca0 <_sk_callback_sse2+0x1089> + .byte 15,88,5,156,18,0,0 // addps 0x129c(%rip),%xmm0 # 5da0 <_sk_callback_sse2+0x10b4> + .byte 68,15,40,13,164,18,0,0 // movaps 0x12a4(%rip),%xmm9 # 5db0 <_sk_callback_sse2+0x10c4> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,109,18,0,0 // movaps 0x126d(%rip),%xmm8 # 5cb0 <_sk_callback_sse2+0x1099> + .byte 68,15,40,5,168,18,0,0 // movaps 0x12a8(%rip),%xmm8 # 5dc0 <_sk_callback_sse2+0x10d4> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,113,18,0,0 // addps 0x1271(%rip),%xmm8 # 5cc0 <_sk_callback_sse2+0x10a9> + .byte 68,15,88,5,172,18,0,0 // addps 0x12ac(%rip),%xmm8 # 5dd0 <_sk_callback_sse2+0x10e4> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,117,18,0,0 // addps 0x1275(%rip),%xmm8 # 5cd0 <_sk_callback_sse2+0x10b9> + .byte 68,15,88,5,176,18,0,0 // addps 0x12b0(%rip),%xmm8 # 5de0 <_sk_callback_sse2+0x10f4> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,121,18,0,0 // addps 0x1279(%rip),%xmm8 # 5ce0 <_sk_callback_sse2+0x10c9> + .byte 68,15,88,5,180,18,0,0 // addps 0x12b4(%rip),%xmm8 # 5df0 <_sk_callback_sse2+0x1104> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -32568,17 +33108,17 @@ HIDDEN _sk_bicubic_p1x_sse2 FUNCTION(_sk_bicubic_p1x_sse2) _sk_bicubic_p1x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,115,18,0,0 // movaps 0x1273(%rip),%xmm8 # 5cf0 <_sk_callback_sse2+0x10d9> + .byte 68,15,40,5,174,18,0,0 // movaps 0x12ae(%rip),%xmm8 # 5e00 <_sk_callback_sse2+0x1114> .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,21,111,18,0,0 // movaps 0x126f(%rip),%xmm10 # 5d00 <_sk_callback_sse2+0x10e9> + .byte 68,15,40,21,170,18,0,0 // movaps 0x12aa(%rip),%xmm10 # 5e10 <_sk_callback_sse2+0x1124> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,115,18,0,0 // addps 0x1273(%rip),%xmm10 # 5d10 <_sk_callback_sse2+0x10f9> + .byte 68,15,88,21,174,18,0,0 // addps 0x12ae(%rip),%xmm10 # 5e20 <_sk_callback_sse2+0x1134> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,111,18,0,0 // addps 0x126f(%rip),%xmm10 # 5d20 <_sk_callback_sse2+0x1109> + .byte 68,15,88,21,170,18,0,0 // addps 0x12aa(%rip),%xmm10 # 5e30 <_sk_callback_sse2+0x1144> .byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -32590,11 +33130,11 @@ _sk_bicubic_p3x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,98,18,0,0 // addps 0x1262(%rip),%xmm0 # 5d30 <_sk_callback_sse2+0x1119> + .byte 15,88,5,157,18,0,0 // addps 0x129d(%rip),%xmm0 # 5e40 <_sk_callback_sse2+0x1154> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,98,18,0,0 // mulps 0x1262(%rip),%xmm8 # 5d40 <_sk_callback_sse2+0x1129> - .byte 68,15,88,5,106,18,0,0 // addps 0x126a(%rip),%xmm8 # 5d50 <_sk_callback_sse2+0x1139> + .byte 68,15,89,5,157,18,0,0 // mulps 0x129d(%rip),%xmm8 # 5e50 <_sk_callback_sse2+0x1164> + .byte 68,15,88,5,165,18,0,0 // addps 0x12a5(%rip),%xmm8 # 5e60 <_sk_callback_sse2+0x1174> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -32607,13 +33147,13 @@ _sk_bicubic_n3y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,88,18,0,0 // addps 0x1258(%rip),%xmm1 # 5d60 <_sk_callback_sse2+0x1149> - .byte 68,15,40,13,96,18,0,0 // movaps 0x1260(%rip),%xmm9 # 5d70 <_sk_callback_sse2+0x1159> + .byte 15,88,13,147,18,0,0 // addps 0x1293(%rip),%xmm1 # 5e70 <_sk_callback_sse2+0x1184> + .byte 68,15,40,13,155,18,0,0 // movaps 0x129b(%rip),%xmm9 # 5e80 <_sk_callback_sse2+0x1194> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,92,18,0,0 // mulps 0x125c(%rip),%xmm9 # 5d80 <_sk_callback_sse2+0x1169> - .byte 68,15,88,13,100,18,0,0 // addps 0x1264(%rip),%xmm9 # 5d90 <_sk_callback_sse2+0x1179> + .byte 68,15,89,13,151,18,0,0 // mulps 0x1297(%rip),%xmm9 # 5e90 <_sk_callback_sse2+0x11a4> + .byte 68,15,88,13,159,18,0,0 // addps 0x129f(%rip),%xmm9 # 5ea0 <_sk_callback_sse2+0x11b4> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -32626,16 +33166,16 @@ _sk_bicubic_n1y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,82,18,0,0 // addps 0x1252(%rip),%xmm1 # 5da0 <_sk_callback_sse2+0x1189> - .byte 68,15,40,13,90,18,0,0 // movaps 0x125a(%rip),%xmm9 # 5db0 <_sk_callback_sse2+0x1199> + .byte 15,88,13,141,18,0,0 // addps 0x128d(%rip),%xmm1 # 5eb0 <_sk_callback_sse2+0x11c4> + .byte 68,15,40,13,149,18,0,0 // movaps 0x1295(%rip),%xmm9 # 5ec0 <_sk_callback_sse2+0x11d4> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,94,18,0,0 // movaps 0x125e(%rip),%xmm8 # 5dc0 <_sk_callback_sse2+0x11a9> + .byte 68,15,40,5,153,18,0,0 // movaps 0x1299(%rip),%xmm8 # 5ed0 <_sk_callback_sse2+0x11e4> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,98,18,0,0 // addps 0x1262(%rip),%xmm8 # 5dd0 <_sk_callback_sse2+0x11b9> + .byte 68,15,88,5,157,18,0,0 // addps 0x129d(%rip),%xmm8 # 5ee0 <_sk_callback_sse2+0x11f4> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,102,18,0,0 // addps 0x1266(%rip),%xmm8 # 5de0 <_sk_callback_sse2+0x11c9> + .byte 68,15,88,5,161,18,0,0 // addps 0x12a1(%rip),%xmm8 # 5ef0 <_sk_callback_sse2+0x1204> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,106,18,0,0 // addps 0x126a(%rip),%xmm8 # 5df0 <_sk_callback_sse2+0x11d9> + .byte 68,15,88,5,165,18,0,0 // addps 0x12a5(%rip),%xmm8 # 5f00 <_sk_callback_sse2+0x1214> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -32645,17 +33185,17 @@ HIDDEN _sk_bicubic_p1y_sse2 FUNCTION(_sk_bicubic_p1y_sse2) _sk_bicubic_p1y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,100,18,0,0 // movaps 0x1264(%rip),%xmm8 # 5e00 <_sk_callback_sse2+0x11e9> + .byte 68,15,40,5,159,18,0,0 // movaps 0x129f(%rip),%xmm8 # 5f10 <_sk_callback_sse2+0x1224> .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9 .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 68,15,40,21,95,18,0,0 // movaps 0x125f(%rip),%xmm10 # 5e10 <_sk_callback_sse2+0x11f9> + .byte 68,15,40,21,154,18,0,0 // movaps 0x129a(%rip),%xmm10 # 5f20 <_sk_callback_sse2+0x1234> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,99,18,0,0 // addps 0x1263(%rip),%xmm10 # 5e20 <_sk_callback_sse2+0x1209> + .byte 68,15,88,21,158,18,0,0 // addps 0x129e(%rip),%xmm10 # 5f30 <_sk_callback_sse2+0x1244> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,95,18,0,0 // addps 0x125f(%rip),%xmm10 # 5e30 <_sk_callback_sse2+0x1219> + .byte 68,15,88,21,154,18,0,0 // addps 0x129a(%rip),%xmm10 # 5f40 <_sk_callback_sse2+0x1254> .byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -32667,11 +33207,11 @@ _sk_bicubic_p3y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,81,18,0,0 // addps 0x1251(%rip),%xmm1 # 5e40 <_sk_callback_sse2+0x1229> + .byte 15,88,13,140,18,0,0 // addps 0x128c(%rip),%xmm1 # 5f50 <_sk_callback_sse2+0x1264> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,81,18,0,0 // mulps 0x1251(%rip),%xmm8 # 5e50 <_sk_callback_sse2+0x1239> - .byte 68,15,88,5,89,18,0,0 // addps 0x1259(%rip),%xmm8 # 5e60 <_sk_callback_sse2+0x1249> + .byte 68,15,89,5,140,18,0,0 // mulps 0x128c(%rip),%xmm8 # 5f60 <_sk_callback_sse2+0x1274> + .byte 68,15,88,5,148,18,0,0 // addps 0x1294(%rip),%xmm8 # 5f70 <_sk_callback_sse2+0x1284> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -32890,11 +33430,11 @@ BALIGN16 .byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%rdi) .byte 0,224 // add %ah,%al .byte 64,0,0 // add %al,(%rax) - .byte 224,64 // loopne 4ec8 <.literal16+0x1d8> + .byte 224,64 // loopne 4fa8 <.literal16+0x1d8> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 4ecc <.literal16+0x1dc> + .byte 224,64 // loopne 4fac <.literal16+0x1dc> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 4ed0 <.literal16+0x1e0> + .byte 224,64 // loopne 4fb0 <.literal16+0x1e0> .byte 154 // (bad) .byte 153 // cltd .byte 153 // cltd @@ -32914,13 +33454,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4ef1 <.literal16+0x201> + .byte 71,225,61 // rex.RXB loope 4fd1 <.literal16+0x201> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4ef5 <.literal16+0x205> + .byte 71,225,61 // rex.RXB loope 4fd5 <.literal16+0x205> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4ef9 <.literal16+0x209> + .byte 71,225,61 // rex.RXB loope 4fd9 <.literal16+0x209> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4efd <.literal16+0x20d> + .byte 71,225,61 // rex.RXB loope 4fdd <.literal16+0x20d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -32945,13 +33485,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4f31 <.literal16+0x241> + .byte 71,225,61 // rex.RXB loope 5011 <.literal16+0x241> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4f35 <.literal16+0x245> + .byte 71,225,61 // rex.RXB loope 5015 <.literal16+0x245> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4f39 <.literal16+0x249> + .byte 71,225,61 // rex.RXB loope 5019 <.literal16+0x249> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4f3d <.literal16+0x24d> + .byte 71,225,61 // rex.RXB loope 501d <.literal16+0x24d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -32976,13 +33516,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4f71 <.literal16+0x281> + .byte 71,225,61 // rex.RXB loope 5051 <.literal16+0x281> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4f75 <.literal16+0x285> + .byte 71,225,61 // rex.RXB loope 5055 <.literal16+0x285> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4f79 <.literal16+0x289> + .byte 71,225,61 // rex.RXB loope 5059 <.literal16+0x289> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4f7d <.literal16+0x28d> + .byte 71,225,61 // rex.RXB loope 505d <.literal16+0x28d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -33007,23 +33547,40 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4fb1 <.literal16+0x2c1> + .byte 71,225,61 // rex.RXB loope 5091 <.literal16+0x2c1> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4fb5 <.literal16+0x2c5> + .byte 71,225,61 // rex.RXB loope 5095 <.literal16+0x2c5> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4fb9 <.literal16+0x2c9> + .byte 71,225,61 // rex.RXB loope 5099 <.literal16+0x2c9> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4fbd <.literal16+0x2cd> + .byte 71,225,61 // rex.RXB loope 509d <.literal16+0x2cd> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) .byte 63 // (bad) .byte 0,0 // add %al,(%rax) - .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 128,63,255 // cmpb $0xff,(%rdi) + .byte 0,0 // add %al,(%rax) + .byte 0,255 // add %bh,%bh + .byte 0,0 // add %al,(%rax) + .byte 0,255 // add %bh,%bh + .byte 0,0 // add %al,(%rax) + .byte 0,255 // add %bh,%bh + .byte 0,0 // add %al,(%rax) + .byte 0,0 // add %al,(%rax) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) .byte 63 // (bad) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax) + .byte 67,0,0 // rex.XB add %al,(%r8) + .byte 127,67 // jg 50db <.literal16+0x30b> + .byte 0,0 // add %al,(%rax) + .byte 127,67 // jg 50df <.literal16+0x30f> + .byte 0,0 // add %al,(%rax) + .byte 127,67 // jg 50e3 <.literal16+0x313> + .byte 0,0 // add %al,(%rax) + .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) .byte 63 // (bad) .byte 0,0 // add %al,(%rax) @@ -33035,7 +33592,10 @@ BALIGN16 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) .byte 63 // (bad) .byte 0,0 // add %al,(%rax) - .byte 128,63,145 // cmpb $0x91,(%rdi) + .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) + .byte 63 // (bad) + .byte 145 // xchg %eax,%ecx .byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%rsi) .byte 145 // xchg %eax,%ecx .byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%rsi) @@ -33245,13 +33805,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 5199 <.literal16+0x4a9> + .byte 224,7 // loopne 52a9 <.literal16+0x4d9> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 519d <.literal16+0x4ad> + .byte 224,7 // loopne 52ad <.literal16+0x4dd> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 51a1 <.literal16+0x4b1> + .byte 224,7 // loopne 52b1 <.literal16+0x4e1> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 51a5 <.literal16+0x4b5> + .byte 224,7 // loopne 52b5 <.literal16+0x4e5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -33316,11 +33876,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 527b <.literal16+0x58b> + .byte 127,67 // jg 538b <.literal16+0x5bb> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 527f <.literal16+0x58f> + .byte 127,67 // jg 538f <.literal16+0x5bf> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5283 <.literal16+0x593> + .byte 127,67 // jg 5393 <.literal16+0x5c3> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax) @@ -33335,16 +33895,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5274 <.literal16+0x584> + .byte 127,0 // jg 5384 <.literal16+0x5b4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5278 <.literal16+0x588> + .byte 127,0 // jg 5388 <.literal16+0x5b8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 527c <.literal16+0x58c> + .byte 127,0 // jg 538c <.literal16+0x5bc> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5280 <.literal16+0x590> + .byte 127,0 // jg 5390 <.literal16+0x5c0> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -33353,7 +33913,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5305 <.literal16+0x615> + .byte 119,115 // ja 5415 <.literal16+0x645> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -33364,7 +33924,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 5269 <.literal16+0x579> + .byte 117,191 // jne 5379 <.literal16+0x5a9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -33376,7 +33936,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a392aa <_sk_callback_sse2+0xffffffffe9a34693> + .byte 233,220,63,163,233 // jmpq ffffffffe9a393ba <_sk_callback_sse2+0xffffffffe9a346ce> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -33430,16 +33990,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5344 <.literal16+0x654> + .byte 127,0 // jg 5454 <.literal16+0x684> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5348 <.literal16+0x658> + .byte 127,0 // jg 5458 <.literal16+0x688> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 534c <.literal16+0x65c> + .byte 127,0 // jg 545c <.literal16+0x68c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5350 <.literal16+0x660> + .byte 127,0 // jg 5460 <.literal16+0x690> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -33448,7 +34008,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 53d5 <.literal16+0x6e5> + .byte 119,115 // ja 54e5 <.literal16+0x715> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -33459,7 +34019,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 5339 <.literal16+0x649> + .byte 117,191 // jne 5449 <.literal16+0x679> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -33471,7 +34031,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3937a <_sk_callback_sse2+0xffffffffe9a34763> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3948a <_sk_callback_sse2+0xffffffffe9a3479e> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -33525,16 +34085,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5414 <.literal16+0x724> + .byte 127,0 // jg 5524 <.literal16+0x754> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5418 <.literal16+0x728> + .byte 127,0 // jg 5528 <.literal16+0x758> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 541c <.literal16+0x72c> + .byte 127,0 // jg 552c <.literal16+0x75c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5420 <.literal16+0x730> + .byte 127,0 // jg 5530 <.literal16+0x760> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -33543,7 +34103,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 54a5 <.literal16+0x7b5> + .byte 119,115 // ja 55b5 <.literal16+0x7e5> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -33554,7 +34114,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 5409 <.literal16+0x719> + .byte 117,191 // jne 5519 <.literal16+0x749> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -33566,7 +34126,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3944a <_sk_callback_sse2+0xffffffffe9a34833> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3955a <_sk_callback_sse2+0xffffffffe9a3486e> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -33620,16 +34180,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 54e4 <.literal16+0x7f4> + .byte 127,0 // jg 55f4 <.literal16+0x824> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 54e8 <.literal16+0x7f8> + .byte 127,0 // jg 55f8 <.literal16+0x828> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 54ec <.literal16+0x7fc> + .byte 127,0 // jg 55fc <.literal16+0x82c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 54f0 <.literal16+0x800> + .byte 127,0 // jg 5600 <.literal16+0x830> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -33638,7 +34198,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5575 <.literal16+0x885> + .byte 119,115 // ja 5685 <.literal16+0x8b5> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -33649,7 +34209,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 54d9 <.literal16+0x7e9> + .byte 117,191 // jne 55e9 <.literal16+0x819> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -33661,7 +34221,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3951a <_sk_callback_sse2+0xffffffffe9a34903> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3962a <_sk_callback_sse2+0xffffffffe9a3493e> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -33711,13 +34271,13 @@ BALIGN16 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 - .byte 127,67 // jg 55f7 <.literal16+0x907> + .byte 127,67 // jg 5707 <.literal16+0x937> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 55fb <.literal16+0x90b> + .byte 127,67 // jg 570b <.literal16+0x93b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 55ff <.literal16+0x90f> + .byte 127,67 // jg 570f <.literal16+0x93f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5603 <.literal16+0x913> + .byte 127,67 // jg 5713 <.literal16+0x943> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -33764,16 +34324,16 @@ BALIGN16 .byte 128,3,62 // addb $0x3e,(%rbx) .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 5683 <.literal16+0x993> + .byte 118,63 // jbe 5793 <.literal16+0x9c3> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 5687 <.literal16+0x997> + .byte 118,63 // jbe 5797 <.literal16+0x9c7> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 568b <.literal16+0x99b> + .byte 118,63 // jbe 579b <.literal16+0x9cb> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 568f <.literal16+0x99f> + .byte 118,63 // jbe 579f <.literal16+0x9cf> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) @@ -33785,11 +34345,11 @@ BALIGN16 .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 56cb <.literal16+0x9db> + .byte 127,67 // jg 57db <.literal16+0xa0b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 56cf <.literal16+0x9df> + .byte 127,67 // jg 57df <.literal16+0xa0f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 56d3 <.literal16+0x9e3> + .byte 127,67 // jg 57e3 <.literal16+0xa13> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,0,0,128,63 // addb $0x3f,-0x7fffffc5(%rax) @@ -33829,13 +34389,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 5719 <.literal16+0xa29> + .byte 224,7 // loopne 5829 <.literal16+0xa59> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 571d <.literal16+0xa2d> + .byte 224,7 // loopne 582d <.literal16+0xa5d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5721 <.literal16+0xa31> + .byte 224,7 // loopne 5831 <.literal16+0xa61> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5725 <.literal16+0xa35> + .byte 224,7 // loopne 5835 <.literal16+0xa65> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -33881,13 +34441,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 5789 <.literal16+0xa99> + .byte 224,7 // loopne 5899 <.literal16+0xac9> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 578d <.literal16+0xa9d> + .byte 224,7 // loopne 589d <.literal16+0xacd> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5791 <.literal16+0xaa1> + .byte 224,7 // loopne 58a1 <.literal16+0xad1> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5795 <.literal16+0xaa5> + .byte 224,7 // loopne 58a5 <.literal16+0xad5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -33925,13 +34485,13 @@ BALIGN16 .byte 65,0,0 // add %al,(%r8) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 5826 <.literal16+0xb36> + .byte 124,66 // jl 5936 <.literal16+0xb66> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 582a <.literal16+0xb3a> + .byte 124,66 // jl 593a <.literal16+0xb6a> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 582e <.literal16+0xb3e> + .byte 124,66 // jl 593e <.literal16+0xb6e> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 5832 <.literal16+0xb42> + .byte 124,66 // jl 5942 <.literal16+0xb72> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 0,240 // add %dh,%al @@ -34021,13 +34581,13 @@ BALIGN16 .byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax) .byte 61,137,136,136,61 // cmp $0x3d888889,%eax .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 5935 <.literal16+0xc45> + .byte 112,65 // jo 5a45 <.literal16+0xc75> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 5939 <.literal16+0xc49> + .byte 112,65 // jo 5a49 <.literal16+0xc79> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 593d <.literal16+0xc4d> + .byte 112,65 // jo 5a4d <.literal16+0xc7d> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 5941 <.literal16+0xc51> + .byte 112,65 // jo 5a51 <.literal16+0xc81> .byte 255,0 // incl (%rax) .byte 0,0 // add %al,(%rax) .byte 255,0 // incl (%rax) @@ -34049,11 +34609,11 @@ BALIGN16 .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%rax) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 598b <.literal16+0xc9b> + .byte 127,67 // jg 5a9b <.literal16+0xccb> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 598f <.literal16+0xc9f> + .byte 127,67 // jg 5a9f <.literal16+0xccf> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5993 <.literal16+0xca3> + .byte 127,67 // jg 5aa3 <.literal16+0xcd3> .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) .byte 0,0 // add %al,(%rax) .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) @@ -34129,13 +34689,13 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 255 // (bad) - .byte 127,71 // jg 5a7b <.literal16+0xd8b> + .byte 127,71 // jg 5b8b <.literal16+0xdbb> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 5a7f <.literal16+0xd8f> + .byte 127,71 // jg 5b8f <.literal16+0xdbf> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 5a83 <.literal16+0xd93> + .byte 127,71 // jg 5b93 <.literal16+0xdc3> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 5a87 <.literal16+0xd97> + .byte 127,71 // jg 5b97 <.literal16+0xdc7> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -34212,10 +34772,10 @@ BALIGN16 .byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax .byte 152 // cwtl .byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx) - .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc06c1a <_sk_callback_sse2+0x2dc02003> + .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc06d2a <_sk_callback_sse2+0x2dc0203e> .byte 17,192 // adc %eax,%eax .byte 45,16,17,192,18 // sub $0x12c01110,%eax - .byte 120,57 // js 5b4c <.literal16+0xe5c> + .byte 120,57 // js 5c5c <.literal16+0xe8c> .byte 64,18,120,57 // adc 0x39(%rax),%dil .byte 64,18,120,57 // adc 0x39(%rax),%dil .byte 64,18,120,57 // adc 0x39(%rax),%dil @@ -34343,11 +34903,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 5c92 <.literal16+0xfa2> + .byte 62,114,28 // jb,pt 5da2 <.literal16+0xfd2> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5c96 <.literal16+0xfa6> + .byte 62,114,28 // jb,pt 5da6 <.literal16+0xfd6> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5c9a <.literal16+0xfaa> + .byte 62,114,28 // jb,pt 5daa <.literal16+0xfda> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -34391,7 +34951,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63eb25 <_sk_callback_sse2+0x3d639f0e> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63ec35 <_sk_callback_sse2+0x3d639f49> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -34417,7 +34977,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63eb65 <_sk_callback_sse2+0x3d639f4e> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63ec75 <_sk_callback_sse2+0x3d639f89> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -34426,13 +34986,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 5d5e <.literal16+0x106e> + .byte 114,28 // jb 5e6e <.literal16+0x109e> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5d62 <.literal16+0x1072> + .byte 62,114,28 // jb,pt 5e72 <.literal16+0x10a2> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5d66 <.literal16+0x1076> + .byte 62,114,28 // jb,pt 5e76 <.literal16+0x10a6> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5d6a <.literal16+0x107a> + .byte 62,114,28 // jb,pt 5e7a <.literal16+0x10aa> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -34453,11 +35013,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 5da2 <.literal16+0x10b2> + .byte 62,114,28 // jb,pt 5eb2 <.literal16+0x10e2> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5da6 <.literal16+0x10b6> + .byte 62,114,28 // jb,pt 5eb6 <.literal16+0x10e6> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5daa <.literal16+0x10ba> + .byte 62,114,28 // jb,pt 5eba <.literal16+0x10ea> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -34501,7 +35061,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63ec35 <_sk_callback_sse2+0x3d63a01e> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63ed45 <_sk_callback_sse2+0x3d63a059> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -34527,7 +35087,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63ec75 <_sk_callback_sse2+0x3d63a05e> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63ed85 <_sk_callback_sse2+0x3d63a099> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -34536,13 +35096,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 5e6e <.literal16+0x117e> + .byte 114,28 // jb 5f7e <.literal16+0x11ae> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5e72 <_sk_callback_sse2+0x125b> + .byte 62,114,28 // jb,pt 5f82 <_sk_callback_sse2+0x1296> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5e76 <_sk_callback_sse2+0x125f> + .byte 62,114,28 // jb,pt 5f86 <_sk_callback_sse2+0x129a> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5e7a <_sk_callback_sse2+0x1263> + .byte 62,114,28 // jb,pt 5f8a <_sk_callback_sse2+0x129e> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) |