diff options
Diffstat (limited to 'src/jumper/SkJumper_generated.S')
-rw-r--r-- | src/jumper/SkJumper_generated.S | 3056 |
1 files changed, 1678 insertions, 1378 deletions
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S index 37d3fd2fa4..f7c5c6d7aa 100644 --- a/src/jumper/SkJumper_generated.S +++ b/src/jumper/SkJumper_generated.S @@ -3379,6 +3379,42 @@ _sk_mirror_y_aarch64: .long 0x4eb1f421 // fmin v1.4s, v1.4s, v17.4s .long 0xd61f0060 // br x3 +HIDDEN _sk_clamp_x_1_aarch64 +.globl _sk_clamp_x_1_aarch64 +FUNCTION(_sk_clamp_x_1_aarch64) +_sk_clamp_x_1_aarch64: + .long 0xf8408423 // ldr x3, [x1], #8 + .long 0x6f00e410 // movi v16.2d, #0x0 + .long 0x4e20f600 // fmax v0.4s, v16.4s, v0.4s + .long 0x4f03f610 // fmov v16.4s, #1.000000000000000000e+00 + .long 0x4eb0f400 // fmin v0.4s, v0.4s, v16.4s + .long 0xd61f0060 // br x3 + +HIDDEN _sk_repeat_x_1_aarch64 +.globl _sk_repeat_x_1_aarch64 +FUNCTION(_sk_repeat_x_1_aarch64) +_sk_repeat_x_1_aarch64: + .long 0xf8408423 // ldr x3, [x1], #8 + .long 0x4e219810 // frintm v16.4s, v0.4s + .long 0x4eb0d400 // fsub v0.4s, v0.4s, v16.4s + .long 0xd61f0060 // br x3 + +HIDDEN _sk_mirror_x_1_aarch64 +.globl _sk_mirror_x_1_aarch64 +FUNCTION(_sk_mirror_x_1_aarch64) +_sk_mirror_x_1_aarch64: + .long 0x4f07f610 // fmov v16.4s, #-1.000000000000000000e+00 + .long 0x4f0167f1 // movi v17.4s, #0x3f, lsl #24 + .long 0x4e30d400 // fadd v0.4s, v0.4s, v16.4s + .long 0x6e31dc11 // fmul v17.4s, v0.4s, v17.4s + .long 0x4e219a31 // frintm v17.4s, v17.4s + .long 0x4e31d631 // fadd v17.4s, v17.4s, v17.4s + .long 0xf8408423 // ldr x3, [x1], #8 + .long 0x4eb1d400 // fsub v0.4s, v0.4s, v17.4s + .long 0x4e30d400 // fadd v0.4s, v0.4s, v16.4s + .long 0x4ea0f800 // fabs v0.4s, v0.4s + .long 0xd61f0060 // br x3 + HIDDEN _sk_luminance_to_alpha_aarch64 .globl _sk_luminance_to_alpha_aarch64 FUNCTION(_sk_luminance_to_alpha_aarch64) @@ -3673,7 +3709,7 @@ _sk_gradient_aarch64: .long 0x6f00e411 // movi v17.2d, #0x0 .long 0xf9400109 // ldr x9, [x8] .long 0xf100093f // cmp x9, #0x2 - .long 0x540001c3 // b.cc 3120 <sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last + .long 0x540001c3 // b.cc 3174 <sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last .long 0xf940250a // ldr x10, [x8, #72] .long 0xd1000529 // sub x9, x9, #0x1 .long 0x6f00e401 // movi v1.2d, #0x0 @@ -3684,7 +3720,7 @@ _sk_gradient_aarch64: .long 0x6e23e403 // fcmge v3.4s, v0.4s, v3.4s .long 0x4e221c63 // and v3.16b, v3.16b, v2.16b .long 0x4ea18461 // add v1.4s, v3.4s, v1.4s - .long 0xb5ffff69 // cbnz x9, 3100 <sk_gradient_aarch64+0x38> + .long 0xb5ffff69 // cbnz x9, 3154 <sk_gradient_aarch64+0x38> .long 0x6f20a431 // uxtl2 v17.2d, v1.4s .long 0x2f20a421 // uxtl v1.2d, v1.2s .long 0xa940b10a // ldp x10, x12, [x8, #8] @@ -7874,6 +7910,59 @@ _sk_mirror_y_vfp4: .long 0x3f800000 // .word 0x3f800000 .long 0x3f800000 // .word 0x3f800000 +HIDDEN _sk_clamp_x_1_vfp4 +.globl _sk_clamp_x_1_vfp4 +FUNCTION(_sk_clamp_x_1_vfp4) +_sk_clamp_x_1_vfp4: + .long 0xf2c00010 // vmov.i32 d16, #0 + .long 0xe4913004 // ldr r3, [r1], #4 + .long 0xf2c71f10 // vmov.f32 d17, #1 + .long 0xf2400f80 // vmax.f32 d16, d16, d0 + .long 0xf2200fa1 // vmin.f32 d0, d16, d17 + .long 0xe12fff13 // bx r3 + +HIDDEN _sk_repeat_x_1_vfp4 +.globl _sk_repeat_x_1_vfp4 +FUNCTION(_sk_repeat_x_1_vfp4) +_sk_repeat_x_1_vfp4: + .long 0xf3fb0700 // vcvt.s32.f32 d16, d0 + .long 0xeddf3b07 // vldr d19, [pc, #28] + .long 0xf2c02010 // vmov.i32 d18, #0 + .long 0xe4913004 // ldr r3, [r1], #4 + .long 0xf3fb0620 // vcvt.f32.s32 d16, d16 + .long 0xf3601e80 // vcgt.f32 d17, d16, d0 + .long 0xf35311b2 // vbsl d17, d19, d18 + .long 0xf2600da1 // vsub.f32 d16, d16, d17 + .long 0xf2200d20 // vsub.f32 d0, d0, d16 + .long 0xe12fff13 // bx r3 + .long 0x3f800000 // .word 0x3f800000 + .long 0x3f800000 // .word 0x3f800000 + +HIDDEN _sk_mirror_x_1_vfp4 +.globl _sk_mirror_x_1_vfp4 +FUNCTION(_sk_mirror_x_1_vfp4) +_sk_mirror_x_1_vfp4: + .long 0xf3c70f10 // vmov.f32 d16, #-1 + .long 0xeddf5b0f // vldr d21, [pc, #60] + .long 0xf2c3261f // vmov.i32 d18, #1056964608 + .long 0xe4913004 // ldr r3, [r1], #4 + .long 0xf2401d20 // vadd.f32 d17, d0, d16 + .long 0xf2c04010 // vmov.i32 d20, #0 + .long 0xf3412db2 // vmul.f32 d18, d17, d18 + .long 0xf3fb3722 // vcvt.s32.f32 d19, d18 + .long 0xf3fb3623 // vcvt.f32.s32 d19, d19 + .long 0xf3632ea2 // vcgt.f32 d18, d19, d18 + .long 0xf35521b4 // vbsl d18, d21, d20 + .long 0xf2632da2 // vsub.f32 d18, d19, d18 + .long 0xf2422da2 // vadd.f32 d18, d18, d18 + .long 0xf2611da2 // vsub.f32 d17, d17, d18 + .long 0xf2410da0 // vadd.f32 d16, d17, d16 + .long 0xf3b90720 // vabs.f32 d0, d16 + .long 0xe12fff13 // bx r3 + .long 0xe320f000 // nop {0} + .long 0x3f800000 // .word 0x3f800000 + .long 0x3f800000 // .word 0x3f800000 + HIDDEN _sk_luminance_to_alpha_vfp4 .globl _sk_luminance_to_alpha_vfp4 FUNCTION(_sk_luminance_to_alpha_vfp4) @@ -8195,7 +8284,7 @@ _sk_gradient_vfp4: .long 0xf2c00010 // vmov.i32 d16, #0 .long 0xe59c3000 // ldr r3, [ip] .long 0xe3530002 // cmp r3, #2 - .long 0x3a00000b // bcc 36e4 <sk_gradient_vfp4+0x50> + .long 0x3a00000b // bcc 377c <sk_gradient_vfp4+0x50> .long 0xe59c4024 // ldr r4, [ip, #36] .long 0xf2c01010 // vmov.i32 d17, #0 .long 0xf2c02011 // vmov.i32 d18, #1 @@ -8207,7 +8296,7 @@ _sk_gradient_vfp4: .long 0xf3403e23 // vcge.f32 d19, d0, d19 .long 0xf35231b1 // vbsl d19, d18, d17 .long 0xf26308a0 // vadd.i32 d16, d19, d16 - .long 0x1afffff9 // bne 36cc <sk_gradient_vfp4+0x38> + .long 0x1afffff9 // bne 3764 <sk_gradient_vfp4+0x38> .long 0xee303b90 // vmov.32 r3, d16[1] .long 0xe59c7010 // ldr r7, [ip, #16] .long 0xee10eb90 // vmov.32 lr, d16[0] @@ -8800,14 +8889,14 @@ _sk_seed_shader_hsw: .byte 197,249,110,199 // vmovd %edi,%xmm0 .byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,81,71,0,0 // vbroadcastss 0x4751(%rip),%ymm1 # 4814 <_sk_callback_hsw+0x127> + .byte 196,226,125,24,13,189,71,0,0 // vbroadcastss 0x47bd(%rip),%ymm1 # 4880 <_sk_callback_hsw+0x127> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,88,2 // vaddps (%rdx),%ymm0,%ymm0 .byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,21,53,71,0,0 // vbroadcastss 0x4735(%rip),%ymm2 # 4818 <_sk_callback_hsw+0x12b> + .byte 196,226,125,24,21,161,71,0,0 // vbroadcastss 0x47a1(%rip),%ymm2 # 4884 <_sk_callback_hsw+0x12b> .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 @@ -8826,13 +8915,13 @@ _sk_dither_hsw: .byte 76,139,0 // mov (%rax),%r8 .byte 196,66,125,88,8 // vpbroadcastd (%r8),%ymm9 .byte 196,65,61,239,201 // vpxor %ymm9,%ymm8,%ymm9 - .byte 196,98,125,88,21,253,70,0,0 // vpbroadcastd 0x46fd(%rip),%ymm10 # 481c <_sk_callback_hsw+0x12f> + .byte 196,98,125,88,21,105,71,0,0 // vpbroadcastd 0x4769(%rip),%ymm10 # 4888 <_sk_callback_hsw+0x12f> .byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11 .byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11 .byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10 .byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10 - .byte 196,98,125,88,37,226,70,0,0 // vpbroadcastd 0x46e2(%rip),%ymm12 # 4820 <_sk_callback_hsw+0x133> - .byte 196,98,125,88,45,221,70,0,0 // vpbroadcastd 0x46dd(%rip),%ymm13 # 4824 <_sk_callback_hsw+0x137> + .byte 196,98,125,88,37,78,71,0,0 // vpbroadcastd 0x474e(%rip),%ymm12 # 488c <_sk_callback_hsw+0x133> + .byte 196,98,125,88,45,73,71,0,0 // vpbroadcastd 0x4749(%rip),%ymm13 # 4890 <_sk_callback_hsw+0x137> .byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14 .byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14 .byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13 @@ -8847,8 +8936,8 @@ _sk_dither_hsw: .byte 196,65,13,235,201 // vpor %ymm9,%ymm14,%ymm9 .byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,143,70,0,0 // vbroadcastss 0x468f(%rip),%ymm9 # 4828 <_sk_callback_hsw+0x13b> - .byte 196,98,125,24,21,138,70,0,0 // vbroadcastss 0x468a(%rip),%ymm10 # 482c <_sk_callback_hsw+0x13f> + .byte 196,98,125,24,13,251,70,0,0 // vbroadcastss 0x46fb(%rip),%ymm9 # 4894 <_sk_callback_hsw+0x13b> + .byte 196,98,125,24,21,246,70,0,0 // vbroadcastss 0x46f6(%rip),%ymm10 # 4898 <_sk_callback_hsw+0x13f> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 196,98,125,24,64,8 // vbroadcastss 0x8(%rax),%ymm8 .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 @@ -8917,7 +9006,7 @@ HIDDEN _sk_srcatop_hsw FUNCTION(_sk_srcatop_hsw) _sk_srcatop_hsw: .byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0 - .byte 196,98,125,24,5,225,69,0,0 // vbroadcastss 0x45e1(%rip),%ymm8 # 4830 <_sk_callback_hsw+0x143> + .byte 196,98,125,24,5,77,70,0,0 // vbroadcastss 0x464d(%rip),%ymm8 # 489c <_sk_callback_hsw+0x143> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0 .byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1 @@ -8933,7 +9022,7 @@ HIDDEN _sk_dstatop_hsw .globl _sk_dstatop_hsw FUNCTION(_sk_dstatop_hsw) _sk_dstatop_hsw: - .byte 196,98,125,24,5,180,69,0,0 // vbroadcastss 0x45b4(%rip),%ymm8 # 4834 <_sk_callback_hsw+0x147> + .byte 196,98,125,24,5,32,70,0,0 // vbroadcastss 0x4620(%rip),%ymm8 # 48a0 <_sk_callback_hsw+0x147> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0 @@ -8972,7 +9061,7 @@ HIDDEN _sk_srcout_hsw .globl _sk_srcout_hsw FUNCTION(_sk_srcout_hsw) _sk_srcout_hsw: - .byte 196,98,125,24,5,91,69,0,0 // vbroadcastss 0x455b(%rip),%ymm8 # 4838 <_sk_callback_hsw+0x14b> + .byte 196,98,125,24,5,199,69,0,0 // vbroadcastss 0x45c7(%rip),%ymm8 # 48a4 <_sk_callback_hsw+0x14b> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -8985,7 +9074,7 @@ HIDDEN _sk_dstout_hsw .globl _sk_dstout_hsw FUNCTION(_sk_dstout_hsw) _sk_dstout_hsw: - .byte 196,226,125,24,5,62,69,0,0 // vbroadcastss 0x453e(%rip),%ymm0 # 483c <_sk_callback_hsw+0x14f> + .byte 196,226,125,24,5,170,69,0,0 // vbroadcastss 0x45aa(%rip),%ymm0 # 48a8 <_sk_callback_hsw+0x14f> .byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3 .byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0 .byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1 @@ -8998,7 +9087,7 @@ HIDDEN _sk_srcover_hsw .globl _sk_srcover_hsw FUNCTION(_sk_srcover_hsw) _sk_srcover_hsw: - .byte 196,98,125,24,5,33,69,0,0 // vbroadcastss 0x4521(%rip),%ymm8 # 4840 <_sk_callback_hsw+0x153> + .byte 196,98,125,24,5,141,69,0,0 // vbroadcastss 0x458d(%rip),%ymm8 # 48ac <_sk_callback_hsw+0x153> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0 .byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1 @@ -9011,7 +9100,7 @@ HIDDEN _sk_dstover_hsw .globl _sk_dstover_hsw FUNCTION(_sk_dstover_hsw) _sk_dstover_hsw: - .byte 196,98,125,24,5,0,69,0,0 // vbroadcastss 0x4500(%rip),%ymm8 # 4844 <_sk_callback_hsw+0x157> + .byte 196,98,125,24,5,108,69,0,0 // vbroadcastss 0x456c(%rip),%ymm8 # 48b0 <_sk_callback_hsw+0x157> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0 .byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1 @@ -9035,7 +9124,7 @@ HIDDEN _sk_multiply_hsw .globl _sk_multiply_hsw FUNCTION(_sk_multiply_hsw) _sk_multiply_hsw: - .byte 196,98,125,24,5,203,68,0,0 // vbroadcastss 0x44cb(%rip),%ymm8 # 4848 <_sk_callback_hsw+0x15b> + .byte 196,98,125,24,5,55,69,0,0 // vbroadcastss 0x4537(%rip),%ymm8 # 48b4 <_sk_callback_hsw+0x15b> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -9083,7 +9172,7 @@ HIDDEN _sk_xor__hsw .globl _sk_xor__hsw FUNCTION(_sk_xor__hsw) _sk_xor__hsw: - .byte 196,98,125,24,5,70,68,0,0 // vbroadcastss 0x4446(%rip),%ymm8 # 484c <_sk_callback_hsw+0x15f> + .byte 196,98,125,24,5,178,68,0,0 // vbroadcastss 0x44b2(%rip),%ymm8 # 48b8 <_sk_callback_hsw+0x15f> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -9117,7 +9206,7 @@ _sk_darken_hsw: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,206,67,0,0 // vbroadcastss 0x43ce(%rip),%ymm8 # 4850 <_sk_callback_hsw+0x163> + .byte 196,98,125,24,5,58,68,0,0 // vbroadcastss 0x443a(%rip),%ymm8 # 48bc <_sk_callback_hsw+0x163> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -9142,7 +9231,7 @@ _sk_lighten_hsw: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,125,67,0,0 // vbroadcastss 0x437d(%rip),%ymm8 # 4854 <_sk_callback_hsw+0x167> + .byte 196,98,125,24,5,233,67,0,0 // vbroadcastss 0x43e9(%rip),%ymm8 # 48c0 <_sk_callback_hsw+0x167> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -9170,7 +9259,7 @@ _sk_difference_hsw: .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,32,67,0,0 // vbroadcastss 0x4320(%rip),%ymm8 # 4858 <_sk_callback_hsw+0x16b> + .byte 196,98,125,24,5,140,67,0,0 // vbroadcastss 0x438c(%rip),%ymm8 # 48c4 <_sk_callback_hsw+0x16b> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -9192,7 +9281,7 @@ _sk_exclusion_hsw: .byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,222,66,0,0 // vbroadcastss 0x42de(%rip),%ymm8 # 485c <_sk_callback_hsw+0x16f> + .byte 196,98,125,24,5,74,67,0,0 // vbroadcastss 0x434a(%rip),%ymm8 # 48c8 <_sk_callback_hsw+0x16f> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -9202,7 +9291,7 @@ HIDDEN _sk_colorburn_hsw .globl _sk_colorburn_hsw FUNCTION(_sk_colorburn_hsw) _sk_colorburn_hsw: - .byte 196,98,125,24,5,204,66,0,0 // vbroadcastss 0x42cc(%rip),%ymm8 # 4860 <_sk_callback_hsw+0x173> + .byte 196,98,125,24,5,56,67,0,0 // vbroadcastss 0x4338(%rip),%ymm8 # 48cc <_sk_callback_hsw+0x173> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11 .byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10 @@ -9260,7 +9349,7 @@ HIDDEN _sk_colordodge_hsw FUNCTION(_sk_colordodge_hsw) _sk_colordodge_hsw: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,13,215,65,0,0 // vbroadcastss 0x41d7(%rip),%ymm9 # 4864 <_sk_callback_hsw+0x177> + .byte 196,98,125,24,13,67,66,0,0 // vbroadcastss 0x4243(%rip),%ymm9 # 48d0 <_sk_callback_hsw+0x177> .byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9 @@ -9313,7 +9402,7 @@ HIDDEN _sk_hardlight_hsw .globl _sk_hardlight_hsw FUNCTION(_sk_hardlight_hsw) _sk_hardlight_hsw: - .byte 196,98,125,24,5,248,64,0,0 // vbroadcastss 0x40f8(%rip),%ymm8 # 4868 <_sk_callback_hsw+0x17b> + .byte 196,98,125,24,5,100,65,0,0 // vbroadcastss 0x4164(%rip),%ymm8 # 48d4 <_sk_callback_hsw+0x17b> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -9364,7 +9453,7 @@ HIDDEN _sk_overlay_hsw .globl _sk_overlay_hsw FUNCTION(_sk_overlay_hsw) _sk_overlay_hsw: - .byte 196,98,125,24,5,48,64,0,0 // vbroadcastss 0x4030(%rip),%ymm8 # 486c <_sk_callback_hsw+0x17f> + .byte 196,98,125,24,5,156,64,0,0 // vbroadcastss 0x409c(%rip),%ymm8 # 48d8 <_sk_callback_hsw+0x17f> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -9425,10 +9514,10 @@ _sk_softlight_hsw: .byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8 .byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8 .byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,29,59,63,0,0 // vbroadcastss 0x3f3b(%rip),%ymm11 # 4874 <_sk_callback_hsw+0x187> + .byte 196,98,125,24,29,167,63,0,0 // vbroadcastss 0x3fa7(%rip),%ymm11 # 48e0 <_sk_callback_hsw+0x187> .byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12 .byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8 - .byte 196,98,125,24,37,44,63,0,0 // vbroadcastss 0x3f2c(%rip),%ymm12 # 4878 <_sk_callback_hsw+0x18b> + .byte 196,98,125,24,37,152,63,0,0 // vbroadcastss 0x3f98(%rip),%ymm12 # 48e4 <_sk_callback_hsw+0x18b> .byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8 .byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14 .byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14 @@ -9438,7 +9527,7 @@ _sk_softlight_hsw: .byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15 .byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14 .byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15 - .byte 196,98,125,24,5,239,62,0,0 // vbroadcastss 0x3eef(%rip),%ymm8 # 4870 <_sk_callback_hsw+0x183> + .byte 196,98,125,24,5,91,63,0,0 // vbroadcastss 0x3f5b(%rip),%ymm8 # 48dc <_sk_callback_hsw+0x183> .byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13 .byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0 .byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13 @@ -9551,11 +9640,11 @@ _sk_hue_hsw: .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10 .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10 .byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - .byte 196,98,125,24,53,243,60,0,0 // vbroadcastss 0x3cf3(%rip),%ymm14 # 487c <_sk_callback_hsw+0x18f> - .byte 196,98,125,24,61,238,60,0,0 // vbroadcastss 0x3cee(%rip),%ymm15 # 4880 <_sk_callback_hsw+0x193> + .byte 196,98,125,24,53,95,61,0,0 // vbroadcastss 0x3d5f(%rip),%ymm14 # 48e8 <_sk_callback_hsw+0x18f> + .byte 196,98,125,24,61,90,61,0,0 // vbroadcastss 0x3d5a(%rip),%ymm15 # 48ec <_sk_callback_hsw+0x193> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13 - .byte 196,226,125,24,5,223,60,0,0 // vbroadcastss 0x3cdf(%rip),%ymm0 # 4884 <_sk_callback_hsw+0x197> + .byte 196,226,125,24,5,75,61,0,0 // vbroadcastss 0x3d4b(%rip),%ymm0 # 48f0 <_sk_callback_hsw+0x197> .byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13 .byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10 .byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -9610,7 +9699,7 @@ _sk_hue_hsw: .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 .byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9 .byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8 - .byte 196,226,125,24,13,204,59,0,0 // vbroadcastss 0x3bcc(%rip),%ymm1 # 4888 <_sk_callback_hsw+0x19b> + .byte 196,226,125,24,13,56,60,0,0 // vbroadcastss 0x3c38(%rip),%ymm1 # 48f4 <_sk_callback_hsw+0x19b> .byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11 @@ -9664,11 +9753,11 @@ _sk_saturation_hsw: .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10 .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10 .byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - .byte 196,98,125,24,53,227,58,0,0 // vbroadcastss 0x3ae3(%rip),%ymm14 # 488c <_sk_callback_hsw+0x19f> - .byte 196,98,125,24,61,222,58,0,0 // vbroadcastss 0x3ade(%rip),%ymm15 # 4890 <_sk_callback_hsw+0x1a3> + .byte 196,98,125,24,53,79,59,0,0 // vbroadcastss 0x3b4f(%rip),%ymm14 # 48f8 <_sk_callback_hsw+0x19f> + .byte 196,98,125,24,61,74,59,0,0 // vbroadcastss 0x3b4a(%rip),%ymm15 # 48fc <_sk_callback_hsw+0x1a3> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13 - .byte 196,226,125,24,5,207,58,0,0 // vbroadcastss 0x3acf(%rip),%ymm0 # 4894 <_sk_callback_hsw+0x1a7> + .byte 196,226,125,24,5,59,59,0,0 // vbroadcastss 0x3b3b(%rip),%ymm0 # 4900 <_sk_callback_hsw+0x1a7> .byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13 .byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10 .byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -9723,7 +9812,7 @@ _sk_saturation_hsw: .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 .byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9 .byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8 - .byte 196,226,125,24,13,188,57,0,0 // vbroadcastss 0x39bc(%rip),%ymm1 # 4898 <_sk_callback_hsw+0x1ab> + .byte 196,226,125,24,13,40,58,0,0 // vbroadcastss 0x3a28(%rip),%ymm1 # 4904 <_sk_callback_hsw+0x1ab> .byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11 @@ -9751,11 +9840,11 @@ _sk_color_hsw: .byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8 .byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10 .byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11 - .byte 196,98,125,24,45,85,57,0,0 // vbroadcastss 0x3955(%rip),%ymm13 # 489c <_sk_callback_hsw+0x1af> - .byte 196,98,125,24,53,80,57,0,0 // vbroadcastss 0x3950(%rip),%ymm14 # 48a0 <_sk_callback_hsw+0x1b3> + .byte 196,98,125,24,45,193,57,0,0 // vbroadcastss 0x39c1(%rip),%ymm13 # 4908 <_sk_callback_hsw+0x1af> + .byte 196,98,125,24,53,188,57,0,0 // vbroadcastss 0x39bc(%rip),%ymm14 # 490c <_sk_callback_hsw+0x1b3> .byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12 .byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12 - .byte 196,98,125,24,61,65,57,0,0 // vbroadcastss 0x3941(%rip),%ymm15 # 48a4 <_sk_callback_hsw+0x1b7> + .byte 196,98,125,24,61,173,57,0,0 // vbroadcastss 0x39ad(%rip),%ymm15 # 4910 <_sk_callback_hsw+0x1b7> .byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12 .byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9 .byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -9811,7 +9900,7 @@ _sk_color_hsw: .byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1 .byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8 .byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9 - .byte 196,226,125,24,5,35,56,0,0 // vbroadcastss 0x3823(%rip),%ymm0 # 48a8 <_sk_callback_hsw+0x1bb> + .byte 196,226,125,24,5,143,56,0,0 // vbroadcastss 0x388f(%rip),%ymm0 # 4914 <_sk_callback_hsw+0x1bb> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -9839,11 +9928,11 @@ _sk_luminosity_hsw: .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 .byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10 .byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11 - .byte 196,98,125,24,45,188,55,0,0 // vbroadcastss 0x37bc(%rip),%ymm13 # 48ac <_sk_callback_hsw+0x1bf> - .byte 196,98,125,24,53,183,55,0,0 // vbroadcastss 0x37b7(%rip),%ymm14 # 48b0 <_sk_callback_hsw+0x1c3> + .byte 196,98,125,24,45,40,56,0,0 // vbroadcastss 0x3828(%rip),%ymm13 # 4918 <_sk_callback_hsw+0x1bf> + .byte 196,98,125,24,53,35,56,0,0 // vbroadcastss 0x3823(%rip),%ymm14 # 491c <_sk_callback_hsw+0x1c3> .byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12 .byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12 - .byte 196,98,125,24,61,168,55,0,0 // vbroadcastss 0x37a8(%rip),%ymm15 # 48b4 <_sk_callback_hsw+0x1c7> + .byte 196,98,125,24,61,20,56,0,0 // vbroadcastss 0x3814(%rip),%ymm15 # 4920 <_sk_callback_hsw+0x1c7> .byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12 .byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9 .byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -9899,7 +9988,7 @@ _sk_luminosity_hsw: .byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1 .byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8 .byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9 - .byte 196,226,125,24,5,138,54,0,0 // vbroadcastss 0x368a(%rip),%ymm0 # 48b8 <_sk_callback_hsw+0x1cb> + .byte 196,226,125,24,5,246,54,0,0 // vbroadcastss 0x36f6(%rip),%ymm0 # 4924 <_sk_callback_hsw+0x1cb> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -9932,7 +10021,7 @@ HIDDEN _sk_clamp_1_hsw .globl _sk_clamp_1_hsw FUNCTION(_sk_clamp_1_hsw) _sk_clamp_1_hsw: - .byte 196,98,125,24,5,38,54,0,0 // vbroadcastss 0x3626(%rip),%ymm8 # 48bc <_sk_callback_hsw+0x1cf> + .byte 196,98,125,24,5,146,54,0,0 // vbroadcastss 0x3692(%rip),%ymm8 # 4928 <_sk_callback_hsw+0x1cf> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 @@ -9944,7 +10033,7 @@ HIDDEN _sk_clamp_a_hsw .globl _sk_clamp_a_hsw FUNCTION(_sk_clamp_a_hsw) _sk_clamp_a_hsw: - .byte 196,98,125,24,5,9,54,0,0 // vbroadcastss 0x3609(%rip),%ymm8 # 48c0 <_sk_callback_hsw+0x1d3> + .byte 196,98,125,24,5,117,54,0,0 // vbroadcastss 0x3675(%rip),%ymm8 # 492c <_sk_callback_hsw+0x1d3> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0 .byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1 @@ -10030,7 +10119,7 @@ FUNCTION(_sk_unpremul_hsw) _sk_unpremul_hsw: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9 - .byte 196,98,125,24,21,81,53,0,0 // vbroadcastss 0x3551(%rip),%ymm10 # 48c4 <_sk_callback_hsw+0x1d7> + .byte 196,98,125,24,21,189,53,0,0 // vbroadcastss 0x35bd(%rip),%ymm10 # 4930 <_sk_callback_hsw+0x1d7> .byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10 .byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 @@ -10043,16 +10132,16 @@ HIDDEN _sk_from_srgb_hsw .globl _sk_from_srgb_hsw FUNCTION(_sk_from_srgb_hsw) _sk_from_srgb_hsw: - .byte 196,98,125,24,5,50,53,0,0 // vbroadcastss 0x3532(%rip),%ymm8 # 48c8 <_sk_callback_hsw+0x1db> + .byte 196,98,125,24,5,158,53,0,0 // vbroadcastss 0x359e(%rip),%ymm8 # 4934 <_sk_callback_hsw+0x1db> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10 - .byte 196,98,125,24,29,36,53,0,0 // vbroadcastss 0x3524(%rip),%ymm11 # 48cc <_sk_callback_hsw+0x1df> - .byte 196,98,125,24,37,31,53,0,0 // vbroadcastss 0x351f(%rip),%ymm12 # 48d0 <_sk_callback_hsw+0x1e3> + .byte 196,98,125,24,29,144,53,0,0 // vbroadcastss 0x3590(%rip),%ymm11 # 4938 <_sk_callback_hsw+0x1df> + .byte 196,98,125,24,37,139,53,0,0 // vbroadcastss 0x358b(%rip),%ymm12 # 493c <_sk_callback_hsw+0x1e3> .byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13 .byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13 - .byte 196,98,125,24,53,16,53,0,0 // vbroadcastss 0x3510(%rip),%ymm14 # 48d4 <_sk_callback_hsw+0x1e7> + .byte 196,98,125,24,53,124,53,0,0 // vbroadcastss 0x357c(%rip),%ymm14 # 4940 <_sk_callback_hsw+0x1e7> .byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13 - .byte 196,98,125,24,21,6,53,0,0 // vbroadcastss 0x3506(%rip),%ymm10 # 48d8 <_sk_callback_hsw+0x1eb> + .byte 196,98,125,24,21,114,53,0,0 // vbroadcastss 0x3572(%rip),%ymm10 # 4944 <_sk_callback_hsw+0x1eb> .byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0 .byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0 .byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9 @@ -10076,19 +10165,19 @@ HIDDEN _sk_to_srgb_hsw FUNCTION(_sk_to_srgb_hsw) _sk_to_srgb_hsw: .byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9 - .byte 196,98,125,24,5,170,52,0,0 // vbroadcastss 0x34aa(%rip),%ymm8 # 48dc <_sk_callback_hsw+0x1ef> + .byte 196,98,125,24,5,22,53,0,0 // vbroadcastss 0x3516(%rip),%ymm8 # 4948 <_sk_callback_hsw+0x1ef> .byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10 - .byte 196,98,125,24,29,160,52,0,0 // vbroadcastss 0x34a0(%rip),%ymm11 # 48e0 <_sk_callback_hsw+0x1f3> - .byte 196,98,125,24,37,155,52,0,0 // vbroadcastss 0x349b(%rip),%ymm12 # 48e4 <_sk_callback_hsw+0x1f7> + .byte 196,98,125,24,29,12,53,0,0 // vbroadcastss 0x350c(%rip),%ymm11 # 494c <_sk_callback_hsw+0x1f3> + .byte 196,98,125,24,37,7,53,0,0 // vbroadcastss 0x3507(%rip),%ymm12 # 4950 <_sk_callback_hsw+0x1f7> .byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13 .byte 196,66,53,168,235 // vfmadd213ps %ymm11,%ymm9,%ymm13 - .byte 196,98,125,24,53,140,52,0,0 // vbroadcastss 0x348c(%rip),%ymm14 # 48e8 <_sk_callback_hsw+0x1fb> + .byte 196,98,125,24,53,248,52,0,0 // vbroadcastss 0x34f8(%rip),%ymm14 # 4954 <_sk_callback_hsw+0x1fb> .byte 196,66,53,168,238 // vfmadd213ps %ymm14,%ymm9,%ymm13 - .byte 196,98,125,24,61,130,52,0,0 // vbroadcastss 0x3482(%rip),%ymm15 # 48ec <_sk_callback_hsw+0x1ff> + .byte 196,98,125,24,61,238,52,0,0 // vbroadcastss 0x34ee(%rip),%ymm15 # 4958 <_sk_callback_hsw+0x1ff> .byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9 .byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9 .byte 196,65,20,89,201 // vmulps %ymm9,%ymm13,%ymm9 - .byte 196,98,125,24,45,110,52,0,0 // vbroadcastss 0x346e(%rip),%ymm13 # 48f0 <_sk_callback_hsw+0x203> + .byte 196,98,125,24,45,218,52,0,0 // vbroadcastss 0x34da(%rip),%ymm13 # 495c <_sk_callback_hsw+0x203> .byte 196,193,124,194,197,1 // vcmpltps %ymm13,%ymm0,%ymm0 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9 @@ -10122,26 +10211,26 @@ _sk_rgb_to_hsl_hsw: .byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9 .byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9 .byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,29,227,51,0,0 // vbroadcastss 0x33e3(%rip),%ymm11 # 48f4 <_sk_callback_hsw+0x207> + .byte 196,98,125,24,29,79,52,0,0 // vbroadcastss 0x344f(%rip),%ymm11 # 4960 <_sk_callback_hsw+0x207> .byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11 .byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12 .byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13 - .byte 196,98,125,24,53,208,51,0,0 // vbroadcastss 0x33d0(%rip),%ymm14 # 48f8 <_sk_callback_hsw+0x20b> + .byte 196,98,125,24,53,60,52,0,0 // vbroadcastss 0x343c(%rip),%ymm14 # 4964 <_sk_callback_hsw+0x20b> .byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15 .byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13 .byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12 .byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2 .byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13 - .byte 196,98,125,24,53,183,51,0,0 // vbroadcastss 0x33b7(%rip),%ymm14 # 4900 <_sk_callback_hsw+0x213> + .byte 196,98,125,24,53,35,52,0,0 // vbroadcastss 0x3423(%rip),%ymm14 # 496c <_sk_callback_hsw+0x213> .byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13 - .byte 196,98,125,24,53,165,51,0,0 // vbroadcastss 0x33a5(%rip),%ymm14 # 48fc <_sk_callback_hsw+0x20f> + .byte 196,98,125,24,53,17,52,0,0 // vbroadcastss 0x3411(%rip),%ymm14 # 4968 <_sk_callback_hsw+0x20f> .byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2 .byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1 .byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1 .byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0 .byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0 .byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1 - .byte 196,98,125,24,29,136,51,0,0 // vbroadcastss 0x3388(%rip),%ymm11 # 4908 <_sk_callback_hsw+0x21b> + .byte 196,98,125,24,29,244,51,0,0 // vbroadcastss 0x33f4(%rip),%ymm11 # 4974 <_sk_callback_hsw+0x21b> .byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2 .byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11 .byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12 @@ -10151,7 +10240,7 @@ _sk_rgb_to_hsl_hsw: .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0 .byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1 - .byte 196,98,125,24,5,75,51,0,0 // vbroadcastss 0x334b(%rip),%ymm8 # 4904 <_sk_callback_hsw+0x217> + .byte 196,98,125,24,5,183,51,0,0 // vbroadcastss 0x33b7(%rip),%ymm8 # 4970 <_sk_callback_hsw+0x217> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -10168,30 +10257,30 @@ _sk_hsl_to_rgb_hsw: .byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp) .byte 197,252,40,233 // vmovaps %ymm1,%ymm5 .byte 197,252,40,224 // vmovaps %ymm0,%ymm4 - .byte 196,98,125,24,5,24,51,0,0 // vbroadcastss 0x3318(%rip),%ymm8 # 490c <_sk_callback_hsw+0x21f> + .byte 196,98,125,24,5,132,51,0,0 // vbroadcastss 0x3384(%rip),%ymm8 # 4978 <_sk_callback_hsw+0x21f> .byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9 .byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10 .byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11 .byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9 .byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10 - .byte 196,98,125,24,13,251,50,0,0 // vbroadcastss 0x32fb(%rip),%ymm9 # 4910 <_sk_callback_hsw+0x223> + .byte 196,98,125,24,13,103,51,0,0 // vbroadcastss 0x3367(%rip),%ymm9 # 497c <_sk_callback_hsw+0x223> .byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9 - .byte 196,98,125,24,29,241,50,0,0 // vbroadcastss 0x32f1(%rip),%ymm11 # 4914 <_sk_callback_hsw+0x227> + .byte 196,98,125,24,29,93,51,0,0 // vbroadcastss 0x335d(%rip),%ymm11 # 4980 <_sk_callback_hsw+0x227> .byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11 .byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12 .byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15 .byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11 - .byte 196,98,125,24,45,219,50,0,0 // vbroadcastss 0x32db(%rip),%ymm13 # 491c <_sk_callback_hsw+0x22f> + .byte 196,98,125,24,45,71,51,0,0 // vbroadcastss 0x3347(%rip),%ymm13 # 4988 <_sk_callback_hsw+0x22f> .byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0 - .byte 196,98,125,24,53,209,50,0,0 // vbroadcastss 0x32d1(%rip),%ymm14 # 4920 <_sk_callback_hsw+0x233> + .byte 196,98,125,24,53,61,51,0,0 // vbroadcastss 0x333d(%rip),%ymm14 # 498c <_sk_callback_hsw+0x233> .byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12 .byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12 - .byte 196,226,125,24,29,183,50,0,0 // vbroadcastss 0x32b7(%rip),%ymm3 # 4918 <_sk_callback_hsw+0x22b> + .byte 196,226,125,24,29,35,51,0,0 // vbroadcastss 0x3323(%rip),%ymm3 # 4984 <_sk_callback_hsw+0x22b> .byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7 .byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7 .byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12 .byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7 - .byte 196,98,125,24,37,162,50,0,0 // vbroadcastss 0x32a2(%rip),%ymm12 # 4924 <_sk_callback_hsw+0x237> + .byte 196,98,125,24,37,14,51,0,0 // vbroadcastss 0x330e(%rip),%ymm12 # 4990 <_sk_callback_hsw+0x237> .byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15 .byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0 .byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15 @@ -10207,7 +10296,7 @@ _sk_hsl_to_rgb_hsw: .byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0 .byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7 .byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1 - .byte 196,226,125,24,5,78,50,0,0 // vbroadcastss 0x324e(%rip),%ymm0 # 4928 <_sk_callback_hsw+0x23b> + .byte 196,226,125,24,5,186,50,0,0 // vbroadcastss 0x32ba(%rip),%ymm0 # 4994 <_sk_callback_hsw+0x23b> .byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0 .byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 @@ -10261,7 +10350,7 @@ _sk_scale_u8_hsw: .byte 197,122,126,0 // vmovq (%rax),%xmm8 .byte 196,66,125,49,192 // vpmovzxbd %xmm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,142,49,0,0 // vbroadcastss 0x318e(%rip),%ymm9 # 492c <_sk_callback_hsw+0x23f> + .byte 196,98,125,24,13,250,49,0,0 // vbroadcastss 0x31fa(%rip),%ymm9 # 4998 <_sk_callback_hsw+0x23f> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -10313,7 +10402,7 @@ _sk_lerp_u8_hsw: .byte 197,122,126,0 // vmovq (%rax),%xmm8 .byte 196,66,125,49,192 // vpmovzxbd %xmm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,251,48,0,0 // vbroadcastss 0x30fb(%rip),%ymm9 # 4930 <_sk_callback_hsw+0x243> + .byte 196,98,125,24,13,103,49,0,0 // vbroadcastss 0x3167(%rip),%ymm9 # 499c <_sk_callback_hsw+0x243> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0 @@ -10349,20 +10438,20 @@ _sk_lerp_565_hsw: .byte 15,133,169,0,0,0 // jne 1941 <_sk_lerp_565_hsw+0xb7> .byte 196,65,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm8 .byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8 - .byte 196,98,125,88,13,136,48,0,0 // vpbroadcastd 0x3088(%rip),%ymm9 # 4934 <_sk_callback_hsw+0x247> + .byte 196,98,125,88,13,244,48,0,0 // vpbroadcastd 0x30f4(%rip),%ymm9 # 49a0 <_sk_callback_hsw+0x247> .byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9 .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9 - .byte 196,98,125,24,21,121,48,0,0 // vbroadcastss 0x3079(%rip),%ymm10 # 4938 <_sk_callback_hsw+0x24b> + .byte 196,98,125,24,21,229,48,0,0 // vbroadcastss 0x30e5(%rip),%ymm10 # 49a4 <_sk_callback_hsw+0x24b> .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,88,21,111,48,0,0 // vpbroadcastd 0x306f(%rip),%ymm10 # 493c <_sk_callback_hsw+0x24f> + .byte 196,98,125,88,21,219,48,0,0 // vpbroadcastd 0x30db(%rip),%ymm10 # 49a8 <_sk_callback_hsw+0x24f> .byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10 .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10 - .byte 196,98,125,24,29,96,48,0,0 // vbroadcastss 0x3060(%rip),%ymm11 # 4940 <_sk_callback_hsw+0x253> + .byte 196,98,125,24,29,204,48,0,0 // vbroadcastss 0x30cc(%rip),%ymm11 # 49ac <_sk_callback_hsw+0x253> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,88,29,86,48,0,0 // vpbroadcastd 0x3056(%rip),%ymm11 # 4944 <_sk_callback_hsw+0x257> + .byte 196,98,125,88,29,194,48,0,0 // vpbroadcastd 0x30c2(%rip),%ymm11 # 49b0 <_sk_callback_hsw+0x257> .byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,29,71,48,0,0 // vbroadcastss 0x3047(%rip),%ymm11 # 4948 <_sk_callback_hsw+0x25b> + .byte 196,98,125,24,29,179,48,0,0 // vbroadcastss 0x30b3(%rip),%ymm11 # 49b4 <_sk_callback_hsw+0x25b> .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,226,53,168,196 // vfmadd213ps %ymm4,%ymm9,%ymm0 @@ -10433,21 +10522,21 @@ _sk_load_tables_hsw: .byte 77,133,192 // test %r8,%r8 .byte 117,105 // jne 1a4a <_sk_load_tables_hsw+0x7e> .byte 196,193,124,16,25 // vmovups (%r9),%ymm3 - .byte 197,228,84,13,18,50,0,0 // vandps 0x3212(%rip),%ymm3,%ymm1 # 4c00 <_sk_callback_hsw+0x513> + .byte 197,228,84,13,146,50,0,0 // vandps 0x3292(%rip),%ymm3,%ymm1 # 4c80 <_sk_callback_hsw+0x527> .byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8 .byte 72,139,72,8 // mov 0x8(%rax),%rcx .byte 76,139,72,16 // mov 0x10(%rax),%r9 .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2 .byte 196,226,109,146,4,137 // vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0 - .byte 196,226,101,0,21,18,50,0,0 // vpshufb 0x3212(%rip),%ymm3,%ymm2 # 4c20 <_sk_callback_hsw+0x533> + .byte 196,226,101,0,21,146,50,0,0 // vpshufb 0x3292(%rip),%ymm3,%ymm2 # 4ca0 <_sk_callback_hsw+0x547> .byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9 .byte 196,194,53,146,12,145 // vgatherdps %ymm9,(%r9,%ymm2,4),%ymm1 .byte 72,139,64,24 // mov 0x18(%rax),%rax - .byte 196,98,101,0,13,26,50,0,0 // vpshufb 0x321a(%rip),%ymm3,%ymm9 # 4c40 <_sk_callback_hsw+0x553> + .byte 196,98,101,0,13,154,50,0,0 // vpshufb 0x329a(%rip),%ymm3,%ymm9 # 4cc0 <_sk_callback_hsw+0x567> .byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,14,47,0,0 // vbroadcastss 0x2f0e(%rip),%ymm8 # 494c <_sk_callback_hsw+0x25f> + .byte 196,98,125,24,5,122,47,0,0 // vbroadcastss 0x2f7a(%rip),%ymm8 # 49b8 <_sk_callback_hsw+0x25f> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,137,193 // mov %r8,%rcx @@ -10486,7 +10575,7 @@ _sk_load_tables_u16_be_hsw: .byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1 .byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2 .byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8 - .byte 197,121,111,21,166,50,0,0 // vmovdqa 0x32a6(%rip),%xmm10 # 4d80 <_sk_callback_hsw+0x693> + .byte 197,121,111,21,38,51,0,0 // vmovdqa 0x3326(%rip),%xmm10 # 4e00 <_sk_callback_hsw+0x6a7> .byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0 .byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1 .byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11 @@ -10508,7 +10597,7 @@ _sk_load_tables_u16_be_hsw: .byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3 .byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,7,46,0,0 // vbroadcastss 0x2e07(%rip),%ymm8 # 4950 <_sk_callback_hsw+0x263> + .byte 196,98,125,24,5,115,46,0,0 // vbroadcastss 0x2e73(%rip),%ymm8 # 49bc <_sk_callback_hsw+0x263> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -10568,7 +10657,7 @@ _sk_load_tables_rgb_u16_be_hsw: .byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3 .byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2 .byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8 - .byte 197,121,111,13,70,49,0,0 // vmovdqa 0x3146(%rip),%xmm9 # 4d90 <_sk_callback_hsw+0x6a3> + .byte 197,121,111,13,198,49,0,0 // vmovdqa 0x31c6(%rip),%xmm9 # 4e10 <_sk_callback_hsw+0x6b7> .byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0 .byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1 .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3 @@ -10585,7 +10674,7 @@ _sk_load_tables_rgb_u16_be_hsw: .byte 196,98,125,51,194 // vpmovzxwd %xmm2,%ymm8 .byte 196,162,101,146,20,128 // vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,181,44,0,0 // vbroadcastss 0x2cb5(%rip),%ymm3 # 4954 <_sk_callback_hsw+0x267> + .byte 196,226,125,24,29,33,45,0,0 // vbroadcastss 0x2d21(%rip),%ymm3 # 49c0 <_sk_callback_hsw+0x267> .byte 255,224 // jmpq *%rax .byte 196,129,121,110,4,72 // vmovd (%r8,%r9,2),%xmm0 .byte 196,129,121,196,68,72,4,2 // vpinsrw $0x2,0x4(%r8,%r9,2),%xmm0,%xmm0 @@ -10632,7 +10721,7 @@ _sk_byte_tables_hsw: .byte 65,84 // push %r12 .byte 83 // push %rbx .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,243,43,0,0 // vbroadcastss 0x2bf3(%rip),%ymm8 # 4958 <_sk_callback_hsw+0x26b> + .byte 196,98,125,24,5,95,44,0,0 // vbroadcastss 0x2c5f(%rip),%ymm8 # 49c4 <_sk_callback_hsw+0x26b> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0 .byte 196,195,249,22,192,1 // vpextrq $0x1,%xmm0,%r8 @@ -10669,7 +10758,7 @@ _sk_byte_tables_hsw: .byte 196,227,121,32,197,7 // vpinsrb $0x7,%ebp,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,68,43,0,0 // vbroadcastss 0x2b44(%rip),%ymm9 # 495c <_sk_callback_hsw+0x26f> + .byte 196,98,125,24,13,176,43,0,0 // vbroadcastss 0x2bb0(%rip),%ymm9 # 49c8 <_sk_callback_hsw+0x26f> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 @@ -10830,7 +10919,7 @@ _sk_byte_tables_rgb_hsw: .byte 196,227,121,32,197,7 // vpinsrb $0x7,%ebp,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,125,40,0,0 // vbroadcastss 0x287d(%rip),%ymm9 # 4960 <_sk_callback_hsw+0x273> + .byte 196,98,125,24,13,233,40,0,0 // vbroadcastss 0x28e9(%rip),%ymm9 # 49cc <_sk_callback_hsw+0x273> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 @@ -10993,33 +11082,33 @@ _sk_parametric_r_hsw: .byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10 .byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,48,38,0,0 // vbroadcastss 0x2630(%rip),%ymm12 # 4964 <_sk_callback_hsw+0x277> - .byte 196,98,125,24,45,43,38,0,0 // vbroadcastss 0x262b(%rip),%ymm13 # 4968 <_sk_callback_hsw+0x27b> + .byte 196,98,125,24,37,156,38,0,0 // vbroadcastss 0x269c(%rip),%ymm12 # 49d0 <_sk_callback_hsw+0x277> + .byte 196,98,125,24,45,151,38,0,0 // vbroadcastss 0x2697(%rip),%ymm13 # 49d4 <_sk_callback_hsw+0x27b> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,33,38,0,0 // vbroadcastss 0x2621(%rip),%ymm13 # 496c <_sk_callback_hsw+0x27f> + .byte 196,98,125,24,45,141,38,0,0 // vbroadcastss 0x268d(%rip),%ymm13 # 49d8 <_sk_callback_hsw+0x27f> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,23,38,0,0 // vbroadcastss 0x2617(%rip),%ymm13 # 4970 <_sk_callback_hsw+0x283> + .byte 196,98,125,24,45,131,38,0,0 // vbroadcastss 0x2683(%rip),%ymm13 # 49dc <_sk_callback_hsw+0x283> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,13,38,0,0 // vbroadcastss 0x260d(%rip),%ymm11 # 4974 <_sk_callback_hsw+0x287> + .byte 196,98,125,24,29,121,38,0,0 // vbroadcastss 0x2679(%rip),%ymm11 # 49e0 <_sk_callback_hsw+0x287> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,3,38,0,0 // vbroadcastss 0x2603(%rip),%ymm12 # 4978 <_sk_callback_hsw+0x28b> + .byte 196,98,125,24,37,111,38,0,0 // vbroadcastss 0x266f(%rip),%ymm12 # 49e4 <_sk_callback_hsw+0x28b> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,249,37,0,0 // vbroadcastss 0x25f9(%rip),%ymm12 # 497c <_sk_callback_hsw+0x28f> + .byte 196,98,125,24,37,101,38,0,0 // vbroadcastss 0x2665(%rip),%ymm12 # 49e8 <_sk_callback_hsw+0x28f> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 - .byte 196,98,125,24,29,218,37,0,0 // vbroadcastss 0x25da(%rip),%ymm11 # 4980 <_sk_callback_hsw+0x293> + .byte 196,98,125,24,29,70,38,0,0 // vbroadcastss 0x2646(%rip),%ymm11 # 49ec <_sk_callback_hsw+0x293> .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,208,37,0,0 // vbroadcastss 0x25d0(%rip),%ymm11 # 4984 <_sk_callback_hsw+0x297> + .byte 196,98,125,24,29,60,38,0,0 // vbroadcastss 0x263c(%rip),%ymm11 # 49f0 <_sk_callback_hsw+0x297> .byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11 - .byte 196,226,125,24,5,198,37,0,0 // vbroadcastss 0x25c6(%rip),%ymm0 # 4988 <_sk_callback_hsw+0x29b> + .byte 196,226,125,24,5,50,38,0,0 // vbroadcastss 0x2632(%rip),%ymm0 # 49f4 <_sk_callback_hsw+0x29b> .byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0 - .byte 196,98,125,24,21,188,37,0,0 // vbroadcastss 0x25bc(%rip),%ymm10 # 498c <_sk_callback_hsw+0x29f> + .byte 196,98,125,24,21,40,38,0,0 // vbroadcastss 0x2628(%rip),%ymm10 # 49f8 <_sk_callback_hsw+0x29f> .byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0 .byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0 - .byte 196,98,125,24,21,175,37,0,0 // vbroadcastss 0x25af(%rip),%ymm10 # 4990 <_sk_callback_hsw+0x2a3> + .byte 196,98,125,24,21,27,38,0,0 // vbroadcastss 0x261b(%rip),%ymm10 # 49fc <_sk_callback_hsw+0x2a3> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -11027,7 +11116,7 @@ _sk_parametric_r_hsw: .byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,134,37,0,0 // vbroadcastss 0x2586(%rip),%ymm8 # 4994 <_sk_callback_hsw+0x2a7> + .byte 196,98,125,24,5,242,37,0,0 // vbroadcastss 0x25f2(%rip),%ymm8 # 4a00 <_sk_callback_hsw+0x2a7> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11047,33 +11136,33 @@ _sk_parametric_g_hsw: .byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10 .byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,62,37,0,0 // vbroadcastss 0x253e(%rip),%ymm12 # 4998 <_sk_callback_hsw+0x2ab> - .byte 196,98,125,24,45,57,37,0,0 // vbroadcastss 0x2539(%rip),%ymm13 # 499c <_sk_callback_hsw+0x2af> + .byte 196,98,125,24,37,170,37,0,0 // vbroadcastss 0x25aa(%rip),%ymm12 # 4a04 <_sk_callback_hsw+0x2ab> + .byte 196,98,125,24,45,165,37,0,0 // vbroadcastss 0x25a5(%rip),%ymm13 # 4a08 <_sk_callback_hsw+0x2af> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,47,37,0,0 // vbroadcastss 0x252f(%rip),%ymm13 # 49a0 <_sk_callback_hsw+0x2b3> + .byte 196,98,125,24,45,155,37,0,0 // vbroadcastss 0x259b(%rip),%ymm13 # 4a0c <_sk_callback_hsw+0x2b3> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,37,37,0,0 // vbroadcastss 0x2525(%rip),%ymm13 # 49a4 <_sk_callback_hsw+0x2b7> + .byte 196,98,125,24,45,145,37,0,0 // vbroadcastss 0x2591(%rip),%ymm13 # 4a10 <_sk_callback_hsw+0x2b7> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,27,37,0,0 // vbroadcastss 0x251b(%rip),%ymm11 # 49a8 <_sk_callback_hsw+0x2bb> + .byte 196,98,125,24,29,135,37,0,0 // vbroadcastss 0x2587(%rip),%ymm11 # 4a14 <_sk_callback_hsw+0x2bb> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,17,37,0,0 // vbroadcastss 0x2511(%rip),%ymm12 # 49ac <_sk_callback_hsw+0x2bf> + .byte 196,98,125,24,37,125,37,0,0 // vbroadcastss 0x257d(%rip),%ymm12 # 4a18 <_sk_callback_hsw+0x2bf> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,7,37,0,0 // vbroadcastss 0x2507(%rip),%ymm12 # 49b0 <_sk_callback_hsw+0x2c3> + .byte 196,98,125,24,37,115,37,0,0 // vbroadcastss 0x2573(%rip),%ymm12 # 4a1c <_sk_callback_hsw+0x2c3> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10 .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10 - .byte 196,98,125,24,29,232,36,0,0 // vbroadcastss 0x24e8(%rip),%ymm11 # 49b4 <_sk_callback_hsw+0x2c7> + .byte 196,98,125,24,29,84,37,0,0 // vbroadcastss 0x2554(%rip),%ymm11 # 4a20 <_sk_callback_hsw+0x2c7> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,222,36,0,0 // vbroadcastss 0x24de(%rip),%ymm11 # 49b8 <_sk_callback_hsw+0x2cb> + .byte 196,98,125,24,29,74,37,0,0 // vbroadcastss 0x254a(%rip),%ymm11 # 4a24 <_sk_callback_hsw+0x2cb> .byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11 - .byte 196,226,125,24,13,212,36,0,0 // vbroadcastss 0x24d4(%rip),%ymm1 # 49bc <_sk_callback_hsw+0x2cf> + .byte 196,226,125,24,13,64,37,0,0 // vbroadcastss 0x2540(%rip),%ymm1 # 4a28 <_sk_callback_hsw+0x2cf> .byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1 - .byte 196,98,125,24,21,202,36,0,0 // vbroadcastss 0x24ca(%rip),%ymm10 # 49c0 <_sk_callback_hsw+0x2d3> + .byte 196,98,125,24,21,54,37,0,0 // vbroadcastss 0x2536(%rip),%ymm10 # 4a2c <_sk_callback_hsw+0x2d3> .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1 - .byte 196,98,125,24,21,189,36,0,0 // vbroadcastss 0x24bd(%rip),%ymm10 # 49c4 <_sk_callback_hsw+0x2d7> + .byte 196,98,125,24,21,41,37,0,0 // vbroadcastss 0x2529(%rip),%ymm10 # 4a30 <_sk_callback_hsw+0x2d7> .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -11081,7 +11170,7 @@ _sk_parametric_g_hsw: .byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,5,148,36,0,0 // vbroadcastss 0x2494(%rip),%ymm8 # 49c8 <_sk_callback_hsw+0x2db> + .byte 196,98,125,24,5,0,37,0,0 // vbroadcastss 0x2500(%rip),%ymm8 # 4a34 <_sk_callback_hsw+0x2db> .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11101,33 +11190,33 @@ _sk_parametric_b_hsw: .byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10 .byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,76,36,0,0 // vbroadcastss 0x244c(%rip),%ymm12 # 49cc <_sk_callback_hsw+0x2df> - .byte 196,98,125,24,45,71,36,0,0 // vbroadcastss 0x2447(%rip),%ymm13 # 49d0 <_sk_callback_hsw+0x2e3> + .byte 196,98,125,24,37,184,36,0,0 // vbroadcastss 0x24b8(%rip),%ymm12 # 4a38 <_sk_callback_hsw+0x2df> + .byte 196,98,125,24,45,179,36,0,0 // vbroadcastss 0x24b3(%rip),%ymm13 # 4a3c <_sk_callback_hsw+0x2e3> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,61,36,0,0 // vbroadcastss 0x243d(%rip),%ymm13 # 49d4 <_sk_callback_hsw+0x2e7> + .byte 196,98,125,24,45,169,36,0,0 // vbroadcastss 0x24a9(%rip),%ymm13 # 4a40 <_sk_callback_hsw+0x2e7> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,51,36,0,0 // vbroadcastss 0x2433(%rip),%ymm13 # 49d8 <_sk_callback_hsw+0x2eb> + .byte 196,98,125,24,45,159,36,0,0 // vbroadcastss 0x249f(%rip),%ymm13 # 4a44 <_sk_callback_hsw+0x2eb> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,41,36,0,0 // vbroadcastss 0x2429(%rip),%ymm11 # 49dc <_sk_callback_hsw+0x2ef> + .byte 196,98,125,24,29,149,36,0,0 // vbroadcastss 0x2495(%rip),%ymm11 # 4a48 <_sk_callback_hsw+0x2ef> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,31,36,0,0 // vbroadcastss 0x241f(%rip),%ymm12 # 49e0 <_sk_callback_hsw+0x2f3> + .byte 196,98,125,24,37,139,36,0,0 // vbroadcastss 0x248b(%rip),%ymm12 # 4a4c <_sk_callback_hsw+0x2f3> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,21,36,0,0 // vbroadcastss 0x2415(%rip),%ymm12 # 49e4 <_sk_callback_hsw+0x2f7> + .byte 196,98,125,24,37,129,36,0,0 // vbroadcastss 0x2481(%rip),%ymm12 # 4a50 <_sk_callback_hsw+0x2f7> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10 .byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10 - .byte 196,98,125,24,29,246,35,0,0 // vbroadcastss 0x23f6(%rip),%ymm11 # 49e8 <_sk_callback_hsw+0x2fb> + .byte 196,98,125,24,29,98,36,0,0 // vbroadcastss 0x2462(%rip),%ymm11 # 4a54 <_sk_callback_hsw+0x2fb> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,236,35,0,0 // vbroadcastss 0x23ec(%rip),%ymm11 # 49ec <_sk_callback_hsw+0x2ff> + .byte 196,98,125,24,29,88,36,0,0 // vbroadcastss 0x2458(%rip),%ymm11 # 4a58 <_sk_callback_hsw+0x2ff> .byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11 - .byte 196,226,125,24,21,226,35,0,0 // vbroadcastss 0x23e2(%rip),%ymm2 # 49f0 <_sk_callback_hsw+0x303> + .byte 196,226,125,24,21,78,36,0,0 // vbroadcastss 0x244e(%rip),%ymm2 # 4a5c <_sk_callback_hsw+0x303> .byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2 - .byte 196,98,125,24,21,216,35,0,0 // vbroadcastss 0x23d8(%rip),%ymm10 # 49f4 <_sk_callback_hsw+0x307> + .byte 196,98,125,24,21,68,36,0,0 // vbroadcastss 0x2444(%rip),%ymm10 # 4a60 <_sk_callback_hsw+0x307> .byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2 .byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2 - .byte 196,98,125,24,21,203,35,0,0 // vbroadcastss 0x23cb(%rip),%ymm10 # 49f8 <_sk_callback_hsw+0x30b> + .byte 196,98,125,24,21,55,36,0,0 // vbroadcastss 0x2437(%rip),%ymm10 # 4a64 <_sk_callback_hsw+0x30b> .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -11135,7 +11224,7 @@ _sk_parametric_b_hsw: .byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,162,35,0,0 // vbroadcastss 0x23a2(%rip),%ymm8 # 49fc <_sk_callback_hsw+0x30f> + .byte 196,98,125,24,5,14,36,0,0 // vbroadcastss 0x240e(%rip),%ymm8 # 4a68 <_sk_callback_hsw+0x30f> .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11155,33 +11244,33 @@ _sk_parametric_a_hsw: .byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10 .byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,90,35,0,0 // vbroadcastss 0x235a(%rip),%ymm12 # 4a00 <_sk_callback_hsw+0x313> - .byte 196,98,125,24,45,85,35,0,0 // vbroadcastss 0x2355(%rip),%ymm13 # 4a04 <_sk_callback_hsw+0x317> + .byte 196,98,125,24,37,198,35,0,0 // vbroadcastss 0x23c6(%rip),%ymm12 # 4a6c <_sk_callback_hsw+0x313> + .byte 196,98,125,24,45,193,35,0,0 // vbroadcastss 0x23c1(%rip),%ymm13 # 4a70 <_sk_callback_hsw+0x317> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,75,35,0,0 // vbroadcastss 0x234b(%rip),%ymm13 # 4a08 <_sk_callback_hsw+0x31b> + .byte 196,98,125,24,45,183,35,0,0 // vbroadcastss 0x23b7(%rip),%ymm13 # 4a74 <_sk_callback_hsw+0x31b> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,65,35,0,0 // vbroadcastss 0x2341(%rip),%ymm13 # 4a0c <_sk_callback_hsw+0x31f> + .byte 196,98,125,24,45,173,35,0,0 // vbroadcastss 0x23ad(%rip),%ymm13 # 4a78 <_sk_callback_hsw+0x31f> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,55,35,0,0 // vbroadcastss 0x2337(%rip),%ymm11 # 4a10 <_sk_callback_hsw+0x323> + .byte 196,98,125,24,29,163,35,0,0 // vbroadcastss 0x23a3(%rip),%ymm11 # 4a7c <_sk_callback_hsw+0x323> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,45,35,0,0 // vbroadcastss 0x232d(%rip),%ymm12 # 4a14 <_sk_callback_hsw+0x327> + .byte 196,98,125,24,37,153,35,0,0 // vbroadcastss 0x2399(%rip),%ymm12 # 4a80 <_sk_callback_hsw+0x327> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,35,35,0,0 // vbroadcastss 0x2323(%rip),%ymm12 # 4a18 <_sk_callback_hsw+0x32b> + .byte 196,98,125,24,37,143,35,0,0 // vbroadcastss 0x238f(%rip),%ymm12 # 4a84 <_sk_callback_hsw+0x32b> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10 .byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10 - .byte 196,98,125,24,29,4,35,0,0 // vbroadcastss 0x2304(%rip),%ymm11 # 4a1c <_sk_callback_hsw+0x32f> + .byte 196,98,125,24,29,112,35,0,0 // vbroadcastss 0x2370(%rip),%ymm11 # 4a88 <_sk_callback_hsw+0x32f> .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,250,34,0,0 // vbroadcastss 0x22fa(%rip),%ymm11 # 4a20 <_sk_callback_hsw+0x333> + .byte 196,98,125,24,29,102,35,0,0 // vbroadcastss 0x2366(%rip),%ymm11 # 4a8c <_sk_callback_hsw+0x333> .byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11 - .byte 196,226,125,24,29,240,34,0,0 // vbroadcastss 0x22f0(%rip),%ymm3 # 4a24 <_sk_callback_hsw+0x337> + .byte 196,226,125,24,29,92,35,0,0 // vbroadcastss 0x235c(%rip),%ymm3 # 4a90 <_sk_callback_hsw+0x337> .byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3 - .byte 196,98,125,24,21,230,34,0,0 // vbroadcastss 0x22e6(%rip),%ymm10 # 4a28 <_sk_callback_hsw+0x33b> + .byte 196,98,125,24,21,82,35,0,0 // vbroadcastss 0x2352(%rip),%ymm10 # 4a94 <_sk_callback_hsw+0x33b> .byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3 .byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3 - .byte 196,98,125,24,21,217,34,0,0 // vbroadcastss 0x22d9(%rip),%ymm10 # 4a2c <_sk_callback_hsw+0x33f> + .byte 196,98,125,24,21,69,35,0,0 // vbroadcastss 0x2345(%rip),%ymm10 # 4a98 <_sk_callback_hsw+0x33f> .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -11189,7 +11278,7 @@ _sk_parametric_a_hsw: .byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3 - .byte 196,98,125,24,5,176,34,0,0 // vbroadcastss 0x22b0(%rip),%ymm8 # 4a30 <_sk_callback_hsw+0x343> + .byte 196,98,125,24,5,28,35,0,0 // vbroadcastss 0x231c(%rip),%ymm8 # 4a9c <_sk_callback_hsw+0x343> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11198,26 +11287,26 @@ HIDDEN _sk_lab_to_xyz_hsw .globl _sk_lab_to_xyz_hsw FUNCTION(_sk_lab_to_xyz_hsw) _sk_lab_to_xyz_hsw: - .byte 196,98,125,24,5,162,34,0,0 // vbroadcastss 0x22a2(%rip),%ymm8 # 4a34 <_sk_callback_hsw+0x347> - .byte 196,98,125,24,13,157,34,0,0 // vbroadcastss 0x229d(%rip),%ymm9 # 4a38 <_sk_callback_hsw+0x34b> - .byte 196,98,125,24,21,152,34,0,0 // vbroadcastss 0x2298(%rip),%ymm10 # 4a3c <_sk_callback_hsw+0x34f> + .byte 196,98,125,24,5,14,35,0,0 // vbroadcastss 0x230e(%rip),%ymm8 # 4aa0 <_sk_callback_hsw+0x347> + .byte 196,98,125,24,13,9,35,0,0 // vbroadcastss 0x2309(%rip),%ymm9 # 4aa4 <_sk_callback_hsw+0x34b> + .byte 196,98,125,24,21,4,35,0,0 // vbroadcastss 0x2304(%rip),%ymm10 # 4aa8 <_sk_callback_hsw+0x34f> .byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1 .byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2 - .byte 196,98,125,24,13,137,34,0,0 // vbroadcastss 0x2289(%rip),%ymm9 # 4a40 <_sk_callback_hsw+0x353> + .byte 196,98,125,24,13,245,34,0,0 // vbroadcastss 0x22f5(%rip),%ymm9 # 4aac <_sk_callback_hsw+0x353> .byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9 - .byte 196,226,125,24,5,127,34,0,0 // vbroadcastss 0x227f(%rip),%ymm0 # 4a44 <_sk_callback_hsw+0x357> + .byte 196,226,125,24,5,235,34,0,0 // vbroadcastss 0x22eb(%rip),%ymm0 # 4ab0 <_sk_callback_hsw+0x357> .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 - .byte 196,98,125,24,5,118,34,0,0 // vbroadcastss 0x2276(%rip),%ymm8 # 4a48 <_sk_callback_hsw+0x35b> + .byte 196,98,125,24,5,226,34,0,0 // vbroadcastss 0x22e2(%rip),%ymm8 # 4ab4 <_sk_callback_hsw+0x35b> .byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8 - .byte 196,98,125,24,13,108,34,0,0 // vbroadcastss 0x226c(%rip),%ymm9 # 4a4c <_sk_callback_hsw+0x35f> + .byte 196,98,125,24,13,216,34,0,0 // vbroadcastss 0x22d8(%rip),%ymm9 # 4ab8 <_sk_callback_hsw+0x35f> .byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9 .byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 - .byte 196,226,125,24,21,89,34,0,0 // vbroadcastss 0x2259(%rip),%ymm2 # 4a50 <_sk_callback_hsw+0x363> + .byte 196,226,125,24,21,197,34,0,0 // vbroadcastss 0x22c5(%rip),%ymm2 # 4abc <_sk_callback_hsw+0x363> .byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10 - .byte 196,98,125,24,29,79,34,0,0 // vbroadcastss 0x224f(%rip),%ymm11 # 4a54 <_sk_callback_hsw+0x367> + .byte 196,98,125,24,29,187,34,0,0 // vbroadcastss 0x22bb(%rip),%ymm11 # 4ac0 <_sk_callback_hsw+0x367> .byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8 - .byte 196,98,125,24,37,69,34,0,0 // vbroadcastss 0x2245(%rip),%ymm12 # 4a58 <_sk_callback_hsw+0x36b> + .byte 196,98,125,24,37,177,34,0,0 // vbroadcastss 0x22b1(%rip),%ymm12 # 4ac4 <_sk_callback_hsw+0x36b> .byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8 .byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8 .byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1 @@ -11232,9 +11321,9 @@ _sk_lab_to_xyz_hsw: .byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9 .byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9 .byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2 - .byte 196,226,125,24,5,250,33,0,0 // vbroadcastss 0x21fa(%rip),%ymm0 # 4a5c <_sk_callback_hsw+0x36f> + .byte 196,226,125,24,5,102,34,0,0 // vbroadcastss 0x2266(%rip),%ymm0 # 4ac8 <_sk_callback_hsw+0x36f> .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,241,33,0,0 // vbroadcastss 0x21f1(%rip),%ymm8 # 4a60 <_sk_callback_hsw+0x373> + .byte 196,98,125,24,5,93,34,0,0 // vbroadcastss 0x225d(%rip),%ymm8 # 4acc <_sk_callback_hsw+0x373> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11252,7 +11341,7 @@ _sk_load_a8_hsw: .byte 197,250,126,0 // vmovq (%rax),%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,198,33,0,0 // vbroadcastss 0x21c6(%rip),%ymm1 # 4a64 <_sk_callback_hsw+0x377> + .byte 196,226,125,24,13,50,34,0,0 // vbroadcastss 0x2232(%rip),%ymm1 # 4ad0 <_sk_callback_hsw+0x377> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -11317,7 +11406,7 @@ _sk_gather_a8_hsw: .byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,209,32,0,0 // vbroadcastss 0x20d1(%rip),%ymm1 # 4a68 <_sk_callback_hsw+0x37b> + .byte 196,226,125,24,13,61,33,0,0 // vbroadcastss 0x213d(%rip),%ymm1 # 4ad4 <_sk_callback_hsw+0x37b> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -11335,7 +11424,7 @@ FUNCTION(_sk_store_a8_hsw) _sk_store_a8_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 196,98,125,24,5,172,32,0,0 // vbroadcastss 0x20ac(%rip),%ymm8 # 4a6c <_sk_callback_hsw+0x37f> + .byte 196,98,125,24,5,24,33,0,0 // vbroadcastss 0x2118(%rip),%ymm8 # 4ad8 <_sk_callback_hsw+0x37f> .byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8 .byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8 .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 @@ -11402,10 +11491,10 @@ _sk_load_g8_hsw: .byte 197,250,126,0 // vmovq (%rax),%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,226,31,0,0 // vbroadcastss 0x1fe2(%rip),%ymm1 # 4a70 <_sk_callback_hsw+0x383> + .byte 196,226,125,24,13,78,32,0,0 // vbroadcastss 0x204e(%rip),%ymm1 # 4adc <_sk_callback_hsw+0x383> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,215,31,0,0 // vbroadcastss 0x1fd7(%rip),%ymm3 # 4a74 <_sk_callback_hsw+0x387> + .byte 196,226,125,24,29,67,32,0,0 // vbroadcastss 0x2043(%rip),%ymm3 # 4ae0 <_sk_callback_hsw+0x387> .byte 76,137,193 // mov %r8,%rcx .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 @@ -11467,10 +11556,10 @@ _sk_gather_g8_hsw: .byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,236,30,0,0 // vbroadcastss 0x1eec(%rip),%ymm1 # 4a78 <_sk_callback_hsw+0x38b> + .byte 196,226,125,24,13,88,31,0,0 // vbroadcastss 0x1f58(%rip),%ymm1 # 4ae4 <_sk_callback_hsw+0x38b> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,225,30,0,0 // vbroadcastss 0x1ee1(%rip),%ymm3 # 4a7c <_sk_callback_hsw+0x38f> + .byte 196,226,125,24,29,77,31,0,0 // vbroadcastss 0x1f4d(%rip),%ymm3 # 4ae8 <_sk_callback_hsw+0x38f> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 91 // pop %rbx @@ -11526,14 +11615,14 @@ _sk_gather_i8_hsw: .byte 73,139,64,8 // mov 0x8(%r8),%rax .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,226,117,144,28,128 // vpgatherdd %ymm1,(%rax,%ymm0,4),%ymm3 - .byte 197,229,219,5,245,31,0,0 // vpand 0x1ff5(%rip),%ymm3,%ymm0 # 4c60 <_sk_callback_hsw+0x573> + .byte 197,229,219,5,117,32,0,0 // vpand 0x2075(%rip),%ymm3,%ymm0 # 4ce0 <_sk_callback_hsw+0x587> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,8,30,0,0 // vbroadcastss 0x1e08(%rip),%ymm8 # 4a80 <_sk_callback_hsw+0x393> + .byte 196,98,125,24,5,116,30,0,0 // vbroadcastss 0x1e74(%rip),%ymm8 # 4aec <_sk_callback_hsw+0x393> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,226,101,0,13,250,31,0,0 // vpshufb 0x1ffa(%rip),%ymm3,%ymm1 # 4c80 <_sk_callback_hsw+0x593> + .byte 196,226,101,0,13,122,32,0,0 // vpshufb 0x207a(%rip),%ymm3,%ymm1 # 4d00 <_sk_callback_hsw+0x5a7> .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,226,101,0,21,8,32,0,0 // vpshufb 0x2008(%rip),%ymm3,%ymm2 # 4ca0 <_sk_callback_hsw+0x5b3> + .byte 196,226,101,0,21,136,32,0,0 // vpshufb 0x2088(%rip),%ymm3,%ymm2 # 4d20 <_sk_callback_hsw+0x5c7> .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -11557,23 +11646,23 @@ _sk_load_565_hsw: .byte 117,114 // jne 2d38 <_sk_load_565_hsw+0x7c> .byte 196,193,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm0 .byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2 - .byte 196,226,125,88,5,170,29,0,0 // vpbroadcastd 0x1daa(%rip),%ymm0 # 4a84 <_sk_callback_hsw+0x397> + .byte 196,226,125,88,5,22,30,0,0 // vpbroadcastd 0x1e16(%rip),%ymm0 # 4af0 <_sk_callback_hsw+0x397> .byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,157,29,0,0 // vbroadcastss 0x1d9d(%rip),%ymm1 # 4a88 <_sk_callback_hsw+0x39b> + .byte 196,226,125,24,13,9,30,0,0 // vbroadcastss 0x1e09(%rip),%ymm1 # 4af4 <_sk_callback_hsw+0x39b> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,148,29,0,0 // vpbroadcastd 0x1d94(%rip),%ymm1 # 4a8c <_sk_callback_hsw+0x39f> + .byte 196,226,125,88,13,0,30,0,0 // vpbroadcastd 0x1e00(%rip),%ymm1 # 4af8 <_sk_callback_hsw+0x39f> .byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,135,29,0,0 // vbroadcastss 0x1d87(%rip),%ymm3 # 4a90 <_sk_callback_hsw+0x3a3> + .byte 196,226,125,24,29,243,29,0,0 // vbroadcastss 0x1df3(%rip),%ymm3 # 4afc <_sk_callback_hsw+0x3a3> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,88,29,126,29,0,0 // vpbroadcastd 0x1d7e(%rip),%ymm3 # 4a94 <_sk_callback_hsw+0x3a7> + .byte 196,226,125,88,29,234,29,0,0 // vpbroadcastd 0x1dea(%rip),%ymm3 # 4b00 <_sk_callback_hsw+0x3a7> .byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,113,29,0,0 // vbroadcastss 0x1d71(%rip),%ymm3 # 4a98 <_sk_callback_hsw+0x3ab> + .byte 196,226,125,24,29,221,29,0,0 // vbroadcastss 0x1ddd(%rip),%ymm3 # 4b04 <_sk_callback_hsw+0x3ab> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,102,29,0,0 // vbroadcastss 0x1d66(%rip),%ymm3 # 4a9c <_sk_callback_hsw+0x3af> + .byte 196,226,125,24,29,210,29,0,0 // vbroadcastss 0x1dd2(%rip),%ymm3 # 4b08 <_sk_callback_hsw+0x3af> .byte 255,224 // jmpq *%rax .byte 65,137,200 // mov %ecx,%r8d .byte 65,128,224,7 // and $0x7,%r8b @@ -11664,23 +11753,23 @@ _sk_gather_565_hsw: .byte 65,15,183,4,88 // movzwl (%r8,%rbx,2),%eax .byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2 - .byte 196,226,125,88,5,41,28,0,0 // vpbroadcastd 0x1c29(%rip),%ymm0 # 4aa0 <_sk_callback_hsw+0x3b3> + .byte 196,226,125,88,5,149,28,0,0 // vpbroadcastd 0x1c95(%rip),%ymm0 # 4b0c <_sk_callback_hsw+0x3b3> .byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,28,28,0,0 // vbroadcastss 0x1c1c(%rip),%ymm1 # 4aa4 <_sk_callback_hsw+0x3b7> + .byte 196,226,125,24,13,136,28,0,0 // vbroadcastss 0x1c88(%rip),%ymm1 # 4b10 <_sk_callback_hsw+0x3b7> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,19,28,0,0 // vpbroadcastd 0x1c13(%rip),%ymm1 # 4aa8 <_sk_callback_hsw+0x3bb> + .byte 196,226,125,88,13,127,28,0,0 // vpbroadcastd 0x1c7f(%rip),%ymm1 # 4b14 <_sk_callback_hsw+0x3bb> .byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,6,28,0,0 // vbroadcastss 0x1c06(%rip),%ymm3 # 4aac <_sk_callback_hsw+0x3bf> + .byte 196,226,125,24,29,114,28,0,0 // vbroadcastss 0x1c72(%rip),%ymm3 # 4b18 <_sk_callback_hsw+0x3bf> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,88,29,253,27,0,0 // vpbroadcastd 0x1bfd(%rip),%ymm3 # 4ab0 <_sk_callback_hsw+0x3c3> + .byte 196,226,125,88,29,105,28,0,0 // vpbroadcastd 0x1c69(%rip),%ymm3 # 4b1c <_sk_callback_hsw+0x3c3> .byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,240,27,0,0 // vbroadcastss 0x1bf0(%rip),%ymm3 # 4ab4 <_sk_callback_hsw+0x3c7> + .byte 196,226,125,24,29,92,28,0,0 // vbroadcastss 0x1c5c(%rip),%ymm3 # 4b20 <_sk_callback_hsw+0x3c7> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,229,27,0,0 // vbroadcastss 0x1be5(%rip),%ymm3 # 4ab8 <_sk_callback_hsw+0x3cb> + .byte 196,226,125,24,29,81,28,0,0 // vbroadcastss 0x1c51(%rip),%ymm3 # 4b24 <_sk_callback_hsw+0x3cb> .byte 91 // pop %rbx .byte 65,92 // pop %r12 .byte 65,94 // pop %r14 @@ -11693,11 +11782,11 @@ FUNCTION(_sk_store_565_hsw) _sk_store_565_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 196,98,125,24,5,210,27,0,0 // vbroadcastss 0x1bd2(%rip),%ymm8 # 4abc <_sk_callback_hsw+0x3cf> + .byte 196,98,125,24,5,62,28,0,0 // vbroadcastss 0x1c3e(%rip),%ymm8 # 4b28 <_sk_callback_hsw+0x3cf> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9 - .byte 196,98,125,24,21,189,27,0,0 // vbroadcastss 0x1bbd(%rip),%ymm10 # 4ac0 <_sk_callback_hsw+0x3d3> + .byte 196,98,125,24,21,41,28,0,0 // vbroadcastss 0x1c29(%rip),%ymm10 # 4b2c <_sk_callback_hsw+0x3d3> .byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10 .byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10 .byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10 @@ -11765,25 +11854,25 @@ _sk_load_4444_hsw: .byte 15,133,138,0,0,0 // jne 3054 <_sk_load_4444_hsw+0x98> .byte 196,193,122,111,4,122 // vmovdqu (%r10,%rdi,2),%xmm0 .byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3 - .byte 196,226,125,88,5,230,26,0,0 // vpbroadcastd 0x1ae6(%rip),%ymm0 # 4ac4 <_sk_callback_hsw+0x3d7> + .byte 196,226,125,88,5,82,27,0,0 // vpbroadcastd 0x1b52(%rip),%ymm0 # 4b30 <_sk_callback_hsw+0x3d7> .byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,217,26,0,0 // vbroadcastss 0x1ad9(%rip),%ymm1 # 4ac8 <_sk_callback_hsw+0x3db> + .byte 196,226,125,24,13,69,27,0,0 // vbroadcastss 0x1b45(%rip),%ymm1 # 4b34 <_sk_callback_hsw+0x3db> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,208,26,0,0 // vpbroadcastd 0x1ad0(%rip),%ymm1 # 4acc <_sk_callback_hsw+0x3df> + .byte 196,226,125,88,13,60,27,0,0 // vpbroadcastd 0x1b3c(%rip),%ymm1 # 4b38 <_sk_callback_hsw+0x3df> .byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,195,26,0,0 // vbroadcastss 0x1ac3(%rip),%ymm2 # 4ad0 <_sk_callback_hsw+0x3e3> + .byte 196,226,125,24,21,47,27,0,0 // vbroadcastss 0x1b2f(%rip),%ymm2 # 4b3c <_sk_callback_hsw+0x3e3> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,88,21,186,26,0,0 // vpbroadcastd 0x1aba(%rip),%ymm2 # 4ad4 <_sk_callback_hsw+0x3e7> + .byte 196,226,125,88,21,38,27,0,0 // vpbroadcastd 0x1b26(%rip),%ymm2 # 4b40 <_sk_callback_hsw+0x3e7> .byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,173,26,0,0 // vbroadcastss 0x1aad(%rip),%ymm8 # 4ad8 <_sk_callback_hsw+0x3eb> + .byte 196,98,125,24,5,25,27,0,0 // vbroadcastss 0x1b19(%rip),%ymm8 # 4b44 <_sk_callback_hsw+0x3eb> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,88,5,163,26,0,0 // vpbroadcastd 0x1aa3(%rip),%ymm8 # 4adc <_sk_callback_hsw+0x3ef> + .byte 196,98,125,88,5,15,27,0,0 // vpbroadcastd 0x1b0f(%rip),%ymm8 # 4b48 <_sk_callback_hsw+0x3ef> .byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,149,26,0,0 // vbroadcastss 0x1a95(%rip),%ymm8 # 4ae0 <_sk_callback_hsw+0x3f3> + .byte 196,98,125,24,5,1,27,0,0 // vbroadcastss 0x1b01(%rip),%ymm8 # 4b4c <_sk_callback_hsw+0x3f3> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11876,25 +11965,25 @@ _sk_gather_4444_hsw: .byte 65,15,183,4,88 // movzwl (%r8,%rbx,2),%eax .byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3 - .byte 196,226,125,88,5,77,25,0,0 // vpbroadcastd 0x194d(%rip),%ymm0 # 4ae4 <_sk_callback_hsw+0x3f7> + .byte 196,226,125,88,5,185,25,0,0 // vpbroadcastd 0x19b9(%rip),%ymm0 # 4b50 <_sk_callback_hsw+0x3f7> .byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,64,25,0,0 // vbroadcastss 0x1940(%rip),%ymm1 # 4ae8 <_sk_callback_hsw+0x3fb> + .byte 196,226,125,24,13,172,25,0,0 // vbroadcastss 0x19ac(%rip),%ymm1 # 4b54 <_sk_callback_hsw+0x3fb> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,55,25,0,0 // vpbroadcastd 0x1937(%rip),%ymm1 # 4aec <_sk_callback_hsw+0x3ff> + .byte 196,226,125,88,13,163,25,0,0 // vpbroadcastd 0x19a3(%rip),%ymm1 # 4b58 <_sk_callback_hsw+0x3ff> .byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,42,25,0,0 // vbroadcastss 0x192a(%rip),%ymm2 # 4af0 <_sk_callback_hsw+0x403> + .byte 196,226,125,24,21,150,25,0,0 // vbroadcastss 0x1996(%rip),%ymm2 # 4b5c <_sk_callback_hsw+0x403> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,88,21,33,25,0,0 // vpbroadcastd 0x1921(%rip),%ymm2 # 4af4 <_sk_callback_hsw+0x407> + .byte 196,226,125,88,21,141,25,0,0 // vpbroadcastd 0x198d(%rip),%ymm2 # 4b60 <_sk_callback_hsw+0x407> .byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,20,25,0,0 // vbroadcastss 0x1914(%rip),%ymm8 # 4af8 <_sk_callback_hsw+0x40b> + .byte 196,98,125,24,5,128,25,0,0 // vbroadcastss 0x1980(%rip),%ymm8 # 4b64 <_sk_callback_hsw+0x40b> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,88,5,10,25,0,0 // vpbroadcastd 0x190a(%rip),%ymm8 # 4afc <_sk_callback_hsw+0x40f> + .byte 196,98,125,88,5,118,25,0,0 // vpbroadcastd 0x1976(%rip),%ymm8 # 4b68 <_sk_callback_hsw+0x40f> .byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,252,24,0,0 // vbroadcastss 0x18fc(%rip),%ymm8 # 4b00 <_sk_callback_hsw+0x413> + .byte 196,98,125,24,5,104,25,0,0 // vbroadcastss 0x1968(%rip),%ymm8 # 4b6c <_sk_callback_hsw+0x413> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -11909,7 +11998,7 @@ FUNCTION(_sk_store_4444_hsw) _sk_store_4444_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 196,98,125,24,5,226,24,0,0 // vbroadcastss 0x18e2(%rip),%ymm8 # 4b04 <_sk_callback_hsw+0x417> + .byte 196,98,125,24,5,78,25,0,0 // vbroadcastss 0x194e(%rip),%ymm8 # 4b70 <_sk_callback_hsw+0x417> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9 @@ -11985,14 +12074,14 @@ _sk_load_8888_hsw: .byte 77,133,192 // test %r8,%r8 .byte 117,88 // jne 336d <_sk_load_8888_hsw+0x6d> .byte 196,193,124,16,25 // vmovups (%r9),%ymm3 - .byte 197,228,84,5,158,25,0,0 // vandps 0x199e(%rip),%ymm3,%ymm0 # 4cc0 <_sk_callback_hsw+0x5d3> + .byte 197,228,84,5,30,26,0,0 // vandps 0x1a1e(%rip),%ymm3,%ymm0 # 4d40 <_sk_callback_hsw+0x5e7> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,217,23,0,0 // vbroadcastss 0x17d9(%rip),%ymm8 # 4b08 <_sk_callback_hsw+0x41b> + .byte 196,98,125,24,5,69,24,0,0 // vbroadcastss 0x1845(%rip),%ymm8 # 4b74 <_sk_callback_hsw+0x41b> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,226,101,0,13,163,25,0,0 // vpshufb 0x19a3(%rip),%ymm3,%ymm1 # 4ce0 <_sk_callback_hsw+0x5f3> + .byte 196,226,101,0,13,35,26,0,0 // vpshufb 0x1a23(%rip),%ymm3,%ymm1 # 4d60 <_sk_callback_hsw+0x607> .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,226,101,0,21,177,25,0,0 // vpshufb 0x19b1(%rip),%ymm3,%ymm2 # 4d00 <_sk_callback_hsw+0x613> + .byte 196,226,101,0,21,49,26,0,0 // vpshufb 0x1a31(%rip),%ymm3,%ymm2 # 4d80 <_sk_callback_hsw+0x627> .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -12024,14 +12113,14 @@ _sk_gather_8888_hsw: .byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,194,117,144,28,128 // vpgatherdd %ymm1,(%r8,%ymm0,4),%ymm3 - .byte 197,229,219,5,95,25,0,0 // vpand 0x195f(%rip),%ymm3,%ymm0 # 4d20 <_sk_callback_hsw+0x633> + .byte 197,229,219,5,223,25,0,0 // vpand 0x19df(%rip),%ymm3,%ymm0 # 4da0 <_sk_callback_hsw+0x647> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,62,23,0,0 // vbroadcastss 0x173e(%rip),%ymm8 # 4b0c <_sk_callback_hsw+0x41f> + .byte 196,98,125,24,5,170,23,0,0 // vbroadcastss 0x17aa(%rip),%ymm8 # 4b78 <_sk_callback_hsw+0x41f> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,226,101,0,13,100,25,0,0 // vpshufb 0x1964(%rip),%ymm3,%ymm1 # 4d40 <_sk_callback_hsw+0x653> + .byte 196,226,101,0,13,228,25,0,0 // vpshufb 0x19e4(%rip),%ymm3,%ymm1 # 4dc0 <_sk_callback_hsw+0x667> .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,226,101,0,21,114,25,0,0 // vpshufb 0x1972(%rip),%ymm3,%ymm2 # 4d60 <_sk_callback_hsw+0x673> + .byte 196,226,101,0,21,242,25,0,0 // vpshufb 0x19f2(%rip),%ymm3,%ymm2 # 4de0 <_sk_callback_hsw+0x687> .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -12048,7 +12137,7 @@ _sk_store_8888_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9 .byte 76,3,8 // add (%rax),%r9 - .byte 196,98,125,24,5,238,22,0,0 // vbroadcastss 0x16ee(%rip),%ymm8 # 4b10 <_sk_callback_hsw+0x423> + .byte 196,98,125,24,5,90,23,0,0 // vbroadcastss 0x175a(%rip),%ymm8 # 4b7c <_sk_callback_hsw+0x423> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10 @@ -12245,7 +12334,7 @@ _sk_load_u16_be_hsw: .byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0 .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,21,229,19,0,0 // vbroadcastss 0x13e5(%rip),%ymm10 # 4b14 <_sk_callback_hsw+0x427> + .byte 196,98,125,24,21,81,20,0,0 // vbroadcastss 0x1451(%rip),%ymm10 # 4b80 <_sk_callback_hsw+0x427> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -12329,7 +12418,7 @@ _sk_load_rgb_u16_be_hsw: .byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0 .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,21,118,18,0,0 // vbroadcastss 0x1276(%rip),%ymm10 # 4b18 <_sk_callback_hsw+0x42b> + .byte 196,98,125,24,21,226,18,0,0 // vbroadcastss 0x12e2(%rip),%ymm10 # 4b84 <_sk_callback_hsw+0x42b> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -12346,7 +12435,7 @@ _sk_load_rgb_u16_be_hsw: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,42,18,0,0 // vbroadcastss 0x122a(%rip),%ymm3 # 4b1c <_sk_callback_hsw+0x42f> + .byte 196,226,125,24,29,150,18,0,0 // vbroadcastss 0x1296(%rip),%ymm3 # 4b88 <_sk_callback_hsw+0x42f> .byte 255,224 // jmpq *%rax .byte 196,193,121,110,4,64 // vmovd (%r8,%rax,2),%xmm0 .byte 196,193,121,196,68,64,4,2 // vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm0 @@ -12389,7 +12478,7 @@ _sk_store_u16_be_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,0 // mov (%rax),%r8 .byte 72,141,4,189,0,0,0,0 // lea 0x0(,%rdi,4),%rax - .byte 196,98,125,24,5,103,17,0,0 // vbroadcastss 0x1167(%rip),%ymm8 # 4b20 <_sk_callback_hsw+0x433> + .byte 196,98,125,24,5,211,17,0,0 // vbroadcastss 0x11d3(%rip),%ymm8 # 4b8c <_sk_callback_hsw+0x433> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10 @@ -12645,15 +12734,53 @@ _sk_mirror_y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax +HIDDEN _sk_clamp_x_1_hsw +.globl _sk_clamp_x_1_hsw +FUNCTION(_sk_clamp_x_1_hsw) +_sk_clamp_x_1_hsw: + .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 + .byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0 + .byte 196,98,125,24,5,26,14,0,0 // vbroadcastss 0xe1a(%rip),%ymm8 # 4b90 <_sk_callback_hsw+0x437> + .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + +HIDDEN _sk_repeat_x_1_hsw +.globl _sk_repeat_x_1_hsw +FUNCTION(_sk_repeat_x_1_hsw) +_sk_repeat_x_1_hsw: + .byte 196,99,125,8,192,1 // vroundps $0x1,%ymm0,%ymm8 + .byte 196,193,124,92,192 // vsubps %ymm8,%ymm0,%ymm0 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + +HIDDEN _sk_mirror_x_1_hsw +.globl _sk_mirror_x_1_hsw +FUNCTION(_sk_mirror_x_1_hsw) +_sk_mirror_x_1_hsw: + .byte 196,98,125,24,5,253,13,0,0 // vbroadcastss 0xdfd(%rip),%ymm8 # 4b94 <_sk_callback_hsw+0x43b> + .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 + .byte 196,98,125,24,13,243,13,0,0 // vbroadcastss 0xdf3(%rip),%ymm9 # 4b98 <_sk_callback_hsw+0x43f> + .byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9 + .byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9 + .byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9 + .byte 196,193,124,92,193 // vsubps %ymm9,%ymm0,%ymm0 + .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 + .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 + .byte 197,60,92,192 // vsubps %ymm0,%ymm8,%ymm8 + .byte 197,188,84,192 // vandps %ymm0,%ymm8,%ymm0 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + HIDDEN _sk_luminance_to_alpha_hsw .globl _sk_luminance_to_alpha_hsw FUNCTION(_sk_luminance_to_alpha_hsw) _sk_luminance_to_alpha_hsw: - .byte 196,226,125,24,29,183,13,0,0 // vbroadcastss 0xdb7(%rip),%ymm3 # 4b24 <_sk_callback_hsw+0x437> - .byte 196,98,125,24,5,178,13,0,0 // vbroadcastss 0xdb2(%rip),%ymm8 # 4b28 <_sk_callback_hsw+0x43b> + .byte 196,226,125,24,29,195,13,0,0 // vbroadcastss 0xdc3(%rip),%ymm3 # 4b9c <_sk_callback_hsw+0x443> + .byte 196,98,125,24,5,190,13,0,0 // vbroadcastss 0xdbe(%rip),%ymm8 # 4ba0 <_sk_callback_hsw+0x447> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 .byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1 - .byte 196,226,125,24,29,163,13,0,0 // vbroadcastss 0xda3(%rip),%ymm3 # 4b2c <_sk_callback_hsw+0x43f> + .byte 196,226,125,24,29,175,13,0,0 // vbroadcastss 0xdaf(%rip),%ymm3 # 4ba4 <_sk_callback_hsw+0x44b> .byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -12826,9 +12953,9 @@ _sk_evenly_spaced_gradient_hsw: .byte 76,139,64,8 // mov 0x8(%rax),%r8 .byte 77,137,202 // mov %r9,%r10 .byte 73,255,202 // dec %r10 - .byte 120,7 // js 4041 <_sk_evenly_spaced_gradient_hsw+0x18> + .byte 120,7 // js 40ad <_sk_evenly_spaced_gradient_hsw+0x18> .byte 196,193,242,42,202 // vcvtsi2ss %r10,%xmm1,%xmm1 - .byte 235,22 // jmp 4057 <_sk_evenly_spaced_gradient_hsw+0x2e> + .byte 235,22 // jmp 40c3 <_sk_evenly_spaced_gradient_hsw+0x2e> .byte 77,137,211 // mov %r10,%r11 .byte 73,209,235 // shr %r11 .byte 65,131,226,1 // and $0x1,%r10d @@ -12839,7 +12966,7 @@ _sk_evenly_spaced_gradient_hsw: .byte 197,244,89,200 // vmulps %ymm0,%ymm1,%ymm1 .byte 197,126,91,217 // vcvttps2dq %ymm1,%ymm11 .byte 73,131,249,8 // cmp $0x8,%r9 - .byte 119,70 // ja 40b0 <_sk_evenly_spaced_gradient_hsw+0x87> + .byte 119,70 // ja 411c <_sk_evenly_spaced_gradient_hsw+0x87> .byte 196,66,37,22,0 // vpermps (%r8),%ymm11,%ymm8 .byte 76,139,64,40 // mov 0x28(%rax),%r8 .byte 196,66,37,22,8 // vpermps (%r8),%ymm11,%ymm9 @@ -12855,7 +12982,7 @@ _sk_evenly_spaced_gradient_hsw: .byte 196,194,37,22,24 // vpermps (%r8),%ymm11,%ymm3 .byte 72,139,64,64 // mov 0x40(%rax),%rax .byte 196,98,37,22,40 // vpermps (%rax),%ymm11,%ymm13 - .byte 235,110 // jmp 411e <_sk_evenly_spaced_gradient_hsw+0xf5> + .byte 235,110 // jmp 418a <_sk_evenly_spaced_gradient_hsw+0xf5> .byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,2,117,146,4,152 // vgatherdps %ymm1,(%r8,%ymm11,4),%ymm8 @@ -12894,11 +13021,11 @@ _sk_gradient_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,0 // mov (%rax),%r8 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 15,134,180,0,0,0 // jbe 41fd <_sk_gradient_hsw+0xc3> + .byte 15,134,180,0,0,0 // jbe 4269 <_sk_gradient_hsw+0xc3> .byte 76,139,72,72 // mov 0x48(%rax),%r9 .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 65,186,1,0,0,0 // mov $0x1,%r10d - .byte 196,226,125,24,21,208,9,0,0 // vbroadcastss 0x9d0(%rip),%ymm2 # 4b30 <_sk_callback_hsw+0x443> + .byte 196,226,125,24,21,220,9,0,0 // vbroadcastss 0x9dc(%rip),%ymm2 # 4ba8 <_sk_callback_hsw+0x44f> .byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9 .byte 196,130,125,24,28,145 // vbroadcastss (%r9,%r10,4),%ymm3 .byte 197,228,194,216,2 // vcmpleps %ymm0,%ymm3,%ymm3 @@ -12906,10 +13033,10 @@ _sk_gradient_hsw: .byte 196,65,101,254,201 // vpaddd %ymm9,%ymm3,%ymm9 .byte 73,255,194 // inc %r10 .byte 77,57,208 // cmp %r10,%r8 - .byte 117,226 // jne 4165 <_sk_gradient_hsw+0x2b> + .byte 117,226 // jne 41d1 <_sk_gradient_hsw+0x2b> .byte 76,139,72,8 // mov 0x8(%rax),%r9 .byte 73,131,248,8 // cmp $0x8,%r8 - .byte 118,121 // jbe 4206 <_sk_gradient_hsw+0xcc> + .byte 118,121 // jbe 4272 <_sk_gradient_hsw+0xcc> .byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,2,117,146,4,137 // vgatherdps %ymm1,(%r9,%ymm9,4),%ymm8 @@ -12933,7 +13060,7 @@ _sk_gradient_hsw: .byte 196,130,21,146,28,136 // vgatherdps %ymm13,(%r8,%ymm9,4),%ymm3 .byte 72,139,64,64 // mov 0x40(%rax),%rax .byte 196,34,13,146,44,136 // vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13 - .byte 235,77 // jmp 424a <_sk_gradient_hsw+0x110> + .byte 235,77 // jmp 42b6 <_sk_gradient_hsw+0x110> .byte 76,139,72,8 // mov 0x8(%rax),%r9 .byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9 .byte 196,66,53,22,1 // vpermps (%r9),%ymm9,%ymm8 @@ -12993,24 +13120,24 @@ _sk_xy_to_unit_angle_hsw: .byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12 .byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11 .byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12 - .byte 196,98,125,24,45,79,8,0,0 // vbroadcastss 0x84f(%rip),%ymm13 # 4b34 <_sk_callback_hsw+0x447> - .byte 196,98,125,24,53,74,8,0,0 // vbroadcastss 0x84a(%rip),%ymm14 # 4b38 <_sk_callback_hsw+0x44b> + .byte 196,98,125,24,45,91,8,0,0 // vbroadcastss 0x85b(%rip),%ymm13 # 4bac <_sk_callback_hsw+0x453> + .byte 196,98,125,24,53,86,8,0,0 // vbroadcastss 0x856(%rip),%ymm14 # 4bb0 <_sk_callback_hsw+0x457> .byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14 - .byte 196,98,125,24,45,64,8,0,0 // vbroadcastss 0x840(%rip),%ymm13 # 4b3c <_sk_callback_hsw+0x44f> + .byte 196,98,125,24,45,76,8,0,0 // vbroadcastss 0x84c(%rip),%ymm13 # 4bb4 <_sk_callback_hsw+0x45b> .byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13 - .byte 196,98,125,24,53,54,8,0,0 // vbroadcastss 0x836(%rip),%ymm14 # 4b40 <_sk_callback_hsw+0x453> + .byte 196,98,125,24,53,66,8,0,0 // vbroadcastss 0x842(%rip),%ymm14 # 4bb8 <_sk_callback_hsw+0x45f> .byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14 .byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11 .byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,33,8,0,0 // vbroadcastss 0x821(%rip),%ymm10 # 4b44 <_sk_callback_hsw+0x457> + .byte 196,98,125,24,21,45,8,0,0 // vbroadcastss 0x82d(%rip),%ymm10 # 4bbc <_sk_callback_hsw+0x463> .byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10 .byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9 .byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,21,11,8,0,0 // vbroadcastss 0x80b(%rip),%ymm10 # 4b48 <_sk_callback_hsw+0x45b> + .byte 196,98,125,24,21,23,8,0,0 // vbroadcastss 0x817(%rip),%ymm10 # 4bc0 <_sk_callback_hsw+0x467> .byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9 - .byte 196,98,125,24,21,245,7,0,0 // vbroadcastss 0x7f5(%rip),%ymm10 # 4b4c <_sk_callback_hsw+0x45f> + .byte 196,98,125,24,21,1,8,0,0 // vbroadcastss 0x801(%rip),%ymm10 # 4bc4 <_sk_callback_hsw+0x46b> .byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10 .byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0 .byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9 @@ -13033,7 +13160,7 @@ HIDDEN _sk_save_xy_hsw FUNCTION(_sk_save_xy_hsw) _sk_save_xy_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,194,7,0,0 // vbroadcastss 0x7c2(%rip),%ymm8 # 4b50 <_sk_callback_hsw+0x463> + .byte 196,98,125,24,5,206,7,0,0 // vbroadcastss 0x7ce(%rip),%ymm8 # 4bc8 <_sk_callback_hsw+0x46f> .byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9 .byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 @@ -13067,9 +13194,9 @@ HIDDEN _sk_bilinear_nx_hsw FUNCTION(_sk_bilinear_nx_hsw) _sk_bilinear_nx_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,86,7,0,0 // vbroadcastss 0x756(%rip),%ymm0 # 4b54 <_sk_callback_hsw+0x467> + .byte 196,226,125,24,5,98,7,0,0 // vbroadcastss 0x762(%rip),%ymm0 # 4bcc <_sk_callback_hsw+0x473> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,77,7,0,0 // vbroadcastss 0x74d(%rip),%ymm8 # 4b58 <_sk_callback_hsw+0x46b> + .byte 196,98,125,24,5,89,7,0,0 // vbroadcastss 0x759(%rip),%ymm8 # 4bd0 <_sk_callback_hsw+0x477> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -13080,7 +13207,7 @@ HIDDEN _sk_bilinear_px_hsw FUNCTION(_sk_bilinear_px_hsw) _sk_bilinear_px_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,53,7,0,0 // vbroadcastss 0x735(%rip),%ymm0 # 4b5c <_sk_callback_hsw+0x46f> + .byte 196,226,125,24,5,65,7,0,0 // vbroadcastss 0x741(%rip),%ymm0 # 4bd4 <_sk_callback_hsw+0x47b> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -13092,9 +13219,9 @@ HIDDEN _sk_bilinear_ny_hsw FUNCTION(_sk_bilinear_ny_hsw) _sk_bilinear_ny_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,25,7,0,0 // vbroadcastss 0x719(%rip),%ymm1 # 4b60 <_sk_callback_hsw+0x473> + .byte 196,226,125,24,13,37,7,0,0 // vbroadcastss 0x725(%rip),%ymm1 # 4bd8 <_sk_callback_hsw+0x47f> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,15,7,0,0 // vbroadcastss 0x70f(%rip),%ymm8 # 4b64 <_sk_callback_hsw+0x477> + .byte 196,98,125,24,5,27,7,0,0 // vbroadcastss 0x71b(%rip),%ymm8 # 4bdc <_sk_callback_hsw+0x483> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -13105,7 +13232,7 @@ HIDDEN _sk_bilinear_py_hsw FUNCTION(_sk_bilinear_py_hsw) _sk_bilinear_py_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,247,6,0,0 // vbroadcastss 0x6f7(%rip),%ymm1 # 4b68 <_sk_callback_hsw+0x47b> + .byte 196,226,125,24,13,3,7,0,0 // vbroadcastss 0x703(%rip),%ymm1 # 4be0 <_sk_callback_hsw+0x487> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -13117,13 +13244,13 @@ HIDDEN _sk_bicubic_n3x_hsw FUNCTION(_sk_bicubic_n3x_hsw) _sk_bicubic_n3x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,218,6,0,0 // vbroadcastss 0x6da(%rip),%ymm0 # 4b6c <_sk_callback_hsw+0x47f> + .byte 196,226,125,24,5,230,6,0,0 // vbroadcastss 0x6e6(%rip),%ymm0 # 4be4 <_sk_callback_hsw+0x48b> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,209,6,0,0 // vbroadcastss 0x6d1(%rip),%ymm8 # 4b70 <_sk_callback_hsw+0x483> + .byte 196,98,125,24,5,221,6,0,0 // vbroadcastss 0x6dd(%rip),%ymm8 # 4be8 <_sk_callback_hsw+0x48f> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,194,6,0,0 // vbroadcastss 0x6c2(%rip),%ymm10 # 4b74 <_sk_callback_hsw+0x487> - .byte 196,98,125,24,29,189,6,0,0 // vbroadcastss 0x6bd(%rip),%ymm11 # 4b78 <_sk_callback_hsw+0x48b> + .byte 196,98,125,24,21,206,6,0,0 // vbroadcastss 0x6ce(%rip),%ymm10 # 4bec <_sk_callback_hsw+0x493> + .byte 196,98,125,24,29,201,6,0,0 // vbroadcastss 0x6c9(%rip),%ymm11 # 4bf0 <_sk_callback_hsw+0x497> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -13135,16 +13262,16 @@ HIDDEN _sk_bicubic_n1x_hsw FUNCTION(_sk_bicubic_n1x_hsw) _sk_bicubic_n1x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,160,6,0,0 // vbroadcastss 0x6a0(%rip),%ymm0 # 4b7c <_sk_callback_hsw+0x48f> + .byte 196,226,125,24,5,172,6,0,0 // vbroadcastss 0x6ac(%rip),%ymm0 # 4bf4 <_sk_callback_hsw+0x49b> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,151,6,0,0 // vbroadcastss 0x697(%rip),%ymm8 # 4b80 <_sk_callback_hsw+0x493> + .byte 196,98,125,24,5,163,6,0,0 // vbroadcastss 0x6a3(%rip),%ymm8 # 4bf8 <_sk_callback_hsw+0x49f> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,141,6,0,0 // vbroadcastss 0x68d(%rip),%ymm9 # 4b84 <_sk_callback_hsw+0x497> - .byte 196,98,125,24,21,136,6,0,0 // vbroadcastss 0x688(%rip),%ymm10 # 4b88 <_sk_callback_hsw+0x49b> + .byte 196,98,125,24,13,153,6,0,0 // vbroadcastss 0x699(%rip),%ymm9 # 4bfc <_sk_callback_hsw+0x4a3> + .byte 196,98,125,24,21,148,6,0,0 // vbroadcastss 0x694(%rip),%ymm10 # 4c00 <_sk_callback_hsw+0x4a7> .byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,13,126,6,0,0 // vbroadcastss 0x67e(%rip),%ymm9 # 4b8c <_sk_callback_hsw+0x49f> + .byte 196,98,125,24,13,138,6,0,0 // vbroadcastss 0x68a(%rip),%ymm9 # 4c04 <_sk_callback_hsw+0x4ab> .byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9 - .byte 196,98,125,24,21,116,6,0,0 // vbroadcastss 0x674(%rip),%ymm10 # 4b90 <_sk_callback_hsw+0x4a3> + .byte 196,98,125,24,21,128,6,0,0 // vbroadcastss 0x680(%rip),%ymm10 # 4c08 <_sk_callback_hsw+0x4af> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -13155,14 +13282,14 @@ HIDDEN _sk_bicubic_p1x_hsw FUNCTION(_sk_bicubic_p1x_hsw) _sk_bicubic_p1x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,92,6,0,0 // vbroadcastss 0x65c(%rip),%ymm8 # 4b94 <_sk_callback_hsw+0x4a7> + .byte 196,98,125,24,5,104,6,0,0 // vbroadcastss 0x668(%rip),%ymm8 # 4c0c <_sk_callback_hsw+0x4b3> .byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0 .byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9 - .byte 196,98,125,24,21,78,6,0,0 // vbroadcastss 0x64e(%rip),%ymm10 # 4b98 <_sk_callback_hsw+0x4ab> - .byte 196,98,125,24,29,73,6,0,0 // vbroadcastss 0x649(%rip),%ymm11 # 4b9c <_sk_callback_hsw+0x4af> + .byte 196,98,125,24,21,90,6,0,0 // vbroadcastss 0x65a(%rip),%ymm10 # 4c10 <_sk_callback_hsw+0x4b7> + .byte 196,98,125,24,29,85,6,0,0 // vbroadcastss 0x655(%rip),%ymm11 # 4c14 <_sk_callback_hsw+0x4bb> .byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11 .byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11 - .byte 196,98,125,24,5,58,6,0,0 // vbroadcastss 0x63a(%rip),%ymm8 # 4ba0 <_sk_callback_hsw+0x4b3> + .byte 196,98,125,24,5,70,6,0,0 // vbroadcastss 0x646(%rip),%ymm8 # 4c18 <_sk_callback_hsw+0x4bf> .byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -13173,12 +13300,12 @@ HIDDEN _sk_bicubic_p3x_hsw FUNCTION(_sk_bicubic_p3x_hsw) _sk_bicubic_p3x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,34,6,0,0 // vbroadcastss 0x622(%rip),%ymm0 # 4ba4 <_sk_callback_hsw+0x4b7> + .byte 196,226,125,24,5,46,6,0,0 // vbroadcastss 0x62e(%rip),%ymm0 # 4c1c <_sk_callback_hsw+0x4c3> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,15,6,0,0 // vbroadcastss 0x60f(%rip),%ymm10 # 4ba8 <_sk_callback_hsw+0x4bb> - .byte 196,98,125,24,29,10,6,0,0 // vbroadcastss 0x60a(%rip),%ymm11 # 4bac <_sk_callback_hsw+0x4bf> + .byte 196,98,125,24,21,27,6,0,0 // vbroadcastss 0x61b(%rip),%ymm10 # 4c20 <_sk_callback_hsw+0x4c7> + .byte 196,98,125,24,29,22,6,0,0 // vbroadcastss 0x616(%rip),%ymm11 # 4c24 <_sk_callback_hsw+0x4cb> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -13190,13 +13317,13 @@ HIDDEN _sk_bicubic_n3y_hsw FUNCTION(_sk_bicubic_n3y_hsw) _sk_bicubic_n3y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,237,5,0,0 // vbroadcastss 0x5ed(%rip),%ymm1 # 4bb0 <_sk_callback_hsw+0x4c3> + .byte 196,226,125,24,13,249,5,0,0 // vbroadcastss 0x5f9(%rip),%ymm1 # 4c28 <_sk_callback_hsw+0x4cf> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,227,5,0,0 // vbroadcastss 0x5e3(%rip),%ymm8 # 4bb4 <_sk_callback_hsw+0x4c7> + .byte 196,98,125,24,5,239,5,0,0 // vbroadcastss 0x5ef(%rip),%ymm8 # 4c2c <_sk_callback_hsw+0x4d3> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,212,5,0,0 // vbroadcastss 0x5d4(%rip),%ymm10 # 4bb8 <_sk_callback_hsw+0x4cb> - .byte 196,98,125,24,29,207,5,0,0 // vbroadcastss 0x5cf(%rip),%ymm11 # 4bbc <_sk_callback_hsw+0x4cf> + .byte 196,98,125,24,21,224,5,0,0 // vbroadcastss 0x5e0(%rip),%ymm10 # 4c30 <_sk_callback_hsw+0x4d7> + .byte 196,98,125,24,29,219,5,0,0 // vbroadcastss 0x5db(%rip),%ymm11 # 4c34 <_sk_callback_hsw+0x4db> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -13208,16 +13335,16 @@ HIDDEN _sk_bicubic_n1y_hsw FUNCTION(_sk_bicubic_n1y_hsw) _sk_bicubic_n1y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,178,5,0,0 // vbroadcastss 0x5b2(%rip),%ymm1 # 4bc0 <_sk_callback_hsw+0x4d3> + .byte 196,226,125,24,13,190,5,0,0 // vbroadcastss 0x5be(%rip),%ymm1 # 4c38 <_sk_callback_hsw+0x4df> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,168,5,0,0 // vbroadcastss 0x5a8(%rip),%ymm8 # 4bc4 <_sk_callback_hsw+0x4d7> + .byte 196,98,125,24,5,180,5,0,0 // vbroadcastss 0x5b4(%rip),%ymm8 # 4c3c <_sk_callback_hsw+0x4e3> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,158,5,0,0 // vbroadcastss 0x59e(%rip),%ymm9 # 4bc8 <_sk_callback_hsw+0x4db> - .byte 196,98,125,24,21,153,5,0,0 // vbroadcastss 0x599(%rip),%ymm10 # 4bcc <_sk_callback_hsw+0x4df> + .byte 196,98,125,24,13,170,5,0,0 // vbroadcastss 0x5aa(%rip),%ymm9 # 4c40 <_sk_callback_hsw+0x4e7> + .byte 196,98,125,24,21,165,5,0,0 // vbroadcastss 0x5a5(%rip),%ymm10 # 4c44 <_sk_callback_hsw+0x4eb> .byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,13,143,5,0,0 // vbroadcastss 0x58f(%rip),%ymm9 # 4bd0 <_sk_callback_hsw+0x4e3> + .byte 196,98,125,24,13,155,5,0,0 // vbroadcastss 0x59b(%rip),%ymm9 # 4c48 <_sk_callback_hsw+0x4ef> .byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9 - .byte 196,98,125,24,21,133,5,0,0 // vbroadcastss 0x585(%rip),%ymm10 # 4bd4 <_sk_callback_hsw+0x4e7> + .byte 196,98,125,24,21,145,5,0,0 // vbroadcastss 0x591(%rip),%ymm10 # 4c4c <_sk_callback_hsw+0x4f3> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -13228,14 +13355,14 @@ HIDDEN _sk_bicubic_p1y_hsw FUNCTION(_sk_bicubic_p1y_hsw) _sk_bicubic_p1y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,109,5,0,0 // vbroadcastss 0x56d(%rip),%ymm8 # 4bd8 <_sk_callback_hsw+0x4eb> + .byte 196,98,125,24,5,121,5,0,0 // vbroadcastss 0x579(%rip),%ymm8 # 4c50 <_sk_callback_hsw+0x4f7> .byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1 .byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9 - .byte 196,98,125,24,21,94,5,0,0 // vbroadcastss 0x55e(%rip),%ymm10 # 4bdc <_sk_callback_hsw+0x4ef> - .byte 196,98,125,24,29,89,5,0,0 // vbroadcastss 0x559(%rip),%ymm11 # 4be0 <_sk_callback_hsw+0x4f3> + .byte 196,98,125,24,21,106,5,0,0 // vbroadcastss 0x56a(%rip),%ymm10 # 4c54 <_sk_callback_hsw+0x4fb> + .byte 196,98,125,24,29,101,5,0,0 // vbroadcastss 0x565(%rip),%ymm11 # 4c58 <_sk_callback_hsw+0x4ff> .byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11 .byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11 - .byte 196,98,125,24,5,74,5,0,0 // vbroadcastss 0x54a(%rip),%ymm8 # 4be4 <_sk_callback_hsw+0x4f7> + .byte 196,98,125,24,5,86,5,0,0 // vbroadcastss 0x556(%rip),%ymm8 # 4c5c <_sk_callback_hsw+0x503> .byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -13246,12 +13373,12 @@ HIDDEN _sk_bicubic_p3y_hsw FUNCTION(_sk_bicubic_p3y_hsw) _sk_bicubic_p3y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,50,5,0,0 // vbroadcastss 0x532(%rip),%ymm1 # 4be8 <_sk_callback_hsw+0x4fb> + .byte 196,226,125,24,13,62,5,0,0 // vbroadcastss 0x53e(%rip),%ymm1 # 4c60 <_sk_callback_hsw+0x507> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,30,5,0,0 // vbroadcastss 0x51e(%rip),%ymm10 # 4bec <_sk_callback_hsw+0x4ff> - .byte 196,98,125,24,29,25,5,0,0 // vbroadcastss 0x519(%rip),%ymm11 # 4bf0 <_sk_callback_hsw+0x503> + .byte 196,98,125,24,21,42,5,0,0 // vbroadcastss 0x52a(%rip),%ymm10 # 4c64 <_sk_callback_hsw+0x50b> + .byte 196,98,125,24,29,37,5,0,0 // vbroadcastss 0x525(%rip),%ymm11 # 4c68 <_sk_callback_hsw+0x50f> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -13375,25 +13502,25 @@ BALIGN4 .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 48c5 <.literal4+0xb1> + .byte 71,225,61 // rex.RXB loope 4931 <.literal4+0xb1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 48d5 <.literal4+0xc1> + .byte 71,225,61 // rex.RXB loope 4941 <.literal4+0xc1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 48e5 <.literal4+0xd1> + .byte 71,225,61 // rex.RXB loope 4951 <.literal4+0xd1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 48f5 <.literal4+0xe1> + .byte 71,225,61 // rex.RXB loope 4961 <.literal4+0xe1> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -13440,7 +13567,7 @@ BALIGN4 .byte 190,129,128,128,59 // mov $0x3b808081,%esi .byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 4945 <.literal4+0x131> + .byte 224,7 // loopne 49b1 <.literal4+0x131> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -13456,10 +13583,10 @@ BALIGN4 .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) .byte 0,52,255 // add %dh,(%rdi,%rdi,8) .byte 255 // (bad) - .byte 127,0 // jg 496c <.literal4+0x158> + .byte 127,0 // jg 49d8 <.literal4+0x158> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 49e5 <.literal4+0x1d1> + .byte 119,115 // ja 4a51 <.literal4+0x1d1> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -13473,10 +13600,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 49a0 <.literal4+0x18c> + .byte 127,0 // jg 4a0c <.literal4+0x18c> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4a19 <.literal4+0x205> + .byte 119,115 // ja 4a85 <.literal4+0x205> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -13490,10 +13617,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 49d4 <.literal4+0x1c0> + .byte 127,0 // jg 4a40 <.literal4+0x1c0> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4a4d <.literal4+0x239> + .byte 119,115 // ja 4ab9 <.literal4+0x239> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -13507,10 +13634,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 4a08 <.literal4+0x1f4> + .byte 127,0 // jg 4a74 <.literal4+0x1f4> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4a81 <.literal4+0x26d> + .byte 119,115 // ja 4aed <.literal4+0x26d> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -13523,7 +13650,7 @@ BALIGN4 .byte 0,75,0 // add %cl,0x0(%rbx) .byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax) .byte 66,0,0 // rex.X add %al,(%rax) - .byte 127,67 // jg 4a7f <.literal4+0x26b> + .byte 127,67 // jg 4aeb <.literal4+0x26b> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -13535,10 +13662,10 @@ BALIGN4 .byte 190,80,128,3,62 // mov $0x3e038050,%esi .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 4a9f <.literal4+0x28b> + .byte 118,63 // jbe 4b0b <.literal4+0x28b> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) - .byte 127,67 // jg 4ab3 <.literal4+0x29f> + .byte 127,67 // jg 4b1f <.literal4+0x29f> .byte 129,128,128,59,0,0,128,63,129,128 // addl $0x80813f80,0x3b80(%rax) .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,128,63,129,128,128 // add %al,-0x7f7f7ec1(%rax) @@ -13547,7 +13674,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 4a95 <.literal4+0x281> + .byte 224,7 // loopne 4b01 <.literal4+0x281> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -13559,7 +13686,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 4ab1 <.literal4+0x29d> + .byte 224,7 // loopne 4b1d <.literal4+0x29d> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -13570,7 +13697,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 4b06 <.literal4+0x2f2> + .byte 124,66 // jl 4b72 <.literal4+0x2f2> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax) @@ -13588,9 +13715,9 @@ BALIGN4 .byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax) .byte 0,0 // add %al,(%rax) .byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax) - .byte 112,65 // jo 4b49 <.literal4+0x335> + .byte 112,65 // jo 4bb5 <.literal4+0x335> .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) - .byte 127,67 // jg 4b57 <.literal4+0x343> + .byte 127,67 // jg 4bc3 <.literal4+0x343> .byte 128,0,128 // addb $0x80,(%rax) .byte 55 // (bad) .byte 128,0,128 // addb $0x80,(%rax) @@ -13598,7 +13725,11 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 255 // (bad) - .byte 127,71 // jg 4b6b <.literal4+0x357> + .byte 127,71 // jg 4bd7 <.literal4+0x357> + .byte 0,0 // add %al,(%rax) + .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,191,0,0,0 // add %al,0xbf(%rax) + .byte 63 // (bad) .byte 208 // (bad) .byte 179,89 // mov $0x59,%bl .byte 62,89 // ds pop %rcx @@ -13698,16 +13829,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004c28 <_sk_callback_hsw+0xa00053b> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004ca8 <_sk_callback_hsw+0xa00054f> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004c30 <_sk_callback_hsw+0x12000543> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004cb0 <_sk_callback_hsw+0x12000557> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004c38 <_sk_callback_hsw+0x1a00054b> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004cb8 <_sk_callback_hsw+0x1a00055f> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004c40 <_sk_callback_hsw+0x3000553> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004cc0 <_sk_callback_hsw+0x3000567> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -13750,16 +13881,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004c88 <_sk_callback_hsw+0xa00059b> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004d08 <_sk_callback_hsw+0xa0005af> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004c90 <_sk_callback_hsw+0x120005a3> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004d10 <_sk_callback_hsw+0x120005b7> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004c98 <_sk_callback_hsw+0x1a0005ab> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004d18 <_sk_callback_hsw+0x1a0005bf> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004ca0 <_sk_callback_hsw+0x30005b3> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004d20 <_sk_callback_hsw+0x30005c7> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -13802,16 +13933,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004ce8 <_sk_callback_hsw+0xa0005fb> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004d68 <_sk_callback_hsw+0xa00060f> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004cf0 <_sk_callback_hsw+0x12000603> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004d70 <_sk_callback_hsw+0x12000617> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004cf8 <_sk_callback_hsw+0x1a00060b> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004d78 <_sk_callback_hsw+0x1a00061f> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004d00 <_sk_callback_hsw+0x3000613> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004d80 <_sk_callback_hsw+0x3000627> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -13854,16 +13985,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004d48 <_sk_callback_hsw+0xa00065b> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004dc8 <_sk_callback_hsw+0xa00066f> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004d50 <_sk_callback_hsw+0x12000663> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12004dd0 <_sk_callback_hsw+0x12000677> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004d58 <_sk_callback_hsw+0x1a00066b> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a004dd8 <_sk_callback_hsw+0x1a00067f> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004d60 <_sk_callback_hsw+0x3000673> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3004de0 <_sk_callback_hsw+0x3000687> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -13984,14 +14115,14 @@ _sk_seed_shader_avx: .byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,67,98,0,0 // vbroadcastss 0x6243(%rip),%ymm1 # 630c <_sk_callback_avx+0x125> + .byte 196,226,125,24,13,175,98,0,0 // vbroadcastss 0x62af(%rip),%ymm1 # 6378 <_sk_callback_avx+0x125> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,88,2 // vaddps (%rdx),%ymm0,%ymm0 .byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,21,39,98,0,0 // vbroadcastss 0x6227(%rip),%ymm2 # 6310 <_sk_callback_avx+0x129> + .byte 196,226,125,24,21,147,98,0,0 // vbroadcastss 0x6293(%rip),%ymm2 # 637c <_sk_callback_avx+0x129> .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 @@ -14014,7 +14145,7 @@ _sk_dither_avx: .byte 76,139,0 // mov (%rax),%r8 .byte 196,66,125,24,8 // vbroadcastss (%r8),%ymm9 .byte 196,65,60,87,209 // vxorps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,29,216,97,0,0 // vbroadcastss 0x61d8(%rip),%ymm11 # 6314 <_sk_callback_avx+0x12d> + .byte 196,98,125,24,29,68,98,0,0 // vbroadcastss 0x6244(%rip),%ymm11 # 6380 <_sk_callback_avx+0x12d> .byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9 .byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12 .byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9 @@ -14025,8 +14156,8 @@ _sk_dither_avx: .byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11 .byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11 .byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11 - .byte 196,98,125,24,37,153,97,0,0 // vbroadcastss 0x6199(%rip),%ymm12 # 6318 <_sk_callback_avx+0x131> - .byte 196,98,125,24,45,148,97,0,0 // vbroadcastss 0x6194(%rip),%ymm13 # 631c <_sk_callback_avx+0x135> + .byte 196,98,125,24,37,5,98,0,0 // vbroadcastss 0x6205(%rip),%ymm12 # 6384 <_sk_callback_avx+0x131> + .byte 196,98,125,24,45,0,98,0,0 // vbroadcastss 0x6200(%rip),%ymm13 # 6388 <_sk_callback_avx+0x135> .byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14 .byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15 .byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14 @@ -14053,9 +14184,9 @@ _sk_dither_avx: .byte 196,65,12,86,202 // vorps %ymm10,%ymm14,%ymm9 .byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,255,96,0,0 // vbroadcastss 0x60ff(%rip),%ymm9 # 6320 <_sk_callback_avx+0x139> + .byte 196,98,125,24,13,107,97,0,0 // vbroadcastss 0x616b(%rip),%ymm9 # 638c <_sk_callback_avx+0x139> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,245,96,0,0 // vbroadcastss 0x60f5(%rip),%ymm9 # 6324 <_sk_callback_avx+0x13d> + .byte 196,98,125,24,13,97,97,0,0 // vbroadcastss 0x6161(%rip),%ymm9 # 6390 <_sk_callback_avx+0x13d> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 196,98,125,24,72,8 // vbroadcastss 0x8(%rax),%ymm9 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 @@ -14124,7 +14255,7 @@ HIDDEN _sk_srcatop_avx FUNCTION(_sk_srcatop_avx) _sk_srcatop_avx: .byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0 - .byte 196,98,125,24,5,76,96,0,0 // vbroadcastss 0x604c(%rip),%ymm8 # 6328 <_sk_callback_avx+0x141> + .byte 196,98,125,24,5,184,96,0,0 // vbroadcastss 0x60b8(%rip),%ymm8 # 6394 <_sk_callback_avx+0x141> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -14145,7 +14276,7 @@ HIDDEN _sk_dstatop_avx FUNCTION(_sk_dstatop_avx) _sk_dstatop_avx: .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 - .byte 196,98,125,24,13,14,96,0,0 // vbroadcastss 0x600e(%rip),%ymm9 # 632c <_sk_callback_avx+0x145> + .byte 196,98,125,24,13,122,96,0,0 // vbroadcastss 0x607a(%rip),%ymm9 # 6398 <_sk_callback_avx+0x145> .byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0 @@ -14187,7 +14318,7 @@ HIDDEN _sk_srcout_avx .globl _sk_srcout_avx FUNCTION(_sk_srcout_avx) _sk_srcout_avx: - .byte 196,98,125,24,5,173,95,0,0 // vbroadcastss 0x5fad(%rip),%ymm8 # 6330 <_sk_callback_avx+0x149> + .byte 196,98,125,24,5,25,96,0,0 // vbroadcastss 0x6019(%rip),%ymm8 # 639c <_sk_callback_avx+0x149> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -14200,7 +14331,7 @@ HIDDEN _sk_dstout_avx .globl _sk_dstout_avx FUNCTION(_sk_dstout_avx) _sk_dstout_avx: - .byte 196,226,125,24,5,144,95,0,0 // vbroadcastss 0x5f90(%rip),%ymm0 # 6334 <_sk_callback_avx+0x14d> + .byte 196,226,125,24,5,252,95,0,0 // vbroadcastss 0x5ffc(%rip),%ymm0 # 63a0 <_sk_callback_avx+0x14d> .byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3 .byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0 .byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1 @@ -14213,7 +14344,7 @@ HIDDEN _sk_srcover_avx .globl _sk_srcover_avx FUNCTION(_sk_srcover_avx) _sk_srcover_avx: - .byte 196,98,125,24,5,115,95,0,0 // vbroadcastss 0x5f73(%rip),%ymm8 # 6338 <_sk_callback_avx+0x151> + .byte 196,98,125,24,5,223,95,0,0 // vbroadcastss 0x5fdf(%rip),%ymm8 # 63a4 <_sk_callback_avx+0x151> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -14230,7 +14361,7 @@ HIDDEN _sk_dstover_avx .globl _sk_dstover_avx FUNCTION(_sk_dstover_avx) _sk_dstover_avx: - .byte 196,98,125,24,5,70,95,0,0 // vbroadcastss 0x5f46(%rip),%ymm8 # 633c <_sk_callback_avx+0x155> + .byte 196,98,125,24,5,178,95,0,0 // vbroadcastss 0x5fb2(%rip),%ymm8 # 63a8 <_sk_callback_avx+0x155> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0 @@ -14258,7 +14389,7 @@ HIDDEN _sk_multiply_avx .globl _sk_multiply_avx FUNCTION(_sk_multiply_avx) _sk_multiply_avx: - .byte 196,98,125,24,5,5,95,0,0 // vbroadcastss 0x5f05(%rip),%ymm8 # 6340 <_sk_callback_avx+0x159> + .byte 196,98,125,24,5,113,95,0,0 // vbroadcastss 0x5f71(%rip),%ymm8 # 63ac <_sk_callback_avx+0x159> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -14318,7 +14449,7 @@ HIDDEN _sk_xor__avx .globl _sk_xor__avx FUNCTION(_sk_xor__avx) _sk_xor__avx: - .byte 196,98,125,24,5,84,94,0,0 // vbroadcastss 0x5e54(%rip),%ymm8 # 6344 <_sk_callback_avx+0x15d> + .byte 196,98,125,24,5,192,94,0,0 // vbroadcastss 0x5ec0(%rip),%ymm8 # 63b0 <_sk_callback_avx+0x15d> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -14355,7 +14486,7 @@ _sk_darken_avx: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,212,93,0,0 // vbroadcastss 0x5dd4(%rip),%ymm8 # 6348 <_sk_callback_avx+0x161> + .byte 196,98,125,24,5,64,94,0,0 // vbroadcastss 0x5e40(%rip),%ymm8 # 63b4 <_sk_callback_avx+0x161> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -14381,7 +14512,7 @@ _sk_lighten_avx: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,128,93,0,0 // vbroadcastss 0x5d80(%rip),%ymm8 # 634c <_sk_callback_avx+0x165> + .byte 196,98,125,24,5,236,93,0,0 // vbroadcastss 0x5dec(%rip),%ymm8 # 63b8 <_sk_callback_avx+0x165> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -14410,7 +14541,7 @@ _sk_difference_avx: .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,32,93,0,0 // vbroadcastss 0x5d20(%rip),%ymm8 # 6350 <_sk_callback_avx+0x169> + .byte 196,98,125,24,5,140,93,0,0 // vbroadcastss 0x5d8c(%rip),%ymm8 # 63bc <_sk_callback_avx+0x169> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -14433,7 +14564,7 @@ _sk_exclusion_avx: .byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,219,92,0,0 // vbroadcastss 0x5cdb(%rip),%ymm8 # 6354 <_sk_callback_avx+0x16d> + .byte 196,98,125,24,5,71,93,0,0 // vbroadcastss 0x5d47(%rip),%ymm8 # 63c0 <_sk_callback_avx+0x16d> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -14444,7 +14575,7 @@ HIDDEN _sk_colorburn_avx .globl _sk_colorburn_avx FUNCTION(_sk_colorburn_avx) _sk_colorburn_avx: - .byte 196,98,125,24,5,198,92,0,0 // vbroadcastss 0x5cc6(%rip),%ymm8 # 6358 <_sk_callback_avx+0x171> + .byte 196,98,125,24,5,50,93,0,0 // vbroadcastss 0x5d32(%rip),%ymm8 # 63c4 <_sk_callback_avx+0x171> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11 .byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10 @@ -14506,7 +14637,7 @@ HIDDEN _sk_colordodge_avx FUNCTION(_sk_colordodge_avx) _sk_colordodge_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,13,194,91,0,0 // vbroadcastss 0x5bc2(%rip),%ymm9 # 635c <_sk_callback_avx+0x175> + .byte 196,98,125,24,13,46,92,0,0 // vbroadcastss 0x5c2e(%rip),%ymm9 # 63c8 <_sk_callback_avx+0x175> .byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9 @@ -14563,7 +14694,7 @@ HIDDEN _sk_hardlight_avx .globl _sk_hardlight_avx FUNCTION(_sk_hardlight_avx) _sk_hardlight_avx: - .byte 196,98,125,24,5,212,90,0,0 // vbroadcastss 0x5ad4(%rip),%ymm8 # 6360 <_sk_callback_avx+0x179> + .byte 196,98,125,24,5,64,91,0,0 // vbroadcastss 0x5b40(%rip),%ymm8 # 63cc <_sk_callback_avx+0x179> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -14618,7 +14749,7 @@ HIDDEN _sk_overlay_avx .globl _sk_overlay_avx FUNCTION(_sk_overlay_avx) _sk_overlay_avx: - .byte 196,98,125,24,5,253,89,0,0 // vbroadcastss 0x59fd(%rip),%ymm8 # 6364 <_sk_callback_avx+0x17d> + .byte 196,98,125,24,5,105,90,0,0 // vbroadcastss 0x5a69(%rip),%ymm8 # 63d0 <_sk_callback_avx+0x17d> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -14684,10 +14815,10 @@ _sk_softlight_avx: .byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8 .byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11 .byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8 - .byte 196,98,125,24,29,244,88,0,0 // vbroadcastss 0x58f4(%rip),%ymm11 # 636c <_sk_callback_avx+0x185> + .byte 196,98,125,24,29,96,89,0,0 // vbroadcastss 0x5960(%rip),%ymm11 # 63d8 <_sk_callback_avx+0x185> .byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13 .byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8 - .byte 196,98,125,24,45,229,88,0,0 // vbroadcastss 0x58e5(%rip),%ymm13 # 6370 <_sk_callback_avx+0x189> + .byte 196,98,125,24,45,81,89,0,0 // vbroadcastss 0x5951(%rip),%ymm13 # 63dc <_sk_callback_avx+0x189> .byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14 .byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8 .byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14 @@ -14698,7 +14829,7 @@ _sk_softlight_avx: .byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15 .byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14 .byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15 - .byte 196,98,125,24,5,163,88,0,0 // vbroadcastss 0x58a3(%rip),%ymm8 # 6368 <_sk_callback_avx+0x181> + .byte 196,98,125,24,5,15,89,0,0 // vbroadcastss 0x590f(%rip),%ymm8 # 63d4 <_sk_callback_avx+0x181> .byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12 .byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0 .byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12 @@ -14825,12 +14956,12 @@ _sk_hue_avx: .byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11 .byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11 .byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - .byte 196,98,125,24,53,114,86,0,0 // vbroadcastss 0x5672(%rip),%ymm14 # 6374 <_sk_callback_avx+0x18d> + .byte 196,98,125,24,53,222,86,0,0 // vbroadcastss 0x56de(%rip),%ymm14 # 63e0 <_sk_callback_avx+0x18d> .byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11 - .byte 196,98,125,24,61,104,86,0,0 // vbroadcastss 0x5668(%rip),%ymm15 # 6378 <_sk_callback_avx+0x191> + .byte 196,98,125,24,61,212,86,0,0 // vbroadcastss 0x56d4(%rip),%ymm15 # 63e4 <_sk_callback_avx+0x191> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 - .byte 196,226,125,24,5,89,86,0,0 // vbroadcastss 0x5659(%rip),%ymm0 # 637c <_sk_callback_avx+0x195> + .byte 196,226,125,24,5,197,86,0,0 // vbroadcastss 0x56c5(%rip),%ymm0 # 63e8 <_sk_callback_avx+0x195> .byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 .byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13 @@ -14891,7 +15022,7 @@ _sk_hue_avx: .byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10 .byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,50,85,0,0 // vbroadcastss 0x5532(%rip),%ymm8 # 6380 <_sk_callback_avx+0x199> + .byte 196,98,125,24,5,158,85,0,0 // vbroadcastss 0x559e(%rip),%ymm8 # 63ec <_sk_callback_avx+0x199> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -14948,12 +15079,12 @@ _sk_saturation_avx: .byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11 .byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11 .byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - .byte 196,98,125,24,53,64,84,0,0 // vbroadcastss 0x5440(%rip),%ymm14 # 6384 <_sk_callback_avx+0x19d> + .byte 196,98,125,24,53,172,84,0,0 // vbroadcastss 0x54ac(%rip),%ymm14 # 63f0 <_sk_callback_avx+0x19d> .byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11 - .byte 196,98,125,24,61,54,84,0,0 // vbroadcastss 0x5436(%rip),%ymm15 # 6388 <_sk_callback_avx+0x1a1> + .byte 196,98,125,24,61,162,84,0,0 // vbroadcastss 0x54a2(%rip),%ymm15 # 63f4 <_sk_callback_avx+0x1a1> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 - .byte 196,226,125,24,5,39,84,0,0 // vbroadcastss 0x5427(%rip),%ymm0 # 638c <_sk_callback_avx+0x1a5> + .byte 196,226,125,24,5,147,84,0,0 // vbroadcastss 0x5493(%rip),%ymm0 # 63f8 <_sk_callback_avx+0x1a5> .byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 .byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13 @@ -15014,7 +15145,7 @@ _sk_saturation_avx: .byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10 .byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,0,83,0,0 // vbroadcastss 0x5300(%rip),%ymm8 # 6390 <_sk_callback_avx+0x1a9> + .byte 196,98,125,24,5,108,83,0,0 // vbroadcastss 0x536c(%rip),%ymm8 # 63fc <_sk_callback_avx+0x1a9> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -15043,12 +15174,12 @@ _sk_color_avx: .byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp) .byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8 .byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9 - .byte 196,98,125,24,45,150,82,0,0 // vbroadcastss 0x5296(%rip),%ymm13 # 6394 <_sk_callback_avx+0x1ad> + .byte 196,98,125,24,45,2,83,0,0 // vbroadcastss 0x5302(%rip),%ymm13 # 6400 <_sk_callback_avx+0x1ad> .byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10 - .byte 196,98,125,24,53,140,82,0,0 // vbroadcastss 0x528c(%rip),%ymm14 # 6398 <_sk_callback_avx+0x1b1> + .byte 196,98,125,24,53,248,82,0,0 // vbroadcastss 0x52f8(%rip),%ymm14 # 6404 <_sk_callback_avx+0x1b1> .byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11 .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,61,125,82,0,0 // vbroadcastss 0x527d(%rip),%ymm15 # 639c <_sk_callback_avx+0x1b5> + .byte 196,98,125,24,61,233,82,0,0 // vbroadcastss 0x52e9(%rip),%ymm15 # 6408 <_sk_callback_avx+0x1b5> .byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11 .byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0 .byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11 @@ -15111,7 +15242,7 @@ _sk_color_avx: .byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9 .byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0 .byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8 - .byte 196,226,125,24,5,68,81,0,0 // vbroadcastss 0x5144(%rip),%ymm0 # 63a0 <_sk_callback_avx+0x1b9> + .byte 196,226,125,24,5,176,81,0,0 // vbroadcastss 0x51b0(%rip),%ymm0 # 640c <_sk_callback_avx+0x1b9> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -15141,12 +15272,12 @@ _sk_luminosity_avx: .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 .byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9 - .byte 196,98,125,24,45,214,80,0,0 // vbroadcastss 0x50d6(%rip),%ymm13 # 63a4 <_sk_callback_avx+0x1bd> + .byte 196,98,125,24,45,66,81,0,0 // vbroadcastss 0x5142(%rip),%ymm13 # 6410 <_sk_callback_avx+0x1bd> .byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10 - .byte 196,98,125,24,53,204,80,0,0 // vbroadcastss 0x50cc(%rip),%ymm14 # 63a8 <_sk_callback_avx+0x1c1> + .byte 196,98,125,24,53,56,81,0,0 // vbroadcastss 0x5138(%rip),%ymm14 # 6414 <_sk_callback_avx+0x1c1> .byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11 .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,61,189,80,0,0 // vbroadcastss 0x50bd(%rip),%ymm15 # 63ac <_sk_callback_avx+0x1c5> + .byte 196,98,125,24,61,41,81,0,0 // vbroadcastss 0x5129(%rip),%ymm15 # 6418 <_sk_callback_avx+0x1c5> .byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11 .byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0 .byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11 @@ -15209,7 +15340,7 @@ _sk_luminosity_avx: .byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9 .byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0 .byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8 - .byte 196,226,125,24,5,132,79,0,0 // vbroadcastss 0x4f84(%rip),%ymm0 # 63b0 <_sk_callback_avx+0x1c9> + .byte 196,226,125,24,5,240,79,0,0 // vbroadcastss 0x4ff0(%rip),%ymm0 # 641c <_sk_callback_avx+0x1c9> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -15245,7 +15376,7 @@ HIDDEN _sk_clamp_1_avx .globl _sk_clamp_1_avx FUNCTION(_sk_clamp_1_avx) _sk_clamp_1_avx: - .byte 196,98,125,24,5,23,79,0,0 // vbroadcastss 0x4f17(%rip),%ymm8 # 63b4 <_sk_callback_avx+0x1cd> + .byte 196,98,125,24,5,131,79,0,0 // vbroadcastss 0x4f83(%rip),%ymm8 # 6420 <_sk_callback_avx+0x1cd> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 @@ -15257,7 +15388,7 @@ HIDDEN _sk_clamp_a_avx .globl _sk_clamp_a_avx FUNCTION(_sk_clamp_a_avx) _sk_clamp_a_avx: - .byte 196,98,125,24,5,250,78,0,0 // vbroadcastss 0x4efa(%rip),%ymm8 # 63b8 <_sk_callback_avx+0x1d1> + .byte 196,98,125,24,5,102,79,0,0 // vbroadcastss 0x4f66(%rip),%ymm8 # 6424 <_sk_callback_avx+0x1d1> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0 .byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1 @@ -15343,7 +15474,7 @@ FUNCTION(_sk_unpremul_avx) _sk_unpremul_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9 - .byte 196,98,125,24,21,66,78,0,0 // vbroadcastss 0x4e42(%rip),%ymm10 # 63bc <_sk_callback_avx+0x1d5> + .byte 196,98,125,24,21,174,78,0,0 // vbroadcastss 0x4eae(%rip),%ymm10 # 6428 <_sk_callback_avx+0x1d5> .byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10 .byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 @@ -15356,17 +15487,17 @@ HIDDEN _sk_from_srgb_avx .globl _sk_from_srgb_avx FUNCTION(_sk_from_srgb_avx) _sk_from_srgb_avx: - .byte 196,98,125,24,5,35,78,0,0 // vbroadcastss 0x4e23(%rip),%ymm8 # 63c0 <_sk_callback_avx+0x1d9> + .byte 196,98,125,24,5,143,78,0,0 // vbroadcastss 0x4e8f(%rip),%ymm8 # 642c <_sk_callback_avx+0x1d9> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10 - .byte 196,98,125,24,29,21,78,0,0 // vbroadcastss 0x4e15(%rip),%ymm11 # 63c4 <_sk_callback_avx+0x1dd> + .byte 196,98,125,24,29,129,78,0,0 // vbroadcastss 0x4e81(%rip),%ymm11 # 6430 <_sk_callback_avx+0x1dd> .byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12 - .byte 196,98,125,24,45,11,78,0,0 // vbroadcastss 0x4e0b(%rip),%ymm13 # 63c8 <_sk_callback_avx+0x1e1> + .byte 196,98,125,24,45,119,78,0,0 // vbroadcastss 0x4e77(%rip),%ymm13 # 6434 <_sk_callback_avx+0x1e1> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,252,77,0,0 // vbroadcastss 0x4dfc(%rip),%ymm12 # 63cc <_sk_callback_avx+0x1e5> + .byte 196,98,125,24,37,104,78,0,0 // vbroadcastss 0x4e68(%rip),%ymm12 # 6438 <_sk_callback_avx+0x1e5> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,53,242,77,0,0 // vbroadcastss 0x4df2(%rip),%ymm14 # 63d0 <_sk_callback_avx+0x1e9> + .byte 196,98,125,24,53,94,78,0,0 // vbroadcastss 0x4e5e(%rip),%ymm14 # 643c <_sk_callback_avx+0x1e9> .byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0 .byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0 .byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9 @@ -15393,20 +15524,20 @@ HIDDEN _sk_to_srgb_avx FUNCTION(_sk_to_srgb_avx) _sk_to_srgb_avx: .byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9 - .byte 196,98,125,24,5,135,77,0,0 // vbroadcastss 0x4d87(%rip),%ymm8 # 63d4 <_sk_callback_avx+0x1ed> + .byte 196,98,125,24,5,243,77,0,0 // vbroadcastss 0x4df3(%rip),%ymm8 # 6440 <_sk_callback_avx+0x1ed> .byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10 - .byte 196,98,125,24,29,125,77,0,0 // vbroadcastss 0x4d7d(%rip),%ymm11 # 63d8 <_sk_callback_avx+0x1f1> + .byte 196,98,125,24,29,233,77,0,0 // vbroadcastss 0x4de9(%rip),%ymm11 # 6444 <_sk_callback_avx+0x1f1> .byte 196,65,52,89,227 // vmulps %ymm11,%ymm9,%ymm12 - .byte 196,98,125,24,45,115,77,0,0 // vbroadcastss 0x4d73(%rip),%ymm13 # 63dc <_sk_callback_avx+0x1f5> + .byte 196,98,125,24,45,223,77,0,0 // vbroadcastss 0x4ddf(%rip),%ymm13 # 6448 <_sk_callback_avx+0x1f5> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,52,89,228 // vmulps %ymm12,%ymm9,%ymm12 - .byte 196,98,125,24,53,100,77,0,0 // vbroadcastss 0x4d64(%rip),%ymm14 # 63e0 <_sk_callback_avx+0x1f9> + .byte 196,98,125,24,53,208,77,0,0 // vbroadcastss 0x4dd0(%rip),%ymm14 # 644c <_sk_callback_avx+0x1f9> .byte 196,65,28,88,230 // vaddps %ymm14,%ymm12,%ymm12 - .byte 196,98,125,24,61,90,77,0,0 // vbroadcastss 0x4d5a(%rip),%ymm15 # 63e4 <_sk_callback_avx+0x1fd> + .byte 196,98,125,24,61,198,77,0,0 // vbroadcastss 0x4dc6(%rip),%ymm15 # 6450 <_sk_callback_avx+0x1fd> .byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9 .byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9 .byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9 - .byte 196,98,125,24,37,70,77,0,0 // vbroadcastss 0x4d46(%rip),%ymm12 # 63e8 <_sk_callback_avx+0x201> + .byte 196,98,125,24,37,178,77,0,0 // vbroadcastss 0x4db2(%rip),%ymm12 # 6454 <_sk_callback_avx+0x201> .byte 196,193,124,194,196,1 // vcmpltps %ymm12,%ymm0,%ymm0 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9 @@ -15443,7 +15574,7 @@ _sk_rgb_to_hsl_avx: .byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9 .byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9 .byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,29,172,76,0,0 // vbroadcastss 0x4cac(%rip),%ymm11 # 63ec <_sk_callback_avx+0x205> + .byte 196,98,125,24,29,24,77,0,0 // vbroadcastss 0x4d18(%rip),%ymm11 # 6458 <_sk_callback_avx+0x205> .byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11 .byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12 .byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12 @@ -15453,19 +15584,19 @@ _sk_rgb_to_hsl_avx: .byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2 .byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1 .byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,133,76,0,0 // vbroadcastss 0x4c85(%rip),%ymm11 # 63f8 <_sk_callback_avx+0x211> + .byte 196,98,125,24,29,241,76,0,0 // vbroadcastss 0x4cf1(%rip),%ymm11 # 6464 <_sk_callback_avx+0x211> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,115,76,0,0 // vbroadcastss 0x4c73(%rip),%ymm11 # 63f4 <_sk_callback_avx+0x20d> + .byte 196,98,125,24,29,223,76,0,0 // vbroadcastss 0x4cdf(%rip),%ymm11 # 6460 <_sk_callback_avx+0x20d> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,91,76,0,0 // vbroadcastss 0x4c5b(%rip),%ymm2 # 63f0 <_sk_callback_avx+0x209> + .byte 196,226,125,24,21,199,76,0,0 // vbroadcastss 0x4cc7(%rip),%ymm2 # 645c <_sk_callback_avx+0x209> .byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14 .byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2 .byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0 .byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2 .byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0 .byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1 - .byte 196,98,125,24,37,66,76,0,0 // vbroadcastss 0x4c42(%rip),%ymm12 # 6400 <_sk_callback_avx+0x219> + .byte 196,98,125,24,37,174,76,0,0 // vbroadcastss 0x4cae(%rip),%ymm12 # 646c <_sk_callback_avx+0x219> .byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2 .byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12 .byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11 @@ -15475,7 +15606,7 @@ _sk_rgb_to_hsl_avx: .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0 .byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1 - .byte 196,98,125,24,5,5,76,0,0 // vbroadcastss 0x4c05(%rip),%ymm8 # 63fc <_sk_callback_avx+0x215> + .byte 196,98,125,24,5,113,76,0,0 // vbroadcastss 0x4c71(%rip),%ymm8 # 6468 <_sk_callback_avx+0x215> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -15492,7 +15623,7 @@ _sk_hsl_to_rgb_avx: .byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp) .byte 197,252,40,225 // vmovaps %ymm1,%ymm4 .byte 197,252,40,216 // vmovaps %ymm0,%ymm3 - .byte 196,98,125,24,5,210,75,0,0 // vbroadcastss 0x4bd2(%rip),%ymm8 # 6404 <_sk_callback_avx+0x21d> + .byte 196,98,125,24,5,62,76,0,0 // vbroadcastss 0x4c3e(%rip),%ymm8 # 6470 <_sk_callback_avx+0x21d> .byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9 .byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10 .byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11 @@ -15500,23 +15631,23 @@ _sk_hsl_to_rgb_avx: .byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10 .byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,29,172,75,0,0 // vbroadcastss 0x4bac(%rip),%ymm11 # 6408 <_sk_callback_avx+0x221> + .byte 196,98,125,24,29,24,76,0,0 // vbroadcastss 0x4c18(%rip),%ymm11 # 6474 <_sk_callback_avx+0x221> .byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11 .byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12 .byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15 .byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11 - .byte 196,98,125,24,37,150,75,0,0 // vbroadcastss 0x4b96(%rip),%ymm12 # 6410 <_sk_callback_avx+0x229> + .byte 196,98,125,24,37,2,76,0,0 // vbroadcastss 0x4c02(%rip),%ymm12 # 647c <_sk_callback_avx+0x229> .byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0 - .byte 196,98,125,24,45,140,75,0,0 // vbroadcastss 0x4b8c(%rip),%ymm13 # 6414 <_sk_callback_avx+0x22d> + .byte 196,98,125,24,45,248,75,0,0 // vbroadcastss 0x4bf8(%rip),%ymm13 # 6480 <_sk_callback_avx+0x22d> .byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14 .byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14 .byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14 - .byte 196,226,125,24,13,109,75,0,0 // vbroadcastss 0x4b6d(%rip),%ymm1 # 640c <_sk_callback_avx+0x225> + .byte 196,226,125,24,13,217,75,0,0 // vbroadcastss 0x4bd9(%rip),%ymm1 # 6478 <_sk_callback_avx+0x225> .byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7 .byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7 .byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14 .byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7 - .byte 196,98,125,24,53,88,75,0,0 // vbroadcastss 0x4b58(%rip),%ymm14 # 6418 <_sk_callback_avx+0x231> + .byte 196,98,125,24,53,196,75,0,0 // vbroadcastss 0x4bc4(%rip),%ymm14 # 6484 <_sk_callback_avx+0x231> .byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15 .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -15535,7 +15666,7 @@ _sk_hsl_to_rgb_avx: .byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6 .byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6 .byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5 - .byte 196,226,125,24,5,250,74,0,0 // vbroadcastss 0x4afa(%rip),%ymm0 # 641c <_sk_callback_avx+0x235> + .byte 196,226,125,24,5,102,75,0,0 // vbroadcastss 0x4b66(%rip),%ymm0 # 6488 <_sk_callback_avx+0x235> .byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0 .byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3 .byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0 @@ -15594,7 +15725,7 @@ _sk_scale_u8_avx: .byte 196,66,121,49,192 // vpmovzxbd %xmm8,%xmm8 .byte 196,67,53,24,192,1 // vinsertf128 $0x1,%xmm8,%ymm9,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,35,74,0,0 // vbroadcastss 0x4a23(%rip),%ymm9 # 6420 <_sk_callback_avx+0x239> + .byte 196,98,125,24,13,143,74,0,0 // vbroadcastss 0x4a8f(%rip),%ymm9 # 648c <_sk_callback_avx+0x239> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -15653,7 +15784,7 @@ _sk_lerp_u8_avx: .byte 196,66,121,49,192 // vpmovzxbd %xmm8,%xmm8 .byte 196,67,53,24,192,1 // vinsertf128 $0x1,%xmm8,%ymm9,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,111,73,0,0 // vbroadcastss 0x496f(%rip),%ymm9 # 6424 <_sk_callback_avx+0x23d> + .byte 196,98,125,24,13,219,73,0,0 // vbroadcastss 0x49db(%rip),%ymm9 # 6490 <_sk_callback_avx+0x23d> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 @@ -15696,20 +15827,20 @@ _sk_lerp_565_avx: .byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9 .byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8 .byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,217,72,0,0 // vbroadcastss 0x48d9(%rip),%ymm9 # 6428 <_sk_callback_avx+0x241> + .byte 196,98,125,24,13,69,73,0,0 // vbroadcastss 0x4945(%rip),%ymm9 # 6494 <_sk_callback_avx+0x241> .byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9 .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9 - .byte 196,98,125,24,21,202,72,0,0 // vbroadcastss 0x48ca(%rip),%ymm10 # 642c <_sk_callback_avx+0x245> + .byte 196,98,125,24,21,54,73,0,0 // vbroadcastss 0x4936(%rip),%ymm10 # 6498 <_sk_callback_avx+0x245> .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,192,72,0,0 // vbroadcastss 0x48c0(%rip),%ymm10 # 6430 <_sk_callback_avx+0x249> + .byte 196,98,125,24,21,44,73,0,0 // vbroadcastss 0x492c(%rip),%ymm10 # 649c <_sk_callback_avx+0x249> .byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10 .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10 - .byte 196,98,125,24,29,177,72,0,0 // vbroadcastss 0x48b1(%rip),%ymm11 # 6434 <_sk_callback_avx+0x24d> + .byte 196,98,125,24,29,29,73,0,0 // vbroadcastss 0x491d(%rip),%ymm11 # 64a0 <_sk_callback_avx+0x24d> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,29,167,72,0,0 // vbroadcastss 0x48a7(%rip),%ymm11 # 6438 <_sk_callback_avx+0x251> + .byte 196,98,125,24,29,19,73,0,0 // vbroadcastss 0x4913(%rip),%ymm11 # 64a4 <_sk_callback_avx+0x251> .byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,29,152,72,0,0 // vbroadcastss 0x4898(%rip),%ymm11 # 643c <_sk_callback_avx+0x255> + .byte 196,98,125,24,29,4,73,0,0 // vbroadcastss 0x4904(%rip),%ymm11 # 64a8 <_sk_callback_avx+0x255> .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 @@ -15756,7 +15887,7 @@ _sk_lerp_565_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,225 // jmpq ffffffffe2001c74 <_sk_callback_avx+0xffffffffe1ffba8d> + .byte 233,255,255,255,225 // jmpq ffffffffe2001c74 <_sk_callback_avx+0xffffffffe1ffba21> .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) @@ -15791,7 +15922,7 @@ _sk_load_tables_avx: .byte 65,85 // push %r13 .byte 65,84 // push %r12 .byte 83 // push %rbx - .byte 197,124,40,13,232,74,0,0 // vmovaps 0x4ae8(%rip),%ymm9 # 67a0 <_sk_callback_avx+0x5b9> + .byte 197,124,40,13,104,75,0,0 // vmovaps 0x4b68(%rip),%ymm9 # 6820 <_sk_callback_avx+0x5cd> .byte 196,193,44,84,193 // vandps %ymm9,%ymm10,%ymm0 .byte 196,193,249,126,193 // vmovq %xmm0,%r9 .byte 69,137,203 // mov %r9d,%r11d @@ -15883,7 +16014,7 @@ _sk_load_tables_avx: .byte 196,193,97,114,208,24 // vpsrld $0x18,%xmm8,%xmm3 .byte 196,227,53,24,219,1 // vinsertf128 $0x1,%xmm3,%ymm9,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,155,69,0,0 // vbroadcastss 0x459b(%rip),%ymm8 # 6440 <_sk_callback_avx+0x259> + .byte 196,98,125,24,5,7,70,0,0 // vbroadcastss 0x4607(%rip),%ymm8 # 64ac <_sk_callback_avx+0x259> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,137,193 // mov %r8,%rcx @@ -15901,9 +16032,9 @@ _sk_load_tables_avx: .byte 73,211,234 // shr %cl,%r10 .byte 196,193,249,110,194 // vmovq %r10,%xmm0 .byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0 - .byte 196,226,121,0,13,61,72,0,0 // vpshufb 0x483d(%rip),%xmm0,%xmm1 # 6720 <_sk_callback_avx+0x539> + .byte 196,226,121,0,13,173,72,0,0 // vpshufb 0x48ad(%rip),%xmm0,%xmm1 # 6790 <_sk_callback_avx+0x53d> .byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1 - .byte 196,226,121,0,5,63,72,0,0 // vpshufb 0x483f(%rip),%xmm0,%xmm0 # 6730 <_sk_callback_avx+0x549> + .byte 196,226,121,0,5,175,72,0,0 // vpshufb 0x48af(%rip),%xmm0,%xmm0 # 67a0 <_sk_callback_avx+0x54d> .byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 196,66,125,44,17 // vmaskmovps (%r9),%ymm0,%ymm10 @@ -15939,7 +16070,7 @@ _sk_load_tables_u16_be_avx: .byte 197,177,108,208 // vpunpcklqdq %xmm0,%xmm9,%xmm2 .byte 197,177,109,200 // vpunpckhqdq %xmm0,%xmm9,%xmm1 .byte 196,65,57,108,212 // vpunpcklqdq %xmm12,%xmm8,%xmm10 - .byte 197,121,111,29,200,71,0,0 // vmovdqa 0x47c8(%rip),%xmm11 # 6740 <_sk_callback_avx+0x559> + .byte 197,121,111,29,56,72,0,0 // vmovdqa 0x4838(%rip),%xmm11 # 67b0 <_sk_callback_avx+0x55d> .byte 196,193,105,219,195 // vpand %xmm11,%xmm2,%xmm0 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 196,193,121,105,209 // vpunpckhwd %xmm9,%xmm0,%xmm2 @@ -16038,7 +16169,7 @@ _sk_load_tables_u16_be_avx: .byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3 .byte 196,195,101,24,216,1 // vinsertf128 $0x1,%xmm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,202,66,0,0 // vbroadcastss 0x42ca(%rip),%ymm8 # 6444 <_sk_callback_avx+0x25d> + .byte 196,98,125,24,5,54,67,0,0 // vbroadcastss 0x4336(%rip),%ymm8 # 64b0 <_sk_callback_avx+0x25d> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -16110,7 +16241,7 @@ _sk_load_tables_rgb_u16_be_avx: .byte 197,185,108,202 // vpunpcklqdq %xmm2,%xmm8,%xmm1 .byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2 .byte 197,121,108,195 // vpunpcklqdq %xmm3,%xmm0,%xmm8 - .byte 197,121,111,13,193,68,0,0 // vmovdqa 0x44c1(%rip),%xmm9 # 6750 <_sk_callback_avx+0x569> + .byte 197,121,111,13,49,69,0,0 // vmovdqa 0x4531(%rip),%xmm9 # 67c0 <_sk_callback_avx+0x56d> .byte 196,193,113,219,193 // vpand %xmm9,%xmm1,%xmm0 .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10 .byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1 @@ -16202,7 +16333,7 @@ _sk_load_tables_rgb_u16_be_avx: .byte 196,227,105,33,211,48 // vinsertps $0x30,%xmm3,%xmm2,%xmm2 .byte 196,195,109,24,208,1 // vinsertf128 $0x1,%xmm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,220,63,0,0 // vbroadcastss 0x3fdc(%rip),%ymm3 # 6448 <_sk_callback_avx+0x261> + .byte 196,226,125,24,29,72,64,0,0 // vbroadcastss 0x4048(%rip),%ymm3 # 64b4 <_sk_callback_avx+0x261> .byte 91 // pop %rbx .byte 65,92 // pop %r12 .byte 65,93 // pop %r13 @@ -16255,7 +16386,7 @@ _sk_byte_tables_avx: .byte 65,84 // push %r12 .byte 83 // push %rbx .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,16,63,0,0 // vbroadcastss 0x3f10(%rip),%ymm8 # 644c <_sk_callback_avx+0x265> + .byte 196,98,125,24,5,124,63,0,0 // vbroadcastss 0x3f7c(%rip),%ymm8 # 64b8 <_sk_callback_avx+0x265> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0 .byte 196,195,249,22,192,1 // vpextrq $0x1,%xmm0,%r8 @@ -16292,7 +16423,7 @@ _sk_byte_tables_avx: .byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0 .byte 196,227,53,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,94,62,0,0 // vbroadcastss 0x3e5e(%rip),%ymm9 # 6450 <_sk_callback_avx+0x269> + .byte 196,98,125,24,13,202,62,0,0 // vbroadcastss 0x3eca(%rip),%ymm9 # 64bc <_sk_callback_avx+0x269> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 @@ -16454,7 +16585,7 @@ _sk_byte_tables_rgb_avx: .byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0 .byte 196,227,53,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,132,59,0,0 // vbroadcastss 0x3b84(%rip),%ymm9 # 6454 <_sk_callback_avx+0x26d> + .byte 196,98,125,24,13,240,59,0,0 // vbroadcastss 0x3bf0(%rip),%ymm9 # 64c0 <_sk_callback_avx+0x26d> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 @@ -16751,36 +16882,36 @@ _sk_parametric_r_avx: .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11 - .byte 196,98,125,24,37,226,54,0,0 // vbroadcastss 0x36e2(%rip),%ymm12 # 6458 <_sk_callback_avx+0x271> + .byte 196,98,125,24,37,78,55,0,0 // vbroadcastss 0x374e(%rip),%ymm12 # 64c4 <_sk_callback_avx+0x271> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,216,54,0,0 // vbroadcastss 0x36d8(%rip),%ymm12 # 645c <_sk_callback_avx+0x275> + .byte 196,98,125,24,37,68,55,0,0 // vbroadcastss 0x3744(%rip),%ymm12 # 64c8 <_sk_callback_avx+0x275> .byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,206,54,0,0 // vbroadcastss 0x36ce(%rip),%ymm12 # 6460 <_sk_callback_avx+0x279> + .byte 196,98,125,24,37,58,55,0,0 // vbroadcastss 0x373a(%rip),%ymm12 # 64cc <_sk_callback_avx+0x279> .byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,196,54,0,0 // vbroadcastss 0x36c4(%rip),%ymm12 # 6464 <_sk_callback_avx+0x27d> + .byte 196,98,125,24,37,48,55,0,0 // vbroadcastss 0x3730(%rip),%ymm12 # 64d0 <_sk_callback_avx+0x27d> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,186,54,0,0 // vbroadcastss 0x36ba(%rip),%ymm12 # 6468 <_sk_callback_avx+0x281> + .byte 196,98,125,24,37,38,55,0,0 // vbroadcastss 0x3726(%rip),%ymm12 # 64d4 <_sk_callback_avx+0x281> .byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,171,54,0,0 // vbroadcastss 0x36ab(%rip),%ymm12 # 646c <_sk_callback_avx+0x285> + .byte 196,98,125,24,37,23,55,0,0 // vbroadcastss 0x3717(%rip),%ymm12 # 64d8 <_sk_callback_avx+0x285> .byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,161,54,0,0 // vbroadcastss 0x36a1(%rip),%ymm12 # 6470 <_sk_callback_avx+0x289> + .byte 196,98,125,24,37,13,55,0,0 // vbroadcastss 0x370d(%rip),%ymm12 # 64dc <_sk_callback_avx+0x289> .byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0 .byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0 .byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0 .byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 - .byte 196,98,125,24,29,133,54,0,0 // vbroadcastss 0x3685(%rip),%ymm11 # 6474 <_sk_callback_avx+0x28d> + .byte 196,98,125,24,29,241,54,0,0 // vbroadcastss 0x36f1(%rip),%ymm11 # 64e0 <_sk_callback_avx+0x28d> .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,123,54,0,0 // vbroadcastss 0x367b(%rip),%ymm11 # 6478 <_sk_callback_avx+0x291> + .byte 196,98,125,24,29,231,54,0,0 // vbroadcastss 0x36e7(%rip),%ymm11 # 64e4 <_sk_callback_avx+0x291> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,108,54,0,0 // vbroadcastss 0x366c(%rip),%ymm11 # 647c <_sk_callback_avx+0x295> + .byte 196,98,125,24,29,216,54,0,0 // vbroadcastss 0x36d8(%rip),%ymm11 # 64e8 <_sk_callback_avx+0x295> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,98,54,0,0 // vbroadcastss 0x3662(%rip),%ymm11 # 6480 <_sk_callback_avx+0x299> + .byte 196,98,125,24,29,206,54,0,0 // vbroadcastss 0x36ce(%rip),%ymm11 # 64ec <_sk_callback_avx+0x299> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0 - .byte 196,98,125,24,21,83,54,0,0 // vbroadcastss 0x3653(%rip),%ymm10 # 6484 <_sk_callback_avx+0x29d> + .byte 196,98,125,24,21,191,54,0,0 // vbroadcastss 0x36bf(%rip),%ymm10 # 64f0 <_sk_callback_avx+0x29d> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -16788,7 +16919,7 @@ _sk_parametric_r_avx: .byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,42,54,0,0 // vbroadcastss 0x362a(%rip),%ymm8 # 6488 <_sk_callback_avx+0x2a1> + .byte 196,98,125,24,5,150,54,0,0 // vbroadcastss 0x3696(%rip),%ymm8 # 64f4 <_sk_callback_avx+0x2a1> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -16810,36 +16941,36 @@ _sk_parametric_g_avx: .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11 - .byte 196,98,125,24,37,219,53,0,0 // vbroadcastss 0x35db(%rip),%ymm12 # 648c <_sk_callback_avx+0x2a5> + .byte 196,98,125,24,37,71,54,0,0 // vbroadcastss 0x3647(%rip),%ymm12 # 64f8 <_sk_callback_avx+0x2a5> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,209,53,0,0 // vbroadcastss 0x35d1(%rip),%ymm12 # 6490 <_sk_callback_avx+0x2a9> + .byte 196,98,125,24,37,61,54,0,0 // vbroadcastss 0x363d(%rip),%ymm12 # 64fc <_sk_callback_avx+0x2a9> .byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,199,53,0,0 // vbroadcastss 0x35c7(%rip),%ymm12 # 6494 <_sk_callback_avx+0x2ad> + .byte 196,98,125,24,37,51,54,0,0 // vbroadcastss 0x3633(%rip),%ymm12 # 6500 <_sk_callback_avx+0x2ad> .byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,189,53,0,0 // vbroadcastss 0x35bd(%rip),%ymm12 # 6498 <_sk_callback_avx+0x2b1> + .byte 196,98,125,24,37,41,54,0,0 // vbroadcastss 0x3629(%rip),%ymm12 # 6504 <_sk_callback_avx+0x2b1> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,179,53,0,0 // vbroadcastss 0x35b3(%rip),%ymm12 # 649c <_sk_callback_avx+0x2b5> + .byte 196,98,125,24,37,31,54,0,0 // vbroadcastss 0x361f(%rip),%ymm12 # 6508 <_sk_callback_avx+0x2b5> .byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,164,53,0,0 // vbroadcastss 0x35a4(%rip),%ymm12 # 64a0 <_sk_callback_avx+0x2b9> + .byte 196,98,125,24,37,16,54,0,0 // vbroadcastss 0x3610(%rip),%ymm12 # 650c <_sk_callback_avx+0x2b9> .byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,154,53,0,0 // vbroadcastss 0x359a(%rip),%ymm12 # 64a4 <_sk_callback_avx+0x2bd> + .byte 196,98,125,24,37,6,54,0,0 // vbroadcastss 0x3606(%rip),%ymm12 # 6510 <_sk_callback_avx+0x2bd> .byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1 .byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1 .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1 .byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10 .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10 - .byte 196,98,125,24,29,126,53,0,0 // vbroadcastss 0x357e(%rip),%ymm11 # 64a8 <_sk_callback_avx+0x2c1> + .byte 196,98,125,24,29,234,53,0,0 // vbroadcastss 0x35ea(%rip),%ymm11 # 6514 <_sk_callback_avx+0x2c1> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,116,53,0,0 // vbroadcastss 0x3574(%rip),%ymm11 # 64ac <_sk_callback_avx+0x2c5> + .byte 196,98,125,24,29,224,53,0,0 // vbroadcastss 0x35e0(%rip),%ymm11 # 6518 <_sk_callback_avx+0x2c5> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,101,53,0,0 // vbroadcastss 0x3565(%rip),%ymm11 # 64b0 <_sk_callback_avx+0x2c9> + .byte 196,98,125,24,29,209,53,0,0 // vbroadcastss 0x35d1(%rip),%ymm11 # 651c <_sk_callback_avx+0x2c9> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,91,53,0,0 // vbroadcastss 0x355b(%rip),%ymm11 # 64b4 <_sk_callback_avx+0x2cd> + .byte 196,98,125,24,29,199,53,0,0 // vbroadcastss 0x35c7(%rip),%ymm11 # 6520 <_sk_callback_avx+0x2cd> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1 - .byte 196,98,125,24,21,76,53,0,0 // vbroadcastss 0x354c(%rip),%ymm10 # 64b8 <_sk_callback_avx+0x2d1> + .byte 196,98,125,24,21,184,53,0,0 // vbroadcastss 0x35b8(%rip),%ymm10 # 6524 <_sk_callback_avx+0x2d1> .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -16847,7 +16978,7 @@ _sk_parametric_g_avx: .byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,5,35,53,0,0 // vbroadcastss 0x3523(%rip),%ymm8 # 64bc <_sk_callback_avx+0x2d5> + .byte 196,98,125,24,5,143,53,0,0 // vbroadcastss 0x358f(%rip),%ymm8 # 6528 <_sk_callback_avx+0x2d5> .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -16869,36 +17000,36 @@ _sk_parametric_b_avx: .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11 - .byte 196,98,125,24,37,212,52,0,0 // vbroadcastss 0x34d4(%rip),%ymm12 # 64c0 <_sk_callback_avx+0x2d9> + .byte 196,98,125,24,37,64,53,0,0 // vbroadcastss 0x3540(%rip),%ymm12 # 652c <_sk_callback_avx+0x2d9> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,202,52,0,0 // vbroadcastss 0x34ca(%rip),%ymm12 # 64c4 <_sk_callback_avx+0x2dd> + .byte 196,98,125,24,37,54,53,0,0 // vbroadcastss 0x3536(%rip),%ymm12 # 6530 <_sk_callback_avx+0x2dd> .byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,192,52,0,0 // vbroadcastss 0x34c0(%rip),%ymm12 # 64c8 <_sk_callback_avx+0x2e1> + .byte 196,98,125,24,37,44,53,0,0 // vbroadcastss 0x352c(%rip),%ymm12 # 6534 <_sk_callback_avx+0x2e1> .byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,182,52,0,0 // vbroadcastss 0x34b6(%rip),%ymm12 # 64cc <_sk_callback_avx+0x2e5> + .byte 196,98,125,24,37,34,53,0,0 // vbroadcastss 0x3522(%rip),%ymm12 # 6538 <_sk_callback_avx+0x2e5> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,172,52,0,0 // vbroadcastss 0x34ac(%rip),%ymm12 # 64d0 <_sk_callback_avx+0x2e9> + .byte 196,98,125,24,37,24,53,0,0 // vbroadcastss 0x3518(%rip),%ymm12 # 653c <_sk_callback_avx+0x2e9> .byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,157,52,0,0 // vbroadcastss 0x349d(%rip),%ymm12 # 64d4 <_sk_callback_avx+0x2ed> + .byte 196,98,125,24,37,9,53,0,0 // vbroadcastss 0x3509(%rip),%ymm12 # 6540 <_sk_callback_avx+0x2ed> .byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,147,52,0,0 // vbroadcastss 0x3493(%rip),%ymm12 # 64d8 <_sk_callback_avx+0x2f1> + .byte 196,98,125,24,37,255,52,0,0 // vbroadcastss 0x34ff(%rip),%ymm12 # 6544 <_sk_callback_avx+0x2f1> .byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2 .byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10 .byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10 - .byte 196,98,125,24,29,119,52,0,0 // vbroadcastss 0x3477(%rip),%ymm11 # 64dc <_sk_callback_avx+0x2f5> + .byte 196,98,125,24,29,227,52,0,0 // vbroadcastss 0x34e3(%rip),%ymm11 # 6548 <_sk_callback_avx+0x2f5> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,109,52,0,0 // vbroadcastss 0x346d(%rip),%ymm11 # 64e0 <_sk_callback_avx+0x2f9> + .byte 196,98,125,24,29,217,52,0,0 // vbroadcastss 0x34d9(%rip),%ymm11 # 654c <_sk_callback_avx+0x2f9> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,94,52,0,0 // vbroadcastss 0x345e(%rip),%ymm11 # 64e4 <_sk_callback_avx+0x2fd> + .byte 196,98,125,24,29,202,52,0,0 // vbroadcastss 0x34ca(%rip),%ymm11 # 6550 <_sk_callback_avx+0x2fd> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,84,52,0,0 // vbroadcastss 0x3454(%rip),%ymm11 # 64e8 <_sk_callback_avx+0x301> + .byte 196,98,125,24,29,192,52,0,0 // vbroadcastss 0x34c0(%rip),%ymm11 # 6554 <_sk_callback_avx+0x301> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2 - .byte 196,98,125,24,21,69,52,0,0 // vbroadcastss 0x3445(%rip),%ymm10 # 64ec <_sk_callback_avx+0x305> + .byte 196,98,125,24,21,177,52,0,0 // vbroadcastss 0x34b1(%rip),%ymm10 # 6558 <_sk_callback_avx+0x305> .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -16906,7 +17037,7 @@ _sk_parametric_b_avx: .byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,28,52,0,0 // vbroadcastss 0x341c(%rip),%ymm8 # 64f0 <_sk_callback_avx+0x309> + .byte 196,98,125,24,5,136,52,0,0 // vbroadcastss 0x3488(%rip),%ymm8 # 655c <_sk_callback_avx+0x309> .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -16928,36 +17059,36 @@ _sk_parametric_a_avx: .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11 - .byte 196,98,125,24,37,205,51,0,0 // vbroadcastss 0x33cd(%rip),%ymm12 # 64f4 <_sk_callback_avx+0x30d> + .byte 196,98,125,24,37,57,52,0,0 // vbroadcastss 0x3439(%rip),%ymm12 # 6560 <_sk_callback_avx+0x30d> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,195,51,0,0 // vbroadcastss 0x33c3(%rip),%ymm12 # 64f8 <_sk_callback_avx+0x311> + .byte 196,98,125,24,37,47,52,0,0 // vbroadcastss 0x342f(%rip),%ymm12 # 6564 <_sk_callback_avx+0x311> .byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,185,51,0,0 // vbroadcastss 0x33b9(%rip),%ymm12 # 64fc <_sk_callback_avx+0x315> + .byte 196,98,125,24,37,37,52,0,0 // vbroadcastss 0x3425(%rip),%ymm12 # 6568 <_sk_callback_avx+0x315> .byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,175,51,0,0 // vbroadcastss 0x33af(%rip),%ymm12 # 6500 <_sk_callback_avx+0x319> + .byte 196,98,125,24,37,27,52,0,0 // vbroadcastss 0x341b(%rip),%ymm12 # 656c <_sk_callback_avx+0x319> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,165,51,0,0 // vbroadcastss 0x33a5(%rip),%ymm12 # 6504 <_sk_callback_avx+0x31d> + .byte 196,98,125,24,37,17,52,0,0 // vbroadcastss 0x3411(%rip),%ymm12 # 6570 <_sk_callback_avx+0x31d> .byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,150,51,0,0 // vbroadcastss 0x3396(%rip),%ymm12 # 6508 <_sk_callback_avx+0x321> + .byte 196,98,125,24,37,2,52,0,0 // vbroadcastss 0x3402(%rip),%ymm12 # 6574 <_sk_callback_avx+0x321> .byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,140,51,0,0 // vbroadcastss 0x338c(%rip),%ymm12 # 650c <_sk_callback_avx+0x325> + .byte 196,98,125,24,37,248,51,0,0 // vbroadcastss 0x33f8(%rip),%ymm12 # 6578 <_sk_callback_avx+0x325> .byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3 .byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3 .byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3 .byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10 .byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10 - .byte 196,98,125,24,29,112,51,0,0 // vbroadcastss 0x3370(%rip),%ymm11 # 6510 <_sk_callback_avx+0x329> + .byte 196,98,125,24,29,220,51,0,0 // vbroadcastss 0x33dc(%rip),%ymm11 # 657c <_sk_callback_avx+0x329> .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,102,51,0,0 // vbroadcastss 0x3366(%rip),%ymm11 # 6514 <_sk_callback_avx+0x32d> + .byte 196,98,125,24,29,210,51,0,0 // vbroadcastss 0x33d2(%rip),%ymm11 # 6580 <_sk_callback_avx+0x32d> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,87,51,0,0 // vbroadcastss 0x3357(%rip),%ymm11 # 6518 <_sk_callback_avx+0x331> + .byte 196,98,125,24,29,195,51,0,0 // vbroadcastss 0x33c3(%rip),%ymm11 # 6584 <_sk_callback_avx+0x331> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,77,51,0,0 // vbroadcastss 0x334d(%rip),%ymm11 # 651c <_sk_callback_avx+0x335> + .byte 196,98,125,24,29,185,51,0,0 // vbroadcastss 0x33b9(%rip),%ymm11 # 6588 <_sk_callback_avx+0x335> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3 - .byte 196,98,125,24,21,62,51,0,0 // vbroadcastss 0x333e(%rip),%ymm10 # 6520 <_sk_callback_avx+0x339> + .byte 196,98,125,24,21,170,51,0,0 // vbroadcastss 0x33aa(%rip),%ymm10 # 658c <_sk_callback_avx+0x339> .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -16965,7 +17096,7 @@ _sk_parametric_a_avx: .byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3 - .byte 196,98,125,24,5,21,51,0,0 // vbroadcastss 0x3315(%rip),%ymm8 # 6524 <_sk_callback_avx+0x33d> + .byte 196,98,125,24,5,129,51,0,0 // vbroadcastss 0x3381(%rip),%ymm8 # 6590 <_sk_callback_avx+0x33d> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -16974,31 +17105,31 @@ HIDDEN _sk_lab_to_xyz_avx .globl _sk_lab_to_xyz_avx FUNCTION(_sk_lab_to_xyz_avx) _sk_lab_to_xyz_avx: - .byte 196,98,125,24,5,7,51,0,0 // vbroadcastss 0x3307(%rip),%ymm8 # 6528 <_sk_callback_avx+0x341> + .byte 196,98,125,24,5,115,51,0,0 // vbroadcastss 0x3373(%rip),%ymm8 # 6594 <_sk_callback_avx+0x341> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,253,50,0,0 // vbroadcastss 0x32fd(%rip),%ymm8 # 652c <_sk_callback_avx+0x345> + .byte 196,98,125,24,5,105,51,0,0 // vbroadcastss 0x3369(%rip),%ymm8 # 6598 <_sk_callback_avx+0x345> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,13,243,50,0,0 // vbroadcastss 0x32f3(%rip),%ymm9 # 6530 <_sk_callback_avx+0x349> + .byte 196,98,125,24,13,95,51,0,0 // vbroadcastss 0x335f(%rip),%ymm9 # 659c <_sk_callback_avx+0x349> .byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2 - .byte 196,98,125,24,5,223,50,0,0 // vbroadcastss 0x32df(%rip),%ymm8 # 6534 <_sk_callback_avx+0x34d> + .byte 196,98,125,24,5,75,51,0,0 // vbroadcastss 0x334b(%rip),%ymm8 # 65a0 <_sk_callback_avx+0x34d> .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,213,50,0,0 // vbroadcastss 0x32d5(%rip),%ymm8 # 6538 <_sk_callback_avx+0x351> + .byte 196,98,125,24,5,65,51,0,0 // vbroadcastss 0x3341(%rip),%ymm8 # 65a4 <_sk_callback_avx+0x351> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,203,50,0,0 // vbroadcastss 0x32cb(%rip),%ymm8 # 653c <_sk_callback_avx+0x355> + .byte 196,98,125,24,5,55,51,0,0 // vbroadcastss 0x3337(%rip),%ymm8 # 65a8 <_sk_callback_avx+0x355> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 .byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1 - .byte 196,98,125,24,5,189,50,0,0 // vbroadcastss 0x32bd(%rip),%ymm8 # 6540 <_sk_callback_avx+0x359> + .byte 196,98,125,24,5,41,51,0,0 // vbroadcastss 0x3329(%rip),%ymm8 # 65ac <_sk_callback_avx+0x359> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2 .byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8 .byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8 - .byte 196,98,125,24,13,166,50,0,0 // vbroadcastss 0x32a6(%rip),%ymm9 # 6544 <_sk_callback_avx+0x35d> + .byte 196,98,125,24,13,18,51,0,0 // vbroadcastss 0x3312(%rip),%ymm9 # 65b0 <_sk_callback_avx+0x35d> .byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10 - .byte 196,98,125,24,29,155,50,0,0 // vbroadcastss 0x329b(%rip),%ymm11 # 6548 <_sk_callback_avx+0x361> + .byte 196,98,125,24,29,7,51,0,0 // vbroadcastss 0x3307(%rip),%ymm11 # 65b4 <_sk_callback_avx+0x361> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,37,145,50,0,0 // vbroadcastss 0x3291(%rip),%ymm12 # 654c <_sk_callback_avx+0x365> + .byte 196,98,125,24,37,253,50,0,0 // vbroadcastss 0x32fd(%rip),%ymm12 # 65b8 <_sk_callback_avx+0x365> .byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1 .byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8 .byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1 @@ -17013,9 +17144,9 @@ _sk_lab_to_xyz_avx: .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2 .byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2 - .byte 196,226,125,24,5,71,50,0,0 // vbroadcastss 0x3247(%rip),%ymm0 # 6550 <_sk_callback_avx+0x369> + .byte 196,226,125,24,5,179,50,0,0 // vbroadcastss 0x32b3(%rip),%ymm0 # 65bc <_sk_callback_avx+0x369> .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,62,50,0,0 // vbroadcastss 0x323e(%rip),%ymm8 # 6554 <_sk_callback_avx+0x36d> + .byte 196,98,125,24,5,170,50,0,0 // vbroadcastss 0x32aa(%rip),%ymm8 # 65c0 <_sk_callback_avx+0x36d> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -17036,7 +17167,7 @@ _sk_load_a8_avx: .byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,2,50,0,0 // vbroadcastss 0x3202(%rip),%ymm1 # 6558 <_sk_callback_avx+0x371> + .byte 196,226,125,24,13,110,50,0,0 // vbroadcastss 0x326e(%rip),%ymm1 # 65c4 <_sk_callback_avx+0x371> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -17105,7 +17236,7 @@ _sk_gather_a8_avx: .byte 196,226,121,49,201 // vpmovzxbd %xmm1,%xmm1 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,247,48,0,0 // vbroadcastss 0x30f7(%rip),%ymm1 # 655c <_sk_callback_avx+0x375> + .byte 196,226,125,24,13,99,49,0,0 // vbroadcastss 0x3163(%rip),%ymm1 # 65c8 <_sk_callback_avx+0x375> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -17123,7 +17254,7 @@ FUNCTION(_sk_store_a8_avx) _sk_store_a8_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 196,98,125,24,5,210,48,0,0 // vbroadcastss 0x30d2(%rip),%ymm8 # 6560 <_sk_callback_avx+0x379> + .byte 196,98,125,24,5,62,49,0,0 // vbroadcastss 0x313e(%rip),%ymm8 # 65cc <_sk_callback_avx+0x379> .byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8 .byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8 .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 @@ -17194,10 +17325,10 @@ _sk_load_g8_avx: .byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,245,47,0,0 // vbroadcastss 0x2ff5(%rip),%ymm1 # 6564 <_sk_callback_avx+0x37d> + .byte 196,226,125,24,13,97,48,0,0 // vbroadcastss 0x3061(%rip),%ymm1 # 65d0 <_sk_callback_avx+0x37d> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,234,47,0,0 // vbroadcastss 0x2fea(%rip),%ymm3 # 6568 <_sk_callback_avx+0x381> + .byte 196,226,125,24,29,86,48,0,0 // vbroadcastss 0x3056(%rip),%ymm3 # 65d4 <_sk_callback_avx+0x381> .byte 76,137,193 // mov %r8,%rcx .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 @@ -17263,10 +17394,10 @@ _sk_gather_g8_avx: .byte 196,226,121,49,201 // vpmovzxbd %xmm1,%xmm1 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,233,46,0,0 // vbroadcastss 0x2ee9(%rip),%ymm1 # 656c <_sk_callback_avx+0x385> + .byte 196,226,125,24,13,85,47,0,0 // vbroadcastss 0x2f55(%rip),%ymm1 # 65d8 <_sk_callback_avx+0x385> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,222,46,0,0 // vbroadcastss 0x2ede(%rip),%ymm3 # 6570 <_sk_callback_avx+0x389> + .byte 196,226,125,24,29,74,47,0,0 // vbroadcastss 0x2f4a(%rip),%ymm3 # 65dc <_sk_callback_avx+0x389> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 91 // pop %rbx @@ -17346,10 +17477,10 @@ _sk_gather_i8_avx: .byte 196,163,121,34,4,163,2 // vpinsrd $0x2,(%rbx,%r12,4),%xmm0,%xmm0 .byte 196,163,121,34,28,19,3 // vpinsrd $0x3,(%rbx,%r10,1),%xmm0,%xmm3 .byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - .byte 197,124,40,21,226,47,0,0 // vmovaps 0x2fe2(%rip),%ymm10 # 67c0 <_sk_callback_avx+0x5d9> + .byte 197,124,40,21,98,48,0,0 // vmovaps 0x3062(%rip),%ymm10 # 6840 <_sk_callback_avx+0x5ed> .byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,132,45,0,0 // vbroadcastss 0x2d84(%rip),%ymm9 # 6574 <_sk_callback_avx+0x38d> + .byte 196,98,125,24,13,240,45,0,0 // vbroadcastss 0x2df0(%rip),%ymm9 # 65e0 <_sk_callback_avx+0x38d> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1 .byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2 @@ -17389,23 +17520,23 @@ _sk_load_565_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - .byte 196,226,125,24,5,238,44,0,0 // vbroadcastss 0x2cee(%rip),%ymm0 # 6578 <_sk_callback_avx+0x391> + .byte 196,226,125,24,5,90,45,0,0 // vbroadcastss 0x2d5a(%rip),%ymm0 # 65e4 <_sk_callback_avx+0x391> .byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,225,44,0,0 // vbroadcastss 0x2ce1(%rip),%ymm1 # 657c <_sk_callback_avx+0x395> + .byte 196,226,125,24,13,77,45,0,0 // vbroadcastss 0x2d4d(%rip),%ymm1 # 65e8 <_sk_callback_avx+0x395> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,216,44,0,0 // vbroadcastss 0x2cd8(%rip),%ymm1 # 6580 <_sk_callback_avx+0x399> + .byte 196,226,125,24,13,68,45,0,0 // vbroadcastss 0x2d44(%rip),%ymm1 # 65ec <_sk_callback_avx+0x399> .byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,203,44,0,0 // vbroadcastss 0x2ccb(%rip),%ymm3 # 6584 <_sk_callback_avx+0x39d> + .byte 196,226,125,24,29,55,45,0,0 // vbroadcastss 0x2d37(%rip),%ymm3 # 65f0 <_sk_callback_avx+0x39d> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,24,29,194,44,0,0 // vbroadcastss 0x2cc2(%rip),%ymm3 # 6588 <_sk_callback_avx+0x3a1> + .byte 196,226,125,24,29,46,45,0,0 // vbroadcastss 0x2d2e(%rip),%ymm3 # 65f4 <_sk_callback_avx+0x3a1> .byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,181,44,0,0 // vbroadcastss 0x2cb5(%rip),%ymm3 # 658c <_sk_callback_avx+0x3a5> + .byte 196,226,125,24,29,33,45,0,0 // vbroadcastss 0x2d21(%rip),%ymm3 # 65f8 <_sk_callback_avx+0x3a5> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,170,44,0,0 // vbroadcastss 0x2caa(%rip),%ymm3 # 6590 <_sk_callback_avx+0x3a9> + .byte 196,226,125,24,29,22,45,0,0 // vbroadcastss 0x2d16(%rip),%ymm3 # 65fc <_sk_callback_avx+0x3a9> .byte 255,224 // jmpq *%rax .byte 65,137,200 // mov %ecx,%r8d .byte 65,128,224,7 // and $0x7,%r8b @@ -17504,23 +17635,23 @@ _sk_gather_565_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - .byte 196,226,125,24,5,74,43,0,0 // vbroadcastss 0x2b4a(%rip),%ymm0 # 6594 <_sk_callback_avx+0x3ad> + .byte 196,226,125,24,5,182,43,0,0 // vbroadcastss 0x2bb6(%rip),%ymm0 # 6600 <_sk_callback_avx+0x3ad> .byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,61,43,0,0 // vbroadcastss 0x2b3d(%rip),%ymm1 # 6598 <_sk_callback_avx+0x3b1> + .byte 196,226,125,24,13,169,43,0,0 // vbroadcastss 0x2ba9(%rip),%ymm1 # 6604 <_sk_callback_avx+0x3b1> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,52,43,0,0 // vbroadcastss 0x2b34(%rip),%ymm1 # 659c <_sk_callback_avx+0x3b5> + .byte 196,226,125,24,13,160,43,0,0 // vbroadcastss 0x2ba0(%rip),%ymm1 # 6608 <_sk_callback_avx+0x3b5> .byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,39,43,0,0 // vbroadcastss 0x2b27(%rip),%ymm3 # 65a0 <_sk_callback_avx+0x3b9> + .byte 196,226,125,24,29,147,43,0,0 // vbroadcastss 0x2b93(%rip),%ymm3 # 660c <_sk_callback_avx+0x3b9> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,24,29,30,43,0,0 // vbroadcastss 0x2b1e(%rip),%ymm3 # 65a4 <_sk_callback_avx+0x3bd> + .byte 196,226,125,24,29,138,43,0,0 // vbroadcastss 0x2b8a(%rip),%ymm3 # 6610 <_sk_callback_avx+0x3bd> .byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,17,43,0,0 // vbroadcastss 0x2b11(%rip),%ymm3 # 65a8 <_sk_callback_avx+0x3c1> + .byte 196,226,125,24,29,125,43,0,0 // vbroadcastss 0x2b7d(%rip),%ymm3 # 6614 <_sk_callback_avx+0x3c1> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,6,43,0,0 // vbroadcastss 0x2b06(%rip),%ymm3 # 65ac <_sk_callback_avx+0x3c5> + .byte 196,226,125,24,29,114,43,0,0 // vbroadcastss 0x2b72(%rip),%ymm3 # 6618 <_sk_callback_avx+0x3c5> .byte 91 // pop %rbx .byte 65,92 // pop %r12 .byte 65,94 // pop %r14 @@ -17534,14 +17665,14 @@ FUNCTION(_sk_store_565_avx) _sk_store_565_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 196,98,125,24,5,242,42,0,0 // vbroadcastss 0x2af2(%rip),%ymm8 # 65b0 <_sk_callback_avx+0x3c9> + .byte 196,98,125,24,5,94,43,0,0 // vbroadcastss 0x2b5e(%rip),%ymm8 # 661c <_sk_callback_avx+0x3c9> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10 .byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9 .byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9 .byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 - .byte 196,98,125,24,21,203,42,0,0 // vbroadcastss 0x2acb(%rip),%ymm10 # 65b4 <_sk_callback_avx+0x3cd> + .byte 196,98,125,24,21,55,43,0,0 // vbroadcastss 0x2b37(%rip),%ymm10 # 6620 <_sk_callback_avx+0x3cd> .byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10 .byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10 .byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11 @@ -17615,25 +17746,25 @@ _sk_load_4444_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - .byte 196,226,125,24,5,212,41,0,0 // vbroadcastss 0x29d4(%rip),%ymm0 # 65b8 <_sk_callback_avx+0x3d1> + .byte 196,226,125,24,5,64,42,0,0 // vbroadcastss 0x2a40(%rip),%ymm0 # 6624 <_sk_callback_avx+0x3d1> .byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,199,41,0,0 // vbroadcastss 0x29c7(%rip),%ymm1 # 65bc <_sk_callback_avx+0x3d5> + .byte 196,226,125,24,13,51,42,0,0 // vbroadcastss 0x2a33(%rip),%ymm1 # 6628 <_sk_callback_avx+0x3d5> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,190,41,0,0 // vbroadcastss 0x29be(%rip),%ymm1 # 65c0 <_sk_callback_avx+0x3d9> + .byte 196,226,125,24,13,42,42,0,0 // vbroadcastss 0x2a2a(%rip),%ymm1 # 662c <_sk_callback_avx+0x3d9> .byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,177,41,0,0 // vbroadcastss 0x29b1(%rip),%ymm2 # 65c4 <_sk_callback_avx+0x3dd> + .byte 196,226,125,24,21,29,42,0,0 // vbroadcastss 0x2a1d(%rip),%ymm2 # 6630 <_sk_callback_avx+0x3dd> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,168,41,0,0 // vbroadcastss 0x29a8(%rip),%ymm2 # 65c8 <_sk_callback_avx+0x3e1> + .byte 196,226,125,24,21,20,42,0,0 // vbroadcastss 0x2a14(%rip),%ymm2 # 6634 <_sk_callback_avx+0x3e1> .byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,155,41,0,0 // vbroadcastss 0x299b(%rip),%ymm8 # 65cc <_sk_callback_avx+0x3e5> + .byte 196,98,125,24,5,7,42,0,0 // vbroadcastss 0x2a07(%rip),%ymm8 # 6638 <_sk_callback_avx+0x3e5> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,145,41,0,0 // vbroadcastss 0x2991(%rip),%ymm8 # 65d0 <_sk_callback_avx+0x3e9> + .byte 196,98,125,24,5,253,41,0,0 // vbroadcastss 0x29fd(%rip),%ymm8 # 663c <_sk_callback_avx+0x3e9> .byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,131,41,0,0 // vbroadcastss 0x2983(%rip),%ymm8 # 65d4 <_sk_callback_avx+0x3ed> + .byte 196,98,125,24,5,239,41,0,0 // vbroadcastss 0x29ef(%rip),%ymm8 # 6640 <_sk_callback_avx+0x3ed> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -17735,25 +17866,25 @@ _sk_gather_4444_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - .byte 196,226,125,24,5,26,40,0,0 // vbroadcastss 0x281a(%rip),%ymm0 # 65d8 <_sk_callback_avx+0x3f1> + .byte 196,226,125,24,5,134,40,0,0 // vbroadcastss 0x2886(%rip),%ymm0 # 6644 <_sk_callback_avx+0x3f1> .byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,13,40,0,0 // vbroadcastss 0x280d(%rip),%ymm1 # 65dc <_sk_callback_avx+0x3f5> + .byte 196,226,125,24,13,121,40,0,0 // vbroadcastss 0x2879(%rip),%ymm1 # 6648 <_sk_callback_avx+0x3f5> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,4,40,0,0 // vbroadcastss 0x2804(%rip),%ymm1 # 65e0 <_sk_callback_avx+0x3f9> + .byte 196,226,125,24,13,112,40,0,0 // vbroadcastss 0x2870(%rip),%ymm1 # 664c <_sk_callback_avx+0x3f9> .byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,247,39,0,0 // vbroadcastss 0x27f7(%rip),%ymm2 # 65e4 <_sk_callback_avx+0x3fd> + .byte 196,226,125,24,21,99,40,0,0 // vbroadcastss 0x2863(%rip),%ymm2 # 6650 <_sk_callback_avx+0x3fd> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,238,39,0,0 // vbroadcastss 0x27ee(%rip),%ymm2 # 65e8 <_sk_callback_avx+0x401> + .byte 196,226,125,24,21,90,40,0,0 // vbroadcastss 0x285a(%rip),%ymm2 # 6654 <_sk_callback_avx+0x401> .byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,225,39,0,0 // vbroadcastss 0x27e1(%rip),%ymm8 # 65ec <_sk_callback_avx+0x405> + .byte 196,98,125,24,5,77,40,0,0 // vbroadcastss 0x284d(%rip),%ymm8 # 6658 <_sk_callback_avx+0x405> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,215,39,0,0 // vbroadcastss 0x27d7(%rip),%ymm8 # 65f0 <_sk_callback_avx+0x409> + .byte 196,98,125,24,5,67,40,0,0 // vbroadcastss 0x2843(%rip),%ymm8 # 665c <_sk_callback_avx+0x409> .byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,201,39,0,0 // vbroadcastss 0x27c9(%rip),%ymm8 # 65f4 <_sk_callback_avx+0x40d> + .byte 196,98,125,24,5,53,40,0,0 // vbroadcastss 0x2835(%rip),%ymm8 # 6660 <_sk_callback_avx+0x40d> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx @@ -17769,7 +17900,7 @@ FUNCTION(_sk_store_4444_avx) _sk_store_4444_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 196,98,125,24,5,174,39,0,0 // vbroadcastss 0x27ae(%rip),%ymm8 # 65f8 <_sk_callback_avx+0x411> + .byte 196,98,125,24,5,26,40,0,0 // vbroadcastss 0x281a(%rip),%ymm8 # 6664 <_sk_callback_avx+0x411> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10 @@ -17852,10 +17983,10 @@ _sk_load_8888_avx: .byte 77,133,192 // test %r8,%r8 .byte 15,133,137,0,0,0 // jne 3ffe <_sk_load_8888_avx+0xa2> .byte 196,193,124,16,25 // vmovups (%r9),%ymm3 - .byte 197,124,40,21,94,40,0,0 // vmovaps 0x285e(%rip),%ymm10 # 67e0 <_sk_callback_avx+0x5f9> + .byte 197,124,40,21,222,40,0,0 // vmovaps 0x28de(%rip),%ymm10 # 6860 <_sk_callback_avx+0x60d> .byte 196,193,100,84,194 // vandps %ymm10,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,104,38,0,0 // vbroadcastss 0x2668(%rip),%ymm8 # 65fc <_sk_callback_avx+0x415> + .byte 196,98,125,24,5,212,38,0,0 // vbroadcastss 0x26d4(%rip),%ymm8 # 6668 <_sk_callback_avx+0x415> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1 .byte 196,195,125,25,217,1 // vextractf128 $0x1,%ymm3,%xmm9 @@ -17885,9 +18016,9 @@ _sk_load_8888_avx: .byte 72,211,232 // shr %cl,%rax .byte 196,225,249,110,192 // vmovq %rax,%xmm0 .byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0 - .byte 196,226,121,0,13,58,39,0,0 // vpshufb 0x273a(%rip),%xmm0,%xmm1 # 6760 <_sk_callback_avx+0x579> + .byte 196,226,121,0,13,170,39,0,0 // vpshufb 0x27aa(%rip),%xmm0,%xmm1 # 67d0 <_sk_callback_avx+0x57d> .byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1 - .byte 196,226,121,0,5,60,39,0,0 // vpshufb 0x273c(%rip),%xmm0,%xmm0 # 6770 <_sk_callback_avx+0x589> + .byte 196,226,121,0,5,172,39,0,0 // vpshufb 0x27ac(%rip),%xmm0,%xmm0 # 67e0 <_sk_callback_avx+0x58d> .byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 196,194,125,44,25 // vmaskmovps (%r9),%ymm0,%ymm3 @@ -17934,10 +18065,10 @@ _sk_gather_8888_avx: .byte 196,131,121,34,4,152,2 // vpinsrd $0x2,(%r8,%r11,4),%xmm0,%xmm0 .byte 196,131,121,34,28,144,3 // vpinsrd $0x3,(%r8,%r10,4),%xmm0,%xmm3 .byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - .byte 197,124,40,21,5,39,0,0 // vmovaps 0x2705(%rip),%ymm10 # 6800 <_sk_callback_avx+0x619> + .byte 197,124,40,21,133,39,0,0 // vmovaps 0x2785(%rip),%ymm10 # 6880 <_sk_callback_avx+0x62d> .byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,243,36,0,0 // vbroadcastss 0x24f3(%rip),%ymm9 # 6600 <_sk_callback_avx+0x419> + .byte 196,98,125,24,13,95,37,0,0 // vbroadcastss 0x255f(%rip),%ymm9 # 666c <_sk_callback_avx+0x419> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1 .byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2 @@ -17971,7 +18102,7 @@ _sk_store_8888_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,141,12,189,0,0,0,0 // lea 0x0(,%rdi,4),%r9 .byte 76,3,8 // add (%rax),%r9 - .byte 196,98,125,24,5,118,36,0,0 // vbroadcastss 0x2476(%rip),%ymm8 # 6604 <_sk_callback_avx+0x41d> + .byte 196,98,125,24,5,226,36,0,0 // vbroadcastss 0x24e2(%rip),%ymm8 # 6670 <_sk_callback_avx+0x41d> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10 @@ -18008,9 +18139,9 @@ _sk_store_8888_avx: .byte 72,211,232 // shr %cl,%rax .byte 196,97,249,110,200 // vmovq %rax,%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 - .byte 196,98,49,0,21,58,37,0,0 // vpshufb 0x253a(%rip),%xmm9,%xmm10 # 6780 <_sk_callback_avx+0x599> + .byte 196,98,49,0,21,170,37,0,0 // vpshufb 0x25aa(%rip),%xmm9,%xmm10 # 67f0 <_sk_callback_avx+0x59d> .byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10 - .byte 196,98,49,0,13,60,37,0,0 // vpshufb 0x253c(%rip),%xmm9,%xmm9 # 6790 <_sk_callback_avx+0x5a9> + .byte 196,98,49,0,13,172,37,0,0 // vpshufb 0x25ac(%rip),%xmm9,%xmm9 # 6800 <_sk_callback_avx+0x5ad> .byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9 .byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 .byte 196,66,53,46,1 // vmaskmovps %ymm8,%ymm9,(%r9) @@ -18046,13 +18177,13 @@ _sk_load_f16_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 - .byte 196,98,125,24,37,31,35,0,0 // vbroadcastss 0x231f(%rip),%ymm12 # 6608 <_sk_callback_avx+0x421> + .byte 196,98,125,24,37,139,35,0,0 // vbroadcastss 0x238b(%rip),%ymm12 # 6674 <_sk_callback_avx+0x421> .byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1 .byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0 .byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14 - .byte 196,98,121,24,29,11,35,0,0 // vbroadcastss 0x230b(%rip),%xmm11 # 660c <_sk_callback_avx+0x425> + .byte 196,98,121,24,29,119,35,0,0 // vbroadcastss 0x2377(%rip),%xmm11 # 6678 <_sk_callback_avx+0x425> .byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3 - .byte 196,98,121,24,45,1,35,0,0 // vbroadcastss 0x2301(%rip),%xmm13 # 6610 <_sk_callback_avx+0x429> + .byte 196,98,121,24,45,109,35,0,0 // vbroadcastss 0x236d(%rip),%xmm13 # 667c <_sk_callback_avx+0x429> .byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3 .byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10 .byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -18066,7 +18197,7 @@ _sk_load_f16_avx: .byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 .byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0 .byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1 - .byte 196,226,121,24,29,183,34,0,0 // vbroadcastss 0x22b7(%rip),%xmm3 # 6614 <_sk_callback_avx+0x42d> + .byte 196,226,121,24,29,35,35,0,0 // vbroadcastss 0x2323(%rip),%xmm3 # 6680 <_sk_callback_avx+0x42d> .byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1 .byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 @@ -18245,13 +18376,13 @@ _sk_gather_f16_avx: .byte 197,249,105,210 // vpunpckhwd %xmm2,%xmm0,%xmm2 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,194,1 // vinsertf128 $0x1,%xmm2,%ymm0,%ymm0 - .byte 196,98,125,24,37,123,31,0,0 // vbroadcastss 0x1f7b(%rip),%ymm12 # 6618 <_sk_callback_avx+0x431> + .byte 196,98,125,24,37,231,31,0,0 // vbroadcastss 0x1fe7(%rip),%ymm12 # 6684 <_sk_callback_avx+0x431> .byte 196,193,124,84,212 // vandps %ymm12,%ymm0,%ymm2 .byte 197,252,87,194 // vxorps %ymm2,%ymm0,%ymm0 .byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14 - .byte 196,98,121,24,29,103,31,0,0 // vbroadcastss 0x1f67(%rip),%xmm11 # 661c <_sk_callback_avx+0x435> + .byte 196,98,121,24,29,211,31,0,0 // vbroadcastss 0x1fd3(%rip),%xmm11 # 6688 <_sk_callback_avx+0x435> .byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3 - .byte 196,98,121,24,45,93,31,0,0 // vbroadcastss 0x1f5d(%rip),%xmm13 # 6620 <_sk_callback_avx+0x439> + .byte 196,98,121,24,45,201,31,0,0 // vbroadcastss 0x1fc9(%rip),%xmm13 # 668c <_sk_callback_avx+0x439> .byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3 .byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10 .byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -18265,7 +18396,7 @@ _sk_gather_f16_avx: .byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 .byte 197,252,86,194 // vorps %ymm2,%ymm0,%ymm0 .byte 196,227,125,25,194,1 // vextractf128 $0x1,%ymm0,%xmm2 - .byte 196,226,121,24,29,19,31,0,0 // vbroadcastss 0x1f13(%rip),%xmm3 # 6624 <_sk_callback_avx+0x43d> + .byte 196,226,121,24,29,127,31,0,0 // vbroadcastss 0x1f7f(%rip),%xmm3 # 6690 <_sk_callback_avx+0x43d> .byte 197,233,254,211 // vpaddd %xmm3,%xmm2,%xmm2 .byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0 .byte 196,227,125,24,194,1 // vinsertf128 $0x1,%xmm2,%ymm0,%ymm0 @@ -18369,12 +18500,12 @@ _sk_store_f16_avx: .byte 197,252,17,52,36 // vmovups %ymm6,(%rsp) .byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp) .byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp) - .byte 196,98,125,24,13,44,29,0,0 // vbroadcastss 0x1d2c(%rip),%ymm9 # 6628 <_sk_callback_avx+0x441> + .byte 196,98,125,24,13,152,29,0,0 // vbroadcastss 0x1d98(%rip),%ymm9 # 6694 <_sk_callback_avx+0x441> .byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10 .byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp) .byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11 .byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12 - .byte 196,98,121,24,5,17,29,0,0 // vbroadcastss 0x1d11(%rip),%xmm8 # 662c <_sk_callback_avx+0x445> + .byte 196,98,121,24,5,125,29,0,0 // vbroadcastss 0x1d7d(%rip),%xmm8 # 6698 <_sk_callback_avx+0x445> .byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13 .byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14 .byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13 @@ -18384,7 +18515,7 @@ _sk_store_f16_avx: .byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14 .byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11 .byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12 - .byte 196,98,125,24,21,216,28,0,0 // vbroadcastss 0x1cd8(%rip),%ymm10 # 6630 <_sk_callback_avx+0x449> + .byte 196,98,125,24,21,68,29,0,0 // vbroadcastss 0x1d44(%rip),%ymm10 # 669c <_sk_callback_avx+0x449> .byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14 .byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15 .byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12 @@ -18529,7 +18660,7 @@ _sk_load_u16_be_avx: .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,29,48,26,0,0 // vbroadcastss 0x1a30(%rip),%ymm11 # 6634 <_sk_callback_avx+0x44d> + .byte 196,98,125,24,29,156,26,0,0 // vbroadcastss 0x1a9c(%rip),%ymm11 # 66a0 <_sk_callback_avx+0x44d> .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -18622,7 +18753,7 @@ _sk_load_rgb_u16_be_avx: .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,29,144,24,0,0 // vbroadcastss 0x1890(%rip),%ymm11 # 6638 <_sk_callback_avx+0x451> + .byte 196,98,125,24,29,252,24,0,0 // vbroadcastss 0x18fc(%rip),%ymm11 # 66a4 <_sk_callback_avx+0x451> .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -18643,7 +18774,7 @@ _sk_load_rgb_u16_be_avx: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,45,24,0,0 // vbroadcastss 0x182d(%rip),%ymm3 # 663c <_sk_callback_avx+0x455> + .byte 196,226,125,24,29,153,24,0,0 // vbroadcastss 0x1899(%rip),%ymm3 # 66a8 <_sk_callback_avx+0x455> .byte 255,224 // jmpq *%rax .byte 196,193,121,110,4,64 // vmovd (%r8,%rax,2),%xmm0 .byte 196,193,121,196,68,64,4,2 // vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm0 @@ -18686,7 +18817,7 @@ _sk_store_u16_be_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,0 // mov (%rax),%r8 .byte 72,141,4,189,0,0,0,0 // lea 0x0(,%rdi,4),%rax - .byte 196,98,125,24,5,106,23,0,0 // vbroadcastss 0x176a(%rip),%ymm8 # 6640 <_sk_callback_avx+0x459> + .byte 196,98,125,24,5,214,23,0,0 // vbroadcastss 0x17d6(%rip),%ymm8 # 66ac <_sk_callback_avx+0x459> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10 @@ -18948,16 +19079,54 @@ _sk_mirror_y_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax +HIDDEN _sk_clamp_x_1_avx +.globl _sk_clamp_x_1_avx +FUNCTION(_sk_clamp_x_1_avx) +_sk_clamp_x_1_avx: + .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 + .byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0 + .byte 196,98,125,24,5,242,19,0,0 // vbroadcastss 0x13f2(%rip),%ymm8 # 66b0 <_sk_callback_avx+0x45d> + .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + +HIDDEN _sk_repeat_x_1_avx +.globl _sk_repeat_x_1_avx +FUNCTION(_sk_repeat_x_1_avx) +_sk_repeat_x_1_avx: + .byte 196,99,125,8,192,1 // vroundps $0x1,%ymm0,%ymm8 + .byte 196,193,124,92,192 // vsubps %ymm8,%ymm0,%ymm0 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + +HIDDEN _sk_mirror_x_1_avx +.globl _sk_mirror_x_1_avx +FUNCTION(_sk_mirror_x_1_avx) +_sk_mirror_x_1_avx: + .byte 196,98,125,24,5,213,19,0,0 // vbroadcastss 0x13d5(%rip),%ymm8 # 66b4 <_sk_callback_avx+0x461> + .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 + .byte 196,98,125,24,13,203,19,0,0 // vbroadcastss 0x13cb(%rip),%ymm9 # 66b8 <_sk_callback_avx+0x465> + .byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9 + .byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9 + .byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9 + .byte 196,193,124,92,193 // vsubps %ymm9,%ymm0,%ymm0 + .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 + .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 + .byte 197,60,92,192 // vsubps %ymm0,%ymm8,%ymm8 + .byte 197,188,84,192 // vandps %ymm0,%ymm8,%ymm0 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + HIDDEN _sk_luminance_to_alpha_avx .globl _sk_luminance_to_alpha_avx FUNCTION(_sk_luminance_to_alpha_avx) _sk_luminance_to_alpha_avx: - .byte 196,226,125,24,29,143,19,0,0 // vbroadcastss 0x138f(%rip),%ymm3 # 6644 <_sk_callback_avx+0x45d> + .byte 196,226,125,24,29,155,19,0,0 // vbroadcastss 0x139b(%rip),%ymm3 # 66bc <_sk_callback_avx+0x469> .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,29,134,19,0,0 // vbroadcastss 0x1386(%rip),%ymm3 # 6648 <_sk_callback_avx+0x461> + .byte 196,226,125,24,29,146,19,0,0 // vbroadcastss 0x1392(%rip),%ymm3 # 66c0 <_sk_callback_avx+0x46d> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,121,19,0,0 // vbroadcastss 0x1379(%rip),%ymm1 # 664c <_sk_callback_avx+0x465> + .byte 196,226,125,24,13,133,19,0,0 // vbroadcastss 0x1385(%rip),%ymm1 # 66c4 <_sk_callback_avx+0x471> .byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1 .byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -19176,9 +19345,9 @@ _sk_evenly_spaced_gradient_avx: .byte 72,139,24 // mov (%rax),%rbx .byte 72,139,104,8 // mov 0x8(%rax),%rbp .byte 72,255,203 // dec %rbx - .byte 120,7 // js 5629 <_sk_evenly_spaced_gradient_avx+0x1f> + .byte 120,7 // js 5695 <_sk_evenly_spaced_gradient_avx+0x1f> .byte 196,225,242,42,203 // vcvtsi2ss %rbx,%xmm1,%xmm1 - .byte 235,21 // jmp 563e <_sk_evenly_spaced_gradient_avx+0x34> + .byte 235,21 // jmp 56aa <_sk_evenly_spaced_gradient_avx+0x34> .byte 73,137,216 // mov %rbx,%r8 .byte 73,209,232 // shr %r8 .byte 131,227,1 // and $0x1,%ebx @@ -19345,12 +19514,12 @@ _sk_gradient_avx: .byte 76,139,0 // mov (%rax),%r8 .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 73,131,248,2 // cmp $0x2,%r8 - .byte 114,80 // jb 59cc <_sk_gradient_avx+0x69> + .byte 114,80 // jb 5a38 <_sk_gradient_avx+0x69> .byte 72,139,88,72 // mov 0x48(%rax),%rbx .byte 73,255,200 // dec %r8 .byte 72,131,195,4 // add $0x4,%rbx .byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9 - .byte 196,98,125,24,21,187,12,0,0 // vbroadcastss 0xcbb(%rip),%ymm10 # 6650 <_sk_callback_avx+0x469> + .byte 196,98,125,24,21,199,12,0,0 // vbroadcastss 0xcc7(%rip),%ymm10 # 66c8 <_sk_callback_avx+0x475> .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 196,98,125,24,3 // vbroadcastss (%rbx),%ymm8 .byte 197,60,194,192,2 // vcmpleps %ymm0,%ymm8,%ymm8 @@ -19362,7 +19531,7 @@ _sk_gradient_avx: .byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1 .byte 72,131,195,4 // add $0x4,%rbx .byte 73,255,200 // dec %r8 - .byte 117,205 // jne 5999 <_sk_gradient_avx+0x36> + .byte 117,205 // jne 5a05 <_sk_gradient_avx+0x36> .byte 196,195,249,22,200,1 // vpextrq $0x1,%xmm1,%r8 .byte 69,137,193 // mov %r8d,%r9d .byte 73,193,232,32 // shr $0x20,%r8 @@ -19544,27 +19713,27 @@ _sk_xy_to_unit_angle_avx: .byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12 .byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11 .byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12 - .byte 196,98,125,24,45,223,8,0,0 // vbroadcastss 0x8df(%rip),%ymm13 # 6654 <_sk_callback_avx+0x46d> + .byte 196,98,125,24,45,235,8,0,0 // vbroadcastss 0x8eb(%rip),%ymm13 # 66cc <_sk_callback_avx+0x479> .byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13 - .byte 196,98,125,24,53,213,8,0,0 // vbroadcastss 0x8d5(%rip),%ymm14 # 6658 <_sk_callback_avx+0x471> + .byte 196,98,125,24,53,225,8,0,0 // vbroadcastss 0x8e1(%rip),%ymm14 # 66d0 <_sk_callback_avx+0x47d> .byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13 .byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13 - .byte 196,98,125,24,53,198,8,0,0 // vbroadcastss 0x8c6(%rip),%ymm14 # 665c <_sk_callback_avx+0x475> + .byte 196,98,125,24,53,210,8,0,0 // vbroadcastss 0x8d2(%rip),%ymm14 # 66d4 <_sk_callback_avx+0x481> .byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13 .byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12 - .byte 196,98,125,24,45,183,8,0,0 // vbroadcastss 0x8b7(%rip),%ymm13 # 6660 <_sk_callback_avx+0x479> + .byte 196,98,125,24,45,195,8,0,0 // vbroadcastss 0x8c3(%rip),%ymm13 # 66d8 <_sk_callback_avx+0x485> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 .byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,162,8,0,0 // vbroadcastss 0x8a2(%rip),%ymm10 # 6664 <_sk_callback_avx+0x47d> + .byte 196,98,125,24,21,174,8,0,0 // vbroadcastss 0x8ae(%rip),%ymm10 # 66dc <_sk_callback_avx+0x489> .byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10 .byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9 .byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,21,140,8,0,0 // vbroadcastss 0x88c(%rip),%ymm10 # 6668 <_sk_callback_avx+0x481> + .byte 196,98,125,24,21,152,8,0,0 // vbroadcastss 0x898(%rip),%ymm10 # 66e0 <_sk_callback_avx+0x48d> .byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9 - .byte 196,98,125,24,21,118,8,0,0 // vbroadcastss 0x876(%rip),%ymm10 # 666c <_sk_callback_avx+0x485> + .byte 196,98,125,24,21,130,8,0,0 // vbroadcastss 0x882(%rip),%ymm10 # 66e4 <_sk_callback_avx+0x491> .byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10 .byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0 .byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9 @@ -19588,7 +19757,7 @@ HIDDEN _sk_save_xy_avx FUNCTION(_sk_save_xy_avx) _sk_save_xy_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,64,8,0,0 // vbroadcastss 0x840(%rip),%ymm8 # 6670 <_sk_callback_avx+0x489> + .byte 196,98,125,24,5,76,8,0,0 // vbroadcastss 0x84c(%rip),%ymm8 # 66e8 <_sk_callback_avx+0x495> .byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9 .byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 @@ -19625,9 +19794,9 @@ HIDDEN _sk_bilinear_nx_avx FUNCTION(_sk_bilinear_nx_avx) _sk_bilinear_nx_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,204,7,0,0 // vbroadcastss 0x7cc(%rip),%ymm0 # 6674 <_sk_callback_avx+0x48d> + .byte 196,226,125,24,5,216,7,0,0 // vbroadcastss 0x7d8(%rip),%ymm0 # 66ec <_sk_callback_avx+0x499> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,195,7,0,0 // vbroadcastss 0x7c3(%rip),%ymm8 # 6678 <_sk_callback_avx+0x491> + .byte 196,98,125,24,5,207,7,0,0 // vbroadcastss 0x7cf(%rip),%ymm8 # 66f0 <_sk_callback_avx+0x49d> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -19638,7 +19807,7 @@ HIDDEN _sk_bilinear_px_avx FUNCTION(_sk_bilinear_px_avx) _sk_bilinear_px_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,171,7,0,0 // vbroadcastss 0x7ab(%rip),%ymm0 # 667c <_sk_callback_avx+0x495> + .byte 196,226,125,24,5,183,7,0,0 // vbroadcastss 0x7b7(%rip),%ymm0 # 66f4 <_sk_callback_avx+0x4a1> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -19650,9 +19819,9 @@ HIDDEN _sk_bilinear_ny_avx FUNCTION(_sk_bilinear_ny_avx) _sk_bilinear_ny_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,143,7,0,0 // vbroadcastss 0x78f(%rip),%ymm1 # 6680 <_sk_callback_avx+0x499> + .byte 196,226,125,24,13,155,7,0,0 // vbroadcastss 0x79b(%rip),%ymm1 # 66f8 <_sk_callback_avx+0x4a5> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,133,7,0,0 // vbroadcastss 0x785(%rip),%ymm8 # 6684 <_sk_callback_avx+0x49d> + .byte 196,98,125,24,5,145,7,0,0 // vbroadcastss 0x791(%rip),%ymm8 # 66fc <_sk_callback_avx+0x4a9> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -19663,7 +19832,7 @@ HIDDEN _sk_bilinear_py_avx FUNCTION(_sk_bilinear_py_avx) _sk_bilinear_py_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,109,7,0,0 // vbroadcastss 0x76d(%rip),%ymm1 # 6688 <_sk_callback_avx+0x4a1> + .byte 196,226,125,24,13,121,7,0,0 // vbroadcastss 0x779(%rip),%ymm1 # 6700 <_sk_callback_avx+0x4ad> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -19675,14 +19844,14 @@ HIDDEN _sk_bicubic_n3x_avx FUNCTION(_sk_bicubic_n3x_avx) _sk_bicubic_n3x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,80,7,0,0 // vbroadcastss 0x750(%rip),%ymm0 # 668c <_sk_callback_avx+0x4a5> + .byte 196,226,125,24,5,92,7,0,0 // vbroadcastss 0x75c(%rip),%ymm0 # 6704 <_sk_callback_avx+0x4b1> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,71,7,0,0 // vbroadcastss 0x747(%rip),%ymm8 # 6690 <_sk_callback_avx+0x4a9> + .byte 196,98,125,24,5,83,7,0,0 // vbroadcastss 0x753(%rip),%ymm8 # 6708 <_sk_callback_avx+0x4b5> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,56,7,0,0 // vbroadcastss 0x738(%rip),%ymm10 # 6694 <_sk_callback_avx+0x4ad> + .byte 196,98,125,24,21,68,7,0,0 // vbroadcastss 0x744(%rip),%ymm10 # 670c <_sk_callback_avx+0x4b9> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,46,7,0,0 // vbroadcastss 0x72e(%rip),%ymm10 # 6698 <_sk_callback_avx+0x4b1> + .byte 196,98,125,24,21,58,7,0,0 // vbroadcastss 0x73a(%rip),%ymm10 # 6710 <_sk_callback_avx+0x4bd> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -19694,19 +19863,19 @@ HIDDEN _sk_bicubic_n1x_avx FUNCTION(_sk_bicubic_n1x_avx) _sk_bicubic_n1x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,17,7,0,0 // vbroadcastss 0x711(%rip),%ymm0 # 669c <_sk_callback_avx+0x4b5> + .byte 196,226,125,24,5,29,7,0,0 // vbroadcastss 0x71d(%rip),%ymm0 # 6714 <_sk_callback_avx+0x4c1> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,8,7,0,0 // vbroadcastss 0x708(%rip),%ymm8 # 66a0 <_sk_callback_avx+0x4b9> + .byte 196,98,125,24,5,20,7,0,0 // vbroadcastss 0x714(%rip),%ymm8 # 6718 <_sk_callback_avx+0x4c5> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,254,6,0,0 // vbroadcastss 0x6fe(%rip),%ymm9 # 66a4 <_sk_callback_avx+0x4bd> + .byte 196,98,125,24,13,10,7,0,0 // vbroadcastss 0x70a(%rip),%ymm9 # 671c <_sk_callback_avx+0x4c9> .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,244,6,0,0 // vbroadcastss 0x6f4(%rip),%ymm10 # 66a8 <_sk_callback_avx+0x4c1> + .byte 196,98,125,24,21,0,7,0,0 // vbroadcastss 0x700(%rip),%ymm10 # 6720 <_sk_callback_avx+0x4cd> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,229,6,0,0 // vbroadcastss 0x6e5(%rip),%ymm10 # 66ac <_sk_callback_avx+0x4c5> + .byte 196,98,125,24,21,241,6,0,0 // vbroadcastss 0x6f1(%rip),%ymm10 # 6724 <_sk_callback_avx+0x4d1> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,214,6,0,0 // vbroadcastss 0x6d6(%rip),%ymm9 # 66b0 <_sk_callback_avx+0x4c9> + .byte 196,98,125,24,13,226,6,0,0 // vbroadcastss 0x6e2(%rip),%ymm9 # 6728 <_sk_callback_avx+0x4d5> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -19717,17 +19886,17 @@ HIDDEN _sk_bicubic_p1x_avx FUNCTION(_sk_bicubic_p1x_avx) _sk_bicubic_p1x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,190,6,0,0 // vbroadcastss 0x6be(%rip),%ymm8 # 66b4 <_sk_callback_avx+0x4cd> + .byte 196,98,125,24,5,202,6,0,0 // vbroadcastss 0x6ca(%rip),%ymm8 # 672c <_sk_callback_avx+0x4d9> .byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0 .byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9 - .byte 196,98,125,24,21,176,6,0,0 // vbroadcastss 0x6b0(%rip),%ymm10 # 66b8 <_sk_callback_avx+0x4d1> + .byte 196,98,125,24,21,188,6,0,0 // vbroadcastss 0x6bc(%rip),%ymm10 # 6730 <_sk_callback_avx+0x4dd> .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 - .byte 196,98,125,24,29,166,6,0,0 // vbroadcastss 0x6a6(%rip),%ymm11 # 66bc <_sk_callback_avx+0x4d5> + .byte 196,98,125,24,29,178,6,0,0 // vbroadcastss 0x6b2(%rip),%ymm11 # 6734 <_sk_callback_avx+0x4e1> .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 .byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 - .byte 196,98,125,24,13,141,6,0,0 // vbroadcastss 0x68d(%rip),%ymm9 # 66c0 <_sk_callback_avx+0x4d9> + .byte 196,98,125,24,13,153,6,0,0 // vbroadcastss 0x699(%rip),%ymm9 # 6738 <_sk_callback_avx+0x4e5> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -19738,13 +19907,13 @@ HIDDEN _sk_bicubic_p3x_avx FUNCTION(_sk_bicubic_p3x_avx) _sk_bicubic_p3x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,117,6,0,0 // vbroadcastss 0x675(%rip),%ymm0 # 66c4 <_sk_callback_avx+0x4dd> + .byte 196,226,125,24,5,129,6,0,0 // vbroadcastss 0x681(%rip),%ymm0 # 673c <_sk_callback_avx+0x4e9> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,98,6,0,0 // vbroadcastss 0x662(%rip),%ymm10 # 66c8 <_sk_callback_avx+0x4e1> + .byte 196,98,125,24,21,110,6,0,0 // vbroadcastss 0x66e(%rip),%ymm10 # 6740 <_sk_callback_avx+0x4ed> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,88,6,0,0 // vbroadcastss 0x658(%rip),%ymm10 # 66cc <_sk_callback_avx+0x4e5> + .byte 196,98,125,24,21,100,6,0,0 // vbroadcastss 0x664(%rip),%ymm10 # 6744 <_sk_callback_avx+0x4f1> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -19756,14 +19925,14 @@ HIDDEN _sk_bicubic_n3y_avx FUNCTION(_sk_bicubic_n3y_avx) _sk_bicubic_n3y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,59,6,0,0 // vbroadcastss 0x63b(%rip),%ymm1 # 66d0 <_sk_callback_avx+0x4e9> + .byte 196,226,125,24,13,71,6,0,0 // vbroadcastss 0x647(%rip),%ymm1 # 6748 <_sk_callback_avx+0x4f5> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,49,6,0,0 // vbroadcastss 0x631(%rip),%ymm8 # 66d4 <_sk_callback_avx+0x4ed> + .byte 196,98,125,24,5,61,6,0,0 // vbroadcastss 0x63d(%rip),%ymm8 # 674c <_sk_callback_avx+0x4f9> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,34,6,0,0 // vbroadcastss 0x622(%rip),%ymm10 # 66d8 <_sk_callback_avx+0x4f1> + .byte 196,98,125,24,21,46,6,0,0 // vbroadcastss 0x62e(%rip),%ymm10 # 6750 <_sk_callback_avx+0x4fd> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,24,6,0,0 // vbroadcastss 0x618(%rip),%ymm10 # 66dc <_sk_callback_avx+0x4f5> + .byte 196,98,125,24,21,36,6,0,0 // vbroadcastss 0x624(%rip),%ymm10 # 6754 <_sk_callback_avx+0x501> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -19775,19 +19944,19 @@ HIDDEN _sk_bicubic_n1y_avx FUNCTION(_sk_bicubic_n1y_avx) _sk_bicubic_n1y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,251,5,0,0 // vbroadcastss 0x5fb(%rip),%ymm1 # 66e0 <_sk_callback_avx+0x4f9> + .byte 196,226,125,24,13,7,6,0,0 // vbroadcastss 0x607(%rip),%ymm1 # 6758 <_sk_callback_avx+0x505> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,241,5,0,0 // vbroadcastss 0x5f1(%rip),%ymm8 # 66e4 <_sk_callback_avx+0x4fd> + .byte 196,98,125,24,5,253,5,0,0 // vbroadcastss 0x5fd(%rip),%ymm8 # 675c <_sk_callback_avx+0x509> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,231,5,0,0 // vbroadcastss 0x5e7(%rip),%ymm9 # 66e8 <_sk_callback_avx+0x501> + .byte 196,98,125,24,13,243,5,0,0 // vbroadcastss 0x5f3(%rip),%ymm9 # 6760 <_sk_callback_avx+0x50d> .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,221,5,0,0 // vbroadcastss 0x5dd(%rip),%ymm10 # 66ec <_sk_callback_avx+0x505> + .byte 196,98,125,24,21,233,5,0,0 // vbroadcastss 0x5e9(%rip),%ymm10 # 6764 <_sk_callback_avx+0x511> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,206,5,0,0 // vbroadcastss 0x5ce(%rip),%ymm10 # 66f0 <_sk_callback_avx+0x509> + .byte 196,98,125,24,21,218,5,0,0 // vbroadcastss 0x5da(%rip),%ymm10 # 6768 <_sk_callback_avx+0x515> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,191,5,0,0 // vbroadcastss 0x5bf(%rip),%ymm9 # 66f4 <_sk_callback_avx+0x50d> + .byte 196,98,125,24,13,203,5,0,0 // vbroadcastss 0x5cb(%rip),%ymm9 # 676c <_sk_callback_avx+0x519> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -19798,17 +19967,17 @@ HIDDEN _sk_bicubic_p1y_avx FUNCTION(_sk_bicubic_p1y_avx) _sk_bicubic_p1y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,167,5,0,0 // vbroadcastss 0x5a7(%rip),%ymm8 # 66f8 <_sk_callback_avx+0x511> + .byte 196,98,125,24,5,179,5,0,0 // vbroadcastss 0x5b3(%rip),%ymm8 # 6770 <_sk_callback_avx+0x51d> .byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1 .byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9 - .byte 196,98,125,24,21,152,5,0,0 // vbroadcastss 0x598(%rip),%ymm10 # 66fc <_sk_callback_avx+0x515> + .byte 196,98,125,24,21,164,5,0,0 // vbroadcastss 0x5a4(%rip),%ymm10 # 6774 <_sk_callback_avx+0x521> .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 - .byte 196,98,125,24,29,142,5,0,0 // vbroadcastss 0x58e(%rip),%ymm11 # 6700 <_sk_callback_avx+0x519> + .byte 196,98,125,24,29,154,5,0,0 // vbroadcastss 0x59a(%rip),%ymm11 # 6778 <_sk_callback_avx+0x525> .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 .byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 - .byte 196,98,125,24,13,117,5,0,0 // vbroadcastss 0x575(%rip),%ymm9 # 6704 <_sk_callback_avx+0x51d> + .byte 196,98,125,24,13,129,5,0,0 // vbroadcastss 0x581(%rip),%ymm9 # 677c <_sk_callback_avx+0x529> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -19819,13 +19988,13 @@ HIDDEN _sk_bicubic_p3y_avx FUNCTION(_sk_bicubic_p3y_avx) _sk_bicubic_p3y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,93,5,0,0 // vbroadcastss 0x55d(%rip),%ymm1 # 6708 <_sk_callback_avx+0x521> + .byte 196,226,125,24,13,105,5,0,0 // vbroadcastss 0x569(%rip),%ymm1 # 6780 <_sk_callback_avx+0x52d> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,73,5,0,0 // vbroadcastss 0x549(%rip),%ymm10 # 670c <_sk_callback_avx+0x525> + .byte 196,98,125,24,21,85,5,0,0 // vbroadcastss 0x555(%rip),%ymm10 # 6784 <_sk_callback_avx+0x531> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,63,5,0,0 // vbroadcastss 0x53f(%rip),%ymm10 # 6710 <_sk_callback_avx+0x529> + .byte 196,98,125,24,21,75,5,0,0 // vbroadcastss 0x54b(%rip),%ymm10 # 6788 <_sk_callback_avx+0x535> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -19949,25 +20118,25 @@ BALIGN4 .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 63bd <.literal4+0xb1> + .byte 71,225,61 // rex.RXB loope 6429 <.literal4+0xb1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 63cd <.literal4+0xc1> + .byte 71,225,61 // rex.RXB loope 6439 <.literal4+0xc1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 63dd <.literal4+0xd1> + .byte 71,225,61 // rex.RXB loope 6449 <.literal4+0xd1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 63ed <.literal4+0xe1> + .byte 71,225,61 // rex.RXB loope 6459 <.literal4+0xe1> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -20015,7 +20184,7 @@ BALIGN4 .byte 190,129,128,128,59 // mov $0x3b808081,%esi .byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 6439 <.literal4+0x12d> + .byte 224,7 // loopne 64a5 <.literal4+0x12d> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -20031,10 +20200,10 @@ BALIGN4 .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) .byte 0,52,255 // add %dh,(%rdi,%rdi,8) .byte 255 // (bad) - .byte 127,0 // jg 6460 <.literal4+0x154> + .byte 127,0 // jg 64cc <.literal4+0x154> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 64d9 <.literal4+0x1cd> + .byte 119,115 // ja 6545 <.literal4+0x1cd> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -20048,10 +20217,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 6494 <.literal4+0x188> + .byte 127,0 // jg 6500 <.literal4+0x188> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 650d <.literal4+0x201> + .byte 119,115 // ja 6579 <.literal4+0x201> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -20065,10 +20234,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 64c8 <.literal4+0x1bc> + .byte 127,0 // jg 6534 <.literal4+0x1bc> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6541 <.literal4+0x235> + .byte 119,115 // ja 65ad <.literal4+0x235> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -20082,10 +20251,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 64fc <.literal4+0x1f0> + .byte 127,0 // jg 6568 <.literal4+0x1f0> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6575 <.literal4+0x269> + .byte 119,115 // ja 65e1 <.literal4+0x269> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -20098,7 +20267,7 @@ BALIGN4 .byte 0,75,0 // add %cl,0x0(%rbx) .byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax) .byte 66,0,0 // rex.X add %al,(%rax) - .byte 127,67 // jg 6573 <.literal4+0x267> + .byte 127,67 // jg 65df <.literal4+0x267> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -20110,10 +20279,10 @@ BALIGN4 .byte 190,80,128,3,62 // mov $0x3e038050,%esi .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 6593 <.literal4+0x287> + .byte 118,63 // jbe 65ff <.literal4+0x287> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) - .byte 127,67 // jg 65a7 <.literal4+0x29b> + .byte 127,67 // jg 6613 <.literal4+0x29b> .byte 129,128,128,59,0,0,128,63,129,128 // addl $0x80813f80,0x3b80(%rax) .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,128,63,129,128,128 // add %al,-0x7f7f7ec1(%rax) @@ -20122,7 +20291,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 6589 <.literal4+0x27d> + .byte 224,7 // loopne 65f5 <.literal4+0x27d> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -20134,7 +20303,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 65a5 <.literal4+0x299> + .byte 224,7 // loopne 6611 <.literal4+0x299> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -20145,7 +20314,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 65fa <.literal4+0x2ee> + .byte 124,66 // jl 6666 <.literal4+0x2ee> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax) @@ -20163,9 +20332,9 @@ BALIGN4 .byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax) .byte 0,0 // add %al,(%rax) .byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax) - .byte 112,65 // jo 663d <.literal4+0x331> + .byte 112,65 // jo 66a9 <.literal4+0x331> .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) - .byte 127,67 // jg 664b <.literal4+0x33f> + .byte 127,67 // jg 66b7 <.literal4+0x33f> .byte 0,128,0,0,0,0 // add %al,0x0(%rax) .byte 0,128,0,4,0,128 // add %al,-0x7ffffc00(%rax) .byte 0,0 // add %al,(%rax) @@ -20181,7 +20350,11 @@ BALIGN4 .byte 0,128,55,0,0,128 // add %al,-0x7fffffc9(%rax) .byte 63 // (bad) .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 668b <.literal4+0x37f> + .byte 127,71 // jg 66f7 <.literal4+0x37f> + .byte 0,0 // add %al,(%rax) + .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,191,0,0,0 // add %al,0xbf(%rax) + .byte 63 // (bad) .byte 208 // (bad) .byte 179,89 // mov $0x59,%bl .byte 62,89 // ds pop %rcx @@ -20459,7 +20632,7 @@ _sk_seed_shader_sse41: .byte 102,15,110,199 // movd %edi,%xmm0 .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0 .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 - .byte 15,40,21,84,71,0,0 // movaps 0x4754(%rip),%xmm2 # 47d0 <_sk_callback_sse41+0xe0> + .byte 15,40,21,180,71,0,0 // movaps 0x47b4(%rip),%xmm2 # 4830 <_sk_callback_sse41+0xde> .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,16,2 // movups (%rdx),%xmm0 .byte 15,88,193 // addps %xmm1,%xmm0 @@ -20468,7 +20641,7 @@ _sk_seed_shader_sse41: .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,21,67,71,0,0 // movaps 0x4743(%rip),%xmm2 # 47e0 <_sk_callback_sse41+0xf0> + .byte 15,40,21,163,71,0,0 // movaps 0x47a3(%rip),%xmm2 # 4840 <_sk_callback_sse41+0xee> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,87,237 // xorps %xmm5,%xmm5 @@ -20489,14 +20662,14 @@ _sk_dither_sse41: .byte 102,68,15,110,1 // movd (%rcx),%xmm8 .byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8 .byte 102,69,15,239,193 // pxor %xmm9,%xmm8 - .byte 102,68,15,111,21,14,71,0,0 // movdqa 0x470e(%rip),%xmm10 # 47f0 <_sk_callback_sse41+0x100> + .byte 102,68,15,111,21,110,71,0,0 // movdqa 0x476e(%rip),%xmm10 # 4850 <_sk_callback_sse41+0xfe> .byte 102,69,15,111,216 // movdqa %xmm8,%xmm11 .byte 102,69,15,219,218 // pand %xmm10,%xmm11 .byte 102,65,15,114,243,5 // pslld $0x5,%xmm11 .byte 102,69,15,219,209 // pand %xmm9,%xmm10 .byte 102,65,15,114,242,4 // pslld $0x4,%xmm10 - .byte 102,68,15,111,37,250,70,0,0 // movdqa 0x46fa(%rip),%xmm12 # 4800 <_sk_callback_sse41+0x110> - .byte 102,68,15,111,45,1,71,0,0 // movdqa 0x4701(%rip),%xmm13 # 4810 <_sk_callback_sse41+0x120> + .byte 102,68,15,111,37,90,71,0,0 // movdqa 0x475a(%rip),%xmm12 # 4860 <_sk_callback_sse41+0x10e> + .byte 102,68,15,111,45,97,71,0,0 // movdqa 0x4761(%rip),%xmm13 # 4870 <_sk_callback_sse41+0x11e> .byte 102,69,15,111,240 // movdqa %xmm8,%xmm14 .byte 102,69,15,219,245 // pand %xmm13,%xmm14 .byte 102,65,15,114,246,2 // pslld $0x2,%xmm14 @@ -20512,8 +20685,8 @@ _sk_dither_sse41: .byte 102,69,15,235,198 // por %xmm14,%xmm8 .byte 102,69,15,235,197 // por %xmm13,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,188,70,0,0 // mulps 0x46bc(%rip),%xmm8 # 4820 <_sk_callback_sse41+0x130> - .byte 68,15,88,5,196,70,0,0 // addps 0x46c4(%rip),%xmm8 # 4830 <_sk_callback_sse41+0x140> + .byte 68,15,89,5,28,71,0,0 // mulps 0x471c(%rip),%xmm8 # 4880 <_sk_callback_sse41+0x12e> + .byte 68,15,88,5,36,71,0,0 // addps 0x4724(%rip),%xmm8 # 4890 <_sk_callback_sse41+0x13e> .byte 243,68,15,16,80,8 // movss 0x8(%rax),%xmm10 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 @@ -20590,7 +20763,7 @@ HIDDEN _sk_srcatop_sse41 FUNCTION(_sk_srcatop_sse41) _sk_srcatop_sse41: .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 68,15,40,5,29,70,0,0 // movaps 0x461d(%rip),%xmm8 # 4840 <_sk_callback_sse41+0x150> + .byte 68,15,40,5,125,70,0,0 // movaps 0x467d(%rip),%xmm8 # 48a0 <_sk_callback_sse41+0x14e> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -20615,7 +20788,7 @@ FUNCTION(_sk_dstatop_sse41) _sk_dstatop_sse41: .byte 68,15,40,195 // movaps %xmm3,%xmm8 .byte 68,15,89,196 // mulps %xmm4,%xmm8 - .byte 68,15,40,13,224,69,0,0 // movaps 0x45e0(%rip),%xmm9 # 4850 <_sk_callback_sse41+0x160> + .byte 68,15,40,13,64,70,0,0 // movaps 0x4640(%rip),%xmm9 # 48b0 <_sk_callback_sse41+0x15e> .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 @@ -20662,7 +20835,7 @@ HIDDEN _sk_srcout_sse41 .globl _sk_srcout_sse41 FUNCTION(_sk_srcout_sse41) _sk_srcout_sse41: - .byte 68,15,40,5,132,69,0,0 // movaps 0x4584(%rip),%xmm8 # 4860 <_sk_callback_sse41+0x170> + .byte 68,15,40,5,228,69,0,0 // movaps 0x45e4(%rip),%xmm8 # 48c0 <_sk_callback_sse41+0x16e> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 @@ -20675,7 +20848,7 @@ HIDDEN _sk_dstout_sse41 .globl _sk_dstout_sse41 FUNCTION(_sk_dstout_sse41) _sk_dstout_sse41: - .byte 68,15,40,5,116,69,0,0 // movaps 0x4574(%rip),%xmm8 # 4870 <_sk_callback_sse41+0x180> + .byte 68,15,40,5,212,69,0,0 // movaps 0x45d4(%rip),%xmm8 # 48d0 <_sk_callback_sse41+0x17e> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 @@ -20692,7 +20865,7 @@ HIDDEN _sk_srcover_sse41 .globl _sk_srcover_sse41 FUNCTION(_sk_srcover_sse41) _sk_srcover_sse41: - .byte 68,15,40,5,87,69,0,0 // movaps 0x4557(%rip),%xmm8 # 4880 <_sk_callback_sse41+0x190> + .byte 68,15,40,5,183,69,0,0 // movaps 0x45b7(%rip),%xmm8 # 48e0 <_sk_callback_sse41+0x18e> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -20712,7 +20885,7 @@ HIDDEN _sk_dstover_sse41 .globl _sk_dstover_sse41 FUNCTION(_sk_dstover_sse41) _sk_dstover_sse41: - .byte 68,15,40,5,43,69,0,0 // movaps 0x452b(%rip),%xmm8 # 4890 <_sk_callback_sse41+0x1a0> + .byte 68,15,40,5,139,69,0,0 // movaps 0x458b(%rip),%xmm8 # 48f0 <_sk_callback_sse41+0x19e> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -20740,7 +20913,7 @@ HIDDEN _sk_multiply_sse41 .globl _sk_multiply_sse41 FUNCTION(_sk_multiply_sse41) _sk_multiply_sse41: - .byte 68,15,40,5,255,68,0,0 // movaps 0x44ff(%rip),%xmm8 # 48a0 <_sk_callback_sse41+0x1b0> + .byte 68,15,40,5,95,69,0,0 // movaps 0x455f(%rip),%xmm8 # 4900 <_sk_callback_sse41+0x1ae> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 69,15,40,209 // movaps %xmm9,%xmm10 @@ -20816,7 +20989,7 @@ HIDDEN _sk_xor__sse41 FUNCTION(_sk_xor__sse41) _sk_xor__sse41: .byte 68,15,40,195 // movaps %xmm3,%xmm8 - .byte 15,40,29,48,68,0,0 // movaps 0x4430(%rip),%xmm3 # 48b0 <_sk_callback_sse41+0x1c0> + .byte 15,40,29,144,68,0,0 // movaps 0x4490(%rip),%xmm3 # 4910 <_sk_callback_sse41+0x1be> .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 @@ -20864,7 +21037,7 @@ _sk_darken_sse41: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,95,209 // maxps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,155,67,0,0 // movaps 0x439b(%rip),%xmm2 # 48c0 <_sk_callback_sse41+0x1d0> + .byte 15,40,21,251,67,0,0 // movaps 0x43fb(%rip),%xmm2 # 4920 <_sk_callback_sse41+0x1ce> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -20898,7 +21071,7 @@ _sk_lighten_sse41: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,64,67,0,0 // movaps 0x4340(%rip),%xmm2 # 48d0 <_sk_callback_sse41+0x1e0> + .byte 15,40,21,160,67,0,0 // movaps 0x43a0(%rip),%xmm2 # 4930 <_sk_callback_sse41+0x1de> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -20935,7 +21108,7 @@ _sk_difference_sse41: .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,218,66,0,0 // movaps 0x42da(%rip),%xmm2 # 48e0 <_sk_callback_sse41+0x1f0> + .byte 15,40,21,58,67,0,0 // movaps 0x433a(%rip),%xmm2 # 4940 <_sk_callback_sse41+0x1ee> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -20962,7 +21135,7 @@ _sk_exclusion_sse41: .byte 15,89,214 // mulps %xmm6,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,202 // subps %xmm2,%xmm9 - .byte 15,40,13,155,66,0,0 // movaps 0x429b(%rip),%xmm1 # 48f0 <_sk_callback_sse41+0x200> + .byte 15,40,13,251,66,0,0 // movaps 0x42fb(%rip),%xmm1 # 4950 <_sk_callback_sse41+0x1fe> .byte 15,92,203 // subps %xmm3,%xmm1 .byte 15,89,207 // mulps %xmm7,%xmm1 .byte 15,88,217 // addps %xmm1,%xmm3 @@ -20976,7 +21149,7 @@ HIDDEN _sk_colorburn_sse41 FUNCTION(_sk_colorburn_sse41) _sk_colorburn_sse41: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,21,138,66,0,0 // movaps 0x428a(%rip),%xmm10 # 4900 <_sk_callback_sse41+0x210> + .byte 68,15,40,21,234,66,0,0 // movaps 0x42ea(%rip),%xmm10 # 4960 <_sk_callback_sse41+0x20e> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 69,15,40,203 // movaps %xmm11,%xmm9 @@ -21058,7 +21231,7 @@ HIDDEN _sk_colordodge_sse41 FUNCTION(_sk_colordodge_sse41) _sk_colordodge_sse41: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,21,104,65,0,0 // movaps 0x4168(%rip),%xmm10 # 4910 <_sk_callback_sse41+0x220> + .byte 68,15,40,21,200,65,0,0 // movaps 0x41c8(%rip),%xmm10 # 4970 <_sk_callback_sse41+0x21e> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 69,15,40,227 // movaps %xmm11,%xmm12 @@ -21140,7 +21313,7 @@ _sk_hardlight_sse41: .byte 15,40,244 // movaps %xmm4,%xmm6 .byte 15,40,227 // movaps %xmm3,%xmm4 .byte 68,15,40,200 // movaps %xmm0,%xmm9 - .byte 68,15,40,21,65,64,0,0 // movaps 0x4041(%rip),%xmm10 # 4920 <_sk_callback_sse41+0x230> + .byte 68,15,40,21,161,64,0,0 // movaps 0x40a1(%rip),%xmm10 # 4980 <_sk_callback_sse41+0x22e> .byte 65,15,40,234 // movaps %xmm10,%xmm5 .byte 15,92,239 // subps %xmm7,%xmm5 .byte 15,40,197 // movaps %xmm5,%xmm0 @@ -21223,7 +21396,7 @@ FUNCTION(_sk_overlay_sse41) _sk_overlay_sse41: .byte 68,15,40,201 // movaps %xmm1,%xmm9 .byte 68,15,40,240 // movaps %xmm0,%xmm14 - .byte 68,15,40,21,38,63,0,0 // movaps 0x3f26(%rip),%xmm10 # 4930 <_sk_callback_sse41+0x240> + .byte 68,15,40,21,134,63,0,0 // movaps 0x3f86(%rip),%xmm10 # 4990 <_sk_callback_sse41+0x23e> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 65,15,40,195 // movaps %xmm11,%xmm0 @@ -21308,7 +21481,7 @@ _sk_softlight_sse41: .byte 15,40,198 // movaps %xmm6,%xmm0 .byte 15,94,199 // divps %xmm7,%xmm0 .byte 65,15,84,193 // andps %xmm9,%xmm0 - .byte 15,40,13,253,61,0,0 // movaps 0x3dfd(%rip),%xmm1 # 4940 <_sk_callback_sse41+0x250> + .byte 15,40,13,93,62,0,0 // movaps 0x3e5d(%rip),%xmm1 # 49a0 <_sk_callback_sse41+0x24e> .byte 68,15,40,209 // movaps %xmm1,%xmm10 .byte 68,15,92,208 // subps %xmm0,%xmm10 .byte 68,15,40,240 // movaps %xmm0,%xmm14 @@ -21321,10 +21494,10 @@ _sk_softlight_sse41: .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,89,210 // mulps %xmm2,%xmm2 .byte 15,88,208 // addps %xmm0,%xmm2 - .byte 68,15,40,45,219,61,0,0 // movaps 0x3ddb(%rip),%xmm13 # 4950 <_sk_callback_sse41+0x260> + .byte 68,15,40,45,59,62,0,0 // movaps 0x3e3b(%rip),%xmm13 # 49b0 <_sk_callback_sse41+0x25e> .byte 69,15,88,245 // addps %xmm13,%xmm14 .byte 68,15,89,242 // mulps %xmm2,%xmm14 - .byte 68,15,40,37,219,61,0,0 // movaps 0x3ddb(%rip),%xmm12 # 4960 <_sk_callback_sse41+0x270> + .byte 68,15,40,37,59,62,0,0 // movaps 0x3e3b(%rip),%xmm12 # 49c0 <_sk_callback_sse41+0x26e> .byte 69,15,89,252 // mulps %xmm12,%xmm15 .byte 69,15,88,254 // addps %xmm14,%xmm15 .byte 15,40,198 // movaps %xmm6,%xmm0 @@ -21510,12 +21683,12 @@ _sk_hue_sse41: .byte 68,15,84,208 // andps %xmm0,%xmm10 .byte 15,84,200 // andps %xmm0,%xmm1 .byte 68,15,84,232 // andps %xmm0,%xmm13 - .byte 15,40,5,70,59,0,0 // movaps 0x3b46(%rip),%xmm0 # 4970 <_sk_callback_sse41+0x280> + .byte 15,40,5,166,59,0,0 // movaps 0x3ba6(%rip),%xmm0 # 49d0 <_sk_callback_sse41+0x27e> .byte 68,15,89,224 // mulps %xmm0,%xmm12 - .byte 15,40,21,75,59,0,0 // movaps 0x3b4b(%rip),%xmm2 # 4980 <_sk_callback_sse41+0x290> + .byte 15,40,21,171,59,0,0 // movaps 0x3bab(%rip),%xmm2 # 49e0 <_sk_callback_sse41+0x28e> .byte 15,89,250 // mulps %xmm2,%xmm7 .byte 65,15,88,252 // addps %xmm12,%xmm7 - .byte 68,15,40,53,76,59,0,0 // movaps 0x3b4c(%rip),%xmm14 # 4990 <_sk_callback_sse41+0x2a0> + .byte 68,15,40,53,172,59,0,0 // movaps 0x3bac(%rip),%xmm14 # 49f0 <_sk_callback_sse41+0x29e> .byte 68,15,40,252 // movaps %xmm4,%xmm15 .byte 69,15,89,254 // mulps %xmm14,%xmm15 .byte 68,15,88,255 // addps %xmm7,%xmm15 @@ -21598,7 +21771,7 @@ _sk_hue_sse41: .byte 65,15,88,214 // addps %xmm14,%xmm2 .byte 15,40,196 // movaps %xmm4,%xmm0 .byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1 - .byte 68,15,40,13,16,58,0,0 // movaps 0x3a10(%rip),%xmm9 # 49a0 <_sk_callback_sse41+0x2b0> + .byte 68,15,40,13,112,58,0,0 // movaps 0x3a70(%rip),%xmm9 # 4a00 <_sk_callback_sse41+0x2ae> .byte 65,15,40,225 // movaps %xmm9,%xmm4 .byte 15,92,229 // subps %xmm5,%xmm4 .byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0 @@ -21692,14 +21865,14 @@ _sk_saturation_sse41: .byte 68,15,84,215 // andps %xmm7,%xmm10 .byte 68,15,84,223 // andps %xmm7,%xmm11 .byte 68,15,84,199 // andps %xmm7,%xmm8 - .byte 15,40,21,202,56,0,0 // movaps 0x38ca(%rip),%xmm2 # 49b0 <_sk_callback_sse41+0x2c0> + .byte 15,40,21,42,57,0,0 // movaps 0x392a(%rip),%xmm2 # 4a10 <_sk_callback_sse41+0x2be> .byte 15,40,221 // movaps %xmm5,%xmm3 .byte 15,89,218 // mulps %xmm2,%xmm3 - .byte 15,40,13,205,56,0,0 // movaps 0x38cd(%rip),%xmm1 # 49c0 <_sk_callback_sse41+0x2d0> + .byte 15,40,13,45,57,0,0 // movaps 0x392d(%rip),%xmm1 # 4a20 <_sk_callback_sse41+0x2ce> .byte 15,40,254 // movaps %xmm6,%xmm7 .byte 15,89,249 // mulps %xmm1,%xmm7 .byte 15,88,251 // addps %xmm3,%xmm7 - .byte 68,15,40,45,204,56,0,0 // movaps 0x38cc(%rip),%xmm13 # 49d0 <_sk_callback_sse41+0x2e0> + .byte 68,15,40,45,44,57,0,0 // movaps 0x392c(%rip),%xmm13 # 4a30 <_sk_callback_sse41+0x2de> .byte 69,15,89,245 // mulps %xmm13,%xmm14 .byte 68,15,88,247 // addps %xmm7,%xmm14 .byte 65,15,40,218 // movaps %xmm10,%xmm3 @@ -21780,7 +21953,7 @@ _sk_saturation_sse41: .byte 65,15,88,253 // addps %xmm13,%xmm7 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11 - .byte 68,15,40,13,146,55,0,0 // movaps 0x3792(%rip),%xmm9 # 49e0 <_sk_callback_sse41+0x2f0> + .byte 68,15,40,13,242,55,0,0 // movaps 0x37f2(%rip),%xmm9 # 4a40 <_sk_callback_sse41+0x2ee> .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 68,15,92,204 // subps %xmm4,%xmm9 .byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7 @@ -21835,14 +22008,14 @@ _sk_color_sse41: .byte 15,40,231 // movaps %xmm7,%xmm4 .byte 68,15,89,244 // mulps %xmm4,%xmm14 .byte 15,89,204 // mulps %xmm4,%xmm1 - .byte 68,15,40,13,221,54,0,0 // movaps 0x36dd(%rip),%xmm9 # 49f0 <_sk_callback_sse41+0x300> + .byte 68,15,40,13,61,55,0,0 // movaps 0x373d(%rip),%xmm9 # 4a50 <_sk_callback_sse41+0x2fe> .byte 65,15,40,250 // movaps %xmm10,%xmm7 .byte 65,15,89,249 // mulps %xmm9,%xmm7 - .byte 68,15,40,21,221,54,0,0 // movaps 0x36dd(%rip),%xmm10 # 4a00 <_sk_callback_sse41+0x310> + .byte 68,15,40,21,61,55,0,0 // movaps 0x373d(%rip),%xmm10 # 4a60 <_sk_callback_sse41+0x30e> .byte 65,15,40,219 // movaps %xmm11,%xmm3 .byte 65,15,89,218 // mulps %xmm10,%xmm3 .byte 15,88,223 // addps %xmm7,%xmm3 - .byte 68,15,40,29,218,54,0,0 // movaps 0x36da(%rip),%xmm11 # 4a10 <_sk_callback_sse41+0x320> + .byte 68,15,40,29,58,55,0,0 // movaps 0x373a(%rip),%xmm11 # 4a70 <_sk_callback_sse41+0x31e> .byte 69,15,40,236 // movaps %xmm12,%xmm13 .byte 69,15,89,235 // mulps %xmm11,%xmm13 .byte 68,15,88,235 // addps %xmm3,%xmm13 @@ -21927,7 +22100,7 @@ _sk_color_sse41: .byte 65,15,88,251 // addps %xmm11,%xmm7 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1 - .byte 68,15,40,13,150,53,0,0 // movaps 0x3596(%rip),%xmm9 # 4a20 <_sk_callback_sse41+0x330> + .byte 68,15,40,13,246,53,0,0 // movaps 0x35f6(%rip),%xmm9 # 4a80 <_sk_callback_sse41+0x32e> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,92,196 // subps %xmm4,%xmm0 .byte 68,15,89,192 // mulps %xmm0,%xmm8 @@ -21979,13 +22152,13 @@ _sk_luminosity_sse41: .byte 69,15,89,216 // mulps %xmm8,%xmm11 .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,89,205 // mulps %xmm5,%xmm9 - .byte 68,15,40,5,238,52,0,0 // movaps 0x34ee(%rip),%xmm8 # 4a30 <_sk_callback_sse41+0x340> + .byte 68,15,40,5,78,53,0,0 // movaps 0x354e(%rip),%xmm8 # 4a90 <_sk_callback_sse41+0x33e> .byte 65,15,89,192 // mulps %xmm8,%xmm0 - .byte 68,15,40,21,242,52,0,0 // movaps 0x34f2(%rip),%xmm10 # 4a40 <_sk_callback_sse41+0x350> + .byte 68,15,40,21,82,53,0,0 // movaps 0x3552(%rip),%xmm10 # 4aa0 <_sk_callback_sse41+0x34e> .byte 15,40,233 // movaps %xmm1,%xmm5 .byte 65,15,89,234 // mulps %xmm10,%xmm5 .byte 15,88,232 // addps %xmm0,%xmm5 - .byte 68,15,40,37,240,52,0,0 // movaps 0x34f0(%rip),%xmm12 # 4a50 <_sk_callback_sse41+0x360> + .byte 68,15,40,37,80,53,0,0 // movaps 0x3550(%rip),%xmm12 # 4ab0 <_sk_callback_sse41+0x35e> .byte 68,15,40,242 // movaps %xmm2,%xmm14 .byte 69,15,89,244 // mulps %xmm12,%xmm14 .byte 68,15,88,245 // addps %xmm5,%xmm14 @@ -22070,7 +22243,7 @@ _sk_luminosity_sse41: .byte 65,15,88,244 // addps %xmm12,%xmm6 .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9 - .byte 15,40,5,166,51,0,0 // movaps 0x33a6(%rip),%xmm0 # 4a60 <_sk_callback_sse41+0x370> + .byte 15,40,5,6,52,0,0 // movaps 0x3406(%rip),%xmm0 # 4ac0 <_sk_callback_sse41+0x36e> .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,92,215 // subps %xmm7,%xmm2 .byte 15,89,226 // mulps %xmm2,%xmm4 @@ -22119,7 +22292,7 @@ HIDDEN _sk_clamp_1_sse41 .globl _sk_clamp_1_sse41 FUNCTION(_sk_clamp_1_sse41) _sk_clamp_1_sse41: - .byte 68,15,40,5,41,51,0,0 // movaps 0x3329(%rip),%xmm8 # 4a70 <_sk_callback_sse41+0x380> + .byte 68,15,40,5,137,51,0,0 // movaps 0x3389(%rip),%xmm8 # 4ad0 <_sk_callback_sse41+0x37e> .byte 65,15,93,192 // minps %xmm8,%xmm0 .byte 65,15,93,200 // minps %xmm8,%xmm1 .byte 65,15,93,208 // minps %xmm8,%xmm2 @@ -22131,7 +22304,7 @@ HIDDEN _sk_clamp_a_sse41 .globl _sk_clamp_a_sse41 FUNCTION(_sk_clamp_a_sse41) _sk_clamp_a_sse41: - .byte 15,93,29,30,51,0,0 // minps 0x331e(%rip),%xmm3 # 4a80 <_sk_callback_sse41+0x390> + .byte 15,93,29,126,51,0,0 // minps 0x337e(%rip),%xmm3 # 4ae0 <_sk_callback_sse41+0x38e> .byte 15,93,195 // minps %xmm3,%xmm0 .byte 15,93,203 // minps %xmm3,%xmm1 .byte 15,93,211 // minps %xmm3,%xmm2 @@ -22218,7 +22391,7 @@ HIDDEN _sk_unpremul_sse41 FUNCTION(_sk_unpremul_sse41) _sk_unpremul_sse41: .byte 69,15,87,192 // xorps %xmm8,%xmm8 - .byte 68,15,40,13,137,50,0,0 // movaps 0x3289(%rip),%xmm9 # 4a90 <_sk_callback_sse41+0x3a0> + .byte 68,15,40,13,233,50,0,0 // movaps 0x32e9(%rip),%xmm9 # 4af0 <_sk_callback_sse41+0x39e> .byte 68,15,94,203 // divps %xmm3,%xmm9 .byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8 .byte 69,15,84,193 // andps %xmm9,%xmm8 @@ -22232,20 +22405,20 @@ HIDDEN _sk_from_srgb_sse41 .globl _sk_from_srgb_sse41 FUNCTION(_sk_from_srgb_sse41) _sk_from_srgb_sse41: - .byte 68,15,40,29,116,50,0,0 // movaps 0x3274(%rip),%xmm11 # 4aa0 <_sk_callback_sse41+0x3b0> + .byte 68,15,40,29,212,50,0,0 // movaps 0x32d4(%rip),%xmm11 # 4b00 <_sk_callback_sse41+0x3ae> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 .byte 68,15,40,208 // movaps %xmm0,%xmm10 .byte 69,15,89,210 // mulps %xmm10,%xmm10 - .byte 68,15,40,37,108,50,0,0 // movaps 0x326c(%rip),%xmm12 # 4ab0 <_sk_callback_sse41+0x3c0> + .byte 68,15,40,37,204,50,0,0 // movaps 0x32cc(%rip),%xmm12 # 4b10 <_sk_callback_sse41+0x3be> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,196 // mulps %xmm12,%xmm8 - .byte 68,15,40,45,108,50,0,0 // movaps 0x326c(%rip),%xmm13 # 4ac0 <_sk_callback_sse41+0x3d0> + .byte 68,15,40,45,204,50,0,0 // movaps 0x32cc(%rip),%xmm13 # 4b20 <_sk_callback_sse41+0x3ce> .byte 69,15,88,197 // addps %xmm13,%xmm8 .byte 69,15,89,194 // mulps %xmm10,%xmm8 - .byte 68,15,40,53,108,50,0,0 // movaps 0x326c(%rip),%xmm14 # 4ad0 <_sk_callback_sse41+0x3e0> + .byte 68,15,40,53,204,50,0,0 // movaps 0x32cc(%rip),%xmm14 # 4b30 <_sk_callback_sse41+0x3de> .byte 69,15,88,198 // addps %xmm14,%xmm8 - .byte 68,15,40,61,112,50,0,0 // movaps 0x3270(%rip),%xmm15 # 4ae0 <_sk_callback_sse41+0x3f0> + .byte 68,15,40,61,208,50,0,0 // movaps 0x32d0(%rip),%xmm15 # 4b40 <_sk_callback_sse41+0x3ee> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 68,15,40,209 // movaps %xmm1,%xmm10 @@ -22288,22 +22461,22 @@ _sk_to_srgb_sse41: .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 68,15,82,192 // rsqrtps %xmm0,%xmm8 - .byte 68,15,40,29,232,49,0,0 // movaps 0x31e8(%rip),%xmm11 # 4af0 <_sk_callback_sse41+0x400> + .byte 68,15,40,29,72,50,0,0 // movaps 0x3248(%rip),%xmm11 # 4b50 <_sk_callback_sse41+0x3fe> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 - .byte 68,15,40,37,232,49,0,0 // movaps 0x31e8(%rip),%xmm12 # 4b00 <_sk_callback_sse41+0x410> + .byte 68,15,40,37,72,50,0,0 // movaps 0x3248(%rip),%xmm12 # 4b60 <_sk_callback_sse41+0x40e> .byte 69,15,40,248 // movaps %xmm8,%xmm15 .byte 69,15,89,252 // mulps %xmm12,%xmm15 - .byte 68,15,40,21,232,49,0,0 // movaps 0x31e8(%rip),%xmm10 # 4b10 <_sk_callback_sse41+0x420> + .byte 68,15,40,21,72,50,0,0 // movaps 0x3248(%rip),%xmm10 # 4b70 <_sk_callback_sse41+0x41e> .byte 69,15,88,250 // addps %xmm10,%xmm15 .byte 69,15,89,248 // mulps %xmm8,%xmm15 - .byte 68,15,40,45,232,49,0,0 // movaps 0x31e8(%rip),%xmm13 # 4b20 <_sk_callback_sse41+0x430> + .byte 68,15,40,45,72,50,0,0 // movaps 0x3248(%rip),%xmm13 # 4b80 <_sk_callback_sse41+0x42e> .byte 69,15,88,253 // addps %xmm13,%xmm15 - .byte 68,15,40,53,236,49,0,0 // movaps 0x31ec(%rip),%xmm14 # 4b30 <_sk_callback_sse41+0x440> + .byte 68,15,40,53,76,50,0,0 // movaps 0x324c(%rip),%xmm14 # 4b90 <_sk_callback_sse41+0x43e> .byte 69,15,88,198 // addps %xmm14,%xmm8 .byte 69,15,83,192 // rcpps %xmm8,%xmm8 .byte 69,15,89,199 // mulps %xmm15,%xmm8 - .byte 68,15,40,61,232,49,0,0 // movaps 0x31e8(%rip),%xmm15 # 4b40 <_sk_callback_sse41+0x450> + .byte 68,15,40,61,72,50,0,0 // movaps 0x3248(%rip),%xmm15 # 4ba0 <_sk_callback_sse41+0x44e> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 68,15,82,202 // rsqrtps %xmm2,%xmm9 @@ -22356,7 +22529,7 @@ _sk_rgb_to_hsl_sse41: .byte 68,15,93,226 // minps %xmm2,%xmm12 .byte 65,15,40,203 // movaps %xmm11,%xmm1 .byte 65,15,92,204 // subps %xmm12,%xmm1 - .byte 68,15,40,53,53,49,0,0 // movaps 0x3135(%rip),%xmm14 # 4b50 <_sk_callback_sse41+0x460> + .byte 68,15,40,53,149,49,0,0 // movaps 0x3195(%rip),%xmm14 # 4bb0 <_sk_callback_sse41+0x45e> .byte 68,15,94,241 // divps %xmm1,%xmm14 .byte 69,15,40,211 // movaps %xmm11,%xmm10 .byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10 @@ -22365,27 +22538,27 @@ _sk_rgb_to_hsl_sse41: .byte 65,15,89,198 // mulps %xmm14,%xmm0 .byte 69,15,40,249 // movaps %xmm9,%xmm15 .byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15 - .byte 68,15,84,61,28,49,0,0 // andps 0x311c(%rip),%xmm15 # 4b60 <_sk_callback_sse41+0x470> + .byte 68,15,84,61,124,49,0,0 // andps 0x317c(%rip),%xmm15 # 4bc0 <_sk_callback_sse41+0x46e> .byte 68,15,88,248 // addps %xmm0,%xmm15 .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0 .byte 65,15,92,208 // subps %xmm8,%xmm2 .byte 65,15,89,214 // mulps %xmm14,%xmm2 - .byte 68,15,40,45,15,49,0,0 // movaps 0x310f(%rip),%xmm13 # 4b70 <_sk_callback_sse41+0x480> + .byte 68,15,40,45,111,49,0,0 // movaps 0x316f(%rip),%xmm13 # 4bd0 <_sk_callback_sse41+0x47e> .byte 65,15,88,213 // addps %xmm13,%xmm2 .byte 69,15,92,193 // subps %xmm9,%xmm8 .byte 69,15,89,198 // mulps %xmm14,%xmm8 - .byte 68,15,88,5,11,49,0,0 // addps 0x310b(%rip),%xmm8 # 4b80 <_sk_callback_sse41+0x490> + .byte 68,15,88,5,107,49,0,0 // addps 0x316b(%rip),%xmm8 # 4be0 <_sk_callback_sse41+0x48e> .byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8 - .byte 68,15,89,5,3,49,0,0 // mulps 0x3103(%rip),%xmm8 # 4b90 <_sk_callback_sse41+0x4a0> + .byte 68,15,89,5,99,49,0,0 // mulps 0x3163(%rip),%xmm8 # 4bf0 <_sk_callback_sse41+0x49e> .byte 69,15,40,203 // movaps %xmm11,%xmm9 .byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9 .byte 69,15,84,193 // andps %xmm9,%xmm8 .byte 69,15,92,235 // subps %xmm11,%xmm13 .byte 69,15,88,220 // addps %xmm12,%xmm11 - .byte 15,40,5,247,48,0,0 // movaps 0x30f7(%rip),%xmm0 # 4ba0 <_sk_callback_sse41+0x4b0> + .byte 15,40,5,87,49,0,0 // movaps 0x3157(%rip),%xmm0 # 4c00 <_sk_callback_sse41+0x4ae> .byte 65,15,40,211 // movaps %xmm11,%xmm2 .byte 15,89,208 // mulps %xmm0,%xmm2 .byte 15,194,194,1 // cmpltps %xmm2,%xmm0 @@ -22407,7 +22580,7 @@ _sk_hsl_to_rgb_sse41: .byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp) .byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp) .byte 68,15,40,208 // movaps %xmm0,%xmm10 - .byte 68,15,40,13,189,48,0,0 // movaps 0x30bd(%rip),%xmm9 # 4bb0 <_sk_callback_sse41+0x4c0> + .byte 68,15,40,13,29,49,0,0 // movaps 0x311d(%rip),%xmm9 # 4c10 <_sk_callback_sse41+0x4be> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,194,194,2 // cmpleps %xmm2,%xmm0 .byte 15,40,217 // movaps %xmm1,%xmm3 @@ -22420,19 +22593,19 @@ _sk_hsl_to_rgb_sse41: .byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp) .byte 69,15,88,192 // addps %xmm8,%xmm8 .byte 68,15,92,197 // subps %xmm5,%xmm8 - .byte 68,15,40,53,152,48,0,0 // movaps 0x3098(%rip),%xmm14 # 4bc0 <_sk_callback_sse41+0x4d0> + .byte 68,15,40,53,248,48,0,0 // movaps 0x30f8(%rip),%xmm14 # 4c20 <_sk_callback_sse41+0x4ce> .byte 69,15,88,242 // addps %xmm10,%xmm14 .byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0 .byte 68,15,92,240 // subps %xmm0,%xmm14 - .byte 68,15,40,29,145,48,0,0 // movaps 0x3091(%rip),%xmm11 # 4bd0 <_sk_callback_sse41+0x4e0> + .byte 68,15,40,29,241,48,0,0 // movaps 0x30f1(%rip),%xmm11 # 4c30 <_sk_callback_sse41+0x4de> .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 15,40,245 // movaps %xmm5,%xmm6 .byte 65,15,92,240 // subps %xmm8,%xmm6 - .byte 15,40,61,138,48,0,0 // movaps 0x308a(%rip),%xmm7 # 4be0 <_sk_callback_sse41+0x4f0> + .byte 15,40,61,234,48,0,0 // movaps 0x30ea(%rip),%xmm7 # 4c40 <_sk_callback_sse41+0x4ee> .byte 69,15,40,238 // movaps %xmm14,%xmm13 .byte 68,15,89,239 // mulps %xmm7,%xmm13 - .byte 15,40,29,139,48,0,0 // movaps 0x308b(%rip),%xmm3 # 4bf0 <_sk_callback_sse41+0x500> + .byte 15,40,29,235,48,0,0 // movaps 0x30eb(%rip),%xmm3 # 4c50 <_sk_callback_sse41+0x4fe> .byte 68,15,40,227 // movaps %xmm3,%xmm12 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 68,15,89,230 // mulps %xmm6,%xmm12 @@ -22442,7 +22615,7 @@ _sk_hsl_to_rgb_sse41: .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 68,15,40,253 // movaps %xmm5,%xmm15 .byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15 - .byte 68,15,40,37,106,48,0,0 // movaps 0x306a(%rip),%xmm12 # 4c00 <_sk_callback_sse41+0x510> + .byte 68,15,40,37,202,48,0,0 // movaps 0x30ca(%rip),%xmm12 # 4c60 <_sk_callback_sse41+0x50e> .byte 65,15,40,196 // movaps %xmm12,%xmm0 .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 68,15,89,238 // mulps %xmm6,%xmm13 @@ -22476,7 +22649,7 @@ _sk_hsl_to_rgb_sse41: .byte 65,15,40,198 // movaps %xmm14,%xmm0 .byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2 .byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1 - .byte 68,15,88,21,226,47,0,0 // addps 0x2fe2(%rip),%xmm10 # 4c10 <_sk_callback_sse41+0x520> + .byte 68,15,88,21,66,48,0,0 // addps 0x3042(%rip),%xmm10 # 4c70 <_sk_callback_sse41+0x51e> .byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0 .byte 68,15,92,208 // subps %xmm0,%xmm10 .byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11 @@ -22528,7 +22701,7 @@ _sk_scale_u8_sse41: .byte 72,139,0 // mov (%rax),%rax .byte 102,68,15,56,49,4,56 // pmovzxbd (%rax,%rdi,1),%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,63,47,0,0 // mulps 0x2f3f(%rip),%xmm8 # 4c20 <_sk_callback_sse41+0x530> + .byte 68,15,89,5,159,47,0,0 // mulps 0x2f9f(%rip),%xmm8 # 4c80 <_sk_callback_sse41+0x52e> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 @@ -22566,7 +22739,7 @@ _sk_lerp_u8_sse41: .byte 72,139,0 // mov (%rax),%rax .byte 102,68,15,56,49,4,56 // pmovzxbd (%rax,%rdi,1),%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,235,46,0,0 // mulps 0x2eeb(%rip),%xmm8 # 4c30 <_sk_callback_sse41+0x540> + .byte 68,15,89,5,75,47,0,0 // mulps 0x2f4b(%rip),%xmm8 # 4c90 <_sk_callback_sse41+0x53e> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -22589,17 +22762,17 @@ _sk_lerp_565_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 102,68,15,56,51,20,120 // pmovzxwd (%rax,%rdi,2),%xmm10 - .byte 102,68,15,111,5,186,46,0,0 // movdqa 0x2eba(%rip),%xmm8 # 4c40 <_sk_callback_sse41+0x550> + .byte 102,68,15,111,5,26,47,0,0 // movdqa 0x2f1a(%rip),%xmm8 # 4ca0 <_sk_callback_sse41+0x54e> .byte 102,69,15,219,194 // pand %xmm10,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,185,46,0,0 // mulps 0x2eb9(%rip),%xmm8 # 4c50 <_sk_callback_sse41+0x560> - .byte 102,68,15,111,13,192,46,0,0 // movdqa 0x2ec0(%rip),%xmm9 # 4c60 <_sk_callback_sse41+0x570> + .byte 68,15,89,5,25,47,0,0 // mulps 0x2f19(%rip),%xmm8 # 4cb0 <_sk_callback_sse41+0x55e> + .byte 102,68,15,111,13,32,47,0,0 // movdqa 0x2f20(%rip),%xmm9 # 4cc0 <_sk_callback_sse41+0x56e> .byte 102,69,15,219,202 // pand %xmm10,%xmm9 .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9 - .byte 68,15,89,13,191,46,0,0 // mulps 0x2ebf(%rip),%xmm9 # 4c70 <_sk_callback_sse41+0x580> - .byte 102,68,15,219,21,198,46,0,0 // pand 0x2ec6(%rip),%xmm10 # 4c80 <_sk_callback_sse41+0x590> + .byte 68,15,89,13,31,47,0,0 // mulps 0x2f1f(%rip),%xmm9 # 4cd0 <_sk_callback_sse41+0x57e> + .byte 102,68,15,219,21,38,47,0,0 // pand 0x2f26(%rip),%xmm10 # 4ce0 <_sk_callback_sse41+0x58e> .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 - .byte 68,15,89,21,202,46,0,0 // mulps 0x2eca(%rip),%xmm10 # 4c90 <_sk_callback_sse41+0x5a0> + .byte 68,15,89,21,42,47,0,0 // mulps 0x2f2a(%rip),%xmm10 # 4cf0 <_sk_callback_sse41+0x59e> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -22630,7 +22803,7 @@ _sk_load_tables_sse41: .byte 76,139,0 // mov (%rax),%r8 .byte 76,139,72,8 // mov 0x8(%rax),%r9 .byte 243,69,15,111,4,184 // movdqu (%r8,%rdi,4),%xmm8 - .byte 102,15,111,5,123,46,0,0 // movdqa 0x2e7b(%rip),%xmm0 # 4ca0 <_sk_callback_sse41+0x5b0> + .byte 102,15,111,5,219,46,0,0 // movdqa 0x2edb(%rip),%xmm0 # 4d00 <_sk_callback_sse41+0x5ae> .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,73,15,58,22,192,1 // pextrq $0x1,%xmm0,%r8 .byte 102,72,15,126,193 // movq %xmm0,%rcx @@ -22645,7 +22818,7 @@ _sk_load_tables_sse41: .byte 102,15,58,33,193,48 // insertps $0x30,%xmm1,%xmm0 .byte 76,139,64,16 // mov 0x10(%rax),%r8 .byte 102,65,15,111,200 // movdqa %xmm8,%xmm1 - .byte 102,15,56,0,13,54,46,0,0 // pshufb 0x2e36(%rip),%xmm1 # 4cb0 <_sk_callback_sse41+0x5c0> + .byte 102,15,56,0,13,150,46,0,0 // pshufb 0x2e96(%rip),%xmm1 # 4d10 <_sk_callback_sse41+0x5be> .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,201 // movq %xmm1,%rcx .byte 68,15,182,209 // movzbl %cl,%r10d @@ -22660,7 +22833,7 @@ _sk_load_tables_sse41: .byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1 .byte 76,139,64,24 // mov 0x18(%rax),%r8 .byte 102,65,15,111,208 // movdqa %xmm8,%xmm2 - .byte 102,15,56,0,21,242,45,0,0 // pshufb 0x2df2(%rip),%xmm2 # 4cc0 <_sk_callback_sse41+0x5d0> + .byte 102,15,56,0,21,82,46,0,0 // pshufb 0x2e52(%rip),%xmm2 # 4d20 <_sk_callback_sse41+0x5ce> .byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx .byte 102,72,15,126,208 // movq %xmm2,%rax .byte 68,15,182,200 // movzbl %al,%r9d @@ -22675,7 +22848,7 @@ _sk_load_tables_sse41: .byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2 .byte 102,65,15,114,208,24 // psrld $0x18,%xmm8 .byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3 - .byte 15,89,29,175,45,0,0 // mulps 0x2daf(%rip),%xmm3 # 4cd0 <_sk_callback_sse41+0x5e0> + .byte 15,89,29,15,46,0,0 // mulps 0x2e0f(%rip),%xmm3 # 4d30 <_sk_callback_sse41+0x5de> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -22694,7 +22867,7 @@ _sk_load_tables_u16_be_sse41: .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 - .byte 102,68,15,111,5,130,45,0,0 // movdqa 0x2d82(%rip),%xmm8 # 4ce0 <_sk_callback_sse41+0x5f0> + .byte 102,68,15,111,5,226,45,0,0 // movdqa 0x2de2(%rip),%xmm8 # 4d40 <_sk_callback_sse41+0x5ee> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 @@ -22711,7 +22884,7 @@ _sk_load_tables_u16_be_sse41: .byte 243,67,15,16,20,8 // movss (%r8,%r9,1),%xmm2 .byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0 .byte 76,139,64,16 // mov 0x10(%rax),%r8 - .byte 102,15,56,0,13,53,45,0,0 // pshufb 0x2d35(%rip),%xmm1 # 4cf0 <_sk_callback_sse41+0x600> + .byte 102,15,56,0,13,149,45,0,0 // pshufb 0x2d95(%rip),%xmm1 # 4d50 <_sk_callback_sse41+0x5fe> .byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1 .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,201 // movq %xmm1,%rcx @@ -22747,7 +22920,7 @@ _sk_load_tables_u16_be_sse41: .byte 102,65,15,235,216 // por %xmm8,%xmm3 .byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,131,44,0,0 // mulps 0x2c83(%rip),%xmm3 # 4d00 <_sk_callback_sse41+0x610> + .byte 15,89,29,227,44,0,0 // mulps 0x2ce3(%rip),%xmm3 # 4d60 <_sk_callback_sse41+0x60e> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -22769,7 +22942,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9 .byte 102,15,111,202 // movdqa %xmm2,%xmm1 .byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1 - .byte 102,68,15,111,5,69,44,0,0 // movdqa 0x2c45(%rip),%xmm8 # 4d10 <_sk_callback_sse41+0x620> + .byte 102,68,15,111,5,165,44,0,0 // movdqa 0x2ca5(%rip),%xmm8 # 4d70 <_sk_callback_sse41+0x61e> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 @@ -22786,7 +22959,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 243,67,15,16,28,8 // movss (%r8,%r9,1),%xmm3 .byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0 .byte 76,139,64,16 // mov 0x10(%rax),%r8 - .byte 102,15,56,0,13,248,43,0,0 // pshufb 0x2bf8(%rip),%xmm1 # 4d20 <_sk_callback_sse41+0x630> + .byte 102,15,56,0,13,88,44,0,0 // pshufb 0x2c58(%rip),%xmm1 # 4d80 <_sk_callback_sse41+0x62e> .byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1 .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,201 // movq %xmm1,%rcx @@ -22817,7 +22990,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 243,65,15,16,28,8 // movss (%r8,%rcx,1),%xmm3 .byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,99,43,0,0 // movaps 0x2b63(%rip),%xmm3 # 4d30 <_sk_callback_sse41+0x640> + .byte 15,40,29,195,43,0,0 // movaps 0x2bc3(%rip),%xmm3 # 4d90 <_sk_callback_sse41+0x63e> .byte 255,224 // jmpq *%rax HIDDEN _sk_byte_tables_sse41 @@ -22827,7 +23000,7 @@ _sk_byte_tables_sse41: .byte 65,86 // push %r14 .byte 83 // push %rbx .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,100,43,0,0 // movaps 0x2b64(%rip),%xmm8 # 4d40 <_sk_callback_sse41+0x650> + .byte 68,15,40,5,196,43,0,0 // movaps 0x2bc4(%rip),%xmm8 # 4da0 <_sk_callback_sse41+0x64e> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx @@ -22846,7 +23019,7 @@ _sk_byte_tables_sse41: .byte 102,15,58,32,193,3 // pinsrb $0x3,%ecx,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,13,21,43,0,0 // movaps 0x2b15(%rip),%xmm9 # 4d50 <_sk_callback_sse41+0x660> + .byte 68,15,40,13,117,43,0,0 // movaps 0x2b75(%rip),%xmm9 # 4db0 <_sk_callback_sse41+0x65e> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -22937,7 +23110,7 @@ _sk_byte_tables_rgb_sse41: .byte 102,15,58,32,193,3 // pinsrb $0x3,%ecx,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,13,157,41,0,0 // movaps 0x299d(%rip),%xmm9 # 4d60 <_sk_callback_sse41+0x670> + .byte 68,15,40,13,253,41,0,0 // movaps 0x29fd(%rip),%xmm9 # 4dc0 <_sk_callback_sse41+0x66e> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -23114,31 +23287,31 @@ _sk_parametric_r_sse41: .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8 - .byte 68,15,89,5,244,38,0,0 // mulps 0x26f4(%rip),%xmm8 # 4d70 <_sk_callback_sse41+0x680> - .byte 68,15,84,21,252,38,0,0 // andps 0x26fc(%rip),%xmm10 # 4d80 <_sk_callback_sse41+0x690> - .byte 68,15,86,21,4,39,0,0 // orps 0x2704(%rip),%xmm10 # 4d90 <_sk_callback_sse41+0x6a0> - .byte 68,15,88,5,12,39,0,0 // addps 0x270c(%rip),%xmm8 # 4da0 <_sk_callback_sse41+0x6b0> - .byte 68,15,40,37,20,39,0,0 // movaps 0x2714(%rip),%xmm12 # 4db0 <_sk_callback_sse41+0x6c0> + .byte 68,15,89,5,84,39,0,0 // mulps 0x2754(%rip),%xmm8 # 4dd0 <_sk_callback_sse41+0x67e> + .byte 68,15,84,21,92,39,0,0 // andps 0x275c(%rip),%xmm10 # 4de0 <_sk_callback_sse41+0x68e> + .byte 68,15,86,21,100,39,0,0 // orps 0x2764(%rip),%xmm10 # 4df0 <_sk_callback_sse41+0x69e> + .byte 68,15,88,5,108,39,0,0 // addps 0x276c(%rip),%xmm8 # 4e00 <_sk_callback_sse41+0x6ae> + .byte 68,15,40,37,116,39,0,0 // movaps 0x2774(%rip),%xmm12 # 4e10 <_sk_callback_sse41+0x6be> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,196 // subps %xmm12,%xmm8 - .byte 68,15,88,21,20,39,0,0 // addps 0x2714(%rip),%xmm10 # 4dc0 <_sk_callback_sse41+0x6d0> - .byte 68,15,40,37,28,39,0,0 // movaps 0x271c(%rip),%xmm12 # 4dd0 <_sk_callback_sse41+0x6e0> + .byte 68,15,88,21,116,39,0,0 // addps 0x2774(%rip),%xmm10 # 4e20 <_sk_callback_sse41+0x6ce> + .byte 68,15,40,37,124,39,0,0 // movaps 0x277c(%rip),%xmm12 # 4e30 <_sk_callback_sse41+0x6de> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,196 // subps %xmm12,%xmm8 .byte 69,15,89,195 // mulps %xmm11,%xmm8 .byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10 .byte 69,15,40,216 // movaps %xmm8,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,5,9,39,0,0 // addps 0x2709(%rip),%xmm8 # 4de0 <_sk_callback_sse41+0x6f0> - .byte 68,15,40,21,17,39,0,0 // movaps 0x2711(%rip),%xmm10 # 4df0 <_sk_callback_sse41+0x700> + .byte 68,15,88,5,105,39,0,0 // addps 0x2769(%rip),%xmm8 # 4e40 <_sk_callback_sse41+0x6ee> + .byte 68,15,40,21,113,39,0,0 // movaps 0x2771(%rip),%xmm10 # 4e50 <_sk_callback_sse41+0x6fe> .byte 69,15,89,211 // mulps %xmm11,%xmm10 .byte 69,15,92,194 // subps %xmm10,%xmm8 - .byte 68,15,40,21,17,39,0,0 // movaps 0x2711(%rip),%xmm10 # 4e00 <_sk_callback_sse41+0x710> + .byte 68,15,40,21,113,39,0,0 // movaps 0x2771(%rip),%xmm10 # 4e60 <_sk_callback_sse41+0x70e> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 68,15,40,29,21,39,0,0 // movaps 0x2715(%rip),%xmm11 # 4e10 <_sk_callback_sse41+0x720> + .byte 68,15,40,29,117,39,0,0 // movaps 0x2775(%rip),%xmm11 # 4e70 <_sk_callback_sse41+0x71e> .byte 69,15,94,218 // divps %xmm10,%xmm11 .byte 69,15,88,216 // addps %xmm8,%xmm11 - .byte 68,15,89,29,21,39,0,0 // mulps 0x2715(%rip),%xmm11 # 4e20 <_sk_callback_sse41+0x730> + .byte 68,15,89,29,117,39,0,0 // mulps 0x2775(%rip),%xmm11 # 4e80 <_sk_callback_sse41+0x72e> .byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10 .byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 @@ -23146,7 +23319,7 @@ _sk_parametric_r_sse41: .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 68,15,95,192 // maxps %xmm0,%xmm8 - .byte 68,15,93,5,252,38,0,0 // minps 0x26fc(%rip),%xmm8 # 4e30 <_sk_callback_sse41+0x740> + .byte 68,15,93,5,92,39,0,0 // minps 0x275c(%rip),%xmm8 # 4e90 <_sk_callback_sse41+0x73e> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -23176,31 +23349,31 @@ _sk_parametric_g_sse41: .byte 68,15,88,217 // addps %xmm1,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,157,38,0,0 // mulps 0x269d(%rip),%xmm12 # 4e40 <_sk_callback_sse41+0x750> - .byte 68,15,84,29,165,38,0,0 // andps 0x26a5(%rip),%xmm11 # 4e50 <_sk_callback_sse41+0x760> - .byte 68,15,86,29,173,38,0,0 // orps 0x26ad(%rip),%xmm11 # 4e60 <_sk_callback_sse41+0x770> - .byte 68,15,88,37,181,38,0,0 // addps 0x26b5(%rip),%xmm12 # 4e70 <_sk_callback_sse41+0x780> - .byte 15,40,13,190,38,0,0 // movaps 0x26be(%rip),%xmm1 # 4e80 <_sk_callback_sse41+0x790> + .byte 68,15,89,37,253,38,0,0 // mulps 0x26fd(%rip),%xmm12 # 4ea0 <_sk_callback_sse41+0x74e> + .byte 68,15,84,29,5,39,0,0 // andps 0x2705(%rip),%xmm11 # 4eb0 <_sk_callback_sse41+0x75e> + .byte 68,15,86,29,13,39,0,0 // orps 0x270d(%rip),%xmm11 # 4ec0 <_sk_callback_sse41+0x76e> + .byte 68,15,88,37,21,39,0,0 // addps 0x2715(%rip),%xmm12 # 4ed0 <_sk_callback_sse41+0x77e> + .byte 15,40,13,30,39,0,0 // movaps 0x271e(%rip),%xmm1 # 4ee0 <_sk_callback_sse41+0x78e> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 - .byte 68,15,88,29,190,38,0,0 // addps 0x26be(%rip),%xmm11 # 4e90 <_sk_callback_sse41+0x7a0> - .byte 15,40,13,199,38,0,0 // movaps 0x26c7(%rip),%xmm1 # 4ea0 <_sk_callback_sse41+0x7b0> + .byte 68,15,88,29,30,39,0,0 // addps 0x271e(%rip),%xmm11 # 4ef0 <_sk_callback_sse41+0x79e> + .byte 15,40,13,39,39,0,0 // movaps 0x2727(%rip),%xmm1 # 4f00 <_sk_callback_sse41+0x7ae> .byte 65,15,94,203 // divps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,180,38,0,0 // addps 0x26b4(%rip),%xmm12 # 4eb0 <_sk_callback_sse41+0x7c0> - .byte 15,40,13,189,38,0,0 // movaps 0x26bd(%rip),%xmm1 # 4ec0 <_sk_callback_sse41+0x7d0> + .byte 68,15,88,37,20,39,0,0 // addps 0x2714(%rip),%xmm12 # 4f10 <_sk_callback_sse41+0x7be> + .byte 15,40,13,29,39,0,0 // movaps 0x271d(%rip),%xmm1 # 4f20 <_sk_callback_sse41+0x7ce> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 - .byte 68,15,40,21,189,38,0,0 // movaps 0x26bd(%rip),%xmm10 # 4ed0 <_sk_callback_sse41+0x7e0> + .byte 68,15,40,21,29,39,0,0 // movaps 0x271d(%rip),%xmm10 # 4f30 <_sk_callback_sse41+0x7de> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,13,194,38,0,0 // movaps 0x26c2(%rip),%xmm1 # 4ee0 <_sk_callback_sse41+0x7f0> + .byte 15,40,13,34,39,0,0 // movaps 0x2722(%rip),%xmm1 # 4f40 <_sk_callback_sse41+0x7ee> .byte 65,15,94,202 // divps %xmm10,%xmm1 .byte 65,15,88,204 // addps %xmm12,%xmm1 - .byte 15,89,13,195,38,0,0 // mulps 0x26c3(%rip),%xmm1 # 4ef0 <_sk_callback_sse41+0x800> + .byte 15,89,13,35,39,0,0 // mulps 0x2723(%rip),%xmm1 # 4f50 <_sk_callback_sse41+0x7fe> .byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10 .byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1 .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1 @@ -23208,7 +23381,7 @@ _sk_parametric_g_sse41: .byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,200 // maxps %xmm0,%xmm1 - .byte 15,93,13,174,38,0,0 // minps 0x26ae(%rip),%xmm1 # 4f00 <_sk_callback_sse41+0x810> + .byte 15,93,13,14,39,0,0 // minps 0x270e(%rip),%xmm1 # 4f60 <_sk_callback_sse41+0x80e> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -23238,31 +23411,31 @@ _sk_parametric_b_sse41: .byte 68,15,88,218 // addps %xmm2,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,79,38,0,0 // mulps 0x264f(%rip),%xmm12 # 4f10 <_sk_callback_sse41+0x820> - .byte 68,15,84,29,87,38,0,0 // andps 0x2657(%rip),%xmm11 # 4f20 <_sk_callback_sse41+0x830> - .byte 68,15,86,29,95,38,0,0 // orps 0x265f(%rip),%xmm11 # 4f30 <_sk_callback_sse41+0x840> - .byte 68,15,88,37,103,38,0,0 // addps 0x2667(%rip),%xmm12 # 4f40 <_sk_callback_sse41+0x850> - .byte 15,40,21,112,38,0,0 // movaps 0x2670(%rip),%xmm2 # 4f50 <_sk_callback_sse41+0x860> + .byte 68,15,89,37,175,38,0,0 // mulps 0x26af(%rip),%xmm12 # 4f70 <_sk_callback_sse41+0x81e> + .byte 68,15,84,29,183,38,0,0 // andps 0x26b7(%rip),%xmm11 # 4f80 <_sk_callback_sse41+0x82e> + .byte 68,15,86,29,191,38,0,0 // orps 0x26bf(%rip),%xmm11 # 4f90 <_sk_callback_sse41+0x83e> + .byte 68,15,88,37,199,38,0,0 // addps 0x26c7(%rip),%xmm12 # 4fa0 <_sk_callback_sse41+0x84e> + .byte 15,40,21,208,38,0,0 // movaps 0x26d0(%rip),%xmm2 # 4fb0 <_sk_callback_sse41+0x85e> .byte 65,15,89,211 // mulps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 - .byte 68,15,88,29,112,38,0,0 // addps 0x2670(%rip),%xmm11 # 4f60 <_sk_callback_sse41+0x870> - .byte 15,40,21,121,38,0,0 // movaps 0x2679(%rip),%xmm2 # 4f70 <_sk_callback_sse41+0x880> + .byte 68,15,88,29,208,38,0,0 // addps 0x26d0(%rip),%xmm11 # 4fc0 <_sk_callback_sse41+0x86e> + .byte 15,40,21,217,38,0,0 // movaps 0x26d9(%rip),%xmm2 # 4fd0 <_sk_callback_sse41+0x87e> .byte 65,15,94,211 // divps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,102,38,0,0 // addps 0x2666(%rip),%xmm12 # 4f80 <_sk_callback_sse41+0x890> - .byte 15,40,21,111,38,0,0 // movaps 0x266f(%rip),%xmm2 # 4f90 <_sk_callback_sse41+0x8a0> + .byte 68,15,88,37,198,38,0,0 // addps 0x26c6(%rip),%xmm12 # 4fe0 <_sk_callback_sse41+0x88e> + .byte 15,40,21,207,38,0,0 // movaps 0x26cf(%rip),%xmm2 # 4ff0 <_sk_callback_sse41+0x89e> .byte 65,15,89,211 // mulps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 - .byte 68,15,40,21,111,38,0,0 // movaps 0x266f(%rip),%xmm10 # 4fa0 <_sk_callback_sse41+0x8b0> + .byte 68,15,40,21,207,38,0,0 // movaps 0x26cf(%rip),%xmm10 # 5000 <_sk_callback_sse41+0x8ae> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,21,116,38,0,0 // movaps 0x2674(%rip),%xmm2 # 4fb0 <_sk_callback_sse41+0x8c0> + .byte 15,40,21,212,38,0,0 // movaps 0x26d4(%rip),%xmm2 # 5010 <_sk_callback_sse41+0x8be> .byte 65,15,94,210 // divps %xmm10,%xmm2 .byte 65,15,88,212 // addps %xmm12,%xmm2 - .byte 15,89,21,117,38,0,0 // mulps 0x2675(%rip),%xmm2 # 4fc0 <_sk_callback_sse41+0x8d0> + .byte 15,89,21,213,38,0,0 // mulps 0x26d5(%rip),%xmm2 # 5020 <_sk_callback_sse41+0x8ce> .byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10 .byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2 .byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2 @@ -23270,7 +23443,7 @@ _sk_parametric_b_sse41: .byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,208 // maxps %xmm0,%xmm2 - .byte 15,93,21,96,38,0,0 // minps 0x2660(%rip),%xmm2 # 4fd0 <_sk_callback_sse41+0x8e0> + .byte 15,93,21,192,38,0,0 // minps 0x26c0(%rip),%xmm2 # 5030 <_sk_callback_sse41+0x8de> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -23300,31 +23473,31 @@ _sk_parametric_a_sse41: .byte 68,15,88,219 // addps %xmm3,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,1,38,0,0 // mulps 0x2601(%rip),%xmm12 # 4fe0 <_sk_callback_sse41+0x8f0> - .byte 68,15,84,29,9,38,0,0 // andps 0x2609(%rip),%xmm11 # 4ff0 <_sk_callback_sse41+0x900> - .byte 68,15,86,29,17,38,0,0 // orps 0x2611(%rip),%xmm11 # 5000 <_sk_callback_sse41+0x910> - .byte 68,15,88,37,25,38,0,0 // addps 0x2619(%rip),%xmm12 # 5010 <_sk_callback_sse41+0x920> - .byte 15,40,29,34,38,0,0 // movaps 0x2622(%rip),%xmm3 # 5020 <_sk_callback_sse41+0x930> + .byte 68,15,89,37,97,38,0,0 // mulps 0x2661(%rip),%xmm12 # 5040 <_sk_callback_sse41+0x8ee> + .byte 68,15,84,29,105,38,0,0 // andps 0x2669(%rip),%xmm11 # 5050 <_sk_callback_sse41+0x8fe> + .byte 68,15,86,29,113,38,0,0 // orps 0x2671(%rip),%xmm11 # 5060 <_sk_callback_sse41+0x90e> + .byte 68,15,88,37,121,38,0,0 // addps 0x2679(%rip),%xmm12 # 5070 <_sk_callback_sse41+0x91e> + .byte 15,40,29,130,38,0,0 // movaps 0x2682(%rip),%xmm3 # 5080 <_sk_callback_sse41+0x92e> .byte 65,15,89,219 // mulps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 - .byte 68,15,88,29,34,38,0,0 // addps 0x2622(%rip),%xmm11 # 5030 <_sk_callback_sse41+0x940> - .byte 15,40,29,43,38,0,0 // movaps 0x262b(%rip),%xmm3 # 5040 <_sk_callback_sse41+0x950> + .byte 68,15,88,29,130,38,0,0 // addps 0x2682(%rip),%xmm11 # 5090 <_sk_callback_sse41+0x93e> + .byte 15,40,29,139,38,0,0 // movaps 0x268b(%rip),%xmm3 # 50a0 <_sk_callback_sse41+0x94e> .byte 65,15,94,219 // divps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,24,38,0,0 // addps 0x2618(%rip),%xmm12 # 5050 <_sk_callback_sse41+0x960> - .byte 15,40,29,33,38,0,0 // movaps 0x2621(%rip),%xmm3 # 5060 <_sk_callback_sse41+0x970> + .byte 68,15,88,37,120,38,0,0 // addps 0x2678(%rip),%xmm12 # 50b0 <_sk_callback_sse41+0x95e> + .byte 15,40,29,129,38,0,0 // movaps 0x2681(%rip),%xmm3 # 50c0 <_sk_callback_sse41+0x96e> .byte 65,15,89,219 // mulps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 - .byte 68,15,40,21,33,38,0,0 // movaps 0x2621(%rip),%xmm10 # 5070 <_sk_callback_sse41+0x980> + .byte 68,15,40,21,129,38,0,0 // movaps 0x2681(%rip),%xmm10 # 50d0 <_sk_callback_sse41+0x97e> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,29,38,38,0,0 // movaps 0x2626(%rip),%xmm3 # 5080 <_sk_callback_sse41+0x990> + .byte 15,40,29,134,38,0,0 // movaps 0x2686(%rip),%xmm3 # 50e0 <_sk_callback_sse41+0x98e> .byte 65,15,94,218 // divps %xmm10,%xmm3 .byte 65,15,88,220 // addps %xmm12,%xmm3 - .byte 15,89,29,39,38,0,0 // mulps 0x2627(%rip),%xmm3 # 5090 <_sk_callback_sse41+0x9a0> + .byte 15,89,29,135,38,0,0 // mulps 0x2687(%rip),%xmm3 # 50f0 <_sk_callback_sse41+0x99e> .byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10 .byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 @@ -23332,7 +23505,7 @@ _sk_parametric_a_sse41: .byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,216 // maxps %xmm0,%xmm3 - .byte 15,93,29,18,38,0,0 // minps 0x2612(%rip),%xmm3 # 50a0 <_sk_callback_sse41+0x9b0> + .byte 15,93,29,114,38,0,0 // minps 0x2672(%rip),%xmm3 # 5100 <_sk_callback_sse41+0x9ae> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -23342,29 +23515,29 @@ HIDDEN _sk_lab_to_xyz_sse41 FUNCTION(_sk_lab_to_xyz_sse41) _sk_lab_to_xyz_sse41: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,89,5,14,38,0,0 // mulps 0x260e(%rip),%xmm8 # 50b0 <_sk_callback_sse41+0x9c0> - .byte 68,15,40,13,22,38,0,0 // movaps 0x2616(%rip),%xmm9 # 50c0 <_sk_callback_sse41+0x9d0> + .byte 68,15,89,5,110,38,0,0 // mulps 0x266e(%rip),%xmm8 # 5110 <_sk_callback_sse41+0x9be> + .byte 68,15,40,13,118,38,0,0 // movaps 0x2676(%rip),%xmm9 # 5120 <_sk_callback_sse41+0x9ce> .byte 65,15,89,201 // mulps %xmm9,%xmm1 - .byte 15,40,5,27,38,0,0 // movaps 0x261b(%rip),%xmm0 # 50d0 <_sk_callback_sse41+0x9e0> + .byte 15,40,5,123,38,0,0 // movaps 0x267b(%rip),%xmm0 # 5130 <_sk_callback_sse41+0x9de> .byte 15,88,200 // addps %xmm0,%xmm1 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 15,88,208 // addps %xmm0,%xmm2 - .byte 68,15,88,5,25,38,0,0 // addps 0x2619(%rip),%xmm8 # 50e0 <_sk_callback_sse41+0x9f0> - .byte 68,15,89,5,33,38,0,0 // mulps 0x2621(%rip),%xmm8 # 50f0 <_sk_callback_sse41+0xa00> - .byte 15,89,13,42,38,0,0 // mulps 0x262a(%rip),%xmm1 # 5100 <_sk_callback_sse41+0xa10> + .byte 68,15,88,5,121,38,0,0 // addps 0x2679(%rip),%xmm8 # 5140 <_sk_callback_sse41+0x9ee> + .byte 68,15,89,5,129,38,0,0 // mulps 0x2681(%rip),%xmm8 # 5150 <_sk_callback_sse41+0x9fe> + .byte 15,89,13,138,38,0,0 // mulps 0x268a(%rip),%xmm1 # 5160 <_sk_callback_sse41+0xa0e> .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 15,89,21,47,38,0,0 // mulps 0x262f(%rip),%xmm2 # 5110 <_sk_callback_sse41+0xa20> + .byte 15,89,21,143,38,0,0 // mulps 0x268f(%rip),%xmm2 # 5170 <_sk_callback_sse41+0xa1e> .byte 69,15,40,208 // movaps %xmm8,%xmm10 .byte 68,15,92,210 // subps %xmm2,%xmm10 .byte 68,15,40,217 // movaps %xmm1,%xmm11 .byte 69,15,89,219 // mulps %xmm11,%xmm11 .byte 68,15,89,217 // mulps %xmm1,%xmm11 - .byte 68,15,40,13,35,38,0,0 // movaps 0x2623(%rip),%xmm9 # 5120 <_sk_callback_sse41+0xa30> + .byte 68,15,40,13,131,38,0,0 // movaps 0x2683(%rip),%xmm9 # 5180 <_sk_callback_sse41+0xa2e> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0 - .byte 15,40,21,35,38,0,0 // movaps 0x2623(%rip),%xmm2 # 5130 <_sk_callback_sse41+0xa40> + .byte 15,40,21,131,38,0,0 // movaps 0x2683(%rip),%xmm2 # 5190 <_sk_callback_sse41+0xa3e> .byte 15,88,202 // addps %xmm2,%xmm1 - .byte 68,15,40,37,40,38,0,0 // movaps 0x2628(%rip),%xmm12 # 5140 <_sk_callback_sse41+0xa50> + .byte 68,15,40,37,136,38,0,0 // movaps 0x2688(%rip),%xmm12 # 51a0 <_sk_callback_sse41+0xa4e> .byte 65,15,89,204 // mulps %xmm12,%xmm1 .byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1 .byte 69,15,40,216 // movaps %xmm8,%xmm11 @@ -23383,8 +23556,8 @@ _sk_lab_to_xyz_sse41: .byte 65,15,89,212 // mulps %xmm12,%xmm2 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2 - .byte 15,89,13,225,37,0,0 // mulps 0x25e1(%rip),%xmm1 # 5150 <_sk_callback_sse41+0xa60> - .byte 15,89,21,234,37,0,0 // mulps 0x25ea(%rip),%xmm2 # 5160 <_sk_callback_sse41+0xa70> + .byte 15,89,13,65,38,0,0 // mulps 0x2641(%rip),%xmm1 # 51b0 <_sk_callback_sse41+0xa5e> + .byte 15,89,21,74,38,0,0 // mulps 0x264a(%rip),%xmm2 # 51c0 <_sk_callback_sse41+0xa6e> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 65,15,40,200 // movaps %xmm8,%xmm1 @@ -23398,7 +23571,7 @@ _sk_load_a8_sse41: .byte 72,139,0 // mov (%rax),%rax .byte 102,15,56,49,4,56 // pmovzxbd (%rax,%rdi,1),%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,218,37,0,0 // mulps 0x25da(%rip),%xmm3 # 5170 <_sk_callback_sse41+0xa80> + .byte 15,89,29,58,38,0,0 // mulps 0x263a(%rip),%xmm3 # 51d0 <_sk_callback_sse41+0xa7e> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,87,201 // xorps %xmm1,%xmm1 @@ -23431,7 +23604,7 @@ _sk_gather_a8_sse41: .byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,110,37,0,0 // mulps 0x256e(%rip),%xmm3 # 5180 <_sk_callback_sse41+0xa90> + .byte 15,89,29,206,37,0,0 // mulps 0x25ce(%rip),%xmm3 # 51e0 <_sk_callback_sse41+0xa8e> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -23444,7 +23617,7 @@ FUNCTION(_sk_store_a8_sse41) _sk_store_a8_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,98,37,0,0 // movaps 0x2562(%rip),%xmm8 # 5190 <_sk_callback_sse41+0xaa0> + .byte 68,15,40,5,194,37,0,0 // movaps 0x25c2(%rip),%xmm8 # 51f0 <_sk_callback_sse41+0xa9e> .byte 68,15,89,195 // mulps %xmm3,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 .byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8 @@ -23461,9 +23634,9 @@ _sk_load_g8_sse41: .byte 72,139,0 // mov (%rax),%rax .byte 102,15,56,49,4,56 // pmovzxbd (%rax,%rdi,1),%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,63,37,0,0 // mulps 0x253f(%rip),%xmm0 # 51a0 <_sk_callback_sse41+0xab0> + .byte 15,89,5,159,37,0,0 // mulps 0x259f(%rip),%xmm0 # 5200 <_sk_callback_sse41+0xaae> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,70,37,0,0 // movaps 0x2546(%rip),%xmm3 # 51b0 <_sk_callback_sse41+0xac0> + .byte 15,40,29,166,37,0,0 // movaps 0x25a6(%rip),%xmm3 # 5210 <_sk_callback_sse41+0xabe> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,224 // jmpq *%rax @@ -23494,9 +23667,9 @@ _sk_gather_g8_sse41: .byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,223,36,0,0 // mulps 0x24df(%rip),%xmm0 # 51c0 <_sk_callback_sse41+0xad0> + .byte 15,89,5,63,37,0,0 // mulps 0x253f(%rip),%xmm0 # 5220 <_sk_callback_sse41+0xace> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,230,36,0,0 // movaps 0x24e6(%rip),%xmm3 # 51d0 <_sk_callback_sse41+0xae0> + .byte 15,40,29,70,37,0,0 // movaps 0x2546(%rip),%xmm3 # 5230 <_sk_callback_sse41+0xade> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,224 // jmpq *%rax @@ -23541,17 +23714,17 @@ _sk_gather_i8_sse41: .byte 102,15,58,34,28,8,1 // pinsrd $0x1,(%rax,%rcx,1),%xmm3 .byte 102,66,15,58,34,28,144,2 // pinsrd $0x2,(%rax,%r10,4),%xmm3 .byte 102,66,15,58,34,28,8,3 // pinsrd $0x3,(%rax,%r9,1),%xmm3 - .byte 102,15,111,5,61,36,0,0 // movdqa 0x243d(%rip),%xmm0 # 51e0 <_sk_callback_sse41+0xaf0> + .byte 102,15,111,5,157,36,0,0 // movdqa 0x249d(%rip),%xmm0 # 5240 <_sk_callback_sse41+0xaee> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,62,36,0,0 // movaps 0x243e(%rip),%xmm8 # 51f0 <_sk_callback_sse41+0xb00> + .byte 68,15,40,5,158,36,0,0 // movaps 0x249e(%rip),%xmm8 # 5250 <_sk_callback_sse41+0xafe> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 - .byte 102,15,56,0,13,61,36,0,0 // pshufb 0x243d(%rip),%xmm1 # 5200 <_sk_callback_sse41+0xb10> + .byte 102,15,56,0,13,157,36,0,0 // pshufb 0x249d(%rip),%xmm1 # 5260 <_sk_callback_sse41+0xb0e> .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,211 // movdqa %xmm3,%xmm2 - .byte 102,15,56,0,21,57,36,0,0 // pshufb 0x2439(%rip),%xmm2 # 5210 <_sk_callback_sse41+0xb20> + .byte 102,15,56,0,21,153,36,0,0 // pshufb 0x2499(%rip),%xmm2 # 5270 <_sk_callback_sse41+0xb1e> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -23567,19 +23740,19 @@ _sk_load_565_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 102,15,56,51,20,120 // pmovzxwd (%rax,%rdi,2),%xmm2 - .byte 102,15,111,5,31,36,0,0 // movdqa 0x241f(%rip),%xmm0 # 5220 <_sk_callback_sse41+0xb30> + .byte 102,15,111,5,127,36,0,0 // movdqa 0x247f(%rip),%xmm0 # 5280 <_sk_callback_sse41+0xb2e> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,33,36,0,0 // mulps 0x2421(%rip),%xmm0 # 5230 <_sk_callback_sse41+0xb40> - .byte 102,15,111,13,41,36,0,0 // movdqa 0x2429(%rip),%xmm1 # 5240 <_sk_callback_sse41+0xb50> + .byte 15,89,5,129,36,0,0 // mulps 0x2481(%rip),%xmm0 # 5290 <_sk_callback_sse41+0xb3e> + .byte 102,15,111,13,137,36,0,0 // movdqa 0x2489(%rip),%xmm1 # 52a0 <_sk_callback_sse41+0xb4e> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,43,36,0,0 // mulps 0x242b(%rip),%xmm1 # 5250 <_sk_callback_sse41+0xb60> - .byte 102,15,219,21,51,36,0,0 // pand 0x2433(%rip),%xmm2 # 5260 <_sk_callback_sse41+0xb70> + .byte 15,89,13,139,36,0,0 // mulps 0x248b(%rip),%xmm1 # 52b0 <_sk_callback_sse41+0xb5e> + .byte 102,15,219,21,147,36,0,0 // pand 0x2493(%rip),%xmm2 # 52c0 <_sk_callback_sse41+0xb6e> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,57,36,0,0 // mulps 0x2439(%rip),%xmm2 # 5270 <_sk_callback_sse41+0xb80> + .byte 15,89,21,153,36,0,0 // mulps 0x2499(%rip),%xmm2 # 52d0 <_sk_callback_sse41+0xb7e> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,64,36,0,0 // movaps 0x2440(%rip),%xmm3 # 5280 <_sk_callback_sse41+0xb90> + .byte 15,40,29,160,36,0,0 // movaps 0x24a0(%rip),%xmm3 # 52e0 <_sk_callback_sse41+0xb8e> .byte 255,224 // jmpq *%rax HIDDEN _sk_gather_565_sse41 @@ -23607,19 +23780,19 @@ _sk_gather_565_sse41: .byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax .byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0 .byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2 - .byte 102,15,111,5,229,35,0,0 // movdqa 0x23e5(%rip),%xmm0 # 5290 <_sk_callback_sse41+0xba0> + .byte 102,15,111,5,69,36,0,0 // movdqa 0x2445(%rip),%xmm0 # 52f0 <_sk_callback_sse41+0xb9e> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,231,35,0,0 // mulps 0x23e7(%rip),%xmm0 # 52a0 <_sk_callback_sse41+0xbb0> - .byte 102,15,111,13,239,35,0,0 // movdqa 0x23ef(%rip),%xmm1 # 52b0 <_sk_callback_sse41+0xbc0> + .byte 15,89,5,71,36,0,0 // mulps 0x2447(%rip),%xmm0 # 5300 <_sk_callback_sse41+0xbae> + .byte 102,15,111,13,79,36,0,0 // movdqa 0x244f(%rip),%xmm1 # 5310 <_sk_callback_sse41+0xbbe> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,241,35,0,0 // mulps 0x23f1(%rip),%xmm1 # 52c0 <_sk_callback_sse41+0xbd0> - .byte 102,15,219,21,249,35,0,0 // pand 0x23f9(%rip),%xmm2 # 52d0 <_sk_callback_sse41+0xbe0> + .byte 15,89,13,81,36,0,0 // mulps 0x2451(%rip),%xmm1 # 5320 <_sk_callback_sse41+0xbce> + .byte 102,15,219,21,89,36,0,0 // pand 0x2459(%rip),%xmm2 # 5330 <_sk_callback_sse41+0xbde> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,255,35,0,0 // mulps 0x23ff(%rip),%xmm2 # 52e0 <_sk_callback_sse41+0xbf0> + .byte 15,89,21,95,36,0,0 // mulps 0x245f(%rip),%xmm2 # 5340 <_sk_callback_sse41+0xbee> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,6,36,0,0 // movaps 0x2406(%rip),%xmm3 # 52f0 <_sk_callback_sse41+0xc00> + .byte 15,40,29,102,36,0,0 // movaps 0x2466(%rip),%xmm3 # 5350 <_sk_callback_sse41+0xbfe> .byte 255,224 // jmpq *%rax HIDDEN _sk_store_565_sse41 @@ -23628,12 +23801,12 @@ FUNCTION(_sk_store_565_sse41) _sk_store_565_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,7,36,0,0 // movaps 0x2407(%rip),%xmm8 # 5300 <_sk_callback_sse41+0xc10> + .byte 68,15,40,5,103,36,0,0 // movaps 0x2467(%rip),%xmm8 # 5360 <_sk_callback_sse41+0xc0e> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 .byte 102,65,15,114,241,11 // pslld $0xb,%xmm9 - .byte 68,15,40,21,252,35,0,0 // movaps 0x23fc(%rip),%xmm10 # 5310 <_sk_callback_sse41+0xc20> + .byte 68,15,40,21,92,36,0,0 // movaps 0x245c(%rip),%xmm10 # 5370 <_sk_callback_sse41+0xc1e> .byte 68,15,89,209 // mulps %xmm1,%xmm10 .byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10 .byte 102,65,15,114,242,5 // pslld $0x5,%xmm10 @@ -23653,21 +23826,21 @@ _sk_load_4444_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 102,15,56,51,28,120 // pmovzxwd (%rax,%rdi,2),%xmm3 - .byte 102,15,111,5,199,35,0,0 // movdqa 0x23c7(%rip),%xmm0 # 5320 <_sk_callback_sse41+0xc30> + .byte 102,15,111,5,39,36,0,0 // movdqa 0x2427(%rip),%xmm0 # 5380 <_sk_callback_sse41+0xc2e> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,201,35,0,0 // mulps 0x23c9(%rip),%xmm0 # 5330 <_sk_callback_sse41+0xc40> - .byte 102,15,111,13,209,35,0,0 // movdqa 0x23d1(%rip),%xmm1 # 5340 <_sk_callback_sse41+0xc50> + .byte 15,89,5,41,36,0,0 // mulps 0x2429(%rip),%xmm0 # 5390 <_sk_callback_sse41+0xc3e> + .byte 102,15,111,13,49,36,0,0 // movdqa 0x2431(%rip),%xmm1 # 53a0 <_sk_callback_sse41+0xc4e> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,211,35,0,0 // mulps 0x23d3(%rip),%xmm1 # 5350 <_sk_callback_sse41+0xc60> - .byte 102,15,111,21,219,35,0,0 // movdqa 0x23db(%rip),%xmm2 # 5360 <_sk_callback_sse41+0xc70> + .byte 15,89,13,51,36,0,0 // mulps 0x2433(%rip),%xmm1 # 53b0 <_sk_callback_sse41+0xc5e> + .byte 102,15,111,21,59,36,0,0 // movdqa 0x243b(%rip),%xmm2 # 53c0 <_sk_callback_sse41+0xc6e> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,221,35,0,0 // mulps 0x23dd(%rip),%xmm2 # 5370 <_sk_callback_sse41+0xc80> - .byte 102,15,219,29,229,35,0,0 // pand 0x23e5(%rip),%xmm3 # 5380 <_sk_callback_sse41+0xc90> + .byte 15,89,21,61,36,0,0 // mulps 0x243d(%rip),%xmm2 # 53d0 <_sk_callback_sse41+0xc7e> + .byte 102,15,219,29,69,36,0,0 // pand 0x2445(%rip),%xmm3 # 53e0 <_sk_callback_sse41+0xc8e> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,235,35,0,0 // mulps 0x23eb(%rip),%xmm3 # 5390 <_sk_callback_sse41+0xca0> + .byte 15,89,29,75,36,0,0 // mulps 0x244b(%rip),%xmm3 # 53f0 <_sk_callback_sse41+0xc9e> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -23696,21 +23869,21 @@ _sk_gather_4444_sse41: .byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax .byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0 .byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3 - .byte 102,15,111,5,142,35,0,0 // movdqa 0x238e(%rip),%xmm0 # 53a0 <_sk_callback_sse41+0xcb0> + .byte 102,15,111,5,238,35,0,0 // movdqa 0x23ee(%rip),%xmm0 # 5400 <_sk_callback_sse41+0xcae> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,144,35,0,0 // mulps 0x2390(%rip),%xmm0 # 53b0 <_sk_callback_sse41+0xcc0> - .byte 102,15,111,13,152,35,0,0 // movdqa 0x2398(%rip),%xmm1 # 53c0 <_sk_callback_sse41+0xcd0> + .byte 15,89,5,240,35,0,0 // mulps 0x23f0(%rip),%xmm0 # 5410 <_sk_callback_sse41+0xcbe> + .byte 102,15,111,13,248,35,0,0 // movdqa 0x23f8(%rip),%xmm1 # 5420 <_sk_callback_sse41+0xcce> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,154,35,0,0 // mulps 0x239a(%rip),%xmm1 # 53d0 <_sk_callback_sse41+0xce0> - .byte 102,15,111,21,162,35,0,0 // movdqa 0x23a2(%rip),%xmm2 # 53e0 <_sk_callback_sse41+0xcf0> + .byte 15,89,13,250,35,0,0 // mulps 0x23fa(%rip),%xmm1 # 5430 <_sk_callback_sse41+0xcde> + .byte 102,15,111,21,2,36,0,0 // movdqa 0x2402(%rip),%xmm2 # 5440 <_sk_callback_sse41+0xcee> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,164,35,0,0 // mulps 0x23a4(%rip),%xmm2 # 53f0 <_sk_callback_sse41+0xd00> - .byte 102,15,219,29,172,35,0,0 // pand 0x23ac(%rip),%xmm3 # 5400 <_sk_callback_sse41+0xd10> + .byte 15,89,21,4,36,0,0 // mulps 0x2404(%rip),%xmm2 # 5450 <_sk_callback_sse41+0xcfe> + .byte 102,15,219,29,12,36,0,0 // pand 0x240c(%rip),%xmm3 # 5460 <_sk_callback_sse41+0xd0e> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,178,35,0,0 // mulps 0x23b2(%rip),%xmm3 # 5410 <_sk_callback_sse41+0xd20> + .byte 15,89,29,18,36,0,0 // mulps 0x2412(%rip),%xmm3 # 5470 <_sk_callback_sse41+0xd1e> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -23720,7 +23893,7 @@ FUNCTION(_sk_store_4444_sse41) _sk_store_4444_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,177,35,0,0 // movaps 0x23b1(%rip),%xmm8 # 5420 <_sk_callback_sse41+0xd30> + .byte 68,15,40,5,17,36,0,0 // movaps 0x2411(%rip),%xmm8 # 5480 <_sk_callback_sse41+0xd2e> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -23750,17 +23923,17 @@ _sk_load_8888_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 15,16,28,184 // movups (%rax,%rdi,4),%xmm3 - .byte 15,40,5,80,35,0,0 // movaps 0x2350(%rip),%xmm0 # 5430 <_sk_callback_sse41+0xd40> + .byte 15,40,5,176,35,0,0 // movaps 0x23b0(%rip),%xmm0 # 5490 <_sk_callback_sse41+0xd3e> .byte 15,84,195 // andps %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,82,35,0,0 // movaps 0x2352(%rip),%xmm8 # 5440 <_sk_callback_sse41+0xd50> + .byte 68,15,40,5,178,35,0,0 // movaps 0x23b2(%rip),%xmm8 # 54a0 <_sk_callback_sse41+0xd4e> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,40,203 // movaps %xmm3,%xmm1 - .byte 102,15,56,0,13,82,35,0,0 // pshufb 0x2352(%rip),%xmm1 # 5450 <_sk_callback_sse41+0xd60> + .byte 102,15,56,0,13,178,35,0,0 // pshufb 0x23b2(%rip),%xmm1 # 54b0 <_sk_callback_sse41+0xd5e> .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 15,40,211 // movaps %xmm3,%xmm2 - .byte 102,15,56,0,21,79,35,0,0 // pshufb 0x234f(%rip),%xmm2 # 5460 <_sk_callback_sse41+0xd70> + .byte 102,15,56,0,21,175,35,0,0 // pshufb 0x23af(%rip),%xmm2 # 54c0 <_sk_callback_sse41+0xd6e> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -23791,17 +23964,17 @@ _sk_gather_8888_sse41: .byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3 .byte 102,67,15,58,34,28,145,2 // pinsrd $0x2,(%r9,%r10,4),%xmm3 .byte 102,65,15,58,34,28,137,3 // pinsrd $0x3,(%r9,%rcx,4),%xmm3 - .byte 102,15,111,5,232,34,0,0 // movdqa 0x22e8(%rip),%xmm0 # 5470 <_sk_callback_sse41+0xd80> + .byte 102,15,111,5,72,35,0,0 // movdqa 0x2348(%rip),%xmm0 # 54d0 <_sk_callback_sse41+0xd7e> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,233,34,0,0 // movaps 0x22e9(%rip),%xmm8 # 5480 <_sk_callback_sse41+0xd90> + .byte 68,15,40,5,73,35,0,0 // movaps 0x2349(%rip),%xmm8 # 54e0 <_sk_callback_sse41+0xd8e> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 - .byte 102,15,56,0,13,232,34,0,0 // pshufb 0x22e8(%rip),%xmm1 # 5490 <_sk_callback_sse41+0xda0> + .byte 102,15,56,0,13,72,35,0,0 // pshufb 0x2348(%rip),%xmm1 # 54f0 <_sk_callback_sse41+0xd9e> .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,211 // movdqa %xmm3,%xmm2 - .byte 102,15,56,0,21,228,34,0,0 // pshufb 0x22e4(%rip),%xmm2 # 54a0 <_sk_callback_sse41+0xdb0> + .byte 102,15,56,0,21,68,35,0,0 // pshufb 0x2344(%rip),%xmm2 # 5500 <_sk_callback_sse41+0xdae> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -23816,7 +23989,7 @@ FUNCTION(_sk_store_8888_sse41) _sk_store_8888_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,208,34,0,0 // movaps 0x22d0(%rip),%xmm8 # 54b0 <_sk_callback_sse41+0xdc0> + .byte 68,15,40,5,48,35,0,0 // movaps 0x2330(%rip),%xmm8 # 5510 <_sk_callback_sse41+0xdbe> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -23853,18 +24026,18 @@ _sk_load_f16_sse41: .byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 .byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1 - .byte 102,68,15,111,5,73,34,0,0 // movdqa 0x2249(%rip),%xmm8 # 54c0 <_sk_callback_sse41+0xdd0> + .byte 102,68,15,111,5,169,34,0,0 // movdqa 0x22a9(%rip),%xmm8 # 5520 <_sk_callback_sse41+0xdce> .byte 102,15,111,209 // movdqa %xmm1,%xmm2 .byte 102,65,15,219,208 // pand %xmm8,%xmm2 .byte 102,15,239,202 // pxor %xmm2,%xmm1 - .byte 102,15,111,29,68,34,0,0 // movdqa 0x2244(%rip),%xmm3 # 54d0 <_sk_callback_sse41+0xde0> + .byte 102,15,111,29,164,34,0,0 // movdqa 0x22a4(%rip),%xmm3 # 5530 <_sk_callback_sse41+0xdde> .byte 102,15,114,242,16 // pslld $0x10,%xmm2 .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0 .byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0 .byte 102,15,114,241,13 // pslld $0xd,%xmm1 .byte 102,15,235,202 // por %xmm2,%xmm1 - .byte 102,68,15,111,21,48,34,0,0 // movdqa 0x2230(%rip),%xmm10 # 54e0 <_sk_callback_sse41+0xdf0> + .byte 102,68,15,111,21,144,34,0,0 // movdqa 0x2290(%rip),%xmm10 # 5540 <_sk_callback_sse41+0xdee> .byte 102,65,15,254,202 // paddd %xmm10,%xmm1 .byte 102,15,219,193 // pand %xmm1,%xmm0 .byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11 @@ -23937,18 +24110,18 @@ _sk_gather_f16_sse41: .byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11 .byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9 .byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1 - .byte 102,68,15,111,5,238,32,0,0 // movdqa 0x20ee(%rip),%xmm8 # 54f0 <_sk_callback_sse41+0xe00> + .byte 102,68,15,111,5,78,33,0,0 // movdqa 0x214e(%rip),%xmm8 # 5550 <_sk_callback_sse41+0xdfe> .byte 102,15,111,209 // movdqa %xmm1,%xmm2 .byte 102,65,15,219,208 // pand %xmm8,%xmm2 .byte 102,15,239,202 // pxor %xmm2,%xmm1 - .byte 102,15,111,29,233,32,0,0 // movdqa 0x20e9(%rip),%xmm3 # 5500 <_sk_callback_sse41+0xe10> + .byte 102,15,111,29,73,33,0,0 // movdqa 0x2149(%rip),%xmm3 # 5560 <_sk_callback_sse41+0xe0e> .byte 102,15,114,242,16 // pslld $0x10,%xmm2 .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0 .byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0 .byte 102,15,114,241,13 // pslld $0xd,%xmm1 .byte 102,15,235,202 // por %xmm2,%xmm1 - .byte 102,68,15,111,21,213,32,0,0 // movdqa 0x20d5(%rip),%xmm10 # 5510 <_sk_callback_sse41+0xe20> + .byte 102,68,15,111,21,53,33,0,0 // movdqa 0x2135(%rip),%xmm10 # 5570 <_sk_callback_sse41+0xe1e> .byte 102,65,15,254,202 // paddd %xmm10,%xmm1 .byte 102,15,219,193 // pand %xmm1,%xmm0 .byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11 @@ -23996,17 +24169,17 @@ FUNCTION(_sk_store_f16_sse41) _sk_store_f16_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 102,68,15,111,21,11,32,0,0 // movdqa 0x200b(%rip),%xmm10 # 5520 <_sk_callback_sse41+0xe30> + .byte 102,68,15,111,21,107,32,0,0 // movdqa 0x206b(%rip),%xmm10 # 5580 <_sk_callback_sse41+0xe2e> .byte 102,68,15,111,224 // movdqa %xmm0,%xmm12 .byte 102,68,15,111,232 // movdqa %xmm0,%xmm13 .byte 102,69,15,219,234 // pand %xmm10,%xmm13 .byte 102,69,15,239,229 // pxor %xmm13,%xmm12 - .byte 102,68,15,111,13,254,31,0,0 // movdqa 0x1ffe(%rip),%xmm9 # 5530 <_sk_callback_sse41+0xe40> + .byte 102,68,15,111,13,94,32,0,0 // movdqa 0x205e(%rip),%xmm9 # 5590 <_sk_callback_sse41+0xe3e> .byte 102,65,15,114,213,16 // psrld $0x10,%xmm13 .byte 102,69,15,111,193 // movdqa %xmm9,%xmm8 .byte 102,69,15,102,196 // pcmpgtd %xmm12,%xmm8 .byte 102,65,15,114,212,13 // psrld $0xd,%xmm12 - .byte 102,68,15,111,29,239,31,0,0 // movdqa 0x1fef(%rip),%xmm11 # 5540 <_sk_callback_sse41+0xe50> + .byte 102,68,15,111,29,79,32,0,0 // movdqa 0x204f(%rip),%xmm11 # 55a0 <_sk_callback_sse41+0xe4e> .byte 102,69,15,235,235 // por %xmm11,%xmm13 .byte 102,69,15,254,236 // paddd %xmm12,%xmm13 .byte 102,69,15,223,197 // pandn %xmm13,%xmm8 @@ -24076,7 +24249,7 @@ _sk_load_u16_be_sse41: .byte 102,15,235,200 // por %xmm0,%xmm1 .byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,190,30,0,0 // movaps 0x1ebe(%rip),%xmm8 # 5550 <_sk_callback_sse41+0xe60> + .byte 68,15,40,5,30,31,0,0 // movaps 0x1f1e(%rip),%xmm8 # 55b0 <_sk_callback_sse41+0xe5e> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -24128,7 +24301,7 @@ _sk_load_rgb_u16_be_sse41: .byte 102,15,235,193 // por %xmm1,%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,255,29,0,0 // movaps 0x1dff(%rip),%xmm8 # 5560 <_sk_callback_sse41+0xe70> + .byte 68,15,40,5,95,30,0,0 // movaps 0x1e5f(%rip),%xmm8 # 55c0 <_sk_callback_sse41+0xe6e> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -24145,7 +24318,7 @@ _sk_load_rgb_u16_be_sse41: .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,198,29,0,0 // movaps 0x1dc6(%rip),%xmm3 # 5570 <_sk_callback_sse41+0xe80> + .byte 15,40,29,38,30,0,0 // movaps 0x1e26(%rip),%xmm3 # 55d0 <_sk_callback_sse41+0xe7e> .byte 255,224 // jmpq *%rax HIDDEN _sk_store_u16_be_sse41 @@ -24154,7 +24327,7 @@ FUNCTION(_sk_store_u16_be_sse41) _sk_store_u16_be_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,13,199,29,0,0 // movaps 0x1dc7(%rip),%xmm9 # 5580 <_sk_callback_sse41+0xe90> + .byte 68,15,40,13,39,30,0,0 // movaps 0x1e27(%rip),%xmm9 # 55e0 <_sk_callback_sse41+0xe8e> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 @@ -24360,15 +24533,53 @@ _sk_mirror_y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax +HIDDEN _sk_clamp_x_1_sse41 +.globl _sk_clamp_x_1_sse41 +FUNCTION(_sk_clamp_x_1_sse41) +_sk_clamp_x_1_sse41: + .byte 69,15,87,192 // xorps %xmm8,%xmm8 + .byte 68,15,95,192 // maxps %xmm0,%xmm8 + .byte 68,15,93,5,125,27,0,0 // minps 0x1b7d(%rip),%xmm8 # 55f0 <_sk_callback_sse41+0xe9e> + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 65,15,40,192 // movaps %xmm8,%xmm0 + .byte 255,224 // jmpq *%rax + +HIDDEN _sk_repeat_x_1_sse41 +.globl _sk_repeat_x_1_sse41 +FUNCTION(_sk_repeat_x_1_sse41) +_sk_repeat_x_1_sse41: + .byte 102,68,15,58,8,192,1 // roundps $0x1,%xmm0,%xmm8 + .byte 65,15,92,192 // subps %xmm8,%xmm0 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + +HIDDEN _sk_mirror_x_1_sse41 +.globl _sk_mirror_x_1_sse41 +FUNCTION(_sk_mirror_x_1_sse41) +_sk_mirror_x_1_sse41: + .byte 68,15,40,5,110,27,0,0 // movaps 0x1b6e(%rip),%xmm8 # 5600 <_sk_callback_sse41+0xeae> + .byte 65,15,88,192 // addps %xmm8,%xmm0 + .byte 68,15,40,13,114,27,0,0 // movaps 0x1b72(%rip),%xmm9 # 5610 <_sk_callback_sse41+0xebe> + .byte 68,15,89,200 // mulps %xmm0,%xmm9 + .byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9 + .byte 69,15,88,201 // addps %xmm9,%xmm9 + .byte 65,15,92,193 // subps %xmm9,%xmm0 + .byte 65,15,88,192 // addps %xmm8,%xmm0 + .byte 69,15,87,192 // xorps %xmm8,%xmm8 + .byte 68,15,92,192 // subps %xmm0,%xmm8 + .byte 65,15,84,192 // andps %xmm8,%xmm0 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + HIDDEN _sk_luminance_to_alpha_sse41 .globl _sk_luminance_to_alpha_sse41 FUNCTION(_sk_luminance_to_alpha_sse41) _sk_luminance_to_alpha_sse41: .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 15,89,5,35,27,0,0 // mulps 0x1b23(%rip),%xmm0 # 5590 <_sk_callback_sse41+0xea0> - .byte 15,89,13,44,27,0,0 // mulps 0x1b2c(%rip),%xmm1 # 55a0 <_sk_callback_sse41+0xeb0> + .byte 15,89,5,81,27,0,0 // mulps 0x1b51(%rip),%xmm0 # 5620 <_sk_callback_sse41+0xece> + .byte 15,89,13,90,27,0,0 // mulps 0x1b5a(%rip),%xmm1 # 5630 <_sk_callback_sse41+0xede> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,29,50,27,0,0 // mulps 0x1b32(%rip),%xmm3 # 55b0 <_sk_callback_sse41+0xec0> + .byte 15,89,29,96,27,0,0 // mulps 0x1b60(%rip),%xmm3 # 5640 <_sk_callback_sse41+0xeee> .byte 15,88,217 // addps %xmm1,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 @@ -24644,9 +24855,9 @@ _sk_evenly_spaced_gradient_sse41: .byte 72,139,8 // mov (%rax),%rcx .byte 76,139,88,8 // mov 0x8(%rax),%r11 .byte 72,255,201 // dec %rcx - .byte 120,7 // js 3eb7 <_sk_evenly_spaced_gradient_sse41+0x15> + .byte 120,7 // js 3f19 <_sk_evenly_spaced_gradient_sse41+0x15> .byte 243,72,15,42,201 // cvtsi2ss %rcx,%xmm1 - .byte 235,21 // jmp 3ecc <_sk_evenly_spaced_gradient_sse41+0x2a> + .byte 235,21 // jmp 3f2e <_sk_evenly_spaced_gradient_sse41+0x2a> .byte 73,137,200 // mov %rcx,%r8 .byte 73,209,232 // shr %r8 .byte 131,225,1 // and $0x1,%ecx @@ -24737,12 +24948,12 @@ _sk_gradient_sse41: .byte 76,139,0 // mov (%rax),%r8 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,2 // cmp $0x2,%r8 - .byte 114,50 // jb 40af <_sk_gradient_sse41+0x41> + .byte 114,50 // jb 4111 <_sk_gradient_sse41+0x41> .byte 72,139,72,72 // mov 0x48(%rax),%rcx .byte 73,255,200 // dec %r8 .byte 72,131,193,4 // add $0x4,%rcx .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 15,40,21,45,21,0,0 // movaps 0x152d(%rip),%xmm2 # 55c0 <_sk_callback_sse41+0xed0> + .byte 15,40,21,91,21,0,0 // movaps 0x155b(%rip),%xmm2 # 5650 <_sk_callback_sse41+0xefe> .byte 243,15,16,25 // movss (%rcx),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 @@ -24750,7 +24961,7 @@ _sk_gradient_sse41: .byte 102,15,254,203 // paddd %xmm3,%xmm1 .byte 72,131,193,4 // add $0x4,%rcx .byte 73,255,200 // dec %r8 - .byte 117,228 // jne 4093 <_sk_gradient_sse41+0x25> + .byte 117,228 // jne 40f5 <_sk_gradient_sse41+0x25> .byte 65,86 // push %r14 .byte 83 // push %rbx .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 @@ -24881,26 +25092,26 @@ _sk_xy_to_unit_angle_sse41: .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,40,236 // movaps %xmm12,%xmm13 .byte 69,15,89,237 // mulps %xmm13,%xmm13 - .byte 68,15,40,21,207,18,0,0 // movaps 0x12cf(%rip),%xmm10 # 55d0 <_sk_callback_sse41+0xee0> + .byte 68,15,40,21,253,18,0,0 // movaps 0x12fd(%rip),%xmm10 # 5660 <_sk_callback_sse41+0xf0e> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,211,18,0,0 // addps 0x12d3(%rip),%xmm10 # 55e0 <_sk_callback_sse41+0xef0> + .byte 68,15,88,21,1,19,0,0 // addps 0x1301(%rip),%xmm10 # 5670 <_sk_callback_sse41+0xf1e> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,215,18,0,0 // addps 0x12d7(%rip),%xmm10 # 55f0 <_sk_callback_sse41+0xf00> + .byte 68,15,88,21,5,19,0,0 // addps 0x1305(%rip),%xmm10 # 5680 <_sk_callback_sse41+0xf2e> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,219,18,0,0 // addps 0x12db(%rip),%xmm10 # 5600 <_sk_callback_sse41+0xf10> + .byte 68,15,88,21,9,19,0,0 // addps 0x1309(%rip),%xmm10 # 5690 <_sk_callback_sse41+0xf3e> .byte 69,15,89,212 // mulps %xmm12,%xmm10 .byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0 - .byte 68,15,40,29,218,18,0,0 // movaps 0x12da(%rip),%xmm11 # 5610 <_sk_callback_sse41+0xf20> + .byte 68,15,40,29,8,19,0,0 // movaps 0x1308(%rip),%xmm11 # 56a0 <_sk_callback_sse41+0xf4e> .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10 .byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9 - .byte 68,15,40,29,211,18,0,0 // movaps 0x12d3(%rip),%xmm11 # 5620 <_sk_callback_sse41+0xf30> + .byte 68,15,40,29,1,19,0,0 // movaps 0x1301(%rip),%xmm11 # 56b0 <_sk_callback_sse41+0xf5e> .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10 .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0 - .byte 68,15,40,13,197,18,0,0 // movaps 0x12c5(%rip),%xmm9 # 5630 <_sk_callback_sse41+0xf40> + .byte 68,15,40,13,243,18,0,0 // movaps 0x12f3(%rip),%xmm9 # 56c0 <_sk_callback_sse41+0xf6e> .byte 69,15,92,202 // subps %xmm10,%xmm9 .byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10 .byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8 @@ -24926,7 +25137,7 @@ HIDDEN _sk_save_xy_sse41 FUNCTION(_sk_save_xy_sse41) _sk_save_xy_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,153,18,0,0 // movaps 0x1299(%rip),%xmm8 # 5640 <_sk_callback_sse41+0xf50> + .byte 68,15,40,5,199,18,0,0 // movaps 0x12c7(%rip),%xmm8 # 56d0 <_sk_callback_sse41+0xf7e> .byte 15,17,0 // movups %xmm0,(%rax) .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,88,200 // addps %xmm8,%xmm9 @@ -24970,8 +25181,8 @@ _sk_bilinear_nx_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,27,18,0,0 // addps 0x121b(%rip),%xmm0 # 5650 <_sk_callback_sse41+0xf60> - .byte 68,15,40,13,35,18,0,0 // movaps 0x1223(%rip),%xmm9 # 5660 <_sk_callback_sse41+0xf70> + .byte 15,88,5,73,18,0,0 // addps 0x1249(%rip),%xmm0 # 56e0 <_sk_callback_sse41+0xf8e> + .byte 68,15,40,13,81,18,0,0 // movaps 0x1251(%rip),%xmm9 # 56f0 <_sk_callback_sse41+0xf9e> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -24984,7 +25195,7 @@ _sk_bilinear_px_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,18,18,0,0 // addps 0x1212(%rip),%xmm0 # 5670 <_sk_callback_sse41+0xf80> + .byte 15,88,5,64,18,0,0 // addps 0x1240(%rip),%xmm0 # 5700 <_sk_callback_sse41+0xfae> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -24996,8 +25207,8 @@ _sk_bilinear_ny_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,4,18,0,0 // addps 0x1204(%rip),%xmm1 # 5680 <_sk_callback_sse41+0xf90> - .byte 68,15,40,13,12,18,0,0 // movaps 0x120c(%rip),%xmm9 # 5690 <_sk_callback_sse41+0xfa0> + .byte 15,88,13,50,18,0,0 // addps 0x1232(%rip),%xmm1 # 5710 <_sk_callback_sse41+0xfbe> + .byte 68,15,40,13,58,18,0,0 // movaps 0x123a(%rip),%xmm9 # 5720 <_sk_callback_sse41+0xfce> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -25010,7 +25221,7 @@ _sk_bilinear_py_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,250,17,0,0 // addps 0x11fa(%rip),%xmm1 # 56a0 <_sk_callback_sse41+0xfb0> + .byte 15,88,13,40,18,0,0 // addps 0x1228(%rip),%xmm1 # 5730 <_sk_callback_sse41+0xfde> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -25022,13 +25233,13 @@ _sk_bicubic_n3x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,237,17,0,0 // addps 0x11ed(%rip),%xmm0 # 56b0 <_sk_callback_sse41+0xfc0> - .byte 68,15,40,13,245,17,0,0 // movaps 0x11f5(%rip),%xmm9 # 56c0 <_sk_callback_sse41+0xfd0> + .byte 15,88,5,27,18,0,0 // addps 0x121b(%rip),%xmm0 # 5740 <_sk_callback_sse41+0xfee> + .byte 68,15,40,13,35,18,0,0 // movaps 0x1223(%rip),%xmm9 # 5750 <_sk_callback_sse41+0xffe> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,241,17,0,0 // mulps 0x11f1(%rip),%xmm9 # 56d0 <_sk_callback_sse41+0xfe0> - .byte 68,15,88,13,249,17,0,0 // addps 0x11f9(%rip),%xmm9 # 56e0 <_sk_callback_sse41+0xff0> + .byte 68,15,89,13,31,18,0,0 // mulps 0x121f(%rip),%xmm9 # 5760 <_sk_callback_sse41+0x100e> + .byte 68,15,88,13,39,18,0,0 // addps 0x1227(%rip),%xmm9 # 5770 <_sk_callback_sse41+0x101e> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -25041,16 +25252,16 @@ _sk_bicubic_n1x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,232,17,0,0 // addps 0x11e8(%rip),%xmm0 # 56f0 <_sk_callback_sse41+0x1000> - .byte 68,15,40,13,240,17,0,0 // movaps 0x11f0(%rip),%xmm9 # 5700 <_sk_callback_sse41+0x1010> + .byte 15,88,5,22,18,0,0 // addps 0x1216(%rip),%xmm0 # 5780 <_sk_callback_sse41+0x102e> + .byte 68,15,40,13,30,18,0,0 // movaps 0x121e(%rip),%xmm9 # 5790 <_sk_callback_sse41+0x103e> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,244,17,0,0 // movaps 0x11f4(%rip),%xmm8 # 5710 <_sk_callback_sse41+0x1020> + .byte 68,15,40,5,34,18,0,0 // movaps 0x1222(%rip),%xmm8 # 57a0 <_sk_callback_sse41+0x104e> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,248,17,0,0 // addps 0x11f8(%rip),%xmm8 # 5720 <_sk_callback_sse41+0x1030> + .byte 68,15,88,5,38,18,0,0 // addps 0x1226(%rip),%xmm8 # 57b0 <_sk_callback_sse41+0x105e> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,252,17,0,0 // addps 0x11fc(%rip),%xmm8 # 5730 <_sk_callback_sse41+0x1040> + .byte 68,15,88,5,42,18,0,0 // addps 0x122a(%rip),%xmm8 # 57c0 <_sk_callback_sse41+0x106e> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,0,18,0,0 // addps 0x1200(%rip),%xmm8 # 5740 <_sk_callback_sse41+0x1050> + .byte 68,15,88,5,46,18,0,0 // addps 0x122e(%rip),%xmm8 # 57d0 <_sk_callback_sse41+0x107e> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -25060,17 +25271,17 @@ HIDDEN _sk_bicubic_p1x_sse41 FUNCTION(_sk_bicubic_p1x_sse41) _sk_bicubic_p1x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,250,17,0,0 // movaps 0x11fa(%rip),%xmm8 # 5750 <_sk_callback_sse41+0x1060> + .byte 68,15,40,5,40,18,0,0 // movaps 0x1228(%rip),%xmm8 # 57e0 <_sk_callback_sse41+0x108e> .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,21,246,17,0,0 // movaps 0x11f6(%rip),%xmm10 # 5760 <_sk_callback_sse41+0x1070> + .byte 68,15,40,21,36,18,0,0 // movaps 0x1224(%rip),%xmm10 # 57f0 <_sk_callback_sse41+0x109e> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,250,17,0,0 // addps 0x11fa(%rip),%xmm10 # 5770 <_sk_callback_sse41+0x1080> + .byte 68,15,88,21,40,18,0,0 // addps 0x1228(%rip),%xmm10 # 5800 <_sk_callback_sse41+0x10ae> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,246,17,0,0 // addps 0x11f6(%rip),%xmm10 # 5780 <_sk_callback_sse41+0x1090> + .byte 68,15,88,21,36,18,0,0 // addps 0x1224(%rip),%xmm10 # 5810 <_sk_callback_sse41+0x10be> .byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -25082,11 +25293,11 @@ _sk_bicubic_p3x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,233,17,0,0 // addps 0x11e9(%rip),%xmm0 # 5790 <_sk_callback_sse41+0x10a0> + .byte 15,88,5,23,18,0,0 // addps 0x1217(%rip),%xmm0 # 5820 <_sk_callback_sse41+0x10ce> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,233,17,0,0 // mulps 0x11e9(%rip),%xmm8 # 57a0 <_sk_callback_sse41+0x10b0> - .byte 68,15,88,5,241,17,0,0 // addps 0x11f1(%rip),%xmm8 # 57b0 <_sk_callback_sse41+0x10c0> + .byte 68,15,89,5,23,18,0,0 // mulps 0x1217(%rip),%xmm8 # 5830 <_sk_callback_sse41+0x10de> + .byte 68,15,88,5,31,18,0,0 // addps 0x121f(%rip),%xmm8 # 5840 <_sk_callback_sse41+0x10ee> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -25099,13 +25310,13 @@ _sk_bicubic_n3y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,223,17,0,0 // addps 0x11df(%rip),%xmm1 # 57c0 <_sk_callback_sse41+0x10d0> - .byte 68,15,40,13,231,17,0,0 // movaps 0x11e7(%rip),%xmm9 # 57d0 <_sk_callback_sse41+0x10e0> + .byte 15,88,13,13,18,0,0 // addps 0x120d(%rip),%xmm1 # 5850 <_sk_callback_sse41+0x10fe> + .byte 68,15,40,13,21,18,0,0 // movaps 0x1215(%rip),%xmm9 # 5860 <_sk_callback_sse41+0x110e> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,227,17,0,0 // mulps 0x11e3(%rip),%xmm9 # 57e0 <_sk_callback_sse41+0x10f0> - .byte 68,15,88,13,235,17,0,0 // addps 0x11eb(%rip),%xmm9 # 57f0 <_sk_callback_sse41+0x1100> + .byte 68,15,89,13,17,18,0,0 // mulps 0x1211(%rip),%xmm9 # 5870 <_sk_callback_sse41+0x111e> + .byte 68,15,88,13,25,18,0,0 // addps 0x1219(%rip),%xmm9 # 5880 <_sk_callback_sse41+0x112e> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -25118,16 +25329,16 @@ _sk_bicubic_n1y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,217,17,0,0 // addps 0x11d9(%rip),%xmm1 # 5800 <_sk_callback_sse41+0x1110> - .byte 68,15,40,13,225,17,0,0 // movaps 0x11e1(%rip),%xmm9 # 5810 <_sk_callback_sse41+0x1120> + .byte 15,88,13,7,18,0,0 // addps 0x1207(%rip),%xmm1 # 5890 <_sk_callback_sse41+0x113e> + .byte 68,15,40,13,15,18,0,0 // movaps 0x120f(%rip),%xmm9 # 58a0 <_sk_callback_sse41+0x114e> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,229,17,0,0 // movaps 0x11e5(%rip),%xmm8 # 5820 <_sk_callback_sse41+0x1130> + .byte 68,15,40,5,19,18,0,0 // movaps 0x1213(%rip),%xmm8 # 58b0 <_sk_callback_sse41+0x115e> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,233,17,0,0 // addps 0x11e9(%rip),%xmm8 # 5830 <_sk_callback_sse41+0x1140> + .byte 68,15,88,5,23,18,0,0 // addps 0x1217(%rip),%xmm8 # 58c0 <_sk_callback_sse41+0x116e> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,237,17,0,0 // addps 0x11ed(%rip),%xmm8 # 5840 <_sk_callback_sse41+0x1150> + .byte 68,15,88,5,27,18,0,0 // addps 0x121b(%rip),%xmm8 # 58d0 <_sk_callback_sse41+0x117e> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,241,17,0,0 // addps 0x11f1(%rip),%xmm8 # 5850 <_sk_callback_sse41+0x1160> + .byte 68,15,88,5,31,18,0,0 // addps 0x121f(%rip),%xmm8 # 58e0 <_sk_callback_sse41+0x118e> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -25137,17 +25348,17 @@ HIDDEN _sk_bicubic_p1y_sse41 FUNCTION(_sk_bicubic_p1y_sse41) _sk_bicubic_p1y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,235,17,0,0 // movaps 0x11eb(%rip),%xmm8 # 5860 <_sk_callback_sse41+0x1170> + .byte 68,15,40,5,25,18,0,0 // movaps 0x1219(%rip),%xmm8 # 58f0 <_sk_callback_sse41+0x119e> .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9 .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 68,15,40,21,230,17,0,0 // movaps 0x11e6(%rip),%xmm10 # 5870 <_sk_callback_sse41+0x1180> + .byte 68,15,40,21,20,18,0,0 // movaps 0x1214(%rip),%xmm10 # 5900 <_sk_callback_sse41+0x11ae> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,234,17,0,0 // addps 0x11ea(%rip),%xmm10 # 5880 <_sk_callback_sse41+0x1190> + .byte 68,15,88,21,24,18,0,0 // addps 0x1218(%rip),%xmm10 # 5910 <_sk_callback_sse41+0x11be> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,230,17,0,0 // addps 0x11e6(%rip),%xmm10 # 5890 <_sk_callback_sse41+0x11a0> + .byte 68,15,88,21,20,18,0,0 // addps 0x1214(%rip),%xmm10 # 5920 <_sk_callback_sse41+0x11ce> .byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -25159,11 +25370,11 @@ _sk_bicubic_p3y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,216,17,0,0 // addps 0x11d8(%rip),%xmm1 # 58a0 <_sk_callback_sse41+0x11b0> + .byte 15,88,13,6,18,0,0 // addps 0x1206(%rip),%xmm1 # 5930 <_sk_callback_sse41+0x11de> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,216,17,0,0 // mulps 0x11d8(%rip),%xmm8 # 58b0 <_sk_callback_sse41+0x11c0> - .byte 68,15,88,5,224,17,0,0 // addps 0x11e0(%rip),%xmm8 # 58c0 <_sk_callback_sse41+0x11d0> + .byte 68,15,89,5,6,18,0,0 // mulps 0x1206(%rip),%xmm8 # 5940 <_sk_callback_sse41+0x11ee> + .byte 68,15,88,5,14,18,0,0 // addps 0x120e(%rip),%xmm8 # 5950 <_sk_callback_sse41+0x11fe> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -25382,11 +25593,11 @@ BALIGN16 .byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%rdi) .byte 0,224 // add %ah,%al .byte 64,0,0 // add %al,(%rax) - .byte 224,64 // loopne 49a8 <.literal16+0x1d8> + .byte 224,64 // loopne 4a08 <.literal16+0x1d8> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 49ac <.literal16+0x1dc> + .byte 224,64 // loopne 4a0c <.literal16+0x1dc> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 49b0 <.literal16+0x1e0> + .byte 224,64 // loopne 4a10 <.literal16+0x1e0> .byte 154 // (bad) .byte 153 // cltd .byte 153 // cltd @@ -25406,13 +25617,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 49d1 <.literal16+0x201> + .byte 71,225,61 // rex.RXB loope 4a31 <.literal16+0x201> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 49d5 <.literal16+0x205> + .byte 71,225,61 // rex.RXB loope 4a35 <.literal16+0x205> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 49d9 <.literal16+0x209> + .byte 71,225,61 // rex.RXB loope 4a39 <.literal16+0x209> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 49dd <.literal16+0x20d> + .byte 71,225,61 // rex.RXB loope 4a3d <.literal16+0x20d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -25437,13 +25648,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a11 <.literal16+0x241> + .byte 71,225,61 // rex.RXB loope 4a71 <.literal16+0x241> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a15 <.literal16+0x245> + .byte 71,225,61 // rex.RXB loope 4a75 <.literal16+0x245> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a19 <.literal16+0x249> + .byte 71,225,61 // rex.RXB loope 4a79 <.literal16+0x249> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a1d <.literal16+0x24d> + .byte 71,225,61 // rex.RXB loope 4a7d <.literal16+0x24d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -25468,13 +25679,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a51 <.literal16+0x281> + .byte 71,225,61 // rex.RXB loope 4ab1 <.literal16+0x281> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a55 <.literal16+0x285> + .byte 71,225,61 // rex.RXB loope 4ab5 <.literal16+0x285> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a59 <.literal16+0x289> + .byte 71,225,61 // rex.RXB loope 4ab9 <.literal16+0x289> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a5d <.literal16+0x28d> + .byte 71,225,61 // rex.RXB loope 4abd <.literal16+0x28d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -25499,13 +25710,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a91 <.literal16+0x2c1> + .byte 71,225,61 // rex.RXB loope 4af1 <.literal16+0x2c1> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a95 <.literal16+0x2c5> + .byte 71,225,61 // rex.RXB loope 4af5 <.literal16+0x2c5> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a99 <.literal16+0x2c9> + .byte 71,225,61 // rex.RXB loope 4af9 <.literal16+0x2c9> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4a9d <.literal16+0x2cd> + .byte 71,225,61 // rex.RXB loope 4afd <.literal16+0x2cd> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -25721,13 +25932,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 4c69 <.literal16+0x499> + .byte 224,7 // loopne 4cc9 <.literal16+0x499> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 4c6d <.literal16+0x49d> + .byte 224,7 // loopne 4ccd <.literal16+0x49d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 4c71 <.literal16+0x4a1> + .byte 224,7 // loopne 4cd1 <.literal16+0x4a1> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 4c75 <.literal16+0x4a5> + .byte 224,7 // loopne 4cd5 <.literal16+0x4a5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -25761,10 +25972,10 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004cb8 <_sk_callback_sse41+0xa0005c8> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a004d18 <_sk_callback_sse41+0xa0005c6> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3004cc0 <_sk_callback_sse41+0x30005d0> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3004d20 <_sk_callback_sse41+0x30005ce> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -25819,11 +26030,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 4d8b <.literal16+0x5bb> + .byte 127,67 // jg 4deb <.literal16+0x5bb> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 4d8f <.literal16+0x5bf> + .byte 127,67 // jg 4def <.literal16+0x5bf> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 4d93 <.literal16+0x5c3> + .byte 127,67 // jg 4df3 <.literal16+0x5c3> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax) @@ -25838,16 +26049,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 4d84 <.literal16+0x5b4> + .byte 127,0 // jg 4de4 <.literal16+0x5b4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4d88 <.literal16+0x5b8> + .byte 127,0 // jg 4de8 <.literal16+0x5b8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4d8c <.literal16+0x5bc> + .byte 127,0 // jg 4dec <.literal16+0x5bc> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4d90 <.literal16+0x5c0> + .byte 127,0 // jg 4df0 <.literal16+0x5c0> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -25856,7 +26067,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4e15 <.literal16+0x645> + .byte 119,115 // ja 4e75 <.literal16+0x645> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -25867,7 +26078,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 4d79 <.literal16+0x5a9> + .byte 117,191 // jne 4dd9 <.literal16+0x5a9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -25879,7 +26090,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a38dba <_sk_callback_sse41+0xffffffffe9a346ca> + .byte 233,220,63,163,233 // jmpq ffffffffe9a38e1a <_sk_callback_sse41+0xffffffffe9a346c8> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -25934,16 +26145,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 4e54 <.literal16+0x684> + .byte 127,0 // jg 4eb4 <.literal16+0x684> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4e58 <.literal16+0x688> + .byte 127,0 // jg 4eb8 <.literal16+0x688> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4e5c <.literal16+0x68c> + .byte 127,0 // jg 4ebc <.literal16+0x68c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4e60 <.literal16+0x690> + .byte 127,0 // jg 4ec0 <.literal16+0x690> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -25952,7 +26163,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4ee5 <.literal16+0x715> + .byte 119,115 // ja 4f45 <.literal16+0x715> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -25963,7 +26174,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 4e49 <.literal16+0x679> + .byte 117,191 // jne 4ea9 <.literal16+0x679> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -25975,7 +26186,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a38e8a <_sk_callback_sse41+0xffffffffe9a3479a> + .byte 233,220,63,163,233 // jmpq ffffffffe9a38eea <_sk_callback_sse41+0xffffffffe9a34798> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -26030,16 +26241,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 4f24 <.literal16+0x754> + .byte 127,0 // jg 4f84 <.literal16+0x754> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4f28 <.literal16+0x758> + .byte 127,0 // jg 4f88 <.literal16+0x758> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4f2c <.literal16+0x75c> + .byte 127,0 // jg 4f8c <.literal16+0x75c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4f30 <.literal16+0x760> + .byte 127,0 // jg 4f90 <.literal16+0x760> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -26048,7 +26259,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4fb5 <.literal16+0x7e5> + .byte 119,115 // ja 5015 <.literal16+0x7e5> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -26059,7 +26270,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 4f19 <.literal16+0x749> + .byte 117,191 // jne 4f79 <.literal16+0x749> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -26071,7 +26282,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a38f5a <_sk_callback_sse41+0xffffffffe9a3486a> + .byte 233,220,63,163,233 // jmpq ffffffffe9a38fba <_sk_callback_sse41+0xffffffffe9a34868> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -26126,16 +26337,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 4ff4 <.literal16+0x824> + .byte 127,0 // jg 5054 <.literal16+0x824> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4ff8 <.literal16+0x828> + .byte 127,0 // jg 5058 <.literal16+0x828> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 4ffc <.literal16+0x82c> + .byte 127,0 // jg 505c <.literal16+0x82c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5000 <.literal16+0x830> + .byte 127,0 // jg 5060 <.literal16+0x830> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -26144,7 +26355,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5085 <.literal16+0x8b5> + .byte 119,115 // ja 50e5 <.literal16+0x8b5> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -26155,7 +26366,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 4fe9 <.literal16+0x819> + .byte 117,191 // jne 5049 <.literal16+0x819> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -26167,7 +26378,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3902a <_sk_callback_sse41+0xffffffffe9a3493a> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3908a <_sk_callback_sse41+0xffffffffe9a34938> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -26218,13 +26429,13 @@ BALIGN16 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 - .byte 127,67 // jg 5107 <.literal16+0x937> + .byte 127,67 // jg 5167 <.literal16+0x937> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 510b <.literal16+0x93b> + .byte 127,67 // jg 516b <.literal16+0x93b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 510f <.literal16+0x93f> + .byte 127,67 // jg 516f <.literal16+0x93f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5113 <.literal16+0x943> + .byte 127,67 // jg 5173 <.literal16+0x943> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -26271,16 +26482,16 @@ BALIGN16 .byte 128,3,62 // addb $0x3e,(%rbx) .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 5193 <.literal16+0x9c3> + .byte 118,63 // jbe 51f3 <.literal16+0x9c3> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 5197 <.literal16+0x9c7> + .byte 118,63 // jbe 51f7 <.literal16+0x9c7> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 519b <.literal16+0x9cb> + .byte 118,63 // jbe 51fb <.literal16+0x9cb> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 519f <.literal16+0x9cf> + .byte 118,63 // jbe 51ff <.literal16+0x9cf> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) @@ -26292,11 +26503,11 @@ BALIGN16 .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 51db <.literal16+0xa0b> + .byte 127,67 // jg 523b <.literal16+0xa0b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 51df <.literal16+0xa0f> + .byte 127,67 // jg 523f <.literal16+0xa0f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 51e3 <.literal16+0xa13> + .byte 127,67 // jg 5243 <.literal16+0xa13> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,0,0,128,63 // addb $0x3f,-0x7fffffc5(%rax) @@ -26325,7 +26536,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005210 <_sk_callback_sse41+0x3000b20> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005270 <_sk_callback_sse41+0x3000b1e> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -26354,13 +26565,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 5249 <.literal16+0xa79> + .byte 224,7 // loopne 52a9 <.literal16+0xa79> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 524d <.literal16+0xa7d> + .byte 224,7 // loopne 52ad <.literal16+0xa7d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5251 <.literal16+0xa81> + .byte 224,7 // loopne 52b1 <.literal16+0xa81> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5255 <.literal16+0xa85> + .byte 224,7 // loopne 52b5 <.literal16+0xa85> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -26406,13 +26617,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 52b9 <.literal16+0xae9> + .byte 224,7 // loopne 5319 <.literal16+0xae9> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 52bd <.literal16+0xaed> + .byte 224,7 // loopne 531d <.literal16+0xaed> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 52c1 <.literal16+0xaf1> + .byte 224,7 // loopne 5321 <.literal16+0xaf1> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 52c5 <.literal16+0xaf5> + .byte 224,7 // loopne 5325 <.literal16+0xaf5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -26450,13 +26661,13 @@ BALIGN16 .byte 65,0,0 // add %al,(%r8) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 5356 <.literal16+0xb86> + .byte 124,66 // jl 53b6 <.literal16+0xb86> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 535a <.literal16+0xb8a> + .byte 124,66 // jl 53ba <.literal16+0xb8a> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 535e <.literal16+0xb8e> + .byte 124,66 // jl 53be <.literal16+0xb8e> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 5362 <.literal16+0xb92> + .byte 124,66 // jl 53c2 <.literal16+0xb92> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 0,240 // add %dh,%al @@ -26546,13 +26757,13 @@ BALIGN16 .byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax) .byte 61,137,136,136,61 // cmp $0x3d888889,%eax .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 5465 <.literal16+0xc95> + .byte 112,65 // jo 54c5 <.literal16+0xc95> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 5469 <.literal16+0xc99> + .byte 112,65 // jo 54c9 <.literal16+0xc99> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 546d <.literal16+0xc9d> + .byte 112,65 // jo 54cd <.literal16+0xc9d> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 5471 <.literal16+0xca1> + .byte 112,65 // jo 54d1 <.literal16+0xca1> .byte 255,0 // incl (%rax) .byte 0,0 // add %al,(%rax) .byte 255,0 // incl (%rax) @@ -26567,7 +26778,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005460 <_sk_callback_sse41+0x3000d70> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30054c0 <_sk_callback_sse41+0x3000d6e> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -26594,7 +26805,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30054a0 <_sk_callback_sse41+0x3000db0> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005500 <_sk_callback_sse41+0x3000dae> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -26609,11 +26820,11 @@ BALIGN16 .byte 255,0 // incl (%rax) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 54fb <.literal16+0xd2b> + .byte 127,67 // jg 555b <.literal16+0xd2b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 54ff <.literal16+0xd2f> + .byte 127,67 // jg 555f <.literal16+0xd2f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5503 <.literal16+0xd33> + .byte 127,67 // jg 5563 <.literal16+0xd33> .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) .byte 0,0 // add %al,(%rax) .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) @@ -26689,13 +26900,29 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 255 // (bad) - .byte 127,71 // jg 55cb <.literal16+0xdfb> + .byte 127,71 // jg 562b <.literal16+0xdfb> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 55cf <.literal16+0xdff> + .byte 127,71 // jg 562f <.literal16+0xdff> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 55d3 <.literal16+0xe03> + .byte 127,71 // jg 5633 <.literal16+0xe03> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 55d7 <.literal16+0xe07> + .byte 127,71 // jg 5637 <.literal16+0xe07> + .byte 0,0 // add %al,(%rax) + .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) + .byte 63 // (bad) + .byte 0,0 // add %al,(%rax) + .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,191,0,0,128 // add %al,-0x7fffff41(%rax) + .byte 191,0,0,128,191 // mov $0xbf800000,%edi + .byte 0,0 // add %al,(%rax) + .byte 128,191,0,0,0,63,0 // cmpb $0x0,0x3f000000(%rdi) + .byte 0,0 // add %al,(%rax) + .byte 63 // (bad) + .byte 0,0 // add %al,(%rax) + .byte 0,63 // add %bh,(%rdi) + .byte 0,0 // add %al,(%rax) + .byte 0,63 // add %bh,(%rdi) .byte 208 // (bad) .byte 179,89 // mov $0x59,%bl .byte 62,208 // ds (bad) @@ -26829,11 +27056,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 56f2 <.literal16+0xf22> + .byte 62,114,28 // jb,pt 5782 <.literal16+0xf52> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 56f6 <.literal16+0xf26> + .byte 62,114,28 // jb,pt 5786 <.literal16+0xf56> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 56fa <.literal16+0xf2a> + .byte 62,114,28 // jb,pt 578a <.literal16+0xf5a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -26877,7 +27104,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e585 <_sk_callback_sse41+0x3d639e95> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e615 <_sk_callback_sse41+0x3d639ec3> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -26903,7 +27130,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e5c5 <_sk_callback_sse41+0x3d639ed5> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e655 <_sk_callback_sse41+0x3d639f03> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -26912,13 +27139,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 57be <.literal16+0xfee> + .byte 114,28 // jb 584e <.literal16+0x101e> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 57c2 <.literal16+0xff2> + .byte 62,114,28 // jb,pt 5852 <.literal16+0x1022> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 57c6 <.literal16+0xff6> + .byte 62,114,28 // jb,pt 5856 <.literal16+0x1026> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 57ca <.literal16+0xffa> + .byte 62,114,28 // jb,pt 585a <.literal16+0x102a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -26939,11 +27166,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 5802 <.literal16+0x1032> + .byte 62,114,28 // jb,pt 5892 <.literal16+0x1062> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5806 <.literal16+0x1036> + .byte 62,114,28 // jb,pt 5896 <.literal16+0x1066> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 580a <.literal16+0x103a> + .byte 62,114,28 // jb,pt 589a <.literal16+0x106a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -26987,7 +27214,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e695 <_sk_callback_sse41+0x3d639fa5> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e725 <_sk_callback_sse41+0x3d639fd3> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -27013,7 +27240,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e6d5 <_sk_callback_sse41+0x3d639fe5> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e765 <_sk_callback_sse41+0x3d63a013> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -27022,13 +27249,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 58ce <.literal16+0x10fe> + .byte 114,28 // jb 595e <.literal16+0x112e> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 58d2 <_sk_callback_sse41+0x11e2> + .byte 62,114,28 // jb,pt 5962 <_sk_callback_sse41+0x1210> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 58d6 <_sk_callback_sse41+0x11e6> + .byte 62,114,28 // jb,pt 5966 <_sk_callback_sse41+0x1214> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 58da <_sk_callback_sse41+0x11ea> + .byte 62,114,28 // jb,pt 596a <_sk_callback_sse41+0x1218> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -27098,7 +27325,7 @@ _sk_seed_shader_sse2: .byte 102,15,110,199 // movd %edi,%xmm0 .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0 .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 - .byte 15,40,21,196,75,0,0 // movaps 0x4bc4(%rip),%xmm2 # 4c40 <_sk_callback_sse2+0xe1> + .byte 15,40,21,68,76,0,0 // movaps 0x4c44(%rip),%xmm2 # 4cc0 <_sk_callback_sse2+0xd5> .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,16,2 // movups (%rdx),%xmm0 .byte 15,88,193 // addps %xmm1,%xmm0 @@ -27107,7 +27334,7 @@ _sk_seed_shader_sse2: .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,21,179,75,0,0 // movaps 0x4bb3(%rip),%xmm2 # 4c50 <_sk_callback_sse2+0xf1> + .byte 15,40,21,51,76,0,0 // movaps 0x4c33(%rip),%xmm2 # 4cd0 <_sk_callback_sse2+0xe5> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,87,237 // xorps %xmm5,%xmm5 @@ -27128,14 +27355,14 @@ _sk_dither_sse2: .byte 102,68,15,110,1 // movd (%rcx),%xmm8 .byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8 .byte 102,69,15,239,193 // pxor %xmm9,%xmm8 - .byte 102,68,15,111,21,126,75,0,0 // movdqa 0x4b7e(%rip),%xmm10 # 4c60 <_sk_callback_sse2+0x101> + .byte 102,68,15,111,21,254,75,0,0 // movdqa 0x4bfe(%rip),%xmm10 # 4ce0 <_sk_callback_sse2+0xf5> .byte 102,69,15,111,216 // movdqa %xmm8,%xmm11 .byte 102,69,15,219,218 // pand %xmm10,%xmm11 .byte 102,65,15,114,243,5 // pslld $0x5,%xmm11 .byte 102,69,15,219,209 // pand %xmm9,%xmm10 .byte 102,65,15,114,242,4 // pslld $0x4,%xmm10 - .byte 102,68,15,111,37,106,75,0,0 // movdqa 0x4b6a(%rip),%xmm12 # 4c70 <_sk_callback_sse2+0x111> - .byte 102,68,15,111,45,113,75,0,0 // movdqa 0x4b71(%rip),%xmm13 # 4c80 <_sk_callback_sse2+0x121> + .byte 102,68,15,111,37,234,75,0,0 // movdqa 0x4bea(%rip),%xmm12 # 4cf0 <_sk_callback_sse2+0x105> + .byte 102,68,15,111,45,241,75,0,0 // movdqa 0x4bf1(%rip),%xmm13 # 4d00 <_sk_callback_sse2+0x115> .byte 102,69,15,111,240 // movdqa %xmm8,%xmm14 .byte 102,69,15,219,245 // pand %xmm13,%xmm14 .byte 102,65,15,114,246,2 // pslld $0x2,%xmm14 @@ -27151,8 +27378,8 @@ _sk_dither_sse2: .byte 102,69,15,235,198 // por %xmm14,%xmm8 .byte 102,69,15,235,197 // por %xmm13,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,44,75,0,0 // mulps 0x4b2c(%rip),%xmm8 # 4c90 <_sk_callback_sse2+0x131> - .byte 68,15,88,5,52,75,0,0 // addps 0x4b34(%rip),%xmm8 # 4ca0 <_sk_callback_sse2+0x141> + .byte 68,15,89,5,172,75,0,0 // mulps 0x4bac(%rip),%xmm8 # 4d10 <_sk_callback_sse2+0x125> + .byte 68,15,88,5,180,75,0,0 // addps 0x4bb4(%rip),%xmm8 # 4d20 <_sk_callback_sse2+0x135> .byte 243,68,15,16,80,8 // movss 0x8(%rax),%xmm10 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 @@ -27229,7 +27456,7 @@ HIDDEN _sk_srcatop_sse2 FUNCTION(_sk_srcatop_sse2) _sk_srcatop_sse2: .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 68,15,40,5,141,74,0,0 // movaps 0x4a8d(%rip),%xmm8 # 4cb0 <_sk_callback_sse2+0x151> + .byte 68,15,40,5,13,75,0,0 // movaps 0x4b0d(%rip),%xmm8 # 4d30 <_sk_callback_sse2+0x145> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -27254,7 +27481,7 @@ FUNCTION(_sk_dstatop_sse2) _sk_dstatop_sse2: .byte 68,15,40,195 // movaps %xmm3,%xmm8 .byte 68,15,89,196 // mulps %xmm4,%xmm8 - .byte 68,15,40,13,80,74,0,0 // movaps 0x4a50(%rip),%xmm9 # 4cc0 <_sk_callback_sse2+0x161> + .byte 68,15,40,13,208,74,0,0 // movaps 0x4ad0(%rip),%xmm9 # 4d40 <_sk_callback_sse2+0x155> .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 @@ -27301,7 +27528,7 @@ HIDDEN _sk_srcout_sse2 .globl _sk_srcout_sse2 FUNCTION(_sk_srcout_sse2) _sk_srcout_sse2: - .byte 68,15,40,5,244,73,0,0 // movaps 0x49f4(%rip),%xmm8 # 4cd0 <_sk_callback_sse2+0x171> + .byte 68,15,40,5,116,74,0,0 // movaps 0x4a74(%rip),%xmm8 # 4d50 <_sk_callback_sse2+0x165> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 @@ -27314,7 +27541,7 @@ HIDDEN _sk_dstout_sse2 .globl _sk_dstout_sse2 FUNCTION(_sk_dstout_sse2) _sk_dstout_sse2: - .byte 68,15,40,5,228,73,0,0 // movaps 0x49e4(%rip),%xmm8 # 4ce0 <_sk_callback_sse2+0x181> + .byte 68,15,40,5,100,74,0,0 // movaps 0x4a64(%rip),%xmm8 # 4d60 <_sk_callback_sse2+0x175> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 @@ -27331,7 +27558,7 @@ HIDDEN _sk_srcover_sse2 .globl _sk_srcover_sse2 FUNCTION(_sk_srcover_sse2) _sk_srcover_sse2: - .byte 68,15,40,5,199,73,0,0 // movaps 0x49c7(%rip),%xmm8 # 4cf0 <_sk_callback_sse2+0x191> + .byte 68,15,40,5,71,74,0,0 // movaps 0x4a47(%rip),%xmm8 # 4d70 <_sk_callback_sse2+0x185> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -27351,7 +27578,7 @@ HIDDEN _sk_dstover_sse2 .globl _sk_dstover_sse2 FUNCTION(_sk_dstover_sse2) _sk_dstover_sse2: - .byte 68,15,40,5,155,73,0,0 // movaps 0x499b(%rip),%xmm8 # 4d00 <_sk_callback_sse2+0x1a1> + .byte 68,15,40,5,27,74,0,0 // movaps 0x4a1b(%rip),%xmm8 # 4d80 <_sk_callback_sse2+0x195> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -27379,7 +27606,7 @@ HIDDEN _sk_multiply_sse2 .globl _sk_multiply_sse2 FUNCTION(_sk_multiply_sse2) _sk_multiply_sse2: - .byte 68,15,40,5,111,73,0,0 // movaps 0x496f(%rip),%xmm8 # 4d10 <_sk_callback_sse2+0x1b1> + .byte 68,15,40,5,239,73,0,0 // movaps 0x49ef(%rip),%xmm8 # 4d90 <_sk_callback_sse2+0x1a5> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 69,15,40,209 // movaps %xmm9,%xmm10 @@ -27455,7 +27682,7 @@ HIDDEN _sk_xor__sse2 FUNCTION(_sk_xor__sse2) _sk_xor__sse2: .byte 68,15,40,195 // movaps %xmm3,%xmm8 - .byte 15,40,29,160,72,0,0 // movaps 0x48a0(%rip),%xmm3 # 4d20 <_sk_callback_sse2+0x1c1> + .byte 15,40,29,32,73,0,0 // movaps 0x4920(%rip),%xmm3 # 4da0 <_sk_callback_sse2+0x1b5> .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 @@ -27503,7 +27730,7 @@ _sk_darken_sse2: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,95,209 // maxps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,11,72,0,0 // movaps 0x480b(%rip),%xmm2 # 4d30 <_sk_callback_sse2+0x1d1> + .byte 15,40,21,139,72,0,0 // movaps 0x488b(%rip),%xmm2 # 4db0 <_sk_callback_sse2+0x1c5> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -27537,7 +27764,7 @@ _sk_lighten_sse2: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,176,71,0,0 // movaps 0x47b0(%rip),%xmm2 # 4d40 <_sk_callback_sse2+0x1e1> + .byte 15,40,21,48,72,0,0 // movaps 0x4830(%rip),%xmm2 # 4dc0 <_sk_callback_sse2+0x1d5> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -27574,7 +27801,7 @@ _sk_difference_sse2: .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,74,71,0,0 // movaps 0x474a(%rip),%xmm2 # 4d50 <_sk_callback_sse2+0x1f1> + .byte 15,40,21,202,71,0,0 // movaps 0x47ca(%rip),%xmm2 # 4dd0 <_sk_callback_sse2+0x1e5> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -27601,7 +27828,7 @@ _sk_exclusion_sse2: .byte 15,89,214 // mulps %xmm6,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,202 // subps %xmm2,%xmm9 - .byte 15,40,13,11,71,0,0 // movaps 0x470b(%rip),%xmm1 # 4d60 <_sk_callback_sse2+0x201> + .byte 15,40,13,139,71,0,0 // movaps 0x478b(%rip),%xmm1 # 4de0 <_sk_callback_sse2+0x1f5> .byte 15,92,203 // subps %xmm3,%xmm1 .byte 15,89,207 // mulps %xmm7,%xmm1 .byte 15,88,217 // addps %xmm1,%xmm3 @@ -27615,7 +27842,7 @@ HIDDEN _sk_colorburn_sse2 FUNCTION(_sk_colorburn_sse2) _sk_colorburn_sse2: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,21,250,70,0,0 // movaps 0x46fa(%rip),%xmm10 # 4d70 <_sk_callback_sse2+0x211> + .byte 68,15,40,21,122,71,0,0 // movaps 0x477a(%rip),%xmm10 # 4df0 <_sk_callback_sse2+0x205> .byte 69,15,40,202 // movaps %xmm10,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 69,15,40,217 // movaps %xmm9,%xmm11 @@ -27709,7 +27936,7 @@ HIDDEN _sk_colordodge_sse2 FUNCTION(_sk_colordodge_sse2) _sk_colordodge_sse2: .byte 68,15,40,200 // movaps %xmm0,%xmm9 - .byte 68,15,40,21,176,69,0,0 // movaps 0x45b0(%rip),%xmm10 # 4d80 <_sk_callback_sse2+0x221> + .byte 68,15,40,21,48,70,0,0 // movaps 0x4630(%rip),%xmm10 # 4e00 <_sk_callback_sse2+0x215> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 69,15,40,227 // movaps %xmm11,%xmm12 @@ -27803,7 +28030,7 @@ _sk_hardlight_sse2: .byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp) .byte 15,40,245 // movaps %xmm5,%xmm6 .byte 15,40,236 // movaps %xmm4,%xmm5 - .byte 68,15,40,29,101,68,0,0 // movaps 0x4465(%rip),%xmm11 # 4d90 <_sk_callback_sse2+0x231> + .byte 68,15,40,29,229,68,0,0 // movaps 0x44e5(%rip),%xmm11 # 4e10 <_sk_callback_sse2+0x225> .byte 69,15,40,211 // movaps %xmm11,%xmm10 .byte 68,15,92,215 // subps %xmm7,%xmm10 .byte 69,15,40,194 // movaps %xmm10,%xmm8 @@ -27891,7 +28118,7 @@ FUNCTION(_sk_overlay_sse2) _sk_overlay_sse2: .byte 68,15,40,193 // movaps %xmm1,%xmm8 .byte 68,15,40,232 // movaps %xmm0,%xmm13 - .byte 68,15,40,13,51,67,0,0 // movaps 0x4333(%rip),%xmm9 # 4da0 <_sk_callback_sse2+0x241> + .byte 68,15,40,13,179,67,0,0 // movaps 0x43b3(%rip),%xmm9 # 4e20 <_sk_callback_sse2+0x235> .byte 69,15,40,209 // movaps %xmm9,%xmm10 .byte 68,15,92,215 // subps %xmm7,%xmm10 .byte 69,15,40,218 // movaps %xmm10,%xmm11 @@ -27982,7 +28209,7 @@ _sk_softlight_sse2: .byte 68,15,40,213 // movaps %xmm5,%xmm10 .byte 68,15,94,215 // divps %xmm7,%xmm10 .byte 69,15,84,212 // andps %xmm12,%xmm10 - .byte 68,15,40,13,240,65,0,0 // movaps 0x41f0(%rip),%xmm9 # 4db0 <_sk_callback_sse2+0x251> + .byte 68,15,40,13,112,66,0,0 // movaps 0x4270(%rip),%xmm9 # 4e30 <_sk_callback_sse2+0x245> .byte 69,15,40,249 // movaps %xmm9,%xmm15 .byte 69,15,92,250 // subps %xmm10,%xmm15 .byte 69,15,40,218 // movaps %xmm10,%xmm11 @@ -27995,10 +28222,10 @@ _sk_softlight_sse2: .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 65,15,88,194 // addps %xmm10,%xmm0 - .byte 68,15,40,53,202,65,0,0 // movaps 0x41ca(%rip),%xmm14 # 4dc0 <_sk_callback_sse2+0x261> + .byte 68,15,40,53,74,66,0,0 // movaps 0x424a(%rip),%xmm14 # 4e40 <_sk_callback_sse2+0x255> .byte 69,15,88,222 // addps %xmm14,%xmm11 .byte 68,15,89,216 // mulps %xmm0,%xmm11 - .byte 68,15,40,21,202,65,0,0 // movaps 0x41ca(%rip),%xmm10 # 4dd0 <_sk_callback_sse2+0x271> + .byte 68,15,40,21,74,66,0,0 // movaps 0x424a(%rip),%xmm10 # 4e50 <_sk_callback_sse2+0x265> .byte 69,15,89,234 // mulps %xmm10,%xmm13 .byte 69,15,88,235 // addps %xmm11,%xmm13 .byte 15,88,228 // addps %xmm4,%xmm4 @@ -28143,7 +28370,7 @@ _sk_hue_sse2: .byte 68,15,40,209 // movaps %xmm1,%xmm10 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 68,15,89,211 // mulps %xmm3,%xmm10 - .byte 68,15,40,5,13,64,0,0 // movaps 0x400d(%rip),%xmm8 # 4e10 <_sk_callback_sse2+0x2b1> + .byte 68,15,40,5,141,64,0,0 // movaps 0x408d(%rip),%xmm8 # 4e90 <_sk_callback_sse2+0x2a5> .byte 69,15,40,216 // movaps %xmm8,%xmm11 .byte 15,40,207 // movaps %xmm7,%xmm1 .byte 68,15,92,217 // subps %xmm1,%xmm11 @@ -28189,12 +28416,12 @@ _sk_hue_sse2: .byte 69,15,84,206 // andps %xmm14,%xmm9 .byte 69,15,84,214 // andps %xmm14,%xmm10 .byte 65,15,84,214 // andps %xmm14,%xmm2 - .byte 68,15,40,61,33,63,0,0 // movaps 0x3f21(%rip),%xmm15 # 4de0 <_sk_callback_sse2+0x281> + .byte 68,15,40,61,161,63,0,0 // movaps 0x3fa1(%rip),%xmm15 # 4e60 <_sk_callback_sse2+0x275> .byte 65,15,89,231 // mulps %xmm15,%xmm4 - .byte 15,40,5,38,63,0,0 // movaps 0x3f26(%rip),%xmm0 # 4df0 <_sk_callback_sse2+0x291> + .byte 15,40,5,166,63,0,0 // movaps 0x3fa6(%rip),%xmm0 # 4e70 <_sk_callback_sse2+0x285> .byte 15,89,240 // mulps %xmm0,%xmm6 .byte 15,88,244 // addps %xmm4,%xmm6 - .byte 68,15,40,53,40,63,0,0 // movaps 0x3f28(%rip),%xmm14 # 4e00 <_sk_callback_sse2+0x2a1> + .byte 68,15,40,53,168,63,0,0 // movaps 0x3fa8(%rip),%xmm14 # 4e80 <_sk_callback_sse2+0x295> .byte 68,15,40,239 // movaps %xmm7,%xmm13 .byte 69,15,89,238 // mulps %xmm14,%xmm13 .byte 68,15,88,238 // addps %xmm6,%xmm13 @@ -28371,14 +28598,14 @@ _sk_saturation_sse2: .byte 68,15,84,211 // andps %xmm3,%xmm10 .byte 68,15,84,203 // andps %xmm3,%xmm9 .byte 15,84,195 // andps %xmm3,%xmm0 - .byte 68,15,40,5,189,60,0,0 // movaps 0x3cbd(%rip),%xmm8 # 4e20 <_sk_callback_sse2+0x2c1> + .byte 68,15,40,5,61,61,0,0 // movaps 0x3d3d(%rip),%xmm8 # 4ea0 <_sk_callback_sse2+0x2b5> .byte 15,40,214 // movaps %xmm6,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 - .byte 15,40,13,191,60,0,0 // movaps 0x3cbf(%rip),%xmm1 # 4e30 <_sk_callback_sse2+0x2d1> + .byte 15,40,13,63,61,0,0 // movaps 0x3d3f(%rip),%xmm1 # 4eb0 <_sk_callback_sse2+0x2c5> .byte 15,40,221 // movaps %xmm5,%xmm3 .byte 15,89,217 // mulps %xmm1,%xmm3 .byte 15,88,218 // addps %xmm2,%xmm3 - .byte 68,15,40,37,190,60,0,0 // movaps 0x3cbe(%rip),%xmm12 # 4e40 <_sk_callback_sse2+0x2e1> + .byte 68,15,40,37,62,61,0,0 // movaps 0x3d3e(%rip),%xmm12 # 4ec0 <_sk_callback_sse2+0x2d5> .byte 69,15,89,236 // mulps %xmm12,%xmm13 .byte 68,15,88,235 // addps %xmm3,%xmm13 .byte 65,15,40,210 // movaps %xmm10,%xmm2 @@ -28423,7 +28650,7 @@ _sk_saturation_sse2: .byte 15,40,223 // movaps %xmm7,%xmm3 .byte 15,40,236 // movaps %xmm4,%xmm5 .byte 15,89,221 // mulps %xmm5,%xmm3 - .byte 68,15,40,5,35,60,0,0 // movaps 0x3c23(%rip),%xmm8 # 4e50 <_sk_callback_sse2+0x2f1> + .byte 68,15,40,5,163,60,0,0 // movaps 0x3ca3(%rip),%xmm8 # 4ed0 <_sk_callback_sse2+0x2e5> .byte 65,15,40,224 // movaps %xmm8,%xmm4 .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 15,88,253 // addps %xmm5,%xmm7 @@ -28524,14 +28751,14 @@ _sk_color_sse2: .byte 68,15,40,213 // movaps %xmm5,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 .byte 65,15,40,208 // movaps %xmm8,%xmm2 - .byte 68,15,40,45,193,58,0,0 // movaps 0x3ac1(%rip),%xmm13 # 4e60 <_sk_callback_sse2+0x301> + .byte 68,15,40,45,65,59,0,0 // movaps 0x3b41(%rip),%xmm13 # 4ee0 <_sk_callback_sse2+0x2f5> .byte 68,15,40,198 // movaps %xmm6,%xmm8 .byte 69,15,89,197 // mulps %xmm13,%xmm8 - .byte 68,15,40,53,193,58,0,0 // movaps 0x3ac1(%rip),%xmm14 # 4e70 <_sk_callback_sse2+0x311> + .byte 68,15,40,53,65,59,0,0 // movaps 0x3b41(%rip),%xmm14 # 4ef0 <_sk_callback_sse2+0x305> .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,89,198 // mulps %xmm14,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,29,189,58,0,0 // movaps 0x3abd(%rip),%xmm11 # 4e80 <_sk_callback_sse2+0x321> + .byte 68,15,40,29,61,59,0,0 // movaps 0x3b3d(%rip),%xmm11 # 4f00 <_sk_callback_sse2+0x315> .byte 69,15,89,227 // mulps %xmm11,%xmm12 .byte 68,15,88,224 // addps %xmm0,%xmm12 .byte 65,15,40,193 // movaps %xmm9,%xmm0 @@ -28539,7 +28766,7 @@ _sk_color_sse2: .byte 69,15,40,250 // movaps %xmm10,%xmm15 .byte 69,15,89,254 // mulps %xmm14,%xmm15 .byte 68,15,88,248 // addps %xmm0,%xmm15 - .byte 68,15,40,5,169,58,0,0 // movaps 0x3aa9(%rip),%xmm8 # 4e90 <_sk_callback_sse2+0x331> + .byte 68,15,40,5,41,59,0,0 // movaps 0x3b29(%rip),%xmm8 # 4f10 <_sk_callback_sse2+0x325> .byte 65,15,40,224 // movaps %xmm8,%xmm4 .byte 15,92,226 // subps %xmm2,%xmm4 .byte 15,89,252 // mulps %xmm4,%xmm7 @@ -28675,15 +28902,15 @@ _sk_luminosity_sse2: .byte 68,15,40,205 // movaps %xmm5,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 .byte 15,89,222 // mulps %xmm6,%xmm3 - .byte 68,15,40,37,192,56,0,0 // movaps 0x38c0(%rip),%xmm12 # 4ea0 <_sk_callback_sse2+0x341> + .byte 68,15,40,37,64,57,0,0 // movaps 0x3940(%rip),%xmm12 # 4f20 <_sk_callback_sse2+0x335> .byte 68,15,40,199 // movaps %xmm7,%xmm8 .byte 69,15,89,196 // mulps %xmm12,%xmm8 - .byte 68,15,40,45,192,56,0,0 // movaps 0x38c0(%rip),%xmm13 # 4eb0 <_sk_callback_sse2+0x351> + .byte 68,15,40,45,64,57,0,0 // movaps 0x3940(%rip),%xmm13 # 4f30 <_sk_callback_sse2+0x345> .byte 68,15,40,241 // movaps %xmm1,%xmm14 .byte 69,15,89,245 // mulps %xmm13,%xmm14 .byte 69,15,88,240 // addps %xmm8,%xmm14 - .byte 68,15,40,29,188,56,0,0 // movaps 0x38bc(%rip),%xmm11 # 4ec0 <_sk_callback_sse2+0x361> - .byte 68,15,40,5,196,56,0,0 // movaps 0x38c4(%rip),%xmm8 # 4ed0 <_sk_callback_sse2+0x371> + .byte 68,15,40,29,60,57,0,0 // movaps 0x393c(%rip),%xmm11 # 4f40 <_sk_callback_sse2+0x355> + .byte 68,15,40,5,68,57,0,0 // movaps 0x3944(%rip),%xmm8 # 4f50 <_sk_callback_sse2+0x365> .byte 69,15,40,248 // movaps %xmm8,%xmm15 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 68,15,92,248 // subps %xmm0,%xmm15 @@ -28828,7 +29055,7 @@ HIDDEN _sk_clamp_1_sse2 .globl _sk_clamp_1_sse2 FUNCTION(_sk_clamp_1_sse2) _sk_clamp_1_sse2: - .byte 68,15,40,5,205,54,0,0 // movaps 0x36cd(%rip),%xmm8 # 4ee0 <_sk_callback_sse2+0x381> + .byte 68,15,40,5,77,55,0,0 // movaps 0x374d(%rip),%xmm8 # 4f60 <_sk_callback_sse2+0x375> .byte 65,15,93,192 // minps %xmm8,%xmm0 .byte 65,15,93,200 // minps %xmm8,%xmm1 .byte 65,15,93,208 // minps %xmm8,%xmm2 @@ -28840,7 +29067,7 @@ HIDDEN _sk_clamp_a_sse2 .globl _sk_clamp_a_sse2 FUNCTION(_sk_clamp_a_sse2) _sk_clamp_a_sse2: - .byte 15,93,29,194,54,0,0 // minps 0x36c2(%rip),%xmm3 # 4ef0 <_sk_callback_sse2+0x391> + .byte 15,93,29,66,55,0,0 // minps 0x3742(%rip),%xmm3 # 4f70 <_sk_callback_sse2+0x385> .byte 15,93,195 // minps %xmm3,%xmm0 .byte 15,93,203 // minps %xmm3,%xmm1 .byte 15,93,211 // minps %xmm3,%xmm2 @@ -28927,7 +29154,7 @@ HIDDEN _sk_unpremul_sse2 FUNCTION(_sk_unpremul_sse2) _sk_unpremul_sse2: .byte 69,15,87,192 // xorps %xmm8,%xmm8 - .byte 68,15,40,13,45,54,0,0 // movaps 0x362d(%rip),%xmm9 # 4f00 <_sk_callback_sse2+0x3a1> + .byte 68,15,40,13,173,54,0,0 // movaps 0x36ad(%rip),%xmm9 # 4f80 <_sk_callback_sse2+0x395> .byte 68,15,94,203 // divps %xmm3,%xmm9 .byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8 .byte 69,15,84,193 // andps %xmm9,%xmm8 @@ -28941,20 +29168,20 @@ HIDDEN _sk_from_srgb_sse2 .globl _sk_from_srgb_sse2 FUNCTION(_sk_from_srgb_sse2) _sk_from_srgb_sse2: - .byte 68,15,40,5,24,54,0,0 // movaps 0x3618(%rip),%xmm8 # 4f10 <_sk_callback_sse2+0x3b1> + .byte 68,15,40,5,152,54,0,0 // movaps 0x3698(%rip),%xmm8 # 4f90 <_sk_callback_sse2+0x3a5> .byte 68,15,40,232 // movaps %xmm0,%xmm13 .byte 69,15,89,232 // mulps %xmm8,%xmm13 .byte 68,15,40,216 // movaps %xmm0,%xmm11 .byte 69,15,89,219 // mulps %xmm11,%xmm11 - .byte 68,15,40,13,16,54,0,0 // movaps 0x3610(%rip),%xmm9 # 4f20 <_sk_callback_sse2+0x3c1> + .byte 68,15,40,13,144,54,0,0 // movaps 0x3690(%rip),%xmm9 # 4fa0 <_sk_callback_sse2+0x3b5> .byte 68,15,40,240 // movaps %xmm0,%xmm14 .byte 69,15,89,241 // mulps %xmm9,%xmm14 - .byte 68,15,40,21,16,54,0,0 // movaps 0x3610(%rip),%xmm10 # 4f30 <_sk_callback_sse2+0x3d1> + .byte 68,15,40,21,144,54,0,0 // movaps 0x3690(%rip),%xmm10 # 4fb0 <_sk_callback_sse2+0x3c5> .byte 69,15,88,242 // addps %xmm10,%xmm14 .byte 69,15,89,243 // mulps %xmm11,%xmm14 - .byte 68,15,40,29,16,54,0,0 // movaps 0x3610(%rip),%xmm11 # 4f40 <_sk_callback_sse2+0x3e1> + .byte 68,15,40,29,144,54,0,0 // movaps 0x3690(%rip),%xmm11 # 4fc0 <_sk_callback_sse2+0x3d5> .byte 69,15,88,243 // addps %xmm11,%xmm14 - .byte 68,15,40,37,20,54,0,0 // movaps 0x3614(%rip),%xmm12 # 4f50 <_sk_callback_sse2+0x3f1> + .byte 68,15,40,37,148,54,0,0 // movaps 0x3694(%rip),%xmm12 # 4fd0 <_sk_callback_sse2+0x3e5> .byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0 .byte 68,15,84,232 // andps %xmm0,%xmm13 .byte 65,15,85,198 // andnps %xmm14,%xmm0 @@ -28991,22 +29218,22 @@ HIDDEN _sk_to_srgb_sse2 FUNCTION(_sk_to_srgb_sse2) _sk_to_srgb_sse2: .byte 68,15,82,232 // rsqrtps %xmm0,%xmm13 - .byte 68,15,40,5,161,53,0,0 // movaps 0x35a1(%rip),%xmm8 # 4f60 <_sk_callback_sse2+0x401> + .byte 68,15,40,5,33,54,0,0 // movaps 0x3621(%rip),%xmm8 # 4fe0 <_sk_callback_sse2+0x3f5> .byte 68,15,40,240 // movaps %xmm0,%xmm14 .byte 69,15,89,240 // mulps %xmm8,%xmm14 - .byte 68,15,40,13,161,53,0,0 // movaps 0x35a1(%rip),%xmm9 # 4f70 <_sk_callback_sse2+0x411> + .byte 68,15,40,13,33,54,0,0 // movaps 0x3621(%rip),%xmm9 # 4ff0 <_sk_callback_sse2+0x405> .byte 69,15,40,253 // movaps %xmm13,%xmm15 .byte 69,15,89,249 // mulps %xmm9,%xmm15 - .byte 68,15,40,21,161,53,0,0 // movaps 0x35a1(%rip),%xmm10 # 4f80 <_sk_callback_sse2+0x421> + .byte 68,15,40,21,33,54,0,0 // movaps 0x3621(%rip),%xmm10 # 5000 <_sk_callback_sse2+0x415> .byte 69,15,88,250 // addps %xmm10,%xmm15 .byte 69,15,89,253 // mulps %xmm13,%xmm15 - .byte 68,15,40,29,161,53,0,0 // movaps 0x35a1(%rip),%xmm11 # 4f90 <_sk_callback_sse2+0x431> + .byte 68,15,40,29,33,54,0,0 // movaps 0x3621(%rip),%xmm11 # 5010 <_sk_callback_sse2+0x425> .byte 69,15,88,251 // addps %xmm11,%xmm15 - .byte 68,15,40,37,165,53,0,0 // movaps 0x35a5(%rip),%xmm12 # 4fa0 <_sk_callback_sse2+0x441> + .byte 68,15,40,37,37,54,0,0 // movaps 0x3625(%rip),%xmm12 # 5020 <_sk_callback_sse2+0x435> .byte 69,15,88,236 // addps %xmm12,%xmm13 .byte 69,15,83,237 // rcpps %xmm13,%xmm13 .byte 69,15,89,239 // mulps %xmm15,%xmm13 - .byte 68,15,40,61,161,53,0,0 // movaps 0x35a1(%rip),%xmm15 # 4fb0 <_sk_callback_sse2+0x451> + .byte 68,15,40,61,33,54,0,0 // movaps 0x3621(%rip),%xmm15 # 5030 <_sk_callback_sse2+0x445> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 68,15,84,240 // andps %xmm0,%xmm14 .byte 65,15,85,197 // andnps %xmm13,%xmm0 @@ -29056,7 +29283,7 @@ _sk_rgb_to_hsl_sse2: .byte 68,15,93,218 // minps %xmm2,%xmm11 .byte 65,15,40,202 // movaps %xmm10,%xmm1 .byte 65,15,92,203 // subps %xmm11,%xmm1 - .byte 68,15,40,45,250,52,0,0 // movaps 0x34fa(%rip),%xmm13 # 4fc0 <_sk_callback_sse2+0x461> + .byte 68,15,40,45,122,53,0,0 // movaps 0x357a(%rip),%xmm13 # 5040 <_sk_callback_sse2+0x455> .byte 68,15,94,233 // divps %xmm1,%xmm13 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0 @@ -29065,30 +29292,30 @@ _sk_rgb_to_hsl_sse2: .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,40,241 // movaps %xmm9,%xmm14 .byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14 - .byte 68,15,84,53,224,52,0,0 // andps 0x34e0(%rip),%xmm14 # 4fd0 <_sk_callback_sse2+0x471> + .byte 68,15,84,53,96,53,0,0 // andps 0x3560(%rip),%xmm14 # 5050 <_sk_callback_sse2+0x465> .byte 69,15,88,244 // addps %xmm12,%xmm14 .byte 69,15,40,250 // movaps %xmm10,%xmm15 .byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15 .byte 65,15,92,208 // subps %xmm8,%xmm2 .byte 65,15,89,213 // mulps %xmm13,%xmm2 - .byte 68,15,40,37,211,52,0,0 // movaps 0x34d3(%rip),%xmm12 # 4fe0 <_sk_callback_sse2+0x481> + .byte 68,15,40,37,83,53,0,0 // movaps 0x3553(%rip),%xmm12 # 5060 <_sk_callback_sse2+0x475> .byte 65,15,88,212 // addps %xmm12,%xmm2 .byte 69,15,92,193 // subps %xmm9,%xmm8 .byte 69,15,89,197 // mulps %xmm13,%xmm8 - .byte 68,15,88,5,207,52,0,0 // addps 0x34cf(%rip),%xmm8 # 4ff0 <_sk_callback_sse2+0x491> + .byte 68,15,88,5,79,53,0,0 // addps 0x354f(%rip),%xmm8 # 5070 <_sk_callback_sse2+0x485> .byte 65,15,84,215 // andps %xmm15,%xmm2 .byte 69,15,85,248 // andnps %xmm8,%xmm15 .byte 68,15,86,250 // orps %xmm2,%xmm15 .byte 68,15,84,240 // andps %xmm0,%xmm14 .byte 65,15,85,199 // andnps %xmm15,%xmm0 .byte 65,15,86,198 // orps %xmm14,%xmm0 - .byte 15,89,5,192,52,0,0 // mulps 0x34c0(%rip),%xmm0 # 5000 <_sk_callback_sse2+0x4a1> + .byte 15,89,5,64,53,0,0 // mulps 0x3540(%rip),%xmm0 # 5080 <_sk_callback_sse2+0x495> .byte 69,15,40,194 // movaps %xmm10,%xmm8 .byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8 .byte 65,15,84,192 // andps %xmm8,%xmm0 .byte 69,15,92,226 // subps %xmm10,%xmm12 .byte 69,15,88,211 // addps %xmm11,%xmm10 - .byte 68,15,40,13,179,52,0,0 // movaps 0x34b3(%rip),%xmm9 # 5010 <_sk_callback_sse2+0x4b1> + .byte 68,15,40,13,51,53,0,0 // movaps 0x3533(%rip),%xmm9 # 5090 <_sk_callback_sse2+0x4a5> .byte 65,15,40,210 // movaps %xmm10,%xmm2 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9 @@ -29112,7 +29339,7 @@ _sk_hsl_to_rgb_sse2: .byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp) .byte 68,15,40,218 // movaps %xmm2,%xmm11 .byte 15,40,240 // movaps %xmm0,%xmm6 - .byte 68,15,40,13,114,52,0,0 // movaps 0x3472(%rip),%xmm9 # 5020 <_sk_callback_sse2+0x4c1> + .byte 68,15,40,13,242,52,0,0 // movaps 0x34f2(%rip),%xmm9 # 50a0 <_sk_callback_sse2+0x4b5> .byte 69,15,40,209 // movaps %xmm9,%xmm10 .byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10 .byte 15,40,193 // movaps %xmm1,%xmm0 @@ -29129,28 +29356,28 @@ _sk_hsl_to_rgb_sse2: .byte 69,15,88,211 // addps %xmm11,%xmm10 .byte 69,15,88,219 // addps %xmm11,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 15,40,5,59,52,0,0 // movaps 0x343b(%rip),%xmm0 # 5030 <_sk_callback_sse2+0x4d1> + .byte 15,40,5,187,52,0,0 // movaps 0x34bb(%rip),%xmm0 # 50b0 <_sk_callback_sse2+0x4c5> .byte 15,88,198 // addps %xmm6,%xmm0 .byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,40,216 // movaps %xmm0,%xmm3 .byte 15,194,217,1 // cmpltps %xmm1,%xmm3 - .byte 15,84,29,51,52,0,0 // andps 0x3433(%rip),%xmm3 # 5040 <_sk_callback_sse2+0x4e1> + .byte 15,84,29,179,52,0,0 // andps 0x34b3(%rip),%xmm3 # 50c0 <_sk_callback_sse2+0x4d5> .byte 15,92,203 // subps %xmm3,%xmm1 .byte 15,92,193 // subps %xmm1,%xmm0 - .byte 68,15,40,45,53,52,0,0 // movaps 0x3435(%rip),%xmm13 # 5050 <_sk_callback_sse2+0x4f1> + .byte 68,15,40,45,181,52,0,0 // movaps 0x34b5(%rip),%xmm13 # 50d0 <_sk_callback_sse2+0x4e5> .byte 69,15,40,197 // movaps %xmm13,%xmm8 .byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8 .byte 69,15,40,242 // movaps %xmm10,%xmm14 .byte 69,15,92,243 // subps %xmm11,%xmm14 .byte 65,15,40,217 // movaps %xmm9,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 - .byte 15,40,21,69,52,0,0 // movaps 0x3445(%rip),%xmm2 # 5080 <_sk_callback_sse2+0x521> + .byte 15,40,21,197,52,0,0 // movaps 0x34c5(%rip),%xmm2 # 5100 <_sk_callback_sse2+0x515> .byte 68,15,40,250 // movaps %xmm2,%xmm15 .byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15 - .byte 15,40,13,21,52,0,0 // movaps 0x3415(%rip),%xmm1 # 5060 <_sk_callback_sse2+0x501> + .byte 15,40,13,149,52,0,0 // movaps 0x3495(%rip),%xmm1 # 50e0 <_sk_callback_sse2+0x4f5> .byte 15,89,193 // mulps %xmm1,%xmm0 - .byte 15,40,45,27,52,0,0 // movaps 0x341b(%rip),%xmm5 # 5070 <_sk_callback_sse2+0x511> + .byte 15,40,45,155,52,0,0 // movaps 0x349b(%rip),%xmm5 # 50f0 <_sk_callback_sse2+0x505> .byte 15,40,229 // movaps %xmm5,%xmm4 .byte 15,92,224 // subps %xmm0,%xmm4 .byte 65,15,89,230 // mulps %xmm14,%xmm4 @@ -29173,7 +29400,7 @@ _sk_hsl_to_rgb_sse2: .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,222 // movaps %xmm6,%xmm3 .byte 15,194,216,1 // cmpltps %xmm0,%xmm3 - .byte 15,84,29,144,51,0,0 // andps 0x3390(%rip),%xmm3 # 5040 <_sk_callback_sse2+0x4e1> + .byte 15,84,29,16,52,0,0 // andps 0x3410(%rip),%xmm3 # 50c0 <_sk_callback_sse2+0x4d5> .byte 15,92,195 // subps %xmm3,%xmm0 .byte 68,15,40,230 // movaps %xmm6,%xmm12 .byte 68,15,92,224 // subps %xmm0,%xmm12 @@ -29203,12 +29430,12 @@ _sk_hsl_to_rgb_sse2: .byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7 .byte 15,40,231 // movaps %xmm7,%xmm4 .byte 15,85,227 // andnps %xmm3,%xmm4 - .byte 15,88,53,104,51,0,0 // addps 0x3368(%rip),%xmm6 # 5090 <_sk_callback_sse2+0x531> + .byte 15,88,53,232,51,0,0 // addps 0x33e8(%rip),%xmm6 # 5110 <_sk_callback_sse2+0x525> .byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,222 // movaps %xmm6,%xmm3 .byte 15,194,216,1 // cmpltps %xmm0,%xmm3 - .byte 15,84,29,3,51,0,0 // andps 0x3303(%rip),%xmm3 # 5040 <_sk_callback_sse2+0x4e1> + .byte 15,84,29,131,51,0,0 // andps 0x3383(%rip),%xmm3 # 50c0 <_sk_callback_sse2+0x4d5> .byte 15,92,195 // subps %xmm3,%xmm0 .byte 15,92,240 // subps %xmm0,%xmm6 .byte 15,89,206 // mulps %xmm6,%xmm1 @@ -29272,7 +29499,7 @@ _sk_scale_u8_sse2: .byte 102,69,15,96,193 // punpcklbw %xmm9,%xmm8 .byte 102,69,15,97,193 // punpcklwd %xmm9,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,145,50,0,0 // mulps 0x3291(%rip),%xmm8 # 50a0 <_sk_callback_sse2+0x541> + .byte 68,15,89,5,17,51,0,0 // mulps 0x3311(%rip),%xmm8 # 5120 <_sk_callback_sse2+0x535> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 @@ -29313,7 +29540,7 @@ _sk_lerp_u8_sse2: .byte 102,69,15,96,193 // punpcklbw %xmm9,%xmm8 .byte 102,69,15,97,193 // punpcklwd %xmm9,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,47,50,0,0 // mulps 0x322f(%rip),%xmm8 # 50b0 <_sk_callback_sse2+0x551> + .byte 68,15,89,5,175,50,0,0 // mulps 0x32af(%rip),%xmm8 # 5130 <_sk_callback_sse2+0x545> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -29338,17 +29565,17 @@ _sk_lerp_565_sse2: .byte 243,68,15,126,20,120 // movq (%rax,%rdi,2),%xmm10 .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,69,15,97,208 // punpcklwd %xmm8,%xmm10 - .byte 102,68,15,111,5,245,49,0,0 // movdqa 0x31f5(%rip),%xmm8 # 50c0 <_sk_callback_sse2+0x561> + .byte 102,68,15,111,5,117,50,0,0 // movdqa 0x3275(%rip),%xmm8 # 5140 <_sk_callback_sse2+0x555> .byte 102,69,15,219,194 // pand %xmm10,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,244,49,0,0 // mulps 0x31f4(%rip),%xmm8 # 50d0 <_sk_callback_sse2+0x571> - .byte 102,68,15,111,13,251,49,0,0 // movdqa 0x31fb(%rip),%xmm9 # 50e0 <_sk_callback_sse2+0x581> + .byte 68,15,89,5,116,50,0,0 // mulps 0x3274(%rip),%xmm8 # 5150 <_sk_callback_sse2+0x565> + .byte 102,68,15,111,13,123,50,0,0 // movdqa 0x327b(%rip),%xmm9 # 5160 <_sk_callback_sse2+0x575> .byte 102,69,15,219,202 // pand %xmm10,%xmm9 .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9 - .byte 68,15,89,13,250,49,0,0 // mulps 0x31fa(%rip),%xmm9 # 50f0 <_sk_callback_sse2+0x591> - .byte 102,68,15,219,21,1,50,0,0 // pand 0x3201(%rip),%xmm10 # 5100 <_sk_callback_sse2+0x5a1> + .byte 68,15,89,13,122,50,0,0 // mulps 0x327a(%rip),%xmm9 # 5170 <_sk_callback_sse2+0x585> + .byte 102,68,15,219,21,129,50,0,0 // pand 0x3281(%rip),%xmm10 # 5180 <_sk_callback_sse2+0x595> .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 - .byte 68,15,89,21,5,50,0,0 // mulps 0x3205(%rip),%xmm10 # 5110 <_sk_callback_sse2+0x5b1> + .byte 68,15,89,21,133,50,0,0 // mulps 0x3285(%rip),%xmm10 # 5190 <_sk_callback_sse2+0x5a5> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -29379,7 +29606,7 @@ _sk_load_tables_sse2: .byte 76,139,0 // mov (%rax),%r8 .byte 76,139,72,8 // mov 0x8(%rax),%r9 .byte 243,69,15,111,12,184 // movdqu (%r8,%rdi,4),%xmm9 - .byte 102,68,15,111,5,181,49,0,0 // movdqa 0x31b5(%rip),%xmm8 # 5120 <_sk_callback_sse2+0x5c1> + .byte 102,68,15,111,5,53,50,0,0 // movdqa 0x3235(%rip),%xmm8 # 51a0 <_sk_callback_sse2+0x5b5> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 @@ -29434,7 +29661,7 @@ _sk_load_tables_sse2: .byte 65,15,20,208 // unpcklps %xmm8,%xmm2 .byte 102,65,15,114,209,24 // psrld $0x18,%xmm9 .byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3 - .byte 15,89,29,194,48,0,0 // mulps 0x30c2(%rip),%xmm3 # 5130 <_sk_callback_sse2+0x5d1> + .byte 15,89,29,66,49,0,0 // mulps 0x3142(%rip),%xmm3 # 51b0 <_sk_callback_sse2+0x5c5> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -29453,7 +29680,7 @@ _sk_load_tables_u16_be_sse2: .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 - .byte 102,68,15,111,21,149,48,0,0 // movdqa 0x3095(%rip),%xmm10 # 5140 <_sk_callback_sse2+0x5e1> + .byte 102,68,15,111,21,21,49,0,0 // movdqa 0x3115(%rip),%xmm10 # 51c0 <_sk_callback_sse2+0x5d5> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,194 // pand %xmm10,%xmm0 .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 @@ -29514,7 +29741,7 @@ _sk_load_tables_u16_be_sse2: .byte 102,65,15,235,217 // por %xmm9,%xmm3 .byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,132,47,0,0 // mulps 0x2f84(%rip),%xmm3 # 5150 <_sk_callback_sse2+0x5f1> + .byte 15,89,29,4,48,0,0 // mulps 0x3004(%rip),%xmm3 # 51d0 <_sk_callback_sse2+0x5e5> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -29536,7 +29763,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10 .byte 102,65,15,111,195 // movdqa %xmm11,%xmm0 .byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0 - .byte 102,68,15,111,5,68,47,0,0 // movdqa 0x2f44(%rip),%xmm8 # 5160 <_sk_callback_sse2+0x601> + .byte 102,68,15,111,5,196,47,0,0 // movdqa 0x2fc4(%rip),%xmm8 # 51e0 <_sk_callback_sse2+0x5f5> .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 @@ -29591,7 +29818,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 15,20,211 // unpcklps %xmm3,%xmm2 .byte 65,15,20,208 // unpcklps %xmm8,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,83,46,0,0 // movaps 0x2e53(%rip),%xmm3 # 5170 <_sk_callback_sse2+0x611> + .byte 15,40,29,211,46,0,0 // movaps 0x2ed3(%rip),%xmm3 # 51f0 <_sk_callback_sse2+0x605> .byte 255,224 // jmpq *%rax HIDDEN _sk_byte_tables_sse2 @@ -29601,7 +29828,7 @@ _sk_byte_tables_sse2: .byte 65,86 // push %r14 .byte 83 // push %rbx .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,84,46,0,0 // movaps 0x2e54(%rip),%xmm8 # 5180 <_sk_callback_sse2+0x621> + .byte 68,15,40,5,212,46,0,0 // movaps 0x2ed4(%rip),%xmm8 # 5200 <_sk_callback_sse2+0x615> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 102,72,15,126,193 // movq %xmm0,%rcx @@ -29628,7 +29855,7 @@ _sk_byte_tables_sse2: .byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0 .byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,21,241,45,0,0 // movaps 0x2df1(%rip),%xmm10 # 5190 <_sk_callback_sse2+0x631> + .byte 68,15,40,21,113,46,0,0 // movaps 0x2e71(%rip),%xmm10 # 5210 <_sk_callback_sse2+0x625> .byte 65,15,89,194 // mulps %xmm10,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -29744,7 +29971,7 @@ _sk_byte_tables_rgb_sse2: .byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0 .byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,21,68,44,0,0 // movaps 0x2c44(%rip),%xmm10 # 51a0 <_sk_callback_sse2+0x641> + .byte 68,15,40,21,196,44,0,0 // movaps 0x2cc4(%rip),%xmm10 # 5220 <_sk_callback_sse2+0x635> .byte 65,15,89,194 // mulps %xmm10,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -29941,15 +30168,15 @@ _sk_parametric_r_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,131,41,0,0 // mulps 0x2983(%rip),%xmm9 # 51b0 <_sk_callback_sse2+0x651> - .byte 68,15,84,21,139,41,0,0 // andps 0x298b(%rip),%xmm10 # 51c0 <_sk_callback_sse2+0x661> - .byte 68,15,86,21,147,41,0,0 // orps 0x2993(%rip),%xmm10 # 51d0 <_sk_callback_sse2+0x671> - .byte 68,15,88,13,155,41,0,0 // addps 0x299b(%rip),%xmm9 # 51e0 <_sk_callback_sse2+0x681> - .byte 68,15,40,37,163,41,0,0 // movaps 0x29a3(%rip),%xmm12 # 51f0 <_sk_callback_sse2+0x691> + .byte 68,15,89,13,3,42,0,0 // mulps 0x2a03(%rip),%xmm9 # 5230 <_sk_callback_sse2+0x645> + .byte 68,15,84,21,11,42,0,0 // andps 0x2a0b(%rip),%xmm10 # 5240 <_sk_callback_sse2+0x655> + .byte 68,15,86,21,19,42,0,0 // orps 0x2a13(%rip),%xmm10 # 5250 <_sk_callback_sse2+0x665> + .byte 68,15,88,13,27,42,0,0 // addps 0x2a1b(%rip),%xmm9 # 5260 <_sk_callback_sse2+0x675> + .byte 68,15,40,37,35,42,0,0 // movaps 0x2a23(%rip),%xmm12 # 5270 <_sk_callback_sse2+0x685> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,163,41,0,0 // addps 0x29a3(%rip),%xmm10 # 5200 <_sk_callback_sse2+0x6a1> - .byte 68,15,40,37,171,41,0,0 // movaps 0x29ab(%rip),%xmm12 # 5210 <_sk_callback_sse2+0x6b1> + .byte 68,15,88,21,35,42,0,0 // addps 0x2a23(%rip),%xmm10 # 5280 <_sk_callback_sse2+0x695> + .byte 68,15,40,37,43,42,0,0 // movaps 0x2a2b(%rip),%xmm12 # 5290 <_sk_callback_sse2+0x6a5> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -29957,22 +30184,22 @@ _sk_parametric_r_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,149,41,0,0 // movaps 0x2995(%rip),%xmm10 # 5220 <_sk_callback_sse2+0x6c1> + .byte 68,15,40,21,21,42,0,0 // movaps 0x2a15(%rip),%xmm10 # 52a0 <_sk_callback_sse2+0x6b5> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,137,41,0,0 // addps 0x2989(%rip),%xmm9 # 5230 <_sk_callback_sse2+0x6d1> - .byte 68,15,40,37,145,41,0,0 // movaps 0x2991(%rip),%xmm12 # 5240 <_sk_callback_sse2+0x6e1> + .byte 68,15,88,13,9,42,0,0 // addps 0x2a09(%rip),%xmm9 # 52b0 <_sk_callback_sse2+0x6c5> + .byte 68,15,40,37,17,42,0,0 // movaps 0x2a11(%rip),%xmm12 # 52c0 <_sk_callback_sse2+0x6d5> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,145,41,0,0 // movaps 0x2991(%rip),%xmm12 # 5250 <_sk_callback_sse2+0x6f1> + .byte 68,15,40,37,17,42,0,0 // movaps 0x2a11(%rip),%xmm12 # 52d0 <_sk_callback_sse2+0x6e5> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,149,41,0,0 // movaps 0x2995(%rip),%xmm13 # 5260 <_sk_callback_sse2+0x701> + .byte 68,15,40,45,21,42,0,0 // movaps 0x2a15(%rip),%xmm13 # 52e0 <_sk_callback_sse2+0x6f5> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,149,41,0,0 // mulps 0x2995(%rip),%xmm13 # 5270 <_sk_callback_sse2+0x711> + .byte 68,15,89,45,21,42,0,0 // mulps 0x2a15(%rip),%xmm13 # 52f0 <_sk_callback_sse2+0x705> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -30008,15 +30235,15 @@ _sk_parametric_g_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,21,41,0,0 // mulps 0x2915(%rip),%xmm9 # 5280 <_sk_callback_sse2+0x721> - .byte 68,15,84,21,29,41,0,0 // andps 0x291d(%rip),%xmm10 # 5290 <_sk_callback_sse2+0x731> - .byte 68,15,86,21,37,41,0,0 // orps 0x2925(%rip),%xmm10 # 52a0 <_sk_callback_sse2+0x741> - .byte 68,15,88,13,45,41,0,0 // addps 0x292d(%rip),%xmm9 # 52b0 <_sk_callback_sse2+0x751> - .byte 68,15,40,37,53,41,0,0 // movaps 0x2935(%rip),%xmm12 # 52c0 <_sk_callback_sse2+0x761> + .byte 68,15,89,13,149,41,0,0 // mulps 0x2995(%rip),%xmm9 # 5300 <_sk_callback_sse2+0x715> + .byte 68,15,84,21,157,41,0,0 // andps 0x299d(%rip),%xmm10 # 5310 <_sk_callback_sse2+0x725> + .byte 68,15,86,21,165,41,0,0 // orps 0x29a5(%rip),%xmm10 # 5320 <_sk_callback_sse2+0x735> + .byte 68,15,88,13,173,41,0,0 // addps 0x29ad(%rip),%xmm9 # 5330 <_sk_callback_sse2+0x745> + .byte 68,15,40,37,181,41,0,0 // movaps 0x29b5(%rip),%xmm12 # 5340 <_sk_callback_sse2+0x755> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,53,41,0,0 // addps 0x2935(%rip),%xmm10 # 52d0 <_sk_callback_sse2+0x771> - .byte 68,15,40,37,61,41,0,0 // movaps 0x293d(%rip),%xmm12 # 52e0 <_sk_callback_sse2+0x781> + .byte 68,15,88,21,181,41,0,0 // addps 0x29b5(%rip),%xmm10 # 5350 <_sk_callback_sse2+0x765> + .byte 68,15,40,37,189,41,0,0 // movaps 0x29bd(%rip),%xmm12 # 5360 <_sk_callback_sse2+0x775> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -30024,22 +30251,22 @@ _sk_parametric_g_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,39,41,0,0 // movaps 0x2927(%rip),%xmm10 # 52f0 <_sk_callback_sse2+0x791> + .byte 68,15,40,21,167,41,0,0 // movaps 0x29a7(%rip),%xmm10 # 5370 <_sk_callback_sse2+0x785> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,27,41,0,0 // addps 0x291b(%rip),%xmm9 # 5300 <_sk_callback_sse2+0x7a1> - .byte 68,15,40,37,35,41,0,0 // movaps 0x2923(%rip),%xmm12 # 5310 <_sk_callback_sse2+0x7b1> + .byte 68,15,88,13,155,41,0,0 // addps 0x299b(%rip),%xmm9 # 5380 <_sk_callback_sse2+0x795> + .byte 68,15,40,37,163,41,0,0 // movaps 0x29a3(%rip),%xmm12 # 5390 <_sk_callback_sse2+0x7a5> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,35,41,0,0 // movaps 0x2923(%rip),%xmm12 # 5320 <_sk_callback_sse2+0x7c1> + .byte 68,15,40,37,163,41,0,0 // movaps 0x29a3(%rip),%xmm12 # 53a0 <_sk_callback_sse2+0x7b5> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,39,41,0,0 // movaps 0x2927(%rip),%xmm13 # 5330 <_sk_callback_sse2+0x7d1> + .byte 68,15,40,45,167,41,0,0 // movaps 0x29a7(%rip),%xmm13 # 53b0 <_sk_callback_sse2+0x7c5> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,39,41,0,0 // mulps 0x2927(%rip),%xmm13 # 5340 <_sk_callback_sse2+0x7e1> + .byte 68,15,89,45,167,41,0,0 // mulps 0x29a7(%rip),%xmm13 # 53c0 <_sk_callback_sse2+0x7d5> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -30075,15 +30302,15 @@ _sk_parametric_b_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,167,40,0,0 // mulps 0x28a7(%rip),%xmm9 # 5350 <_sk_callback_sse2+0x7f1> - .byte 68,15,84,21,175,40,0,0 // andps 0x28af(%rip),%xmm10 # 5360 <_sk_callback_sse2+0x801> - .byte 68,15,86,21,183,40,0,0 // orps 0x28b7(%rip),%xmm10 # 5370 <_sk_callback_sse2+0x811> - .byte 68,15,88,13,191,40,0,0 // addps 0x28bf(%rip),%xmm9 # 5380 <_sk_callback_sse2+0x821> - .byte 68,15,40,37,199,40,0,0 // movaps 0x28c7(%rip),%xmm12 # 5390 <_sk_callback_sse2+0x831> + .byte 68,15,89,13,39,41,0,0 // mulps 0x2927(%rip),%xmm9 # 53d0 <_sk_callback_sse2+0x7e5> + .byte 68,15,84,21,47,41,0,0 // andps 0x292f(%rip),%xmm10 # 53e0 <_sk_callback_sse2+0x7f5> + .byte 68,15,86,21,55,41,0,0 // orps 0x2937(%rip),%xmm10 # 53f0 <_sk_callback_sse2+0x805> + .byte 68,15,88,13,63,41,0,0 // addps 0x293f(%rip),%xmm9 # 5400 <_sk_callback_sse2+0x815> + .byte 68,15,40,37,71,41,0,0 // movaps 0x2947(%rip),%xmm12 # 5410 <_sk_callback_sse2+0x825> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,199,40,0,0 // addps 0x28c7(%rip),%xmm10 # 53a0 <_sk_callback_sse2+0x841> - .byte 68,15,40,37,207,40,0,0 // movaps 0x28cf(%rip),%xmm12 # 53b0 <_sk_callback_sse2+0x851> + .byte 68,15,88,21,71,41,0,0 // addps 0x2947(%rip),%xmm10 # 5420 <_sk_callback_sse2+0x835> + .byte 68,15,40,37,79,41,0,0 // movaps 0x294f(%rip),%xmm12 # 5430 <_sk_callback_sse2+0x845> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -30091,22 +30318,22 @@ _sk_parametric_b_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,185,40,0,0 // movaps 0x28b9(%rip),%xmm10 # 53c0 <_sk_callback_sse2+0x861> + .byte 68,15,40,21,57,41,0,0 // movaps 0x2939(%rip),%xmm10 # 5440 <_sk_callback_sse2+0x855> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,173,40,0,0 // addps 0x28ad(%rip),%xmm9 # 53d0 <_sk_callback_sse2+0x871> - .byte 68,15,40,37,181,40,0,0 // movaps 0x28b5(%rip),%xmm12 # 53e0 <_sk_callback_sse2+0x881> + .byte 68,15,88,13,45,41,0,0 // addps 0x292d(%rip),%xmm9 # 5450 <_sk_callback_sse2+0x865> + .byte 68,15,40,37,53,41,0,0 // movaps 0x2935(%rip),%xmm12 # 5460 <_sk_callback_sse2+0x875> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,181,40,0,0 // movaps 0x28b5(%rip),%xmm12 # 53f0 <_sk_callback_sse2+0x891> + .byte 68,15,40,37,53,41,0,0 // movaps 0x2935(%rip),%xmm12 # 5470 <_sk_callback_sse2+0x885> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,185,40,0,0 // movaps 0x28b9(%rip),%xmm13 # 5400 <_sk_callback_sse2+0x8a1> + .byte 68,15,40,45,57,41,0,0 // movaps 0x2939(%rip),%xmm13 # 5480 <_sk_callback_sse2+0x895> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,185,40,0,0 // mulps 0x28b9(%rip),%xmm13 # 5410 <_sk_callback_sse2+0x8b1> + .byte 68,15,89,45,57,41,0,0 // mulps 0x2939(%rip),%xmm13 # 5490 <_sk_callback_sse2+0x8a5> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -30142,15 +30369,15 @@ _sk_parametric_a_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,57,40,0,0 // mulps 0x2839(%rip),%xmm9 # 5420 <_sk_callback_sse2+0x8c1> - .byte 68,15,84,21,65,40,0,0 // andps 0x2841(%rip),%xmm10 # 5430 <_sk_callback_sse2+0x8d1> - .byte 68,15,86,21,73,40,0,0 // orps 0x2849(%rip),%xmm10 # 5440 <_sk_callback_sse2+0x8e1> - .byte 68,15,88,13,81,40,0,0 // addps 0x2851(%rip),%xmm9 # 5450 <_sk_callback_sse2+0x8f1> - .byte 68,15,40,37,89,40,0,0 // movaps 0x2859(%rip),%xmm12 # 5460 <_sk_callback_sse2+0x901> + .byte 68,15,89,13,185,40,0,0 // mulps 0x28b9(%rip),%xmm9 # 54a0 <_sk_callback_sse2+0x8b5> + .byte 68,15,84,21,193,40,0,0 // andps 0x28c1(%rip),%xmm10 # 54b0 <_sk_callback_sse2+0x8c5> + .byte 68,15,86,21,201,40,0,0 // orps 0x28c9(%rip),%xmm10 # 54c0 <_sk_callback_sse2+0x8d5> + .byte 68,15,88,13,209,40,0,0 // addps 0x28d1(%rip),%xmm9 # 54d0 <_sk_callback_sse2+0x8e5> + .byte 68,15,40,37,217,40,0,0 // movaps 0x28d9(%rip),%xmm12 # 54e0 <_sk_callback_sse2+0x8f5> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,89,40,0,0 // addps 0x2859(%rip),%xmm10 # 5470 <_sk_callback_sse2+0x911> - .byte 68,15,40,37,97,40,0,0 // movaps 0x2861(%rip),%xmm12 # 5480 <_sk_callback_sse2+0x921> + .byte 68,15,88,21,217,40,0,0 // addps 0x28d9(%rip),%xmm10 # 54f0 <_sk_callback_sse2+0x905> + .byte 68,15,40,37,225,40,0,0 // movaps 0x28e1(%rip),%xmm12 # 5500 <_sk_callback_sse2+0x915> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -30158,22 +30385,22 @@ _sk_parametric_a_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,75,40,0,0 // movaps 0x284b(%rip),%xmm10 # 5490 <_sk_callback_sse2+0x931> + .byte 68,15,40,21,203,40,0,0 // movaps 0x28cb(%rip),%xmm10 # 5510 <_sk_callback_sse2+0x925> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,63,40,0,0 // addps 0x283f(%rip),%xmm9 # 54a0 <_sk_callback_sse2+0x941> - .byte 68,15,40,37,71,40,0,0 // movaps 0x2847(%rip),%xmm12 # 54b0 <_sk_callback_sse2+0x951> + .byte 68,15,88,13,191,40,0,0 // addps 0x28bf(%rip),%xmm9 # 5520 <_sk_callback_sse2+0x935> + .byte 68,15,40,37,199,40,0,0 // movaps 0x28c7(%rip),%xmm12 # 5530 <_sk_callback_sse2+0x945> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,71,40,0,0 // movaps 0x2847(%rip),%xmm12 # 54c0 <_sk_callback_sse2+0x961> + .byte 68,15,40,37,199,40,0,0 // movaps 0x28c7(%rip),%xmm12 # 5540 <_sk_callback_sse2+0x955> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,75,40,0,0 // movaps 0x284b(%rip),%xmm13 # 54d0 <_sk_callback_sse2+0x971> + .byte 68,15,40,45,203,40,0,0 // movaps 0x28cb(%rip),%xmm13 # 5550 <_sk_callback_sse2+0x965> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,75,40,0,0 // mulps 0x284b(%rip),%xmm13 # 54e0 <_sk_callback_sse2+0x981> + .byte 68,15,89,45,203,40,0,0 // mulps 0x28cb(%rip),%xmm13 # 5560 <_sk_callback_sse2+0x975> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -30190,29 +30417,29 @@ HIDDEN _sk_lab_to_xyz_sse2 .globl _sk_lab_to_xyz_sse2 FUNCTION(_sk_lab_to_xyz_sse2) _sk_lab_to_xyz_sse2: - .byte 15,89,5,40,40,0,0 // mulps 0x2828(%rip),%xmm0 # 54f0 <_sk_callback_sse2+0x991> - .byte 68,15,40,5,48,40,0,0 // movaps 0x2830(%rip),%xmm8 # 5500 <_sk_callback_sse2+0x9a1> + .byte 15,89,5,168,40,0,0 // mulps 0x28a8(%rip),%xmm0 # 5570 <_sk_callback_sse2+0x985> + .byte 68,15,40,5,176,40,0,0 // movaps 0x28b0(%rip),%xmm8 # 5580 <_sk_callback_sse2+0x995> .byte 65,15,89,200 // mulps %xmm8,%xmm1 - .byte 68,15,40,13,52,40,0,0 // movaps 0x2834(%rip),%xmm9 # 5510 <_sk_callback_sse2+0x9b1> + .byte 68,15,40,13,180,40,0,0 // movaps 0x28b4(%rip),%xmm9 # 5590 <_sk_callback_sse2+0x9a5> .byte 65,15,88,201 // addps %xmm9,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 65,15,88,209 // addps %xmm9,%xmm2 - .byte 15,88,5,49,40,0,0 // addps 0x2831(%rip),%xmm0 # 5520 <_sk_callback_sse2+0x9c1> - .byte 15,89,5,58,40,0,0 // mulps 0x283a(%rip),%xmm0 # 5530 <_sk_callback_sse2+0x9d1> - .byte 15,89,13,67,40,0,0 // mulps 0x2843(%rip),%xmm1 # 5540 <_sk_callback_sse2+0x9e1> + .byte 15,88,5,177,40,0,0 // addps 0x28b1(%rip),%xmm0 # 55a0 <_sk_callback_sse2+0x9b5> + .byte 15,89,5,186,40,0,0 // mulps 0x28ba(%rip),%xmm0 # 55b0 <_sk_callback_sse2+0x9c5> + .byte 15,89,13,195,40,0,0 // mulps 0x28c3(%rip),%xmm1 # 55c0 <_sk_callback_sse2+0x9d5> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,21,73,40,0,0 // mulps 0x2849(%rip),%xmm2 # 5550 <_sk_callback_sse2+0x9f1> + .byte 15,89,21,201,40,0,0 // mulps 0x28c9(%rip),%xmm2 # 55d0 <_sk_callback_sse2+0x9e5> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 68,15,92,202 // subps %xmm2,%xmm9 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 .byte 68,15,89,225 // mulps %xmm1,%xmm12 - .byte 15,40,21,62,40,0,0 // movaps 0x283e(%rip),%xmm2 # 5560 <_sk_callback_sse2+0xa01> + .byte 15,40,21,190,40,0,0 // movaps 0x28be(%rip),%xmm2 # 55e0 <_sk_callback_sse2+0x9f5> .byte 68,15,40,194 // movaps %xmm2,%xmm8 .byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8 - .byte 68,15,40,21,61,40,0,0 // movaps 0x283d(%rip),%xmm10 # 5570 <_sk_callback_sse2+0xa11> + .byte 68,15,40,21,189,40,0,0 // movaps 0x28bd(%rip),%xmm10 # 55f0 <_sk_callback_sse2+0xa05> .byte 65,15,88,202 // addps %xmm10,%xmm1 - .byte 68,15,40,29,65,40,0,0 // movaps 0x2841(%rip),%xmm11 # 5580 <_sk_callback_sse2+0xa21> + .byte 68,15,40,29,193,40,0,0 // movaps 0x28c1(%rip),%xmm11 # 5600 <_sk_callback_sse2+0xa15> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 69,15,84,224 // andps %xmm8,%xmm12 .byte 68,15,85,193 // andnps %xmm1,%xmm8 @@ -30236,8 +30463,8 @@ _sk_lab_to_xyz_sse2: .byte 15,84,194 // andps %xmm2,%xmm0 .byte 65,15,85,209 // andnps %xmm9,%xmm2 .byte 15,86,208 // orps %xmm0,%xmm2 - .byte 68,15,89,5,241,39,0,0 // mulps 0x27f1(%rip),%xmm8 # 5590 <_sk_callback_sse2+0xa31> - .byte 15,89,21,250,39,0,0 // mulps 0x27fa(%rip),%xmm2 # 55a0 <_sk_callback_sse2+0xa41> + .byte 68,15,89,5,113,40,0,0 // mulps 0x2871(%rip),%xmm8 # 5610 <_sk_callback_sse2+0xa25> + .byte 15,89,21,122,40,0,0 // mulps 0x287a(%rip),%xmm2 # 5620 <_sk_callback_sse2+0xa35> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -30253,7 +30480,7 @@ _sk_load_a8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,226,39,0,0 // mulps 0x27e2(%rip),%xmm3 # 55b0 <_sk_callback_sse2+0xa51> + .byte 15,89,29,98,40,0,0 // mulps 0x2862(%rip),%xmm3 # 5630 <_sk_callback_sse2+0xa45> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -30298,7 +30525,7 @@ _sk_gather_a8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,81,39,0,0 // mulps 0x2751(%rip),%xmm3 # 55c0 <_sk_callback_sse2+0xa61> + .byte 15,89,29,209,39,0,0 // mulps 0x27d1(%rip),%xmm3 # 5640 <_sk_callback_sse2+0xa55> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -30311,7 +30538,7 @@ FUNCTION(_sk_store_a8_sse2) _sk_store_a8_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,69,39,0,0 // movaps 0x2745(%rip),%xmm8 # 55d0 <_sk_callback_sse2+0xa71> + .byte 68,15,40,5,197,39,0,0 // movaps 0x27c5(%rip),%xmm8 # 5650 <_sk_callback_sse2+0xa65> .byte 68,15,89,195 // mulps %xmm3,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 .byte 102,65,15,114,240,16 // pslld $0x10,%xmm8 @@ -30333,9 +30560,9 @@ _sk_load_g8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,12,39,0,0 // mulps 0x270c(%rip),%xmm0 # 55e0 <_sk_callback_sse2+0xa81> + .byte 15,89,5,140,39,0,0 // mulps 0x278c(%rip),%xmm0 # 5660 <_sk_callback_sse2+0xa75> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,19,39,0,0 // movaps 0x2713(%rip),%xmm3 # 55f0 <_sk_callback_sse2+0xa91> + .byte 15,40,29,147,39,0,0 // movaps 0x2793(%rip),%xmm3 # 5670 <_sk_callback_sse2+0xa85> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,224 // jmpq *%rax @@ -30378,9 +30605,9 @@ _sk_gather_g8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,136,38,0,0 // mulps 0x2688(%rip),%xmm0 # 5600 <_sk_callback_sse2+0xaa1> + .byte 15,89,5,8,39,0,0 // mulps 0x2708(%rip),%xmm0 # 5680 <_sk_callback_sse2+0xa95> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,143,38,0,0 // movaps 0x268f(%rip),%xmm3 # 5610 <_sk_callback_sse2+0xab1> + .byte 15,40,29,15,39,0,0 // movaps 0x270f(%rip),%xmm3 # 5690 <_sk_callback_sse2+0xaa5> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,224 // jmpq *%rax @@ -30443,11 +30670,11 @@ _sk_gather_i8_sse2: .byte 102,67,15,110,12,136 // movd (%r8,%r9,4),%xmm1 .byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9 .byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9 - .byte 102,15,111,21,174,37,0,0 // movdqa 0x25ae(%rip),%xmm2 # 5620 <_sk_callback_sse2+0xac1> + .byte 102,15,111,21,46,38,0,0 // movdqa 0x262e(%rip),%xmm2 # 56a0 <_sk_callback_sse2+0xab5> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,170,37,0,0 // movaps 0x25aa(%rip),%xmm8 # 5630 <_sk_callback_sse2+0xad1> + .byte 68,15,40,5,42,38,0,0 // movaps 0x262a(%rip),%xmm8 # 56b0 <_sk_callback_sse2+0xac5> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -30474,19 +30701,19 @@ _sk_load_565_sse2: .byte 243,15,126,20,120 // movq (%rax,%rdi,2),%xmm2 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,5,96,37,0,0 // movdqa 0x2560(%rip),%xmm0 # 5640 <_sk_callback_sse2+0xae1> + .byte 102,15,111,5,224,37,0,0 // movdqa 0x25e0(%rip),%xmm0 # 56c0 <_sk_callback_sse2+0xad5> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,98,37,0,0 // mulps 0x2562(%rip),%xmm0 # 5650 <_sk_callback_sse2+0xaf1> - .byte 102,15,111,13,106,37,0,0 // movdqa 0x256a(%rip),%xmm1 # 5660 <_sk_callback_sse2+0xb01> + .byte 15,89,5,226,37,0,0 // mulps 0x25e2(%rip),%xmm0 # 56d0 <_sk_callback_sse2+0xae5> + .byte 102,15,111,13,234,37,0,0 // movdqa 0x25ea(%rip),%xmm1 # 56e0 <_sk_callback_sse2+0xaf5> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,108,37,0,0 // mulps 0x256c(%rip),%xmm1 # 5670 <_sk_callback_sse2+0xb11> - .byte 102,15,219,21,116,37,0,0 // pand 0x2574(%rip),%xmm2 # 5680 <_sk_callback_sse2+0xb21> + .byte 15,89,13,236,37,0,0 // mulps 0x25ec(%rip),%xmm1 # 56f0 <_sk_callback_sse2+0xb05> + .byte 102,15,219,21,244,37,0,0 // pand 0x25f4(%rip),%xmm2 # 5700 <_sk_callback_sse2+0xb15> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,122,37,0,0 // mulps 0x257a(%rip),%xmm2 # 5690 <_sk_callback_sse2+0xb31> + .byte 15,89,21,250,37,0,0 // mulps 0x25fa(%rip),%xmm2 # 5710 <_sk_callback_sse2+0xb25> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,129,37,0,0 // movaps 0x2581(%rip),%xmm3 # 56a0 <_sk_callback_sse2+0xb41> + .byte 15,40,29,1,38,0,0 // movaps 0x2601(%rip),%xmm3 # 5720 <_sk_callback_sse2+0xb35> .byte 255,224 // jmpq *%rax HIDDEN _sk_gather_565_sse2 @@ -30521,19 +30748,19 @@ _sk_gather_565_sse2: .byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,5,10,37,0,0 // movdqa 0x250a(%rip),%xmm0 # 56b0 <_sk_callback_sse2+0xb51> + .byte 102,15,111,5,138,37,0,0 // movdqa 0x258a(%rip),%xmm0 # 5730 <_sk_callback_sse2+0xb45> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,12,37,0,0 // mulps 0x250c(%rip),%xmm0 # 56c0 <_sk_callback_sse2+0xb61> - .byte 102,15,111,13,20,37,0,0 // movdqa 0x2514(%rip),%xmm1 # 56d0 <_sk_callback_sse2+0xb71> + .byte 15,89,5,140,37,0,0 // mulps 0x258c(%rip),%xmm0 # 5740 <_sk_callback_sse2+0xb55> + .byte 102,15,111,13,148,37,0,0 // movdqa 0x2594(%rip),%xmm1 # 5750 <_sk_callback_sse2+0xb65> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,22,37,0,0 // mulps 0x2516(%rip),%xmm1 # 56e0 <_sk_callback_sse2+0xb81> - .byte 102,15,219,21,30,37,0,0 // pand 0x251e(%rip),%xmm2 # 56f0 <_sk_callback_sse2+0xb91> + .byte 15,89,13,150,37,0,0 // mulps 0x2596(%rip),%xmm1 # 5760 <_sk_callback_sse2+0xb75> + .byte 102,15,219,21,158,37,0,0 // pand 0x259e(%rip),%xmm2 # 5770 <_sk_callback_sse2+0xb85> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,36,37,0,0 // mulps 0x2524(%rip),%xmm2 # 5700 <_sk_callback_sse2+0xba1> + .byte 15,89,21,164,37,0,0 // mulps 0x25a4(%rip),%xmm2 # 5780 <_sk_callback_sse2+0xb95> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,43,37,0,0 // movaps 0x252b(%rip),%xmm3 # 5710 <_sk_callback_sse2+0xbb1> + .byte 15,40,29,171,37,0,0 // movaps 0x25ab(%rip),%xmm3 # 5790 <_sk_callback_sse2+0xba5> .byte 255,224 // jmpq *%rax HIDDEN _sk_store_565_sse2 @@ -30542,12 +30769,12 @@ FUNCTION(_sk_store_565_sse2) _sk_store_565_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,44,37,0,0 // movaps 0x252c(%rip),%xmm8 # 5720 <_sk_callback_sse2+0xbc1> + .byte 68,15,40,5,172,37,0,0 // movaps 0x25ac(%rip),%xmm8 # 57a0 <_sk_callback_sse2+0xbb5> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 .byte 102,65,15,114,241,11 // pslld $0xb,%xmm9 - .byte 68,15,40,21,33,37,0,0 // movaps 0x2521(%rip),%xmm10 # 5730 <_sk_callback_sse2+0xbd1> + .byte 68,15,40,21,161,37,0,0 // movaps 0x25a1(%rip),%xmm10 # 57b0 <_sk_callback_sse2+0xbc5> .byte 68,15,89,209 // mulps %xmm1,%xmm10 .byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10 .byte 102,65,15,114,242,5 // pslld $0x5,%xmm10 @@ -30571,21 +30798,21 @@ _sk_load_4444_sse2: .byte 243,15,126,28,120 // movq (%rax,%rdi,2),%xmm3 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,5,218,36,0,0 // movdqa 0x24da(%rip),%xmm0 # 5740 <_sk_callback_sse2+0xbe1> + .byte 102,15,111,5,90,37,0,0 // movdqa 0x255a(%rip),%xmm0 # 57c0 <_sk_callback_sse2+0xbd5> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,220,36,0,0 // mulps 0x24dc(%rip),%xmm0 # 5750 <_sk_callback_sse2+0xbf1> - .byte 102,15,111,13,228,36,0,0 // movdqa 0x24e4(%rip),%xmm1 # 5760 <_sk_callback_sse2+0xc01> + .byte 15,89,5,92,37,0,0 // mulps 0x255c(%rip),%xmm0 # 57d0 <_sk_callback_sse2+0xbe5> + .byte 102,15,111,13,100,37,0,0 // movdqa 0x2564(%rip),%xmm1 # 57e0 <_sk_callback_sse2+0xbf5> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,230,36,0,0 // mulps 0x24e6(%rip),%xmm1 # 5770 <_sk_callback_sse2+0xc11> - .byte 102,15,111,21,238,36,0,0 // movdqa 0x24ee(%rip),%xmm2 # 5780 <_sk_callback_sse2+0xc21> + .byte 15,89,13,102,37,0,0 // mulps 0x2566(%rip),%xmm1 # 57f0 <_sk_callback_sse2+0xc05> + .byte 102,15,111,21,110,37,0,0 // movdqa 0x256e(%rip),%xmm2 # 5800 <_sk_callback_sse2+0xc15> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,240,36,0,0 // mulps 0x24f0(%rip),%xmm2 # 5790 <_sk_callback_sse2+0xc31> - .byte 102,15,219,29,248,36,0,0 // pand 0x24f8(%rip),%xmm3 # 57a0 <_sk_callback_sse2+0xc41> + .byte 15,89,21,112,37,0,0 // mulps 0x2570(%rip),%xmm2 # 5810 <_sk_callback_sse2+0xc25> + .byte 102,15,219,29,120,37,0,0 // pand 0x2578(%rip),%xmm3 # 5820 <_sk_callback_sse2+0xc35> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,254,36,0,0 // mulps 0x24fe(%rip),%xmm3 # 57b0 <_sk_callback_sse2+0xc51> + .byte 15,89,29,126,37,0,0 // mulps 0x257e(%rip),%xmm3 # 5830 <_sk_callback_sse2+0xc45> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -30621,21 +30848,21 @@ _sk_gather_4444_sse2: .byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,5,133,36,0,0 // movdqa 0x2485(%rip),%xmm0 # 57c0 <_sk_callback_sse2+0xc61> + .byte 102,15,111,5,5,37,0,0 // movdqa 0x2505(%rip),%xmm0 # 5840 <_sk_callback_sse2+0xc55> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,135,36,0,0 // mulps 0x2487(%rip),%xmm0 # 57d0 <_sk_callback_sse2+0xc71> - .byte 102,15,111,13,143,36,0,0 // movdqa 0x248f(%rip),%xmm1 # 57e0 <_sk_callback_sse2+0xc81> + .byte 15,89,5,7,37,0,0 // mulps 0x2507(%rip),%xmm0 # 5850 <_sk_callback_sse2+0xc65> + .byte 102,15,111,13,15,37,0,0 // movdqa 0x250f(%rip),%xmm1 # 5860 <_sk_callback_sse2+0xc75> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,145,36,0,0 // mulps 0x2491(%rip),%xmm1 # 57f0 <_sk_callback_sse2+0xc91> - .byte 102,15,111,21,153,36,0,0 // movdqa 0x2499(%rip),%xmm2 # 5800 <_sk_callback_sse2+0xca1> + .byte 15,89,13,17,37,0,0 // mulps 0x2511(%rip),%xmm1 # 5870 <_sk_callback_sse2+0xc85> + .byte 102,15,111,21,25,37,0,0 // movdqa 0x2519(%rip),%xmm2 # 5880 <_sk_callback_sse2+0xc95> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,155,36,0,0 // mulps 0x249b(%rip),%xmm2 # 5810 <_sk_callback_sse2+0xcb1> - .byte 102,15,219,29,163,36,0,0 // pand 0x24a3(%rip),%xmm3 # 5820 <_sk_callback_sse2+0xcc1> + .byte 15,89,21,27,37,0,0 // mulps 0x251b(%rip),%xmm2 # 5890 <_sk_callback_sse2+0xca5> + .byte 102,15,219,29,35,37,0,0 // pand 0x2523(%rip),%xmm3 # 58a0 <_sk_callback_sse2+0xcb5> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,169,36,0,0 // mulps 0x24a9(%rip),%xmm3 # 5830 <_sk_callback_sse2+0xcd1> + .byte 15,89,29,41,37,0,0 // mulps 0x2529(%rip),%xmm3 # 58b0 <_sk_callback_sse2+0xcc5> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -30645,7 +30872,7 @@ FUNCTION(_sk_store_4444_sse2) _sk_store_4444_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,168,36,0,0 // movaps 0x24a8(%rip),%xmm8 # 5840 <_sk_callback_sse2+0xce1> + .byte 68,15,40,5,40,37,0,0 // movaps 0x2528(%rip),%xmm8 # 58c0 <_sk_callback_sse2+0xcd5> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -30677,11 +30904,11 @@ _sk_load_8888_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 68,15,16,12,184 // movups (%rax,%rdi,4),%xmm9 - .byte 15,40,21,59,36,0,0 // movaps 0x243b(%rip),%xmm2 # 5850 <_sk_callback_sse2+0xcf1> + .byte 15,40,21,187,36,0,0 // movaps 0x24bb(%rip),%xmm2 # 58d0 <_sk_callback_sse2+0xce5> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,84,194 // andps %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,57,36,0,0 // movaps 0x2439(%rip),%xmm8 # 5860 <_sk_callback_sse2+0xd01> + .byte 68,15,40,5,185,36,0,0 // movaps 0x24b9(%rip),%xmm8 # 58e0 <_sk_callback_sse2+0xcf5> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,40,201 // movaps %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -30730,11 +30957,11 @@ _sk_gather_8888_sse2: .byte 102,67,15,110,12,129 // movd (%r9,%r8,4),%xmm1 .byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9 .byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9 - .byte 102,15,111,21,138,35,0,0 // movdqa 0x238a(%rip),%xmm2 # 5870 <_sk_callback_sse2+0xd11> + .byte 102,15,111,21,10,36,0,0 // movdqa 0x240a(%rip),%xmm2 # 58f0 <_sk_callback_sse2+0xd05> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,134,35,0,0 // movaps 0x2386(%rip),%xmm8 # 5880 <_sk_callback_sse2+0xd21> + .byte 68,15,40,5,6,36,0,0 // movaps 0x2406(%rip),%xmm8 # 5900 <_sk_callback_sse2+0xd15> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -30758,7 +30985,7 @@ FUNCTION(_sk_store_8888_sse2) _sk_store_8888_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,73,35,0,0 // movaps 0x2349(%rip),%xmm8 # 5890 <_sk_callback_sse2+0xd31> + .byte 68,15,40,5,201,35,0,0 // movaps 0x23c9(%rip),%xmm8 # 5910 <_sk_callback_sse2+0xd25> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -30797,7 +31024,7 @@ _sk_load_f16_sse2: .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 .byte 102,65,15,111,206 // movdqa %xmm14,%xmm1 .byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1 - .byte 102,68,15,111,13,185,34,0,0 // movdqa 0x22b9(%rip),%xmm9 # 58a0 <_sk_callback_sse2+0xd41> + .byte 102,68,15,111,13,57,35,0,0 // movdqa 0x2339(%rip),%xmm9 # 5920 <_sk_callback_sse2+0xd35> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,193 // pand %xmm9,%xmm0 .byte 102,15,239,200 // pxor %xmm0,%xmm1 @@ -30805,11 +31032,11 @@ _sk_load_f16_sse2: .byte 102,68,15,111,233 // movdqa %xmm1,%xmm13 .byte 102,65,15,114,245,13 // pslld $0xd,%xmm13 .byte 102,68,15,235,232 // por %xmm0,%xmm13 - .byte 102,68,15,111,29,158,34,0,0 // movdqa 0x229e(%rip),%xmm11 # 58b0 <_sk_callback_sse2+0xd51> + .byte 102,68,15,111,29,30,35,0,0 // movdqa 0x231e(%rip),%xmm11 # 5930 <_sk_callback_sse2+0xd45> .byte 102,69,15,254,235 // paddd %xmm11,%xmm13 - .byte 102,68,15,111,37,160,34,0,0 // movdqa 0x22a0(%rip),%xmm12 # 58c0 <_sk_callback_sse2+0xd61> + .byte 102,68,15,111,37,32,35,0,0 // movdqa 0x2320(%rip),%xmm12 # 5940 <_sk_callback_sse2+0xd55> .byte 102,65,15,239,204 // pxor %xmm12,%xmm1 - .byte 102,15,111,29,163,34,0,0 // movdqa 0x22a3(%rip),%xmm3 # 58d0 <_sk_callback_sse2+0xd71> + .byte 102,15,111,29,35,35,0,0 // movdqa 0x2323(%rip),%xmm3 # 5950 <_sk_callback_sse2+0xd65> .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0 .byte 102,65,15,223,197 // pandn %xmm13,%xmm0 @@ -30895,7 +31122,7 @@ _sk_gather_f16_sse2: .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 .byte 102,65,15,111,206 // movdqa %xmm14,%xmm1 .byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1 - .byte 102,68,15,111,13,49,33,0,0 // movdqa 0x2131(%rip),%xmm9 # 58e0 <_sk_callback_sse2+0xd81> + .byte 102,68,15,111,13,177,33,0,0 // movdqa 0x21b1(%rip),%xmm9 # 5960 <_sk_callback_sse2+0xd75> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,193 // pand %xmm9,%xmm0 .byte 102,15,239,200 // pxor %xmm0,%xmm1 @@ -30903,11 +31130,11 @@ _sk_gather_f16_sse2: .byte 102,68,15,111,233 // movdqa %xmm1,%xmm13 .byte 102,65,15,114,245,13 // pslld $0xd,%xmm13 .byte 102,68,15,235,232 // por %xmm0,%xmm13 - .byte 102,68,15,111,29,22,33,0,0 // movdqa 0x2116(%rip),%xmm11 # 58f0 <_sk_callback_sse2+0xd91> + .byte 102,68,15,111,29,150,33,0,0 // movdqa 0x2196(%rip),%xmm11 # 5970 <_sk_callback_sse2+0xd85> .byte 102,69,15,254,235 // paddd %xmm11,%xmm13 - .byte 102,68,15,111,37,24,33,0,0 // movdqa 0x2118(%rip),%xmm12 # 5900 <_sk_callback_sse2+0xda1> + .byte 102,68,15,111,37,152,33,0,0 // movdqa 0x2198(%rip),%xmm12 # 5980 <_sk_callback_sse2+0xd95> .byte 102,65,15,239,204 // pxor %xmm12,%xmm1 - .byte 102,15,111,29,27,33,0,0 // movdqa 0x211b(%rip),%xmm3 # 5910 <_sk_callback_sse2+0xdb1> + .byte 102,15,111,29,155,33,0,0 // movdqa 0x219b(%rip),%xmm3 # 5990 <_sk_callback_sse2+0xda5> .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0 .byte 102,65,15,223,197 // pandn %xmm13,%xmm0 @@ -30960,17 +31187,17 @@ FUNCTION(_sk_store_f16_sse2) _sk_store_f16_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 102,68,15,111,21,67,32,0,0 // movdqa 0x2043(%rip),%xmm10 # 5920 <_sk_callback_sse2+0xdc1> + .byte 102,68,15,111,21,195,32,0,0 // movdqa 0x20c3(%rip),%xmm10 # 59a0 <_sk_callback_sse2+0xdb5> .byte 102,68,15,111,224 // movdqa %xmm0,%xmm12 .byte 102,68,15,111,232 // movdqa %xmm0,%xmm13 .byte 102,69,15,219,234 // pand %xmm10,%xmm13 .byte 102,69,15,239,229 // pxor %xmm13,%xmm12 - .byte 102,68,15,111,13,54,32,0,0 // movdqa 0x2036(%rip),%xmm9 # 5930 <_sk_callback_sse2+0xdd1> + .byte 102,68,15,111,13,182,32,0,0 // movdqa 0x20b6(%rip),%xmm9 # 59b0 <_sk_callback_sse2+0xdc5> .byte 102,65,15,114,213,16 // psrld $0x10,%xmm13 .byte 102,69,15,111,193 // movdqa %xmm9,%xmm8 .byte 102,69,15,102,196 // pcmpgtd %xmm12,%xmm8 .byte 102,65,15,114,212,13 // psrld $0xd,%xmm12 - .byte 102,68,15,111,29,39,32,0,0 // movdqa 0x2027(%rip),%xmm11 # 5940 <_sk_callback_sse2+0xde1> + .byte 102,68,15,111,29,167,32,0,0 // movdqa 0x20a7(%rip),%xmm11 # 59c0 <_sk_callback_sse2+0xdd5> .byte 102,69,15,235,235 // por %xmm11,%xmm13 .byte 102,69,15,254,236 // paddd %xmm12,%xmm13 .byte 102,65,15,114,245,16 // pslld $0x10,%xmm13 @@ -31049,7 +31276,7 @@ _sk_load_u16_be_sse2: .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1 .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0 - .byte 68,15,40,5,197,30,0,0 // movaps 0x1ec5(%rip),%xmm8 # 5950 <_sk_callback_sse2+0xdf1> + .byte 68,15,40,5,69,31,0,0 // movaps 0x1f45(%rip),%xmm8 # 59d0 <_sk_callback_sse2+0xde5> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -31102,7 +31329,7 @@ _sk_load_rgb_u16_be_sse2: .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,65,15,97,192 // punpcklwd %xmm8,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,13,1,30,0,0 // movaps 0x1e01(%rip),%xmm9 # 5960 <_sk_callback_sse2+0xe01> + .byte 68,15,40,13,129,30,0,0 // movaps 0x1e81(%rip),%xmm9 # 59e0 <_sk_callback_sse2+0xdf5> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -31119,7 +31346,7 @@ _sk_load_rgb_u16_be_sse2: .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,200,29,0,0 // movaps 0x1dc8(%rip),%xmm3 # 5970 <_sk_callback_sse2+0xe11> + .byte 15,40,29,72,30,0,0 // movaps 0x1e48(%rip),%xmm3 # 59f0 <_sk_callback_sse2+0xe05> .byte 255,224 // jmpq *%rax HIDDEN _sk_store_u16_be_sse2 @@ -31128,7 +31355,7 @@ FUNCTION(_sk_store_u16_be_sse2) _sk_store_u16_be_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,13,201,29,0,0 // movaps 0x1dc9(%rip),%xmm9 # 5980 <_sk_callback_sse2+0xe21> + .byte 68,15,40,13,73,30,0,0 // movaps 0x1e49(%rip),%xmm9 # 5a00 <_sk_callback_sse2+0xe15> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 @@ -31274,7 +31501,7 @@ _sk_repeat_x_sse2: .byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10 .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,84,13,201,27,0,0 // andps 0x1bc9(%rip),%xmm9 # 5990 <_sk_callback_sse2+0xe31> + .byte 68,15,84,13,73,28,0,0 // andps 0x1c49(%rip),%xmm9 # 5a10 <_sk_callback_sse2+0xe25> .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 .byte 65,15,92,194 // subps %xmm10,%xmm0 @@ -31294,7 +31521,7 @@ _sk_repeat_y_sse2: .byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10 .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,84,13,155,27,0,0 // andps 0x1b9b(%rip),%xmm9 # 59a0 <_sk_callback_sse2+0xe41> + .byte 68,15,84,13,27,28,0,0 // andps 0x1c1b(%rip),%xmm9 # 5a20 <_sk_callback_sse2+0xe35> .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 .byte 65,15,92,202 // subps %xmm10,%xmm1 @@ -31318,7 +31545,7 @@ _sk_mirror_x_sse2: .byte 243,69,15,91,218 // cvttps2dq %xmm10,%xmm11 .byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11 .byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10 - .byte 68,15,84,21,91,27,0,0 // andps 0x1b5b(%rip),%xmm10 # 59b0 <_sk_callback_sse2+0xe51> + .byte 68,15,84,21,219,27,0,0 // andps 0x1bdb(%rip),%xmm10 # 5a30 <_sk_callback_sse2+0xe45> .byte 69,15,87,228 // xorps %xmm12,%xmm12 .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 69,15,89,216 // mulps %xmm8,%xmm11 @@ -31346,7 +31573,7 @@ _sk_mirror_y_sse2: .byte 243,69,15,91,218 // cvttps2dq %xmm10,%xmm11 .byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11 .byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10 - .byte 68,15,84,21,11,27,0,0 // andps 0x1b0b(%rip),%xmm10 # 59c0 <_sk_callback_sse2+0xe61> + .byte 68,15,84,21,139,27,0,0 // andps 0x1b8b(%rip),%xmm10 # 5a40 <_sk_callback_sse2+0xe55> .byte 69,15,87,228 // xorps %xmm12,%xmm12 .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 69,15,89,216 // mulps %xmm8,%xmm11 @@ -31358,15 +31585,62 @@ _sk_mirror_y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax +HIDDEN _sk_clamp_x_1_sse2 +.globl _sk_clamp_x_1_sse2 +FUNCTION(_sk_clamp_x_1_sse2) +_sk_clamp_x_1_sse2: + .byte 69,15,87,192 // xorps %xmm8,%xmm8 + .byte 68,15,95,192 // maxps %xmm0,%xmm8 + .byte 68,15,93,5,103,27,0,0 // minps 0x1b67(%rip),%xmm8 # 5a50 <_sk_callback_sse2+0xe65> + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 65,15,40,192 // movaps %xmm8,%xmm0 + .byte 255,224 // jmpq *%rax + +HIDDEN _sk_repeat_x_1_sse2 +.globl _sk_repeat_x_1_sse2 +FUNCTION(_sk_repeat_x_1_sse2) +_sk_repeat_x_1_sse2: + .byte 243,68,15,91,192 // cvttps2dq %xmm0,%xmm8 + .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 + .byte 68,15,40,200 // movaps %xmm0,%xmm9 + .byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9 + .byte 68,15,84,13,85,27,0,0 // andps 0x1b55(%rip),%xmm9 # 5a60 <_sk_callback_sse2+0xe75> + .byte 69,15,92,193 // subps %xmm9,%xmm8 + .byte 65,15,92,192 // subps %xmm8,%xmm0 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + +HIDDEN _sk_mirror_x_1_sse2 +.globl _sk_mirror_x_1_sse2 +FUNCTION(_sk_mirror_x_1_sse2) +_sk_mirror_x_1_sse2: + .byte 68,15,40,5,81,27,0,0 // movaps 0x1b51(%rip),%xmm8 # 5a70 <_sk_callback_sse2+0xe85> + .byte 65,15,88,192 // addps %xmm8,%xmm0 + .byte 68,15,40,13,85,27,0,0 // movaps 0x1b55(%rip),%xmm9 # 5a80 <_sk_callback_sse2+0xe95> + .byte 68,15,89,200 // mulps %xmm0,%xmm9 + .byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10 + .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 + .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 + .byte 68,15,84,13,75,27,0,0 // andps 0x1b4b(%rip),%xmm9 # 5a90 <_sk_callback_sse2+0xea5> + .byte 69,15,87,219 // xorps %xmm11,%xmm11 + .byte 69,15,92,209 // subps %xmm9,%xmm10 + .byte 69,15,88,210 // addps %xmm10,%xmm10 + .byte 65,15,92,194 // subps %xmm10,%xmm0 + .byte 65,15,88,192 // addps %xmm8,%xmm0 + .byte 68,15,92,216 // subps %xmm0,%xmm11 + .byte 65,15,84,195 // andps %xmm11,%xmm0 + .byte 72,173 // lods %ds:(%rsi),%rax + .byte 255,224 // jmpq *%rax + HIDDEN _sk_luminance_to_alpha_sse2 .globl _sk_luminance_to_alpha_sse2 FUNCTION(_sk_luminance_to_alpha_sse2) _sk_luminance_to_alpha_sse2: .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 15,89,5,237,26,0,0 // mulps 0x1aed(%rip),%xmm0 # 59d0 <_sk_callback_sse2+0xe71> - .byte 15,89,13,246,26,0,0 // mulps 0x1af6(%rip),%xmm1 # 59e0 <_sk_callback_sse2+0xe81> + .byte 15,89,5,49,27,0,0 // mulps 0x1b31(%rip),%xmm0 # 5aa0 <_sk_callback_sse2+0xeb5> + .byte 15,89,13,58,27,0,0 // mulps 0x1b3a(%rip),%xmm1 # 5ab0 <_sk_callback_sse2+0xec5> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,29,252,26,0,0 // mulps 0x1afc(%rip),%xmm3 # 59f0 <_sk_callback_sse2+0xe91> + .byte 15,89,29,64,27,0,0 // mulps 0x1b40(%rip),%xmm3 # 5ac0 <_sk_callback_sse2+0xed5> .byte 15,88,217 // addps %xmm1,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 @@ -31642,9 +31916,9 @@ _sk_evenly_spaced_gradient_sse2: .byte 72,139,8 // mov (%rax),%rcx .byte 76,139,88,8 // mov 0x8(%rax),%r11 .byte 72,255,201 // dec %rcx - .byte 120,7 // js 432d <_sk_evenly_spaced_gradient_sse2+0x15> + .byte 120,7 // js 43b9 <_sk_evenly_spaced_gradient_sse2+0x15> .byte 243,72,15,42,201 // cvtsi2ss %rcx,%xmm1 - .byte 235,21 // jmp 4342 <_sk_evenly_spaced_gradient_sse2+0x2a> + .byte 235,21 // jmp 43ce <_sk_evenly_spaced_gradient_sse2+0x2a> .byte 73,137,200 // mov %rcx,%r8 .byte 73,209,232 // shr %r8 .byte 131,225,1 // and $0x1,%ecx @@ -31744,12 +32018,12 @@ _sk_gradient_sse2: .byte 76,139,0 // mov (%rax),%r8 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,2 // cmp $0x2,%r8 - .byte 114,50 // jb 4505 <_sk_gradient_sse2+0x41> + .byte 114,50 // jb 4591 <_sk_gradient_sse2+0x41> .byte 72,139,72,72 // mov 0x48(%rax),%rcx .byte 73,255,200 // dec %r8 .byte 72,131,193,4 // add $0x4,%rcx .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 15,40,21,23,21,0,0 // movaps 0x1517(%rip),%xmm2 # 5a00 <_sk_callback_sse2+0xea1> + .byte 15,40,21,91,21,0,0 // movaps 0x155b(%rip),%xmm2 # 5ad0 <_sk_callback_sse2+0xee5> .byte 243,15,16,25 // movss (%rcx),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 @@ -31757,7 +32031,7 @@ _sk_gradient_sse2: .byte 102,15,254,203 // paddd %xmm3,%xmm1 .byte 72,131,193,4 // add $0x4,%rcx .byte 73,255,200 // dec %r8 - .byte 117,228 // jne 44e9 <_sk_gradient_sse2+0x25> + .byte 117,228 // jne 4575 <_sk_gradient_sse2+0x25> .byte 65,86 // push %r14 .byte 83 // push %rbx .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2 @@ -31897,29 +32171,29 @@ _sk_xy_to_unit_angle_sse2: .byte 69,15,94,220 // divps %xmm12,%xmm11 .byte 69,15,40,227 // movaps %xmm11,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 - .byte 68,15,40,45,217,18,0,0 // movaps 0x12d9(%rip),%xmm13 # 5a10 <_sk_callback_sse2+0xeb1> + .byte 68,15,40,45,29,19,0,0 // movaps 0x131d(%rip),%xmm13 # 5ae0 <_sk_callback_sse2+0xef5> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,221,18,0,0 // addps 0x12dd(%rip),%xmm13 # 5a20 <_sk_callback_sse2+0xec1> + .byte 68,15,88,45,33,19,0,0 // addps 0x1321(%rip),%xmm13 # 5af0 <_sk_callback_sse2+0xf05> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,225,18,0,0 // addps 0x12e1(%rip),%xmm13 # 5a30 <_sk_callback_sse2+0xed1> + .byte 68,15,88,45,37,19,0,0 // addps 0x1325(%rip),%xmm13 # 5b00 <_sk_callback_sse2+0xf15> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,229,18,0,0 // addps 0x12e5(%rip),%xmm13 # 5a40 <_sk_callback_sse2+0xee1> + .byte 68,15,88,45,41,19,0,0 // addps 0x1329(%rip),%xmm13 # 5b10 <_sk_callback_sse2+0xf25> .byte 69,15,89,235 // mulps %xmm11,%xmm13 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,40,21,228,18,0,0 // movaps 0x12e4(%rip),%xmm10 # 5a50 <_sk_callback_sse2+0xef1> + .byte 68,15,40,21,40,19,0,0 // movaps 0x1328(%rip),%xmm10 # 5b20 <_sk_callback_sse2+0xf35> .byte 69,15,92,213 // subps %xmm13,%xmm10 .byte 69,15,84,209 // andps %xmm9,%xmm10 .byte 69,15,85,205 // andnps %xmm13,%xmm9 .byte 69,15,86,202 // orps %xmm10,%xmm9 .byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8 - .byte 68,15,40,21,215,18,0,0 // movaps 0x12d7(%rip),%xmm10 # 5a60 <_sk_callback_sse2+0xf01> + .byte 68,15,40,21,27,19,0,0 // movaps 0x131b(%rip),%xmm10 # 5b30 <_sk_callback_sse2+0xf45> .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,84,208 // andps %xmm8,%xmm10 .byte 69,15,85,193 // andnps %xmm9,%xmm8 .byte 69,15,86,194 // orps %xmm10,%xmm8 .byte 68,15,40,201 // movaps %xmm1,%xmm9 .byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9 - .byte 68,15,40,21,198,18,0,0 // movaps 0x12c6(%rip),%xmm10 # 5a70 <_sk_callback_sse2+0xf11> + .byte 68,15,40,21,10,19,0,0 // movaps 0x130a(%rip),%xmm10 # 5b40 <_sk_callback_sse2+0xf55> .byte 69,15,92,208 // subps %xmm8,%xmm10 .byte 69,15,84,209 // andps %xmm9,%xmm10 .byte 69,15,85,200 // andnps %xmm8,%xmm9 @@ -31946,7 +32220,7 @@ HIDDEN _sk_save_xy_sse2 FUNCTION(_sk_save_xy_sse2) _sk_save_xy_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,152,18,0,0 // movaps 0x1298(%rip),%xmm8 # 5a80 <_sk_callback_sse2+0xf21> + .byte 68,15,40,5,220,18,0,0 // movaps 0x12dc(%rip),%xmm8 # 5b50 <_sk_callback_sse2+0xf65> .byte 15,17,0 // movups %xmm0,(%rax) .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,88,200 // addps %xmm8,%xmm9 @@ -31954,7 +32228,7 @@ _sk_save_xy_sse2: .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,40,217 // movaps %xmm9,%xmm11 .byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11 - .byte 68,15,40,37,131,18,0,0 // movaps 0x1283(%rip),%xmm12 # 5a90 <_sk_callback_sse2+0xf31> + .byte 68,15,40,37,199,18,0,0 // movaps 0x12c7(%rip),%xmm12 # 5b60 <_sk_callback_sse2+0xf75> .byte 69,15,84,220 // andps %xmm12,%xmm11 .byte 69,15,92,211 // subps %xmm11,%xmm10 .byte 69,15,92,202 // subps %xmm10,%xmm9 @@ -32001,8 +32275,8 @@ _sk_bilinear_nx_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,252,17,0,0 // addps 0x11fc(%rip),%xmm0 # 5aa0 <_sk_callback_sse2+0xf41> - .byte 68,15,40,13,4,18,0,0 // movaps 0x1204(%rip),%xmm9 # 5ab0 <_sk_callback_sse2+0xf51> + .byte 15,88,5,64,18,0,0 // addps 0x1240(%rip),%xmm0 # 5b70 <_sk_callback_sse2+0xf85> + .byte 68,15,40,13,72,18,0,0 // movaps 0x1248(%rip),%xmm9 # 5b80 <_sk_callback_sse2+0xf95> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -32015,7 +32289,7 @@ _sk_bilinear_px_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,243,17,0,0 // addps 0x11f3(%rip),%xmm0 # 5ac0 <_sk_callback_sse2+0xf61> + .byte 15,88,5,55,18,0,0 // addps 0x1237(%rip),%xmm0 # 5b90 <_sk_callback_sse2+0xfa5> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -32027,8 +32301,8 @@ _sk_bilinear_ny_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,229,17,0,0 // addps 0x11e5(%rip),%xmm1 # 5ad0 <_sk_callback_sse2+0xf71> - .byte 68,15,40,13,237,17,0,0 // movaps 0x11ed(%rip),%xmm9 # 5ae0 <_sk_callback_sse2+0xf81> + .byte 15,88,13,41,18,0,0 // addps 0x1229(%rip),%xmm1 # 5ba0 <_sk_callback_sse2+0xfb5> + .byte 68,15,40,13,49,18,0,0 // movaps 0x1231(%rip),%xmm9 # 5bb0 <_sk_callback_sse2+0xfc5> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -32041,7 +32315,7 @@ _sk_bilinear_py_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,219,17,0,0 // addps 0x11db(%rip),%xmm1 # 5af0 <_sk_callback_sse2+0xf91> + .byte 15,88,13,31,18,0,0 // addps 0x121f(%rip),%xmm1 # 5bc0 <_sk_callback_sse2+0xfd5> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -32053,13 +32327,13 @@ _sk_bicubic_n3x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,206,17,0,0 // addps 0x11ce(%rip),%xmm0 # 5b00 <_sk_callback_sse2+0xfa1> - .byte 68,15,40,13,214,17,0,0 // movaps 0x11d6(%rip),%xmm9 # 5b10 <_sk_callback_sse2+0xfb1> + .byte 15,88,5,18,18,0,0 // addps 0x1212(%rip),%xmm0 # 5bd0 <_sk_callback_sse2+0xfe5> + .byte 68,15,40,13,26,18,0,0 // movaps 0x121a(%rip),%xmm9 # 5be0 <_sk_callback_sse2+0xff5> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,210,17,0,0 // mulps 0x11d2(%rip),%xmm9 # 5b20 <_sk_callback_sse2+0xfc1> - .byte 68,15,88,13,218,17,0,0 // addps 0x11da(%rip),%xmm9 # 5b30 <_sk_callback_sse2+0xfd1> + .byte 68,15,89,13,22,18,0,0 // mulps 0x1216(%rip),%xmm9 # 5bf0 <_sk_callback_sse2+0x1005> + .byte 68,15,88,13,30,18,0,0 // addps 0x121e(%rip),%xmm9 # 5c00 <_sk_callback_sse2+0x1015> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -32072,16 +32346,16 @@ _sk_bicubic_n1x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,201,17,0,0 // addps 0x11c9(%rip),%xmm0 # 5b40 <_sk_callback_sse2+0xfe1> - .byte 68,15,40,13,209,17,0,0 // movaps 0x11d1(%rip),%xmm9 # 5b50 <_sk_callback_sse2+0xff1> + .byte 15,88,5,13,18,0,0 // addps 0x120d(%rip),%xmm0 # 5c10 <_sk_callback_sse2+0x1025> + .byte 68,15,40,13,21,18,0,0 // movaps 0x1215(%rip),%xmm9 # 5c20 <_sk_callback_sse2+0x1035> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,213,17,0,0 // movaps 0x11d5(%rip),%xmm8 # 5b60 <_sk_callback_sse2+0x1001> + .byte 68,15,40,5,25,18,0,0 // movaps 0x1219(%rip),%xmm8 # 5c30 <_sk_callback_sse2+0x1045> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,217,17,0,0 // addps 0x11d9(%rip),%xmm8 # 5b70 <_sk_callback_sse2+0x1011> + .byte 68,15,88,5,29,18,0,0 // addps 0x121d(%rip),%xmm8 # 5c40 <_sk_callback_sse2+0x1055> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,221,17,0,0 // addps 0x11dd(%rip),%xmm8 # 5b80 <_sk_callback_sse2+0x1021> + .byte 68,15,88,5,33,18,0,0 // addps 0x1221(%rip),%xmm8 # 5c50 <_sk_callback_sse2+0x1065> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,225,17,0,0 // addps 0x11e1(%rip),%xmm8 # 5b90 <_sk_callback_sse2+0x1031> + .byte 68,15,88,5,37,18,0,0 // addps 0x1225(%rip),%xmm8 # 5c60 <_sk_callback_sse2+0x1075> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -32091,17 +32365,17 @@ HIDDEN _sk_bicubic_p1x_sse2 FUNCTION(_sk_bicubic_p1x_sse2) _sk_bicubic_p1x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,219,17,0,0 // movaps 0x11db(%rip),%xmm8 # 5ba0 <_sk_callback_sse2+0x1041> + .byte 68,15,40,5,31,18,0,0 // movaps 0x121f(%rip),%xmm8 # 5c70 <_sk_callback_sse2+0x1085> .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,21,215,17,0,0 // movaps 0x11d7(%rip),%xmm10 # 5bb0 <_sk_callback_sse2+0x1051> + .byte 68,15,40,21,27,18,0,0 // movaps 0x121b(%rip),%xmm10 # 5c80 <_sk_callback_sse2+0x1095> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,219,17,0,0 // addps 0x11db(%rip),%xmm10 # 5bc0 <_sk_callback_sse2+0x1061> + .byte 68,15,88,21,31,18,0,0 // addps 0x121f(%rip),%xmm10 # 5c90 <_sk_callback_sse2+0x10a5> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,215,17,0,0 // addps 0x11d7(%rip),%xmm10 # 5bd0 <_sk_callback_sse2+0x1071> + .byte 68,15,88,21,27,18,0,0 // addps 0x121b(%rip),%xmm10 # 5ca0 <_sk_callback_sse2+0x10b5> .byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -32113,11 +32387,11 @@ _sk_bicubic_p3x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,202,17,0,0 // addps 0x11ca(%rip),%xmm0 # 5be0 <_sk_callback_sse2+0x1081> + .byte 15,88,5,14,18,0,0 // addps 0x120e(%rip),%xmm0 # 5cb0 <_sk_callback_sse2+0x10c5> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,202,17,0,0 // mulps 0x11ca(%rip),%xmm8 # 5bf0 <_sk_callback_sse2+0x1091> - .byte 68,15,88,5,210,17,0,0 // addps 0x11d2(%rip),%xmm8 # 5c00 <_sk_callback_sse2+0x10a1> + .byte 68,15,89,5,14,18,0,0 // mulps 0x120e(%rip),%xmm8 # 5cc0 <_sk_callback_sse2+0x10d5> + .byte 68,15,88,5,22,18,0,0 // addps 0x1216(%rip),%xmm8 # 5cd0 <_sk_callback_sse2+0x10e5> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -32130,13 +32404,13 @@ _sk_bicubic_n3y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,192,17,0,0 // addps 0x11c0(%rip),%xmm1 # 5c10 <_sk_callback_sse2+0x10b1> - .byte 68,15,40,13,200,17,0,0 // movaps 0x11c8(%rip),%xmm9 # 5c20 <_sk_callback_sse2+0x10c1> + .byte 15,88,13,4,18,0,0 // addps 0x1204(%rip),%xmm1 # 5ce0 <_sk_callback_sse2+0x10f5> + .byte 68,15,40,13,12,18,0,0 // movaps 0x120c(%rip),%xmm9 # 5cf0 <_sk_callback_sse2+0x1105> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,196,17,0,0 // mulps 0x11c4(%rip),%xmm9 # 5c30 <_sk_callback_sse2+0x10d1> - .byte 68,15,88,13,204,17,0,0 // addps 0x11cc(%rip),%xmm9 # 5c40 <_sk_callback_sse2+0x10e1> + .byte 68,15,89,13,8,18,0,0 // mulps 0x1208(%rip),%xmm9 # 5d00 <_sk_callback_sse2+0x1115> + .byte 68,15,88,13,16,18,0,0 // addps 0x1210(%rip),%xmm9 # 5d10 <_sk_callback_sse2+0x1125> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -32149,16 +32423,16 @@ _sk_bicubic_n1y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,186,17,0,0 // addps 0x11ba(%rip),%xmm1 # 5c50 <_sk_callback_sse2+0x10f1> - .byte 68,15,40,13,194,17,0,0 // movaps 0x11c2(%rip),%xmm9 # 5c60 <_sk_callback_sse2+0x1101> + .byte 15,88,13,254,17,0,0 // addps 0x11fe(%rip),%xmm1 # 5d20 <_sk_callback_sse2+0x1135> + .byte 68,15,40,13,6,18,0,0 // movaps 0x1206(%rip),%xmm9 # 5d30 <_sk_callback_sse2+0x1145> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,198,17,0,0 // movaps 0x11c6(%rip),%xmm8 # 5c70 <_sk_callback_sse2+0x1111> + .byte 68,15,40,5,10,18,0,0 // movaps 0x120a(%rip),%xmm8 # 5d40 <_sk_callback_sse2+0x1155> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,202,17,0,0 // addps 0x11ca(%rip),%xmm8 # 5c80 <_sk_callback_sse2+0x1121> + .byte 68,15,88,5,14,18,0,0 // addps 0x120e(%rip),%xmm8 # 5d50 <_sk_callback_sse2+0x1165> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,206,17,0,0 // addps 0x11ce(%rip),%xmm8 # 5c90 <_sk_callback_sse2+0x1131> + .byte 68,15,88,5,18,18,0,0 // addps 0x1212(%rip),%xmm8 # 5d60 <_sk_callback_sse2+0x1175> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,210,17,0,0 // addps 0x11d2(%rip),%xmm8 # 5ca0 <_sk_callback_sse2+0x1141> + .byte 68,15,88,5,22,18,0,0 // addps 0x1216(%rip),%xmm8 # 5d70 <_sk_callback_sse2+0x1185> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -32168,17 +32442,17 @@ HIDDEN _sk_bicubic_p1y_sse2 FUNCTION(_sk_bicubic_p1y_sse2) _sk_bicubic_p1y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,204,17,0,0 // movaps 0x11cc(%rip),%xmm8 # 5cb0 <_sk_callback_sse2+0x1151> + .byte 68,15,40,5,16,18,0,0 // movaps 0x1210(%rip),%xmm8 # 5d80 <_sk_callback_sse2+0x1195> .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9 .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 68,15,40,21,199,17,0,0 // movaps 0x11c7(%rip),%xmm10 # 5cc0 <_sk_callback_sse2+0x1161> + .byte 68,15,40,21,11,18,0,0 // movaps 0x120b(%rip),%xmm10 # 5d90 <_sk_callback_sse2+0x11a5> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,203,17,0,0 // addps 0x11cb(%rip),%xmm10 # 5cd0 <_sk_callback_sse2+0x1171> + .byte 68,15,88,21,15,18,0,0 // addps 0x120f(%rip),%xmm10 # 5da0 <_sk_callback_sse2+0x11b5> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,199,17,0,0 // addps 0x11c7(%rip),%xmm10 # 5ce0 <_sk_callback_sse2+0x1181> + .byte 68,15,88,21,11,18,0,0 // addps 0x120b(%rip),%xmm10 # 5db0 <_sk_callback_sse2+0x11c5> .byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -32190,11 +32464,11 @@ _sk_bicubic_p3y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,185,17,0,0 // addps 0x11b9(%rip),%xmm1 # 5cf0 <_sk_callback_sse2+0x1191> + .byte 15,88,13,253,17,0,0 // addps 0x11fd(%rip),%xmm1 # 5dc0 <_sk_callback_sse2+0x11d5> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,185,17,0,0 // mulps 0x11b9(%rip),%xmm8 # 5d00 <_sk_callback_sse2+0x11a1> - .byte 68,15,88,5,193,17,0,0 // addps 0x11c1(%rip),%xmm8 # 5d10 <_sk_callback_sse2+0x11b1> + .byte 68,15,89,5,253,17,0,0 // mulps 0x11fd(%rip),%xmm8 # 5dd0 <_sk_callback_sse2+0x11e5> + .byte 68,15,88,5,5,18,0,0 // addps 0x1205(%rip),%xmm8 # 5de0 <_sk_callback_sse2+0x11f5> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -32413,11 +32687,11 @@ BALIGN16 .byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%rdi) .byte 0,224 // add %ah,%al .byte 64,0,0 // add %al,(%rax) - .byte 224,64 // loopne 4e18 <.literal16+0x1d8> + .byte 224,64 // loopne 4e98 <.literal16+0x1d8> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 4e1c <.literal16+0x1dc> + .byte 224,64 // loopne 4e9c <.literal16+0x1dc> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 4e20 <.literal16+0x1e0> + .byte 224,64 // loopne 4ea0 <.literal16+0x1e0> .byte 154 // (bad) .byte 153 // cltd .byte 153 // cltd @@ -32437,13 +32711,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4e41 <.literal16+0x201> + .byte 71,225,61 // rex.RXB loope 4ec1 <.literal16+0x201> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4e45 <.literal16+0x205> + .byte 71,225,61 // rex.RXB loope 4ec5 <.literal16+0x205> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4e49 <.literal16+0x209> + .byte 71,225,61 // rex.RXB loope 4ec9 <.literal16+0x209> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4e4d <.literal16+0x20d> + .byte 71,225,61 // rex.RXB loope 4ecd <.literal16+0x20d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -32468,13 +32742,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4e81 <.literal16+0x241> + .byte 71,225,61 // rex.RXB loope 4f01 <.literal16+0x241> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4e85 <.literal16+0x245> + .byte 71,225,61 // rex.RXB loope 4f05 <.literal16+0x245> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4e89 <.literal16+0x249> + .byte 71,225,61 // rex.RXB loope 4f09 <.literal16+0x249> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4e8d <.literal16+0x24d> + .byte 71,225,61 // rex.RXB loope 4f0d <.literal16+0x24d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -32499,13 +32773,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4ec1 <.literal16+0x281> + .byte 71,225,61 // rex.RXB loope 4f41 <.literal16+0x281> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4ec5 <.literal16+0x285> + .byte 71,225,61 // rex.RXB loope 4f45 <.literal16+0x285> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4ec9 <.literal16+0x289> + .byte 71,225,61 // rex.RXB loope 4f49 <.literal16+0x289> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4ecd <.literal16+0x28d> + .byte 71,225,61 // rex.RXB loope 4f4d <.literal16+0x28d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -32530,13 +32804,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4f01 <.literal16+0x2c1> + .byte 71,225,61 // rex.RXB loope 4f81 <.literal16+0x2c1> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4f05 <.literal16+0x2c5> + .byte 71,225,61 // rex.RXB loope 4f85 <.literal16+0x2c5> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4f09 <.literal16+0x2c9> + .byte 71,225,61 // rex.RXB loope 4f89 <.literal16+0x2c9> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 4f0d <.literal16+0x2cd> + .byte 71,225,61 // rex.RXB loope 4f8d <.literal16+0x2cd> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -32757,13 +33031,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 50e9 <.literal16+0x4a9> + .byte 224,7 // loopne 5169 <.literal16+0x4a9> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 50ed <.literal16+0x4ad> + .byte 224,7 // loopne 516d <.literal16+0x4ad> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 50f1 <.literal16+0x4b1> + .byte 224,7 // loopne 5171 <.literal16+0x4b1> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 50f5 <.literal16+0x4b5> + .byte 224,7 // loopne 5175 <.literal16+0x4b5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -32828,11 +33102,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 51cb <.literal16+0x58b> + .byte 127,67 // jg 524b <.literal16+0x58b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 51cf <.literal16+0x58f> + .byte 127,67 // jg 524f <.literal16+0x58f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 51d3 <.literal16+0x593> + .byte 127,67 // jg 5253 <.literal16+0x593> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax) @@ -32847,16 +33121,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 51c4 <.literal16+0x584> + .byte 127,0 // jg 5244 <.literal16+0x584> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 51c8 <.literal16+0x588> + .byte 127,0 // jg 5248 <.literal16+0x588> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 51cc <.literal16+0x58c> + .byte 127,0 // jg 524c <.literal16+0x58c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 51d0 <.literal16+0x590> + .byte 127,0 // jg 5250 <.literal16+0x590> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -32865,7 +33139,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5255 <.literal16+0x615> + .byte 119,115 // ja 52d5 <.literal16+0x615> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -32876,7 +33150,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 51b9 <.literal16+0x579> + .byte 117,191 // jne 5239 <.literal16+0x579> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -32888,7 +33162,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a391fa <_sk_callback_sse2+0xffffffffe9a3469b> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3927a <_sk_callback_sse2+0xffffffffe9a3468f> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -32942,16 +33216,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5294 <.literal16+0x654> + .byte 127,0 // jg 5314 <.literal16+0x654> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5298 <.literal16+0x658> + .byte 127,0 // jg 5318 <.literal16+0x658> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 529c <.literal16+0x65c> + .byte 127,0 // jg 531c <.literal16+0x65c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 52a0 <.literal16+0x660> + .byte 127,0 // jg 5320 <.literal16+0x660> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -32960,7 +33234,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5325 <.literal16+0x6e5> + .byte 119,115 // ja 53a5 <.literal16+0x6e5> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -32971,7 +33245,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 5289 <.literal16+0x649> + .byte 117,191 // jne 5309 <.literal16+0x649> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -32983,7 +33257,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a392ca <_sk_callback_sse2+0xffffffffe9a3476b> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3934a <_sk_callback_sse2+0xffffffffe9a3475f> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -33037,16 +33311,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5364 <.literal16+0x724> + .byte 127,0 // jg 53e4 <.literal16+0x724> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5368 <.literal16+0x728> + .byte 127,0 // jg 53e8 <.literal16+0x728> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 536c <.literal16+0x72c> + .byte 127,0 // jg 53ec <.literal16+0x72c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5370 <.literal16+0x730> + .byte 127,0 // jg 53f0 <.literal16+0x730> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -33055,7 +33329,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 53f5 <.literal16+0x7b5> + .byte 119,115 // ja 5475 <.literal16+0x7b5> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -33066,7 +33340,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 5359 <.literal16+0x719> + .byte 117,191 // jne 53d9 <.literal16+0x719> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -33078,7 +33352,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3939a <_sk_callback_sse2+0xffffffffe9a3483b> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3941a <_sk_callback_sse2+0xffffffffe9a3482f> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -33132,16 +33406,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5434 <.literal16+0x7f4> + .byte 127,0 // jg 54b4 <.literal16+0x7f4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5438 <.literal16+0x7f8> + .byte 127,0 // jg 54b8 <.literal16+0x7f8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 543c <.literal16+0x7fc> + .byte 127,0 // jg 54bc <.literal16+0x7fc> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5440 <.literal16+0x800> + .byte 127,0 // jg 54c0 <.literal16+0x800> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -33150,7 +33424,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 54c5 <.literal16+0x885> + .byte 119,115 // ja 5545 <.literal16+0x885> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -33161,7 +33435,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 5429 <.literal16+0x7e9> + .byte 117,191 // jne 54a9 <.literal16+0x7e9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -33173,7 +33447,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3946a <_sk_callback_sse2+0xffffffffe9a3490b> + .byte 233,220,63,163,233 // jmpq ffffffffe9a394ea <_sk_callback_sse2+0xffffffffe9a348ff> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -33223,13 +33497,13 @@ BALIGN16 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 - .byte 127,67 // jg 5547 <.literal16+0x907> + .byte 127,67 // jg 55c7 <.literal16+0x907> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 554b <.literal16+0x90b> + .byte 127,67 // jg 55cb <.literal16+0x90b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 554f <.literal16+0x90f> + .byte 127,67 // jg 55cf <.literal16+0x90f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5553 <.literal16+0x913> + .byte 127,67 // jg 55d3 <.literal16+0x913> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -33276,16 +33550,16 @@ BALIGN16 .byte 128,3,62 // addb $0x3e,(%rbx) .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 55d3 <.literal16+0x993> + .byte 118,63 // jbe 5653 <.literal16+0x993> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 55d7 <.literal16+0x997> + .byte 118,63 // jbe 5657 <.literal16+0x997> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 55db <.literal16+0x99b> + .byte 118,63 // jbe 565b <.literal16+0x99b> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 55df <.literal16+0x99f> + .byte 118,63 // jbe 565f <.literal16+0x99f> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) @@ -33297,11 +33571,11 @@ BALIGN16 .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 561b <.literal16+0x9db> + .byte 127,67 // jg 569b <.literal16+0x9db> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 561f <.literal16+0x9df> + .byte 127,67 // jg 569f <.literal16+0x9df> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5623 <.literal16+0x9e3> + .byte 127,67 // jg 56a3 <.literal16+0x9e3> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,0,0,128,63 // addb $0x3f,-0x7fffffc5(%rax) @@ -33341,13 +33615,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 5669 <.literal16+0xa29> + .byte 224,7 // loopne 56e9 <.literal16+0xa29> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 566d <.literal16+0xa2d> + .byte 224,7 // loopne 56ed <.literal16+0xa2d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5671 <.literal16+0xa31> + .byte 224,7 // loopne 56f1 <.literal16+0xa31> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5675 <.literal16+0xa35> + .byte 224,7 // loopne 56f5 <.literal16+0xa35> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -33393,13 +33667,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 56d9 <.literal16+0xa99> + .byte 224,7 // loopne 5759 <.literal16+0xa99> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 56dd <.literal16+0xa9d> + .byte 224,7 // loopne 575d <.literal16+0xa9d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 56e1 <.literal16+0xaa1> + .byte 224,7 // loopne 5761 <.literal16+0xaa1> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 56e5 <.literal16+0xaa5> + .byte 224,7 // loopne 5765 <.literal16+0xaa5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -33437,13 +33711,13 @@ BALIGN16 .byte 65,0,0 // add %al,(%r8) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 5776 <.literal16+0xb36> + .byte 124,66 // jl 57f6 <.literal16+0xb36> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 577a <.literal16+0xb3a> + .byte 124,66 // jl 57fa <.literal16+0xb3a> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 577e <.literal16+0xb3e> + .byte 124,66 // jl 57fe <.literal16+0xb3e> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 5782 <.literal16+0xb42> + .byte 124,66 // jl 5802 <.literal16+0xb42> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 0,240 // add %dh,%al @@ -33533,13 +33807,13 @@ BALIGN16 .byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax) .byte 61,137,136,136,61 // cmp $0x3d888889,%eax .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 5885 <.literal16+0xc45> + .byte 112,65 // jo 5905 <.literal16+0xc45> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 5889 <.literal16+0xc49> + .byte 112,65 // jo 5909 <.literal16+0xc49> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 588d <.literal16+0xc4d> + .byte 112,65 // jo 590d <.literal16+0xc4d> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 5891 <.literal16+0xc51> + .byte 112,65 // jo 5911 <.literal16+0xc51> .byte 255,0 // incl (%rax) .byte 0,0 // add %al,(%rax) .byte 255,0 // incl (%rax) @@ -33561,11 +33835,11 @@ BALIGN16 .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%rax) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 58db <.literal16+0xc9b> + .byte 127,67 // jg 595b <.literal16+0xc9b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 58df <.literal16+0xc9f> + .byte 127,67 // jg 595f <.literal16+0xc9f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 58e3 <.literal16+0xca3> + .byte 127,67 // jg 5963 <.literal16+0xca3> .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) .byte 0,0 // add %al,(%rax) .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) @@ -33641,13 +33915,21 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 255 // (bad) - .byte 127,71 // jg 59cb <.literal16+0xd8b> + .byte 127,71 // jg 5a4b <.literal16+0xd8b> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 59cf <.literal16+0xd8f> + .byte 127,71 // jg 5a4f <.literal16+0xd8f> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 59d3 <.literal16+0xd93> + .byte 127,71 // jg 5a53 <.literal16+0xd93> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 59d7 <.literal16+0xd97> + .byte 127,71 // jg 5a57 <.literal16+0xd97> + .byte 0,0 // add %al,(%rax) + .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) + .byte 63 // (bad) + .byte 0,0 // add %al,(%rax) + .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) + .byte 63 // (bad) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -33669,6 +33951,24 @@ BALIGN16 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) .byte 63 // (bad) .byte 0,0 // add %al,(%rax) + .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) + .byte 63 // (bad) + .byte 0,0 // add %al,(%rax) + .byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%rdi) + .byte 0,128,191,0,0,128 // add %al,-0x7fffff41(%rax) + .byte 191,0,0,0,63 // mov $0x3f000000,%edi + .byte 0,0 // add %al,(%rax) + .byte 0,63 // add %bh,(%rdi) + .byte 0,0 // add %al,(%rax) + .byte 0,63 // add %bh,(%rdi) + .byte 0,0 // add %al,(%rax) + .byte 0,63 // add %bh,(%rdi) + .byte 0,0 // add %al,(%rax) + .byte 128,63,0 // cmpb $0x0,(%rdi) + .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) + .byte 63 // (bad) + .byte 0,0 // add %al,(%rax) .byte 128,63,208 // cmpb $0xd0,(%rdi) .byte 179,89 // mov $0x59,%bl .byte 62,208 // ds (bad) @@ -33808,11 +34108,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 5b42 <.literal16+0xf02> + .byte 62,114,28 // jb,pt 5c12 <.literal16+0xf52> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5b46 <.literal16+0xf06> + .byte 62,114,28 // jb,pt 5c16 <.literal16+0xf56> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5b4a <.literal16+0xf0a> + .byte 62,114,28 // jb,pt 5c1a <.literal16+0xf5a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -33856,7 +34156,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63e9d5 <_sk_callback_sse2+0x3d639e76> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63eaa5 <_sk_callback_sse2+0x3d639eba> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -33882,7 +34182,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63ea15 <_sk_callback_sse2+0x3d639eb6> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63eae5 <_sk_callback_sse2+0x3d639efa> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -33891,13 +34191,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 5c0e <.literal16+0xfce> + .byte 114,28 // jb 5cde <.literal16+0x101e> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5c12 <.literal16+0xfd2> + .byte 62,114,28 // jb,pt 5ce2 <.literal16+0x1022> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5c16 <.literal16+0xfd6> + .byte 62,114,28 // jb,pt 5ce6 <.literal16+0x1026> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5c1a <.literal16+0xfda> + .byte 62,114,28 // jb,pt 5cea <.literal16+0x102a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -33918,11 +34218,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 5c52 <.literal16+0x1012> + .byte 62,114,28 // jb,pt 5d22 <.literal16+0x1062> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5c56 <.literal16+0x1016> + .byte 62,114,28 // jb,pt 5d26 <.literal16+0x1066> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5c5a <.literal16+0x101a> + .byte 62,114,28 // jb,pt 5d2a <.literal16+0x106a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -33966,7 +34266,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63eae5 <_sk_callback_sse2+0x3d639f86> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63ebb5 <_sk_callback_sse2+0x3d639fca> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -33992,7 +34292,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63eb25 <_sk_callback_sse2+0x3d639fc6> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63ebf5 <_sk_callback_sse2+0x3d63a00a> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -34001,13 +34301,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 5d1e <.literal16+0x10de> + .byte 114,28 // jb 5dee <.literal16+0x112e> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5d22 <_sk_callback_sse2+0x11c3> + .byte 62,114,28 // jb,pt 5df2 <_sk_callback_sse2+0x1207> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5d26 <_sk_callback_sse2+0x11c7> + .byte 62,114,28 // jb,pt 5df6 <_sk_callback_sse2+0x120b> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 5d2a <_sk_callback_sse2+0x11cb> + .byte 62,114,28 // jb,pt 5dfa <_sk_callback_sse2+0x120f> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) |