aboutsummaryrefslogtreecommitdiffhomepage
path: root/src/jumper
diff options
context:
space:
mode:
authorGravatar Mike Klein <mtklein@chromium.org>2017-09-05 11:55:01 -0400
committerGravatar Skia Commit-Bot <skia-commit-bot@chromium.org>2017-09-05 19:23:45 +0000
commit16e357c711d40f4b6609f71276c37a0614f77d89 (patch)
treebb09c5f1570c5c27249fc255166ae8e9ba1fe5d8 /src/jumper
parent91f9a2c2bbd7cf52aad5d2f90e0608c04ffcfdf7 (diff)
merge 0,1,2,3,... and 0.5f
Because floats are fun, the compiler cannot merge x + 0.5f + [0,1,2,3,4...] into x + [0.5,1.5,2.5,3.5,4.5,...]. But we can. Change-Id: I03b46c1ea0653877f35f6c888f29371b5f73d813 Reviewed-on: https://skia-review.googlesource.com/42480 Reviewed-by: Florin Malita <fmalita@chromium.org> Commit-Queue: Mike Klein <mtklein@chromium.org>
Diffstat (limited to 'src/jumper')
-rw-r--r--src/jumper/SkJumper_generated.S8860
-rw-r--r--src/jumper/SkJumper_generated_win.S8338
-rw-r--r--src/jumper/SkJumper_stages.cpp4
3 files changed, 8602 insertions, 8600 deletions
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S
index 9c370f599b..91e788a502 100644
--- a/src/jumper/SkJumper_generated.S
+++ b/src/jumper/SkJumper_generated.S
@@ -85,39 +85,37 @@ HIDDEN _sk_seed_shader_vfp4
FUNCTION(_sk_seed_shader_vfp4)
_sk_seed_shader_vfp4:
.long 0xe1a02000 // mov r2, r0
- .long 0xf2c3265f // vmov.i32 q9, #1056964608
+ .long 0xf2c06050 // vmov.i32 q11, #0
.long 0xf4e20cbd // vld1.32 {d16[]-d17[]}, [r2 :32]!
- .long 0xe28f3054 // add r3, pc, #84
+ .long 0xe28f304c // add r3, pc, #76
.long 0xf3fb0660 // vcvt.f32.s32 q8, q8
- .long 0xf2c06050 // vmov.i32 q11, #0
.long 0xf4234acf // vld1.64 {d4-d5}, [r3]
- .long 0xe28f3054 // add r3, pc, #84
+ .long 0xe28f3050 // add r3, pc, #80
.long 0xf4e28cbf // vld1.32 {d24[]-d25[]}, [r2 :32]
.long 0xe2802040 // add r2, r0, #64
.long 0xf3fb8668 // vcvt.f32.s32 q12, q12
- .long 0xf2400de2 // vadd.f32 q8, q8, q9
.long 0xf4426aef // vst1.64 {d22-d23}, [r2 :128]
.long 0xe2802030 // add r2, r0, #48
- .long 0xf4634acf // vld1.64 {d20-d21}, [r3]
- .long 0xf2806050 // vmov.i32 q3, #0
- .long 0xf2082de2 // vadd.f32 q1, q12, q9
+ .long 0xf2c3265f // vmov.i32 q9, #1056964608
.long 0xf4426aef // vst1.64 {d22-d23}, [r2 :128]
.long 0xe2802020 // add r2, r0, #32
+ .long 0xf2082de2 // vadd.f32 q1, q12, q9
+ .long 0xf4634acf // vld1.64 {d20-d21}, [r3]
.long 0xf2000de4 // vadd.f32 q0, q8, q10
.long 0xf4426aef // vst1.64 {d22-d23}, [r2 :128]
.long 0xe2802010 // add r2, r0, #16
+ .long 0xf2806050 // vmov.i32 q3, #0
.long 0xf4426aef // vst1.64 {d22-d23}, [r2 :128]
.long 0xe4912004 // ldr r2, [r1], #4
.long 0xe12fff12 // bx r2
- .long 0xe320f000 // nop {0}
- .long 0x3f800000 // .word 0x3f800000
.long 0x3f800000 // .word 0x3f800000
.long 0x3f800000 // .word 0x3f800000
.long 0x3f800000 // .word 0x3f800000
- .long 0x00000000 // .word 0x00000000
.long 0x3f800000 // .word 0x3f800000
- .long 0x40000000 // .word 0x40000000
- .long 0x40400000 // .word 0x40400000
+ .long 0x3f000000 // .word 0x3f000000
+ .long 0x3fc00000 // .word 0x3fc00000
+ .long 0x40200000 // .word 0x40200000
+ .long 0x40600000 // .word 0x40600000
HIDDEN _sk_dither_vfp4
.globl _sk_dither_vfp4
@@ -1928,7 +1926,7 @@ _sk_srcover_rgba_8888_vfp4:
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe2804020 // add r4, r0, #32
.long 0xe0822106 // add r2, r2, r6, lsl #2
- .long 0x1a000032 // bne 1ba8 <sk_srcover_rgba_8888_vfp4+0x110>
+ .long 0x1a000032 // bne 1ba0 <sk_srcover_rgba_8888_vfp4+0x110>
.long 0xf4620a8f // vld1.32 {d16-d17}, [r2]
.long 0xf3c7405f // vmov.i32 q10, #255
.long 0xe28f6f51 // add r6, pc, #324
@@ -1973,7 +1971,7 @@ _sk_srcover_rgba_8888_vfp4:
.long 0xf2f0c57c // vshl.s32 q14, q14, #16
.long 0xf26e01f4 // vorr q8, q15, q10
.long 0xf26001fc // vorr q8, q8, q14
- .long 0x1a000015 // bne 1be8 <sk_srcover_rgba_8888_vfp4+0x150>
+ .long 0x1a000015 // bne 1be0 <sk_srcover_rgba_8888_vfp4+0x150>
.long 0xf4420a8f // vst1.32 {d16-d17}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -1982,12 +1980,12 @@ _sk_srcover_rgba_8888_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe2036003 // and r6, r3, #3
.long 0xe3560001 // cmp r6, #1
- .long 0x0a000017 // beq 1c14 <sk_srcover_rgba_8888_vfp4+0x17c>
+ .long 0x0a000017 // beq 1c0c <sk_srcover_rgba_8888_vfp4+0x17c>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3560002 // cmp r6, #2
- .long 0x0a000005 // beq 1bd8 <sk_srcover_rgba_8888_vfp4+0x140>
+ .long 0x0a000005 // beq 1bd0 <sk_srcover_rgba_8888_vfp4+0x140>
.long 0xe3560003 // cmp r6, #3
- .long 0x1affffc5 // bne 1ae0 <sk_srcover_rgba_8888_vfp4+0x48>
+ .long 0x1affffc5 // bne 1ad8 <sk_srcover_rgba_8888_vfp4+0x48>
.long 0xe3a06000 // mov r6, #0
.long 0xeea06b90 // vdup.32 q8, r6
.long 0xe2826008 // add r6, r2, #8
@@ -1995,24 +1993,24 @@ _sk_srcover_rgba_8888_vfp4:
.long 0xedd22b00 // vldr d18, [r2]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffbd // b 1ae0 <sk_srcover_rgba_8888_vfp4+0x48>
+ .long 0xeaffffbd // b 1ad8 <sk_srcover_rgba_8888_vfp4+0x48>
.long 0xe2033003 // and r3, r3, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000b // beq 1c24 <sk_srcover_rgba_8888_vfp4+0x18c>
+ .long 0x0a00000b // beq 1c1c <sk_srcover_rgba_8888_vfp4+0x18c>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 1c0c <sk_srcover_rgba_8888_vfp4+0x174>
+ .long 0x0a000003 // beq 1c04 <sk_srcover_rgba_8888_vfp4+0x174>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe3 // bne 1b94 <sk_srcover_rgba_8888_vfp4+0xfc>
+ .long 0x1affffe3 // bne 1b8c <sk_srcover_rgba_8888_vfp4+0xfc>
.long 0xe2823008 // add r3, r2, #8
.long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32]
.long 0xedc20b00 // vstr d16, [r2]
- .long 0xeaffffdf // b 1b94 <sk_srcover_rgba_8888_vfp4+0xfc>
+ .long 0xeaffffdf // b 1b8c <sk_srcover_rgba_8888_vfp4+0xfc>
.long 0xe3a06000 // mov r6, #0
.long 0xeea06b90 // vdup.32 q8, r6
.long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffae // b 1ae0 <sk_srcover_rgba_8888_vfp4+0x48>
+ .long 0xeaffffae // b 1ad8 <sk_srcover_rgba_8888_vfp4+0x48>
.long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffd9 // b 1b94 <sk_srcover_rgba_8888_vfp4+0xfc>
+ .long 0xeaffffd9 // b 1b8c <sk_srcover_rgba_8888_vfp4+0xfc>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -2657,7 +2655,7 @@ _sk_scale_u8_vfp4:
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
- .long 0x1a000013 // bne 2514 <sk_scale_u8_vfp4+0x7c>
+ .long 0x1a000013 // bne 250c <sk_scale_u8_vfp4+0x7c>
.long 0xe5922000 // ldr r2, [r2]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -2680,12 +2678,12 @@ _sk_scale_u8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000012 // beq 256c <sk_scale_u8_vfp4+0xd4>
+ .long 0x0a000012 // beq 2564 <sk_scale_u8_vfp4+0xd4>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 2544 <sk_scale_u8_vfp4+0xac>
+ .long 0x0a000005 // beq 253c <sk_scale_u8_vfp4+0xac>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe8 // bne 24d8 <sk_scale_u8_vfp4+0x40>
+ .long 0x1affffe8 // bne 24d0 <sk_scale_u8_vfp4+0x40>
.long 0xe3a04000 // mov r4, #0
.long 0xe5d23002 // ldrb r3, [r2, #2]
.long 0xee804bb0 // vdup.16 d16, r4
@@ -2699,12 +2697,12 @@ _sk_scale_u8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffda // b 24d8 <sk_scale_u8_vfp4+0x40>
+ .long 0xeaffffda // b 24d0 <sk_scale_u8_vfp4+0x40>
.long 0xe3a03000 // mov r3, #0
.long 0xe5d22000 // ldrb r2, [r2]
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd5 // b 24d8 <sk_scale_u8_vfp4+0x40>
+ .long 0xeaffffd5 // b 24d0 <sk_scale_u8_vfp4+0x40>
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -2726,7 +2724,7 @@ _sk_scale_565_vfp4:
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082308c // add r3, r2, ip, lsl #1
.long 0xe280c040 // add ip, r0, #64
- .long 0x1a000024 // bne 2658 <sk_scale_565_vfp4+0xc8>
+ .long 0x1a000024 // bne 2650 <sk_scale_565_vfp4+0xc8>
.long 0xf463074f // vld1.16 {d16}, [r3]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe3a02e7e // mov r2, #2016
@@ -2766,12 +2764,12 @@ _sk_scale_565_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20e2003 // and r2, lr, #3
.long 0xe3520001 // cmp r2, #1
- .long 0x0a000011 // beq 26ac <sk_scale_565_vfp4+0x11c>
+ .long 0x0a000011 // beq 26a4 <sk_scale_565_vfp4+0x11c>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3520002 // cmp r2, #2
- .long 0x0a000005 // beq 2688 <sk_scale_565_vfp4+0xf8>
+ .long 0x0a000005 // beq 2680 <sk_scale_565_vfp4+0xf8>
.long 0xe3520003 // cmp r2, #3
- .long 0x1affffd3 // bne 25c8 <sk_scale_565_vfp4+0x38>
+ .long 0x1affffd3 // bne 25c0 <sk_scale_565_vfp4+0x38>
.long 0xe3a02000 // mov r2, #0
.long 0xee802bb0 // vdup.16 d16, r2
.long 0xe2832004 // add r2, r3, #4
@@ -2784,11 +2782,11 @@ _sk_scale_565_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffc6 // b 25c8 <sk_scale_565_vfp4+0x38>
+ .long 0xeaffffc6 // b 25c0 <sk_scale_565_vfp4+0x38>
.long 0xe3a02000 // mov r2, #0
.long 0xee802bb0 // vdup.16 d16, r2
.long 0xf4e3041f // vld1.16 {d16[0]}, [r3 :16]
- .long 0xeaffffc2 // b 25c8 <sk_scale_565_vfp4+0x38>
+ .long 0xeaffffc2 // b 25c0 <sk_scale_565_vfp4+0x38>
.long 0xe320f000 // nop {0}
.long 0x3d042108 // .word 0x3d042108
.long 0x3d042108 // .word 0x3d042108
@@ -2849,7 +2847,7 @@ _sk_lerp_u8_vfp4:
.long 0xe0824003 // add r4, r2, r3
.long 0xe2803020 // add r3, r0, #32
.long 0xe2802010 // add r2, r0, #16
- .long 0x1a00001f // bne 2808 <sk_lerp_u8_vfp4+0xb8>
+ .long 0x1a00001f // bne 2800 <sk_lerp_u8_vfp4+0xb8>
.long 0xe5944000 // ldr r4, [r4]
.long 0xe58d4000 // str r4, [sp]
.long 0xe1a0400d // mov r4, sp
@@ -2884,12 +2882,12 @@ _sk_lerp_u8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000012 // beq 2860 <sk_lerp_u8_vfp4+0x110>
+ .long 0x0a000012 // beq 2858 <sk_lerp_u8_vfp4+0x110>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 2838 <sk_lerp_u8_vfp4+0xe8>
+ .long 0x0a000005 // beq 2830 <sk_lerp_u8_vfp4+0xe8>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffdc // bne 279c <sk_lerp_u8_vfp4+0x4c>
+ .long 0x1affffdc // bne 2794 <sk_lerp_u8_vfp4+0x4c>
.long 0xe3a06000 // mov r6, #0
.long 0xe5d45002 // ldrb r5, [r4, #2]
.long 0xee806bb0 // vdup.16 d16, r6
@@ -2903,12 +2901,12 @@ _sk_lerp_u8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffce // b 279c <sk_lerp_u8_vfp4+0x4c>
+ .long 0xeaffffce // b 2794 <sk_lerp_u8_vfp4+0x4c>
.long 0xe3a05000 // mov r5, #0
.long 0xe5d44000 // ldrb r4, [r4]
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xee004bb0 // vmov.16 d16[0], r4
- .long 0xeaffffc9 // b 279c <sk_lerp_u8_vfp4+0x4c>
+ .long 0xeaffffc9 // b 2794 <sk_lerp_u8_vfp4+0x4c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -2933,7 +2931,7 @@ _sk_lerp_565_vfp4:
.long 0xe0824083 // add r4, r2, r3, lsl #1
.long 0xe2802030 // add r2, r0, #48
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00002f // bne 2984 <sk_lerp_565_vfp4+0xfc>
+ .long 0x1a00002f // bne 297c <sk_lerp_565_vfp4+0xfc>
.long 0xf464074f // vld1.16 {d16}, [r4]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe3a04e7e // mov r4, #2016
@@ -2984,12 +2982,12 @@ _sk_lerp_565_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000011 // beq 29d8 <sk_lerp_565_vfp4+0x150>
+ .long 0x0a000011 // beq 29d0 <sk_lerp_565_vfp4+0x150>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 29b4 <sk_lerp_565_vfp4+0x12c>
+ .long 0x0a000005 // beq 29ac <sk_lerp_565_vfp4+0x12c>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffc8 // bne 28c8 <sk_lerp_565_vfp4+0x40>
+ .long 0x1affffc8 // bne 28c0 <sk_lerp_565_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xe2845004 // add r5, r4, #4
@@ -3002,11 +3000,11 @@ _sk_lerp_565_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffbb // b 28c8 <sk_lerp_565_vfp4+0x40>
+ .long 0xeaffffbb // b 28c0 <sk_lerp_565_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16]
- .long 0xeaffffb7 // b 28c8 <sk_lerp_565_vfp4+0x40>
+ .long 0xeaffffb7 // b 28c0 <sk_lerp_565_vfp4+0x40>
.long 0x3d042108 // .word 0x3d042108
.long 0x3d042108 // .word 0x3d042108
.long 0x3d042108 // .word 0x3d042108
@@ -3031,7 +3029,7 @@ _sk_load_tables_vfp4:
.long 0xe5964000 // ldr r4, [r6]
.long 0xe3530000 // cmp r3, #0
.long 0xe084e102 // add lr, r4, r2, lsl #2
- .long 0x1a000036 // bne 2b14 <sk_load_tables_vfp4+0xfc>
+ .long 0x1a000036 // bne 2b0c <sk_load_tables_vfp4+0xfc>
.long 0xf46e0a8f // vld1.32 {d16-d17}, [lr]
.long 0xf3c7405f // vmov.i32 q10, #255
.long 0xe5967004 // ldr r7, [r6, #4]
@@ -3089,12 +3087,12 @@ _sk_load_tables_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe203c003 // and ip, r3, #3
.long 0xe35c0001 // cmp ip, #1
- .long 0x0a00000c // beq 2b54 <sk_load_tables_vfp4+0x13c>
+ .long 0x0a00000c // beq 2b4c <sk_load_tables_vfp4+0x13c>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe35c0002 // cmp ip, #2
- .long 0x0a000005 // beq 2b44 <sk_load_tables_vfp4+0x12c>
+ .long 0x0a000005 // beq 2b3c <sk_load_tables_vfp4+0x12c>
.long 0xe35c0003 // cmp ip, #3
- .long 0x1affffc1 // bne 2a3c <sk_load_tables_vfp4+0x24>
+ .long 0x1affffc1 // bne 2a34 <sk_load_tables_vfp4+0x24>
.long 0xe3a02000 // mov r2, #0
.long 0xeea02b90 // vdup.32 q8, r2
.long 0xe28e2008 // add r2, lr, #8
@@ -3102,11 +3100,11 @@ _sk_load_tables_vfp4:
.long 0xedde2b00 // vldr d18, [lr]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffb9 // b 2a3c <sk_load_tables_vfp4+0x24>
+ .long 0xeaffffb9 // b 2a34 <sk_load_tables_vfp4+0x24>
.long 0xe3a02000 // mov r2, #0
.long 0xeea02b90 // vdup.32 q8, r2
.long 0xf4ee083f // vld1.32 {d16[0]}, [lr :32]
- .long 0xeaffffb5 // b 2a3c <sk_load_tables_vfp4+0x24>
+ .long 0xeaffffb5 // b 2a34 <sk_load_tables_vfp4+0x24>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -3124,7 +3122,7 @@ _sk_load_tables_u16_be_vfp4:
.long 0xe5982000 // ldr r2, [r8]
.long 0xe35e0000 // cmp lr, #0
.long 0xe082c183 // add ip, r2, r3, lsl #3
- .long 0x1a000039 // bne 2c80 <sk_load_tables_u16_be_vfp4+0x108>
+ .long 0x1a000039 // bne 2c78 <sk_load_tables_u16_be_vfp4+0x108>
.long 0xf46c004f // vld4.16 {d16-d19}, [ip]
.long 0xf3c72b3f // vbic.i16 d18, #65280
.long 0xe5986004 // ldr r6, [r8, #4]
@@ -3185,14 +3183,14 @@ _sk_load_tables_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4ec070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [ip]
.long 0xe35e0001 // cmp lr, #1
- .long 0x0affffc3 // beq 2b9c <sk_load_tables_u16_be_vfp4+0x24>
+ .long 0x0affffc3 // beq 2b94 <sk_load_tables_u16_be_vfp4+0x24>
.long 0xe28c2008 // add r2, ip, #8
.long 0xe35e0003 // cmp lr, #3
.long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3affffbf // bcc 2b9c <sk_load_tables_u16_be_vfp4+0x24>
+ .long 0x3affffbf // bcc 2b94 <sk_load_tables_u16_be_vfp4+0x24>
.long 0xe28c2010 // add r2, ip, #16
.long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeaffffbc // b 2b9c <sk_load_tables_u16_be_vfp4+0x24>
+ .long 0xeaffffbc // b 2b94 <sk_load_tables_u16_be_vfp4+0x24>
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
@@ -3210,7 +3208,7 @@ _sk_load_tables_rgb_u16_be_vfp4:
.long 0xe5982000 // ldr r2, [r8]
.long 0xe35e0000 // cmp lr, #0
.long 0xe082c083 // add ip, r2, r3, lsl #1
- .long 0x1a000033 // bne 2dac <sk_load_tables_rgb_u16_be_vfp4+0xf4>
+ .long 0x1a000033 // bne 2da4 <sk_load_tables_rgb_u16_be_vfp4+0xf4>
.long 0xf46c044f // vld3.16 {d16-d18}, [ip]
.long 0xf3c72b3f // vbic.i16 d18, #65280
.long 0xe5987004 // ldr r7, [r8, #4]
@@ -3265,14 +3263,14 @@ _sk_load_tables_rgb_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4ec060f // vld3.16 {d16[0],d17[0],d18[0]}, [ip]
.long 0xe35e0001 // cmp lr, #1
- .long 0x0affffc9 // beq 2ce0 <sk_load_tables_rgb_u16_be_vfp4+0x28>
+ .long 0x0affffc9 // beq 2cd8 <sk_load_tables_rgb_u16_be_vfp4+0x28>
.long 0xe28c2006 // add r2, ip, #6
.long 0xe35e0003 // cmp lr, #3
.long 0xf4e2064f // vld3.16 {d16[1],d17[1],d18[1]}, [r2]
- .long 0x3affffc5 // bcc 2ce0 <sk_load_tables_rgb_u16_be_vfp4+0x28>
+ .long 0x3affffc5 // bcc 2cd8 <sk_load_tables_rgb_u16_be_vfp4+0x28>
.long 0xe28c200c // add r2, ip, #12
.long 0xf4e2068f // vld3.16 {d16[2],d17[2],d18[2]}, [r2]
- .long 0xeaffffc2 // b 2ce0 <sk_load_tables_rgb_u16_be_vfp4+0x28>
+ .long 0xeaffffc2 // b 2cd8 <sk_load_tables_rgb_u16_be_vfp4+0x28>
.long 0xe320f000 // nop {0}
.long 0x3f800000 // .word 0x3f800000
.long 0x3f800000 // .word 0x3f800000
@@ -4325,7 +4323,7 @@ _sk_load_a8_vfp4:
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
- .long 0x1a000012 // bne 3d90 <sk_load_a8_vfp4+0x78>
+ .long 0x1a000012 // bne 3d88 <sk_load_a8_vfp4+0x78>
.long 0xe5922000 // ldr r2, [r2]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -4347,12 +4345,12 @@ _sk_load_a8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000012 // beq 3de8 <sk_load_a8_vfp4+0xd0>
+ .long 0x0a000012 // beq 3de0 <sk_load_a8_vfp4+0xd0>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 3dc0 <sk_load_a8_vfp4+0xa8>
+ .long 0x0a000005 // beq 3db8 <sk_load_a8_vfp4+0xa8>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe9 // bne 3d58 <sk_load_a8_vfp4+0x40>
+ .long 0x1affffe9 // bne 3d50 <sk_load_a8_vfp4+0x40>
.long 0xe3a04000 // mov r4, #0
.long 0xe5d23002 // ldrb r3, [r2, #2]
.long 0xee804bb0 // vdup.16 d16, r4
@@ -4366,12 +4364,12 @@ _sk_load_a8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffdb // b 3d58 <sk_load_a8_vfp4+0x40>
+ .long 0xeaffffdb // b 3d50 <sk_load_a8_vfp4+0x40>
.long 0xe3a03000 // mov r3, #0
.long 0xe5d22000 // ldrb r2, [r2]
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd6 // b 3d58 <sk_load_a8_vfp4+0x40>
+ .long 0xeaffffd6 // b 3d50 <sk_load_a8_vfp4+0x40>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -4400,7 +4398,7 @@ _sk_load_a8_dst_vfp4:
.long 0xf4430aef // vst1.64 {d16-d17}, [r3 :128]
.long 0xe082300c // add r3, r2, ip
.long 0xe280c040 // add ip, r0, #64
- .long 0x1a000011 // bne 3ea4 <sk_load_a8_dst_vfp4+0x94>
+ .long 0x1a000011 // bne 3e9c <sk_load_a8_dst_vfp4+0x94>
.long 0xe5932000 // ldr r2, [r3]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -4421,12 +4419,12 @@ _sk_load_a8_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe20e2003 // and r2, lr, #3
.long 0xe3520001 // cmp r2, #1
- .long 0x0a000012 // beq 3efc <sk_load_a8_dst_vfp4+0xec>
+ .long 0x0a000012 // beq 3ef4 <sk_load_a8_dst_vfp4+0xec>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3520002 // cmp r2, #2
- .long 0x0a000005 // beq 3ed4 <sk_load_a8_dst_vfp4+0xc4>
+ .long 0x0a000005 // beq 3ecc <sk_load_a8_dst_vfp4+0xc4>
.long 0xe3520003 // cmp r2, #3
- .long 0x1affffea // bne 3e70 <sk_load_a8_dst_vfp4+0x60>
+ .long 0x1affffea // bne 3e68 <sk_load_a8_dst_vfp4+0x60>
.long 0xe3a05000 // mov r5, #0
.long 0xe5d32002 // ldrb r2, [r3, #2]
.long 0xee805bb0 // vdup.16 d16, r5
@@ -4440,12 +4438,12 @@ _sk_load_a8_dst_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffdc // b 3e70 <sk_load_a8_dst_vfp4+0x60>
+ .long 0xeaffffdc // b 3e68 <sk_load_a8_dst_vfp4+0x60>
.long 0xe5d32000 // ldrb r2, [r3]
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd7 // b 3e70 <sk_load_a8_dst_vfp4+0x60>
+ .long 0xeaffffd7 // b 3e68 <sk_load_a8_dst_vfp4+0x60>
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -4511,7 +4509,7 @@ _sk_store_a8_vfp4:
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000005 // bne 4008 <sk_store_a8_vfp4+0x58>
+ .long 0x1a000005 // bne 4000 <sk_store_a8_vfp4+0x58>
.long 0xf3f20121 // vuzp.8 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
@@ -4520,21 +4518,21 @@ _sk_store_a8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000a // beq 4040 <sk_store_a8_vfp4+0x90>
+ .long 0x0a00000a // beq 4038 <sk_store_a8_vfp4+0x90>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 402c <sk_store_a8_vfp4+0x7c>
+ .long 0x0a000003 // beq 4024 <sk_store_a8_vfp4+0x7c>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 3ff8 <sk_store_a8_vfp4+0x48>
+ .long 0x1afffff4 // bne 3ff0 <sk_store_a8_vfp4+0x48>
.long 0xeeb03bb0 // vmov.u16 r3, d16[2]
.long 0xe5c23002 // strb r3, [r2, #2]
.long 0xee903bf0 // vmov.u16 r3, d16[1]
.long 0xee904bb0 // vmov.u16 r4, d16[0]
.long 0xe5c23001 // strb r3, [r2, #1]
.long 0xe5c24000 // strb r4, [r2]
- .long 0xeaffffed // b 3ff8 <sk_store_a8_vfp4+0x48>
+ .long 0xeaffffed // b 3ff0 <sk_store_a8_vfp4+0x48>
.long 0xee903bb0 // vmov.u16 r3, d16[0]
.long 0xe5c23000 // strb r3, [r2]
- .long 0xeaffffea // b 3ff8 <sk_store_a8_vfp4+0x48>
+ .long 0xeaffffea // b 3ff0 <sk_store_a8_vfp4+0x48>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -4555,7 +4553,7 @@ _sk_load_g8_vfp4:
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
- .long 0x1a000013 // bne 40dc <sk_load_g8_vfp4+0x7c>
+ .long 0x1a000013 // bne 40d4 <sk_load_g8_vfp4+0x7c>
.long 0xe5922000 // ldr r2, [r2]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -4578,12 +4576,12 @@ _sk_load_g8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000012 // beq 4134 <sk_load_g8_vfp4+0xd4>
+ .long 0x0a000012 // beq 412c <sk_load_g8_vfp4+0xd4>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 410c <sk_load_g8_vfp4+0xac>
+ .long 0x0a000005 // beq 4104 <sk_load_g8_vfp4+0xac>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe8 // bne 40a0 <sk_load_g8_vfp4+0x40>
+ .long 0x1affffe8 // bne 4098 <sk_load_g8_vfp4+0x40>
.long 0xe3a04000 // mov r4, #0
.long 0xe5d23002 // ldrb r3, [r2, #2]
.long 0xee804bb0 // vdup.16 d16, r4
@@ -4597,12 +4595,12 @@ _sk_load_g8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffda // b 40a0 <sk_load_g8_vfp4+0x40>
+ .long 0xeaffffda // b 4098 <sk_load_g8_vfp4+0x40>
.long 0xe3a03000 // mov r3, #0
.long 0xe5d22000 // ldrb r2, [r2]
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd5 // b 40a0 <sk_load_g8_vfp4+0x40>
+ .long 0xeaffffd5 // b 4098 <sk_load_g8_vfp4+0x40>
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -4629,7 +4627,7 @@ _sk_load_g8_dst_vfp4:
.long 0xe0824003 // add r4, r2, r3
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a000015 // bne 41f8 <sk_load_g8_dst_vfp4+0x90>
+ .long 0x1a000015 // bne 41f0 <sk_load_g8_dst_vfp4+0x90>
.long 0xe5944000 // ldr r4, [r4]
.long 0xe58d4000 // str r4, [sp]
.long 0xe1a0400d // mov r4, sp
@@ -4654,12 +4652,12 @@ _sk_load_g8_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000012 // beq 4250 <sk_load_g8_dst_vfp4+0xe8>
+ .long 0x0a000012 // beq 4248 <sk_load_g8_dst_vfp4+0xe8>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 4228 <sk_load_g8_dst_vfp4+0xc0>
+ .long 0x0a000005 // beq 4220 <sk_load_g8_dst_vfp4+0xc0>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffe6 // bne 41b4 <sk_load_g8_dst_vfp4+0x4c>
+ .long 0x1affffe6 // bne 41ac <sk_load_g8_dst_vfp4+0x4c>
.long 0xe3a06000 // mov r6, #0
.long 0xe5d45002 // ldrb r5, [r4, #2]
.long 0xee806bb0 // vdup.16 d16, r6
@@ -4673,12 +4671,12 @@ _sk_load_g8_dst_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffd8 // b 41b4 <sk_load_g8_dst_vfp4+0x4c>
+ .long 0xeaffffd8 // b 41ac <sk_load_g8_dst_vfp4+0x4c>
.long 0xe3a05000 // mov r5, #0
.long 0xe5d44000 // ldrb r4, [r4]
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xee004bb0 // vmov.16 d16[0], r4
- .long 0xeaffffd3 // b 41b4 <sk_load_g8_dst_vfp4+0x4c>
+ .long 0xeaffffd3 // b 41ac <sk_load_g8_dst_vfp4+0x4c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -4745,7 +4743,7 @@ _sk_load_565_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082208e // add r2, r2, lr, lsl #1
- .long 0x1a00001b // bne 43b8 <sk_load_565_vfp4+0xa0>
+ .long 0x1a00001b // bne 43b0 <sk_load_565_vfp4+0xa0>
.long 0xf462074f // vld1.16 {d16}, [r2]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe3a02e7e // mov r2, #2016
@@ -4776,12 +4774,12 @@ _sk_load_565_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000011 // beq 440c <sk_load_565_vfp4+0xf4>
+ .long 0x0a000011 // beq 4404 <sk_load_565_vfp4+0xf4>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 43e8 <sk_load_565_vfp4+0xd0>
+ .long 0x0a000005 // beq 43e0 <sk_load_565_vfp4+0xd0>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffdc // bne 434c <sk_load_565_vfp4+0x34>
+ .long 0x1affffdc // bne 4344 <sk_load_565_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xe2823004 // add r3, r2, #4
@@ -4794,11 +4792,11 @@ _sk_load_565_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcf // b 434c <sk_load_565_vfp4+0x34>
+ .long 0xeaffffcf // b 4344 <sk_load_565_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xf4e2041f // vld1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffcb // b 434c <sk_load_565_vfp4+0x34>
+ .long 0xeaffffcb // b 4344 <sk_load_565_vfp4+0x34>
.long 0xe320f000 // nop {0}
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
@@ -4835,7 +4833,7 @@ _sk_load_565_dst_vfp4:
.long 0xe0824083 // add r4, r2, r3, lsl #1
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001f // bne 451c <sk_load_565_dst_vfp4+0xbc>
+ .long 0x1a00001f // bne 4514 <sk_load_565_dst_vfp4+0xbc>
.long 0xf464074f // vld1.16 {d16}, [r4]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe3a04e7e // mov r4, #2016
@@ -4870,12 +4868,12 @@ _sk_load_565_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000011 // beq 4570 <sk_load_565_dst_vfp4+0x110>
+ .long 0x0a000011 // beq 4568 <sk_load_565_dst_vfp4+0x110>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 454c <sk_load_565_dst_vfp4+0xec>
+ .long 0x0a000005 // beq 4544 <sk_load_565_dst_vfp4+0xec>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffd8 // bne 44a0 <sk_load_565_dst_vfp4+0x40>
+ .long 0x1affffd8 // bne 4498 <sk_load_565_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xe2845004 // add r5, r4, #4
@@ -4888,11 +4886,11 @@ _sk_load_565_dst_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcb // b 44a0 <sk_load_565_dst_vfp4+0x40>
+ .long 0xeaffffcb // b 4498 <sk_load_565_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16]
- .long 0xeaffffc7 // b 44a0 <sk_load_565_dst_vfp4+0x40>
+ .long 0xeaffffc7 // b 4498 <sk_load_565_dst_vfp4+0x40>
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
@@ -5004,7 +5002,7 @@ _sk_store_565_vfp4:
.long 0xf26401f0 // vorr q8, q10, q8
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000004 // bne 472c <sk_store_565_vfp4+0x84>
+ .long 0x1a000004 // bne 4724 <sk_store_565_vfp4+0x84>
.long 0xf442074f // vst1.16 {d16}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -5012,11 +5010,11 @@ _sk_store_565_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 476c <sk_store_565_vfp4+0xc4>
+ .long 0x0a00000c // beq 4764 <sk_store_565_vfp4+0xc4>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 4750 <sk_store_565_vfp4+0xa8>
+ .long 0x0a000003 // beq 4748 <sk_store_565_vfp4+0xa8>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 471c <sk_store_565_vfp4+0x74>
+ .long 0x1afffff4 // bne 4714 <sk_store_565_vfp4+0x74>
.long 0xe2823004 // add r3, r2, #4
.long 0xf4c3049f // vst1.16 {d16[2]}, [r3 :16]
.long 0xee903bb0 // vmov.u16 r3, d16[0]
@@ -5025,9 +5023,9 @@ _sk_store_565_vfp4:
.long 0xee204b90 // vmov.32 d16[1], r4
.long 0xf3f60121 // vuzp.16 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
- .long 0xeaffffeb // b 471c <sk_store_565_vfp4+0x74>
+ .long 0xeaffffeb // b 4714 <sk_store_565_vfp4+0x74>
.long 0xf4c2041f // vst1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffe9 // b 471c <sk_store_565_vfp4+0x74>
+ .long 0xeaffffe9 // b 4714 <sk_store_565_vfp4+0x74>
.long 0xe320f000 // nop {0}
.long 0x427c0000 // .word 0x427c0000
.long 0x427c0000 // .word 0x427c0000
@@ -5049,7 +5047,7 @@ _sk_load_4444_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082208e // add r2, r2, lr, lsl #1
- .long 0x1a00001e // bne 4834 <sk_load_4444_vfp4+0xac>
+ .long 0x1a00001e // bne 482c <sk_load_4444_vfp4+0xac>
.long 0xf462074f // vld1.16 {d16}, [r2]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe28f20d0 // add r2, pc, #208
@@ -5083,12 +5081,12 @@ _sk_load_4444_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000011 // beq 4888 <sk_load_4444_vfp4+0x100>
+ .long 0x0a000011 // beq 4880 <sk_load_4444_vfp4+0x100>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 4864 <sk_load_4444_vfp4+0xdc>
+ .long 0x0a000005 // beq 485c <sk_load_4444_vfp4+0xdc>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffd9 // bne 47bc <sk_load_4444_vfp4+0x34>
+ .long 0x1affffd9 // bne 47b4 <sk_load_4444_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xe2823004 // add r3, r2, #4
@@ -5101,11 +5099,11 @@ _sk_load_4444_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcc // b 47bc <sk_load_4444_vfp4+0x34>
+ .long 0xeaffffcc // b 47b4 <sk_load_4444_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xf4e2041f // vld1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffc8 // b 47bc <sk_load_4444_vfp4+0x34>
+ .long 0xeaffffc8 // b 47b4 <sk_load_4444_vfp4+0x34>
.long 0x3b888889 // .word 0x3b888889
.long 0x3b888889 // .word 0x3b888889
.long 0x3b888889 // .word 0x3b888889
@@ -5141,7 +5139,7 @@ _sk_load_4444_dst_vfp4:
.long 0xe0824083 // add r4, r2, r3, lsl #1
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a000023 // bne 49a4 <sk_load_4444_dst_vfp4+0xcc>
+ .long 0x1a000023 // bne 499c <sk_load_4444_dst_vfp4+0xcc>
.long 0xf464074f // vld1.16 {d16}, [r4]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe28f40e4 // add r4, pc, #228
@@ -5180,12 +5178,12 @@ _sk_load_4444_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000011 // beq 49f8 <sk_load_4444_dst_vfp4+0x120>
+ .long 0x0a000011 // beq 49f0 <sk_load_4444_dst_vfp4+0x120>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 49d4 <sk_load_4444_dst_vfp4+0xfc>
+ .long 0x0a000005 // beq 49cc <sk_load_4444_dst_vfp4+0xfc>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffd4 // bne 4918 <sk_load_4444_dst_vfp4+0x40>
+ .long 0x1affffd4 // bne 4910 <sk_load_4444_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xe2845004 // add r5, r4, #4
@@ -5198,11 +5196,11 @@ _sk_load_4444_dst_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffc7 // b 4918 <sk_load_4444_dst_vfp4+0x40>
+ .long 0xeaffffc7 // b 4910 <sk_load_4444_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16]
- .long 0xeaffffc3 // b 4918 <sk_load_4444_dst_vfp4+0x40>
+ .long 0xeaffffc3 // b 4910 <sk_load_4444_dst_vfp4+0x40>
.long 0x37888889 // .word 0x37888889
.long 0x37888889 // .word 0x37888889
.long 0x37888889 // .word 0x37888889
@@ -5325,7 +5323,7 @@ _sk_store_4444_vfp4:
.long 0xf26001f6 // vorr q8, q8, q11
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000004 // bne 4be0 <sk_store_4444_vfp4+0x90>
+ .long 0x1a000004 // bne 4bd8 <sk_store_4444_vfp4+0x90>
.long 0xf442074f // vst1.16 {d16}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -5333,11 +5331,11 @@ _sk_store_4444_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 4c20 <sk_store_4444_vfp4+0xd0>
+ .long 0x0a00000c // beq 4c18 <sk_store_4444_vfp4+0xd0>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 4c04 <sk_store_4444_vfp4+0xb4>
+ .long 0x0a000003 // beq 4bfc <sk_store_4444_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 4bd0 <sk_store_4444_vfp4+0x80>
+ .long 0x1afffff4 // bne 4bc8 <sk_store_4444_vfp4+0x80>
.long 0xe2823004 // add r3, r2, #4
.long 0xf4c3049f // vst1.16 {d16[2]}, [r3 :16]
.long 0xee903bb0 // vmov.u16 r3, d16[0]
@@ -5346,9 +5344,9 @@ _sk_store_4444_vfp4:
.long 0xee204b90 // vmov.32 d16[1], r4
.long 0xf3f60121 // vuzp.16 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
- .long 0xeaffffeb // b 4bd0 <sk_store_4444_vfp4+0x80>
+ .long 0xeaffffeb // b 4bc8 <sk_store_4444_vfp4+0x80>
.long 0xf4c2041f // vst1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffe9 // b 4bd0 <sk_store_4444_vfp4+0x80>
+ .long 0xeaffffe9 // b 4bc8 <sk_store_4444_vfp4+0x80>
HIDDEN _sk_load_8888_vfp4
.globl _sk_load_8888_vfp4
@@ -5364,7 +5362,7 @@ _sk_load_8888_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082210e // add r2, r2, lr, lsl #2
- .long 0x1a000015 // bne 4cac <sk_load_8888_vfp4+0x84>
+ .long 0x1a000015 // bne 4ca4 <sk_load_8888_vfp4+0x84>
.long 0xf4620a8f // vld1.32 {d16-d17}, [r2]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f209c // add r2, pc, #156
@@ -5389,12 +5387,12 @@ _sk_load_8888_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 4cec <sk_load_8888_vfp4+0xc4>
+ .long 0x0a00000c // beq 4ce4 <sk_load_8888_vfp4+0xc4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 4cdc <sk_load_8888_vfp4+0xb4>
+ .long 0x0a000005 // beq 4cd4 <sk_load_8888_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe2 // bne 4c58 <sk_load_8888_vfp4+0x30>
+ .long 0x1affffe2 // bne 4c50 <sk_load_8888_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xe2823008 // add r3, r2, #8
@@ -5402,11 +5400,11 @@ _sk_load_8888_vfp4:
.long 0xedd22b00 // vldr d18, [r2]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffda // b 4c58 <sk_load_8888_vfp4+0x30>
+ .long 0xeaffffda // b 4c50 <sk_load_8888_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffd6 // b 4c58 <sk_load_8888_vfp4+0x30>
+ .long 0xeaffffd6 // b 4c50 <sk_load_8888_vfp4+0x30>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -5430,7 +5428,7 @@ _sk_load_8888_dst_vfp4:
.long 0xe0824103 // add r4, r2, r3, lsl #2
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001a // bne 4db4 <sk_load_8888_dst_vfp4+0xa4>
+ .long 0x1a00001a // bne 4dac <sk_load_8888_dst_vfp4+0xa4>
.long 0xf4640a8f // vld1.32 {d16-d17}, [r4]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f40b0 // add r4, pc, #176
@@ -5460,12 +5458,12 @@ _sk_load_8888_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a00000c // beq 4df4 <sk_load_8888_dst_vfp4+0xe4>
+ .long 0x0a00000c // beq 4dec <sk_load_8888_dst_vfp4+0xe4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 4de4 <sk_load_8888_dst_vfp4+0xd4>
+ .long 0x0a000005 // beq 4ddc <sk_load_8888_dst_vfp4+0xd4>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffdd // bne 4d4c <sk_load_8888_dst_vfp4+0x3c>
+ .long 0x1affffdd // bne 4d44 <sk_load_8888_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xe2845008 // add r5, r4, #8
@@ -5473,11 +5471,11 @@ _sk_load_8888_dst_vfp4:
.long 0xedd42b00 // vldr d18, [r4]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffd5 // b 4d4c <sk_load_8888_dst_vfp4+0x3c>
+ .long 0xeaffffd5 // b 4d44 <sk_load_8888_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xf4e4083f // vld1.32 {d16[0]}, [r4 :32]
- .long 0xeaffffd1 // b 4d4c <sk_load_8888_dst_vfp4+0x3c>
+ .long 0xeaffffd1 // b 4d44 <sk_load_8888_dst_vfp4+0x3c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -5567,7 +5565,7 @@ _sk_store_8888_vfp4:
.long 0xf2f84576 // vshl.s32 q10, q11, #24
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf26001f4 // vorr q8, q8, q10
- .long 0x1a000004 // bne 4f58 <sk_store_8888_vfp4+0x90>
+ .long 0x1a000004 // bne 4f50 <sk_store_8888_vfp4+0x90>
.long 0xf4420a8f // vst1.32 {d16-d17}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -5575,17 +5573,17 @@ _sk_store_8888_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000007 // beq 4f84 <sk_store_8888_vfp4+0xbc>
+ .long 0x0a000007 // beq 4f7c <sk_store_8888_vfp4+0xbc>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 4f7c <sk_store_8888_vfp4+0xb4>
+ .long 0x0a000003 // beq 4f74 <sk_store_8888_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 4f48 <sk_store_8888_vfp4+0x80>
+ .long 0x1afffff4 // bne 4f40 <sk_store_8888_vfp4+0x80>
.long 0xe2823008 // add r3, r2, #8
.long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32]
.long 0xedc20b00 // vstr d16, [r2]
- .long 0xeafffff0 // b 4f48 <sk_store_8888_vfp4+0x80>
+ .long 0xeafffff0 // b 4f40 <sk_store_8888_vfp4+0x80>
.long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffee // b 4f48 <sk_store_8888_vfp4+0x80>
+ .long 0xeaffffee // b 4f40 <sk_store_8888_vfp4+0x80>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -5606,7 +5604,7 @@ _sk_load_bgra_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082210e // add r2, r2, lr, lsl #2
- .long 0x1a000015 // bne 5024 <sk_load_bgra_vfp4+0x84>
+ .long 0x1a000015 // bne 501c <sk_load_bgra_vfp4+0x84>
.long 0xf4620a8f // vld1.32 {d16-d17}, [r2]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f209c // add r2, pc, #156
@@ -5631,12 +5629,12 @@ _sk_load_bgra_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 5064 <sk_load_bgra_vfp4+0xc4>
+ .long 0x0a00000c // beq 505c <sk_load_bgra_vfp4+0xc4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 5054 <sk_load_bgra_vfp4+0xb4>
+ .long 0x0a000005 // beq 504c <sk_load_bgra_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe2 // bne 4fd0 <sk_load_bgra_vfp4+0x30>
+ .long 0x1affffe2 // bne 4fc8 <sk_load_bgra_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xe2823008 // add r3, r2, #8
@@ -5644,11 +5642,11 @@ _sk_load_bgra_vfp4:
.long 0xedd22b00 // vldr d18, [r2]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffda // b 4fd0 <sk_load_bgra_vfp4+0x30>
+ .long 0xeaffffda // b 4fc8 <sk_load_bgra_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffd6 // b 4fd0 <sk_load_bgra_vfp4+0x30>
+ .long 0xeaffffd6 // b 4fc8 <sk_load_bgra_vfp4+0x30>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -5672,7 +5670,7 @@ _sk_load_bgra_dst_vfp4:
.long 0xe0824103 // add r4, r2, r3, lsl #2
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001a // bne 512c <sk_load_bgra_dst_vfp4+0xa4>
+ .long 0x1a00001a // bne 5124 <sk_load_bgra_dst_vfp4+0xa4>
.long 0xf4640a8f // vld1.32 {d16-d17}, [r4]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f40b0 // add r4, pc, #176
@@ -5702,12 +5700,12 @@ _sk_load_bgra_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a00000c // beq 516c <sk_load_bgra_dst_vfp4+0xe4>
+ .long 0x0a00000c // beq 5164 <sk_load_bgra_dst_vfp4+0xe4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 515c <sk_load_bgra_dst_vfp4+0xd4>
+ .long 0x0a000005 // beq 5154 <sk_load_bgra_dst_vfp4+0xd4>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffdd // bne 50c4 <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0x1affffdd // bne 50bc <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xe2845008 // add r5, r4, #8
@@ -5715,11 +5713,11 @@ _sk_load_bgra_dst_vfp4:
.long 0xedd42b00 // vldr d18, [r4]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffd5 // b 50c4 <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0xeaffffd5 // b 50bc <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xf4e4083f // vld1.32 {d16[0]}, [r4 :32]
- .long 0xeaffffd1 // b 50c4 <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0xeaffffd1 // b 50bc <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -5809,7 +5807,7 @@ _sk_store_bgra_vfp4:
.long 0xf2f84576 // vshl.s32 q10, q11, #24
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf26001f4 // vorr q8, q8, q10
- .long 0x1a000004 // bne 52d0 <sk_store_bgra_vfp4+0x90>
+ .long 0x1a000004 // bne 52c8 <sk_store_bgra_vfp4+0x90>
.long 0xf4420a8f // vst1.32 {d16-d17}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -5817,17 +5815,17 @@ _sk_store_bgra_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000007 // beq 52fc <sk_store_bgra_vfp4+0xbc>
+ .long 0x0a000007 // beq 52f4 <sk_store_bgra_vfp4+0xbc>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 52f4 <sk_store_bgra_vfp4+0xb4>
+ .long 0x0a000003 // beq 52ec <sk_store_bgra_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 52c0 <sk_store_bgra_vfp4+0x80>
+ .long 0x1afffff4 // bne 52b8 <sk_store_bgra_vfp4+0x80>
.long 0xe2823008 // add r3, r2, #8
.long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32]
.long 0xedc20b00 // vstr d16, [r2]
- .long 0xeafffff0 // b 52c0 <sk_store_bgra_vfp4+0x80>
+ .long 0xeafffff0 // b 52b8 <sk_store_bgra_vfp4+0x80>
.long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffee // b 52c0 <sk_store_bgra_vfp4+0x80>
+ .long 0xeaffffee // b 52b8 <sk_store_bgra_vfp4+0x80>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -5848,7 +5846,7 @@ _sk_load_f16_vfp4:
.long 0xe0020293 // mul r2, r3, r2
.long 0xe0842182 // add r2, r4, r2, lsl #3
.long 0xe082318e // add r3, r2, lr, lsl #3
- .long 0x1a000008 // bne 5368 <sk_load_f16_vfp4+0x50>
+ .long 0x1a000008 // bne 5360 <sk_load_f16_vfp4+0x50>
.long 0xf463004f // vld4.16 {d16-d19}, [r3]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xf3b60720 // vcvt.f32.f16 q0, d16
@@ -5860,14 +5858,14 @@ _sk_load_f16_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0afffff4 // beq 5348 <sk_load_f16_vfp4+0x30>
+ .long 0x0afffff4 // beq 5340 <sk_load_f16_vfp4+0x30>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3afffff0 // bcc 5348 <sk_load_f16_vfp4+0x30>
+ .long 0x3afffff0 // bcc 5340 <sk_load_f16_vfp4+0x30>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeaffffed // b 5348 <sk_load_f16_vfp4+0x30>
+ .long 0xeaffffed // b 5340 <sk_load_f16_vfp4+0x30>
HIDDEN _sk_load_f16_dst_vfp4
.globl _sk_load_f16_dst_vfp4
@@ -5886,7 +5884,7 @@ _sk_load_f16_dst_vfp4:
.long 0xe0825183 // add r5, r2, r3, lsl #3
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00000d // bne 5400 <sk_load_f16_dst_vfp4+0x70>
+ .long 0x1a00000d // bne 53f8 <sk_load_f16_dst_vfp4+0x70>
.long 0xf465004f // vld4.16 {d16-d19}, [r5]
.long 0xf3f64720 // vcvt.f32.f16 q10, d16
.long 0xf3f66721 // vcvt.f32.f16 q11, d17
@@ -5903,14 +5901,14 @@ _sk_load_f16_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xf4e5070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r5]
.long 0xe3560001 // cmp r6, #1
- .long 0x0affffef // beq 53cc <sk_load_f16_dst_vfp4+0x3c>
+ .long 0x0affffef // beq 53c4 <sk_load_f16_dst_vfp4+0x3c>
.long 0xe2854008 // add r4, r5, #8
.long 0xe3560003 // cmp r6, #3
.long 0xf4e4074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r4]
- .long 0x3affffeb // bcc 53cc <sk_load_f16_dst_vfp4+0x3c>
+ .long 0x3affffeb // bcc 53c4 <sk_load_f16_dst_vfp4+0x3c>
.long 0xe2854010 // add r4, r5, #16
.long 0xf4e4078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r4]
- .long 0xeaffffe8 // b 53cc <sk_load_f16_dst_vfp4+0x3c>
+ .long 0xeaffffe8 // b 53c4 <sk_load_f16_dst_vfp4+0x3c>
HIDDEN _sk_gather_f16_vfp4
.globl _sk_gather_f16_vfp4
@@ -5971,7 +5969,7 @@ _sk_store_f16_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842182 // add r2, r4, r2, lsl #3
.long 0xe082218e // add r2, r2, lr, lsl #3
- .long 0x1a000004 // bne 5508 <sk_store_f16_vfp4+0x50>
+ .long 0x1a000004 // bne 5500 <sk_store_f16_vfp4+0x50>
.long 0xf442004f // vst4.16 {d16-d19}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -5979,14 +5977,14 @@ _sk_store_f16_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4c2070f // vst4.16 {d16[0],d17[0],d18[0],d19[0]}, [r2]
- .long 0x0afffff8 // beq 54f8 <sk_store_f16_vfp4+0x40>
+ .long 0x0afffff8 // beq 54f0 <sk_store_f16_vfp4+0x40>
.long 0xe2823008 // add r3, r2, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4c3074f // vst4.16 {d16[1],d17[1],d18[1],d19[1]}, [r3]
- .long 0x3afffff4 // bcc 54f8 <sk_store_f16_vfp4+0x40>
+ .long 0x3afffff4 // bcc 54f0 <sk_store_f16_vfp4+0x40>
.long 0xe2822010 // add r2, r2, #16
.long 0xf4c2078f // vst4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeafffff1 // b 54f8 <sk_store_f16_vfp4+0x40>
+ .long 0xeafffff1 // b 54f0 <sk_store_f16_vfp4+0x40>
HIDDEN _sk_load_u16_be_vfp4
.globl _sk_load_u16_be_vfp4
@@ -6002,7 +6000,7 @@ _sk_load_u16_be_vfp4:
.long 0xe0020293 // mul r2, r3, r2
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082318e // add r3, r2, lr, lsl #3
- .long 0x1a00001e // bne 55d8 <sk_load_u16_be_vfp4+0xa8>
+ .long 0x1a00001e // bne 55d0 <sk_load_u16_be_vfp4+0xa8>
.long 0xf463004f // vld4.16 {d16-d19}, [r3]
.long 0xf3d84030 // vshr.u16 d20, d16, #8
.long 0xe28f2094 // add r2, pc, #148
@@ -6036,14 +6034,14 @@ _sk_load_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0affffde // beq 5560 <sk_load_u16_be_vfp4+0x30>
+ .long 0x0affffde // beq 5558 <sk_load_u16_be_vfp4+0x30>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3affffda // bcc 5560 <sk_load_u16_be_vfp4+0x30>
+ .long 0x3affffda // bcc 5558 <sk_load_u16_be_vfp4+0x30>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeaffffd7 // b 5560 <sk_load_u16_be_vfp4+0x30>
+ .long 0xeaffffd7 // b 5558 <sk_load_u16_be_vfp4+0x30>
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
@@ -6064,7 +6062,7 @@ _sk_load_rgb_u16_be_vfp4:
.long 0xe08e308e // add r3, lr, lr, lsl #1
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe0823083 // add r3, r2, r3, lsl #1
- .long 0x1a00001a // bne 56ac <sk_load_rgb_u16_be_vfp4+0x9c>
+ .long 0x1a00001a // bne 56a4 <sk_load_rgb_u16_be_vfp4+0x9c>
.long 0xf463044f // vld3.16 {d16-d18}, [r3]
.long 0xf3d84030 // vshr.u16 d20, d16, #8
.long 0xe28f2088 // add r2, pc, #136
@@ -6094,14 +6092,14 @@ _sk_load_rgb_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3060f // vld3.16 {d16[0],d17[0],d18[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0affffe2 // beq 5644 <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0x0affffe2 // beq 563c <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe2832006 // add r2, r3, #6
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2064f // vld3.16 {d16[1],d17[1],d18[1]}, [r2]
- .long 0x3affffde // bcc 5644 <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0x3affffde // bcc 563c <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe283200c // add r2, r3, #12
.long 0xf4e2068f // vld3.16 {d16[2],d17[2],d18[2]}, [r2]
- .long 0xeaffffdb // b 5644 <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0xeaffffdb // b 563c <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe320f000 // nop {0}
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
@@ -6156,7 +6154,7 @@ _sk_store_u16_be_vfp4:
.long 0xf2d84534 // vshl.s16 d20, d20, #8
.long 0xf26811b7 // vorr d17, d24, d23
.long 0xf26401b9 // vorr d16, d20, d25
- .long 0x1a000004 // bne 57b0 <sk_store_u16_be_vfp4+0xb8>
+ .long 0x1a000004 // bne 57a8 <sk_store_u16_be_vfp4+0xb8>
.long 0xf443004f // vst4.16 {d16-d19}, [r3]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -6164,14 +6162,14 @@ _sk_store_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4c3070f // vst4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
- .long 0x0afffff8 // beq 57a0 <sk_store_u16_be_vfp4+0xa8>
+ .long 0x0afffff8 // beq 5798 <sk_store_u16_be_vfp4+0xa8>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4c2074f // vst4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3afffff4 // bcc 57a0 <sk_store_u16_be_vfp4+0xa8>
+ .long 0x3afffff4 // bcc 5798 <sk_store_u16_be_vfp4+0xa8>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4c2078f // vst4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeafffff1 // b 57a0 <sk_store_u16_be_vfp4+0xa8>
+ .long 0xeafffff1 // b 5798 <sk_store_u16_be_vfp4+0xa8>
.long 0x477fff00 // .word 0x477fff00
.long 0x477fff00 // .word 0x477fff00
.long 0x477fff00 // .word 0x477fff00
@@ -6191,7 +6189,7 @@ _sk_load_f32_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082220e // add r2, r2, lr, lsl #4
- .long 0x1a000009 // bne 583c <sk_load_f32_vfp4+0x54>
+ .long 0x1a000009 // bne 5834 <sk_load_f32_vfp4+0x54>
.long 0xf462018d // vld4.32 {d16,d18,d20,d22}, [r2]!
.long 0xf462118f // vld4.32 {d17,d19,d21,d23}, [r2]
.long 0xf22001f0 // vorr q0, q8, q8
@@ -6204,14 +6202,14 @@ _sk_load_f32_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4a20b4f // vld4.32 {d0[0],d2[0],d4[0],d6[0]}, [r2]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0afffff8 // beq 582c <sk_load_f32_vfp4+0x44>
+ .long 0x0afffff8 // beq 5824 <sk_load_f32_vfp4+0x44>
.long 0xe2823010 // add r3, r2, #16
.long 0xe35c0003 // cmp ip, #3
.long 0xf4a30bcf // vld4.32 {d0[1],d2[1],d4[1],d6[1]}, [r3]
- .long 0x3afffff4 // bcc 582c <sk_load_f32_vfp4+0x44>
+ .long 0x3afffff4 // bcc 5824 <sk_load_f32_vfp4+0x44>
.long 0xe2822020 // add r2, r2, #32
.long 0xf4a21b4f // vld4.32 {d1[0],d3[0],d5[0],d7[0]}, [r2]
- .long 0xeafffff1 // b 582c <sk_load_f32_vfp4+0x44>
+ .long 0xeafffff1 // b 5824 <sk_load_f32_vfp4+0x44>
HIDDEN _sk_load_f32_dst_vfp4
.globl _sk_load_f32_dst_vfp4
@@ -6230,7 +6228,7 @@ _sk_load_f32_dst_vfp4:
.long 0xe0824203 // add r4, r2, r3, lsl #4
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00000e // bne 58d8 <sk_load_f32_dst_vfp4+0x74>
+ .long 0x1a00000e // bne 58d0 <sk_load_f32_dst_vfp4+0x74>
.long 0xf464818d // vld4.32 {d24,d26,d28,d30}, [r4]!
.long 0xf464918f // vld4.32 {d25,d27,d29,d31}, [r4]
.long 0xf26801f8 // vorr q8, q12, q12
@@ -6248,14 +6246,14 @@ _sk_load_f32_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xf4e40b4f // vld4.32 {d16[0],d18[0],d20[0],d22[0]}, [r4]
.long 0xe3560001 // cmp r6, #1
- .long 0x0afffff3 // beq 58b4 <sk_load_f32_dst_vfp4+0x50>
+ .long 0x0afffff3 // beq 58ac <sk_load_f32_dst_vfp4+0x50>
.long 0xe2845010 // add r5, r4, #16
.long 0xe3560003 // cmp r6, #3
.long 0xf4e50bcf // vld4.32 {d16[1],d18[1],d20[1],d22[1]}, [r5]
- .long 0x3affffef // bcc 58b4 <sk_load_f32_dst_vfp4+0x50>
+ .long 0x3affffef // bcc 58ac <sk_load_f32_dst_vfp4+0x50>
.long 0xe2844020 // add r4, r4, #32
.long 0xf4e41b4f // vld4.32 {d17[0],d19[0],d21[0],d23[0]}, [r4]
- .long 0xeaffffec // b 58b4 <sk_load_f32_dst_vfp4+0x50>
+ .long 0xeaffffec // b 58ac <sk_load_f32_dst_vfp4+0x50>
HIDDEN _sk_store_f32_vfp4
.globl _sk_store_f32_vfp4
@@ -6271,7 +6269,7 @@ _sk_store_f32_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082220e // add r2, r2, lr, lsl #4
- .long 0x1a000005 // bne 5944 <sk_store_f32_vfp4+0x44>
+ .long 0x1a000005 // bne 593c <sk_store_f32_vfp4+0x44>
.long 0xf402018d // vst4.32 {d0,d2,d4,d6}, [r2]!
.long 0xf402118f // vst4.32 {d1,d3,d5,d7}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
@@ -6280,14 +6278,14 @@ _sk_store_f32_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4820b4f // vst4.32 {d0[0],d2[0],d4[0],d6[0]}, [r2]
- .long 0x0afffff8 // beq 5934 <sk_store_f32_vfp4+0x34>
+ .long 0x0afffff8 // beq 592c <sk_store_f32_vfp4+0x34>
.long 0xe2823010 // add r3, r2, #16
.long 0xe35c0003 // cmp ip, #3
.long 0xf4830bcf // vst4.32 {d0[1],d2[1],d4[1],d6[1]}, [r3]
- .long 0x3afffff4 // bcc 5934 <sk_store_f32_vfp4+0x34>
+ .long 0x3afffff4 // bcc 592c <sk_store_f32_vfp4+0x34>
.long 0xe2822020 // add r2, r2, #32
.long 0xf4821b4f // vst4.32 {d1[0],d3[0],d5[0],d7[0]}, [r2]
- .long 0xeafffff1 // b 5934 <sk_store_f32_vfp4+0x34>
+ .long 0xeafffff1 // b 592c <sk_store_f32_vfp4+0x34>
HIDDEN _sk_clamp_x_vfp4
.globl _sk_clamp_x_vfp4
@@ -6968,7 +6966,7 @@ _sk_gradient_vfp4:
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe5931000 // ldr r1, [r3]
.long 0xe3510002 // cmp r1, #2
- .long 0x3a00000a // bcc 62ac <sk_gradient_vfp4+0x5c>
+ .long 0x3a00000a // bcc 62a4 <sk_gradient_vfp4+0x5c>
.long 0xe5932024 // ldr r2, [r3, #36]
.long 0xf2c04051 // vmov.i32 q10, #1
.long 0xf2c00050 // vmov.i32 q8, #0
@@ -6979,7 +6977,7 @@ _sk_gradient_vfp4:
.long 0xf3468ee8 // vcge.f32 q12, q11, q12
.long 0xf35481f2 // vbsl q12, q10, q9
.long 0xf26808e0 // vadd.i32 q8, q12, q8
- .long 0x1afffff9 // bne 6294 <sk_gradient_vfp4+0x44>
+ .long 0x1afffff9 // bne 628c <sk_gradient_vfp4+0x44>
.long 0xee315b90 // vmov.32 r5, d17[1]
.long 0xe5937010 // ldr r7, [r3, #16]
.long 0xee112b90 // vmov.32 r2, d17[0]
@@ -8120,7 +8118,7 @@ _sk_clut_3D_vfp4:
.long 0xee1e2b10 // vmov.32 r2, d14[0]
.long 0xf2660d40 // vsub.f32 q8, q3, q0
.long 0xf2000cf4 // vfma.f32 q0, q8, q10
- .long 0xea000003 // b 72b0 <sk_clut_3D_vfp4+0x500>
+ .long 0xea000003 // b 72a8 <sk_clut_3D_vfp4+0x500>
.long 0x3f7ff972 // .word 0x3f7ff972
.long 0x3f7ff972 // .word 0x3f7ff972
.long 0x3f7ff972 // .word 0x3f7ff972
@@ -8625,7 +8623,7 @@ _sk_clut_4D_vfp4:
.long 0xf20c0cdc // vfma.f32 q0, q14, q6
.long 0xf260cd4e // vsub.f32 q14, q0, q7
.long 0xf20cecfe // vfma.f32 q7, q14, q15
- .long 0xea000003 // b 7a80 <sk_clut_4D_vfp4+0x548>
+ .long 0xea000003 // b 7a78 <sk_clut_4D_vfp4+0x548>
.long 0x3f7ff972 // .word 0x3f7ff972
.long 0x3f7ff972 // .word 0x3f7ff972
.long 0x3f7ff972 // .word 0x3f7ff972
@@ -9348,15 +9346,14 @@ _sk_seed_shader_hsw:
.byte 197,249,110,194 // vmovd %edx,%xmm0
.byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,105,193,2,0 // vbroadcastss 0x2c169(%rip),%ymm1 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
- .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 197,252,88,5,9,195,2,0 // vaddps 0x2c309(%rip),%ymm0,%ymm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x5e8>
- .byte 197,249,110,209 // vmovd %ecx,%xmm2
- .byte 196,226,125,88,210 // vpbroadcastd %xmm2,%ymm2
- .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
+ .byte 197,252,88,5,86,193,2,0 // vaddps 0x2c156(%rip),%ymm0,%ymm0 # 2c200 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 197,249,110,201 // vmovd %ecx,%xmm1
+ .byte 196,226,125,88,201 // vpbroadcastd %xmm1,%ymm1
+ .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
+ .byte 196,226,125,24,21,8,202,2,0 // vbroadcastss 0x2ca08(%rip),%ymm2 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
+ .byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,69,193,2,0 // vbroadcastss 0x2c145(%rip),%ymm2 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,21,253,201,2,0 // vbroadcastss 0x2c9fd(%rip),%ymm2 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -9371,17 +9368,17 @@ _sk_dither_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,121,110,194 // vmovd %edx,%xmm8
.byte 196,66,125,88,192 // vpbroadcastd %xmm8,%ymm8
- .byte 197,61,254,5,228,194,2,0 // vpaddd 0x2c2e4(%rip),%ymm8,%ymm8 # 2c3e0 <_sk_overlay_sse2_8bit+0x608>
+ .byte 197,61,254,5,40,193,2,0 // vpaddd 0x2c128(%rip),%ymm8,%ymm8 # 2c220 <_sk_overlay_sse2_8bit+0x45c>
.byte 197,121,110,201 // vmovd %ecx,%xmm9
.byte 196,66,125,88,201 // vpbroadcastd %xmm9,%ymm9
.byte 196,65,53,239,200 // vpxor %ymm8,%ymm9,%ymm9
- .byte 196,98,125,88,21,9,193,2,0 // vpbroadcastd 0x2c109(%rip),%ymm10 # 2c21c <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,98,125,88,21,193,201,2,0 // vpbroadcastd 0x2c9c1(%rip),%ymm10 # 2cad0 <_sk_overlay_sse2_8bit+0xd0c>
.byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11
.byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10
- .byte 196,98,125,88,37,238,192,2,0 // vpbroadcastd 0x2c0ee(%rip),%ymm12 # 2c220 <_sk_overlay_sse2_8bit+0x448>
- .byte 196,98,125,88,45,233,192,2,0 // vpbroadcastd 0x2c0e9(%rip),%ymm13 # 2c224 <_sk_overlay_sse2_8bit+0x44c>
+ .byte 196,98,125,88,37,166,201,2,0 // vpbroadcastd 0x2c9a6(%rip),%ymm12 # 2cad4 <_sk_overlay_sse2_8bit+0xd10>
+ .byte 196,98,125,88,45,161,201,2,0 // vpbroadcastd 0x2c9a1(%rip),%ymm13 # 2cad8 <_sk_overlay_sse2_8bit+0xd14>
.byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14
.byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14
.byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13
@@ -9396,8 +9393,8 @@ _sk_dither_hsw:
.byte 196,65,61,235,194 // vpor %ymm10,%ymm8,%ymm8
.byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,155,192,2,0 // vbroadcastss 0x2c09b(%rip),%ymm9 # 2c228 <_sk_overlay_sse2_8bit+0x450>
- .byte 196,98,125,24,21,150,192,2,0 // vbroadcastss 0x2c096(%rip),%ymm10 # 2c22c <_sk_overlay_sse2_8bit+0x454>
+ .byte 196,98,125,24,13,83,201,2,0 // vbroadcastss 0x2c953(%rip),%ymm9 # 2cadc <_sk_overlay_sse2_8bit+0xd18>
+ .byte 196,98,125,24,21,78,201,2,0 // vbroadcastss 0x2c94e(%rip),%ymm10 # 2cae0 <_sk_overlay_sse2_8bit+0xd1c>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 196,98,125,24,0 // vbroadcastss (%rax),%ymm8
.byte 196,65,44,89,192 // vmulps %ymm8,%ymm10,%ymm8
@@ -9431,7 +9428,7 @@ HIDDEN _sk_black_color_hsw
FUNCTION(_sk_black_color_hsw)
_sk_black_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,30,192,2,0 // vbroadcastss 0x2c01e(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,214,200,2,0 // vbroadcastss 0x2c8d6(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -9442,7 +9439,7 @@ HIDDEN _sk_white_color_hsw
FUNCTION(_sk_white_color_hsw)
_sk_white_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,5,192,2,0 // vbroadcastss 0x2c005(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,189,200,2,0 // vbroadcastss 0x2c8bd(%rip),%ymm0 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -9488,7 +9485,7 @@ HIDDEN _sk_srcatop_hsw
FUNCTION(_sk_srcatop_hsw)
_sk_srcatop_hsw:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,164,191,2,0 // vbroadcastss 0x2bfa4(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,92,200,2,0 // vbroadcastss 0x2c85c(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0
.byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1
@@ -9504,7 +9501,7 @@ HIDDEN _sk_dstatop_hsw
.globl _sk_dstatop_hsw
FUNCTION(_sk_dstatop_hsw)
_sk_dstatop_hsw:
- .byte 196,98,125,24,5,115,191,2,0 // vbroadcastss 0x2bf73(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,43,200,2,0 // vbroadcastss 0x2c82b(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -9543,7 +9540,7 @@ HIDDEN _sk_srcout_hsw
.globl _sk_srcout_hsw
FUNCTION(_sk_srcout_hsw)
_sk_srcout_hsw:
- .byte 196,98,125,24,5,22,191,2,0 // vbroadcastss 0x2bf16(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,206,199,2,0 // vbroadcastss 0x2c7ce(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -9556,7 +9553,7 @@ HIDDEN _sk_dstout_hsw
.globl _sk_dstout_hsw
FUNCTION(_sk_dstout_hsw)
_sk_dstout_hsw:
- .byte 196,226,125,24,5,245,190,2,0 // vbroadcastss 0x2bef5(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,173,199,2,0 // vbroadcastss 0x2c7ad(%rip),%ymm0 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -9569,7 +9566,7 @@ HIDDEN _sk_srcover_hsw
.globl _sk_srcover_hsw
FUNCTION(_sk_srcover_hsw)
_sk_srcover_hsw:
- .byte 196,98,125,24,5,212,190,2,0 // vbroadcastss 0x2bed4(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,140,199,2,0 // vbroadcastss 0x2c78c(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -9582,7 +9579,7 @@ HIDDEN _sk_dstover_hsw
.globl _sk_dstover_hsw
FUNCTION(_sk_dstover_hsw)
_sk_dstover_hsw:
- .byte 196,98,125,24,5,175,190,2,0 // vbroadcastss 0x2beaf(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,103,199,2,0 // vbroadcastss 0x2c767(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
.byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -9606,7 +9603,7 @@ HIDDEN _sk_multiply_hsw
.globl _sk_multiply_hsw
FUNCTION(_sk_multiply_hsw)
_sk_multiply_hsw:
- .byte 196,98,125,24,5,118,190,2,0 // vbroadcastss 0x2be76(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,46,199,2,0 // vbroadcastss 0x2c72e(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -9629,7 +9626,7 @@ HIDDEN _sk_plus__hsw
FUNCTION(_sk_plus__hsw)
_sk_plus__hsw:
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
- .byte 196,98,125,24,5,37,190,2,0 // vbroadcastss 0x2be25(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,221,198,2,0 // vbroadcastss 0x2c6dd(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 197,244,88,205 // vaddps %ymm5,%ymm1,%ymm1
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
@@ -9659,7 +9656,7 @@ HIDDEN _sk_xor__hsw
.globl _sk_xor__hsw
FUNCTION(_sk_xor__hsw)
_sk_xor__hsw:
- .byte 196,98,125,24,5,208,189,2,0 // vbroadcastss 0x2bdd0(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,136,198,2,0 // vbroadcastss 0x2c688(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -9693,7 +9690,7 @@ _sk_darken_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,84,189,2,0 // vbroadcastss 0x2bd54(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,12,198,2,0 // vbroadcastss 0x2c60c(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -9718,7 +9715,7 @@ _sk_lighten_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,255,188,2,0 // vbroadcastss 0x2bcff(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,183,197,2,0 // vbroadcastss 0x2c5b7(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -9746,7 +9743,7 @@ _sk_difference_hsw:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,158,188,2,0 // vbroadcastss 0x2bc9e(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,86,197,2,0 // vbroadcastss 0x2c556(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -9768,7 +9765,7 @@ _sk_exclusion_hsw:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,88,188,2,0 // vbroadcastss 0x2bc58(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,16,197,2,0 // vbroadcastss 0x2c510(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -9778,7 +9775,7 @@ HIDDEN _sk_colorburn_hsw
.globl _sk_colorburn_hsw
FUNCTION(_sk_colorburn_hsw)
_sk_colorburn_hsw:
- .byte 196,98,125,24,5,66,188,2,0 // vbroadcastss 0x2bc42(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,250,196,2,0 // vbroadcastss 0x2c4fa(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -9836,7 +9833,7 @@ HIDDEN _sk_colordodge_hsw
FUNCTION(_sk_colordodge_hsw)
_sk_colordodge_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,82,187,2,0 // vbroadcastss 0x2bb52(%rip),%ymm9 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,13,10,196,2,0 // vbroadcastss 0x2c40a(%rip),%ymm9 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -9889,7 +9886,7 @@ HIDDEN _sk_hardlight_hsw
.globl _sk_hardlight_hsw
FUNCTION(_sk_hardlight_hsw)
_sk_hardlight_hsw:
- .byte 196,98,125,24,5,108,186,2,0 // vbroadcastss 0x2ba6c(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,36,195,2,0 // vbroadcastss 0x2c324(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -9940,7 +9937,7 @@ HIDDEN _sk_overlay_hsw
.globl _sk_overlay_hsw
FUNCTION(_sk_overlay_hsw)
_sk_overlay_hsw:
- .byte 196,98,125,24,5,160,185,2,0 // vbroadcastss 0x2b9a0(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,88,194,2,0 // vbroadcastss 0x2c258(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -10001,10 +9998,10 @@ _sk_softlight_hsw:
.byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,29,187,184,2,0 // vbroadcastss 0x2b8bb(%rip),%ymm11 # 2c230 <_sk_overlay_sse2_8bit+0x458>
+ .byte 196,98,125,24,29,115,193,2,0 // vbroadcastss 0x2c173(%rip),%ymm11 # 2cae4 <_sk_overlay_sse2_8bit+0xd20>
.byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12
.byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8
- .byte 196,98,125,24,37,172,184,2,0 // vbroadcastss 0x2b8ac(%rip),%ymm12 # 2c234 <_sk_overlay_sse2_8bit+0x45c>
+ .byte 196,98,125,24,37,100,193,2,0 // vbroadcastss 0x2c164(%rip),%ymm12 # 2cae8 <_sk_overlay_sse2_8bit+0xd24>
.byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8
.byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14
.byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14
@@ -10014,7 +10011,7 @@ _sk_softlight_hsw:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,91,184,2,0 // vbroadcastss 0x2b85b(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,19,193,2,0 // vbroadcastss 0x2c113(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -10127,11 +10124,11 @@ _sk_hue_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,115,182,2,0 // vbroadcastss 0x2b673(%rip),%ymm14 # 2c238 <_sk_overlay_sse2_8bit+0x460>
- .byte 196,98,125,24,61,110,182,2,0 // vbroadcastss 0x2b66e(%rip),%ymm15 # 2c23c <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,53,43,191,2,0 // vbroadcastss 0x2bf2b(%rip),%ymm14 # 2caec <_sk_overlay_sse2_8bit+0xd28>
+ .byte 196,98,125,24,61,38,191,2,0 // vbroadcastss 0x2bf26(%rip),%ymm15 # 2caf0 <_sk_overlay_sse2_8bit+0xd2c>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,95,182,2,0 // vbroadcastss 0x2b65f(%rip),%ymm0 # 2c240 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,226,125,24,5,23,191,2,0 // vbroadcastss 0x2bf17(%rip),%ymm0 # 2caf4 <_sk_overlay_sse2_8bit+0xd30>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -10186,7 +10183,7 @@ _sk_hue_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,32,181,2,0 // vbroadcastss 0x2b520(%rip),%ymm1 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,13,216,189,2,0 // vbroadcastss 0x2bdd8(%rip),%ymm1 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -10240,11 +10237,11 @@ _sk_saturation_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,83,180,2,0 // vbroadcastss 0x2b453(%rip),%ymm14 # 2c238 <_sk_overlay_sse2_8bit+0x460>
- .byte 196,98,125,24,61,78,180,2,0 // vbroadcastss 0x2b44e(%rip),%ymm15 # 2c23c <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,53,11,189,2,0 // vbroadcastss 0x2bd0b(%rip),%ymm14 # 2caec <_sk_overlay_sse2_8bit+0xd28>
+ .byte 196,98,125,24,61,6,189,2,0 // vbroadcastss 0x2bd06(%rip),%ymm15 # 2caf0 <_sk_overlay_sse2_8bit+0xd2c>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,63,180,2,0 // vbroadcastss 0x2b43f(%rip),%ymm0 # 2c240 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,226,125,24,5,247,188,2,0 // vbroadcastss 0x2bcf7(%rip),%ymm0 # 2caf4 <_sk_overlay_sse2_8bit+0xd30>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -10299,7 +10296,7 @@ _sk_saturation_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,0,179,2,0 // vbroadcastss 0x2b300(%rip),%ymm1 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,13,184,187,2,0 // vbroadcastss 0x2bbb8(%rip),%ymm1 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -10327,11 +10324,11 @@ _sk_color_hsw:
.byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8
.byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10
.byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11
- .byte 196,98,125,24,45,181,178,2,0 // vbroadcastss 0x2b2b5(%rip),%ymm13 # 2c238 <_sk_overlay_sse2_8bit+0x460>
- .byte 196,98,125,24,53,176,178,2,0 // vbroadcastss 0x2b2b0(%rip),%ymm14 # 2c23c <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,45,109,187,2,0 // vbroadcastss 0x2bb6d(%rip),%ymm13 # 2caec <_sk_overlay_sse2_8bit+0xd28>
+ .byte 196,98,125,24,53,104,187,2,0 // vbroadcastss 0x2bb68(%rip),%ymm14 # 2caf0 <_sk_overlay_sse2_8bit+0xd2c>
.byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12
.byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12
- .byte 196,98,125,24,61,161,178,2,0 // vbroadcastss 0x2b2a1(%rip),%ymm15 # 2c240 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,98,125,24,61,89,187,2,0 // vbroadcastss 0x2bb59(%rip),%ymm15 # 2caf4 <_sk_overlay_sse2_8bit+0xd30>
.byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -10387,7 +10384,7 @@ _sk_color_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,87,177,2,0 // vbroadcastss 0x2b157(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,15,186,2,0 // vbroadcastss 0x2ba0f(%rip),%ymm0 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -10415,11 +10412,11 @@ _sk_luminosity_hsw:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10
.byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11
- .byte 196,98,125,24,45,12,177,2,0 // vbroadcastss 0x2b10c(%rip),%ymm13 # 2c238 <_sk_overlay_sse2_8bit+0x460>
- .byte 196,98,125,24,53,7,177,2,0 // vbroadcastss 0x2b107(%rip),%ymm14 # 2c23c <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,45,196,185,2,0 // vbroadcastss 0x2b9c4(%rip),%ymm13 # 2caec <_sk_overlay_sse2_8bit+0xd28>
+ .byte 196,98,125,24,53,191,185,2,0 // vbroadcastss 0x2b9bf(%rip),%ymm14 # 2caf0 <_sk_overlay_sse2_8bit+0xd2c>
.byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12
.byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12
- .byte 196,98,125,24,61,248,176,2,0 // vbroadcastss 0x2b0f8(%rip),%ymm15 # 2c240 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,98,125,24,61,176,185,2,0 // vbroadcastss 0x2b9b0(%rip),%ymm15 # 2caf4 <_sk_overlay_sse2_8bit+0xd30>
.byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -10475,7 +10472,7 @@ _sk_luminosity_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,174,175,2,0 // vbroadcastss 0x2afae(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,102,184,2,0 // vbroadcastss 0x2b866(%rip),%ymm0 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -10504,19 +10501,19 @@ _sk_srcover_rgba_8888_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,179,0,0,0 // jne 137f <_sk_srcover_rgba_8888_hsw+0xd3>
+ .byte 15,133,179,0,0,0 // jne 137b <_sk_srcover_rgba_8888_hsw+0xd3>
.byte 196,129,126,111,60,152 // vmovdqu (%r8,%r11,4),%ymm7
- .byte 197,197,219,37,38,177,2,0 // vpand 0x2b126(%rip),%ymm7,%ymm4 # 2c400 <_sk_overlay_sse2_8bit+0x628>
+ .byte 197,197,219,37,106,175,2,0 // vpand 0x2af6a(%rip),%ymm7,%ymm4 # 2c240 <_sk_overlay_sse2_8bit+0x47c>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,69,0,45,57,177,2,0 // vpshufb 0x2b139(%rip),%ymm7,%ymm5 # 2c420 <_sk_overlay_sse2_8bit+0x648>
+ .byte 196,226,69,0,45,125,175,2,0 // vpshufb 0x2af7d(%rip),%ymm7,%ymm5 # 2c260 <_sk_overlay_sse2_8bit+0x49c>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,69,0,53,76,177,2,0 // vpshufb 0x2b14c(%rip),%ymm7,%ymm6 # 2c440 <_sk_overlay_sse2_8bit+0x668>
+ .byte 196,226,69,0,53,144,175,2,0 // vpshufb 0x2af90(%rip),%ymm7,%ymm6 # 2c280 <_sk_overlay_sse2_8bit+0x4bc>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,14,175,2,0 // vbroadcastss 0x2af0e(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,198,183,2,0 // vbroadcastss 0x2b7c6(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,45,175,2,0 // vbroadcastss 0x2af2d(%rip),%ymm9 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,13,229,183,2,0 // vbroadcastss 0x2b7e5(%rip),%ymm9 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -10536,7 +10533,7 @@ _sk_srcover_rgba_8888_hsw:
.byte 196,65,53,235,202 // vpor %ymm10,%ymm9,%ymm9
.byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,65 // jne 13b6 <_sk_srcover_rgba_8888_hsw+0x10a>
+ .byte 117,65 // jne 13b2 <_sk_srcover_rgba_8888_hsw+0x10a>
.byte 196,1,126,127,4,152 // vmovdqu %ymm8,(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -10545,33 +10542,33 @@ _sk_srcover_rgba_8888_hsw:
.byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,59,255,255,255 // ja 12d2 <_sk_srcover_rgba_8888_hsw+0x26>
+ .byte 15,135,59,255,255,255 // ja 12ce <_sk_srcover_rgba_8888_hsw+0x26>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,254,0,0,0 // lea 0xfe(%rip),%r10 # 14a0 <_sk_srcover_rgba_8888_hsw+0x1f4>
+ .byte 76,141,21,254,0,0,0 // lea 0xfe(%rip),%r10 # 149c <_sk_srcover_rgba_8888_hsw+0x1f4>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,60,152 // vmovd (%r8,%r11,4),%xmm7
- .byte 233,28,255,255,255 // jmpq 12d2 <_sk_srcover_rgba_8888_hsw+0x26>
+ .byte 233,28,255,255,255 // jmpq 12ce <_sk_srcover_rgba_8888_hsw+0x26>
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,181 // ja 137b <_sk_srcover_rgba_8888_hsw+0xcf>
+ .byte 119,181 // ja 1377 <_sk_srcover_rgba_8888_hsw+0xcf>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 76,141,13,235,0,0,0 // lea 0xeb(%rip),%r9 # 14bc <_sk_srcover_rgba_8888_hsw+0x210>
+ .byte 76,141,13,235,0,0,0 // lea 0xeb(%rip),%r9 # 14b8 <_sk_srcover_rgba_8888_hsw+0x210>
.byte 73,99,4,129 // movslq (%r9,%rax,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,121,126,4,152 // vmovd %xmm8,(%r8,%r11,4)
- .byte 235,153 // jmp 137b <_sk_srcover_rgba_8888_hsw+0xcf>
+ .byte 235,153 // jmp 1377 <_sk_srcover_rgba_8888_hsw+0xcf>
.byte 196,129,121,110,100,152,8 // vmovd 0x8(%r8,%r11,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
.byte 196,227,85,2,252,4 // vpblendd $0x4,%ymm4,%ymm5,%ymm7
.byte 196,129,122,126,36,152 // vmovq (%r8,%r11,4),%xmm4
.byte 196,227,69,2,252,3 // vpblendd $0x3,%ymm4,%ymm7,%ymm7
- .byte 233,201,254,255,255 // jmpq 12d2 <_sk_srcover_rgba_8888_hsw+0x26>
+ .byte 233,201,254,255,255 // jmpq 12ce <_sk_srcover_rgba_8888_hsw+0x26>
.byte 196,129,121,110,100,152,24 // vmovd 0x18(%r8,%r11,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -10584,10 +10581,10 @@ _sk_srcover_rgba_8888_hsw:
.byte 196,227,69,56,252,1 // vinserti128 $0x1,%xmm4,%ymm7,%ymm7
.byte 196,129,122,111,36,152 // vmovdqu (%r8,%r11,4),%xmm4
.byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- .byte 233,122,254,255,255 // jmpq 12d2 <_sk_srcover_rgba_8888_hsw+0x26>
+ .byte 233,122,254,255,255 // jmpq 12ce <_sk_srcover_rgba_8888_hsw+0x26>
.byte 196,3,121,22,68,152,8,2 // vpextrd $0x2,%xmm8,0x8(%r8,%r11,4)
.byte 196,1,121,214,4,152 // vmovq %xmm8,(%r8,%r11,4)
- .byte 233,16,255,255,255 // jmpq 137b <_sk_srcover_rgba_8888_hsw+0xcf>
+ .byte 233,16,255,255,255 // jmpq 1377 <_sk_srcover_rgba_8888_hsw+0xcf>
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,3,121,22,76,152,24,2 // vpextrd $0x2,%xmm9,0x18(%r8,%r11,4)
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
@@ -10595,7 +10592,7 @@ _sk_srcover_rgba_8888_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,1,121,126,76,152,16 // vmovd %xmm9,0x10(%r8,%r11,4)
.byte 196,1,122,127,4,152 // vmovdqu %xmm8,(%r8,%r11,4)
- .byte 233,220,254,255,255 // jmpq 137b <_sk_srcover_rgba_8888_hsw+0xcf>
+ .byte 233,220,254,255,255 // jmpq 1377 <_sk_srcover_rgba_8888_hsw+0xcf>
.byte 144 // nop
.byte 11,255 // or %edi,%edi
.byte 255 // (bad)
@@ -10607,7 +10604,7 @@ _sk_srcover_rgba_8888_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,255 // jg 14b5 <_sk_srcover_rgba_8888_hsw+0x209>
+ .byte 127,255 // jg 14b1 <_sk_srcover_rgba_8888_hsw+0x209>
.byte 255 // (bad)
.byte 255,105,255 // ljmp *-0x1(%rcx)
.byte 255 // (bad)
@@ -10644,7 +10641,7 @@ HIDDEN _sk_clamp_1_hsw
.globl _sk_clamp_1_hsw
FUNCTION(_sk_clamp_1_hsw)
_sk_clamp_1_hsw:
- .byte 196,98,125,24,5,26,173,2,0 // vbroadcastss 0x2ad1a(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,210,181,2,0 // vbroadcastss 0x2b5d2(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -10656,7 +10653,7 @@ HIDDEN _sk_clamp_a_hsw
.globl _sk_clamp_a_hsw
FUNCTION(_sk_clamp_a_hsw)
_sk_clamp_a_hsw:
- .byte 196,98,125,24,5,249,172,2,0 // vbroadcastss 0x2acf9(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,177,181,2,0 // vbroadcastss 0x2b5b1(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -10668,7 +10665,7 @@ HIDDEN _sk_clamp_a_dst_hsw
.globl _sk_clamp_a_dst_hsw
FUNCTION(_sk_clamp_a_dst_hsw)
_sk_clamp_a_dst_hsw:
- .byte 196,98,125,24,5,219,172,2,0 // vbroadcastss 0x2acdb(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,147,181,2,0 // vbroadcastss 0x2b593(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -10701,7 +10698,7 @@ HIDDEN _sk_invert_hsw
.globl _sk_invert_hsw
FUNCTION(_sk_invert_hsw)
_sk_invert_hsw:
- .byte 196,98,125,24,5,150,172,2,0 // vbroadcastss 0x2ac96(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,78,181,2,0 // vbroadcastss 0x2b54e(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -10757,7 +10754,7 @@ FUNCTION(_sk_unpremul_hsw)
_sk_unpremul_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,38,172,2,0 // vbroadcastss 0x2ac26(%rip),%ymm10 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,21,222,180,2,0 // vbroadcastss 0x2b4de(%rip),%ymm10 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -10770,16 +10767,16 @@ HIDDEN _sk_from_srgb_hsw
.globl _sk_from_srgb_hsw
FUNCTION(_sk_from_srgb_hsw)
_sk_from_srgb_hsw:
- .byte 196,98,125,24,5,51,172,2,0 // vbroadcastss 0x2ac33(%rip),%ymm8 # 2c248 <_sk_overlay_sse2_8bit+0x470>
+ .byte 196,98,125,24,5,235,180,2,0 // vbroadcastss 0x2b4eb(%rip),%ymm8 # 2cafc <_sk_overlay_sse2_8bit+0xd38>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,37,172,2,0 // vbroadcastss 0x2ac25(%rip),%ymm11 # 2c24c <_sk_overlay_sse2_8bit+0x474>
- .byte 196,98,125,24,37,8,172,2,0 // vbroadcastss 0x2ac08(%rip),%ymm12 # 2c238 <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,29,221,180,2,0 // vbroadcastss 0x2b4dd(%rip),%ymm11 # 2cb00 <_sk_overlay_sse2_8bit+0xd3c>
+ .byte 196,98,125,24,37,192,180,2,0 // vbroadcastss 0x2b4c0(%rip),%ymm12 # 2caec <_sk_overlay_sse2_8bit+0xd28>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13
- .byte 196,98,125,24,53,13,172,2,0 // vbroadcastss 0x2ac0d(%rip),%ymm14 # 2c250 <_sk_overlay_sse2_8bit+0x478>
+ .byte 196,98,125,24,53,197,180,2,0 // vbroadcastss 0x2b4c5(%rip),%ymm14 # 2cb04 <_sk_overlay_sse2_8bit+0xd40>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,3,172,2,0 // vbroadcastss 0x2ac03(%rip),%ymm10 # 2c254 <_sk_overlay_sse2_8bit+0x47c>
+ .byte 196,98,125,24,21,187,180,2,0 // vbroadcastss 0x2b4bb(%rip),%ymm10 # 2cb08 <_sk_overlay_sse2_8bit+0xd44>
.byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0
.byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -10802,16 +10799,16 @@ HIDDEN _sk_from_srgb_dst_hsw
.globl _sk_from_srgb_dst_hsw
FUNCTION(_sk_from_srgb_dst_hsw)
_sk_from_srgb_dst_hsw:
- .byte 196,98,125,24,5,155,171,2,0 // vbroadcastss 0x2ab9b(%rip),%ymm8 # 2c248 <_sk_overlay_sse2_8bit+0x470>
+ .byte 196,98,125,24,5,83,180,2,0 // vbroadcastss 0x2b453(%rip),%ymm8 # 2cafc <_sk_overlay_sse2_8bit+0xd38>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,141,171,2,0 // vbroadcastss 0x2ab8d(%rip),%ymm11 # 2c24c <_sk_overlay_sse2_8bit+0x474>
- .byte 196,98,125,24,37,112,171,2,0 // vbroadcastss 0x2ab70(%rip),%ymm12 # 2c238 <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,29,69,180,2,0 // vbroadcastss 0x2b445(%rip),%ymm11 # 2cb00 <_sk_overlay_sse2_8bit+0xd3c>
+ .byte 196,98,125,24,37,40,180,2,0 // vbroadcastss 0x2b428(%rip),%ymm12 # 2caec <_sk_overlay_sse2_8bit+0xd28>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,93,168,235 // vfmadd213ps %ymm11,%ymm4,%ymm13
- .byte 196,98,125,24,53,117,171,2,0 // vbroadcastss 0x2ab75(%rip),%ymm14 # 2c250 <_sk_overlay_sse2_8bit+0x478>
+ .byte 196,98,125,24,53,45,180,2,0 // vbroadcastss 0x2b42d(%rip),%ymm14 # 2cb04 <_sk_overlay_sse2_8bit+0xd40>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,107,171,2,0 // vbroadcastss 0x2ab6b(%rip),%ymm10 # 2c254 <_sk_overlay_sse2_8bit+0x47c>
+ .byte 196,98,125,24,21,35,180,2,0 // vbroadcastss 0x2b423(%rip),%ymm10 # 2cb08 <_sk_overlay_sse2_8bit+0xd44>
.byte 196,193,92,194,226,1 // vcmpltps %ymm10,%ymm4,%ymm4
.byte 196,195,21,74,225,64 // vblendvps %ymm4,%ymm9,%ymm13,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -10835,19 +10832,19 @@ HIDDEN _sk_to_srgb_hsw
FUNCTION(_sk_to_srgb_hsw)
_sk_to_srgb_hsw:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,15,171,2,0 // vbroadcastss 0x2ab0f(%rip),%ymm8 # 2c258 <_sk_overlay_sse2_8bit+0x480>
+ .byte 196,98,125,24,5,199,179,2,0 // vbroadcastss 0x2b3c7(%rip),%ymm8 # 2cb0c <_sk_overlay_sse2_8bit+0xd48>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,5,171,2,0 // vbroadcastss 0x2ab05(%rip),%ymm11 # 2c25c <_sk_overlay_sse2_8bit+0x484>
- .byte 196,98,125,24,37,0,171,2,0 // vbroadcastss 0x2ab00(%rip),%ymm12 # 2c260 <_sk_overlay_sse2_8bit+0x488>
+ .byte 196,98,125,24,29,189,179,2,0 // vbroadcastss 0x2b3bd(%rip),%ymm11 # 2cb10 <_sk_overlay_sse2_8bit+0xd4c>
+ .byte 196,98,125,24,37,184,179,2,0 // vbroadcastss 0x2b3b8(%rip),%ymm12 # 2cb14 <_sk_overlay_sse2_8bit+0xd50>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,53,168,235 // vfmadd213ps %ymm11,%ymm9,%ymm13
- .byte 196,98,125,24,53,241,170,2,0 // vbroadcastss 0x2aaf1(%rip),%ymm14 # 2c264 <_sk_overlay_sse2_8bit+0x48c>
+ .byte 196,98,125,24,53,169,179,2,0 // vbroadcastss 0x2b3a9(%rip),%ymm14 # 2cb18 <_sk_overlay_sse2_8bit+0xd54>
.byte 196,66,53,168,238 // vfmadd213ps %ymm14,%ymm9,%ymm13
- .byte 196,98,125,24,61,231,170,2,0 // vbroadcastss 0x2aae7(%rip),%ymm15 # 2c268 <_sk_overlay_sse2_8bit+0x490>
+ .byte 196,98,125,24,61,159,179,2,0 // vbroadcastss 0x2b39f(%rip),%ymm15 # 2cb1c <_sk_overlay_sse2_8bit+0xd58>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,20,89,201 // vmulps %ymm9,%ymm13,%ymm9
- .byte 196,98,125,24,45,211,170,2,0 // vbroadcastss 0x2aad3(%rip),%ymm13 # 2c26c <_sk_overlay_sse2_8bit+0x494>
+ .byte 196,98,125,24,45,139,179,2,0 // vbroadcastss 0x2b38b(%rip),%ymm13 # 2cb20 <_sk_overlay_sse2_8bit+0xd5c>
.byte 196,193,124,194,197,1 // vcmpltps %ymm13,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -10881,26 +10878,26 @@ _sk_rgb_to_hsl_hsw:
.byte 197,116,93,202 // vminps %ymm2,%ymm1,%ymm9
.byte 196,65,124,93,201 // vminps %ymm9,%ymm0,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,238,169,2,0 // vbroadcastss 0x2a9ee(%rip),%ymm11 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,29,166,178,2,0 // vbroadcastss 0x2b2a6(%rip),%ymm11 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13
- .byte 196,98,125,24,53,47,170,2,0 // vbroadcastss 0x2aa2f(%rip),%ymm14 # 2c270 <_sk_overlay_sse2_8bit+0x498>
+ .byte 196,98,125,24,53,231,178,2,0 // vbroadcastss 0x2b2e7(%rip),%ymm14 # 2cb24 <_sk_overlay_sse2_8bit+0xd60>
.byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15
.byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13
.byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12
.byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2
.byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13
- .byte 196,98,125,24,53,22,170,2,0 // vbroadcastss 0x2aa16(%rip),%ymm14 # 2c278 <_sk_overlay_sse2_8bit+0x4a0>
+ .byte 196,98,125,24,53,206,178,2,0 // vbroadcastss 0x2b2ce(%rip),%ymm14 # 2cb2c <_sk_overlay_sse2_8bit+0xd68>
.byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13
- .byte 196,98,125,24,53,4,170,2,0 // vbroadcastss 0x2aa04(%rip),%ymm14 # 2c274 <_sk_overlay_sse2_8bit+0x49c>
+ .byte 196,98,125,24,53,188,178,2,0 // vbroadcastss 0x2b2bc(%rip),%ymm14 # 2cb28 <_sk_overlay_sse2_8bit+0xd64>
.byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2
.byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1
.byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,29,123,169,2,0 // vbroadcastss 0x2a97b(%rip),%ymm11 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,29,51,178,2,0 // vbroadcastss 0x2b233(%rip),%ymm11 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2
.byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11
.byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12
@@ -10910,7 +10907,7 @@ _sk_rgb_to_hsl_hsw:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0
.byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- .byte 196,98,125,24,5,170,169,2,0 // vbroadcastss 0x2a9aa(%rip),%ymm8 # 2c27c <_sk_overlay_sse2_8bit+0x4a4>
+ .byte 196,98,125,24,5,98,178,2,0 // vbroadcastss 0x2b262(%rip),%ymm8 # 2cb30 <_sk_overlay_sse2_8bit+0xd6c>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -10927,30 +10924,30 @@ _sk_hsl_to_rgb_hsw:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 197,252,40,224 // vmovaps %ymm0,%ymm4
- .byte 196,98,125,24,5,7,169,2,0 // vbroadcastss 0x2a907(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,191,177,2,0 // vbroadcastss 0x2b1bf(%rip),%ymm8 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10
.byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11
.byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
- .byte 196,98,125,24,13,70,169,2,0 // vbroadcastss 0x2a946(%rip),%ymm9 # 2c274 <_sk_overlay_sse2_8bit+0x49c>
+ .byte 196,98,125,24,13,254,177,2,0 // vbroadcastss 0x2b1fe(%rip),%ymm9 # 2cb28 <_sk_overlay_sse2_8bit+0xd64>
.byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9
- .byte 196,98,125,24,29,68,169,2,0 // vbroadcastss 0x2a944(%rip),%ymm11 # 2c280 <_sk_overlay_sse2_8bit+0x4a8>
+ .byte 196,98,125,24,29,252,177,2,0 // vbroadcastss 0x2b1fc(%rip),%ymm11 # 2cb34 <_sk_overlay_sse2_8bit+0xd70>
.byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,45,22,169,2,0 // vbroadcastss 0x2a916(%rip),%ymm13 # 2c270 <_sk_overlay_sse2_8bit+0x498>
+ .byte 196,98,125,24,45,206,177,2,0 // vbroadcastss 0x2b1ce(%rip),%ymm13 # 2cb24 <_sk_overlay_sse2_8bit+0xd60>
.byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0
- .byte 196,98,125,24,53,16,169,2,0 // vbroadcastss 0x2a910(%rip),%ymm14 # 2c278 <_sk_overlay_sse2_8bit+0x4a0>
+ .byte 196,98,125,24,53,200,177,2,0 // vbroadcastss 0x2b1c8(%rip),%ymm14 # 2cb2c <_sk_overlay_sse2_8bit+0xd68>
.byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12
.byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12
- .byte 196,226,125,24,29,10,169,2,0 // vbroadcastss 0x2a90a(%rip),%ymm3 # 2c284 <_sk_overlay_sse2_8bit+0x4ac>
+ .byte 196,226,125,24,29,194,177,2,0 // vbroadcastss 0x2b1c2(%rip),%ymm3 # 2cb38 <_sk_overlay_sse2_8bit+0xd74>
.byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7
.byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7
.byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12
.byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,37,225,168,2,0 // vbroadcastss 0x2a8e1(%rip),%ymm12 # 2c27c <_sk_overlay_sse2_8bit+0x4a4>
+ .byte 196,98,125,24,37,153,177,2,0 // vbroadcastss 0x2b199(%rip),%ymm12 # 2cb30 <_sk_overlay_sse2_8bit+0xd6c>
.byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15
.byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0
.byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -10966,7 +10963,7 @@ _sk_hsl_to_rgb_hsw:
.byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0
.byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7
.byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- .byte 196,226,125,24,5,149,168,2,0 // vbroadcastss 0x2a895(%rip),%ymm0 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,226,125,24,5,77,177,2,0 // vbroadcastss 0x2b14d(%rip),%ymm0 # 2cb3c <_sk_overlay_sse2_8bit+0xd78>
.byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0
.byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
@@ -11018,12 +11015,12 @@ _sk_scale_u8_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,58 // jne 1ae2 <_sk_scale_u8_hsw+0x52>
+ .byte 117,58 // jne 1ade <_sk_scale_u8_hsw+0x52>
.byte 196,2,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm8
- .byte 197,57,219,5,218,177,2,0 // vpand 0x2b1da(%rip),%xmm8,%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,57,219,5,190,177,2,0 // vpand 0x2b1be(%rip),%xmm8,%xmm8 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,195,167,2,0 // vbroadcastss 0x2a7c3(%rip),%ymm9 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,13,123,176,2,0 // vbroadcastss 0x2b07b(%rip),%ymm9 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -11036,15 +11033,15 @@ _sk_scale_u8_hsw:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,183 // ja 1aae <_sk_scale_u8_hsw+0x1e>
+ .byte 119,183 // ja 1aaa <_sk_scale_u8_hsw+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # 1b7c <_sk_scale_u8_hsw+0xec>
+ .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # 1b78 <_sk_scale_u8_hsw+0xec>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 235,152 // jmp 1aae <_sk_scale_u8_hsw+0x1e>
+ .byte 235,152 // jmp 1aaa <_sk_scale_u8_hsw+0x1e>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -11052,7 +11049,7 @@ _sk_scale_u8_hsw:
.byte 197,121,110,200 // vmovd %eax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
- .byte 233,111,255,255,255 // jmpq 1aae <_sk_scale_u8_hsw+0x1e>
+ .byte 233,111,255,255,255 // jmpq 1aaa <_sk_scale_u8_hsw+0x1e>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -11063,7 +11060,7 @@ _sk_scale_u8_hsw:
.byte 196,1,121,110,12,24 // vmovd (%r8,%r11,1),%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
- .byte 233,51,255,255,255 // jmpq 1aae <_sk_scale_u8_hsw+0x1e>
+ .byte 233,51,255,255,255 // jmpq 1aaa <_sk_scale_u8_hsw+0x1e>
.byte 144 // nop
.byte 143 // (bad)
.byte 255 // (bad)
@@ -11072,7 +11069,7 @@ _sk_scale_u8_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf001b8c <_sk_overlay_sse2_8bit+0xffffffffdefd5db4>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf001b88 <_sk_overlay_sse2_8bit+0xffffffffdefd5dc4>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -11095,23 +11092,23 @@ _sk_scale_565_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,161,0,0,0 // jne 1c58 <_sk_scale_565_hsw+0xc0>
+ .byte 15,133,161,0,0,0 // jne 1c54 <_sk_scale_565_hsw+0xc0>
.byte 196,1,122,111,4,88 // vmovdqu (%r8,%r11,2),%xmm8
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
- .byte 196,98,125,88,13,197,166,2,0 // vpbroadcastd 0x2a6c5(%rip),%ymm9 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,98,125,88,13,125,175,2,0 // vpbroadcastd 0x2af7d(%rip),%ymm9 # 2cb44 <_sk_overlay_sse2_8bit+0xd80>
.byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,182,166,2,0 // vbroadcastss 0x2a6b6(%rip),%ymm10 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,98,125,24,21,110,175,2,0 // vbroadcastss 0x2af6e(%rip),%ymm10 # 2cb48 <_sk_overlay_sse2_8bit+0xd84>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,88,21,172,166,2,0 // vpbroadcastd 0x2a6ac(%rip),%ymm10 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,98,125,88,21,100,175,2,0 // vpbroadcastd 0x2af64(%rip),%ymm10 # 2cb4c <_sk_overlay_sse2_8bit+0xd88>
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,157,166,2,0 // vbroadcastss 0x2a69d(%rip),%ymm11 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,98,125,24,29,85,175,2,0 // vbroadcastss 0x2af55(%rip),%ymm11 # 2cb50 <_sk_overlay_sse2_8bit+0xd8c>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,88,29,147,166,2,0 // vpbroadcastd 0x2a693(%rip),%ymm11 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,98,125,88,29,75,175,2,0 // vpbroadcastd 0x2af4b(%rip),%ymm11 # 2cb54 <_sk_overlay_sse2_8bit+0xd90>
.byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,132,166,2,0 // vbroadcastss 0x2a684(%rip),%ymm11 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,98,125,24,29,60,175,2,0 // vbroadcastss 0x2af3c(%rip),%ymm11 # 2cb58 <_sk_overlay_sse2_8bit+0xd94>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
.byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
@@ -11130,27 +11127,27 @@ _sk_scale_565_hsw:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,76,255,255,255 // ja 1bbd <_sk_scale_565_hsw+0x25>
+ .byte 15,135,76,255,255,255 // ja 1bb9 <_sk_scale_565_hsw+0x25>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,100,0,0,0 // lea 0x64(%rip),%r10 # 1ce0 <_sk_scale_565_hsw+0x148>
+ .byte 76,141,21,100,0,0,0 // lea 0x64(%rip),%r10 # 1cdc <_sk_scale_565_hsw+0x148>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 233,42,255,255,255 // jmpq 1bbd <_sk_scale_565_hsw+0x25>
+ .byte 233,42,255,255,255 // jmpq 1bb9 <_sk_scale_565_hsw+0x25>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,1,57,196,68,88,4,2 // vpinsrw $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,121,110,12,88 // vmovd (%r8,%r11,2),%xmm9
.byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
- .byte 233,12,255,255,255 // jmpq 1bbd <_sk_scale_565_hsw+0x25>
+ .byte 233,12,255,255,255 // jmpq 1bb9 <_sk_scale_565_hsw+0x25>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,1,57,196,68,88,12,6 // vpinsrw $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,57,196,68,88,10,5 // vpinsrw $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,57,196,68,88,8,4 // vpinsrw $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,122,126,12,88 // vmovq (%r8,%r11,2),%xmm9
.byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
- .byte 233,222,254,255,255 // jmpq 1bbd <_sk_scale_565_hsw+0x25>
+ .byte 233,222,254,255,255 // jmpq 1bb9 <_sk_scale_565_hsw+0x25>
.byte 144 // nop
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -11200,12 +11197,12 @@ _sk_lerp_u8_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,78 // jne 1d91 <_sk_lerp_u8_hsw+0x66>
+ .byte 117,78 // jne 1d8d <_sk_lerp_u8_hsw+0x66>
.byte 196,2,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm8
- .byte 197,57,219,5,63,175,2,0 // vpand 0x2af3f(%rip),%xmm8,%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,57,219,5,35,175,2,0 // vpand 0x2af23(%rip),%xmm8,%xmm8 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,40,165,2,0 // vbroadcastss 0x2a528(%rip),%ymm9 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,13,224,173,2,0 // vbroadcastss 0x2ade0(%rip),%ymm9 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -11222,15 +11219,15 @@ _sk_lerp_u8_hsw:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,163 // ja 1d49 <_sk_lerp_u8_hsw+0x1e>
+ .byte 119,163 // ja 1d45 <_sk_lerp_u8_hsw+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,123,0,0,0 // lea 0x7b(%rip),%r10 # 1e2c <_sk_lerp_u8_hsw+0x101>
+ .byte 76,141,21,123,0,0,0 // lea 0x7b(%rip),%r10 # 1e28 <_sk_lerp_u8_hsw+0x101>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 235,132 // jmp 1d49 <_sk_lerp_u8_hsw+0x1e>
+ .byte 235,132 // jmp 1d45 <_sk_lerp_u8_hsw+0x1e>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -11238,7 +11235,7 @@ _sk_lerp_u8_hsw:
.byte 197,121,110,200 // vmovd %eax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
- .byte 233,91,255,255,255 // jmpq 1d49 <_sk_lerp_u8_hsw+0x1e>
+ .byte 233,91,255,255,255 // jmpq 1d45 <_sk_lerp_u8_hsw+0x1e>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -11249,7 +11246,7 @@ _sk_lerp_u8_hsw:
.byte 196,1,121,110,12,24 // vmovd (%r8,%r11,1),%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
- .byte 233,31,255,255,255 // jmpq 1d49 <_sk_lerp_u8_hsw+0x1e>
+ .byte 233,31,255,255,255 // jmpq 1d45 <_sk_lerp_u8_hsw+0x1e>
.byte 102,144 // xchg %ax,%ax
.byte 142,255 // mov %edi,%?
.byte 255 // (bad)
@@ -11257,7 +11254,7 @@ _sk_lerp_u8_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde001e3c <_sk_overlay_sse2_8bit+0xffffffffddfd6064>
+ .byte 232,255,255,255,221 // callq ffffffffde001e38 <_sk_overlay_sse2_8bit+0xffffffffddfd6074>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -11280,23 +11277,23 @@ _sk_lerp_565_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,181,0,0,0 // jne 1f1c <_sk_lerp_565_hsw+0xd4>
+ .byte 15,133,181,0,0,0 // jne 1f18 <_sk_lerp_565_hsw+0xd4>
.byte 196,1,122,111,4,88 // vmovdqu (%r8,%r11,2),%xmm8
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
- .byte 196,98,125,88,13,21,164,2,0 // vpbroadcastd 0x2a415(%rip),%ymm9 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,98,125,88,13,205,172,2,0 // vpbroadcastd 0x2accd(%rip),%ymm9 # 2cb44 <_sk_overlay_sse2_8bit+0xd80>
.byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,6,164,2,0 // vbroadcastss 0x2a406(%rip),%ymm10 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,98,125,24,21,190,172,2,0 // vbroadcastss 0x2acbe(%rip),%ymm10 # 2cb48 <_sk_overlay_sse2_8bit+0xd84>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,88,21,252,163,2,0 // vpbroadcastd 0x2a3fc(%rip),%ymm10 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,98,125,88,21,180,172,2,0 // vpbroadcastd 0x2acb4(%rip),%ymm10 # 2cb4c <_sk_overlay_sse2_8bit+0xd88>
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,237,163,2,0 // vbroadcastss 0x2a3ed(%rip),%ymm11 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,98,125,24,29,165,172,2,0 // vbroadcastss 0x2aca5(%rip),%ymm11 # 2cb50 <_sk_overlay_sse2_8bit+0xd8c>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,88,29,227,163,2,0 // vpbroadcastd 0x2a3e3(%rip),%ymm11 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,98,125,88,29,155,172,2,0 // vpbroadcastd 0x2ac9b(%rip),%ymm11 # 2cb54 <_sk_overlay_sse2_8bit+0xd90>
.byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,212,163,2,0 // vbroadcastss 0x2a3d4(%rip),%ymm11 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,98,125,24,29,140,172,2,0 // vbroadcastss 0x2ac8c(%rip),%ymm11 # 2cb58 <_sk_overlay_sse2_8bit+0xd94>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
.byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
@@ -11319,27 +11316,27 @@ _sk_lerp_565_hsw:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,56,255,255,255 // ja 1e6d <_sk_lerp_565_hsw+0x25>
+ .byte 15,135,56,255,255,255 // ja 1e69 <_sk_lerp_565_hsw+0x25>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,100,0,0,0 // lea 0x64(%rip),%r10 # 1fa4 <_sk_lerp_565_hsw+0x15c>
+ .byte 76,141,21,100,0,0,0 // lea 0x64(%rip),%r10 # 1fa0 <_sk_lerp_565_hsw+0x15c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 233,22,255,255,255 // jmpq 1e6d <_sk_lerp_565_hsw+0x25>
+ .byte 233,22,255,255,255 // jmpq 1e69 <_sk_lerp_565_hsw+0x25>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,1,57,196,68,88,4,2 // vpinsrw $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,121,110,12,88 // vmovd (%r8,%r11,2),%xmm9
.byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
- .byte 233,248,254,255,255 // jmpq 1e6d <_sk_lerp_565_hsw+0x25>
+ .byte 233,248,254,255,255 // jmpq 1e69 <_sk_lerp_565_hsw+0x25>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,1,57,196,68,88,12,6 // vpinsrw $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,57,196,68,88,10,5 // vpinsrw $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,57,196,68,88,8,4 // vpinsrw $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,122,126,12,88 // vmovq (%r8,%r11,2),%xmm9
.byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
- .byte 233,202,254,255,255 // jmpq 1e6d <_sk_lerp_565_hsw+0x25>
+ .byte 233,202,254,255,255 // jmpq 1e69 <_sk_lerp_565_hsw+0x25>
.byte 144 // nop
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -11368,23 +11365,23 @@ _sk_load_tables_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,0 // mov (%rax),%r8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,103 // jne 2031 <_sk_load_tables_hsw+0x71>
+ .byte 117,103 // jne 202d <_sk_load_tables_hsw+0x71>
.byte 196,193,126,111,28,144 // vmovdqu (%r8,%rdx,4),%ymm3
- .byte 197,229,219,13,136,164,2,0 // vpand 0x2a488(%rip),%ymm3,%ymm1 # 2c460 <_sk_overlay_sse2_8bit+0x688>
+ .byte 197,229,219,13,204,162,2,0 // vpand 0x2a2cc(%rip),%ymm3,%ymm1 # 2c2a0 <_sk_overlay_sse2_8bit+0x4dc>
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 76,139,64,8 // mov 0x8(%rax),%r8
.byte 76,139,72,16 // mov 0x10(%rax),%r9
.byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
.byte 196,194,109,146,4,136 // vgatherdps %ymm2,(%r8,%ymm1,4),%ymm0
- .byte 196,226,101,0,21,136,164,2,0 // vpshufb 0x2a488(%rip),%ymm3,%ymm2 # 2c480 <_sk_overlay_sse2_8bit+0x6a8>
+ .byte 196,226,101,0,21,204,162,2,0 // vpshufb 0x2a2cc(%rip),%ymm3,%ymm2 # 2c2c0 <_sk_overlay_sse2_8bit+0x4fc>
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,194,53,146,12,145 // vgatherdps %ymm9,(%r9,%ymm2,4),%ymm1
.byte 72,139,64,24 // mov 0x18(%rax),%rax
- .byte 196,98,101,0,13,144,164,2,0 // vpshufb 0x2a490(%rip),%ymm3,%ymm9 # 2c4a0 <_sk_overlay_sse2_8bit+0x6c8>
+ .byte 196,98,101,0,13,212,162,2,0 // vpshufb 0x2a2d4(%rip),%ymm3,%ymm9 # 2c2e0 <_sk_overlay_sse2_8bit+0x51c>
.byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,100,162,2,0 // vbroadcastss 0x2a264(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,28,171,2,0 // vbroadcastss 0x2ab1c(%rip),%ymm8 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -11393,21 +11390,21 @@ _sk_load_tables_hsw:
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,139 // ja 1fd0 <_sk_load_tables_hsw+0x10>
+ .byte 119,139 // ja 1fcc <_sk_load_tables_hsw+0x10>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,140,0,0,0 // lea 0x8c(%rip),%r10 # 20dc <_sk_load_tables_hsw+0x11c>
+ .byte 76,141,21,140,0,0,0 // lea 0x8c(%rip),%r10 # 20d8 <_sk_load_tables_hsw+0x11c>
.byte 79,99,12,138 // movslq (%r10,%r9,4),%r9
.byte 77,1,209 // add %r10,%r9
.byte 65,255,225 // jmpq *%r9
.byte 196,193,121,110,28,144 // vmovd (%r8,%rdx,4),%xmm3
- .byte 233,107,255,255,255 // jmpq 1fd0 <_sk_load_tables_hsw+0x10>
+ .byte 233,107,255,255,255 // jmpq 1fcc <_sk_load_tables_hsw+0x10>
.byte 196,193,121,110,68,144,8 // vmovd 0x8(%r8,%rdx,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
.byte 196,227,117,2,216,4 // vpblendd $0x4,%ymm0,%ymm1,%ymm3
.byte 196,193,122,126,4,144 // vmovq (%r8,%rdx,4),%xmm0
.byte 196,227,101,2,216,3 // vpblendd $0x3,%ymm0,%ymm3,%ymm3
- .byte 233,68,255,255,255 // jmpq 1fd0 <_sk_load_tables_hsw+0x10>
+ .byte 233,68,255,255,255 // jmpq 1fcc <_sk_load_tables_hsw+0x10>
.byte 196,193,121,110,68,144,24 // vmovd 0x18(%r8,%rdx,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -11420,9 +11417,9 @@ _sk_load_tables_hsw:
.byte 196,227,101,56,216,1 // vinserti128 $0x1,%xmm0,%ymm3,%ymm3
.byte 196,193,122,111,4,144 // vmovdqu (%r8,%rdx,4),%xmm0
.byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- .byte 233,245,254,255,255 // jmpq 1fd0 <_sk_load_tables_hsw+0x10>
+ .byte 233,245,254,255,255 // jmpq 1fcc <_sk_load_tables_hsw+0x10>
.byte 144 // nop
- .byte 126,255 // jle 20dd <_sk_load_tables_hsw+0x11d>
+ .byte 126,255 // jle 20d9 <_sk_load_tables_hsw+0x11d>
.byte 255 // (bad)
.byte 255,159,255,255,255,137 // lcall *-0x76000001(%rdi)
.byte 255 // (bad)
@@ -11450,7 +11447,7 @@ _sk_load_tables_u16_be_hsw:
.byte 76,139,0 // mov (%rax),%r8
.byte 76,141,12,149,0,0,0,0 // lea 0x0(,%rdx,4),%r9
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,201,0,0,0 // jne 21d7 <_sk_load_tables_u16_be_hsw+0xdf>
+ .byte 15,133,201,0,0,0 // jne 21d3 <_sk_load_tables_u16_be_hsw+0xdf>
.byte 196,1,121,16,4,72 // vmovupd (%r8,%r9,2),%xmm8
.byte 196,129,121,16,84,72,16 // vmovupd 0x10(%r8,%r9,2),%xmm2
.byte 196,129,121,16,92,72,32 // vmovupd 0x20(%r8,%r9,2),%xmm3
@@ -11466,7 +11463,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1
.byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2
.byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8
- .byte 197,121,111,21,49,171,2,0 // vmovdqa 0x2ab31(%rip),%xmm10 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,121,111,21,21,171,2,0 // vmovdqa 0x2ab15(%rip),%xmm10 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -11488,36 +11485,36 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3
.byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,218,160,2,0 // vbroadcastss 0x2a0da(%rip),%ymm8 # 2c2a8 <_sk_overlay_sse2_8bit+0x4d0>
+ .byte 196,98,125,24,5,146,169,2,0 // vbroadcastss 0x2a992(%rip),%ymm8 # 2cb5c <_sk_overlay_sse2_8bit+0xd98>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,123,16,4,72 // vmovsd (%r8,%r9,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,85 // je 223d <_sk_load_tables_u16_be_hsw+0x145>
+ .byte 116,85 // je 2239 <_sk_load_tables_u16_be_hsw+0x145>
.byte 196,1,57,22,68,72,8 // vmovhpd 0x8(%r8,%r9,2),%xmm8,%xmm8
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,72 // jb 223d <_sk_load_tables_u16_be_hsw+0x145>
+ .byte 114,72 // jb 2239 <_sk_load_tables_u16_be_hsw+0x145>
.byte 196,129,123,16,84,72,16 // vmovsd 0x10(%r8,%r9,2),%xmm2
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 116,72 // je 224a <_sk_load_tables_u16_be_hsw+0x152>
+ .byte 116,72 // je 2246 <_sk_load_tables_u16_be_hsw+0x152>
.byte 196,129,105,22,84,72,24 // vmovhpd 0x18(%r8,%r9,2),%xmm2,%xmm2
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,59 // jb 224a <_sk_load_tables_u16_be_hsw+0x152>
+ .byte 114,59 // jb 2246 <_sk_load_tables_u16_be_hsw+0x152>
.byte 196,129,123,16,92,72,32 // vmovsd 0x20(%r8,%r9,2),%xmm3
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 15,132,9,255,255,255 // je 2129 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 15,132,9,255,255,255 // je 2125 <_sk_load_tables_u16_be_hsw+0x31>
.byte 196,129,97,22,92,72,40 // vmovhpd 0x28(%r8,%r9,2),%xmm3,%xmm3
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 15,130,248,254,255,255 // jb 2129 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 15,130,248,254,255,255 // jb 2125 <_sk_load_tables_u16_be_hsw+0x31>
.byte 196,1,122,126,76,72,48 // vmovq 0x30(%r8,%r9,2),%xmm9
- .byte 233,236,254,255,255 // jmpq 2129 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,236,254,255,255 // jmpq 2125 <_sk_load_tables_u16_be_hsw+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,223,254,255,255 // jmpq 2129 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,223,254,255,255 // jmpq 2125 <_sk_load_tables_u16_be_hsw+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,214,254,255,255 // jmpq 2129 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,214,254,255,255 // jmpq 2125 <_sk_load_tables_u16_be_hsw+0x31>
HIDDEN _sk_load_tables_rgb_u16_be_hsw
.globl _sk_load_tables_rgb_u16_be_hsw
@@ -11527,7 +11524,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 76,139,0 // mov (%rax),%r8
.byte 76,141,12,82 // lea (%rdx,%rdx,2),%r9
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,193,0,0,0 // jne 2326 <_sk_load_tables_rgb_u16_be_hsw+0xd3>
+ .byte 15,133,193,0,0,0 // jne 2322 <_sk_load_tables_rgb_u16_be_hsw+0xd3>
.byte 196,1,122,111,28,72 // vmovdqu (%r8,%r9,2),%xmm11
.byte 196,129,122,111,92,72,12 // vmovdqu 0xc(%r8,%r9,2),%xmm3
.byte 196,129,122,111,84,72,24 // vmovdqu 0x18(%r8,%r9,2),%xmm2
@@ -11548,7 +11545,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 197,185,108,211 // vpunpcklqdq %xmm3,%xmm8,%xmm2
.byte 197,185,109,219 // vpunpckhqdq %xmm3,%xmm8,%xmm3
.byte 197,113,108,192 // vpunpcklqdq %xmm0,%xmm1,%xmm8
- .byte 197,121,111,13,192,169,2,0 // vmovdqa 0x2a9c0(%rip),%xmm9 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,121,111,13,164,169,2,0 // vmovdqa 0x2a9a4(%rip),%xmm9 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 196,193,105,219,193 // vpand %xmm9,%xmm2,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 196,65,45,118,210 // vpcmpeqd %ymm10,%ymm10,%ymm10
@@ -11565,76 +11562,76 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 196,226,125,51,218 // vpmovzxwd %xmm2,%ymm3
.byte 196,226,45,146,20,152 // vgatherdps %ymm10,(%rax,%ymm3,4),%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,244,158,2,0 // vbroadcastss 0x29ef4(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,172,167,2,0 // vbroadcastss 0x2a7ac(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,72 // vmovd (%r8,%r9,2),%xmm0
.byte 196,1,121,196,92,72,4,2 // vpinsrw $0x2,0x4(%r8,%r9,2),%xmm0,%xmm11
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,32 // jne 235f <_sk_load_tables_rgb_u16_be_hsw+0x10c>
+ .byte 117,32 // jne 235b <_sk_load_tables_rgb_u16_be_hsw+0x10c>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
- .byte 233,59,255,255,255 // jmpq 229a <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ .byte 233,59,255,255,255 // jmpq 2296 <_sk_load_tables_rgb_u16_be_hsw+0x47>
.byte 196,129,121,110,68,72,6 // vmovd 0x6(%r8,%r9,2),%xmm0
.byte 196,1,121,196,68,72,10,2 // vpinsrw $0x2,0xa(%r8,%r9,2),%xmm0,%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,49 // jb 23aa <_sk_load_tables_rgb_u16_be_hsw+0x157>
+ .byte 114,49 // jb 23a6 <_sk_load_tables_rgb_u16_be_hsw+0x157>
.byte 196,129,121,110,68,72,12 // vmovd 0xc(%r8,%r9,2),%xmm0
.byte 196,129,121,196,92,72,16,2 // vpinsrw $0x2,0x10(%r8,%r9,2),%xmm0,%xmm3
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 117,50 // jne 23c5 <_sk_load_tables_rgb_u16_be_hsw+0x172>
+ .byte 117,50 // jne 23c1 <_sk_load_tables_rgb_u16_be_hsw+0x172>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
- .byte 233,240,254,255,255 // jmpq 229a <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ .byte 233,240,254,255,255 // jmpq 2296 <_sk_load_tables_rgb_u16_be_hsw+0x47>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
- .byte 233,213,254,255,255 // jmpq 229a <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ .byte 233,213,254,255,255 // jmpq 2296 <_sk_load_tables_rgb_u16_be_hsw+0x47>
.byte 196,129,121,110,68,72,18 // vmovd 0x12(%r8,%r9,2),%xmm0
.byte 196,1,121,196,84,72,22,2 // vpinsrw $0x2,0x16(%r8,%r9,2),%xmm0,%xmm10
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,40 // jb 2407 <_sk_load_tables_rgb_u16_be_hsw+0x1b4>
+ .byte 114,40 // jb 2403 <_sk_load_tables_rgb_u16_be_hsw+0x1b4>
.byte 196,129,121,110,68,72,24 // vmovd 0x18(%r8,%r9,2),%xmm0
.byte 196,129,121,196,84,72,28,2 // vpinsrw $0x2,0x1c(%r8,%r9,2),%xmm0,%xmm2
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 117,32 // jne 2419 <_sk_load_tables_rgb_u16_be_hsw+0x1c6>
+ .byte 117,32 // jne 2415 <_sk_load_tables_rgb_u16_be_hsw+0x1c6>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
- .byte 233,147,254,255,255 // jmpq 229a <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ .byte 233,147,254,255,255 // jmpq 2296 <_sk_load_tables_rgb_u16_be_hsw+0x47>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
- .byte 233,129,254,255,255 // jmpq 229a <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ .byte 233,129,254,255,255 // jmpq 2296 <_sk_load_tables_rgb_u16_be_hsw+0x47>
.byte 196,129,121,110,68,72,30 // vmovd 0x1e(%r8,%r9,2),%xmm0
.byte 196,1,121,196,100,72,34,2 // vpinsrw $0x2,0x22(%r8,%r9,2),%xmm0,%xmm12
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 114,25 // jb 244c <_sk_load_tables_rgb_u16_be_hsw+0x1f9>
+ .byte 114,25 // jb 2448 <_sk_load_tables_rgb_u16_be_hsw+0x1f9>
.byte 196,129,121,110,68,72,36 // vmovd 0x24(%r8,%r9,2),%xmm0
.byte 196,129,121,196,68,72,40,2 // vpinsrw $0x2,0x28(%r8,%r9,2),%xmm0,%xmm0
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
- .byte 233,78,254,255,255 // jmpq 229a <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ .byte 233,78,254,255,255 // jmpq 2296 <_sk_load_tables_rgb_u16_be_hsw+0x47>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
- .byte 233,69,254,255,255 // jmpq 229a <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ .byte 233,69,254,255,255 // jmpq 2296 <_sk_load_tables_rgb_u16_be_hsw+0x47>
HIDDEN _sk_byte_tables_hsw
.globl _sk_byte_tables_hsw
FUNCTION(_sk_byte_tables_hsw)
_sk_byte_tables_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,228,157,2,0 // vbroadcastss 0x29de4(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,156,166,2,0 // vbroadcastss 0x2a69c(%rip),%ymm8 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,200 // vmovq %xmm9,%r8
@@ -11756,7 +11753,7 @@ _sk_byte_tables_hsw:
.byte 67,15,182,4,17 // movzbl (%r9,%r10,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,205,155,2,0 // vbroadcastss 0x29bcd(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,133,164,2,0 // vbroadcastss 0x2a485(%rip),%ymm8 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -11872,7 +11869,7 @@ _sk_byte_tables_rgb_hsw:
.byte 67,15,182,4,17 // movzbl (%r9,%r10,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,181,153,2,0 // vbroadcastss 0x299b5(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,109,162,2,0 // vbroadcastss 0x2a26d(%rip),%ymm8 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -11971,33 +11968,33 @@ _sk_parametric_r_hsw:
.byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10
.byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,171,152,2,0 // vbroadcastss 0x298ab(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
- .byte 196,98,125,24,45,166,152,2,0 // vbroadcastss 0x298a6(%rip),%ymm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,99,161,2,0 // vbroadcastss 0x2a163(%rip),%ymm12 # 2cb60 <_sk_overlay_sse2_8bit+0xd9c>
+ .byte 196,98,125,24,45,94,161,2,0 // vbroadcastss 0x2a15e(%rip),%ymm13 # 2cb64 <_sk_overlay_sse2_8bit+0xda0>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,252,151,2,0 // vbroadcastss 0x297fc(%rip),%ymm13 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,45,180,160,2,0 // vbroadcastss 0x2a0b4(%rip),%ymm13 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,142,152,2,0 // vbroadcastss 0x2988e(%rip),%ymm13 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,45,70,161,2,0 // vbroadcastss 0x2a146(%rip),%ymm13 # 2cb68 <_sk_overlay_sse2_8bit+0xda4>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,132,152,2,0 // vbroadcastss 0x29884(%rip),%ymm11 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,29,60,161,2,0 // vbroadcastss 0x2a13c(%rip),%ymm11 # 2cb6c <_sk_overlay_sse2_8bit+0xda8>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,122,152,2,0 // vbroadcastss 0x2987a(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,50,161,2,0 // vbroadcastss 0x2a132(%rip),%ymm12 # 2cb70 <_sk_overlay_sse2_8bit+0xdac>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,112,152,2,0 // vbroadcastss 0x29870(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,40,161,2,0 // vbroadcastss 0x2a128(%rip),%ymm12 # 2cb74 <_sk_overlay_sse2_8bit+0xdb0>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,81,152,2,0 // vbroadcastss 0x29851(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,9,161,2,0 // vbroadcastss 0x2a109(%rip),%ymm11 # 2cb78 <_sk_overlay_sse2_8bit+0xdb4>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,71,152,2,0 // vbroadcastss 0x29847(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,255,160,2,0 // vbroadcastss 0x2a0ff(%rip),%ymm11 # 2cb7c <_sk_overlay_sse2_8bit+0xdb8>
.byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11
- .byte 196,226,125,24,5,61,152,2,0 // vbroadcastss 0x2983d(%rip),%ymm0 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,226,125,24,5,245,160,2,0 // vbroadcastss 0x2a0f5(%rip),%ymm0 # 2cb80 <_sk_overlay_sse2_8bit+0xdbc>
.byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,51,152,2,0 // vbroadcastss 0x29833(%rip),%ymm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,21,235,160,2,0 // vbroadcastss 0x2a0eb(%rip),%ymm10 # 2cb84 <_sk_overlay_sse2_8bit+0xdc0>
.byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0
.byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,21,38,152,2,0 // vbroadcastss 0x29826(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,222,160,2,0 // vbroadcastss 0x2a0de(%rip),%ymm10 # 2cb88 <_sk_overlay_sse2_8bit+0xdc4>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12005,7 +12002,7 @@ _sk_parametric_r_hsw:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,61,151,2,0 // vbroadcastss 0x2973d(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,245,159,2,0 // vbroadcastss 0x29ff5(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12025,33 +12022,33 @@ _sk_parametric_g_hsw:
.byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10
.byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,133,151,2,0 // vbroadcastss 0x29785(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
- .byte 196,98,125,24,45,128,151,2,0 // vbroadcastss 0x29780(%rip),%ymm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,61,160,2,0 // vbroadcastss 0x2a03d(%rip),%ymm12 # 2cb60 <_sk_overlay_sse2_8bit+0xd9c>
+ .byte 196,98,125,24,45,56,160,2,0 // vbroadcastss 0x2a038(%rip),%ymm13 # 2cb64 <_sk_overlay_sse2_8bit+0xda0>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,214,150,2,0 // vbroadcastss 0x296d6(%rip),%ymm13 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,45,142,159,2,0 // vbroadcastss 0x29f8e(%rip),%ymm13 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,104,151,2,0 // vbroadcastss 0x29768(%rip),%ymm13 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,45,32,160,2,0 // vbroadcastss 0x2a020(%rip),%ymm13 # 2cb68 <_sk_overlay_sse2_8bit+0xda4>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,94,151,2,0 // vbroadcastss 0x2975e(%rip),%ymm11 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,29,22,160,2,0 // vbroadcastss 0x2a016(%rip),%ymm11 # 2cb6c <_sk_overlay_sse2_8bit+0xda8>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,84,151,2,0 // vbroadcastss 0x29754(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,12,160,2,0 // vbroadcastss 0x2a00c(%rip),%ymm12 # 2cb70 <_sk_overlay_sse2_8bit+0xdac>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,74,151,2,0 // vbroadcastss 0x2974a(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,2,160,2,0 // vbroadcastss 0x2a002(%rip),%ymm12 # 2cb74 <_sk_overlay_sse2_8bit+0xdb0>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,43,151,2,0 // vbroadcastss 0x2972b(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,227,159,2,0 // vbroadcastss 0x29fe3(%rip),%ymm11 # 2cb78 <_sk_overlay_sse2_8bit+0xdb4>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,33,151,2,0 // vbroadcastss 0x29721(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,217,159,2,0 // vbroadcastss 0x29fd9(%rip),%ymm11 # 2cb7c <_sk_overlay_sse2_8bit+0xdb8>
.byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11
- .byte 196,226,125,24,13,23,151,2,0 // vbroadcastss 0x29717(%rip),%ymm1 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,226,125,24,13,207,159,2,0 // vbroadcastss 0x29fcf(%rip),%ymm1 # 2cb80 <_sk_overlay_sse2_8bit+0xdbc>
.byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,13,151,2,0 // vbroadcastss 0x2970d(%rip),%ymm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,21,197,159,2,0 // vbroadcastss 0x29fc5(%rip),%ymm10 # 2cb84 <_sk_overlay_sse2_8bit+0xdc0>
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
- .byte 196,98,125,24,21,0,151,2,0 // vbroadcastss 0x29700(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,184,159,2,0 // vbroadcastss 0x29fb8(%rip),%ymm10 # 2cb88 <_sk_overlay_sse2_8bit+0xdc4>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12059,7 +12056,7 @@ _sk_parametric_g_hsw:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,23,150,2,0 // vbroadcastss 0x29617(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,207,158,2,0 // vbroadcastss 0x29ecf(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12079,33 +12076,33 @@ _sk_parametric_b_hsw:
.byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10
.byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,95,150,2,0 // vbroadcastss 0x2965f(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
- .byte 196,98,125,24,45,90,150,2,0 // vbroadcastss 0x2965a(%rip),%ymm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,23,159,2,0 // vbroadcastss 0x29f17(%rip),%ymm12 # 2cb60 <_sk_overlay_sse2_8bit+0xd9c>
+ .byte 196,98,125,24,45,18,159,2,0 // vbroadcastss 0x29f12(%rip),%ymm13 # 2cb64 <_sk_overlay_sse2_8bit+0xda0>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,176,149,2,0 // vbroadcastss 0x295b0(%rip),%ymm13 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,45,104,158,2,0 // vbroadcastss 0x29e68(%rip),%ymm13 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,66,150,2,0 // vbroadcastss 0x29642(%rip),%ymm13 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,45,250,158,2,0 // vbroadcastss 0x29efa(%rip),%ymm13 # 2cb68 <_sk_overlay_sse2_8bit+0xda4>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,56,150,2,0 // vbroadcastss 0x29638(%rip),%ymm11 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,29,240,158,2,0 // vbroadcastss 0x29ef0(%rip),%ymm11 # 2cb6c <_sk_overlay_sse2_8bit+0xda8>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,46,150,2,0 // vbroadcastss 0x2962e(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,230,158,2,0 // vbroadcastss 0x29ee6(%rip),%ymm12 # 2cb70 <_sk_overlay_sse2_8bit+0xdac>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,36,150,2,0 // vbroadcastss 0x29624(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,220,158,2,0 // vbroadcastss 0x29edc(%rip),%ymm12 # 2cb74 <_sk_overlay_sse2_8bit+0xdb0>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,5,150,2,0 // vbroadcastss 0x29605(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,189,158,2,0 // vbroadcastss 0x29ebd(%rip),%ymm11 # 2cb78 <_sk_overlay_sse2_8bit+0xdb4>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,251,149,2,0 // vbroadcastss 0x295fb(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,179,158,2,0 // vbroadcastss 0x29eb3(%rip),%ymm11 # 2cb7c <_sk_overlay_sse2_8bit+0xdb8>
.byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11
- .byte 196,226,125,24,21,241,149,2,0 // vbroadcastss 0x295f1(%rip),%ymm2 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,226,125,24,21,169,158,2,0 // vbroadcastss 0x29ea9(%rip),%ymm2 # 2cb80 <_sk_overlay_sse2_8bit+0xdbc>
.byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,231,149,2,0 // vbroadcastss 0x295e7(%rip),%ymm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,21,159,158,2,0 // vbroadcastss 0x29e9f(%rip),%ymm10 # 2cb84 <_sk_overlay_sse2_8bit+0xdc0>
.byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2
.byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2
- .byte 196,98,125,24,21,218,149,2,0 // vbroadcastss 0x295da(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,146,158,2,0 // vbroadcastss 0x29e92(%rip),%ymm10 # 2cb88 <_sk_overlay_sse2_8bit+0xdc4>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12113,7 +12110,7 @@ _sk_parametric_b_hsw:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,241,148,2,0 // vbroadcastss 0x294f1(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,169,157,2,0 // vbroadcastss 0x29da9(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12133,33 +12130,33 @@ _sk_parametric_a_hsw:
.byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10
.byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,57,149,2,0 // vbroadcastss 0x29539(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
- .byte 196,98,125,24,45,52,149,2,0 // vbroadcastss 0x29534(%rip),%ymm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,241,157,2,0 // vbroadcastss 0x29df1(%rip),%ymm12 # 2cb60 <_sk_overlay_sse2_8bit+0xd9c>
+ .byte 196,98,125,24,45,236,157,2,0 // vbroadcastss 0x29dec(%rip),%ymm13 # 2cb64 <_sk_overlay_sse2_8bit+0xda0>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,138,148,2,0 // vbroadcastss 0x2948a(%rip),%ymm13 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,45,66,157,2,0 // vbroadcastss 0x29d42(%rip),%ymm13 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,28,149,2,0 // vbroadcastss 0x2951c(%rip),%ymm13 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,45,212,157,2,0 // vbroadcastss 0x29dd4(%rip),%ymm13 # 2cb68 <_sk_overlay_sse2_8bit+0xda4>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,18,149,2,0 // vbroadcastss 0x29512(%rip),%ymm11 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,29,202,157,2,0 // vbroadcastss 0x29dca(%rip),%ymm11 # 2cb6c <_sk_overlay_sse2_8bit+0xda8>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,8,149,2,0 // vbroadcastss 0x29508(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,192,157,2,0 // vbroadcastss 0x29dc0(%rip),%ymm12 # 2cb70 <_sk_overlay_sse2_8bit+0xdac>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,254,148,2,0 // vbroadcastss 0x294fe(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,182,157,2,0 // vbroadcastss 0x29db6(%rip),%ymm12 # 2cb74 <_sk_overlay_sse2_8bit+0xdb0>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,223,148,2,0 // vbroadcastss 0x294df(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,151,157,2,0 // vbroadcastss 0x29d97(%rip),%ymm11 # 2cb78 <_sk_overlay_sse2_8bit+0xdb4>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,213,148,2,0 // vbroadcastss 0x294d5(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,141,157,2,0 // vbroadcastss 0x29d8d(%rip),%ymm11 # 2cb7c <_sk_overlay_sse2_8bit+0xdb8>
.byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11
- .byte 196,226,125,24,29,203,148,2,0 // vbroadcastss 0x294cb(%rip),%ymm3 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,226,125,24,29,131,157,2,0 // vbroadcastss 0x29d83(%rip),%ymm3 # 2cb80 <_sk_overlay_sse2_8bit+0xdbc>
.byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,193,148,2,0 // vbroadcastss 0x294c1(%rip),%ymm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,21,121,157,2,0 // vbroadcastss 0x29d79(%rip),%ymm10 # 2cb84 <_sk_overlay_sse2_8bit+0xdc0>
.byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3
.byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3
- .byte 196,98,125,24,21,180,148,2,0 // vbroadcastss 0x294b4(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,108,157,2,0 // vbroadcastss 0x29d6c(%rip),%ymm10 # 2cb88 <_sk_overlay_sse2_8bit+0xdc4>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12167,7 +12164,7 @@ _sk_parametric_a_hsw:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,203,147,2,0 // vbroadcastss 0x293cb(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,131,156,2,0 // vbroadcastss 0x29c83(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12186,35 +12183,35 @@ _sk_gamma_hsw:
.byte 197,252,40,241 // vmovaps %ymm1,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,124,91,208 // vcvtdq2ps %ymm0,%ymm10
- .byte 196,98,125,24,29,30,148,2,0 // vbroadcastss 0x2941e(%rip),%ymm11 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
- .byte 196,226,125,24,45,25,148,2,0 // vbroadcastss 0x29419(%rip),%ymm5 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,29,214,156,2,0 // vbroadcastss 0x29cd6(%rip),%ymm11 # 2cb60 <_sk_overlay_sse2_8bit+0xd9c>
+ .byte 196,226,125,24,45,209,156,2,0 // vbroadcastss 0x29cd1(%rip),%ymm5 # 2cb64 <_sk_overlay_sse2_8bit+0xda0>
.byte 197,124,84,205 // vandps %ymm5,%ymm0,%ymm9
- .byte 196,226,125,24,37,112,147,2,0 // vbroadcastss 0x29370(%rip),%ymm4 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,226,125,24,37,40,156,2,0 // vbroadcastss 0x29c28(%rip),%ymm4 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 197,52,86,228 // vorps %ymm4,%ymm9,%ymm12
- .byte 196,98,125,24,45,3,148,2,0 // vbroadcastss 0x29403(%rip),%ymm13 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,45,187,156,2,0 // vbroadcastss 0x29cbb(%rip),%ymm13 # 2cb68 <_sk_overlay_sse2_8bit+0xda4>
.byte 196,66,37,168,213 // vfmadd213ps %ymm13,%ymm11,%ymm10
- .byte 196,98,125,24,13,249,147,2,0 // vbroadcastss 0x293f9(%rip),%ymm9 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,13,177,156,2,0 // vbroadcastss 0x29cb1(%rip),%ymm9 # 2cb6c <_sk_overlay_sse2_8bit+0xda8>
.byte 196,66,29,188,209 // vfnmadd231ps %ymm9,%ymm12,%ymm10
.byte 197,124,91,246 // vcvtdq2ps %ymm6,%ymm14
.byte 196,66,37,168,245 // vfmadd213ps %ymm13,%ymm11,%ymm14
.byte 197,124,91,255 // vcvtdq2ps %ymm7,%ymm15
.byte 196,66,37,168,253 // vfmadd213ps %ymm13,%ymm11,%ymm15
- .byte 196,98,125,24,29,221,147,2,0 // vbroadcastss 0x293dd(%rip),%ymm11 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,29,149,156,2,0 // vbroadcastss 0x29c95(%rip),%ymm11 # 2cb70 <_sk_overlay_sse2_8bit+0xdac>
.byte 196,65,28,88,227 // vaddps %ymm11,%ymm12,%ymm12
- .byte 196,98,125,24,45,211,147,2,0 // vbroadcastss 0x293d3(%rip),%ymm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,45,139,156,2,0 // vbroadcastss 0x29c8b(%rip),%ymm13 # 2cb74 <_sk_overlay_sse2_8bit+0xdb0>
.byte 196,65,20,94,228 // vdivps %ymm12,%ymm13,%ymm12
.byte 196,65,44,92,212 // vsubps %ymm12,%ymm10,%ymm10
.byte 196,98,125,24,32 // vbroadcastss (%rax),%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
.byte 196,67,125,8,194,1 // vroundps $0x1,%ymm10,%ymm8
.byte 196,65,44,92,192 // vsubps %ymm8,%ymm10,%ymm8
- .byte 196,226,125,24,21,175,147,2,0 // vbroadcastss 0x293af(%rip),%ymm2 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,226,125,24,21,103,156,2,0 // vbroadcastss 0x29c67(%rip),%ymm2 # 2cb78 <_sk_overlay_sse2_8bit+0xdb4>
.byte 197,44,88,210 // vaddps %ymm2,%ymm10,%ymm10
- .byte 196,226,125,24,29,166,147,2,0 // vbroadcastss 0x293a6(%rip),%ymm3 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,226,125,24,29,94,156,2,0 // vbroadcastss 0x29c5e(%rip),%ymm3 # 2cb7c <_sk_overlay_sse2_8bit+0xdb8>
.byte 196,98,61,188,211 // vfnmadd231ps %ymm3,%ymm8,%ymm10
- .byte 196,226,125,24,13,156,147,2,0 // vbroadcastss 0x2939c(%rip),%ymm1 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,226,125,24,13,84,156,2,0 // vbroadcastss 0x29c54(%rip),%ymm1 # 2cb80 <_sk_overlay_sse2_8bit+0xdbc>
.byte 196,65,116,92,192 // vsubps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,5,146,147,2,0 // vbroadcastss 0x29392(%rip),%ymm0 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,226,125,24,5,74,156,2,0 // vbroadcastss 0x29c4a(%rip),%ymm0 # 2cb84 <_sk_overlay_sse2_8bit+0xdc0>
.byte 196,65,124,94,192 // vdivps %ymm8,%ymm0,%ymm8
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 197,204,84,245 // vandps %ymm5,%ymm6,%ymm6
@@ -12245,7 +12242,7 @@ _sk_gamma_hsw:
.byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1
.byte 197,252,94,193 // vdivps %ymm1,%ymm0,%ymm0
.byte 197,236,88,192 // vaddps %ymm0,%ymm2,%ymm0
- .byte 196,226,125,24,13,3,147,2,0 // vbroadcastss 0x29303(%rip),%ymm1 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,226,125,24,13,187,155,2,0 // vbroadcastss 0x29bbb(%rip),%ymm1 # 2cb88 <_sk_overlay_sse2_8bit+0xdc4>
.byte 197,188,89,209 // vmulps %ymm1,%ymm8,%ymm2
.byte 197,204,89,217 // vmulps %ymm1,%ymm6,%ymm3
.byte 197,252,89,225 // vmulps %ymm1,%ymm0,%ymm4
@@ -12265,26 +12262,26 @@ HIDDEN _sk_lab_to_xyz_hsw
.globl _sk_lab_to_xyz_hsw
FUNCTION(_sk_lab_to_xyz_hsw)
_sk_lab_to_xyz_hsw:
- .byte 196,98,125,24,5,193,146,2,0 // vbroadcastss 0x292c1(%rip),%ymm8 # 2c2d8 <_sk_overlay_sse2_8bit+0x500>
- .byte 196,98,125,24,13,36,146,2,0 // vbroadcastss 0x29224(%rip),%ymm9 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
- .byte 196,98,125,24,21,179,146,2,0 // vbroadcastss 0x292b3(%rip),%ymm10 # 2c2dc <_sk_overlay_sse2_8bit+0x504>
+ .byte 196,98,125,24,5,121,155,2,0 // vbroadcastss 0x29b79(%rip),%ymm8 # 2cb8c <_sk_overlay_sse2_8bit+0xdc8>
+ .byte 196,98,125,24,13,220,154,2,0 // vbroadcastss 0x29adc(%rip),%ymm9 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
+ .byte 196,98,125,24,21,107,155,2,0 // vbroadcastss 0x29b6b(%rip),%ymm10 # 2cb90 <_sk_overlay_sse2_8bit+0xdcc>
.byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1
.byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2
- .byte 196,98,125,24,13,164,146,2,0 // vbroadcastss 0x292a4(%rip),%ymm9 # 2c2e0 <_sk_overlay_sse2_8bit+0x508>
+ .byte 196,98,125,24,13,92,155,2,0 // vbroadcastss 0x29b5c(%rip),%ymm9 # 2cb94 <_sk_overlay_sse2_8bit+0xdd0>
.byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9
- .byte 196,226,125,24,5,154,146,2,0 // vbroadcastss 0x2929a(%rip),%ymm0 # 2c2e4 <_sk_overlay_sse2_8bit+0x50c>
+ .byte 196,226,125,24,5,82,155,2,0 // vbroadcastss 0x29b52(%rip),%ymm0 # 2cb98 <_sk_overlay_sse2_8bit+0xdd4>
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
- .byte 196,98,125,24,5,145,146,2,0 // vbroadcastss 0x29291(%rip),%ymm8 # 2c2e8 <_sk_overlay_sse2_8bit+0x510>
+ .byte 196,98,125,24,5,73,155,2,0 // vbroadcastss 0x29b49(%rip),%ymm8 # 2cb9c <_sk_overlay_sse2_8bit+0xdd8>
.byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8
- .byte 196,98,125,24,13,135,146,2,0 // vbroadcastss 0x29287(%rip),%ymm9 # 2c2ec <_sk_overlay_sse2_8bit+0x514>
+ .byte 196,98,125,24,13,63,155,2,0 // vbroadcastss 0x29b3f(%rip),%ymm9 # 2cba0 <_sk_overlay_sse2_8bit+0xddc>
.byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9
.byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
- .byte 196,226,125,24,21,116,146,2,0 // vbroadcastss 0x29274(%rip),%ymm2 # 2c2f0 <_sk_overlay_sse2_8bit+0x518>
+ .byte 196,226,125,24,21,44,155,2,0 // vbroadcastss 0x29b2c(%rip),%ymm2 # 2cba4 <_sk_overlay_sse2_8bit+0xde0>
.byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10
- .byte 196,98,125,24,29,106,146,2,0 // vbroadcastss 0x2926a(%rip),%ymm11 # 2c2f4 <_sk_overlay_sse2_8bit+0x51c>
+ .byte 196,98,125,24,29,34,155,2,0 // vbroadcastss 0x29b22(%rip),%ymm11 # 2cba8 <_sk_overlay_sse2_8bit+0xde4>
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,37,96,146,2,0 // vbroadcastss 0x29260(%rip),%ymm12 # 2c2f8 <_sk_overlay_sse2_8bit+0x520>
+ .byte 196,98,125,24,37,24,155,2,0 // vbroadcastss 0x29b18(%rip),%ymm12 # 2cbac <_sk_overlay_sse2_8bit+0xde8>
.byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8
.byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -12299,9 +12296,9 @@ _sk_lab_to_xyz_hsw:
.byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
.byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- .byte 196,226,125,24,5,21,146,2,0 // vbroadcastss 0x29215(%rip),%ymm0 # 2c2fc <_sk_overlay_sse2_8bit+0x524>
+ .byte 196,226,125,24,5,205,154,2,0 // vbroadcastss 0x29acd(%rip),%ymm0 # 2cbb0 <_sk_overlay_sse2_8bit+0xdec>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,12,146,2,0 // vbroadcastss 0x2920c(%rip),%ymm8 # 2c300 <_sk_overlay_sse2_8bit+0x528>
+ .byte 196,98,125,24,5,196,154,2,0 // vbroadcastss 0x29ac4(%rip),%ymm8 # 2cbb4 <_sk_overlay_sse2_8bit+0xdf0>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12317,12 +12314,12 @@ _sk_load_a8_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,52 // jne 3149 <_sk_load_a8_hsw+0x4c>
+ .byte 117,52 // jne 3145 <_sk_load_a8_hsw+0x4c>
.byte 196,130,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm0
- .byte 197,249,219,5,109,155,2,0 // vpand 0x29b6d(%rip),%xmm0,%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,249,219,5,81,155,2,0 // vpand 0x29b51(%rip),%xmm0,%xmm0 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,87,145,2,0 // vbroadcastss 0x29157(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,15,154,2,0 // vbroadcastss 0x29a0f(%rip),%ymm1 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -12334,15 +12331,15 @@ _sk_load_a8_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,190 // ja 311b <_sk_load_a8_hsw+0x1e>
+ .byte 119,190 // ja 3117 <_sk_load_a8_hsw+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,120,0,0,0 // lea 0x78(%rip),%r10 # 31e0 <_sk_load_a8_hsw+0xe3>
+ .byte 76,141,21,120,0,0,0 // lea 0x78(%rip),%r10 # 31dc <_sk_load_a8_hsw+0xe3>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,159 // jmp 311b <_sk_load_a8_hsw+0x1e>
+ .byte 235,159 // jmp 3117 <_sk_load_a8_hsw+0x1e>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -12350,7 +12347,7 @@ _sk_load_a8_hsw:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,119,255,255,255 // jmpq 311b <_sk_load_a8_hsw+0x1e>
+ .byte 233,119,255,255,255 // jmpq 3117 <_sk_load_a8_hsw+0x1e>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -12361,7 +12358,7 @@ _sk_load_a8_hsw:
.byte 196,129,121,110,12,24 // vmovd (%r8,%r11,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,60,255,255,255 // jmpq 311b <_sk_load_a8_hsw+0x1e>
+ .byte 233,60,255,255,255 // jmpq 3117 <_sk_load_a8_hsw+0x1e>
.byte 144 // nop
.byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
@@ -12370,7 +12367,7 @@ _sk_load_a8_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf0031f0 <_sk_overlay_sse2_8bit+0xffffffffdefd7418>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf0031ec <_sk_overlay_sse2_8bit+0xffffffffdefd7428>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -12392,12 +12389,12 @@ _sk_load_a8_dst_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,52 // jne 3248 <_sk_load_a8_dst_hsw+0x4c>
+ .byte 117,52 // jne 3244 <_sk_load_a8_dst_hsw+0x4c>
.byte 196,130,121,48,36,24 // vpmovzxbw (%r8,%r11,1),%xmm4
- .byte 197,217,219,37,110,154,2,0 // vpand 0x29a6e(%rip),%xmm4,%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,217,219,37,82,154,2,0 // vpand 0x29a52(%rip),%xmm4,%xmm4 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,88,144,2,0 // vbroadcastss 0x29058(%rip),%ymm5 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,45,16,153,2,0 // vbroadcastss 0x29910(%rip),%ymm5 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -12409,15 +12406,15 @@ _sk_load_a8_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,190 // ja 321a <_sk_load_a8_dst_hsw+0x1e>
+ .byte 119,190 // ja 3216 <_sk_load_a8_dst_hsw+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,121,0,0,0 // lea 0x79(%rip),%r10 # 32e0 <_sk_load_a8_dst_hsw+0xe4>
+ .byte 76,141,21,121,0,0,0 // lea 0x79(%rip),%r10 # 32dc <_sk_load_a8_dst_hsw+0xe4>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,159 // jmp 321a <_sk_load_a8_dst_hsw+0x1e>
+ .byte 235,159 // jmp 3216 <_sk_load_a8_dst_hsw+0x1e>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -12425,7 +12422,7 @@ _sk_load_a8_dst_hsw:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,119,255,255,255 // jmpq 321a <_sk_load_a8_dst_hsw+0x1e>
+ .byte 233,119,255,255,255 // jmpq 3216 <_sk_load_a8_dst_hsw+0x1e>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -12436,7 +12433,7 @@ _sk_load_a8_dst_hsw:
.byte 196,129,121,110,44,24 // vmovd (%r8,%r11,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,60,255,255,255 // jmpq 321a <_sk_load_a8_dst_hsw+0x1e>
+ .byte 233,60,255,255,255 // jmpq 3216 <_sk_load_a8_dst_hsw+0x1e>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -12445,7 +12442,7 @@ _sk_load_a8_dst_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde0032f0 <_sk_overlay_sse2_8bit+0xffffffffddfd7518>
+ .byte 232,255,255,255,221 // callq ffffffffde0032ec <_sk_overlay_sse2_8bit+0xffffffffddfd7528>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -12500,7 +12497,7 @@ _sk_gather_a8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,211,142,2,0 // vbroadcastss 0x28ed3(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,139,151,2,0 // vbroadcastss 0x2978b(%rip),%ymm1 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -12522,14 +12519,14 @@ _sk_store_a8_hsw:
.byte 77,15,175,193 // imul %r9,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,84,142,2,0 // vbroadcastss 0x28e54(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,12,151,2,0 // vbroadcastss 0x2970c(%rip),%ymm8 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 3419 <_sk_store_a8_hsw+0x45>
+ .byte 117,10 // jne 3415 <_sk_store_a8_hsw+0x45>
.byte 196,1,123,17,4,24 // vmovsd %xmm8,(%r8,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12537,25 +12534,25 @@ _sk_store_a8_hsw:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 3415 <_sk_store_a8_hsw+0x41>
+ .byte 119,236 // ja 3411 <_sk_store_a8_hsw+0x41>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,87,0,0,0 // lea 0x57(%rip),%r10 # 3490 <_sk_store_a8_hsw+0xbc>
+ .byte 76,141,21,87,0,0,0 // lea 0x57(%rip),%r10 # 348c <_sk_store_a8_hsw+0xbc>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,3,121,20,4,24,0 // vpextrb $0x0,%xmm8,(%r8,%r11,1)
- .byte 235,202 // jmp 3415 <_sk_store_a8_hsw+0x41>
+ .byte 235,202 // jmp 3411 <_sk_store_a8_hsw+0x41>
.byte 196,3,121,20,68,24,2,4 // vpextrb $0x4,%xmm8,0x2(%r8,%r11,1)
- .byte 196,98,57,0,5,68,152,2,0 // vpshufb 0x29844(%rip),%xmm8,%xmm8 # 2cca0 <_sk_overlay_sse2_8bit+0xec8>
+ .byte 196,98,57,0,5,40,152,2,0 // vpshufb 0x29828(%rip),%xmm8,%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0xebc>
.byte 196,3,121,21,4,24,0 // vpextrw $0x0,%xmm8,(%r8,%r11,1)
- .byte 235,176 // jmp 3415 <_sk_store_a8_hsw+0x41>
+ .byte 235,176 // jmp 3411 <_sk_store_a8_hsw+0x41>
.byte 196,3,121,20,68,24,6,12 // vpextrb $0xc,%xmm8,0x6(%r8,%r11,1)
.byte 196,3,121,20,68,24,5,10 // vpextrb $0xa,%xmm8,0x5(%r8,%r11,1)
.byte 196,3,121,20,68,24,4,8 // vpextrb $0x8,%xmm8,0x4(%r8,%r11,1)
- .byte 196,98,57,0,5,42,152,2,0 // vpshufb 0x2982a(%rip),%xmm8,%xmm8 # 2ccb0 <_sk_overlay_sse2_8bit+0xed8>
+ .byte 196,98,57,0,5,14,152,2,0 // vpshufb 0x2980e(%rip),%xmm8,%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0xecc>
.byte 196,1,121,126,4,24 // vmovd %xmm8,(%r8,%r11,1)
- .byte 235,135 // jmp 3415 <_sk_store_a8_hsw+0x41>
+ .byte 235,135 // jmp 3411 <_sk_store_a8_hsw+0x41>
.byte 102,144 // xchg %ax,%ax
.byte 178,255 // mov $0xff,%dl
.byte 255 // (bad)
@@ -12588,15 +12585,15 @@ _sk_load_g8_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,57 // jne 34fd <_sk_load_g8_hsw+0x51>
+ .byte 117,57 // jne 34f9 <_sk_load_g8_hsw+0x51>
.byte 196,130,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm0
- .byte 197,249,219,5,190,151,2,0 // vpand 0x297be(%rip),%xmm0,%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,249,219,5,162,151,2,0 // vpand 0x297a2(%rip),%xmm0,%xmm0 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,168,141,2,0 // vbroadcastss 0x28da8(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,96,150,2,0 // vbroadcastss 0x29660(%rip),%ymm1 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,37,141,2,0 // vbroadcastss 0x28d25(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,221,149,2,0 // vbroadcastss 0x295dd(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -12605,15 +12602,15 @@ _sk_load_g8_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,185 // ja 34ca <_sk_load_g8_hsw+0x1e>
+ .byte 119,185 // ja 34c6 <_sk_load_g8_hsw+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,120,0,0,0 // lea 0x78(%rip),%r10 # 3594 <_sk_load_g8_hsw+0xe8>
+ .byte 76,141,21,120,0,0,0 // lea 0x78(%rip),%r10 # 3590 <_sk_load_g8_hsw+0xe8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,154 // jmp 34ca <_sk_load_g8_hsw+0x1e>
+ .byte 235,154 // jmp 34c6 <_sk_load_g8_hsw+0x1e>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -12621,7 +12618,7 @@ _sk_load_g8_hsw:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,114,255,255,255 // jmpq 34ca <_sk_load_g8_hsw+0x1e>
+ .byte 233,114,255,255,255 // jmpq 34c6 <_sk_load_g8_hsw+0x1e>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -12632,7 +12629,7 @@ _sk_load_g8_hsw:
.byte 196,129,121,110,12,24 // vmovd (%r8,%r11,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,55,255,255,255 // jmpq 34ca <_sk_load_g8_hsw+0x1e>
+ .byte 233,55,255,255,255 // jmpq 34c6 <_sk_load_g8_hsw+0x1e>
.byte 144 // nop
.byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
@@ -12641,7 +12638,7 @@ _sk_load_g8_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf0035a4 <_sk_overlay_sse2_8bit+0xffffffffdefd77cc>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf0035a0 <_sk_overlay_sse2_8bit+0xffffffffdefd77dc>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -12663,15 +12660,15 @@ _sk_load_g8_dst_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,57 // jne 3601 <_sk_load_g8_dst_hsw+0x51>
+ .byte 117,57 // jne 35fd <_sk_load_g8_dst_hsw+0x51>
.byte 196,130,121,48,36,24 // vpmovzxbw (%r8,%r11,1),%xmm4
- .byte 197,217,219,37,186,150,2,0 // vpand 0x296ba(%rip),%xmm4,%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,217,219,37,158,150,2,0 // vpand 0x2969e(%rip),%xmm4,%xmm4 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,164,140,2,0 // vbroadcastss 0x28ca4(%rip),%ymm5 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,45,92,149,2,0 // vbroadcastss 0x2955c(%rip),%ymm5 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,33,140,2,0 // vbroadcastss 0x28c21(%rip),%ymm7 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,61,217,148,2,0 // vbroadcastss 0x294d9(%rip),%ymm7 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 255,224 // jmpq *%rax
@@ -12680,15 +12677,15 @@ _sk_load_g8_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,185 // ja 35ce <_sk_load_g8_dst_hsw+0x1e>
+ .byte 119,185 // ja 35ca <_sk_load_g8_dst_hsw+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,120,0,0,0 // lea 0x78(%rip),%r10 # 3698 <_sk_load_g8_dst_hsw+0xe8>
+ .byte 76,141,21,120,0,0,0 // lea 0x78(%rip),%r10 # 3694 <_sk_load_g8_dst_hsw+0xe8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,154 // jmp 35ce <_sk_load_g8_dst_hsw+0x1e>
+ .byte 235,154 // jmp 35ca <_sk_load_g8_dst_hsw+0x1e>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -12696,7 +12693,7 @@ _sk_load_g8_dst_hsw:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,114,255,255,255 // jmpq 35ce <_sk_load_g8_dst_hsw+0x1e>
+ .byte 233,114,255,255,255 // jmpq 35ca <_sk_load_g8_dst_hsw+0x1e>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -12707,7 +12704,7 @@ _sk_load_g8_dst_hsw:
.byte 196,129,121,110,44,24 // vmovd (%r8,%r11,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,55,255,255,255 // jmpq 35ce <_sk_load_g8_dst_hsw+0x1e>
+ .byte 233,55,255,255,255 // jmpq 35ca <_sk_load_g8_dst_hsw+0x1e>
.byte 144 // nop
.byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
@@ -12716,7 +12713,7 @@ _sk_load_g8_dst_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf0036a8 <_sk_overlay_sse2_8bit+0xffffffffdefd78d0>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf0036a4 <_sk_overlay_sse2_8bit+0xffffffffdefd78e0>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -12771,10 +12768,10 @@ _sk_gather_g8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,27,139,2,0 // vbroadcastss 0x28b1b(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,211,147,2,0 // vbroadcastss 0x293d3(%rip),%ymm1 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,152,138,2,0 // vbroadcastss 0x28a98(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,80,147,2,0 // vbroadcastss 0x29350(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -12795,53 +12792,53 @@ _sk_load_565_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,114 // jne 381e <_sk_load_565_hsw+0x8d>
+ .byte 117,114 // jne 381a <_sk_load_565_hsw+0x8d>
.byte 196,129,122,111,4,88 // vmovdqu (%r8,%r11,2),%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,208,138,2,0 // vpbroadcastd 0x28ad0(%rip),%ymm0 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,226,125,88,5,136,147,2,0 // vpbroadcastd 0x29388(%rip),%ymm0 # 2cb44 <_sk_overlay_sse2_8bit+0xd80>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,195,138,2,0 // vbroadcastss 0x28ac3(%rip),%ymm1 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,226,125,24,13,123,147,2,0 // vbroadcastss 0x2937b(%rip),%ymm1 # 2cb48 <_sk_overlay_sse2_8bit+0xd84>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,186,138,2,0 // vpbroadcastd 0x28aba(%rip),%ymm1 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,226,125,88,13,114,147,2,0 // vpbroadcastd 0x29372(%rip),%ymm1 # 2cb4c <_sk_overlay_sse2_8bit+0xd88>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,173,138,2,0 // vbroadcastss 0x28aad(%rip),%ymm3 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,226,125,24,29,101,147,2,0 // vbroadcastss 0x29365(%rip),%ymm3 # 2cb50 <_sk_overlay_sse2_8bit+0xd8c>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,164,138,2,0 // vpbroadcastd 0x28aa4(%rip),%ymm3 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,226,125,88,29,92,147,2,0 // vpbroadcastd 0x2935c(%rip),%ymm3 # 2cb54 <_sk_overlay_sse2_8bit+0xd90>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,151,138,2,0 // vbroadcastss 0x28a97(%rip),%ymm3 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,226,125,24,29,79,147,2,0 // vbroadcastss 0x2934f(%rip),%ymm3 # 2cb58 <_sk_overlay_sse2_8bit+0xd94>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,252,137,2,0 // vbroadcastss 0x289fc(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,180,146,2,0 // vbroadcastss 0x292b4(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,128 // ja 37b2 <_sk_load_565_hsw+0x21>
+ .byte 119,128 // ja 37ae <_sk_load_565_hsw+0x21>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,99,0,0,0 // lea 0x63(%rip),%r10 # 38a0 <_sk_load_565_hsw+0x10f>
+ .byte 76,141,21,99,0,0,0 // lea 0x63(%rip),%r10 # 389c <_sk_load_565_hsw+0x10f>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,94,255,255,255 // jmpq 37b2 <_sk_load_565_hsw+0x21>
+ .byte 233,94,255,255,255 // jmpq 37ae <_sk_load_565_hsw+0x21>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,129,121,196,68,88,4,2 // vpinsrw $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,121,110,12,88 // vmovd (%r8,%r11,2),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,65,255,255,255 // jmpq 37b2 <_sk_load_565_hsw+0x21>
+ .byte 233,65,255,255,255 // jmpq 37ae <_sk_load_565_hsw+0x21>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,129,121,196,68,88,12,6 // vpinsrw $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,121,196,68,88,10,5 // vpinsrw $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,121,196,68,88,8,4 // vpinsrw $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,122,126,12,88 // vmovq (%r8,%r11,2),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,20,255,255,255 // jmpq 37b2 <_sk_load_565_hsw+0x21>
+ .byte 233,20,255,255,255 // jmpq 37ae <_sk_load_565_hsw+0x21>
.byte 102,144 // xchg %ax,%ax
.byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -12874,53 +12871,53 @@ _sk_load_565_dst_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,114 // jne 3949 <_sk_load_565_dst_hsw+0x8d>
+ .byte 117,114 // jne 3945 <_sk_load_565_dst_hsw+0x8d>
.byte 196,129,122,111,36,88 // vmovdqu (%r8,%r11,2),%xmm4
.byte 196,226,125,51,244 // vpmovzxwd %xmm4,%ymm6
- .byte 196,226,125,88,37,165,137,2,0 // vpbroadcastd 0x289a5(%rip),%ymm4 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,226,125,88,37,93,146,2,0 // vpbroadcastd 0x2925d(%rip),%ymm4 # 2cb44 <_sk_overlay_sse2_8bit+0xd80>
.byte 197,205,219,228 // vpand %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,152,137,2,0 // vbroadcastss 0x28998(%rip),%ymm5 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,226,125,24,45,80,146,2,0 // vbroadcastss 0x29250(%rip),%ymm5 # 2cb48 <_sk_overlay_sse2_8bit+0xd84>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,143,137,2,0 // vpbroadcastd 0x2898f(%rip),%ymm5 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,226,125,88,45,71,146,2,0 // vpbroadcastd 0x29247(%rip),%ymm5 # 2cb4c <_sk_overlay_sse2_8bit+0xd88>
.byte 197,205,219,237 // vpand %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,130,137,2,0 // vbroadcastss 0x28982(%rip),%ymm7 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,226,125,24,61,58,146,2,0 // vbroadcastss 0x2923a(%rip),%ymm7 # 2cb50 <_sk_overlay_sse2_8bit+0xd8c>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,88,61,121,137,2,0 // vpbroadcastd 0x28979(%rip),%ymm7 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,226,125,88,61,49,146,2,0 // vpbroadcastd 0x29231(%rip),%ymm7 # 2cb54 <_sk_overlay_sse2_8bit+0xd90>
.byte 197,205,219,247 // vpand %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,108,137,2,0 // vbroadcastss 0x2896c(%rip),%ymm7 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,226,125,24,61,36,146,2,0 // vbroadcastss 0x29224(%rip),%ymm7 # 2cb58 <_sk_overlay_sse2_8bit+0xd94>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,209,136,2,0 // vbroadcastss 0x288d1(%rip),%ymm7 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,61,137,145,2,0 // vbroadcastss 0x29189(%rip),%ymm7 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,128 // ja 38dd <_sk_load_565_dst_hsw+0x21>
+ .byte 119,128 // ja 38d9 <_sk_load_565_dst_hsw+0x21>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,100,0,0,0 // lea 0x64(%rip),%r10 # 39cc <_sk_load_565_dst_hsw+0x110>
+ .byte 76,141,21,100,0,0,0 // lea 0x64(%rip),%r10 # 39c8 <_sk_load_565_dst_hsw+0x110>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,94,255,255,255 // jmpq 38dd <_sk_load_565_dst_hsw+0x21>
+ .byte 233,94,255,255,255 // jmpq 38d9 <_sk_load_565_dst_hsw+0x21>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,129,89,196,100,88,4,2 // vpinsrw $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,121,110,44,88 // vmovd (%r8,%r11,2),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,65,255,255,255 // jmpq 38dd <_sk_load_565_dst_hsw+0x21>
+ .byte 233,65,255,255,255 // jmpq 38d9 <_sk_load_565_dst_hsw+0x21>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,129,89,196,100,88,12,6 // vpinsrw $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,89,196,100,88,10,5 // vpinsrw $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,89,196,100,88,8,4 // vpinsrw $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,122,126,44,88 // vmovq (%r8,%r11,2),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,20,255,255,255 // jmpq 38dd <_sk_load_565_dst_hsw+0x21>
+ .byte 233,20,255,255,255 // jmpq 38d9 <_sk_load_565_dst_hsw+0x21>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -12989,23 +12986,23 @@ _sk_gather_565_hsw:
.byte 65,15,183,4,88 // movzwl (%r8,%rbx,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,237,135,2,0 // vpbroadcastd 0x287ed(%rip),%ymm0 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,226,125,88,5,165,144,2,0 // vpbroadcastd 0x290a5(%rip),%ymm0 # 2cb44 <_sk_overlay_sse2_8bit+0xd80>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,224,135,2,0 // vbroadcastss 0x287e0(%rip),%ymm1 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,226,125,24,13,152,144,2,0 // vbroadcastss 0x29098(%rip),%ymm1 # 2cb48 <_sk_overlay_sse2_8bit+0xd84>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,215,135,2,0 // vpbroadcastd 0x287d7(%rip),%ymm1 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,226,125,88,13,143,144,2,0 // vpbroadcastd 0x2908f(%rip),%ymm1 # 2cb4c <_sk_overlay_sse2_8bit+0xd88>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,202,135,2,0 // vbroadcastss 0x287ca(%rip),%ymm3 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,226,125,24,29,130,144,2,0 // vbroadcastss 0x29082(%rip),%ymm3 # 2cb50 <_sk_overlay_sse2_8bit+0xd8c>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,193,135,2,0 // vpbroadcastd 0x287c1(%rip),%ymm3 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,226,125,88,29,121,144,2,0 // vpbroadcastd 0x29079(%rip),%ymm3 # 2cb54 <_sk_overlay_sse2_8bit+0xd90>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,180,135,2,0 // vbroadcastss 0x287b4(%rip),%ymm3 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,226,125,24,29,108,144,2,0 // vbroadcastss 0x2906c(%rip),%ymm3 # 2cb58 <_sk_overlay_sse2_8bit+0xd94>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,25,135,2,0 // vbroadcastss 0x28719(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,209,143,2,0 // vbroadcastss 0x28fd1(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
.byte 65,94 // pop %r14
@@ -13023,11 +13020,11 @@ _sk_store_565_hsw:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,221,135,2,0 // vbroadcastss 0x287dd(%rip),%ymm8 # 2c304 <_sk_overlay_sse2_8bit+0x52c>
+ .byte 196,98,125,24,5,149,144,2,0 // vbroadcastss 0x29095(%rip),%ymm8 # 2cbb8 <_sk_overlay_sse2_8bit+0xdf4>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9
- .byte 196,98,125,24,21,200,135,2,0 // vbroadcastss 0x287c8(%rip),%ymm10 # 2c308 <_sk_overlay_sse2_8bit+0x530>
+ .byte 196,98,125,24,21,128,144,2,0 // vbroadcastss 0x29080(%rip),%ymm10 # 2cbbc <_sk_overlay_sse2_8bit+0xdf8>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10
@@ -13038,7 +13035,7 @@ _sk_store_565_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 3b7e <_sk_store_565_hsw+0x76>
+ .byte 117,10 // jne 3b7a <_sk_store_565_hsw+0x76>
.byte 196,1,122,127,4,88 // vmovdqu %xmm8,(%r8,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -13046,22 +13043,22 @@ _sk_store_565_hsw:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 3b7a <_sk_store_565_hsw+0x72>
+ .byte 119,236 // ja 3b76 <_sk_store_565_hsw+0x72>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,67,0,0,0 // lea 0x43(%rip),%r10 # 3bdc <_sk_store_565_hsw+0xd4>
+ .byte 76,141,21,67,0,0,0 // lea 0x43(%rip),%r10 # 3bd8 <_sk_store_565_hsw+0xd4>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,3,121,21,4,88,0 // vpextrw $0x0,%xmm8,(%r8,%r11,2)
- .byte 235,207 // jmp 3b7a <_sk_store_565_hsw+0x72>
+ .byte 235,207 // jmp 3b76 <_sk_store_565_hsw+0x72>
.byte 196,3,121,21,68,88,4,2 // vpextrw $0x2,%xmm8,0x4(%r8,%r11,2)
.byte 196,1,121,126,4,88 // vmovd %xmm8,(%r8,%r11,2)
- .byte 235,191 // jmp 3b7a <_sk_store_565_hsw+0x72>
+ .byte 235,191 // jmp 3b76 <_sk_store_565_hsw+0x72>
.byte 196,3,121,21,68,88,12,6 // vpextrw $0x6,%xmm8,0xc(%r8,%r11,2)
.byte 196,3,121,21,68,88,10,5 // vpextrw $0x5,%xmm8,0xa(%r8,%r11,2)
.byte 196,3,121,21,68,88,8,4 // vpextrw $0x4,%xmm8,0x8(%r8,%r11,2)
.byte 196,1,121,214,4,88 // vmovq %xmm8,(%r8,%r11,2)
- .byte 235,159 // jmp 3b7a <_sk_store_565_hsw+0x72>
+ .byte 235,159 // jmp 3b76 <_sk_store_565_hsw+0x72>
.byte 144 // nop
.byte 198 // (bad)
.byte 255 // (bad)
@@ -13099,28 +13096,28 @@ _sk_load_4444_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,138,0,0,0 // jne 3ca1 <_sk_load_4444_hsw+0xa9>
+ .byte 15,133,138,0,0,0 // jne 3c9d <_sk_load_4444_hsw+0xa9>
.byte 196,129,122,111,4,88 // vmovdqu (%r8,%r11,2),%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,225,134,2,0 // vpbroadcastd 0x286e1(%rip),%ymm0 # 2c30c <_sk_overlay_sse2_8bit+0x534>
+ .byte 196,226,125,88,5,153,143,2,0 // vpbroadcastd 0x28f99(%rip),%ymm0 # 2cbc0 <_sk_overlay_sse2_8bit+0xdfc>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,212,134,2,0 // vbroadcastss 0x286d4(%rip),%ymm1 # 2c310 <_sk_overlay_sse2_8bit+0x538>
+ .byte 196,226,125,24,13,140,143,2,0 // vbroadcastss 0x28f8c(%rip),%ymm1 # 2cbc4 <_sk_overlay_sse2_8bit+0xe00>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,203,134,2,0 // vpbroadcastd 0x286cb(%rip),%ymm1 # 2c314 <_sk_overlay_sse2_8bit+0x53c>
+ .byte 196,226,125,88,13,131,143,2,0 // vpbroadcastd 0x28f83(%rip),%ymm1 # 2cbc8 <_sk_overlay_sse2_8bit+0xe04>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,190,134,2,0 // vbroadcastss 0x286be(%rip),%ymm2 # 2c318 <_sk_overlay_sse2_8bit+0x540>
+ .byte 196,226,125,24,21,118,143,2,0 // vbroadcastss 0x28f76(%rip),%ymm2 # 2cbcc <_sk_overlay_sse2_8bit+0xe08>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,181,134,2,0 // vpbroadcastd 0x286b5(%rip),%ymm2 # 2c31c <_sk_overlay_sse2_8bit+0x544>
+ .byte 196,226,125,88,21,109,143,2,0 // vpbroadcastd 0x28f6d(%rip),%ymm2 # 2cbd0 <_sk_overlay_sse2_8bit+0xe0c>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,168,134,2,0 // vbroadcastss 0x286a8(%rip),%ymm8 # 2c320 <_sk_overlay_sse2_8bit+0x548>
+ .byte 196,98,125,24,5,96,143,2,0 // vbroadcastss 0x28f60(%rip),%ymm8 # 2cbd4 <_sk_overlay_sse2_8bit+0xe10>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,158,134,2,0 // vpbroadcastd 0x2869e(%rip),%ymm8 # 2c324 <_sk_overlay_sse2_8bit+0x54c>
+ .byte 196,98,125,88,5,86,143,2,0 // vpbroadcastd 0x28f56(%rip),%ymm8 # 2cbd8 <_sk_overlay_sse2_8bit+0xe14>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,144,134,2,0 // vbroadcastss 0x28690(%rip),%ymm8 # 2c328 <_sk_overlay_sse2_8bit+0x550>
+ .byte 196,98,125,24,5,72,143,2,0 // vbroadcastss 0x28f48(%rip),%ymm8 # 2cbdc <_sk_overlay_sse2_8bit+0xe18>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -13129,27 +13126,27 @@ _sk_load_4444_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,100,255,255,255 // ja 3c1d <_sk_load_4444_hsw+0x25>
+ .byte 15,135,100,255,255,255 // ja 3c19 <_sk_load_4444_hsw+0x25>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,100,0,0,0 // lea 0x64(%rip),%r10 # 3d28 <_sk_load_4444_hsw+0x130>
+ .byte 76,141,21,100,0,0,0 // lea 0x64(%rip),%r10 # 3d24 <_sk_load_4444_hsw+0x130>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,66,255,255,255 // jmpq 3c1d <_sk_load_4444_hsw+0x25>
+ .byte 233,66,255,255,255 // jmpq 3c19 <_sk_load_4444_hsw+0x25>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,129,121,196,68,88,4,2 // vpinsrw $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,121,110,12,88 // vmovd (%r8,%r11,2),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,37,255,255,255 // jmpq 3c1d <_sk_load_4444_hsw+0x25>
+ .byte 233,37,255,255,255 // jmpq 3c19 <_sk_load_4444_hsw+0x25>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,129,121,196,68,88,12,6 // vpinsrw $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,121,196,68,88,10,5 // vpinsrw $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,121,196,68,88,8,4 // vpinsrw $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,122,126,12,88 // vmovq (%r8,%r11,2),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,248,254,255,255 // jmpq 3c1d <_sk_load_4444_hsw+0x25>
+ .byte 233,248,254,255,255 // jmpq 3c19 <_sk_load_4444_hsw+0x25>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -13185,28 +13182,28 @@ _sk_load_4444_dst_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,138,0,0,0 // jne 3ded <_sk_load_4444_dst_hsw+0xa9>
+ .byte 15,133,138,0,0,0 // jne 3de9 <_sk_load_4444_dst_hsw+0xa9>
.byte 196,129,122,111,36,88 // vmovdqu (%r8,%r11,2),%xmm4
.byte 196,226,125,51,252 // vpmovzxwd %xmm4,%ymm7
- .byte 196,226,125,88,37,149,133,2,0 // vpbroadcastd 0x28595(%rip),%ymm4 # 2c30c <_sk_overlay_sse2_8bit+0x534>
+ .byte 196,226,125,88,37,77,142,2,0 // vpbroadcastd 0x28e4d(%rip),%ymm4 # 2cbc0 <_sk_overlay_sse2_8bit+0xdfc>
.byte 197,197,219,228 // vpand %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,136,133,2,0 // vbroadcastss 0x28588(%rip),%ymm5 # 2c310 <_sk_overlay_sse2_8bit+0x538>
+ .byte 196,226,125,24,45,64,142,2,0 // vbroadcastss 0x28e40(%rip),%ymm5 # 2cbc4 <_sk_overlay_sse2_8bit+0xe00>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,127,133,2,0 // vpbroadcastd 0x2857f(%rip),%ymm5 # 2c314 <_sk_overlay_sse2_8bit+0x53c>
+ .byte 196,226,125,88,45,55,142,2,0 // vpbroadcastd 0x28e37(%rip),%ymm5 # 2cbc8 <_sk_overlay_sse2_8bit+0xe04>
.byte 197,197,219,237 // vpand %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,114,133,2,0 // vbroadcastss 0x28572(%rip),%ymm6 # 2c318 <_sk_overlay_sse2_8bit+0x540>
+ .byte 196,226,125,24,53,42,142,2,0 // vbroadcastss 0x28e2a(%rip),%ymm6 # 2cbcc <_sk_overlay_sse2_8bit+0xe08>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,88,53,105,133,2,0 // vpbroadcastd 0x28569(%rip),%ymm6 # 2c31c <_sk_overlay_sse2_8bit+0x544>
+ .byte 196,226,125,88,53,33,142,2,0 // vpbroadcastd 0x28e21(%rip),%ymm6 # 2cbd0 <_sk_overlay_sse2_8bit+0xe0c>
.byte 197,197,219,246 // vpand %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,92,133,2,0 // vbroadcastss 0x2855c(%rip),%ymm8 # 2c320 <_sk_overlay_sse2_8bit+0x548>
+ .byte 196,98,125,24,5,20,142,2,0 // vbroadcastss 0x28e14(%rip),%ymm8 # 2cbd4 <_sk_overlay_sse2_8bit+0xe10>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,88,5,82,133,2,0 // vpbroadcastd 0x28552(%rip),%ymm8 # 2c324 <_sk_overlay_sse2_8bit+0x54c>
+ .byte 196,98,125,88,5,10,142,2,0 // vpbroadcastd 0x28e0a(%rip),%ymm8 # 2cbd8 <_sk_overlay_sse2_8bit+0xe14>
.byte 196,193,69,219,248 // vpand %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,68,133,2,0 // vbroadcastss 0x28544(%rip),%ymm8 # 2c328 <_sk_overlay_sse2_8bit+0x550>
+ .byte 196,98,125,24,5,252,141,2,0 // vbroadcastss 0x28dfc(%rip),%ymm8 # 2cbdc <_sk_overlay_sse2_8bit+0xe18>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -13215,27 +13212,27 @@ _sk_load_4444_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,100,255,255,255 // ja 3d69 <_sk_load_4444_dst_hsw+0x25>
+ .byte 15,135,100,255,255,255 // ja 3d65 <_sk_load_4444_dst_hsw+0x25>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,100,0,0,0 // lea 0x64(%rip),%r10 # 3e74 <_sk_load_4444_dst_hsw+0x130>
+ .byte 76,141,21,100,0,0,0 // lea 0x64(%rip),%r10 # 3e70 <_sk_load_4444_dst_hsw+0x130>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,66,255,255,255 // jmpq 3d69 <_sk_load_4444_dst_hsw+0x25>
+ .byte 233,66,255,255,255 // jmpq 3d65 <_sk_load_4444_dst_hsw+0x25>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,129,89,196,100,88,4,2 // vpinsrw $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,121,110,44,88 // vmovd (%r8,%r11,2),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,37,255,255,255 // jmpq 3d69 <_sk_load_4444_dst_hsw+0x25>
+ .byte 233,37,255,255,255 // jmpq 3d65 <_sk_load_4444_dst_hsw+0x25>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,129,89,196,100,88,12,6 // vpinsrw $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,89,196,100,88,10,5 // vpinsrw $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,89,196,100,88,8,4 // vpinsrw $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,122,126,44,88 // vmovq (%r8,%r11,2),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,248,254,255,255 // jmpq 3d69 <_sk_load_4444_dst_hsw+0x25>
+ .byte 233,248,254,255,255 // jmpq 3d65 <_sk_load_4444_dst_hsw+0x25>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -13304,25 +13301,25 @@ _sk_gather_4444_hsw:
.byte 65,15,183,4,88 // movzwl (%r8,%rbx,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,193,131,2,0 // vpbroadcastd 0x283c1(%rip),%ymm0 # 2c30c <_sk_overlay_sse2_8bit+0x534>
+ .byte 196,226,125,88,5,121,140,2,0 // vpbroadcastd 0x28c79(%rip),%ymm0 # 2cbc0 <_sk_overlay_sse2_8bit+0xdfc>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,180,131,2,0 // vbroadcastss 0x283b4(%rip),%ymm1 # 2c310 <_sk_overlay_sse2_8bit+0x538>
+ .byte 196,226,125,24,13,108,140,2,0 // vbroadcastss 0x28c6c(%rip),%ymm1 # 2cbc4 <_sk_overlay_sse2_8bit+0xe00>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,171,131,2,0 // vpbroadcastd 0x283ab(%rip),%ymm1 # 2c314 <_sk_overlay_sse2_8bit+0x53c>
+ .byte 196,226,125,88,13,99,140,2,0 // vpbroadcastd 0x28c63(%rip),%ymm1 # 2cbc8 <_sk_overlay_sse2_8bit+0xe04>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,158,131,2,0 // vbroadcastss 0x2839e(%rip),%ymm2 # 2c318 <_sk_overlay_sse2_8bit+0x540>
+ .byte 196,226,125,24,21,86,140,2,0 // vbroadcastss 0x28c56(%rip),%ymm2 # 2cbcc <_sk_overlay_sse2_8bit+0xe08>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,149,131,2,0 // vpbroadcastd 0x28395(%rip),%ymm2 # 2c31c <_sk_overlay_sse2_8bit+0x544>
+ .byte 196,226,125,88,21,77,140,2,0 // vpbroadcastd 0x28c4d(%rip),%ymm2 # 2cbd0 <_sk_overlay_sse2_8bit+0xe0c>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,136,131,2,0 // vbroadcastss 0x28388(%rip),%ymm8 # 2c320 <_sk_overlay_sse2_8bit+0x548>
+ .byte 196,98,125,24,5,64,140,2,0 // vbroadcastss 0x28c40(%rip),%ymm8 # 2cbd4 <_sk_overlay_sse2_8bit+0xe10>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,126,131,2,0 // vpbroadcastd 0x2837e(%rip),%ymm8 # 2c324 <_sk_overlay_sse2_8bit+0x54c>
+ .byte 196,98,125,88,5,54,140,2,0 // vpbroadcastd 0x28c36(%rip),%ymm8 # 2cbd8 <_sk_overlay_sse2_8bit+0xe14>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,112,131,2,0 // vbroadcastss 0x28370(%rip),%ymm8 # 2c328 <_sk_overlay_sse2_8bit+0x550>
+ .byte 196,98,125,24,5,40,140,2,0 // vbroadcastss 0x28c28(%rip),%ymm8 # 2cbdc <_sk_overlay_sse2_8bit+0xe18>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -13342,7 +13339,7 @@ _sk_store_4444_hsw:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,69,131,2,0 // vbroadcastss 0x28345(%rip),%ymm8 # 2c32c <_sk_overlay_sse2_8bit+0x554>
+ .byte 196,98,125,24,5,253,139,2,0 // vbroadcastss 0x28bfd(%rip),%ymm8 # 2cbe0 <_sk_overlay_sse2_8bit+0xe1c>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9
@@ -13360,7 +13357,7 @@ _sk_store_4444_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 404a <_sk_store_4444_hsw+0x82>
+ .byte 117,10 // jne 4046 <_sk_store_4444_hsw+0x82>
.byte 196,1,122,127,4,88 // vmovdqu %xmm8,(%r8,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -13368,22 +13365,22 @@ _sk_store_4444_hsw:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 4046 <_sk_store_4444_hsw+0x7e>
+ .byte 119,236 // ja 4042 <_sk_store_4444_hsw+0x7e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,67,0,0,0 // lea 0x43(%rip),%r10 # 40a8 <_sk_store_4444_hsw+0xe0>
+ .byte 76,141,21,67,0,0,0 // lea 0x43(%rip),%r10 # 40a4 <_sk_store_4444_hsw+0xe0>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,3,121,21,4,88,0 // vpextrw $0x0,%xmm8,(%r8,%r11,2)
- .byte 235,207 // jmp 4046 <_sk_store_4444_hsw+0x7e>
+ .byte 235,207 // jmp 4042 <_sk_store_4444_hsw+0x7e>
.byte 196,3,121,21,68,88,4,2 // vpextrw $0x2,%xmm8,0x4(%r8,%r11,2)
.byte 196,1,121,126,4,88 // vmovd %xmm8,(%r8,%r11,2)
- .byte 235,191 // jmp 4046 <_sk_store_4444_hsw+0x7e>
+ .byte 235,191 // jmp 4042 <_sk_store_4444_hsw+0x7e>
.byte 196,3,121,21,68,88,12,6 // vpextrw $0x6,%xmm8,0xc(%r8,%r11,2)
.byte 196,3,121,21,68,88,10,5 // vpextrw $0x5,%xmm8,0xa(%r8,%r11,2)
.byte 196,3,121,21,68,88,8,4 // vpextrw $0x4,%xmm8,0x8(%r8,%r11,2)
.byte 196,1,121,214,4,88 // vmovq %xmm8,(%r8,%r11,2)
- .byte 235,159 // jmp 4046 <_sk_store_4444_hsw+0x7e>
+ .byte 235,159 // jmp 4042 <_sk_store_4444_hsw+0x7e>
.byte 144 // nop
.byte 198 // (bad)
.byte 255 // (bad)
@@ -13421,16 +13418,16 @@ _sk_load_8888_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,86 // jne 4136 <_sk_load_8888_hsw+0x72>
+ .byte 117,86 // jne 4132 <_sk_load_8888_hsw+0x72>
.byte 196,129,126,111,28,152 // vmovdqu (%r8,%r11,4),%ymm3
- .byte 197,229,219,5,210,131,2,0 // vpand 0x283d2(%rip),%ymm3,%ymm0 # 2c4c0 <_sk_overlay_sse2_8bit+0x6e8>
+ .byte 197,229,219,5,22,130,2,0 // vpand 0x28216(%rip),%ymm3,%ymm0 # 2c300 <_sk_overlay_sse2_8bit+0x53c>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,145,129,2,0 // vbroadcastss 0x28191(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,73,138,2,0 // vbroadcastss 0x28a49(%rip),%ymm8 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,215,131,2,0 // vpshufb 0x283d7(%rip),%ymm3,%ymm1 # 2c4e0 <_sk_overlay_sse2_8bit+0x708>
+ .byte 196,226,101,0,13,27,130,2,0 // vpshufb 0x2821b(%rip),%ymm3,%ymm1 # 2c320 <_sk_overlay_sse2_8bit+0x55c>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,229,131,2,0 // vpshufb 0x283e5(%rip),%ymm3,%ymm2 # 2c500 <_sk_overlay_sse2_8bit+0x728>
+ .byte 196,226,101,0,21,41,130,2,0 // vpshufb 0x28229(%rip),%ymm3,%ymm2 # 2c340 <_sk_overlay_sse2_8bit+0x57c>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -13443,21 +13440,21 @@ _sk_load_8888_hsw:
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,156 // ja 40e6 <_sk_load_8888_hsw+0x22>
+ .byte 119,156 // ja 40e2 <_sk_load_8888_hsw+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,135,0,0,0 // lea 0x87(%rip),%r10 # 41dc <_sk_load_8888_hsw+0x118>
+ .byte 76,141,21,135,0,0,0 // lea 0x87(%rip),%r10 # 41d8 <_sk_load_8888_hsw+0x118>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,28,152 // vmovd (%r8,%r11,4),%xmm3
- .byte 235,128 // jmp 40e6 <_sk_load_8888_hsw+0x22>
+ .byte 235,128 // jmp 40e2 <_sk_load_8888_hsw+0x22>
.byte 196,129,121,110,68,152,8 // vmovd 0x8(%r8,%r11,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
.byte 196,227,117,2,216,4 // vpblendd $0x4,%ymm0,%ymm1,%ymm3
.byte 196,129,122,126,4,152 // vmovq (%r8,%r11,4),%xmm0
.byte 196,227,101,2,216,3 // vpblendd $0x3,%ymm0,%ymm3,%ymm3
- .byte 233,89,255,255,255 // jmpq 40e6 <_sk_load_8888_hsw+0x22>
+ .byte 233,89,255,255,255 // jmpq 40e2 <_sk_load_8888_hsw+0x22>
.byte 196,129,121,110,68,152,24 // vmovd 0x18(%r8,%r11,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -13470,7 +13467,7 @@ _sk_load_8888_hsw:
.byte 196,227,101,56,216,1 // vinserti128 $0x1,%xmm0,%ymm3,%ymm3
.byte 196,129,122,111,4,152 // vmovdqu (%r8,%r11,4),%xmm0
.byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- .byte 233,10,255,255,255 // jmpq 40e6 <_sk_load_8888_hsw+0x22>
+ .byte 233,10,255,255,255 // jmpq 40e2 <_sk_load_8888_hsw+0x22>
.byte 130 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -13504,16 +13501,16 @@ _sk_load_8888_dst_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,86 // jne 426a <_sk_load_8888_dst_hsw+0x72>
+ .byte 117,86 // jne 4266 <_sk_load_8888_dst_hsw+0x72>
.byte 196,129,126,111,60,152 // vmovdqu (%r8,%r11,4),%ymm7
- .byte 197,197,219,37,254,130,2,0 // vpand 0x282fe(%rip),%ymm7,%ymm4 # 2c520 <_sk_overlay_sse2_8bit+0x748>
+ .byte 197,197,219,37,66,129,2,0 // vpand 0x28142(%rip),%ymm7,%ymm4 # 2c360 <_sk_overlay_sse2_8bit+0x59c>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,93,128,2,0 // vbroadcastss 0x2805d(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,21,137,2,0 // vbroadcastss 0x28915(%rip),%ymm8 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
- .byte 196,226,69,0,45,3,131,2,0 // vpshufb 0x28303(%rip),%ymm7,%ymm5 # 2c540 <_sk_overlay_sse2_8bit+0x768>
+ .byte 196,226,69,0,45,71,129,2,0 // vpshufb 0x28147(%rip),%ymm7,%ymm5 # 2c380 <_sk_overlay_sse2_8bit+0x5bc>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
.byte 196,193,84,89,232 // vmulps %ymm8,%ymm5,%ymm5
- .byte 196,226,69,0,53,17,131,2,0 // vpshufb 0x28311(%rip),%ymm7,%ymm6 # 2c560 <_sk_overlay_sse2_8bit+0x788>
+ .byte 196,226,69,0,53,85,129,2,0 // vpshufb 0x28155(%rip),%ymm7,%ymm6 # 2c3a0 <_sk_overlay_sse2_8bit+0x5dc>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -13526,21 +13523,21 @@ _sk_load_8888_dst_hsw:
.byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,156 // ja 421a <_sk_load_8888_dst_hsw+0x22>
+ .byte 119,156 // ja 4216 <_sk_load_8888_dst_hsw+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,135,0,0,0 // lea 0x87(%rip),%r10 # 4310 <_sk_load_8888_dst_hsw+0x118>
+ .byte 76,141,21,135,0,0,0 // lea 0x87(%rip),%r10 # 430c <_sk_load_8888_dst_hsw+0x118>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,60,152 // vmovd (%r8,%r11,4),%xmm7
- .byte 235,128 // jmp 421a <_sk_load_8888_dst_hsw+0x22>
+ .byte 235,128 // jmp 4216 <_sk_load_8888_dst_hsw+0x22>
.byte 196,129,121,110,100,152,8 // vmovd 0x8(%r8,%r11,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
.byte 196,227,85,2,252,4 // vpblendd $0x4,%ymm4,%ymm5,%ymm7
.byte 196,129,122,126,36,152 // vmovq (%r8,%r11,4),%xmm4
.byte 196,227,69,2,252,3 // vpblendd $0x3,%ymm4,%ymm7,%ymm7
- .byte 233,89,255,255,255 // jmpq 421a <_sk_load_8888_dst_hsw+0x22>
+ .byte 233,89,255,255,255 // jmpq 4216 <_sk_load_8888_dst_hsw+0x22>
.byte 196,129,121,110,100,152,24 // vmovd 0x18(%r8,%r11,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -13553,7 +13550,7 @@ _sk_load_8888_dst_hsw:
.byte 196,227,69,56,252,1 // vinserti128 $0x1,%xmm4,%ymm7,%ymm7
.byte 196,129,122,111,36,152 // vmovdqu (%r8,%r11,4),%xmm4
.byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- .byte 233,10,255,255,255 // jmpq 421a <_sk_load_8888_dst_hsw+0x22>
+ .byte 233,10,255,255,255 // jmpq 4216 <_sk_load_8888_dst_hsw+0x22>
.byte 130 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -13588,14 +13585,14 @@ _sk_gather_8888_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,128 // vpgatherdd %ymm1,(%r8,%ymm0,4),%ymm3
- .byte 197,229,219,5,38,130,2,0 // vpand 0x28226(%rip),%ymm3,%ymm0 # 2c580 <_sk_overlay_sse2_8bit+0x7a8>
+ .byte 197,229,219,5,106,128,2,0 // vpand 0x2806a(%rip),%ymm3,%ymm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x5fc>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,37,127,2,0 // vbroadcastss 0x27f25(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,221,135,2,0 // vbroadcastss 0x287dd(%rip),%ymm8 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,43,130,2,0 // vpshufb 0x2822b(%rip),%ymm3,%ymm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x7c8>
+ .byte 196,226,101,0,13,111,128,2,0 // vpshufb 0x2806f(%rip),%ymm3,%ymm1 # 2c3e0 <_sk_overlay_sse2_8bit+0x61c>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,57,130,2,0 // vpshufb 0x28239(%rip),%ymm3,%ymm2 # 2c5c0 <_sk_overlay_sse2_8bit+0x7e8>
+ .byte 196,226,101,0,21,125,128,2,0 // vpshufb 0x2807d(%rip),%ymm3,%ymm2 # 2c400 <_sk_overlay_sse2_8bit+0x63c>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -13615,7 +13612,7 @@ _sk_store_8888_hsw:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,130,126,2,0 // vbroadcastss 0x27e82(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,58,135,2,0 // vbroadcastss 0x2873a(%rip),%ymm8 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -13631,7 +13628,7 @@ _sk_store_8888_hsw:
.byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8
.byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 441a <_sk_store_8888_hsw+0x78>
+ .byte 117,10 // jne 4416 <_sk_store_8888_hsw+0x78>
.byte 196,1,126,127,4,152 // vmovdqu %ymm8,(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -13639,17 +13636,17 @@ _sk_store_8888_hsw:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 4416 <_sk_store_8888_hsw+0x74>
+ .byte 119,236 // ja 4412 <_sk_store_8888_hsw+0x74>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,83,0,0,0 // lea 0x53(%rip),%r10 # 4488 <_sk_store_8888_hsw+0xe6>
+ .byte 76,141,21,83,0,0,0 // lea 0x53(%rip),%r10 # 4484 <_sk_store_8888_hsw+0xe6>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,121,126,4,152 // vmovd %xmm8,(%r8,%r11,4)
- .byte 235,208 // jmp 4416 <_sk_store_8888_hsw+0x74>
+ .byte 235,208 // jmp 4412 <_sk_store_8888_hsw+0x74>
.byte 196,3,121,22,68,152,8,2 // vpextrd $0x2,%xmm8,0x8(%r8,%r11,4)
.byte 196,1,121,214,4,152 // vmovq %xmm8,(%r8,%r11,4)
- .byte 235,192 // jmp 4416 <_sk_store_8888_hsw+0x74>
+ .byte 235,192 // jmp 4412 <_sk_store_8888_hsw+0x74>
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,3,121,22,76,152,24,2 // vpextrd $0x2,%xmm9,0x18(%r8,%r11,4)
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
@@ -13657,7 +13654,7 @@ _sk_store_8888_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,1,121,126,76,152,16 // vmovd %xmm9,0x10(%r8,%r11,4)
.byte 196,1,122,127,4,152 // vmovdqu %xmm8,(%r8,%r11,4)
- .byte 235,143 // jmp 4416 <_sk_store_8888_hsw+0x74>
+ .byte 235,143 // jmp 4412 <_sk_store_8888_hsw+0x74>
.byte 144 // nop
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -13692,16 +13689,16 @@ _sk_load_bgra_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,86 // jne 4516 <_sk_load_bgra_hsw+0x72>
+ .byte 117,86 // jne 4512 <_sk_load_bgra_hsw+0x72>
.byte 196,129,126,111,28,152 // vmovdqu (%r8,%r11,4),%ymm3
- .byte 197,229,219,5,18,129,2,0 // vpand 0x28112(%rip),%ymm3,%ymm0 # 2c5e0 <_sk_overlay_sse2_8bit+0x808>
+ .byte 197,229,219,5,86,127,2,0 // vpand 0x27f56(%rip),%ymm3,%ymm0 # 2c420 <_sk_overlay_sse2_8bit+0x65c>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,177,125,2,0 // vbroadcastss 0x27db1(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,105,134,2,0 // vbroadcastss 0x28669(%rip),%ymm8 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,23,129,2,0 // vpshufb 0x28117(%rip),%ymm3,%ymm0 # 2c600 <_sk_overlay_sse2_8bit+0x828>
+ .byte 196,226,101,0,5,91,127,2,0 // vpshufb 0x27f5b(%rip),%ymm3,%ymm0 # 2c440 <_sk_overlay_sse2_8bit+0x67c>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,37,129,2,0 // vpshufb 0x28125(%rip),%ymm3,%ymm0 # 2c620 <_sk_overlay_sse2_8bit+0x848>
+ .byte 196,226,101,0,5,105,127,2,0 // vpshufb 0x27f69(%rip),%ymm3,%ymm0 # 2c460 <_sk_overlay_sse2_8bit+0x69c>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -13714,21 +13711,21 @@ _sk_load_bgra_hsw:
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,156 // ja 44c6 <_sk_load_bgra_hsw+0x22>
+ .byte 119,156 // ja 44c2 <_sk_load_bgra_hsw+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,135,0,0,0 // lea 0x87(%rip),%r10 # 45bc <_sk_load_bgra_hsw+0x118>
+ .byte 76,141,21,135,0,0,0 // lea 0x87(%rip),%r10 # 45b8 <_sk_load_bgra_hsw+0x118>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,28,152 // vmovd (%r8,%r11,4),%xmm3
- .byte 235,128 // jmp 44c6 <_sk_load_bgra_hsw+0x22>
+ .byte 235,128 // jmp 44c2 <_sk_load_bgra_hsw+0x22>
.byte 196,129,121,110,68,152,8 // vmovd 0x8(%r8,%r11,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
.byte 196,227,117,2,216,4 // vpblendd $0x4,%ymm0,%ymm1,%ymm3
.byte 196,129,122,126,4,152 // vmovq (%r8,%r11,4),%xmm0
.byte 196,227,101,2,216,3 // vpblendd $0x3,%ymm0,%ymm3,%ymm3
- .byte 233,89,255,255,255 // jmpq 44c6 <_sk_load_bgra_hsw+0x22>
+ .byte 233,89,255,255,255 // jmpq 44c2 <_sk_load_bgra_hsw+0x22>
.byte 196,129,121,110,68,152,24 // vmovd 0x18(%r8,%r11,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -13741,7 +13738,7 @@ _sk_load_bgra_hsw:
.byte 196,227,101,56,216,1 // vinserti128 $0x1,%xmm0,%ymm3,%ymm3
.byte 196,129,122,111,4,152 // vmovdqu (%r8,%r11,4),%xmm0
.byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- .byte 233,10,255,255,255 // jmpq 44c6 <_sk_load_bgra_hsw+0x22>
+ .byte 233,10,255,255,255 // jmpq 44c2 <_sk_load_bgra_hsw+0x22>
.byte 130 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -13775,16 +13772,16 @@ _sk_load_bgra_dst_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,86 // jne 464a <_sk_load_bgra_dst_hsw+0x72>
+ .byte 117,86 // jne 4646 <_sk_load_bgra_dst_hsw+0x72>
.byte 196,129,126,111,60,152 // vmovdqu (%r8,%r11,4),%ymm7
- .byte 197,197,219,37,62,128,2,0 // vpand 0x2803e(%rip),%ymm7,%ymm4 # 2c640 <_sk_overlay_sse2_8bit+0x868>
+ .byte 197,197,219,37,130,126,2,0 // vpand 0x27e82(%rip),%ymm7,%ymm4 # 2c480 <_sk_overlay_sse2_8bit+0x6bc>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,125,124,2,0 // vbroadcastss 0x27c7d(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,53,133,2,0 // vbroadcastss 0x28535(%rip),%ymm8 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,92,89,240 // vmulps %ymm8,%ymm4,%ymm6
- .byte 196,226,69,0,37,67,128,2,0 // vpshufb 0x28043(%rip),%ymm7,%ymm4 # 2c660 <_sk_overlay_sse2_8bit+0x888>
+ .byte 196,226,69,0,37,135,126,2,0 // vpshufb 0x27e87(%rip),%ymm7,%ymm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x6dc>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,232 // vmulps %ymm8,%ymm4,%ymm5
- .byte 196,226,69,0,37,81,128,2,0 // vpshufb 0x28051(%rip),%ymm7,%ymm4 # 2c680 <_sk_overlay_sse2_8bit+0x8a8>
+ .byte 196,226,69,0,37,149,126,2,0 // vpshufb 0x27e95(%rip),%ymm7,%ymm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x6fc>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -13797,21 +13794,21 @@ _sk_load_bgra_dst_hsw:
.byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,156 // ja 45fa <_sk_load_bgra_dst_hsw+0x22>
+ .byte 119,156 // ja 45f6 <_sk_load_bgra_dst_hsw+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,135,0,0,0 // lea 0x87(%rip),%r10 # 46f0 <_sk_load_bgra_dst_hsw+0x118>
+ .byte 76,141,21,135,0,0,0 // lea 0x87(%rip),%r10 # 46ec <_sk_load_bgra_dst_hsw+0x118>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,60,152 // vmovd (%r8,%r11,4),%xmm7
- .byte 235,128 // jmp 45fa <_sk_load_bgra_dst_hsw+0x22>
+ .byte 235,128 // jmp 45f6 <_sk_load_bgra_dst_hsw+0x22>
.byte 196,129,121,110,100,152,8 // vmovd 0x8(%r8,%r11,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
.byte 196,227,85,2,252,4 // vpblendd $0x4,%ymm4,%ymm5,%ymm7
.byte 196,129,122,126,36,152 // vmovq (%r8,%r11,4),%xmm4
.byte 196,227,69,2,252,3 // vpblendd $0x3,%ymm4,%ymm7,%ymm7
- .byte 233,89,255,255,255 // jmpq 45fa <_sk_load_bgra_dst_hsw+0x22>
+ .byte 233,89,255,255,255 // jmpq 45f6 <_sk_load_bgra_dst_hsw+0x22>
.byte 196,129,121,110,100,152,24 // vmovd 0x18(%r8,%r11,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -13824,7 +13821,7 @@ _sk_load_bgra_dst_hsw:
.byte 196,227,69,56,252,1 // vinserti128 $0x1,%xmm4,%ymm7,%ymm7
.byte 196,129,122,111,36,152 // vmovdqu (%r8,%r11,4),%xmm4
.byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- .byte 233,10,255,255,255 // jmpq 45fa <_sk_load_bgra_dst_hsw+0x22>
+ .byte 233,10,255,255,255 // jmpq 45f6 <_sk_load_bgra_dst_hsw+0x22>
.byte 130 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -13859,14 +13856,14 @@ _sk_gather_bgra_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,128 // vpgatherdd %ymm1,(%r8,%ymm0,4),%ymm3
- .byte 197,229,219,5,102,127,2,0 // vpand 0x27f66(%rip),%ymm3,%ymm0 # 2c6a0 <_sk_overlay_sse2_8bit+0x8c8>
+ .byte 197,229,219,5,170,125,2,0 // vpand 0x27daa(%rip),%ymm3,%ymm0 # 2c4e0 <_sk_overlay_sse2_8bit+0x71c>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,69,123,2,0 // vbroadcastss 0x27b45(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,253,131,2,0 // vbroadcastss 0x283fd(%rip),%ymm8 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,107,127,2,0 // vpshufb 0x27f6b(%rip),%ymm3,%ymm0 # 2c6c0 <_sk_overlay_sse2_8bit+0x8e8>
+ .byte 196,226,101,0,5,175,125,2,0 // vpshufb 0x27daf(%rip),%ymm3,%ymm0 # 2c500 <_sk_overlay_sse2_8bit+0x73c>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,121,127,2,0 // vpshufb 0x27f79(%rip),%ymm3,%ymm0 # 2c6e0 <_sk_overlay_sse2_8bit+0x908>
+ .byte 196,226,101,0,5,189,125,2,0 // vpshufb 0x27dbd(%rip),%ymm3,%ymm0 # 2c520 <_sk_overlay_sse2_8bit+0x75c>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -13886,7 +13883,7 @@ _sk_store_bgra_hsw:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,162,122,2,0 // vbroadcastss 0x27aa2(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,90,131,2,0 // vbroadcastss 0x2835a(%rip),%ymm8 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -13902,7 +13899,7 @@ _sk_store_bgra_hsw:
.byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8
.byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 47fa <_sk_store_bgra_hsw+0x78>
+ .byte 117,10 // jne 47f6 <_sk_store_bgra_hsw+0x78>
.byte 196,1,126,127,4,152 // vmovdqu %ymm8,(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -13910,17 +13907,17 @@ _sk_store_bgra_hsw:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 47f6 <_sk_store_bgra_hsw+0x74>
+ .byte 119,236 // ja 47f2 <_sk_store_bgra_hsw+0x74>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,83,0,0,0 // lea 0x53(%rip),%r10 # 4868 <_sk_store_bgra_hsw+0xe6>
+ .byte 76,141,21,83,0,0,0 // lea 0x53(%rip),%r10 # 4864 <_sk_store_bgra_hsw+0xe6>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,121,126,4,152 // vmovd %xmm8,(%r8,%r11,4)
- .byte 235,208 // jmp 47f6 <_sk_store_bgra_hsw+0x74>
+ .byte 235,208 // jmp 47f2 <_sk_store_bgra_hsw+0x74>
.byte 196,3,121,22,68,152,8,2 // vpextrd $0x2,%xmm8,0x8(%r8,%r11,4)
.byte 196,1,121,214,4,152 // vmovq %xmm8,(%r8,%r11,4)
- .byte 235,192 // jmp 47f6 <_sk_store_bgra_hsw+0x74>
+ .byte 235,192 // jmp 47f2 <_sk_store_bgra_hsw+0x74>
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,3,121,22,76,152,24,2 // vpextrd $0x2,%xmm9,0x18(%r8,%r11,4)
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
@@ -13928,7 +13925,7 @@ _sk_store_bgra_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,1,121,126,76,152,16 // vmovd %xmm9,0x10(%r8,%r11,4)
.byte 196,1,122,127,4,152 // vmovdqu %xmm8,(%r8,%r11,4)
- .byte 235,143 // jmp 47f6 <_sk_store_bgra_hsw+0x74>
+ .byte 235,143 // jmp 47f2 <_sk_store_bgra_hsw+0x74>
.byte 144 // nop
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -13963,7 +13960,7 @@ _sk_load_f16_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,101 // jne 4905 <_sk_load_f16_hsw+0x81>
+ .byte 117,101 // jne 4901 <_sk_load_f16_hsw+0x81>
.byte 196,65,121,16,4,192 // vmovupd (%r8,%rax,8),%xmm8
.byte 196,193,121,16,84,192,16 // vmovupd 0x10(%r8,%rax,8),%xmm2
.byte 196,193,121,16,92,192,32 // vmovupd 0x20(%r8,%rax,8),%xmm3
@@ -13989,29 +13986,29 @@ _sk_load_f16_hsw:
.byte 196,65,123,16,4,192 // vmovsd (%r8,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,85 // je 496b <_sk_load_f16_hsw+0xe7>
+ .byte 116,85 // je 4967 <_sk_load_f16_hsw+0xe7>
.byte 196,65,57,22,68,192,8 // vmovhpd 0x8(%r8,%rax,8),%xmm8,%xmm8
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,72 // jb 496b <_sk_load_f16_hsw+0xe7>
+ .byte 114,72 // jb 4967 <_sk_load_f16_hsw+0xe7>
.byte 196,193,123,16,84,192,16 // vmovsd 0x10(%r8,%rax,8),%xmm2
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 116,72 // je 4978 <_sk_load_f16_hsw+0xf4>
+ .byte 116,72 // je 4974 <_sk_load_f16_hsw+0xf4>
.byte 196,193,105,22,84,192,24 // vmovhpd 0x18(%r8,%rax,8),%xmm2,%xmm2
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,59 // jb 4978 <_sk_load_f16_hsw+0xf4>
+ .byte 114,59 // jb 4974 <_sk_load_f16_hsw+0xf4>
.byte 196,193,123,16,92,192,32 // vmovsd 0x20(%r8,%rax,8),%xmm3
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 15,132,109,255,255,255 // je 48bb <_sk_load_f16_hsw+0x37>
+ .byte 15,132,109,255,255,255 // je 48b7 <_sk_load_f16_hsw+0x37>
.byte 196,193,97,22,92,192,40 // vmovhpd 0x28(%r8,%rax,8),%xmm3,%xmm3
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 15,130,92,255,255,255 // jb 48bb <_sk_load_f16_hsw+0x37>
+ .byte 15,130,92,255,255,255 // jb 48b7 <_sk_load_f16_hsw+0x37>
.byte 196,65,122,126,76,192,48 // vmovq 0x30(%r8,%rax,8),%xmm9
- .byte 233,80,255,255,255 // jmpq 48bb <_sk_load_f16_hsw+0x37>
+ .byte 233,80,255,255,255 // jmpq 48b7 <_sk_load_f16_hsw+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,67,255,255,255 // jmpq 48bb <_sk_load_f16_hsw+0x37>
+ .byte 233,67,255,255,255 // jmpq 48b7 <_sk_load_f16_hsw+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,58,255,255,255 // jmpq 48bb <_sk_load_f16_hsw+0x37>
+ .byte 233,58,255,255,255 // jmpq 48b7 <_sk_load_f16_hsw+0x37>
HIDDEN _sk_load_f16_dst_hsw
.globl _sk_load_f16_dst_hsw
@@ -14025,7 +14022,7 @@ _sk_load_f16_dst_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,101 // jne 4a02 <_sk_load_f16_dst_hsw+0x81>
+ .byte 117,101 // jne 49fe <_sk_load_f16_dst_hsw+0x81>
.byte 196,65,121,16,4,192 // vmovupd (%r8,%rax,8),%xmm8
.byte 196,193,121,16,116,192,16 // vmovupd 0x10(%r8,%rax,8),%xmm6
.byte 196,193,121,16,124,192,32 // vmovupd 0x20(%r8,%rax,8),%xmm7
@@ -14051,29 +14048,29 @@ _sk_load_f16_dst_hsw:
.byte 196,65,123,16,4,192 // vmovsd (%r8,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,85 // je 4a68 <_sk_load_f16_dst_hsw+0xe7>
+ .byte 116,85 // je 4a64 <_sk_load_f16_dst_hsw+0xe7>
.byte 196,65,57,22,68,192,8 // vmovhpd 0x8(%r8,%rax,8),%xmm8,%xmm8
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,72 // jb 4a68 <_sk_load_f16_dst_hsw+0xe7>
+ .byte 114,72 // jb 4a64 <_sk_load_f16_dst_hsw+0xe7>
.byte 196,193,123,16,116,192,16 // vmovsd 0x10(%r8,%rax,8),%xmm6
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 116,72 // je 4a75 <_sk_load_f16_dst_hsw+0xf4>
+ .byte 116,72 // je 4a71 <_sk_load_f16_dst_hsw+0xf4>
.byte 196,193,73,22,116,192,24 // vmovhpd 0x18(%r8,%rax,8),%xmm6,%xmm6
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,59 // jb 4a75 <_sk_load_f16_dst_hsw+0xf4>
+ .byte 114,59 // jb 4a71 <_sk_load_f16_dst_hsw+0xf4>
.byte 196,193,123,16,124,192,32 // vmovsd 0x20(%r8,%rax,8),%xmm7
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 15,132,109,255,255,255 // je 49b8 <_sk_load_f16_dst_hsw+0x37>
+ .byte 15,132,109,255,255,255 // je 49b4 <_sk_load_f16_dst_hsw+0x37>
.byte 196,193,65,22,124,192,40 // vmovhpd 0x28(%r8,%rax,8),%xmm7,%xmm7
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 15,130,92,255,255,255 // jb 49b8 <_sk_load_f16_dst_hsw+0x37>
+ .byte 15,130,92,255,255,255 // jb 49b4 <_sk_load_f16_dst_hsw+0x37>
.byte 196,65,122,126,76,192,48 // vmovq 0x30(%r8,%rax,8),%xmm9
- .byte 233,80,255,255,255 // jmpq 49b8 <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,80,255,255,255 // jmpq 49b4 <_sk_load_f16_dst_hsw+0x37>
.byte 197,193,87,255 // vxorpd %xmm7,%xmm7,%xmm7
.byte 197,201,87,246 // vxorpd %xmm6,%xmm6,%xmm6
- .byte 233,67,255,255,255 // jmpq 49b8 <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,67,255,255,255 // jmpq 49b4 <_sk_load_f16_dst_hsw+0x37>
.byte 197,193,87,255 // vxorpd %xmm7,%xmm7,%xmm7
- .byte 233,58,255,255,255 // jmpq 49b8 <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,58,255,255,255 // jmpq 49b4 <_sk_load_f16_dst_hsw+0x37>
HIDDEN _sk_gather_f16_hsw
.globl _sk_gather_f16_hsw
@@ -14136,7 +14133,7 @@ _sk_store_f16_hsw:
.byte 196,65,57,98,205 // vpunpckldq %xmm13,%xmm8,%xmm9
.byte 196,65,57,106,197 // vpunpckhdq %xmm13,%xmm8,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,31 // jne 4b83 <_sk_store_f16_hsw+0x7b>
+ .byte 117,31 // jne 4b7f <_sk_store_f16_hsw+0x7b>
.byte 196,65,120,17,28,192 // vmovups %xmm11,(%r8,%rax,8)
.byte 196,65,120,17,84,192,16 // vmovups %xmm10,0x10(%r8,%rax,8)
.byte 196,65,120,17,76,192,32 // vmovups %xmm9,0x20(%r8,%rax,8)
@@ -14145,22 +14142,22 @@ _sk_store_f16_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,192 // vmovq %xmm11,(%r8,%rax,8)
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,240 // je 4b7f <_sk_store_f16_hsw+0x77>
+ .byte 116,240 // je 4b7b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,92,192,8 // vmovhpd %xmm11,0x8(%r8,%rax,8)
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,227 // jb 4b7f <_sk_store_f16_hsw+0x77>
+ .byte 114,227 // jb 4b7b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,84,192,16 // vmovq %xmm10,0x10(%r8,%rax,8)
- .byte 116,218 // je 4b7f <_sk_store_f16_hsw+0x77>
+ .byte 116,218 // je 4b7b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,84,192,24 // vmovhpd %xmm10,0x18(%r8,%rax,8)
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,205 // jb 4b7f <_sk_store_f16_hsw+0x77>
+ .byte 114,205 // jb 4b7b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,76,192,32 // vmovq %xmm9,0x20(%r8,%rax,8)
- .byte 116,196 // je 4b7f <_sk_store_f16_hsw+0x77>
+ .byte 116,196 // je 4b7b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,76,192,40 // vmovhpd %xmm9,0x28(%r8,%rax,8)
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 114,183 // jb 4b7f <_sk_store_f16_hsw+0x77>
+ .byte 114,183 // jb 4b7b <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,68,192,48 // vmovq %xmm8,0x30(%r8,%rax,8)
- .byte 235,174 // jmp 4b7f <_sk_store_f16_hsw+0x77>
+ .byte 235,174 // jmp 4b7b <_sk_store_f16_hsw+0x77>
HIDDEN _sk_load_u16_be_hsw
.globl _sk_load_u16_be_hsw
@@ -14175,7 +14172,7 @@ _sk_load_u16_be_hsw:
.byte 76,3,0 // add (%rax),%r8
.byte 73,99,193 // movslq %r9d,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,204,0,0,0 // jne 4cc4 <_sk_load_u16_be_hsw+0xf3>
+ .byte 15,133,204,0,0,0 // jne 4cc0 <_sk_load_u16_be_hsw+0xf3>
.byte 196,65,121,16,4,64 // vmovupd (%r8,%rax,2),%xmm8
.byte 196,193,121,16,84,64,16 // vmovupd 0x10(%r8,%rax,2),%xmm2
.byte 196,193,121,16,92,64,32 // vmovupd 0x20(%r8,%rax,2),%xmm3
@@ -14194,7 +14191,7 @@ _sk_load_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,79,118,2,0 // vbroadcastss 0x2764f(%rip),%ymm10 # 2c2a8 <_sk_overlay_sse2_8bit+0x4d0>
+ .byte 196,98,125,24,21,7,127,2,0 // vbroadcastss 0x27f07(%rip),%ymm10 # 2cb5c <_sk_overlay_sse2_8bit+0xd98>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -14222,29 +14219,29 @@ _sk_load_u16_be_hsw:
.byte 196,65,123,16,4,64 // vmovsd (%r8,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,85 // je 4d2a <_sk_load_u16_be_hsw+0x159>
+ .byte 116,85 // je 4d26 <_sk_load_u16_be_hsw+0x159>
.byte 196,65,57,22,68,64,8 // vmovhpd 0x8(%r8,%rax,2),%xmm8,%xmm8
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,72 // jb 4d2a <_sk_load_u16_be_hsw+0x159>
+ .byte 114,72 // jb 4d26 <_sk_load_u16_be_hsw+0x159>
.byte 196,193,123,16,84,64,16 // vmovsd 0x10(%r8,%rax,2),%xmm2
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 116,72 // je 4d37 <_sk_load_u16_be_hsw+0x166>
+ .byte 116,72 // je 4d33 <_sk_load_u16_be_hsw+0x166>
.byte 196,193,105,22,84,64,24 // vmovhpd 0x18(%r8,%rax,2),%xmm2,%xmm2
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,59 // jb 4d37 <_sk_load_u16_be_hsw+0x166>
+ .byte 114,59 // jb 4d33 <_sk_load_u16_be_hsw+0x166>
.byte 196,193,123,16,92,64,32 // vmovsd 0x20(%r8,%rax,2),%xmm3
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 15,132,6,255,255,255 // je 4c13 <_sk_load_u16_be_hsw+0x42>
+ .byte 15,132,6,255,255,255 // je 4c0f <_sk_load_u16_be_hsw+0x42>
.byte 196,193,97,22,92,64,40 // vmovhpd 0x28(%r8,%rax,2),%xmm3,%xmm3
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 15,130,245,254,255,255 // jb 4c13 <_sk_load_u16_be_hsw+0x42>
+ .byte 15,130,245,254,255,255 // jb 4c0f <_sk_load_u16_be_hsw+0x42>
.byte 196,65,122,126,76,64,48 // vmovq 0x30(%r8,%rax,2),%xmm9
- .byte 233,233,254,255,255 // jmpq 4c13 <_sk_load_u16_be_hsw+0x42>
+ .byte 233,233,254,255,255 // jmpq 4c0f <_sk_load_u16_be_hsw+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,220,254,255,255 // jmpq 4c13 <_sk_load_u16_be_hsw+0x42>
+ .byte 233,220,254,255,255 // jmpq 4c0f <_sk_load_u16_be_hsw+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,211,254,255,255 // jmpq 4c13 <_sk_load_u16_be_hsw+0x42>
+ .byte 233,211,254,255,255 // jmpq 4c0f <_sk_load_u16_be_hsw+0x42>
HIDDEN _sk_load_rgb_u16_be_hsw
.globl _sk_load_rgb_u16_be_hsw
@@ -14261,7 +14258,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,203,0,0,0 // jne 4e36 <_sk_load_rgb_u16_be_hsw+0xf6>
+ .byte 15,133,203,0,0,0 // jne 4e32 <_sk_load_rgb_u16_be_hsw+0xf6>
.byte 196,65,122,111,28,64 // vmovdqu (%r8,%rax,2),%xmm11
.byte 196,193,122,111,92,64,12 // vmovdqu 0xc(%r8,%rax,2),%xmm3
.byte 196,193,122,111,84,64,24 // vmovdqu 0x18(%r8,%rax,2),%xmm2
@@ -14285,7 +14282,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,225,235,192 // vpor %xmm0,%xmm3,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,29,194,116,2,0 // vbroadcastss 0x274c2(%rip),%ymm3 # 2c2a8 <_sk_overlay_sse2_8bit+0x4d0>
+ .byte 196,226,125,24,29,122,125,2,0 // vbroadcastss 0x27d7a(%rip),%ymm3 # 2cb5c <_sk_overlay_sse2_8bit+0xd98>
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
.byte 197,185,109,201 // vpunpckhqdq %xmm1,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -14302,69 +14299,69 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,228,115,2,0 // vbroadcastss 0x273e4(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,156,124,2,0 // vbroadcastss 0x27c9c(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,64 // vmovd (%r8,%rax,2),%xmm0
.byte 196,65,121,196,92,64,4,2 // vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,32 // jne 4e6f <_sk_load_rgb_u16_be_hsw+0x12f>
+ .byte 117,32 // jne 4e6b <_sk_load_rgb_u16_be_hsw+0x12f>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
- .byte 233,49,255,255,255 // jmpq 4da0 <_sk_load_rgb_u16_be_hsw+0x60>
+ .byte 233,49,255,255,255 // jmpq 4d9c <_sk_load_rgb_u16_be_hsw+0x60>
.byte 196,193,121,110,68,64,6 // vmovd 0x6(%r8,%rax,2),%xmm0
.byte 196,65,121,196,68,64,10,2 // vpinsrw $0x2,0xa(%r8,%rax,2),%xmm0,%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,49 // jb 4eba <_sk_load_rgb_u16_be_hsw+0x17a>
+ .byte 114,49 // jb 4eb6 <_sk_load_rgb_u16_be_hsw+0x17a>
.byte 196,193,121,110,68,64,12 // vmovd 0xc(%r8,%rax,2),%xmm0
.byte 196,193,121,196,92,64,16,2 // vpinsrw $0x2,0x10(%r8,%rax,2),%xmm0,%xmm3
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 117,50 // jne 4ed5 <_sk_load_rgb_u16_be_hsw+0x195>
+ .byte 117,50 // jne 4ed1 <_sk_load_rgb_u16_be_hsw+0x195>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
- .byte 233,230,254,255,255 // jmpq 4da0 <_sk_load_rgb_u16_be_hsw+0x60>
+ .byte 233,230,254,255,255 // jmpq 4d9c <_sk_load_rgb_u16_be_hsw+0x60>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
- .byte 233,203,254,255,255 // jmpq 4da0 <_sk_load_rgb_u16_be_hsw+0x60>
+ .byte 233,203,254,255,255 // jmpq 4d9c <_sk_load_rgb_u16_be_hsw+0x60>
.byte 196,193,121,110,68,64,18 // vmovd 0x12(%r8,%rax,2),%xmm0
.byte 196,65,121,196,84,64,22,2 // vpinsrw $0x2,0x16(%r8,%rax,2),%xmm0,%xmm10
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,40 // jb 4f17 <_sk_load_rgb_u16_be_hsw+0x1d7>
+ .byte 114,40 // jb 4f13 <_sk_load_rgb_u16_be_hsw+0x1d7>
.byte 196,193,121,110,68,64,24 // vmovd 0x18(%r8,%rax,2),%xmm0
.byte 196,193,121,196,84,64,28,2 // vpinsrw $0x2,0x1c(%r8,%rax,2),%xmm0,%xmm2
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 117,32 // jne 4f29 <_sk_load_rgb_u16_be_hsw+0x1e9>
+ .byte 117,32 // jne 4f25 <_sk_load_rgb_u16_be_hsw+0x1e9>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
- .byte 233,137,254,255,255 // jmpq 4da0 <_sk_load_rgb_u16_be_hsw+0x60>
+ .byte 233,137,254,255,255 // jmpq 4d9c <_sk_load_rgb_u16_be_hsw+0x60>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
- .byte 233,119,254,255,255 // jmpq 4da0 <_sk_load_rgb_u16_be_hsw+0x60>
+ .byte 233,119,254,255,255 // jmpq 4d9c <_sk_load_rgb_u16_be_hsw+0x60>
.byte 196,193,121,110,68,64,30 // vmovd 0x1e(%r8,%rax,2),%xmm0
.byte 196,65,121,196,100,64,34,2 // vpinsrw $0x2,0x22(%r8,%rax,2),%xmm0,%xmm12
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 114,25 // jb 4f5c <_sk_load_rgb_u16_be_hsw+0x21c>
+ .byte 114,25 // jb 4f58 <_sk_load_rgb_u16_be_hsw+0x21c>
.byte 196,193,121,110,68,64,36 // vmovd 0x24(%r8,%rax,2),%xmm0
.byte 196,193,121,196,68,64,40,2 // vpinsrw $0x2,0x28(%r8,%rax,2),%xmm0,%xmm0
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
- .byte 233,68,254,255,255 // jmpq 4da0 <_sk_load_rgb_u16_be_hsw+0x60>
+ .byte 233,68,254,255,255 // jmpq 4d9c <_sk_load_rgb_u16_be_hsw+0x60>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
- .byte 233,59,254,255,255 // jmpq 4da0 <_sk_load_rgb_u16_be_hsw+0x60>
+ .byte 233,59,254,255,255 // jmpq 4d9c <_sk_load_rgb_u16_be_hsw+0x60>
HIDDEN _sk_store_u16_be_hsw
.globl _sk_store_u16_be_hsw
@@ -14378,7 +14375,7 @@ _sk_store_u16_be_hsw:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 73,99,193 // movslq %r9d,%rax
- .byte 196,98,125,24,5,164,115,2,0 // vbroadcastss 0x273a4(%rip),%ymm8 # 2c330 <_sk_overlay_sse2_8bit+0x558>
+ .byte 196,98,125,24,5,92,124,2,0 // vbroadcastss 0x27c5c(%rip),%ymm8 # 2cbe4 <_sk_overlay_sse2_8bit+0xe20>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -14416,7 +14413,7 @@ _sk_store_u16_be_hsw:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,31 // jne 5070 <_sk_store_u16_be_hsw+0x10b>
+ .byte 117,31 // jne 506c <_sk_store_u16_be_hsw+0x10b>
.byte 196,65,120,17,28,64 // vmovups %xmm11,(%r8,%rax,2)
.byte 196,65,120,17,84,64,16 // vmovups %xmm10,0x10(%r8,%rax,2)
.byte 196,65,120,17,76,64,32 // vmovups %xmm9,0x20(%r8,%rax,2)
@@ -14425,22 +14422,22 @@ _sk_store_u16_be_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,64 // vmovq %xmm11,(%r8,%rax,2)
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,240 // je 506c <_sk_store_u16_be_hsw+0x107>
+ .byte 116,240 // je 5068 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,92,64,8 // vmovhpd %xmm11,0x8(%r8,%rax,2)
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,227 // jb 506c <_sk_store_u16_be_hsw+0x107>
+ .byte 114,227 // jb 5068 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,84,64,16 // vmovq %xmm10,0x10(%r8,%rax,2)
- .byte 116,218 // je 506c <_sk_store_u16_be_hsw+0x107>
+ .byte 116,218 // je 5068 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,84,64,24 // vmovhpd %xmm10,0x18(%r8,%rax,2)
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,205 // jb 506c <_sk_store_u16_be_hsw+0x107>
+ .byte 114,205 // jb 5068 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,76,64,32 // vmovq %xmm9,0x20(%r8,%rax,2)
- .byte 116,196 // je 506c <_sk_store_u16_be_hsw+0x107>
+ .byte 116,196 // je 5068 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,76,64,40 // vmovhpd %xmm9,0x28(%r8,%rax,2)
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 114,183 // jb 506c <_sk_store_u16_be_hsw+0x107>
+ .byte 114,183 // jb 5068 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,68,64,48 // vmovq %xmm8,0x30(%r8,%rax,2)
- .byte 235,174 // jmp 506c <_sk_store_u16_be_hsw+0x107>
+ .byte 235,174 // jmp 5068 <_sk_store_u16_be_hsw+0x107>
HIDDEN _sk_load_f32_hsw
.globl _sk_load_f32_hsw
@@ -14449,7 +14446,7 @@ _sk_load_f32_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,253,87,192 // vxorpd %ymm0,%ymm0,%ymm0
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 15,135,97,1,0,0 // ja 522f <_sk_load_f32_hsw+0x171>
+ .byte 15,135,97,1,0,0 // ja 522b <_sk_load_f32_hsw+0x171>
.byte 72,131,236,24 // sub $0x18,%rsp
.byte 197,253,17,100,36,128 // vmovupd %ymm4,-0x80(%rsp)
.byte 197,253,17,108,36,160 // vmovupd %ymm5,-0x60(%rsp)
@@ -14462,7 +14459,7 @@ _sk_load_f32_hsw:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 77,99,201 // movslq %r9d,%r9
- .byte 76,141,21,50,1,0,0 // lea 0x132(%rip),%r10 # 5240 <_sk_load_f32_hsw+0x182>
+ .byte 76,141,21,50,1,0,0 // lea 0x132(%rip),%r10 # 523c <_sk_load_f32_hsw+0x182>
.byte 73,99,4,186 // movslq (%r10,%rdi,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 197,221,87,228 // vxorpd %ymm4,%ymm4,%ymm4
@@ -14525,7 +14522,7 @@ _sk_load_f32_hsw:
.byte 197,229,87,219 // vxorpd %ymm3,%ymm3,%ymm3
.byte 196,65,45,87,210 // vxorpd %ymm10,%ymm10,%ymm10
.byte 197,245,87,201 // vxorpd %ymm1,%ymm1,%ymm1
- .byte 235,203 // jmp 5209 <_sk_load_f32_hsw+0x14b>
+ .byte 235,203 // jmp 5205 <_sk_load_f32_hsw+0x14b>
.byte 102,144 // xchg %ax,%ax
.byte 27,255 // sbb %edi,%edi
.byte 255 // (bad)
@@ -14537,7 +14534,7 @@ _sk_load_f32_hsw:
.byte 255,92,255,255 // lcall *-0x1(%rdi,%rdi,8)
.byte 255,70,255 // incl -0x1(%rsi)
.byte 255 // (bad)
- .byte 255,53,255,255,255,40 // pushq 0x28ffffff(%rip) # 2900525c <_sk_overlay_sse2_8bit+0x28fd9484>
+ .byte 255,53,255,255,255,40 // pushq 0x28ffffff(%rip) # 29005258 <_sk_overlay_sse2_8bit+0x28fd9494>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -14549,7 +14546,7 @@ _sk_load_f32_dst_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,221,87,228 // vxorpd %ymm4,%ymm4,%ymm4
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 15,135,97,1,0,0 // ja 53d1 <_sk_load_f32_dst_hsw+0x171>
+ .byte 15,135,97,1,0,0 // ja 53cd <_sk_load_f32_dst_hsw+0x171>
.byte 72,131,236,24 // sub $0x18,%rsp
.byte 197,253,17,68,36,128 // vmovupd %ymm0,-0x80(%rsp)
.byte 197,253,17,76,36,160 // vmovupd %ymm1,-0x60(%rsp)
@@ -14562,7 +14559,7 @@ _sk_load_f32_dst_hsw:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 77,99,201 // movslq %r9d,%r9
- .byte 76,141,21,48,1,0,0 // lea 0x130(%rip),%r10 # 53e0 <_sk_load_f32_dst_hsw+0x180>
+ .byte 76,141,21,48,1,0,0 // lea 0x130(%rip),%r10 # 53dc <_sk_load_f32_dst_hsw+0x180>
.byte 73,99,4,186 // movslq (%r10,%rdi,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 197,253,87,192 // vxorpd %ymm0,%ymm0,%ymm0
@@ -14625,7 +14622,7 @@ _sk_load_f32_dst_hsw:
.byte 197,197,87,255 // vxorpd %ymm7,%ymm7,%ymm7
.byte 196,65,45,87,210 // vxorpd %ymm10,%ymm10,%ymm10
.byte 197,213,87,237 // vxorpd %ymm5,%ymm5,%ymm5
- .byte 235,203 // jmp 53ab <_sk_load_f32_dst_hsw+0x14b>
+ .byte 235,203 // jmp 53a7 <_sk_load_f32_dst_hsw+0x14b>
.byte 29,255,255,255,163 // sbb $0xa3ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
@@ -14665,7 +14662,7 @@ _sk_store_f32_hsw:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,55 // jne 547f <_sk_store_f32_hsw+0x7f>
+ .byte 117,55 // jne 547b <_sk_store_f32_hsw+0x7f>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -14678,22 +14675,22 @@ _sk_store_f32_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,128 // vmovupd %xmm10,(%r8,%rax,4)
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,240 // je 547b <_sk_store_f32_hsw+0x7b>
+ .byte 116,240 // je 5477 <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,76,128,16 // vmovupd %xmm9,0x10(%r8,%rax,4)
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,227 // jb 547b <_sk_store_f32_hsw+0x7b>
+ .byte 114,227 // jb 5477 <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,68,128,32 // vmovupd %xmm8,0x20(%r8,%rax,4)
- .byte 116,218 // je 547b <_sk_store_f32_hsw+0x7b>
+ .byte 116,218 // je 5477 <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,92,128,48 // vmovupd %xmm11,0x30(%r8,%rax,4)
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,205 // jb 547b <_sk_store_f32_hsw+0x7b>
+ .byte 114,205 // jb 5477 <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,84,128,64,1 // vextractf128 $0x1,%ymm10,0x40(%r8,%rax,4)
- .byte 116,195 // je 547b <_sk_store_f32_hsw+0x7b>
+ .byte 116,195 // je 5477 <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,76,128,80,1 // vextractf128 $0x1,%ymm9,0x50(%r8,%rax,4)
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 114,181 // jb 547b <_sk_store_f32_hsw+0x7b>
+ .byte 114,181 // jb 5477 <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,68,128,96,1 // vextractf128 $0x1,%ymm8,0x60(%r8,%rax,4)
- .byte 235,171 // jmp 547b <_sk_store_f32_hsw+0x7b>
+ .byte 235,171 // jmp 5477 <_sk_store_f32_hsw+0x7b>
HIDDEN _sk_clamp_x_hsw
.globl _sk_clamp_x_hsw
@@ -14770,7 +14767,7 @@ _sk_mirror_x_hsw:
.byte 196,65,124,92,218 // vsubps %ymm10,%ymm0,%ymm11
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,98,125,24,192 // vbroadcastss %xmm0,%ymm8
- .byte 197,178,89,5,103,108,2,0 // vmulss 0x26c67(%rip),%xmm9,%xmm0 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 197,178,89,5,31,117,2,0 // vmulss 0x2751f(%rip),%xmm9,%xmm0 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
.byte 196,227,125,8,192,1 // vroundps $0x1,%ymm0,%ymm0
@@ -14797,7 +14794,7 @@ _sk_mirror_y_hsw:
.byte 196,65,116,92,218 // vsubps %ymm10,%ymm1,%ymm11
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,98,125,24,193 // vbroadcastss %xmm1,%ymm8
- .byte 197,178,89,13,3,108,2,0 // vmulss 0x26c03(%rip),%xmm9,%xmm1 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 197,178,89,13,187,116,2,0 // vmulss 0x274bb(%rip),%xmm9,%xmm1 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,226,125,24,201 // vbroadcastss %xmm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
.byte 196,227,125,8,201,1 // vroundps $0x1,%ymm1,%ymm1
@@ -14819,7 +14816,7 @@ FUNCTION(_sk_clamp_x_1_hsw)
_sk_clamp_x_1_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,184,107,2,0 // vbroadcastss 0x26bb8(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,112,116,2,0 // vbroadcastss 0x27470(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -14837,9 +14834,9 @@ HIDDEN _sk_mirror_x_1_hsw
.globl _sk_mirror_x_1_hsw
FUNCTION(_sk_mirror_x_1_hsw)
_sk_mirror_x_1_hsw:
- .byte 196,98,125,24,5,175,107,2,0 // vbroadcastss 0x26baf(%rip),%ymm8 # 2c230 <_sk_overlay_sse2_8bit+0x458>
+ .byte 196,98,125,24,5,103,116,2,0 // vbroadcastss 0x27467(%rip),%ymm8 # 2cae4 <_sk_overlay_sse2_8bit+0xd20>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,133,107,2,0 // vbroadcastss 0x26b85(%rip),%ymm9 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,13,61,116,2,0 // vbroadcastss 0x2743d(%rip),%ymm9 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -14855,11 +14852,11 @@ HIDDEN _sk_luminance_to_alpha_hsw
.globl _sk_luminance_to_alpha_hsw
FUNCTION(_sk_luminance_to_alpha_hsw)
_sk_luminance_to_alpha_hsw:
- .byte 196,226,125,24,29,113,108,2,0 // vbroadcastss 0x26c71(%rip),%ymm3 # 2c334 <_sk_overlay_sse2_8bit+0x55c>
- .byte 196,98,125,24,5,108,108,2,0 // vbroadcastss 0x26c6c(%rip),%ymm8 # 2c338 <_sk_overlay_sse2_8bit+0x560>
+ .byte 196,226,125,24,29,41,117,2,0 // vbroadcastss 0x27529(%rip),%ymm3 # 2cbe8 <_sk_overlay_sse2_8bit+0xe24>
+ .byte 196,98,125,24,5,36,117,2,0 // vbroadcastss 0x27524(%rip),%ymm8 # 2cbec <_sk_overlay_sse2_8bit+0xe28>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1
- .byte 196,226,125,24,29,93,108,2,0 // vbroadcastss 0x26c5d(%rip),%ymm3 # 2c33c <_sk_overlay_sse2_8bit+0x564>
+ .byte 196,226,125,24,29,21,117,2,0 // vbroadcastss 0x27515(%rip),%ymm3 # 2cbf0 <_sk_overlay_sse2_8bit+0xe2c>
.byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -15058,9 +15055,9 @@ _sk_evenly_spaced_gradient_hsw:
.byte 76,139,64,8 // mov 0x8(%rax),%r8
.byte 77,137,202 // mov %r9,%r10
.byte 73,255,202 // dec %r10
- .byte 120,7 // js 59d7 <_sk_evenly_spaced_gradient_hsw+0x18>
+ .byte 120,7 // js 59d3 <_sk_evenly_spaced_gradient_hsw+0x18>
.byte 196,193,242,42,202 // vcvtsi2ss %r10,%xmm1,%xmm1
- .byte 235,22 // jmp 59ed <_sk_evenly_spaced_gradient_hsw+0x2e>
+ .byte 235,22 // jmp 59e9 <_sk_evenly_spaced_gradient_hsw+0x2e>
.byte 77,137,211 // mov %r10,%r11
.byte 73,209,235 // shr %r11
.byte 65,131,226,1 // and $0x1,%r10d
@@ -15071,7 +15068,7 @@ _sk_evenly_spaced_gradient_hsw:
.byte 197,244,89,200 // vmulps %ymm0,%ymm1,%ymm1
.byte 197,126,91,217 // vcvttps2dq %ymm1,%ymm11
.byte 73,131,249,8 // cmp $0x8,%r9
- .byte 119,70 // ja 5a46 <_sk_evenly_spaced_gradient_hsw+0x87>
+ .byte 119,70 // ja 5a42 <_sk_evenly_spaced_gradient_hsw+0x87>
.byte 196,66,37,22,0 // vpermps (%r8),%ymm11,%ymm8
.byte 76,139,64,40 // mov 0x28(%rax),%r8
.byte 196,66,37,22,8 // vpermps (%r8),%ymm11,%ymm9
@@ -15087,7 +15084,7 @@ _sk_evenly_spaced_gradient_hsw:
.byte 196,194,37,22,24 // vpermps (%r8),%ymm11,%ymm3
.byte 72,139,64,64 // mov 0x40(%rax),%rax
.byte 196,98,37,22,40 // vpermps (%rax),%ymm11,%ymm13
- .byte 235,110 // jmp 5ab4 <_sk_evenly_spaced_gradient_hsw+0xf5>
+ .byte 235,110 // jmp 5ab0 <_sk_evenly_spaced_gradient_hsw+0xf5>
.byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,2,117,146,4,152 // vgatherdps %ymm1,(%r8,%ymm11,4),%ymm8
@@ -15123,14 +15120,14 @@ HIDDEN _sk_gauss_a_to_rgba_hsw
.globl _sk_gauss_a_to_rgba_hsw
FUNCTION(_sk_gauss_a_to_rgba_hsw)
_sk_gauss_a_to_rgba_hsw:
- .byte 196,226,125,24,5,103,104,2,0 // vbroadcastss 0x26867(%rip),%ymm0 # 2c340 <_sk_overlay_sse2_8bit+0x568>
- .byte 196,226,125,24,13,98,104,2,0 // vbroadcastss 0x26862(%rip),%ymm1 # 2c344 <_sk_overlay_sse2_8bit+0x56c>
+ .byte 196,226,125,24,5,31,113,2,0 // vbroadcastss 0x2711f(%rip),%ymm0 # 2cbf4 <_sk_overlay_sse2_8bit+0xe30>
+ .byte 196,226,125,24,13,26,113,2,0 // vbroadcastss 0x2711a(%rip),%ymm1 # 2cbf8 <_sk_overlay_sse2_8bit+0xe34>
.byte 196,226,101,168,200 // vfmadd213ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,88,104,2,0 // vbroadcastss 0x26858(%rip),%ymm0 # 2c348 <_sk_overlay_sse2_8bit+0x570>
+ .byte 196,226,125,24,5,16,113,2,0 // vbroadcastss 0x27110(%rip),%ymm0 # 2cbfc <_sk_overlay_sse2_8bit+0xe38>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
- .byte 196,226,125,24,13,78,104,2,0 // vbroadcastss 0x2684e(%rip),%ymm1 # 2c34c <_sk_overlay_sse2_8bit+0x574>
+ .byte 196,226,125,24,13,6,113,2,0 // vbroadcastss 0x27106(%rip),%ymm1 # 2cc00 <_sk_overlay_sse2_8bit+0xe3c>
.byte 196,226,101,184,200 // vfmadd231ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,68,104,2,0 // vbroadcastss 0x26844(%rip),%ymm0 # 2c350 <_sk_overlay_sse2_8bit+0x578>
+ .byte 196,226,125,24,5,252,112,2,0 // vbroadcastss 0x270fc(%rip),%ymm0 # 2cc04 <_sk_overlay_sse2_8bit+0xe40>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -15145,11 +15142,11 @@ _sk_gradient_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,0 // mov (%rax),%r8
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 15,134,180,0,0,0 // jbe 5be4 <_sk_gradient_hsw+0xc3>
+ .byte 15,134,180,0,0,0 // jbe 5be0 <_sk_gradient_hsw+0xc3>
.byte 76,139,72,72 // mov 0x48(%rax),%r9
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 65,186,1,0,0,0 // mov $0x1,%r10d
- .byte 196,226,125,24,21,213,102,2,0 // vbroadcastss 0x266d5(%rip),%ymm2 # 2c21c <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,226,125,24,21,141,111,2,0 // vbroadcastss 0x26f8d(%rip),%ymm2 # 2cad0 <_sk_overlay_sse2_8bit+0xd0c>
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
.byte 196,130,125,24,28,145 // vbroadcastss (%r9,%r10,4),%ymm3
.byte 197,228,194,216,2 // vcmpleps %ymm0,%ymm3,%ymm3
@@ -15157,10 +15154,10 @@ _sk_gradient_hsw:
.byte 196,65,101,254,201 // vpaddd %ymm9,%ymm3,%ymm9
.byte 73,255,194 // inc %r10
.byte 77,57,208 // cmp %r10,%r8
- .byte 117,226 // jne 5b4c <_sk_gradient_hsw+0x2b>
+ .byte 117,226 // jne 5b48 <_sk_gradient_hsw+0x2b>
.byte 76,139,72,8 // mov 0x8(%rax),%r9
.byte 73,131,248,8 // cmp $0x8,%r8
- .byte 118,121 // jbe 5bed <_sk_gradient_hsw+0xcc>
+ .byte 118,121 // jbe 5be9 <_sk_gradient_hsw+0xcc>
.byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,2,117,146,4,137 // vgatherdps %ymm1,(%r9,%ymm9,4),%ymm8
@@ -15184,7 +15181,7 @@ _sk_gradient_hsw:
.byte 196,130,21,146,28,136 // vgatherdps %ymm13,(%r8,%ymm9,4),%ymm3
.byte 72,139,64,64 // mov 0x40(%rax),%rax
.byte 196,34,13,146,44,136 // vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13
- .byte 235,77 // jmp 5c31 <_sk_gradient_hsw+0x110>
+ .byte 235,77 // jmp 5c2d <_sk_gradient_hsw+0x110>
.byte 76,139,72,8 // mov 0x8(%rax),%r9
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 196,66,53,22,1 // vpermps (%r9),%ymm9,%ymm8
@@ -15244,24 +15241,24 @@ _sk_xy_to_unit_angle_hsw:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,136,102,2,0 // vbroadcastss 0x26688(%rip),%ymm13 # 2c354 <_sk_overlay_sse2_8bit+0x57c>
- .byte 196,98,125,24,53,131,102,2,0 // vbroadcastss 0x26683(%rip),%ymm14 # 2c358 <_sk_overlay_sse2_8bit+0x580>
+ .byte 196,98,125,24,45,64,111,2,0 // vbroadcastss 0x26f40(%rip),%ymm13 # 2cc08 <_sk_overlay_sse2_8bit+0xe44>
+ .byte 196,98,125,24,53,59,111,2,0 // vbroadcastss 0x26f3b(%rip),%ymm14 # 2cc0c <_sk_overlay_sse2_8bit+0xe48>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
- .byte 196,98,125,24,45,121,102,2,0 // vbroadcastss 0x26679(%rip),%ymm13 # 2c35c <_sk_overlay_sse2_8bit+0x584>
+ .byte 196,98,125,24,45,49,111,2,0 // vbroadcastss 0x26f31(%rip),%ymm13 # 2cc10 <_sk_overlay_sse2_8bit+0xe4c>
.byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13
- .byte 196,98,125,24,53,111,102,2,0 // vbroadcastss 0x2666f(%rip),%ymm14 # 2c360 <_sk_overlay_sse2_8bit+0x588>
+ .byte 196,98,125,24,53,39,111,2,0 // vbroadcastss 0x26f27(%rip),%ymm14 # 2cc14 <_sk_overlay_sse2_8bit+0xe50>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
.byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,90,102,2,0 // vbroadcastss 0x2665a(%rip),%ymm10 # 2c364 <_sk_overlay_sse2_8bit+0x58c>
+ .byte 196,98,125,24,21,18,111,2,0 // vbroadcastss 0x26f12(%rip),%ymm10 # 2cc18 <_sk_overlay_sse2_8bit+0xe54>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,240,100,2,0 // vbroadcastss 0x264f0(%rip),%ymm10 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,21,168,109,2,0 // vbroadcastss 0x26da8(%rip),%ymm10 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,218,100,2,0 // vbroadcastss 0x264da(%rip),%ymm10 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,21,146,109,2,0 // vbroadcastss 0x26d92(%rip),%ymm10 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -15289,23 +15286,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,218,101,2,0 // vbroadcastss 0x265da(%rip),%ymm11 # 2c368 <_sk_overlay_sse2_8bit+0x590>
+ .byte 196,98,125,24,29,146,110,2,0 // vbroadcastss 0x26e92(%rip),%ymm11 # 2cc1c <_sk_overlay_sse2_8bit+0xe58>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,185,101,2,0 // vbroadcastss 0x265b9(%rip),%ymm9 # 2c36c <_sk_overlay_sse2_8bit+0x594>
+ .byte 196,98,125,24,13,113,110,2,0 // vbroadcastss 0x26e71(%rip),%ymm9 # 2cc20 <_sk_overlay_sse2_8bit+0xe5c>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,156,101,2,0 // vbroadcastss 0x2659c(%rip),%ymm9 # 2c370 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,125,24,13,84,110,2,0 // vbroadcastss 0x26e54(%rip),%ymm9 # 2cc24 <_sk_overlay_sse2_8bit+0xe60>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,45,100,2,0 // vbroadcastss 0x2642d(%rip),%ymm11 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,29,229,108,2,0 // vbroadcastss 0x26ce5(%rip),%ymm11 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -15324,23 +15321,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,66,101,2,0 // vbroadcastss 0x26542(%rip),%ymm11 # 2c368 <_sk_overlay_sse2_8bit+0x590>
+ .byte 196,98,125,24,29,250,109,2,0 // vbroadcastss 0x26dfa(%rip),%ymm11 # 2cc1c <_sk_overlay_sse2_8bit+0xe58>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,33,101,2,0 // vbroadcastss 0x26521(%rip),%ymm9 # 2c36c <_sk_overlay_sse2_8bit+0x594>
+ .byte 196,98,125,24,13,217,109,2,0 // vbroadcastss 0x26dd9(%rip),%ymm9 # 2cc20 <_sk_overlay_sse2_8bit+0xe5c>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,4,101,2,0 // vbroadcastss 0x26504(%rip),%ymm9 # 2c370 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,125,24,13,188,109,2,0 // vbroadcastss 0x26dbc(%rip),%ymm9 # 2cc24 <_sk_overlay_sse2_8bit+0xe60>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,149,99,2,0 // vbroadcastss 0x26395(%rip),%ymm11 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,29,77,108,2,0 // vbroadcastss 0x26c4d(%rip),%ymm11 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -15358,14 +15355,14 @@ _sk_xy_to_2pt_conical_linear_hsw:
.byte 197,58,89,72,44 // vmulss 0x2c(%rax),%xmm8,%xmm9
.byte 196,66,125,24,201 // vbroadcastss %xmm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,176,100,2,0 // vbroadcastss 0x264b0(%rip),%ymm10 # 2c368 <_sk_overlay_sse2_8bit+0x590>
+ .byte 196,98,125,24,21,104,109,2,0 // vbroadcastss 0x26d68(%rip),%ymm10 # 2cc1c <_sk_overlay_sse2_8bit+0xe58>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
.byte 196,98,125,184,208 // vfmadd231ps %ymm0,%ymm0,%ymm10
.byte 196,193,58,89,192 // vmulss %xmm8,%xmm8,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,147,100,2,0 // vbroadcastss 0x26493(%rip),%ymm8 # 2c370 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,125,24,5,75,109,2,0 // vbroadcastss 0x26d4b(%rip),%ymm8 # 2cc24 <_sk_overlay_sse2_8bit+0xe60>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15405,7 +15402,7 @@ HIDDEN _sk_save_xy_hsw
FUNCTION(_sk_save_xy_hsw)
_sk_save_xy_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,211,98,2,0 // vbroadcastss 0x262d3(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,139,107,2,0 // vbroadcastss 0x26b8b(%rip),%ymm8 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -15439,9 +15436,9 @@ HIDDEN _sk_bilinear_nx_hsw
FUNCTION(_sk_bilinear_nx_hsw)
_sk_bilinear_nx_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,195,99,2,0 // vbroadcastss 0x263c3(%rip),%ymm0 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,5,123,108,2,0 // vbroadcastss 0x26c7b(%rip),%ymm0 # 2cc28 <_sk_overlay_sse2_8bit+0xe64>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,90,98,2,0 // vbroadcastss 0x2625a(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,18,107,2,0 // vbroadcastss 0x26b12(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15452,7 +15449,7 @@ HIDDEN _sk_bilinear_px_hsw
FUNCTION(_sk_bilinear_px_hsw)
_sk_bilinear_px_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,58,98,2,0 // vbroadcastss 0x2623a(%rip),%ymm0 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,226,125,24,5,242,106,2,0 // vbroadcastss 0x26af2(%rip),%ymm0 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -15464,9 +15461,9 @@ HIDDEN _sk_bilinear_ny_hsw
FUNCTION(_sk_bilinear_ny_hsw)
_sk_bilinear_ny_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,122,99,2,0 // vbroadcastss 0x2637a(%rip),%ymm1 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,13,50,108,2,0 // vbroadcastss 0x26c32(%rip),%ymm1 # 2cc28 <_sk_overlay_sse2_8bit+0xe64>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,16,98,2,0 // vbroadcastss 0x26210(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,200,106,2,0 // vbroadcastss 0x26ac8(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15477,7 +15474,7 @@ HIDDEN _sk_bilinear_py_hsw
FUNCTION(_sk_bilinear_py_hsw)
_sk_bilinear_py_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,240,97,2,0 // vbroadcastss 0x261f0(%rip),%ymm1 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,226,125,24,13,168,106,2,0 // vbroadcastss 0x26aa8(%rip),%ymm1 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -15489,13 +15486,13 @@ HIDDEN _sk_bicubic_n3x_hsw
FUNCTION(_sk_bicubic_n3x_hsw)
_sk_bicubic_n3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,51,99,2,0 // vbroadcastss 0x26333(%rip),%ymm0 # 2c378 <_sk_overlay_sse2_8bit+0x5a0>
+ .byte 196,226,125,24,5,235,107,2,0 // vbroadcastss 0x26beb(%rip),%ymm0 # 2cc2c <_sk_overlay_sse2_8bit+0xe68>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,198,97,2,0 // vbroadcastss 0x261c6(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,126,106,2,0 // vbroadcastss 0x26a7e(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,35,98,2,0 // vbroadcastss 0x26223(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
- .byte 196,98,125,24,29,14,99,2,0 // vbroadcastss 0x2630e(%rip),%ymm11 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,219,106,2,0 // vbroadcastss 0x26adb(%rip),%ymm10 # 2cb3c <_sk_overlay_sse2_8bit+0xd78>
+ .byte 196,98,125,24,29,198,107,2,0 // vbroadcastss 0x26bc6(%rip),%ymm11 # 2cc30 <_sk_overlay_sse2_8bit+0xe6c>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -15507,16 +15504,16 @@ HIDDEN _sk_bicubic_n1x_hsw
FUNCTION(_sk_bicubic_n1x_hsw)
_sk_bicubic_n1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,229,98,2,0 // vbroadcastss 0x262e5(%rip),%ymm0 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,5,157,107,2,0 // vbroadcastss 0x26b9d(%rip),%ymm0 # 2cc28 <_sk_overlay_sse2_8bit+0xe64>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,124,97,2,0 // vbroadcastss 0x2617c(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,52,106,2,0 // vbroadcastss 0x26a34(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,214,98,2,0 // vbroadcastss 0x262d6(%rip),%ymm9 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
- .byte 196,98,125,24,21,209,98,2,0 // vbroadcastss 0x262d1(%rip),%ymm10 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,13,142,107,2,0 // vbroadcastss 0x26b8e(%rip),%ymm9 # 2cc34 <_sk_overlay_sse2_8bit+0xe70>
+ .byte 196,98,125,24,21,137,107,2,0 // vbroadcastss 0x26b89(%rip),%ymm10 # 2cc38 <_sk_overlay_sse2_8bit+0xe74>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,83,97,2,0 // vbroadcastss 0x26153(%rip),%ymm9 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,13,11,106,2,0 // vbroadcastss 0x26a0b(%rip),%ymm9 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,185,98,2,0 // vbroadcastss 0x262b9(%rip),%ymm10 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,21,113,107,2,0 // vbroadcastss 0x26b71(%rip),%ymm10 # 2cc3c <_sk_overlay_sse2_8bit+0xe78>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15527,14 +15524,14 @@ HIDDEN _sk_bicubic_p1x_hsw
FUNCTION(_sk_bicubic_p1x_hsw)
_sk_bicubic_p1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,41,97,2,0 // vbroadcastss 0x26129(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,225,105,2,0 // vbroadcastss 0x269e1(%rip),%ymm8 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,131,98,2,0 // vbroadcastss 0x26283(%rip),%ymm10 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
- .byte 196,98,125,24,29,126,98,2,0 // vbroadcastss 0x2627e(%rip),%ymm11 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,21,59,107,2,0 // vbroadcastss 0x26b3b(%rip),%ymm10 # 2cc34 <_sk_overlay_sse2_8bit+0xe70>
+ .byte 196,98,125,24,29,54,107,2,0 // vbroadcastss 0x26b36(%rip),%ymm11 # 2cc38 <_sk_overlay_sse2_8bit+0xe74>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,111,98,2,0 // vbroadcastss 0x2626f(%rip),%ymm8 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,5,39,107,2,0 // vbroadcastss 0x26b27(%rip),%ymm8 # 2cc3c <_sk_overlay_sse2_8bit+0xe78>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15545,12 +15542,12 @@ HIDDEN _sk_bicubic_p3x_hsw
FUNCTION(_sk_bicubic_p3x_hsw)
_sk_bicubic_p3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,75,98,2,0 // vbroadcastss 0x2624b(%rip),%ymm0 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,226,125,24,5,3,107,2,0 // vbroadcastss 0x26b03(%rip),%ymm0 # 2cc34 <_sk_overlay_sse2_8bit+0xe70>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,60,97,2,0 // vbroadcastss 0x2613c(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
- .byte 196,98,125,24,29,39,98,2,0 // vbroadcastss 0x26227(%rip),%ymm11 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,244,105,2,0 // vbroadcastss 0x269f4(%rip),%ymm10 # 2cb3c <_sk_overlay_sse2_8bit+0xd78>
+ .byte 196,98,125,24,29,223,106,2,0 // vbroadcastss 0x26adf(%rip),%ymm11 # 2cc30 <_sk_overlay_sse2_8bit+0xe6c>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -15562,13 +15559,13 @@ HIDDEN _sk_bicubic_n3y_hsw
FUNCTION(_sk_bicubic_n3y_hsw)
_sk_bicubic_n3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,2,98,2,0 // vbroadcastss 0x26202(%rip),%ymm1 # 2c378 <_sk_overlay_sse2_8bit+0x5a0>
+ .byte 196,226,125,24,13,186,106,2,0 // vbroadcastss 0x26aba(%rip),%ymm1 # 2cc2c <_sk_overlay_sse2_8bit+0xe68>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,148,96,2,0 // vbroadcastss 0x26094(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,76,105,2,0 // vbroadcastss 0x2694c(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,241,96,2,0 // vbroadcastss 0x260f1(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
- .byte 196,98,125,24,29,220,97,2,0 // vbroadcastss 0x261dc(%rip),%ymm11 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,169,105,2,0 // vbroadcastss 0x269a9(%rip),%ymm10 # 2cb3c <_sk_overlay_sse2_8bit+0xd78>
+ .byte 196,98,125,24,29,148,106,2,0 // vbroadcastss 0x26a94(%rip),%ymm11 # 2cc30 <_sk_overlay_sse2_8bit+0xe6c>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -15580,16 +15577,16 @@ HIDDEN _sk_bicubic_n1y_hsw
FUNCTION(_sk_bicubic_n1y_hsw)
_sk_bicubic_n1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,179,97,2,0 // vbroadcastss 0x261b3(%rip),%ymm1 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,13,107,106,2,0 // vbroadcastss 0x26a6b(%rip),%ymm1 # 2cc28 <_sk_overlay_sse2_8bit+0xe64>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,73,96,2,0 // vbroadcastss 0x26049(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,1,105,2,0 // vbroadcastss 0x26901(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,163,97,2,0 // vbroadcastss 0x261a3(%rip),%ymm9 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
- .byte 196,98,125,24,21,158,97,2,0 // vbroadcastss 0x2619e(%rip),%ymm10 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,13,91,106,2,0 // vbroadcastss 0x26a5b(%rip),%ymm9 # 2cc34 <_sk_overlay_sse2_8bit+0xe70>
+ .byte 196,98,125,24,21,86,106,2,0 // vbroadcastss 0x26a56(%rip),%ymm10 # 2cc38 <_sk_overlay_sse2_8bit+0xe74>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,32,96,2,0 // vbroadcastss 0x26020(%rip),%ymm9 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,13,216,104,2,0 // vbroadcastss 0x268d8(%rip),%ymm9 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,134,97,2,0 // vbroadcastss 0x26186(%rip),%ymm10 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,21,62,106,2,0 // vbroadcastss 0x26a3e(%rip),%ymm10 # 2cc3c <_sk_overlay_sse2_8bit+0xe78>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15600,14 +15597,14 @@ HIDDEN _sk_bicubic_p1y_hsw
FUNCTION(_sk_bicubic_p1y_hsw)
_sk_bicubic_p1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,246,95,2,0 // vbroadcastss 0x25ff6(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,174,104,2,0 // vbroadcastss 0x268ae(%rip),%ymm8 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,79,97,2,0 // vbroadcastss 0x2614f(%rip),%ymm10 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
- .byte 196,98,125,24,29,74,97,2,0 // vbroadcastss 0x2614a(%rip),%ymm11 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,21,7,106,2,0 // vbroadcastss 0x26a07(%rip),%ymm10 # 2cc34 <_sk_overlay_sse2_8bit+0xe70>
+ .byte 196,98,125,24,29,2,106,2,0 // vbroadcastss 0x26a02(%rip),%ymm11 # 2cc38 <_sk_overlay_sse2_8bit+0xe74>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,59,97,2,0 // vbroadcastss 0x2613b(%rip),%ymm8 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,5,243,105,2,0 // vbroadcastss 0x269f3(%rip),%ymm8 # 2cc3c <_sk_overlay_sse2_8bit+0xe78>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15618,12 +15615,12 @@ HIDDEN _sk_bicubic_p3y_hsw
FUNCTION(_sk_bicubic_p3y_hsw)
_sk_bicubic_p3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,23,97,2,0 // vbroadcastss 0x26117(%rip),%ymm1 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,226,125,24,13,207,105,2,0 // vbroadcastss 0x269cf(%rip),%ymm1 # 2cc34 <_sk_overlay_sse2_8bit+0xe70>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,7,96,2,0 // vbroadcastss 0x26007(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
- .byte 196,98,125,24,29,242,96,2,0 // vbroadcastss 0x260f2(%rip),%ymm11 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,191,104,2,0 // vbroadcastss 0x268bf(%rip),%ymm10 # 2cb3c <_sk_overlay_sse2_8bit+0xd78>
+ .byte 196,98,125,24,29,170,105,2,0 // vbroadcastss 0x269aa(%rip),%ymm11 # 2cc30 <_sk_overlay_sse2_8bit+0xe6c>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -15761,19 +15758,19 @@ _sk_clut_3D_hsw:
.byte 197,254,127,76,36,160 // vmovdqu %ymm1,-0x60(%rsp)
.byte 72,139,0 // mov (%rax),%rax
.byte 196,193,117,254,204 // vpaddd %ymm12,%ymm1,%ymm1
- .byte 196,226,125,88,61,197,94,2,0 // vpbroadcastd 0x25ec5(%rip),%ymm7 # 2c390 <_sk_overlay_sse2_8bit+0x5b8>
+ .byte 196,226,125,88,61,125,103,2,0 // vpbroadcastd 0x2677d(%rip),%ymm7 # 2cc44 <_sk_overlay_sse2_8bit+0xe80>
.byte 196,226,117,64,207 // vpmulld %ymm7,%ymm1,%ymm1
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
.byte 196,98,77,146,4,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8
- .byte 196,98,125,88,21,57,93,2,0 // vpbroadcastd 0x25d39(%rip),%ymm10 # 2c21c <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,98,125,88,21,241,101,2,0 // vpbroadcastd 0x265f1(%rip),%ymm10 # 2cad0 <_sk_overlay_sse2_8bit+0xd0c>
.byte 196,193,117,254,242 // vpaddd %ymm10,%ymm1,%ymm6
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
.byte 196,226,37,146,28,176 // vgatherdps %ymm11,(%rax,%ymm6,4),%ymm3
- .byte 196,98,125,88,29,40,93,2,0 // vpbroadcastd 0x25d28(%rip),%ymm11 # 2c224 <_sk_overlay_sse2_8bit+0x44c>
+ .byte 196,98,125,88,29,224,101,2,0 // vpbroadcastd 0x265e0(%rip),%ymm11 # 2cad8 <_sk_overlay_sse2_8bit+0xd14>
.byte 196,193,117,254,203 // vpaddd %ymm11,%ymm1,%ymm1
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
.byte 196,226,77,146,36,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm4
- .byte 196,98,125,24,45,120,94,2,0 // vbroadcastss 0x25e78(%rip),%ymm13 # 2c38c <_sk_overlay_sse2_8bit+0x5b4>
+ .byte 196,98,125,24,45,48,103,2,0 // vbroadcastss 0x26730(%rip),%ymm13 # 2cc40 <_sk_overlay_sse2_8bit+0xe7c>
.byte 196,193,124,88,245 // vaddps %ymm13,%ymm0,%ymm6
.byte 197,254,91,246 // vcvttps2dq %ymm6,%ymm6
.byte 196,226,77,64,205 // vpmulld %ymm5,%ymm6,%ymm1
@@ -15993,19 +15990,19 @@ _sk_clut_4D_hsw:
.byte 197,126,91,245 // vcvttps2dq %ymm5,%ymm14
.byte 196,98,13,64,233 // vpmulld %ymm1,%ymm14,%ymm13
.byte 197,149,254,198 // vpaddd %ymm6,%ymm13,%ymm0
- .byte 196,98,125,88,21,14,90,2,0 // vpbroadcastd 0x25a0e(%rip),%ymm10 # 2c390 <_sk_overlay_sse2_8bit+0x5b8>
+ .byte 196,98,125,88,21,198,98,2,0 // vpbroadcastd 0x262c6(%rip),%ymm10 # 2cc44 <_sk_overlay_sse2_8bit+0xe80>
.byte 196,194,125,64,194 // vpmulld %ymm10,%ymm0,%ymm0
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 196,98,61,146,60,128 // vgatherdps %ymm8,(%rax,%ymm0,4),%ymm15
- .byte 196,98,125,88,29,129,88,2,0 // vpbroadcastd 0x25881(%rip),%ymm11 # 2c21c <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,98,125,88,29,57,97,2,0 // vpbroadcastd 0x26139(%rip),%ymm11 # 2cad0 <_sk_overlay_sse2_8bit+0xd0c>
.byte 196,65,125,254,195 // vpaddd %ymm11,%ymm0,%ymm8
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,162,53,146,20,128 // vgatherdps %ymm9,(%rax,%ymm8,4),%ymm2
- .byte 196,98,125,88,37,112,88,2,0 // vpbroadcastd 0x25870(%rip),%ymm12 # 2c224 <_sk_overlay_sse2_8bit+0x44c>
+ .byte 196,98,125,88,37,40,97,2,0 // vpbroadcastd 0x26128(%rip),%ymm12 # 2cad8 <_sk_overlay_sse2_8bit+0xd14>
.byte 196,193,125,254,196 // vpaddd %ymm12,%ymm0,%ymm0
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 196,226,61,146,60,128 // vgatherdps %ymm8,(%rax,%ymm0,4),%ymm7
- .byte 196,98,125,24,13,191,89,2,0 // vbroadcastss 0x259bf(%rip),%ymm9 # 2c38c <_sk_overlay_sse2_8bit+0x5b4>
+ .byte 196,98,125,24,13,119,98,2,0 // vbroadcastss 0x26277(%rip),%ymm9 # 2cc40 <_sk_overlay_sse2_8bit+0xe7c>
.byte 196,65,84,88,193 // vaddps %ymm9,%ymm5,%ymm8
.byte 196,65,126,91,192 // vcvttps2dq %ymm8,%ymm8
.byte 196,226,61,64,193 // vpmulld %ymm1,%ymm8,%ymm0
@@ -16330,7 +16327,7 @@ _sk_clut_4D_hsw:
.byte 197,196,92,214 // vsubps %ymm6,%ymm7,%ymm2
.byte 196,226,61,168,214 // vfmadd213ps %ymm6,%ymm8,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,109,81,2,0 // vbroadcastss 0x2516d(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,37,90,2,0 // vbroadcastss 0x25a25(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,16,164,36,32,3,0,0 // vmovups 0x320(%rsp),%ymm4
.byte 197,252,16,172,36,64,3,0,0 // vmovups 0x340(%rsp),%ymm5
.byte 197,252,16,180,36,96,3,0,0 // vmovups 0x360(%rsp),%ymm6
@@ -16359,13 +16356,13 @@ _sk_start_pipeline_avx:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,192 // mov %rcx,-0x40(%rbp)
.byte 72,57,203 // cmp %rcx,%rbx
- .byte 115,83 // jae 715a <_sk_start_pipeline_avx+0x82>
+ .byte 115,83 // jae 7156 <_sk_start_pipeline_avx+0x82>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,8 // lea 0x8(%rax),%rax
.byte 72,137,69,200 // mov %rax,-0x38(%rbp)
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
.byte 76,57,125,200 // cmp %r15,-0x38(%rbp)
- .byte 119,35 // ja 7140 <_sk_start_pipeline_avx+0x68>
+ .byte 119,35 // ja 713c <_sk_start_pipeline_avx+0x68>
.byte 76,139,101,208 // mov -0x30(%rbp),%r12
.byte 49,255 // xor %edi,%edi
.byte 76,137,246 // mov %r14,%rsi
@@ -16376,16 +16373,16 @@ _sk_start_pipeline_avx:
.byte 73,131,196,16 // add $0x10,%r12
.byte 77,57,252 // cmp %r15,%r12
.byte 73,137,212 // mov %rdx,%r12
- .byte 118,225 // jbe 7121 <_sk_start_pipeline_avx+0x49>
+ .byte 118,225 // jbe 711d <_sk_start_pipeline_avx+0x49>
.byte 76,137,255 // mov %r15,%rdi
.byte 72,41,215 // sub %rdx,%rdi
- .byte 116,9 // je 7151 <_sk_start_pipeline_avx+0x79>
+ .byte 116,9 // je 714d <_sk_start_pipeline_avx+0x79>
.byte 76,137,246 // mov %r14,%rsi
.byte 72,137,217 // mov %rbx,%rcx
.byte 65,255,213 // callq *%r13
.byte 72,255,195 // inc %rbx
.byte 72,59,93,192 // cmp -0x40(%rbp),%rbx
- .byte 117,185 // jne 7113 <_sk_start_pipeline_avx+0x3b>
+ .byte 117,185 // jne 710f <_sk_start_pipeline_avx+0x3b>
.byte 72,131,196,24 // add $0x18,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -16410,16 +16407,15 @@ _sk_seed_shader_avx:
.byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,139,80,2,0 // vbroadcastss 0x2508b(%rip),%ymm1 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
- .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 197,252,88,5,107,85,2,0 // vaddps 0x2556b(%rip),%ymm0,%ymm0 # 2c700 <_sk_overlay_sse2_8bit+0x928>
- .byte 197,249,110,209 // vmovd %ecx,%xmm2
- .byte 197,249,112,210,0 // vpshufd $0x0,%xmm2,%xmm2
- .byte 196,227,109,24,210,1 // vinsertf128 $0x1,%xmm2,%ymm2,%ymm2
- .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
+ .byte 197,252,88,5,188,83,2,0 // vaddps 0x253bc(%rip),%ymm0,%ymm0 # 2c540 <_sk_overlay_sse2_8bit+0x77c>
+ .byte 197,249,110,201 // vmovd %ecx,%xmm1
+ .byte 197,249,112,201,0 // vpshufd $0x0,%xmm1,%xmm1
+ .byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
+ .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
+ .byte 196,226,125,24,21,40,89,2,0 // vbroadcastss 0x25928(%rip),%ymm2 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
+ .byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,97,80,2,0 // vbroadcastss 0x25061(%rip),%ymm2 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,21,29,89,2,0 // vbroadcastss 0x2591d(%rip),%ymm2 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -16434,14 +16430,14 @@ _sk_dither_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,121,110,194 // vmovd %edx,%xmm8
.byte 196,65,121,112,192,0 // vpshufd $0x0,%xmm8,%xmm8
- .byte 197,57,254,13,223,90,2,0 // vpaddd 0x25adf(%rip),%xmm8,%xmm9 # 2ccc0 <_sk_overlay_sse2_8bit+0xee8>
- .byte 197,57,254,5,231,90,2,0 // vpaddd 0x25ae7(%rip),%xmm8,%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xef8>
+ .byte 197,57,254,13,199,90,2,0 // vpaddd 0x25ac7(%rip),%xmm8,%xmm9 # 2cca0 <_sk_overlay_sse2_8bit+0xedc>
+ .byte 197,57,254,5,207,90,2,0 // vpaddd 0x25acf(%rip),%xmm8,%xmm8 # 2ccb0 <_sk_overlay_sse2_8bit+0xeec>
.byte 196,67,53,24,192,1 // vinsertf128 $0x1,%xmm8,%ymm9,%ymm8
.byte 197,121,110,201 // vmovd %ecx,%xmm9
.byte 196,65,121,112,201,0 // vpshufd $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 196,65,52,87,208 // vxorps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,15,80,2,0 // vbroadcastss 0x2500f(%rip),%ymm11 # 2c21c <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,98,125,24,29,203,88,2,0 // vbroadcastss 0x258cb(%rip),%ymm11 # 2cad0 <_sk_overlay_sse2_8bit+0xd0c>
.byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9
.byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
@@ -16452,8 +16448,8 @@ _sk_dither_avx:
.byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11
.byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11
.byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- .byte 196,98,125,24,37,208,79,2,0 // vbroadcastss 0x24fd0(%rip),%ymm12 # 2c220 <_sk_overlay_sse2_8bit+0x448>
- .byte 196,98,125,24,45,203,79,2,0 // vbroadcastss 0x24fcb(%rip),%ymm13 # 2c224 <_sk_overlay_sse2_8bit+0x44c>
+ .byte 196,98,125,24,37,140,88,2,0 // vbroadcastss 0x2588c(%rip),%ymm12 # 2cad4 <_sk_overlay_sse2_8bit+0xd10>
+ .byte 196,98,125,24,45,135,88,2,0 // vbroadcastss 0x25887(%rip),%ymm13 # 2cad8 <_sk_overlay_sse2_8bit+0xd14>
.byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14
.byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15
.byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14
@@ -16480,9 +16476,9 @@ _sk_dither_avx:
.byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8
.byte 196,65,60,86,194 // vorps %ymm10,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,54,79,2,0 // vbroadcastss 0x24f36(%rip),%ymm9 # 2c228 <_sk_overlay_sse2_8bit+0x450>
+ .byte 196,98,125,24,13,242,87,2,0 // vbroadcastss 0x257f2(%rip),%ymm9 # 2cadc <_sk_overlay_sse2_8bit+0xd18>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,44,79,2,0 // vbroadcastss 0x24f2c(%rip),%ymm9 # 2c22c <_sk_overlay_sse2_8bit+0x454>
+ .byte 196,98,125,24,13,232,87,2,0 // vbroadcastss 0x257e8(%rip),%ymm9 # 2cae0 <_sk_overlay_sse2_8bit+0xd1c>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 196,98,125,24,8 // vbroadcastss (%rax),%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
@@ -16516,7 +16512,7 @@ HIDDEN _sk_black_color_avx
FUNCTION(_sk_black_color_avx)
_sk_black_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,180,78,2,0 // vbroadcastss 0x24eb4(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,112,87,2,0 // vbroadcastss 0x25770(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -16527,7 +16523,7 @@ HIDDEN _sk_white_color_avx
FUNCTION(_sk_white_color_avx)
_sk_white_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,155,78,2,0 // vbroadcastss 0x24e9b(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,87,87,2,0 // vbroadcastss 0x25757(%rip),%ymm0 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -16573,7 +16569,7 @@ HIDDEN _sk_srcatop_avx
FUNCTION(_sk_srcatop_avx)
_sk_srcatop_avx:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,58,78,2,0 // vbroadcastss 0x24e3a(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,246,86,2,0 // vbroadcastss 0x256f6(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -16594,7 +16590,7 @@ HIDDEN _sk_dstatop_avx
FUNCTION(_sk_dstatop_avx)
_sk_dstatop_avx:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
- .byte 196,98,125,24,13,248,77,2,0 // vbroadcastss 0x24df8(%rip),%ymm9 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,13,180,86,2,0 // vbroadcastss 0x256b4(%rip),%ymm9 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0
@@ -16636,7 +16632,7 @@ HIDDEN _sk_srcout_avx
.globl _sk_srcout_avx
FUNCTION(_sk_srcout_avx)
_sk_srcout_avx:
- .byte 196,98,125,24,5,147,77,2,0 // vbroadcastss 0x24d93(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,79,86,2,0 // vbroadcastss 0x2564f(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -16649,7 +16645,7 @@ HIDDEN _sk_dstout_avx
.globl _sk_dstout_avx
FUNCTION(_sk_dstout_avx)
_sk_dstout_avx:
- .byte 196,226,125,24,5,114,77,2,0 // vbroadcastss 0x24d72(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,46,86,2,0 // vbroadcastss 0x2562e(%rip),%ymm0 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -16662,7 +16658,7 @@ HIDDEN _sk_srcover_avx
.globl _sk_srcover_avx
FUNCTION(_sk_srcover_avx)
_sk_srcover_avx:
- .byte 196,98,125,24,5,81,77,2,0 // vbroadcastss 0x24d51(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,13,86,2,0 // vbroadcastss 0x2560d(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -16679,7 +16675,7 @@ HIDDEN _sk_dstover_avx
.globl _sk_dstover_avx
FUNCTION(_sk_dstover_avx)
_sk_dstover_avx:
- .byte 196,98,125,24,5,32,77,2,0 // vbroadcastss 0x24d20(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,220,85,2,0 // vbroadcastss 0x255dc(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
@@ -16707,7 +16703,7 @@ HIDDEN _sk_multiply_avx
.globl _sk_multiply_avx
FUNCTION(_sk_multiply_avx)
_sk_multiply_avx:
- .byte 196,98,125,24,5,219,76,2,0 // vbroadcastss 0x24cdb(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,151,85,2,0 // vbroadcastss 0x25597(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -16738,7 +16734,7 @@ HIDDEN _sk_plus__avx
FUNCTION(_sk_plus__avx)
_sk_plus__avx:
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
- .byte 196,98,125,24,5,106,76,2,0 // vbroadcastss 0x24c6a(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,38,85,2,0 // vbroadcastss 0x25526(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 197,244,88,205 // vaddps %ymm5,%ymm1,%ymm1
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
@@ -16772,7 +16768,7 @@ HIDDEN _sk_xor__avx
.globl _sk_xor__avx
FUNCTION(_sk_xor__avx)
_sk_xor__avx:
- .byte 196,98,125,24,5,9,76,2,0 // vbroadcastss 0x24c09(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,197,84,2,0 // vbroadcastss 0x254c5(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -16809,7 +16805,7 @@ _sk_darken_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,133,75,2,0 // vbroadcastss 0x24b85(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,65,84,2,0 // vbroadcastss 0x25441(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -16835,7 +16831,7 @@ _sk_lighten_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,45,75,2,0 // vbroadcastss 0x24b2d(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,233,83,2,0 // vbroadcastss 0x253e9(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -16864,7 +16860,7 @@ _sk_difference_avx:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,201,74,2,0 // vbroadcastss 0x24ac9(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,133,83,2,0 // vbroadcastss 0x25385(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -16887,7 +16883,7 @@ _sk_exclusion_avx:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,128,74,2,0 // vbroadcastss 0x24a80(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,60,83,2,0 // vbroadcastss 0x2533c(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -16898,7 +16894,7 @@ HIDDEN _sk_colorburn_avx
.globl _sk_colorburn_avx
FUNCTION(_sk_colorburn_avx)
_sk_colorburn_avx:
- .byte 196,98,125,24,5,103,74,2,0 // vbroadcastss 0x24a67(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,35,83,2,0 // vbroadcastss 0x25323(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -16960,7 +16956,7 @@ HIDDEN _sk_colordodge_avx
FUNCTION(_sk_colordodge_avx)
_sk_colordodge_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,107,73,2,0 // vbroadcastss 0x2496b(%rip),%ymm9 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,13,39,82,2,0 // vbroadcastss 0x25227(%rip),%ymm9 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -17017,7 +17013,7 @@ HIDDEN _sk_hardlight_avx
.globl _sk_hardlight_avx
FUNCTION(_sk_hardlight_avx)
_sk_hardlight_avx:
- .byte 196,98,125,24,5,118,72,2,0 // vbroadcastss 0x24876(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,50,81,2,0 // vbroadcastss 0x25132(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17072,7 +17068,7 @@ HIDDEN _sk_overlay_avx
.globl _sk_overlay_avx
FUNCTION(_sk_overlay_avx)
_sk_overlay_avx:
- .byte 196,98,125,24,5,155,71,2,0 // vbroadcastss 0x2479b(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,87,80,2,0 // vbroadcastss 0x25057(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17138,10 +17134,10 @@ _sk_softlight_avx:
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,29,162,70,2,0 // vbroadcastss 0x246a2(%rip),%ymm11 # 2c230 <_sk_overlay_sse2_8bit+0x458>
+ .byte 196,98,125,24,29,94,79,2,0 // vbroadcastss 0x24f5e(%rip),%ymm11 # 2cae4 <_sk_overlay_sse2_8bit+0xd20>
.byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13
.byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8
- .byte 196,98,125,24,45,147,70,2,0 // vbroadcastss 0x24693(%rip),%ymm13 # 2c234 <_sk_overlay_sse2_8bit+0x45c>
+ .byte 196,98,125,24,45,79,79,2,0 // vbroadcastss 0x24f4f(%rip),%ymm13 # 2cae8 <_sk_overlay_sse2_8bit+0xd24>
.byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14
.byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8
.byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14
@@ -17152,7 +17148,7 @@ _sk_softlight_avx:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,61,70,2,0 // vbroadcastss 0x2463d(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,249,78,2,0 // vbroadcastss 0x24ef9(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
@@ -17279,12 +17275,12 @@ _sk_hue_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,32,68,2,0 // vbroadcastss 0x24420(%rip),%ymm14 # 2c238 <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,53,220,76,2,0 // vbroadcastss 0x24cdc(%rip),%ymm14 # 2caec <_sk_overlay_sse2_8bit+0xd28>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,22,68,2,0 // vbroadcastss 0x24416(%rip),%ymm15 # 2c23c <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,61,210,76,2,0 // vbroadcastss 0x24cd2(%rip),%ymm15 # 2caf0 <_sk_overlay_sse2_8bit+0xd2c>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,7,68,2,0 // vbroadcastss 0x24407(%rip),%ymm0 # 2c240 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,226,125,24,5,195,76,2,0 // vbroadcastss 0x24cc3(%rip),%ymm0 # 2caf4 <_sk_overlay_sse2_8bit+0xd30>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -17345,7 +17341,7 @@ _sk_hue_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,180,66,2,0 // vbroadcastss 0x242b4(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,112,75,2,0 // vbroadcastss 0x24b70(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17402,12 +17398,12 @@ _sk_saturation_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,222,65,2,0 // vbroadcastss 0x241de(%rip),%ymm14 # 2c238 <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,53,154,74,2,0 // vbroadcastss 0x24a9a(%rip),%ymm14 # 2caec <_sk_overlay_sse2_8bit+0xd28>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,212,65,2,0 // vbroadcastss 0x241d4(%rip),%ymm15 # 2c23c <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,61,144,74,2,0 // vbroadcastss 0x24a90(%rip),%ymm15 # 2caf0 <_sk_overlay_sse2_8bit+0xd2c>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,197,65,2,0 // vbroadcastss 0x241c5(%rip),%ymm0 # 2c240 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,226,125,24,5,129,74,2,0 // vbroadcastss 0x24a81(%rip),%ymm0 # 2caf4 <_sk_overlay_sse2_8bit+0xd30>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -17468,7 +17464,7 @@ _sk_saturation_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,114,64,2,0 // vbroadcastss 0x24072(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,46,73,2,0 // vbroadcastss 0x2492e(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17497,12 +17493,12 @@ _sk_color_avx:
.byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp)
.byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8
.byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9
- .byte 196,98,125,24,45,36,64,2,0 // vbroadcastss 0x24024(%rip),%ymm13 # 2c238 <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,45,224,72,2,0 // vbroadcastss 0x248e0(%rip),%ymm13 # 2caec <_sk_overlay_sse2_8bit+0xd28>
.byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10
- .byte 196,98,125,24,53,26,64,2,0 // vbroadcastss 0x2401a(%rip),%ymm14 # 2c23c <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,53,214,72,2,0 // vbroadcastss 0x248d6(%rip),%ymm14 # 2caf0 <_sk_overlay_sse2_8bit+0xd2c>
.byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,11,64,2,0 // vbroadcastss 0x2400b(%rip),%ymm15 # 2c240 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,98,125,24,61,199,72,2,0 // vbroadcastss 0x248c7(%rip),%ymm15 # 2caf4 <_sk_overlay_sse2_8bit+0xd30>
.byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -17565,7 +17561,7 @@ _sk_color_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,166,62,2,0 // vbroadcastss 0x23ea6(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,98,71,2,0 // vbroadcastss 0x24762(%rip),%ymm0 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -17595,12 +17591,12 @@ _sk_luminosity_avx:
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9
- .byte 196,98,125,24,45,84,62,2,0 // vbroadcastss 0x23e54(%rip),%ymm13 # 2c238 <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,45,16,71,2,0 // vbroadcastss 0x24710(%rip),%ymm13 # 2caec <_sk_overlay_sse2_8bit+0xd28>
.byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10
- .byte 196,98,125,24,53,74,62,2,0 // vbroadcastss 0x23e4a(%rip),%ymm14 # 2c23c <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,53,6,71,2,0 // vbroadcastss 0x24706(%rip),%ymm14 # 2caf0 <_sk_overlay_sse2_8bit+0xd2c>
.byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,59,62,2,0 // vbroadcastss 0x23e3b(%rip),%ymm15 # 2c240 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,98,125,24,61,247,70,2,0 // vbroadcastss 0x246f7(%rip),%ymm15 # 2caf4 <_sk_overlay_sse2_8bit+0xd30>
.byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -17663,7 +17659,7 @@ _sk_luminosity_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,214,60,2,0 // vbroadcastss 0x23cd6(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,146,69,2,0 // vbroadcastss 0x24592(%rip),%ymm0 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -17695,9 +17691,9 @@ _sk_srcover_rgba_8888_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,42,1,0,0 // jne 86d7 <_sk_srcover_rgba_8888_avx+0x14a>
+ .byte 15,133,42,1,0,0 // jne 86cf <_sk_srcover_rgba_8888_avx+0x14a>
.byte 196,1,125,16,4,152 // vmovupd (%r8,%r11,4),%ymm8
- .byte 197,125,40,13,101,65,2,0 // vmovapd 0x24165(%rip),%ymm9 # 2c720 <_sk_overlay_sse2_8bit+0x948>
+ .byte 197,125,40,13,173,63,2,0 // vmovapd 0x23fad(%rip),%ymm9 # 2c560 <_sk_overlay_sse2_8bit+0x79c>
.byte 196,193,61,84,225 // vandpd %ymm9,%ymm8,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,81,114,208,8 // vpsrld $0x8,%xmm8,%xmm5
@@ -17715,9 +17711,9 @@ _sk_srcover_rgba_8888_avx:
.byte 197,193,114,215,24 // vpsrld $0x18,%xmm7,%xmm7
.byte 196,227,61,24,255,1 // vinsertf128 $0x1,%xmm7,%ymm8,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,252,59,2,0 // vbroadcastss 0x23bfc(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,184,68,2,0 // vbroadcastss 0x244b8(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,27,60,2,0 // vbroadcastss 0x23c1b(%rip),%ymm9 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,13,215,68,2,0 // vbroadcastss 0x244d7(%rip),%ymm9 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,60,89,212 // vmulps %ymm4,%ymm8,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
@@ -17750,7 +17746,7 @@ _sk_srcover_rgba_8888_avx:
.byte 196,65,53,86,202 // vorpd %ymm10,%ymm9,%ymm9
.byte 196,65,61,86,193 // vorpd %ymm9,%ymm8,%ymm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,66 // jne 870f <_sk_srcover_rgba_8888_avx+0x182>
+ .byte 117,66 // jne 8707 <_sk_srcover_rgba_8888_avx+0x182>
.byte 196,1,124,17,4,152 // vmovups %ymm8,(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -17759,33 +17755,33 @@ _sk_srcover_rgba_8888_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,195,254,255,255 // ja 85b3 <_sk_srcover_rgba_8888_avx+0x26>
+ .byte 15,135,195,254,255,255 // ja 85ab <_sk_srcover_rgba_8888_avx+0x26>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,5,1,0,0 // lea 0x105(%rip),%r10 # 8800 <_sk_srcover_rgba_8888_avx+0x273>
+ .byte 76,141,21,5,1,0,0 // lea 0x105(%rip),%r10 # 87f8 <_sk_srcover_rgba_8888_avx+0x273>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,122,16,4,152 // vmovss (%r8,%r11,4),%xmm8
- .byte 233,164,254,255,255 // jmpq 85b3 <_sk_srcover_rgba_8888_avx+0x26>
+ .byte 233,164,254,255,255 // jmpq 85ab <_sk_srcover_rgba_8888_avx+0x26>
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,180 // ja 86d3 <_sk_srcover_rgba_8888_avx+0x146>
+ .byte 119,180 // ja 86cb <_sk_srcover_rgba_8888_avx+0x146>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 76,141,13,242,0,0,0 // lea 0xf2(%rip),%r9 # 881c <_sk_srcover_rgba_8888_avx+0x28f>
+ .byte 76,141,13,242,0,0,0 // lea 0xf2(%rip),%r9 # 8814 <_sk_srcover_rgba_8888_avx+0x28f>
.byte 73,99,4,129 // movslq (%r9,%rax,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,121,126,4,152 // vmovd %xmm8,(%r8,%r11,4)
- .byte 235,152 // jmp 86d3 <_sk_srcover_rgba_8888_avx+0x146>
+ .byte 235,152 // jmp 86cb <_sk_srcover_rgba_8888_avx+0x146>
.byte 196,129,121,110,100,152,8 // vmovd 0x8(%r8,%r11,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
.byte 196,99,85,12,196,4 // vblendps $0x4,%ymm4,%ymm5,%ymm8
.byte 196,129,123,16,36,152 // vmovsd (%r8,%r11,4),%xmm4
.byte 196,99,61,13,196,1 // vblendpd $0x1,%ymm4,%ymm8,%ymm8
- .byte 233,81,254,255,255 // jmpq 85b3 <_sk_srcover_rgba_8888_avx+0x26>
+ .byte 233,81,254,255,255 // jmpq 85ab <_sk_srcover_rgba_8888_avx+0x26>
.byte 196,129,121,110,100,152,24 // vmovd 0x18(%r8,%r11,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -17799,10 +17795,10 @@ _sk_srcover_rgba_8888_avx:
.byte 196,99,61,24,196,1 // vinsertf128 $0x1,%xmm4,%ymm8,%ymm8
.byte 196,129,121,16,36,152 // vmovupd (%r8,%r11,4),%xmm4
.byte 196,67,93,13,192,12 // vblendpd $0xc,%ymm8,%ymm4,%ymm8
- .byte 233,252,253,255,255 // jmpq 85b3 <_sk_srcover_rgba_8888_avx+0x26>
+ .byte 233,252,253,255,255 // jmpq 85ab <_sk_srcover_rgba_8888_avx+0x26>
.byte 196,3,121,22,68,152,8,2 // vpextrd $0x2,%xmm8,0x8(%r8,%r11,4)
.byte 196,1,121,214,4,152 // vmovq %xmm8,(%r8,%r11,4)
- .byte 233,9,255,255,255 // jmpq 86d3 <_sk_srcover_rgba_8888_avx+0x146>
+ .byte 233,9,255,255,255 // jmpq 86cb <_sk_srcover_rgba_8888_avx+0x146>
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,3,121,22,76,152,24,2 // vpextrd $0x2,%xmm9,0x18(%r8,%r11,4)
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -17810,7 +17806,7 @@ _sk_srcover_rgba_8888_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,1,122,17,76,152,16 // vmovss %xmm9,0x10(%r8,%r11,4)
.byte 196,1,121,17,4,152 // vmovupd %xmm8,(%r8,%r11,4)
- .byte 233,213,254,255,255 // jmpq 86d3 <_sk_srcover_rgba_8888_avx+0x146>
+ .byte 233,213,254,255,255 // jmpq 86cb <_sk_srcover_rgba_8888_avx+0x146>
.byte 102,144 // xchg %ax,%ax
.byte 4,255 // add $0xff,%al
.byte 255 // (bad)
@@ -17823,7 +17819,7 @@ _sk_srcover_rgba_8888_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 126,255 // jle 8815 <_sk_srcover_rgba_8888_avx+0x288>
+ .byte 126,255 // jle 880d <_sk_srcover_rgba_8888_avx+0x288>
.byte 255 // (bad)
.byte 255,98,255 // jmpq *-0x1(%rdx)
.byte 255 // (bad)
@@ -17861,7 +17857,7 @@ HIDDEN _sk_clamp_1_avx
.globl _sk_clamp_1_avx
FUNCTION(_sk_clamp_1_avx)
_sk_clamp_1_avx:
- .byte 196,98,125,24,5,186,57,2,0 // vbroadcastss 0x239ba(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,118,66,2,0 // vbroadcastss 0x24276(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -17873,7 +17869,7 @@ HIDDEN _sk_clamp_a_avx
.globl _sk_clamp_a_avx
FUNCTION(_sk_clamp_a_avx)
_sk_clamp_a_avx:
- .byte 196,98,125,24,5,153,57,2,0 // vbroadcastss 0x23999(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,85,66,2,0 // vbroadcastss 0x24255(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -17885,7 +17881,7 @@ HIDDEN _sk_clamp_a_dst_avx
.globl _sk_clamp_a_dst_avx
FUNCTION(_sk_clamp_a_dst_avx)
_sk_clamp_a_dst_avx:
- .byte 196,98,125,24,5,123,57,2,0 // vbroadcastss 0x2397b(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,55,66,2,0 // vbroadcastss 0x24237(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -17918,7 +17914,7 @@ HIDDEN _sk_invert_avx
.globl _sk_invert_avx
FUNCTION(_sk_invert_avx)
_sk_invert_avx:
- .byte 196,98,125,24,5,54,57,2,0 // vbroadcastss 0x23936(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,242,65,2,0 // vbroadcastss 0x241f2(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -17974,7 +17970,7 @@ FUNCTION(_sk_unpremul_avx)
_sk_unpremul_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,198,56,2,0 // vbroadcastss 0x238c6(%rip),%ymm10 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,21,130,65,2,0 // vbroadcastss 0x24182(%rip),%ymm10 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -17987,17 +17983,17 @@ HIDDEN _sk_from_srgb_avx
.globl _sk_from_srgb_avx
FUNCTION(_sk_from_srgb_avx)
_sk_from_srgb_avx:
- .byte 196,98,125,24,5,211,56,2,0 // vbroadcastss 0x238d3(%rip),%ymm8 # 2c248 <_sk_overlay_sse2_8bit+0x470>
+ .byte 196,98,125,24,5,143,65,2,0 // vbroadcastss 0x2418f(%rip),%ymm8 # 2cafc <_sk_overlay_sse2_8bit+0xd38>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,177,56,2,0 // vbroadcastss 0x238b1(%rip),%ymm11 # 2c238 <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,29,109,65,2,0 // vbroadcastss 0x2416d(%rip),%ymm11 # 2caec <_sk_overlay_sse2_8bit+0xd28>
.byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12
- .byte 196,98,125,24,45,183,56,2,0 // vbroadcastss 0x238b7(%rip),%ymm13 # 2c24c <_sk_overlay_sse2_8bit+0x474>
+ .byte 196,98,125,24,45,115,65,2,0 // vbroadcastss 0x24173(%rip),%ymm13 # 2cb00 <_sk_overlay_sse2_8bit+0xd3c>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,168,56,2,0 // vbroadcastss 0x238a8(%rip),%ymm12 # 2c250 <_sk_overlay_sse2_8bit+0x478>
+ .byte 196,98,125,24,37,100,65,2,0 // vbroadcastss 0x24164(%rip),%ymm12 # 2cb04 <_sk_overlay_sse2_8bit+0xd40>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,158,56,2,0 // vbroadcastss 0x2389e(%rip),%ymm14 # 2c254 <_sk_overlay_sse2_8bit+0x47c>
+ .byte 196,98,125,24,53,90,65,2,0 // vbroadcastss 0x2415a(%rip),%ymm14 # 2cb08 <_sk_overlay_sse2_8bit+0xd44>
.byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0
.byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -18023,17 +18019,17 @@ HIDDEN _sk_from_srgb_dst_avx
.globl _sk_from_srgb_dst_avx
FUNCTION(_sk_from_srgb_dst_avx)
_sk_from_srgb_dst_avx:
- .byte 196,98,125,24,5,39,56,2,0 // vbroadcastss 0x23827(%rip),%ymm8 # 2c248 <_sk_overlay_sse2_8bit+0x470>
+ .byte 196,98,125,24,5,227,64,2,0 // vbroadcastss 0x240e3(%rip),%ymm8 # 2cafc <_sk_overlay_sse2_8bit+0xd38>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,5,56,2,0 // vbroadcastss 0x23805(%rip),%ymm11 # 2c238 <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,29,193,64,2,0 // vbroadcastss 0x240c1(%rip),%ymm11 # 2caec <_sk_overlay_sse2_8bit+0xd28>
.byte 196,65,92,89,227 // vmulps %ymm11,%ymm4,%ymm12
- .byte 196,98,125,24,45,11,56,2,0 // vbroadcastss 0x2380b(%rip),%ymm13 # 2c24c <_sk_overlay_sse2_8bit+0x474>
+ .byte 196,98,125,24,45,199,64,2,0 // vbroadcastss 0x240c7(%rip),%ymm13 # 2cb00 <_sk_overlay_sse2_8bit+0xd3c>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,252,55,2,0 // vbroadcastss 0x237fc(%rip),%ymm12 # 2c250 <_sk_overlay_sse2_8bit+0x478>
+ .byte 196,98,125,24,37,184,64,2,0 // vbroadcastss 0x240b8(%rip),%ymm12 # 2cb04 <_sk_overlay_sse2_8bit+0xd40>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,242,55,2,0 // vbroadcastss 0x237f2(%rip),%ymm14 # 2c254 <_sk_overlay_sse2_8bit+0x47c>
+ .byte 196,98,125,24,53,174,64,2,0 // vbroadcastss 0x240ae(%rip),%ymm14 # 2cb08 <_sk_overlay_sse2_8bit+0xd44>
.byte 196,193,92,194,230,1 // vcmpltps %ymm14,%ymm4,%ymm4
.byte 196,195,45,74,225,64 // vblendvps %ymm4,%ymm9,%ymm10,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -18060,20 +18056,20 @@ HIDDEN _sk_to_srgb_avx
FUNCTION(_sk_to_srgb_avx)
_sk_to_srgb_avx:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,135,55,2,0 // vbroadcastss 0x23787(%rip),%ymm8 # 2c258 <_sk_overlay_sse2_8bit+0x480>
+ .byte 196,98,125,24,5,67,64,2,0 // vbroadcastss 0x24043(%rip),%ymm8 # 2cb0c <_sk_overlay_sse2_8bit+0xd48>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,129,55,2,0 // vbroadcastss 0x23781(%rip),%ymm11 # 2c260 <_sk_overlay_sse2_8bit+0x488>
+ .byte 196,98,125,24,29,61,64,2,0 // vbroadcastss 0x2403d(%rip),%ymm11 # 2cb14 <_sk_overlay_sse2_8bit+0xd50>
.byte 196,65,52,89,227 // vmulps %ymm11,%ymm9,%ymm12
- .byte 196,98,125,24,45,111,55,2,0 // vbroadcastss 0x2376f(%rip),%ymm13 # 2c25c <_sk_overlay_sse2_8bit+0x484>
+ .byte 196,98,125,24,45,43,64,2,0 // vbroadcastss 0x2402b(%rip),%ymm13 # 2cb10 <_sk_overlay_sse2_8bit+0xd4c>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,52,89,228 // vmulps %ymm12,%ymm9,%ymm12
- .byte 196,98,125,24,53,100,55,2,0 // vbroadcastss 0x23764(%rip),%ymm14 # 2c264 <_sk_overlay_sse2_8bit+0x48c>
+ .byte 196,98,125,24,53,32,64,2,0 // vbroadcastss 0x24020(%rip),%ymm14 # 2cb18 <_sk_overlay_sse2_8bit+0xd54>
.byte 196,65,28,88,230 // vaddps %ymm14,%ymm12,%ymm12
- .byte 196,98,125,24,61,90,55,2,0 // vbroadcastss 0x2375a(%rip),%ymm15 # 2c268 <_sk_overlay_sse2_8bit+0x490>
+ .byte 196,98,125,24,61,22,64,2,0 // vbroadcastss 0x24016(%rip),%ymm15 # 2cb1c <_sk_overlay_sse2_8bit+0xd58>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
- .byte 196,98,125,24,37,70,55,2,0 // vbroadcastss 0x23746(%rip),%ymm12 # 2c26c <_sk_overlay_sse2_8bit+0x494>
+ .byte 196,98,125,24,37,2,64,2,0 // vbroadcastss 0x24002(%rip),%ymm12 # 2cb20 <_sk_overlay_sse2_8bit+0xd5c>
.byte 196,193,124,194,196,1 // vcmpltps %ymm12,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -18110,7 +18106,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,116,93,202 // vminps %ymm2,%ymm1,%ymm9
.byte 196,65,124,93,201 // vminps %ymm9,%ymm0,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,82,54,2,0 // vbroadcastss 0x23652(%rip),%ymm11 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,29,14,63,2,0 // vbroadcastss 0x23f0e(%rip),%ymm11 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12
@@ -18120,19 +18116,19 @@ _sk_rgb_to_hsl_avx:
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
.byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,127,54,2,0 // vbroadcastss 0x2367f(%rip),%ymm11 # 2c278 <_sk_overlay_sse2_8bit+0x4a0>
+ .byte 196,98,125,24,29,59,63,2,0 // vbroadcastss 0x23f3b(%rip),%ymm11 # 2cb2c <_sk_overlay_sse2_8bit+0xd68>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,109,54,2,0 // vbroadcastss 0x2366d(%rip),%ymm11 # 2c274 <_sk_overlay_sse2_8bit+0x49c>
+ .byte 196,98,125,24,29,41,63,2,0 // vbroadcastss 0x23f29(%rip),%ymm11 # 2cb28 <_sk_overlay_sse2_8bit+0xd64>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,85,54,2,0 // vbroadcastss 0x23655(%rip),%ymm2 # 2c270 <_sk_overlay_sse2_8bit+0x498>
+ .byte 196,226,125,24,21,17,63,2,0 // vbroadcastss 0x23f11(%rip),%ymm2 # 2cb24 <_sk_overlay_sse2_8bit+0xd60>
.byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14
.byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
.byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,37,208,53,2,0 // vbroadcastss 0x235d0(%rip),%ymm12 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,37,140,62,2,0 // vbroadcastss 0x23e8c(%rip),%ymm12 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2
.byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12
.byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11
@@ -18142,7 +18138,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0
.byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- .byte 196,98,125,24,5,255,53,2,0 // vbroadcastss 0x235ff(%rip),%ymm8 # 2c27c <_sk_overlay_sse2_8bit+0x4a4>
+ .byte 196,98,125,24,5,187,62,2,0 // vbroadcastss 0x23ebb(%rip),%ymm8 # 2cb30 <_sk_overlay_sse2_8bit+0xd6c>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -18159,7 +18155,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,225 // vmovaps %ymm1,%ymm4
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
- .byte 196,98,125,24,5,92,53,2,0 // vbroadcastss 0x2355c(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,24,62,2,0 // vbroadcastss 0x23e18(%rip),%ymm8 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10
.byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11
@@ -18167,23 +18163,23 @@ _sk_hsl_to_rgb_avx:
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
.byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,29,158,53,2,0 // vbroadcastss 0x2359e(%rip),%ymm11 # 2c280 <_sk_overlay_sse2_8bit+0x4a8>
+ .byte 196,98,125,24,29,90,62,2,0 // vbroadcastss 0x23e5a(%rip),%ymm11 # 2cb34 <_sk_overlay_sse2_8bit+0xd70>
.byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,37,112,53,2,0 // vbroadcastss 0x23570(%rip),%ymm12 # 2c270 <_sk_overlay_sse2_8bit+0x498>
+ .byte 196,98,125,24,37,44,62,2,0 // vbroadcastss 0x23e2c(%rip),%ymm12 # 2cb24 <_sk_overlay_sse2_8bit+0xd60>
.byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0
- .byte 196,98,125,24,45,106,53,2,0 // vbroadcastss 0x2356a(%rip),%ymm13 # 2c278 <_sk_overlay_sse2_8bit+0x4a0>
+ .byte 196,98,125,24,45,38,62,2,0 // vbroadcastss 0x23e26(%rip),%ymm13 # 2cb2c <_sk_overlay_sse2_8bit+0xd68>
.byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14
.byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14
.byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14
- .byte 196,226,125,24,13,95,53,2,0 // vbroadcastss 0x2355f(%rip),%ymm1 # 2c284 <_sk_overlay_sse2_8bit+0x4ac>
+ .byte 196,226,125,24,13,27,62,2,0 // vbroadcastss 0x23e1b(%rip),%ymm1 # 2cb38 <_sk_overlay_sse2_8bit+0xd74>
.byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7
.byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7
.byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14
.byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,53,54,53,2,0 // vbroadcastss 0x23536(%rip),%ymm14 # 2c27c <_sk_overlay_sse2_8bit+0x4a4>
+ .byte 196,98,125,24,53,242,61,2,0 // vbroadcastss 0x23df2(%rip),%ymm14 # 2cb30 <_sk_overlay_sse2_8bit+0xd6c>
.byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -18202,7 +18198,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6
.byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6
.byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- .byte 196,226,125,24,5,224,52,2,0 // vbroadcastss 0x234e0(%rip),%ymm0 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,226,125,24,5,156,61,2,0 // vbroadcastss 0x23d9c(%rip),%ymm0 # 2cb3c <_sk_overlay_sse2_8bit+0xd78>
.byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0
.byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3
.byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0
@@ -18256,15 +18252,15 @@ _sk_scale_u8_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,74 // jne 8ead <_sk_scale_u8_avx+0x62>
+ .byte 117,74 // jne 8ea5 <_sk_scale_u8_avx+0x62>
.byte 196,2,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm8
- .byte 197,57,219,5,31,62,2,0 // vpand 0x23e1f(%rip),%xmm8,%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,57,219,5,7,62,2,0 // vpand 0x23e07(%rip),%xmm8,%xmm8 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,248,51,2,0 // vbroadcastss 0x233f8(%rip),%ymm9 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,13,180,60,2,0 // vbroadcastss 0x23cb4(%rip),%ymm9 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -18277,15 +18273,15 @@ _sk_scale_u8_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,167 // ja 8e69 <_sk_scale_u8_avx+0x1e>
+ .byte 119,167 // ja 8e61 <_sk_scale_u8_avx+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,123,0,0,0 // lea 0x7b(%rip),%r10 # 8f48 <_sk_scale_u8_avx+0xfd>
+ .byte 76,141,21,123,0,0,0 // lea 0x7b(%rip),%r10 # 8f40 <_sk_scale_u8_avx+0xfd>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 235,136 // jmp 8e69 <_sk_scale_u8_avx+0x1e>
+ .byte 235,136 // jmp 8e61 <_sk_scale_u8_avx+0x1e>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -18293,7 +18289,7 @@ _sk_scale_u8_avx:
.byte 197,121,110,200 // vmovd %eax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
- .byte 233,95,255,255,255 // jmpq 8e69 <_sk_scale_u8_avx+0x1e>
+ .byte 233,95,255,255,255 // jmpq 8e61 <_sk_scale_u8_avx+0x1e>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -18304,7 +18300,7 @@ _sk_scale_u8_avx:
.byte 196,1,121,110,12,24 // vmovd (%r8,%r11,1),%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- .byte 233,35,255,255,255 // jmpq 8e69 <_sk_scale_u8_avx+0x1e>
+ .byte 233,35,255,255,255 // jmpq 8e61 <_sk_scale_u8_avx+0x1e>
.byte 102,144 // xchg %ax,%ax
.byte 142,255 // mov %edi,%?
.byte 255 // (bad)
@@ -18312,7 +18308,7 @@ _sk_scale_u8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde008f58 <_sk_overlay_sse2_8bit+0xffffffffddfdd180>
+ .byte 232,255,255,255,221 // callq ffffffffde008f50 <_sk_overlay_sse2_8bit+0xffffffffddfdd18c>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -18335,26 +18331,26 @@ _sk_scale_565_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,177,0,0,0 // jne 9034 <_sk_scale_565_avx+0xd0>
+ .byte 15,133,177,0,0,0 // jne 902c <_sk_scale_565_avx+0xd0>
.byte 196,1,122,111,4,88 // vmovdqu (%r8,%r11,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,233,50,2,0 // vbroadcastss 0x232e9(%rip),%ymm9 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,98,125,24,13,165,59,2,0 // vbroadcastss 0x23ba5(%rip),%ymm9 # 2cb44 <_sk_overlay_sse2_8bit+0xd80>
.byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,218,50,2,0 // vbroadcastss 0x232da(%rip),%ymm10 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,98,125,24,21,150,59,2,0 // vbroadcastss 0x23b96(%rip),%ymm10 # 2cb48 <_sk_overlay_sse2_8bit+0xd84>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,208,50,2,0 // vbroadcastss 0x232d0(%rip),%ymm10 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,98,125,24,21,140,59,2,0 // vbroadcastss 0x23b8c(%rip),%ymm10 # 2cb4c <_sk_overlay_sse2_8bit+0xd88>
.byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,193,50,2,0 // vbroadcastss 0x232c1(%rip),%ymm11 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,98,125,24,29,125,59,2,0 // vbroadcastss 0x23b7d(%rip),%ymm11 # 2cb50 <_sk_overlay_sse2_8bit+0xd8c>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,29,183,50,2,0 // vbroadcastss 0x232b7(%rip),%ymm11 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,98,125,24,29,115,59,2,0 // vbroadcastss 0x23b73(%rip),%ymm11 # 2cb54 <_sk_overlay_sse2_8bit+0xd90>
.byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,168,50,2,0 // vbroadcastss 0x232a8(%rip),%ymm11 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,98,125,24,29,100,59,2,0 // vbroadcastss 0x23b64(%rip),%ymm11 # 2cb58 <_sk_overlay_sse2_8bit+0xd94>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
.byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
@@ -18373,27 +18369,27 @@ _sk_scale_565_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,60,255,255,255 // ja 8f89 <_sk_scale_565_avx+0x25>
+ .byte 15,135,60,255,255,255 // ja 8f81 <_sk_scale_565_avx+0x25>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,100,0,0,0 // lea 0x64(%rip),%r10 # 90bc <_sk_scale_565_avx+0x158>
+ .byte 76,141,21,100,0,0,0 // lea 0x64(%rip),%r10 # 90b4 <_sk_scale_565_avx+0x158>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 233,26,255,255,255 // jmpq 8f89 <_sk_scale_565_avx+0x25>
+ .byte 233,26,255,255,255 // jmpq 8f81 <_sk_scale_565_avx+0x25>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,1,57,196,68,88,4,2 // vpinsrw $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,121,110,12,88 // vmovd (%r8,%r11,2),%xmm9
.byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
- .byte 233,252,254,255,255 // jmpq 8f89 <_sk_scale_565_avx+0x25>
+ .byte 233,252,254,255,255 // jmpq 8f81 <_sk_scale_565_avx+0x25>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,1,57,196,68,88,12,6 // vpinsrw $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,57,196,68,88,10,5 // vpinsrw $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,57,196,68,88,8,4 // vpinsrw $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,122,126,12,88 // vmovq (%r8,%r11,2),%xmm9
.byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- .byte 233,206,254,255,255 // jmpq 8f89 <_sk_scale_565_avx+0x25>
+ .byte 233,206,254,255,255 // jmpq 8f81 <_sk_scale_565_avx+0x25>
.byte 144 // nop
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -18447,15 +18443,15 @@ _sk_lerp_u8_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,110 // jne 919d <_sk_lerp_u8_avx+0x86>
+ .byte 117,110 // jne 9195 <_sk_lerp_u8_avx+0x86>
.byte 196,2,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm8
- .byte 197,57,219,5,83,59,2,0 // vpand 0x23b53(%rip),%xmm8,%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,57,219,5,59,59,2,0 // vpand 0x23b3b(%rip),%xmm8,%xmm8 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,44,49,2,0 // vbroadcastss 0x2312c(%rip),%ymm9 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,13,232,57,2,0 // vbroadcastss 0x239e8(%rip),%ymm9 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
@@ -18476,15 +18472,15 @@ _sk_lerp_u8_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,131 // ja 9135 <_sk_lerp_u8_avx+0x1e>
+ .byte 119,131 // ja 912d <_sk_lerp_u8_avx+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,127,0,0,0 // lea 0x7f(%rip),%r10 # 923c <_sk_lerp_u8_avx+0x125>
+ .byte 76,141,21,127,0,0,0 // lea 0x7f(%rip),%r10 # 9234 <_sk_lerp_u8_avx+0x125>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 233,97,255,255,255 // jmpq 9135 <_sk_lerp_u8_avx+0x1e>
+ .byte 233,97,255,255,255 // jmpq 912d <_sk_lerp_u8_avx+0x1e>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -18492,7 +18488,7 @@ _sk_lerp_u8_avx:
.byte 197,121,110,200 // vmovd %eax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
- .byte 233,56,255,255,255 // jmpq 9135 <_sk_lerp_u8_avx+0x1e>
+ .byte 233,56,255,255,255 // jmpq 912d <_sk_lerp_u8_avx+0x1e>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -18503,7 +18499,7 @@ _sk_lerp_u8_avx:
.byte 196,1,121,110,12,24 // vmovd (%r8,%r11,1),%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- .byte 233,252,254,255,255 // jmpq 9135 <_sk_lerp_u8_avx+0x1e>
+ .byte 233,252,254,255,255 // jmpq 912d <_sk_lerp_u8_avx+0x1e>
.byte 15,31,0 // nopl (%rax)
.byte 138,255 // mov %bh,%bh
.byte 255 // (bad)
@@ -18536,26 +18532,26 @@ _sk_lerp_565_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,213,0,0,0 // jne 934c <_sk_lerp_565_avx+0xf4>
+ .byte 15,133,213,0,0,0 // jne 9344 <_sk_lerp_565_avx+0xf4>
.byte 196,1,122,111,4,88 // vmovdqu (%r8,%r11,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,245,47,2,0 // vbroadcastss 0x22ff5(%rip),%ymm9 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,98,125,24,13,177,56,2,0 // vbroadcastss 0x238b1(%rip),%ymm9 # 2cb44 <_sk_overlay_sse2_8bit+0xd80>
.byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,230,47,2,0 // vbroadcastss 0x22fe6(%rip),%ymm10 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,98,125,24,21,162,56,2,0 // vbroadcastss 0x238a2(%rip),%ymm10 # 2cb48 <_sk_overlay_sse2_8bit+0xd84>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,220,47,2,0 // vbroadcastss 0x22fdc(%rip),%ymm10 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,98,125,24,21,152,56,2,0 // vbroadcastss 0x23898(%rip),%ymm10 # 2cb4c <_sk_overlay_sse2_8bit+0xd88>
.byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,205,47,2,0 // vbroadcastss 0x22fcd(%rip),%ymm11 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,98,125,24,29,137,56,2,0 // vbroadcastss 0x23889(%rip),%ymm11 # 2cb50 <_sk_overlay_sse2_8bit+0xd8c>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,29,195,47,2,0 // vbroadcastss 0x22fc3(%rip),%ymm11 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,98,125,24,29,127,56,2,0 // vbroadcastss 0x2387f(%rip),%ymm11 # 2cb54 <_sk_overlay_sse2_8bit+0xd90>
.byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,180,47,2,0 // vbroadcastss 0x22fb4(%rip),%ymm11 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,98,125,24,29,112,56,2,0 // vbroadcastss 0x23870(%rip),%ymm11 # 2cb58 <_sk_overlay_sse2_8bit+0xd94>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
.byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
@@ -18582,27 +18578,27 @@ _sk_lerp_565_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,24,255,255,255 // ja 927d <_sk_lerp_565_avx+0x25>
+ .byte 15,135,24,255,255,255 // ja 9275 <_sk_lerp_565_avx+0x25>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,100,0,0,0 // lea 0x64(%rip),%r10 # 93d4 <_sk_lerp_565_avx+0x17c>
+ .byte 76,141,21,100,0,0,0 // lea 0x64(%rip),%r10 # 93cc <_sk_lerp_565_avx+0x17c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 233,246,254,255,255 // jmpq 927d <_sk_lerp_565_avx+0x25>
+ .byte 233,246,254,255,255 // jmpq 9275 <_sk_lerp_565_avx+0x25>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,1,57,196,68,88,4,2 // vpinsrw $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,121,110,12,88 // vmovd (%r8,%r11,2),%xmm9
.byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
- .byte 233,216,254,255,255 // jmpq 927d <_sk_lerp_565_avx+0x25>
+ .byte 233,216,254,255,255 // jmpq 9275 <_sk_lerp_565_avx+0x25>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,1,57,196,68,88,12,6 // vpinsrw $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,57,196,68,88,10,5 // vpinsrw $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,57,196,68,88,8,4 // vpinsrw $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
.byte 196,1,122,126,12,88 // vmovq (%r8,%r11,2),%xmm9
.byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- .byte 233,170,254,255,255 // jmpq 927d <_sk_lerp_565_avx+0x25>
+ .byte 233,170,254,255,255 // jmpq 9275 <_sk_lerp_565_avx+0x25>
.byte 144 // nop
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -18632,9 +18628,9 @@ _sk_load_tables_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,0 // mov (%rax),%r8
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,4,2,0,0 // jne 9608 <_sk_load_tables_avx+0x218>
+ .byte 15,133,4,2,0,0 // jne 9600 <_sk_load_tables_avx+0x218>
.byte 196,65,125,16,20,144 // vmovupd (%r8,%rdx,4),%ymm10
- .byte 197,125,40,13,46,51,2,0 // vmovapd 0x2332e(%rip),%ymm9 # 2c740 <_sk_overlay_sse2_8bit+0x968>
+ .byte 197,125,40,13,118,49,2,0 // vmovapd 0x23176(%rip),%ymm9 # 2c580 <_sk_overlay_sse2_8bit+0x7bc>
.byte 196,193,45,84,201 // vandpd %ymm9,%ymm10,%ymm1
.byte 196,227,125,25,200,1 // vextractf128 $0x1,%ymm1,%xmm0
.byte 196,193,249,126,192 // vmovq %xmm0,%r8
@@ -18726,7 +18722,7 @@ _sk_load_tables_avx:
.byte 196,193,65,114,213,24 // vpsrld $0x18,%xmm13,%xmm7
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,146,44,2,0 // vbroadcastss 0x22c92(%rip),%ymm7 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,61,78,53,2,0 // vbroadcastss 0x2354e(%rip),%ymm7 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
@@ -18736,21 +18732,21 @@ _sk_load_tables_avx:
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,233,253,255,255 // ja 940a <_sk_load_tables_avx+0x1a>
+ .byte 15,135,233,253,255,255 // ja 9402 <_sk_load_tables_avx+0x1a>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,148,0,0,0 // lea 0x94(%rip),%r10 # 96c0 <_sk_load_tables_avx+0x2d0>
+ .byte 76,141,21,148,0,0,0 // lea 0x94(%rip),%r10 # 96b8 <_sk_load_tables_avx+0x2d0>
.byte 79,99,12,138 // movslq (%r10,%r9,4),%r9
.byte 77,1,209 // add %r10,%r9
.byte 65,255,225 // jmpq *%r9
.byte 196,65,122,16,20,144 // vmovss (%r8,%rdx,4),%xmm10
- .byte 233,201,253,255,255 // jmpq 940a <_sk_load_tables_avx+0x1a>
+ .byte 233,201,253,255,255 // jmpq 9402 <_sk_load_tables_avx+0x1a>
.byte 196,193,121,110,68,144,8 // vmovd 0x8(%r8,%rdx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,99,117,12,208,4 // vblendps $0x4,%ymm0,%ymm1,%ymm10
.byte 196,193,123,16,4,144 // vmovsd (%r8,%rdx,4),%xmm0
.byte 196,99,45,13,208,1 // vblendpd $0x1,%ymm0,%ymm10,%ymm10
- .byte 233,162,253,255,255 // jmpq 940a <_sk_load_tables_avx+0x1a>
+ .byte 233,162,253,255,255 // jmpq 9402 <_sk_load_tables_avx+0x1a>
.byte 196,193,121,110,68,144,24 // vmovd 0x18(%r8,%rdx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -18764,9 +18760,9 @@ _sk_load_tables_avx:
.byte 196,99,45,24,208,1 // vinsertf128 $0x1,%xmm0,%ymm10,%ymm10
.byte 196,193,121,16,4,144 // vmovupd (%r8,%rdx,4),%xmm0
.byte 196,67,125,13,210,12 // vblendpd $0xc,%ymm10,%ymm0,%ymm10
- .byte 233,77,253,255,255 // jmpq 940a <_sk_load_tables_avx+0x1a>
+ .byte 233,77,253,255,255 // jmpq 9402 <_sk_load_tables_avx+0x1a>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe 96c1 <_sk_load_tables_avx+0x2d1>
+ .byte 118,255 // jbe 96b9 <_sk_load_tables_avx+0x2d1>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -18795,7 +18791,7 @@ _sk_load_tables_u16_be_avx:
.byte 76,141,12,149,0,0,0,0 // lea 0x0(,%rdx,4),%r9
.byte 72,133,255 // test %rdi,%rdi
.byte 197,252,17,124,36,200 // vmovups %ymm7,-0x38(%rsp)
- .byte 15,133,84,2,0,0 // jne 994c <_sk_load_tables_u16_be_avx+0x270>
+ .byte 15,133,84,2,0,0 // jne 9944 <_sk_load_tables_u16_be_avx+0x270>
.byte 196,1,121,16,4,72 // vmovupd (%r8,%r9,2),%xmm8
.byte 196,129,121,16,84,72,16 // vmovupd 0x10(%r8,%r9,2),%xmm2
.byte 196,129,121,16,92,72,32 // vmovupd 0x20(%r8,%r9,2),%xmm3
@@ -18810,7 +18806,7 @@ _sk_load_tables_u16_be_avx:
.byte 197,113,105,219 // vpunpckhwd %xmm3,%xmm1,%xmm11
.byte 197,177,108,200 // vpunpcklqdq %xmm0,%xmm9,%xmm1
.byte 197,49,109,224 // vpunpckhqdq %xmm0,%xmm9,%xmm12
- .byte 197,121,111,21,75,53,2,0 // vmovdqa 0x2354b(%rip),%xmm10 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,121,111,21,51,53,2,0 // vmovdqa 0x23533(%rip),%xmm10 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 196,193,113,219,202 // vpand %xmm10,%xmm1,%xmm1
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,193,113,105,209 // vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -18908,7 +18904,7 @@ _sk_load_tables_u16_be_avx:
.byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,106,41,2,0 // vbroadcastss 0x2296a(%rip),%ymm7 # 2c2a8 <_sk_overlay_sse2_8bit+0x4d0>
+ .byte 196,226,125,24,61,38,50,2,0 // vbroadcastss 0x23226(%rip),%ymm7 # 2cb5c <_sk_overlay_sse2_8bit+0xd98>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
@@ -18916,29 +18912,29 @@ _sk_load_tables_u16_be_avx:
.byte 196,1,123,16,4,72 // vmovsd (%r8,%r9,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,85 // je 99b2 <_sk_load_tables_u16_be_avx+0x2d6>
+ .byte 116,85 // je 99aa <_sk_load_tables_u16_be_avx+0x2d6>
.byte 196,1,57,22,68,72,8 // vmovhpd 0x8(%r8,%r9,2),%xmm8,%xmm8
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,72 // jb 99b2 <_sk_load_tables_u16_be_avx+0x2d6>
+ .byte 114,72 // jb 99aa <_sk_load_tables_u16_be_avx+0x2d6>
.byte 196,129,123,16,84,72,16 // vmovsd 0x10(%r8,%r9,2),%xmm2
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 116,72 // je 99bf <_sk_load_tables_u16_be_avx+0x2e3>
+ .byte 116,72 // je 99b7 <_sk_load_tables_u16_be_avx+0x2e3>
.byte 196,129,105,22,84,72,24 // vmovhpd 0x18(%r8,%r9,2),%xmm2,%xmm2
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,59 // jb 99bf <_sk_load_tables_u16_be_avx+0x2e3>
+ .byte 114,59 // jb 99b7 <_sk_load_tables_u16_be_avx+0x2e3>
.byte 196,129,123,16,92,72,32 // vmovsd 0x20(%r8,%r9,2),%xmm3
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 15,132,126,253,255,255 // je 9713 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 15,132,126,253,255,255 // je 970b <_sk_load_tables_u16_be_avx+0x37>
.byte 196,129,97,22,92,72,40 // vmovhpd 0x28(%r8,%r9,2),%xmm3,%xmm3
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 15,130,109,253,255,255 // jb 9713 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 15,130,109,253,255,255 // jb 970b <_sk_load_tables_u16_be_avx+0x37>
.byte 196,1,122,126,76,72,48 // vmovq 0x30(%r8,%r9,2),%xmm9
- .byte 233,97,253,255,255 // jmpq 9713 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,97,253,255,255 // jmpq 970b <_sk_load_tables_u16_be_avx+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,84,253,255,255 // jmpq 9713 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,84,253,255,255 // jmpq 970b <_sk_load_tables_u16_be_avx+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,75,253,255,255 // jmpq 9713 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,75,253,255,255 // jmpq 970b <_sk_load_tables_u16_be_avx+0x37>
HIDDEN _sk_load_tables_rgb_u16_be_avx
.globl _sk_load_tables_rgb_u16_be_avx
@@ -18950,7 +18946,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 72,133,255 // test %rdi,%rdi
.byte 197,252,17,124,36,200 // vmovups %ymm7,-0x38(%rsp)
.byte 197,252,17,116,36,168 // vmovups %ymm6,-0x58(%rsp)
- .byte 15,133,72,2,0,0 // jne 9c2e <_sk_load_tables_rgb_u16_be_avx+0x266>
+ .byte 15,133,72,2,0,0 // jne 9c26 <_sk_load_tables_rgb_u16_be_avx+0x266>
.byte 196,1,122,111,28,72 // vmovdqu (%r8,%r9,2),%xmm11
.byte 196,129,122,111,92,72,12 // vmovdqu 0xc(%r8,%r9,2),%xmm3
.byte 196,129,122,111,84,72,24 // vmovdqu 0x18(%r8,%r9,2),%xmm2
@@ -18971,7 +18967,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 197,185,108,211 // vpunpcklqdq %xmm3,%xmm8,%xmm2
.byte 197,57,109,219 // vpunpckhqdq %xmm3,%xmm8,%xmm11
.byte 197,113,108,192 // vpunpcklqdq %xmm0,%xmm1,%xmm8
- .byte 197,121,111,13,63,50,2,0 // vmovdqa 0x2323f(%rip),%xmm9 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,121,111,13,39,50,2,0 // vmovdqa 0x23227(%rip),%xmm9 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 196,193,105,219,193 // vpand %xmm9,%xmm2,%xmm0
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -19061,7 +19057,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 196,195,105,33,211,48 // vinsertps $0x30,%xmm11,%xmm2,%xmm2
.byte 196,227,109,24,211,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,248,37,2,0 // vbroadcastss 0x225f8(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,180,46,2,0 // vbroadcastss 0x22eb4(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,16,116,36,168 // vmovups -0x58(%rsp),%ymm6
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
.byte 255,224 // jmpq *%rax
@@ -19069,70 +19065,70 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 196,1,121,196,92,72,4,2 // vpinsrw $0x2,0x4(%r8,%r9,2),%xmm0,%xmm11
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,32 // jne 9c67 <_sk_load_tables_rgb_u16_be_avx+0x29f>
+ .byte 117,32 // jne 9c5f <_sk_load_tables_rgb_u16_be_avx+0x29f>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
- .byte 233,180,253,255,255 // jmpq 9a1b <_sk_load_tables_rgb_u16_be_avx+0x53>
+ .byte 233,180,253,255,255 // jmpq 9a13 <_sk_load_tables_rgb_u16_be_avx+0x53>
.byte 196,129,121,110,68,72,6 // vmovd 0x6(%r8,%r9,2),%xmm0
.byte 196,1,121,196,68,72,10,2 // vpinsrw $0x2,0xa(%r8,%r9,2),%xmm0,%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,49 // jb 9cb2 <_sk_load_tables_rgb_u16_be_avx+0x2ea>
+ .byte 114,49 // jb 9caa <_sk_load_tables_rgb_u16_be_avx+0x2ea>
.byte 196,129,121,110,68,72,12 // vmovd 0xc(%r8,%r9,2),%xmm0
.byte 196,129,121,196,92,72,16,2 // vpinsrw $0x2,0x10(%r8,%r9,2),%xmm0,%xmm3
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 117,50 // jne 9ccd <_sk_load_tables_rgb_u16_be_avx+0x305>
+ .byte 117,50 // jne 9cc5 <_sk_load_tables_rgb_u16_be_avx+0x305>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
- .byte 233,105,253,255,255 // jmpq 9a1b <_sk_load_tables_rgb_u16_be_avx+0x53>
+ .byte 233,105,253,255,255 // jmpq 9a13 <_sk_load_tables_rgb_u16_be_avx+0x53>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
- .byte 233,78,253,255,255 // jmpq 9a1b <_sk_load_tables_rgb_u16_be_avx+0x53>
+ .byte 233,78,253,255,255 // jmpq 9a13 <_sk_load_tables_rgb_u16_be_avx+0x53>
.byte 196,129,121,110,68,72,18 // vmovd 0x12(%r8,%r9,2),%xmm0
.byte 196,1,121,196,84,72,22,2 // vpinsrw $0x2,0x16(%r8,%r9,2),%xmm0,%xmm10
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,40 // jb 9d0f <_sk_load_tables_rgb_u16_be_avx+0x347>
+ .byte 114,40 // jb 9d07 <_sk_load_tables_rgb_u16_be_avx+0x347>
.byte 196,129,121,110,68,72,24 // vmovd 0x18(%r8,%r9,2),%xmm0
.byte 196,129,121,196,84,72,28,2 // vpinsrw $0x2,0x1c(%r8,%r9,2),%xmm0,%xmm2
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 117,32 // jne 9d21 <_sk_load_tables_rgb_u16_be_avx+0x359>
+ .byte 117,32 // jne 9d19 <_sk_load_tables_rgb_u16_be_avx+0x359>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
- .byte 233,12,253,255,255 // jmpq 9a1b <_sk_load_tables_rgb_u16_be_avx+0x53>
+ .byte 233,12,253,255,255 // jmpq 9a13 <_sk_load_tables_rgb_u16_be_avx+0x53>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
- .byte 233,250,252,255,255 // jmpq 9a1b <_sk_load_tables_rgb_u16_be_avx+0x53>
+ .byte 233,250,252,255,255 // jmpq 9a13 <_sk_load_tables_rgb_u16_be_avx+0x53>
.byte 196,129,121,110,68,72,30 // vmovd 0x1e(%r8,%r9,2),%xmm0
.byte 196,1,121,196,100,72,34,2 // vpinsrw $0x2,0x22(%r8,%r9,2),%xmm0,%xmm12
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 114,25 // jb 9d54 <_sk_load_tables_rgb_u16_be_avx+0x38c>
+ .byte 114,25 // jb 9d4c <_sk_load_tables_rgb_u16_be_avx+0x38c>
.byte 196,129,121,110,68,72,36 // vmovd 0x24(%r8,%r9,2),%xmm0
.byte 196,129,121,196,68,72,40,2 // vpinsrw $0x2,0x28(%r8,%r9,2),%xmm0,%xmm0
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
- .byte 233,199,252,255,255 // jmpq 9a1b <_sk_load_tables_rgb_u16_be_avx+0x53>
+ .byte 233,199,252,255,255 // jmpq 9a13 <_sk_load_tables_rgb_u16_be_avx+0x53>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
- .byte 233,190,252,255,255 // jmpq 9a1b <_sk_load_tables_rgb_u16_be_avx+0x53>
+ .byte 233,190,252,255,255 // jmpq 9a13 <_sk_load_tables_rgb_u16_be_avx+0x53>
HIDDEN _sk_byte_tables_avx
.globl _sk_byte_tables_avx
FUNCTION(_sk_byte_tables_avx)
_sk_byte_tables_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,220,36,2,0 // vbroadcastss 0x224dc(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,152,45,2,0 // vbroadcastss 0x22d98(%rip),%ymm8 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,200 // vmovq %xmm9,%r8
@@ -19251,7 +19247,7 @@ _sk_byte_tables_avx:
.byte 196,194,121,49,204 // vpmovzxbd %xmm12,%xmm1
.byte 196,194,121,49,213 // vpmovzxbd %xmm13,%xmm2
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- .byte 196,98,125,24,13,202,34,2,0 // vbroadcastss 0x222ca(%rip),%ymm9 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,13,134,43,2,0 // vbroadcastss 0x22b86(%rip),%ymm9 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -19367,7 +19363,7 @@ _sk_byte_tables_rgb_avx:
.byte 196,194,121,49,203 // vpmovzxbd %xmm11,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,167,32,2,0 // vbroadcastss 0x220a7(%rip),%ymm9 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,13,99,41,2,0 // vbroadcastss 0x22963(%rip),%ymm9 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,121,49,202 // vpmovzxbd %xmm10,%xmm1
.byte 196,194,121,49,212 // vpmovzxbd %xmm12,%xmm2
@@ -19604,36 +19600,36 @@ _sk_parametric_r_avx:
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11
- .byte 196,98,125,24,37,56,29,2,0 // vbroadcastss 0x21d38(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,98,125,24,37,244,37,2,0 // vbroadcastss 0x225f4(%rip),%ymm12 # 2cb60 <_sk_overlay_sse2_8bit+0xd9c>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,46,29,2,0 // vbroadcastss 0x21d2e(%rip),%ymm12 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,234,37,2,0 // vbroadcastss 0x225ea(%rip),%ymm12 # 2cb64 <_sk_overlay_sse2_8bit+0xda0>
.byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,132,28,2,0 // vbroadcastss 0x21c84(%rip),%ymm12 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,37,64,37,2,0 // vbroadcastss 0x22540(%rip),%ymm12 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,22,29,2,0 // vbroadcastss 0x21d16(%rip),%ymm12 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,37,210,37,2,0 // vbroadcastss 0x225d2(%rip),%ymm12 # 2cb68 <_sk_overlay_sse2_8bit+0xda4>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,12,29,2,0 // vbroadcastss 0x21d0c(%rip),%ymm12 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,37,200,37,2,0 // vbroadcastss 0x225c8(%rip),%ymm12 # 2cb6c <_sk_overlay_sse2_8bit+0xda8>
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,253,28,2,0 // vbroadcastss 0x21cfd(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,185,37,2,0 // vbroadcastss 0x225b9(%rip),%ymm12 # 2cb70 <_sk_overlay_sse2_8bit+0xdac>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,243,28,2,0 // vbroadcastss 0x21cf3(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,175,37,2,0 // vbroadcastss 0x225af(%rip),%ymm12 # 2cb74 <_sk_overlay_sse2_8bit+0xdb0>
.byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
.byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,215,28,2,0 // vbroadcastss 0x21cd7(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,147,37,2,0 // vbroadcastss 0x22593(%rip),%ymm11 # 2cb78 <_sk_overlay_sse2_8bit+0xdb4>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,205,28,2,0 // vbroadcastss 0x21ccd(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,137,37,2,0 // vbroadcastss 0x22589(%rip),%ymm11 # 2cb7c <_sk_overlay_sse2_8bit+0xdb8>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,190,28,2,0 // vbroadcastss 0x21cbe(%rip),%ymm11 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,98,125,24,29,122,37,2,0 // vbroadcastss 0x2257a(%rip),%ymm11 # 2cb80 <_sk_overlay_sse2_8bit+0xdbc>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,180,28,2,0 // vbroadcastss 0x21cb4(%rip),%ymm11 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,29,112,37,2,0 // vbroadcastss 0x22570(%rip),%ymm11 # 2cb84 <_sk_overlay_sse2_8bit+0xdc0>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,165,28,2,0 // vbroadcastss 0x21ca5(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,97,37,2,0 // vbroadcastss 0x22561(%rip),%ymm10 # 2cb88 <_sk_overlay_sse2_8bit+0xdc4>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19641,7 +19637,7 @@ _sk_parametric_r_avx:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,188,27,2,0 // vbroadcastss 0x21bbc(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,120,36,2,0 // vbroadcastss 0x22478(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19663,36 +19659,36 @@ _sk_parametric_g_avx:
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11
- .byte 196,98,125,24,37,253,27,2,0 // vbroadcastss 0x21bfd(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,98,125,24,37,185,36,2,0 // vbroadcastss 0x224b9(%rip),%ymm12 # 2cb60 <_sk_overlay_sse2_8bit+0xd9c>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,243,27,2,0 // vbroadcastss 0x21bf3(%rip),%ymm12 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,175,36,2,0 // vbroadcastss 0x224af(%rip),%ymm12 # 2cb64 <_sk_overlay_sse2_8bit+0xda0>
.byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,73,27,2,0 // vbroadcastss 0x21b49(%rip),%ymm12 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,37,5,36,2,0 // vbroadcastss 0x22405(%rip),%ymm12 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,219,27,2,0 // vbroadcastss 0x21bdb(%rip),%ymm12 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,37,151,36,2,0 // vbroadcastss 0x22497(%rip),%ymm12 # 2cb68 <_sk_overlay_sse2_8bit+0xda4>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,209,27,2,0 // vbroadcastss 0x21bd1(%rip),%ymm12 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,37,141,36,2,0 // vbroadcastss 0x2248d(%rip),%ymm12 # 2cb6c <_sk_overlay_sse2_8bit+0xda8>
.byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,194,27,2,0 // vbroadcastss 0x21bc2(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,126,36,2,0 // vbroadcastss 0x2247e(%rip),%ymm12 # 2cb70 <_sk_overlay_sse2_8bit+0xdac>
.byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,184,27,2,0 // vbroadcastss 0x21bb8(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,116,36,2,0 // vbroadcastss 0x22474(%rip),%ymm12 # 2cb74 <_sk_overlay_sse2_8bit+0xdb0>
.byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1
.byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1
.byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,156,27,2,0 // vbroadcastss 0x21b9c(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,88,36,2,0 // vbroadcastss 0x22458(%rip),%ymm11 # 2cb78 <_sk_overlay_sse2_8bit+0xdb4>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,146,27,2,0 // vbroadcastss 0x21b92(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,78,36,2,0 // vbroadcastss 0x2244e(%rip),%ymm11 # 2cb7c <_sk_overlay_sse2_8bit+0xdb8>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,131,27,2,0 // vbroadcastss 0x21b83(%rip),%ymm11 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,98,125,24,29,63,36,2,0 // vbroadcastss 0x2243f(%rip),%ymm11 # 2cb80 <_sk_overlay_sse2_8bit+0xdbc>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,121,27,2,0 // vbroadcastss 0x21b79(%rip),%ymm11 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,29,53,36,2,0 // vbroadcastss 0x22435(%rip),%ymm11 # 2cb84 <_sk_overlay_sse2_8bit+0xdc0>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,106,27,2,0 // vbroadcastss 0x21b6a(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,38,36,2,0 // vbroadcastss 0x22426(%rip),%ymm10 # 2cb88 <_sk_overlay_sse2_8bit+0xdc4>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19700,7 +19696,7 @@ _sk_parametric_g_avx:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,129,26,2,0 // vbroadcastss 0x21a81(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,61,35,2,0 // vbroadcastss 0x2233d(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19722,36 +19718,36 @@ _sk_parametric_b_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11
- .byte 196,98,125,24,37,194,26,2,0 // vbroadcastss 0x21ac2(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,98,125,24,37,126,35,2,0 // vbroadcastss 0x2237e(%rip),%ymm12 # 2cb60 <_sk_overlay_sse2_8bit+0xd9c>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,184,26,2,0 // vbroadcastss 0x21ab8(%rip),%ymm12 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,116,35,2,0 // vbroadcastss 0x22374(%rip),%ymm12 # 2cb64 <_sk_overlay_sse2_8bit+0xda0>
.byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,14,26,2,0 // vbroadcastss 0x21a0e(%rip),%ymm12 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,37,202,34,2,0 // vbroadcastss 0x222ca(%rip),%ymm12 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,160,26,2,0 // vbroadcastss 0x21aa0(%rip),%ymm12 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,37,92,35,2,0 // vbroadcastss 0x2235c(%rip),%ymm12 # 2cb68 <_sk_overlay_sse2_8bit+0xda4>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,150,26,2,0 // vbroadcastss 0x21a96(%rip),%ymm12 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,37,82,35,2,0 // vbroadcastss 0x22352(%rip),%ymm12 # 2cb6c <_sk_overlay_sse2_8bit+0xda8>
.byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,135,26,2,0 // vbroadcastss 0x21a87(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,67,35,2,0 // vbroadcastss 0x22343(%rip),%ymm12 # 2cb70 <_sk_overlay_sse2_8bit+0xdac>
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,125,26,2,0 // vbroadcastss 0x21a7d(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,57,35,2,0 // vbroadcastss 0x22339(%rip),%ymm12 # 2cb74 <_sk_overlay_sse2_8bit+0xdb0>
.byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2
.byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,97,26,2,0 // vbroadcastss 0x21a61(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,29,35,2,0 // vbroadcastss 0x2231d(%rip),%ymm11 # 2cb78 <_sk_overlay_sse2_8bit+0xdb4>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,87,26,2,0 // vbroadcastss 0x21a57(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,19,35,2,0 // vbroadcastss 0x22313(%rip),%ymm11 # 2cb7c <_sk_overlay_sse2_8bit+0xdb8>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,72,26,2,0 // vbroadcastss 0x21a48(%rip),%ymm11 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,98,125,24,29,4,35,2,0 // vbroadcastss 0x22304(%rip),%ymm11 # 2cb80 <_sk_overlay_sse2_8bit+0xdbc>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,62,26,2,0 // vbroadcastss 0x21a3e(%rip),%ymm11 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,29,250,34,2,0 // vbroadcastss 0x222fa(%rip),%ymm11 # 2cb84 <_sk_overlay_sse2_8bit+0xdc0>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,47,26,2,0 // vbroadcastss 0x21a2f(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,235,34,2,0 // vbroadcastss 0x222eb(%rip),%ymm10 # 2cb88 <_sk_overlay_sse2_8bit+0xdc4>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19759,7 +19755,7 @@ _sk_parametric_b_avx:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,70,25,2,0 // vbroadcastss 0x21946(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,2,34,2,0 // vbroadcastss 0x22202(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19781,36 +19777,36 @@ _sk_parametric_a_avx:
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11
- .byte 196,98,125,24,37,135,25,2,0 // vbroadcastss 0x21987(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,98,125,24,37,67,34,2,0 // vbroadcastss 0x22243(%rip),%ymm12 # 2cb60 <_sk_overlay_sse2_8bit+0xd9c>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,125,25,2,0 // vbroadcastss 0x2197d(%rip),%ymm12 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,57,34,2,0 // vbroadcastss 0x22239(%rip),%ymm12 # 2cb64 <_sk_overlay_sse2_8bit+0xda0>
.byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,211,24,2,0 // vbroadcastss 0x218d3(%rip),%ymm12 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,37,143,33,2,0 // vbroadcastss 0x2218f(%rip),%ymm12 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,101,25,2,0 // vbroadcastss 0x21965(%rip),%ymm12 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,37,33,34,2,0 // vbroadcastss 0x22221(%rip),%ymm12 # 2cb68 <_sk_overlay_sse2_8bit+0xda4>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,91,25,2,0 // vbroadcastss 0x2195b(%rip),%ymm12 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,37,23,34,2,0 // vbroadcastss 0x22217(%rip),%ymm12 # 2cb6c <_sk_overlay_sse2_8bit+0xda8>
.byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,76,25,2,0 // vbroadcastss 0x2194c(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,8,34,2,0 // vbroadcastss 0x22208(%rip),%ymm12 # 2cb70 <_sk_overlay_sse2_8bit+0xdac>
.byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,66,25,2,0 // vbroadcastss 0x21942(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,254,33,2,0 // vbroadcastss 0x221fe(%rip),%ymm12 # 2cb74 <_sk_overlay_sse2_8bit+0xdb0>
.byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3
.byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3
.byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,38,25,2,0 // vbroadcastss 0x21926(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,226,33,2,0 // vbroadcastss 0x221e2(%rip),%ymm11 # 2cb78 <_sk_overlay_sse2_8bit+0xdb4>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,28,25,2,0 // vbroadcastss 0x2191c(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,216,33,2,0 // vbroadcastss 0x221d8(%rip),%ymm11 # 2cb7c <_sk_overlay_sse2_8bit+0xdb8>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,13,25,2,0 // vbroadcastss 0x2190d(%rip),%ymm11 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,98,125,24,29,201,33,2,0 // vbroadcastss 0x221c9(%rip),%ymm11 # 2cb80 <_sk_overlay_sse2_8bit+0xdbc>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,3,25,2,0 // vbroadcastss 0x21903(%rip),%ymm11 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,29,191,33,2,0 // vbroadcastss 0x221bf(%rip),%ymm11 # 2cb84 <_sk_overlay_sse2_8bit+0xdc0>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,244,24,2,0 // vbroadcastss 0x218f4(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,176,33,2,0 // vbroadcastss 0x221b0(%rip),%ymm10 # 2cb88 <_sk_overlay_sse2_8bit+0xdc4>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19818,7 +19814,7 @@ _sk_parametric_a_avx:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,11,24,2,0 // vbroadcastss 0x2180b(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,199,32,2,0 // vbroadcastss 0x220c7(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19837,34 +19833,34 @@ _sk_gamma_avx:
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,91,200 // vcvtdq2ps %ymm0,%ymm1
- .byte 196,98,125,24,5,94,24,2,0 // vbroadcastss 0x2185e(%rip),%ymm8 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,98,125,24,5,26,33,2,0 // vbroadcastss 0x2211a(%rip),%ymm8 # 2cb60 <_sk_overlay_sse2_8bit+0xd9c>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,84,24,2,0 // vbroadcastss 0x21854(%rip),%ymm9 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,13,16,33,2,0 // vbroadcastss 0x22110(%rip),%ymm9 # 2cb64 <_sk_overlay_sse2_8bit+0xda0>
.byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
- .byte 196,226,125,24,37,170,23,2,0 // vbroadcastss 0x217aa(%rip),%ymm4 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,226,125,24,37,102,32,2,0 // vbroadcastss 0x22066(%rip),%ymm4 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 197,252,86,196 // vorps %ymm4,%ymm0,%ymm0
- .byte 196,98,125,24,21,61,24,2,0 // vbroadcastss 0x2183d(%rip),%ymm10 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,21,249,32,2,0 // vbroadcastss 0x220f9(%rip),%ymm10 # 2cb68 <_sk_overlay_sse2_8bit+0xda4>
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,29,51,24,2,0 // vbroadcastss 0x21833(%rip),%ymm11 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,29,239,32,2,0 // vbroadcastss 0x220ef(%rip),%ymm11 # 2cb6c <_sk_overlay_sse2_8bit+0xda8>
.byte 196,193,124,89,211 // vmulps %ymm11,%ymm0,%ymm2
.byte 197,244,92,202 // vsubps %ymm2,%ymm1,%ymm1
- .byte 196,98,125,24,37,37,24,2,0 // vbroadcastss 0x21825(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,225,32,2,0 // vbroadcastss 0x220e1(%rip),%ymm12 # 2cb70 <_sk_overlay_sse2_8bit+0xdac>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,45,27,24,2,0 // vbroadcastss 0x2181b(%rip),%ymm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,45,215,32,2,0 // vbroadcastss 0x220d7(%rip),%ymm13 # 2cb74 <_sk_overlay_sse2_8bit+0xdb0>
.byte 197,148,94,192 // vdivps %ymm0,%ymm13,%ymm0
.byte 197,244,92,192 // vsubps %ymm0,%ymm1,%ymm0
.byte 196,98,125,24,48 // vbroadcastss (%rax),%ymm14
.byte 196,193,124,89,198 // vmulps %ymm14,%ymm0,%ymm0
.byte 196,227,125,8,200,1 // vroundps $0x1,%ymm0,%ymm1
.byte 197,252,92,241 // vsubps %ymm1,%ymm0,%ymm6
- .byte 196,98,125,24,61,250,23,2,0 // vbroadcastss 0x217fa(%rip),%ymm15 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,61,182,32,2,0 // vbroadcastss 0x220b6(%rip),%ymm15 # 2cb78 <_sk_overlay_sse2_8bit+0xdb4>
.byte 196,193,124,88,199 // vaddps %ymm15,%ymm0,%ymm0
- .byte 196,226,125,24,29,240,23,2,0 // vbroadcastss 0x217f0(%rip),%ymm3 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,226,125,24,29,172,32,2,0 // vbroadcastss 0x220ac(%rip),%ymm3 # 2cb7c <_sk_overlay_sse2_8bit+0xdb8>
.byte 197,204,89,203 // vmulps %ymm3,%ymm6,%ymm1
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
- .byte 196,226,125,24,21,227,23,2,0 // vbroadcastss 0x217e3(%rip),%ymm2 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,226,125,24,21,159,32,2,0 // vbroadcastss 0x2209f(%rip),%ymm2 # 2cb80 <_sk_overlay_sse2_8bit+0xdbc>
.byte 197,236,92,198 // vsubps %ymm6,%ymm2,%ymm0
- .byte 196,226,125,24,53,218,23,2,0 // vbroadcastss 0x217da(%rip),%ymm6 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,226,125,24,53,150,32,2,0 // vbroadcastss 0x22096(%rip),%ymm6 # 2cb84 <_sk_overlay_sse2_8bit+0xdc0>
.byte 197,204,94,192 // vdivps %ymm0,%ymm6,%ymm0
.byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
@@ -19906,7 +19902,7 @@ _sk_gamma_avx:
.byte 197,236,92,212 // vsubps %ymm4,%ymm2,%ymm2
.byte 197,204,94,210 // vdivps %ymm2,%ymm6,%ymm2
.byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,29,23,2,0 // vbroadcastss 0x2171d(%rip),%ymm2 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,226,125,24,21,217,31,2,0 // vbroadcastss 0x21fd9(%rip),%ymm2 # 2cb88 <_sk_overlay_sse2_8bit+0xdc4>
.byte 197,236,89,92,36,128 // vmulps -0x80(%rsp),%ymm2,%ymm3
.byte 197,252,89,226 // vmulps %ymm2,%ymm0,%ymm4
.byte 197,244,89,210 // vmulps %ymm2,%ymm1,%ymm2
@@ -19926,31 +19922,31 @@ HIDDEN _sk_lab_to_xyz_avx
.globl _sk_lab_to_xyz_avx
FUNCTION(_sk_lab_to_xyz_avx)
_sk_lab_to_xyz_avx:
- .byte 196,98,125,24,5,217,22,2,0 // vbroadcastss 0x216d9(%rip),%ymm8 # 2c2d8 <_sk_overlay_sse2_8bit+0x500>
+ .byte 196,98,125,24,5,149,31,2,0 // vbroadcastss 0x21f95(%rip),%ymm8 # 2cb8c <_sk_overlay_sse2_8bit+0xdc8>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,55,22,2,0 // vbroadcastss 0x21637(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,243,30,2,0 // vbroadcastss 0x21ef3(%rip),%ymm8 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,193,22,2,0 // vbroadcastss 0x216c1(%rip),%ymm9 # 2c2dc <_sk_overlay_sse2_8bit+0x504>
+ .byte 196,98,125,24,13,125,31,2,0 // vbroadcastss 0x21f7d(%rip),%ymm9 # 2cb90 <_sk_overlay_sse2_8bit+0xdcc>
.byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2
- .byte 196,98,125,24,5,173,22,2,0 // vbroadcastss 0x216ad(%rip),%ymm8 # 2c2e0 <_sk_overlay_sse2_8bit+0x508>
+ .byte 196,98,125,24,5,105,31,2,0 // vbroadcastss 0x21f69(%rip),%ymm8 # 2cb94 <_sk_overlay_sse2_8bit+0xdd0>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,163,22,2,0 // vbroadcastss 0x216a3(%rip),%ymm8 # 2c2e4 <_sk_overlay_sse2_8bit+0x50c>
+ .byte 196,98,125,24,5,95,31,2,0 // vbroadcastss 0x21f5f(%rip),%ymm8 # 2cb98 <_sk_overlay_sse2_8bit+0xdd4>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,153,22,2,0 // vbroadcastss 0x21699(%rip),%ymm8 # 2c2e8 <_sk_overlay_sse2_8bit+0x510>
+ .byte 196,98,125,24,5,85,31,2,0 // vbroadcastss 0x21f55(%rip),%ymm8 # 2cb9c <_sk_overlay_sse2_8bit+0xdd8>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1
- .byte 196,98,125,24,5,139,22,2,0 // vbroadcastss 0x2168b(%rip),%ymm8 # 2c2ec <_sk_overlay_sse2_8bit+0x514>
+ .byte 196,98,125,24,5,71,31,2,0 // vbroadcastss 0x21f47(%rip),%ymm8 # 2cba0 <_sk_overlay_sse2_8bit+0xddc>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2
.byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8
.byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8
- .byte 196,98,125,24,13,116,22,2,0 // vbroadcastss 0x21674(%rip),%ymm9 # 2c2f0 <_sk_overlay_sse2_8bit+0x518>
+ .byte 196,98,125,24,13,48,31,2,0 // vbroadcastss 0x21f30(%rip),%ymm9 # 2cba4 <_sk_overlay_sse2_8bit+0xde0>
.byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,105,22,2,0 // vbroadcastss 0x21669(%rip),%ymm11 # 2c2f4 <_sk_overlay_sse2_8bit+0x51c>
+ .byte 196,98,125,24,29,37,31,2,0 // vbroadcastss 0x21f25(%rip),%ymm11 # 2cba8 <_sk_overlay_sse2_8bit+0xde4>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,37,95,22,2,0 // vbroadcastss 0x2165f(%rip),%ymm12 # 2c2f8 <_sk_overlay_sse2_8bit+0x520>
+ .byte 196,98,125,24,37,27,31,2,0 // vbroadcastss 0x21f1b(%rip),%ymm12 # 2cbac <_sk_overlay_sse2_8bit+0xde8>
.byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1
.byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -19965,9 +19961,9 @@ _sk_lab_to_xyz_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2
.byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- .byte 196,226,125,24,5,21,22,2,0 // vbroadcastss 0x21615(%rip),%ymm0 # 2c2fc <_sk_overlay_sse2_8bit+0x524>
+ .byte 196,226,125,24,5,209,30,2,0 // vbroadcastss 0x21ed1(%rip),%ymm0 # 2cbb0 <_sk_overlay_sse2_8bit+0xdec>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,12,22,2,0 // vbroadcastss 0x2160c(%rip),%ymm8 # 2c300 <_sk_overlay_sse2_8bit+0x528>
+ .byte 196,98,125,24,5,200,30,2,0 // vbroadcastss 0x21ec8(%rip),%ymm8 # 2cbb4 <_sk_overlay_sse2_8bit+0xdf0>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19983,15 +19979,15 @@ _sk_load_a8_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,66 // jne ad57 <_sk_load_a8_avx+0x5a>
+ .byte 117,66 // jne ad4f <_sk_load_a8_avx+0x5a>
.byte 196,130,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm0
- .byte 197,249,219,5,109,31,2,0 // vpand 0x21f6d(%rip),%xmm0,%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,249,219,5,85,31,2,0 // vpand 0x21f55(%rip),%xmm0,%xmm0 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,73,21,2,0 // vbroadcastss 0x21549(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,5,30,2,0 // vbroadcastss 0x21e05(%rip),%ymm1 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -20003,15 +19999,15 @@ _sk_load_a8_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,176 // ja ad1b <_sk_load_a8_avx+0x1e>
+ .byte 119,176 // ja ad13 <_sk_load_a8_avx+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # adf0 <_sk_load_a8_avx+0xf3>
+ .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # ade8 <_sk_load_a8_avx+0xf3>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,145 // jmp ad1b <_sk_load_a8_avx+0x1e>
+ .byte 235,145 // jmp ad13 <_sk_load_a8_avx+0x1e>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -20019,7 +20015,7 @@ _sk_load_a8_avx:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,105,255,255,255 // jmpq ad1b <_sk_load_a8_avx+0x1e>
+ .byte 233,105,255,255,255 // jmpq ad13 <_sk_load_a8_avx+0x1e>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -20030,7 +20026,7 @@ _sk_load_a8_avx:
.byte 196,129,121,110,12,24 // vmovd (%r8,%r11,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,46,255,255,255 // jmpq ad1b <_sk_load_a8_avx+0x1e>
+ .byte 233,46,255,255,255 // jmpq ad13 <_sk_load_a8_avx+0x1e>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -20063,15 +20059,15 @@ _sk_load_a8_dst_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,66 // jne ae66 <_sk_load_a8_dst_avx+0x5a>
+ .byte 117,66 // jne ae5e <_sk_load_a8_dst_avx+0x5a>
.byte 196,130,121,48,36,24 // vpmovzxbw (%r8,%r11,1),%xmm4
- .byte 197,217,219,37,94,30,2,0 // vpand 0x21e5e(%rip),%xmm4,%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,217,219,37,70,30,2,0 // vpand 0x21e46(%rip),%xmm4,%xmm4 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,58,20,2,0 // vbroadcastss 0x2143a(%rip),%ymm5 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,45,246,28,2,0 // vbroadcastss 0x21cf6(%rip),%ymm5 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -20083,15 +20079,15 @@ _sk_load_a8_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,176 // ja ae2a <_sk_load_a8_dst_avx+0x1e>
+ .byte 119,176 // ja ae22 <_sk_load_a8_dst_avx+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # aefc <_sk_load_a8_dst_avx+0xf0>
+ .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # aef4 <_sk_load_a8_dst_avx+0xf0>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,145 // jmp ae2a <_sk_load_a8_dst_avx+0x1e>
+ .byte 235,145 // jmp ae22 <_sk_load_a8_dst_avx+0x1e>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -20099,7 +20095,7 @@ _sk_load_a8_dst_avx:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,105,255,255,255 // jmpq ae2a <_sk_load_a8_dst_avx+0x1e>
+ .byte 233,105,255,255,255 // jmpq ae22 <_sk_load_a8_dst_avx+0x1e>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -20110,7 +20106,7 @@ _sk_load_a8_dst_avx:
.byte 196,129,121,110,44,24 // vmovd (%r8,%r11,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,46,255,255,255 // jmpq ae2a <_sk_load_a8_dst_avx+0x1e>
+ .byte 233,46,255,255,255 // jmpq ae22 <_sk_load_a8_dst_avx+0x1e>
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -20179,7 +20175,7 @@ _sk_gather_a8_avx:
.byte 196,226,121,49,201 // vpmovzxbd %xmm1,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,161,18,2,0 // vbroadcastss 0x212a1(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,93,27,2,0 // vbroadcastss 0x21b5d(%rip),%ymm1 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -20201,14 +20197,14 @@ _sk_store_a8_avx:
.byte 77,15,175,193 // imul %r9,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,34,18,2,0 // vbroadcastss 0x21222(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,222,26,2,0 // vbroadcastss 0x21ade(%rip),%ymm8 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne b04b <_sk_store_a8_avx+0x45>
+ .byte 117,10 // jne b043 <_sk_store_a8_avx+0x45>
.byte 196,1,123,17,4,24 // vmovsd %xmm8,(%r8,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -20216,25 +20212,25 @@ _sk_store_a8_avx:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja b047 <_sk_store_a8_avx+0x41>
+ .byte 119,236 // ja b03f <_sk_store_a8_avx+0x41>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,85,0,0,0 // lea 0x55(%rip),%r10 # b0c0 <_sk_store_a8_avx+0xba>
+ .byte 76,141,21,85,0,0,0 // lea 0x55(%rip),%r10 # b0b8 <_sk_store_a8_avx+0xba>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,3,121,20,4,24,0 // vpextrb $0x0,%xmm8,(%r8,%r11,1)
- .byte 235,202 // jmp b047 <_sk_store_a8_avx+0x41>
+ .byte 235,202 // jmp b03f <_sk_store_a8_avx+0x41>
.byte 196,3,121,20,68,24,2,4 // vpextrb $0x4,%xmm8,0x2(%r8,%r11,1)
- .byte 196,98,57,0,5,18,28,2,0 // vpshufb 0x21c12(%rip),%xmm8,%xmm8 # 2cca0 <_sk_overlay_sse2_8bit+0xec8>
+ .byte 196,98,57,0,5,250,27,2,0 // vpshufb 0x21bfa(%rip),%xmm8,%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0xebc>
.byte 196,3,121,21,4,24,0 // vpextrw $0x0,%xmm8,(%r8,%r11,1)
- .byte 235,176 // jmp b047 <_sk_store_a8_avx+0x41>
+ .byte 235,176 // jmp b03f <_sk_store_a8_avx+0x41>
.byte 196,3,121,20,68,24,6,12 // vpextrb $0xc,%xmm8,0x6(%r8,%r11,1)
.byte 196,3,121,20,68,24,5,10 // vpextrb $0xa,%xmm8,0x5(%r8,%r11,1)
.byte 196,3,121,20,68,24,4,8 // vpextrb $0x8,%xmm8,0x4(%r8,%r11,1)
- .byte 196,98,57,0,5,248,27,2,0 // vpshufb 0x21bf8(%rip),%xmm8,%xmm8 # 2ccb0 <_sk_overlay_sse2_8bit+0xed8>
+ .byte 196,98,57,0,5,224,27,2,0 // vpshufb 0x21be0(%rip),%xmm8,%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0xecc>
.byte 196,1,121,126,4,24 // vmovd %xmm8,(%r8,%r11,1)
- .byte 235,135 // jmp b047 <_sk_store_a8_avx+0x41>
+ .byte 235,135 // jmp b03f <_sk_store_a8_avx+0x41>
.byte 180,255 // mov $0xff,%ah
.byte 255 // (bad)
.byte 255,197 // inc %ebp
@@ -20266,18 +20262,18 @@ _sk_load_g8_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,71 // jne b13b <_sk_load_g8_avx+0x5f>
+ .byte 117,71 // jne b133 <_sk_load_g8_avx+0x5f>
.byte 196,130,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm0
- .byte 197,249,219,5,142,27,2,0 // vpand 0x21b8e(%rip),%xmm0,%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,249,219,5,118,27,2,0 // vpand 0x21b76(%rip),%xmm0,%xmm0 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,106,17,2,0 // vbroadcastss 0x2116a(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,38,26,2,0 // vbroadcastss 0x21a26(%rip),%ymm1 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,231,16,2,0 // vbroadcastss 0x210e7(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,163,25,2,0 // vbroadcastss 0x219a3(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -20286,15 +20282,15 @@ _sk_load_g8_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,171 // ja b0fa <_sk_load_g8_avx+0x1e>
+ .byte 119,171 // ja b0f2 <_sk_load_g8_avx+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # b1d4 <_sk_load_g8_avx+0xf8>
+ .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # b1cc <_sk_load_g8_avx+0xf8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,140 // jmp b0fa <_sk_load_g8_avx+0x1e>
+ .byte 235,140 // jmp b0f2 <_sk_load_g8_avx+0x1e>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -20302,7 +20298,7 @@ _sk_load_g8_avx:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,100,255,255,255 // jmpq b0fa <_sk_load_g8_avx+0x1e>
+ .byte 233,100,255,255,255 // jmpq b0f2 <_sk_load_g8_avx+0x1e>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -20313,7 +20309,7 @@ _sk_load_g8_avx:
.byte 196,129,121,110,12,24 // vmovd (%r8,%r11,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,41,255,255,255 // jmpq b0fa <_sk_load_g8_avx+0x1e>
+ .byte 233,41,255,255,255 // jmpq b0f2 <_sk_load_g8_avx+0x1e>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -20346,18 +20342,18 @@ _sk_load_g8_dst_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,71 // jne b24f <_sk_load_g8_dst_avx+0x5f>
+ .byte 117,71 // jne b247 <_sk_load_g8_dst_avx+0x5f>
.byte 196,130,121,48,36,24 // vpmovzxbw (%r8,%r11,1),%xmm4
- .byte 197,217,219,37,122,26,2,0 // vpand 0x21a7a(%rip),%xmm4,%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 197,217,219,37,98,26,2,0 // vpand 0x21a62(%rip),%xmm4,%xmm4 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,86,16,2,0 // vbroadcastss 0x21056(%rip),%ymm5 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,45,18,25,2,0 // vbroadcastss 0x21912(%rip),%ymm5 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,211,15,2,0 // vbroadcastss 0x20fd3(%rip),%ymm7 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,61,143,24,2,0 // vbroadcastss 0x2188f(%rip),%ymm7 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 255,224 // jmpq *%rax
@@ -20366,15 +20362,15 @@ _sk_load_g8_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,171 // ja b20e <_sk_load_g8_dst_avx+0x1e>
+ .byte 119,171 // ja b206 <_sk_load_g8_dst_avx+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # b2e8 <_sk_load_g8_dst_avx+0xf8>
+ .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # b2e0 <_sk_load_g8_dst_avx+0xf8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,140 // jmp b20e <_sk_load_g8_dst_avx+0x1e>
+ .byte 235,140 // jmp b206 <_sk_load_g8_dst_avx+0x1e>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -20382,7 +20378,7 @@ _sk_load_g8_dst_avx:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,100,255,255,255 // jmpq b20e <_sk_load_g8_dst_avx+0x1e>
+ .byte 233,100,255,255,255 // jmpq b206 <_sk_load_g8_dst_avx+0x1e>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -20393,7 +20389,7 @@ _sk_load_g8_dst_avx:
.byte 196,129,121,110,44,24 // vmovd (%r8,%r11,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,41,255,255,255 // jmpq b20e <_sk_load_g8_dst_avx+0x1e>
+ .byte 233,41,255,255,255 // jmpq b206 <_sk_load_g8_dst_avx+0x1e>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -20463,10 +20459,10 @@ _sk_gather_g8_avx:
.byte 196,226,121,49,201 // vpmovzxbd %xmm1,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,181,14,2,0 // vbroadcastss 0x20eb5(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,113,23,2,0 // vbroadcastss 0x21771(%rip),%ymm1 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,50,14,2,0 // vbroadcastss 0x20e32(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,238,22,2,0 // vbroadcastss 0x216ee(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -20487,56 +20483,56 @@ _sk_load_565_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,128,0,0,0 // jne b496 <_sk_load_565_avx+0x9f>
+ .byte 15,133,128,0,0,0 // jne b48e <_sk_load_565_avx+0x9f>
.byte 196,129,122,111,4,88 // vmovdqu (%r8,%r11,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,88,14,2,0 // vbroadcastss 0x20e58(%rip),%ymm0 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,226,125,24,5,20,23,2,0 // vbroadcastss 0x21714(%rip),%ymm0 # 2cb44 <_sk_overlay_sse2_8bit+0xd80>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,75,14,2,0 // vbroadcastss 0x20e4b(%rip),%ymm1 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,226,125,24,13,7,23,2,0 // vbroadcastss 0x21707(%rip),%ymm1 # 2cb48 <_sk_overlay_sse2_8bit+0xd84>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,66,14,2,0 // vbroadcastss 0x20e42(%rip),%ymm1 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,226,125,24,13,254,22,2,0 // vbroadcastss 0x216fe(%rip),%ymm1 # 2cb4c <_sk_overlay_sse2_8bit+0xd88>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,53,14,2,0 // vbroadcastss 0x20e35(%rip),%ymm3 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,226,125,24,29,241,22,2,0 // vbroadcastss 0x216f1(%rip),%ymm3 # 2cb50 <_sk_overlay_sse2_8bit+0xd8c>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,44,14,2,0 // vbroadcastss 0x20e2c(%rip),%ymm3 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,226,125,24,29,232,22,2,0 // vbroadcastss 0x216e8(%rip),%ymm3 # 2cb54 <_sk_overlay_sse2_8bit+0xd90>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,31,14,2,0 // vbroadcastss 0x20e1f(%rip),%ymm3 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,226,125,24,29,219,22,2,0 // vbroadcastss 0x216db(%rip),%ymm3 # 2cb58 <_sk_overlay_sse2_8bit+0xd94>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,132,13,2,0 // vbroadcastss 0x20d84(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,64,22,2,0 // vbroadcastss 0x21640(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,110,255,255,255 // ja b41c <_sk_load_565_avx+0x25>
+ .byte 15,135,110,255,255,255 // ja b414 <_sk_load_565_avx+0x25>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,99,0,0,0 // lea 0x63(%rip),%r10 # b51c <_sk_load_565_avx+0x125>
+ .byte 76,141,21,99,0,0,0 // lea 0x63(%rip),%r10 # b514 <_sk_load_565_avx+0x125>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,76,255,255,255 // jmpq b41c <_sk_load_565_avx+0x25>
+ .byte 233,76,255,255,255 // jmpq b414 <_sk_load_565_avx+0x25>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,129,121,196,68,88,4,2 // vpinsrw $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,121,110,12,88 // vmovd (%r8,%r11,2),%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,47,255,255,255 // jmpq b41c <_sk_load_565_avx+0x25>
+ .byte 233,47,255,255,255 // jmpq b414 <_sk_load_565_avx+0x25>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,129,121,196,68,88,12,6 // vpinsrw $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,121,196,68,88,10,5 // vpinsrw $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,121,196,68,88,8,4 // vpinsrw $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,122,126,12,88 // vmovq (%r8,%r11,2),%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,2,255,255,255 // jmpq b41c <_sk_load_565_avx+0x25>
+ .byte 233,2,255,255,255 // jmpq b414 <_sk_load_565_avx+0x25>
.byte 102,144 // xchg %ax,%ax
.byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -20569,56 +20565,56 @@ _sk_load_565_dst_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,128,0,0,0 // jne b5d7 <_sk_load_565_dst_avx+0x9f>
+ .byte 15,133,128,0,0,0 // jne b5cf <_sk_load_565_dst_avx+0x9f>
.byte 196,129,122,111,36,88 // vmovdqu (%r8,%r11,2),%xmm4
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,245,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- .byte 196,226,125,24,37,23,13,2,0 // vbroadcastss 0x20d17(%rip),%ymm4 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,226,125,24,37,211,21,2,0 // vbroadcastss 0x215d3(%rip),%ymm4 # 2cb44 <_sk_overlay_sse2_8bit+0xd80>
.byte 197,204,84,228 // vandps %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,10,13,2,0 // vbroadcastss 0x20d0a(%rip),%ymm5 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,226,125,24,45,198,21,2,0 // vbroadcastss 0x215c6(%rip),%ymm5 # 2cb48 <_sk_overlay_sse2_8bit+0xd84>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,1,13,2,0 // vbroadcastss 0x20d01(%rip),%ymm5 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,226,125,24,45,189,21,2,0 // vbroadcastss 0x215bd(%rip),%ymm5 # 2cb4c <_sk_overlay_sse2_8bit+0xd88>
.byte 197,204,84,237 // vandps %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,244,12,2,0 // vbroadcastss 0x20cf4(%rip),%ymm7 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,226,125,24,61,176,21,2,0 // vbroadcastss 0x215b0(%rip),%ymm7 # 2cb50 <_sk_overlay_sse2_8bit+0xd8c>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,24,61,235,12,2,0 // vbroadcastss 0x20ceb(%rip),%ymm7 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,226,125,24,61,167,21,2,0 // vbroadcastss 0x215a7(%rip),%ymm7 # 2cb54 <_sk_overlay_sse2_8bit+0xd90>
.byte 197,204,84,247 // vandps %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,222,12,2,0 // vbroadcastss 0x20cde(%rip),%ymm7 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,226,125,24,61,154,21,2,0 // vbroadcastss 0x2159a(%rip),%ymm7 # 2cb58 <_sk_overlay_sse2_8bit+0xd94>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,67,12,2,0 // vbroadcastss 0x20c43(%rip),%ymm7 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,61,255,20,2,0 // vbroadcastss 0x214ff(%rip),%ymm7 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,110,255,255,255 // ja b55d <_sk_load_565_dst_avx+0x25>
+ .byte 15,135,110,255,255,255 // ja b555 <_sk_load_565_dst_avx+0x25>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,98,0,0,0 // lea 0x62(%rip),%r10 # b65c <_sk_load_565_dst_avx+0x124>
+ .byte 76,141,21,98,0,0,0 // lea 0x62(%rip),%r10 # b654 <_sk_load_565_dst_avx+0x124>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,76,255,255,255 // jmpq b55d <_sk_load_565_dst_avx+0x25>
+ .byte 233,76,255,255,255 // jmpq b555 <_sk_load_565_dst_avx+0x25>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,129,89,196,100,88,4,2 // vpinsrw $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,121,110,44,88 // vmovd (%r8,%r11,2),%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,47,255,255,255 // jmpq b55d <_sk_load_565_dst_avx+0x25>
+ .byte 233,47,255,255,255 // jmpq b555 <_sk_load_565_dst_avx+0x25>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,129,89,196,100,88,12,6 // vpinsrw $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,89,196,100,88,10,5 // vpinsrw $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,89,196,100,88,8,4 // vpinsrw $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,122,126,44,88 // vmovq (%r8,%r11,2),%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,2,255,255,255 // jmpq b55d <_sk_load_565_dst_avx+0x25>
+ .byte 233,2,255,255,255 // jmpq b555 <_sk_load_565_dst_avx+0x25>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -20693,23 +20689,23 @@ _sk_gather_565_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,62,11,2,0 // vbroadcastss 0x20b3e(%rip),%ymm0 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,226,125,24,5,250,19,2,0 // vbroadcastss 0x213fa(%rip),%ymm0 # 2cb44 <_sk_overlay_sse2_8bit+0xd80>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,49,11,2,0 // vbroadcastss 0x20b31(%rip),%ymm1 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,226,125,24,13,237,19,2,0 // vbroadcastss 0x213ed(%rip),%ymm1 # 2cb48 <_sk_overlay_sse2_8bit+0xd84>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,40,11,2,0 // vbroadcastss 0x20b28(%rip),%ymm1 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,226,125,24,13,228,19,2,0 // vbroadcastss 0x213e4(%rip),%ymm1 # 2cb4c <_sk_overlay_sse2_8bit+0xd88>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,27,11,2,0 // vbroadcastss 0x20b1b(%rip),%ymm3 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,226,125,24,29,215,19,2,0 // vbroadcastss 0x213d7(%rip),%ymm3 # 2cb50 <_sk_overlay_sse2_8bit+0xd8c>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,18,11,2,0 // vbroadcastss 0x20b12(%rip),%ymm3 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,226,125,24,29,206,19,2,0 // vbroadcastss 0x213ce(%rip),%ymm3 # 2cb54 <_sk_overlay_sse2_8bit+0xd90>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,5,11,2,0 // vbroadcastss 0x20b05(%rip),%ymm3 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,226,125,24,29,193,19,2,0 // vbroadcastss 0x213c1(%rip),%ymm3 # 2cb58 <_sk_overlay_sse2_8bit+0xd94>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,106,10,2,0 // vbroadcastss 0x20a6a(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,38,19,2,0 // vbroadcastss 0x21326(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
.byte 65,94 // pop %r14
@@ -20728,14 +20724,14 @@ _sk_store_565_avx:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,45,11,2,0 // vbroadcastss 0x20b2d(%rip),%ymm8 # 2c304 <_sk_overlay_sse2_8bit+0x52c>
+ .byte 196,98,125,24,5,233,19,2,0 // vbroadcastss 0x213e9(%rip),%ymm8 # 2cbb8 <_sk_overlay_sse2_8bit+0xdf4>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
.byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- .byte 196,98,125,24,21,6,11,2,0 // vbroadcastss 0x20b06(%rip),%ymm10 # 2c308 <_sk_overlay_sse2_8bit+0x530>
+ .byte 196,98,125,24,21,194,19,2,0 // vbroadcastss 0x213c2(%rip),%ymm10 # 2cbbc <_sk_overlay_sse2_8bit+0xdf8>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11
@@ -20749,7 +20745,7 @@ _sk_store_565_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne b852 <_sk_store_565_avx+0x9a>
+ .byte 117,10 // jne b84a <_sk_store_565_avx+0x9a>
.byte 196,1,122,127,4,88 // vmovdqu %xmm8,(%r8,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -20757,22 +20753,22 @@ _sk_store_565_avx:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja b84e <_sk_store_565_avx+0x96>
+ .byte 119,236 // ja b846 <_sk_store_565_avx+0x96>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,67,0,0,0 // lea 0x43(%rip),%r10 # b8b0 <_sk_store_565_avx+0xf8>
+ .byte 76,141,21,67,0,0,0 // lea 0x43(%rip),%r10 # b8a8 <_sk_store_565_avx+0xf8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,3,121,21,4,88,0 // vpextrw $0x0,%xmm8,(%r8,%r11,2)
- .byte 235,207 // jmp b84e <_sk_store_565_avx+0x96>
+ .byte 235,207 // jmp b846 <_sk_store_565_avx+0x96>
.byte 196,3,121,21,68,88,4,2 // vpextrw $0x2,%xmm8,0x4(%r8,%r11,2)
.byte 196,1,121,126,4,88 // vmovd %xmm8,(%r8,%r11,2)
- .byte 235,191 // jmp b84e <_sk_store_565_avx+0x96>
+ .byte 235,191 // jmp b846 <_sk_store_565_avx+0x96>
.byte 196,3,121,21,68,88,12,6 // vpextrw $0x6,%xmm8,0xc(%r8,%r11,2)
.byte 196,3,121,21,68,88,10,5 // vpextrw $0x5,%xmm8,0xa(%r8,%r11,2)
.byte 196,3,121,21,68,88,8,4 // vpextrw $0x4,%xmm8,0x8(%r8,%r11,2)
.byte 196,1,121,214,4,88 // vmovq %xmm8,(%r8,%r11,2)
- .byte 235,159 // jmp b84e <_sk_store_565_avx+0x96>
+ .byte 235,159 // jmp b846 <_sk_store_565_avx+0x96>
.byte 144 // nop
.byte 198 // (bad)
.byte 255 // (bad)
@@ -20810,31 +20806,31 @@ _sk_load_4444_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,152,0,0,0 // jne b983 <_sk_load_4444_avx+0xb7>
+ .byte 15,133,152,0,0,0 // jne b97b <_sk_load_4444_avx+0xb7>
.byte 196,129,122,111,4,88 // vmovdqu (%r8,%r11,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,255,9,2,0 // vbroadcastss 0x209ff(%rip),%ymm0 # 2c30c <_sk_overlay_sse2_8bit+0x534>
+ .byte 196,226,125,24,5,187,18,2,0 // vbroadcastss 0x212bb(%rip),%ymm0 # 2cbc0 <_sk_overlay_sse2_8bit+0xdfc>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,242,9,2,0 // vbroadcastss 0x209f2(%rip),%ymm1 # 2c310 <_sk_overlay_sse2_8bit+0x538>
+ .byte 196,226,125,24,13,174,18,2,0 // vbroadcastss 0x212ae(%rip),%ymm1 # 2cbc4 <_sk_overlay_sse2_8bit+0xe00>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,233,9,2,0 // vbroadcastss 0x209e9(%rip),%ymm1 # 2c314 <_sk_overlay_sse2_8bit+0x53c>
+ .byte 196,226,125,24,13,165,18,2,0 // vbroadcastss 0x212a5(%rip),%ymm1 # 2cbc8 <_sk_overlay_sse2_8bit+0xe04>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,220,9,2,0 // vbroadcastss 0x209dc(%rip),%ymm2 # 2c318 <_sk_overlay_sse2_8bit+0x540>
+ .byte 196,226,125,24,21,152,18,2,0 // vbroadcastss 0x21298(%rip),%ymm2 # 2cbcc <_sk_overlay_sse2_8bit+0xe08>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,211,9,2,0 // vbroadcastss 0x209d3(%rip),%ymm2 # 2c31c <_sk_overlay_sse2_8bit+0x544>
+ .byte 196,226,125,24,21,143,18,2,0 // vbroadcastss 0x2128f(%rip),%ymm2 # 2cbd0 <_sk_overlay_sse2_8bit+0xe0c>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,198,9,2,0 // vbroadcastss 0x209c6(%rip),%ymm8 # 2c320 <_sk_overlay_sse2_8bit+0x548>
+ .byte 196,98,125,24,5,130,18,2,0 // vbroadcastss 0x21282(%rip),%ymm8 # 2cbd4 <_sk_overlay_sse2_8bit+0xe10>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,188,9,2,0 // vbroadcastss 0x209bc(%rip),%ymm8 # 2c324 <_sk_overlay_sse2_8bit+0x54c>
+ .byte 196,98,125,24,5,120,18,2,0 // vbroadcastss 0x21278(%rip),%ymm8 # 2cbd8 <_sk_overlay_sse2_8bit+0xe14>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,174,9,2,0 // vbroadcastss 0x209ae(%rip),%ymm8 # 2c328 <_sk_overlay_sse2_8bit+0x550>
+ .byte 196,98,125,24,5,106,18,2,0 // vbroadcastss 0x2126a(%rip),%ymm8 # 2cbdc <_sk_overlay_sse2_8bit+0xe18>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -20843,27 +20839,27 @@ _sk_load_4444_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,86,255,255,255 // ja b8f1 <_sk_load_4444_avx+0x25>
+ .byte 15,135,86,255,255,255 // ja b8e9 <_sk_load_4444_avx+0x25>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,98,0,0,0 // lea 0x62(%rip),%r10 # ba08 <_sk_load_4444_avx+0x13c>
+ .byte 76,141,21,98,0,0,0 // lea 0x62(%rip),%r10 # ba00 <_sk_load_4444_avx+0x13c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,52,255,255,255 // jmpq b8f1 <_sk_load_4444_avx+0x25>
+ .byte 233,52,255,255,255 // jmpq b8e9 <_sk_load_4444_avx+0x25>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,129,121,196,68,88,4,2 // vpinsrw $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,121,110,12,88 // vmovd (%r8,%r11,2),%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,23,255,255,255 // jmpq b8f1 <_sk_load_4444_avx+0x25>
+ .byte 233,23,255,255,255 // jmpq b8e9 <_sk_load_4444_avx+0x25>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,129,121,196,68,88,12,6 // vpinsrw $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,121,196,68,88,10,5 // vpinsrw $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,121,196,68,88,8,4 // vpinsrw $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
.byte 196,129,122,126,12,88 // vmovq (%r8,%r11,2),%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,234,254,255,255 // jmpq b8f1 <_sk_load_4444_avx+0x25>
+ .byte 233,234,254,255,255 // jmpq b8e9 <_sk_load_4444_avx+0x25>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -20897,31 +20893,31 @@ _sk_load_4444_dst_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,152,0,0,0 // jne badb <_sk_load_4444_dst_avx+0xb7>
+ .byte 15,133,152,0,0,0 // jne bad3 <_sk_load_4444_dst_avx+0xb7>
.byte 196,129,122,111,36,88 // vmovdqu (%r8,%r11,2),%xmm4
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,253,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- .byte 196,226,125,24,37,167,8,2,0 // vbroadcastss 0x208a7(%rip),%ymm4 # 2c30c <_sk_overlay_sse2_8bit+0x534>
+ .byte 196,226,125,24,37,99,17,2,0 // vbroadcastss 0x21163(%rip),%ymm4 # 2cbc0 <_sk_overlay_sse2_8bit+0xdfc>
.byte 197,196,84,228 // vandps %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,154,8,2,0 // vbroadcastss 0x2089a(%rip),%ymm5 # 2c310 <_sk_overlay_sse2_8bit+0x538>
+ .byte 196,226,125,24,45,86,17,2,0 // vbroadcastss 0x21156(%rip),%ymm5 # 2cbc4 <_sk_overlay_sse2_8bit+0xe00>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,145,8,2,0 // vbroadcastss 0x20891(%rip),%ymm5 # 2c314 <_sk_overlay_sse2_8bit+0x53c>
+ .byte 196,226,125,24,45,77,17,2,0 // vbroadcastss 0x2114d(%rip),%ymm5 # 2cbc8 <_sk_overlay_sse2_8bit+0xe04>
.byte 197,196,84,237 // vandps %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,132,8,2,0 // vbroadcastss 0x20884(%rip),%ymm6 # 2c318 <_sk_overlay_sse2_8bit+0x540>
+ .byte 196,226,125,24,53,64,17,2,0 // vbroadcastss 0x21140(%rip),%ymm6 # 2cbcc <_sk_overlay_sse2_8bit+0xe08>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,24,53,123,8,2,0 // vbroadcastss 0x2087b(%rip),%ymm6 # 2c31c <_sk_overlay_sse2_8bit+0x544>
+ .byte 196,226,125,24,53,55,17,2,0 // vbroadcastss 0x21137(%rip),%ymm6 # 2cbd0 <_sk_overlay_sse2_8bit+0xe0c>
.byte 197,196,84,246 // vandps %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,110,8,2,0 // vbroadcastss 0x2086e(%rip),%ymm8 # 2c320 <_sk_overlay_sse2_8bit+0x548>
+ .byte 196,98,125,24,5,42,17,2,0 // vbroadcastss 0x2112a(%rip),%ymm8 # 2cbd4 <_sk_overlay_sse2_8bit+0xe10>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,24,5,100,8,2,0 // vbroadcastss 0x20864(%rip),%ymm8 # 2c324 <_sk_overlay_sse2_8bit+0x54c>
+ .byte 196,98,125,24,5,32,17,2,0 // vbroadcastss 0x21120(%rip),%ymm8 # 2cbd8 <_sk_overlay_sse2_8bit+0xe14>
.byte 196,193,68,84,248 // vandps %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,86,8,2,0 // vbroadcastss 0x20856(%rip),%ymm8 # 2c328 <_sk_overlay_sse2_8bit+0x550>
+ .byte 196,98,125,24,5,18,17,2,0 // vbroadcastss 0x21112(%rip),%ymm8 # 2cbdc <_sk_overlay_sse2_8bit+0xe18>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -20930,27 +20926,27 @@ _sk_load_4444_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,86,255,255,255 // ja ba49 <_sk_load_4444_dst_avx+0x25>
+ .byte 15,135,86,255,255,255 // ja ba41 <_sk_load_4444_dst_avx+0x25>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,98,0,0,0 // lea 0x62(%rip),%r10 # bb60 <_sk_load_4444_dst_avx+0x13c>
+ .byte 76,141,21,98,0,0,0 // lea 0x62(%rip),%r10 # bb58 <_sk_load_4444_dst_avx+0x13c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,52,255,255,255 // jmpq ba49 <_sk_load_4444_dst_avx+0x25>
+ .byte 233,52,255,255,255 // jmpq ba41 <_sk_load_4444_dst_avx+0x25>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,129,89,196,100,88,4,2 // vpinsrw $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,121,110,44,88 // vmovd (%r8,%r11,2),%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,23,255,255,255 // jmpq ba49 <_sk_load_4444_dst_avx+0x25>
+ .byte 233,23,255,255,255 // jmpq ba41 <_sk_load_4444_dst_avx+0x25>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,129,89,196,100,88,12,6 // vpinsrw $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,89,196,100,88,10,5 // vpinsrw $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,89,196,100,88,8,4 // vpinsrw $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
.byte 196,129,122,126,44,88 // vmovq (%r8,%r11,2),%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,234,254,255,255 // jmpq ba49 <_sk_load_4444_dst_avx+0x25>
+ .byte 233,234,254,255,255 // jmpq ba41 <_sk_load_4444_dst_avx+0x25>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -21025,25 +21021,25 @@ _sk_gather_4444_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,182,6,2,0 // vbroadcastss 0x206b6(%rip),%ymm0 # 2c30c <_sk_overlay_sse2_8bit+0x534>
+ .byte 196,226,125,24,5,114,15,2,0 // vbroadcastss 0x20f72(%rip),%ymm0 # 2cbc0 <_sk_overlay_sse2_8bit+0xdfc>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,169,6,2,0 // vbroadcastss 0x206a9(%rip),%ymm1 # 2c310 <_sk_overlay_sse2_8bit+0x538>
+ .byte 196,226,125,24,13,101,15,2,0 // vbroadcastss 0x20f65(%rip),%ymm1 # 2cbc4 <_sk_overlay_sse2_8bit+0xe00>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,160,6,2,0 // vbroadcastss 0x206a0(%rip),%ymm1 # 2c314 <_sk_overlay_sse2_8bit+0x53c>
+ .byte 196,226,125,24,13,92,15,2,0 // vbroadcastss 0x20f5c(%rip),%ymm1 # 2cbc8 <_sk_overlay_sse2_8bit+0xe04>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,147,6,2,0 // vbroadcastss 0x20693(%rip),%ymm2 # 2c318 <_sk_overlay_sse2_8bit+0x540>
+ .byte 196,226,125,24,21,79,15,2,0 // vbroadcastss 0x20f4f(%rip),%ymm2 # 2cbcc <_sk_overlay_sse2_8bit+0xe08>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,138,6,2,0 // vbroadcastss 0x2068a(%rip),%ymm2 # 2c31c <_sk_overlay_sse2_8bit+0x544>
+ .byte 196,226,125,24,21,70,15,2,0 // vbroadcastss 0x20f46(%rip),%ymm2 # 2cbd0 <_sk_overlay_sse2_8bit+0xe0c>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,125,6,2,0 // vbroadcastss 0x2067d(%rip),%ymm8 # 2c320 <_sk_overlay_sse2_8bit+0x548>
+ .byte 196,98,125,24,5,57,15,2,0 // vbroadcastss 0x20f39(%rip),%ymm8 # 2cbd4 <_sk_overlay_sse2_8bit+0xe10>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,115,6,2,0 // vbroadcastss 0x20673(%rip),%ymm8 # 2c324 <_sk_overlay_sse2_8bit+0x54c>
+ .byte 196,98,125,24,5,47,15,2,0 // vbroadcastss 0x20f2f(%rip),%ymm8 # 2cbd8 <_sk_overlay_sse2_8bit+0xe14>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,101,6,2,0 // vbroadcastss 0x20665(%rip),%ymm8 # 2c328 <_sk_overlay_sse2_8bit+0x550>
+ .byte 196,98,125,24,5,33,15,2,0 // vbroadcastss 0x20f21(%rip),%ymm8 # 2cbdc <_sk_overlay_sse2_8bit+0xe18>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -21064,7 +21060,7 @@ _sk_store_4444_avx:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,57,6,2,0 // vbroadcastss 0x20639(%rip),%ymm8 # 2c32c <_sk_overlay_sse2_8bit+0x554>
+ .byte 196,98,125,24,5,245,14,2,0 // vbroadcastss 0x20ef5(%rip),%ymm8 # 2cbe0 <_sk_overlay_sse2_8bit+0xe1c>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10
@@ -21091,7 +21087,7 @@ _sk_store_4444_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne bd8c <_sk_store_4444_avx+0xb8>
+ .byte 117,10 // jne bd84 <_sk_store_4444_avx+0xb8>
.byte 196,1,122,127,4,88 // vmovdqu %xmm8,(%r8,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -21099,22 +21095,22 @@ _sk_store_4444_avx:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja bd88 <_sk_store_4444_avx+0xb4>
+ .byte 119,236 // ja bd80 <_sk_store_4444_avx+0xb4>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,69,0,0,0 // lea 0x45(%rip),%r10 # bdec <_sk_store_4444_avx+0x118>
+ .byte 76,141,21,69,0,0,0 // lea 0x45(%rip),%r10 # bde4 <_sk_store_4444_avx+0x118>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,3,121,21,4,88,0 // vpextrw $0x0,%xmm8,(%r8,%r11,2)
- .byte 235,207 // jmp bd88 <_sk_store_4444_avx+0xb4>
+ .byte 235,207 // jmp bd80 <_sk_store_4444_avx+0xb4>
.byte 196,3,121,21,68,88,4,2 // vpextrw $0x2,%xmm8,0x4(%r8,%r11,2)
.byte 196,1,121,126,4,88 // vmovd %xmm8,(%r8,%r11,2)
- .byte 235,191 // jmp bd88 <_sk_store_4444_avx+0xb4>
+ .byte 235,191 // jmp bd80 <_sk_store_4444_avx+0xb4>
.byte 196,3,121,21,68,88,12,6 // vpextrw $0x6,%xmm8,0xc(%r8,%r11,2)
.byte 196,3,121,21,68,88,10,5 // vpextrw $0x5,%xmm8,0xa(%r8,%r11,2)
.byte 196,3,121,21,68,88,8,4 // vpextrw $0x4,%xmm8,0x8(%r8,%r11,2)
.byte 196,1,121,214,4,88 // vmovq %xmm8,(%r8,%r11,2)
- .byte 235,159 // jmp bd88 <_sk_store_4444_avx+0xb4>
+ .byte 235,159 // jmp bd80 <_sk_store_4444_avx+0xb4>
.byte 15,31,0 // nopl (%rax)
.byte 196 // (bad)
.byte 255 // (bad)
@@ -21152,12 +21148,12 @@ _sk_load_8888_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,135,0,0,0 // jne beaf <_sk_load_8888_avx+0xa7>
+ .byte 15,133,135,0,0,0 // jne bea7 <_sk_load_8888_avx+0xa7>
.byte 196,1,125,16,12,152 // vmovupd (%r8,%r11,4),%ymm9
- .byte 197,125,40,21,42,9,2,0 // vmovapd 0x2092a(%rip),%ymm10 # 2c760 <_sk_overlay_sse2_8bit+0x988>
+ .byte 197,125,40,21,114,7,2,0 // vmovapd 0x20772(%rip),%ymm10 # 2c5a0 <_sk_overlay_sse2_8bit+0x7dc>
.byte 196,193,53,84,194 // vandpd %ymm10,%ymm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,68,4,2,0 // vbroadcastss 0x20444(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,0,13,2,0 // vbroadcastss 0x20d00(%rip),%ymm8 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,193,113,114,209,8 // vpsrld $0x8,%xmm9,%xmm1
.byte 196,99,125,25,203,1 // vextractf128 $0x1,%ymm9,%xmm3
@@ -21184,21 +21180,21 @@ _sk_load_8888_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,102,255,255,255 // ja be2e <_sk_load_8888_avx+0x26>
+ .byte 15,135,102,255,255,255 // ja be26 <_sk_load_8888_avx+0x26>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,145,0,0,0 // lea 0x91(%rip),%r10 # bf64 <_sk_load_8888_avx+0x15c>
+ .byte 76,141,21,145,0,0,0 // lea 0x91(%rip),%r10 # bf5c <_sk_load_8888_avx+0x15c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,122,16,12,152 // vmovss (%r8,%r11,4),%xmm9
- .byte 233,71,255,255,255 // jmpq be2e <_sk_load_8888_avx+0x26>
+ .byte 233,71,255,255,255 // jmpq be26 <_sk_load_8888_avx+0x26>
.byte 196,129,121,110,68,152,8 // vmovd 0x8(%r8,%r11,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,99,117,12,200,4 // vblendps $0x4,%ymm0,%ymm1,%ymm9
.byte 196,129,123,16,4,152 // vmovsd (%r8,%r11,4),%xmm0
.byte 196,99,53,13,200,1 // vblendpd $0x1,%ymm0,%ymm9,%ymm9
- .byte 233,32,255,255,255 // jmpq be2e <_sk_load_8888_avx+0x26>
+ .byte 233,32,255,255,255 // jmpq be26 <_sk_load_8888_avx+0x26>
.byte 196,129,121,110,68,152,24 // vmovd 0x18(%r8,%r11,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -21212,9 +21208,9 @@ _sk_load_8888_avx:
.byte 196,99,53,24,200,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
.byte 196,129,121,16,4,152 // vmovupd (%r8,%r11,4),%xmm0
.byte 196,67,125,13,201,12 // vblendpd $0xc,%ymm9,%ymm0,%ymm9
- .byte 233,203,254,255,255 // jmpq be2e <_sk_load_8888_avx+0x26>
+ .byte 233,203,254,255,255 // jmpq be26 <_sk_load_8888_avx+0x26>
.byte 144 // nop
- .byte 120,255 // js bf65 <_sk_load_8888_avx+0x15d>
+ .byte 120,255 // js bf5d <_sk_load_8888_avx+0x15d>
.byte 255 // (bad)
.byte 255,153,255,255,255,131 // lcall *-0x7c000001(%rcx)
.byte 255 // (bad)
@@ -21247,12 +21243,12 @@ _sk_load_8888_dst_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,135,0,0,0 // jne c027 <_sk_load_8888_dst_avx+0xa7>
+ .byte 15,133,135,0,0,0 // jne c01f <_sk_load_8888_dst_avx+0xa7>
.byte 196,1,125,16,12,152 // vmovupd (%r8,%r11,4),%ymm9
- .byte 197,125,40,21,210,7,2,0 // vmovapd 0x207d2(%rip),%ymm10 # 2c780 <_sk_overlay_sse2_8bit+0x9a8>
+ .byte 197,125,40,21,26,6,2,0 // vmovapd 0x2061a(%rip),%ymm10 # 2c5c0 <_sk_overlay_sse2_8bit+0x7fc>
.byte 196,193,53,84,226 // vandpd %ymm10,%ymm9,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,204,2,2,0 // vbroadcastss 0x202cc(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,136,11,2,0 // vbroadcastss 0x20b88(%rip),%ymm8 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 196,193,81,114,209,8 // vpsrld $0x8,%xmm9,%xmm5
.byte 196,99,125,25,207,1 // vextractf128 $0x1,%ymm9,%xmm7
@@ -21279,21 +21275,21 @@ _sk_load_8888_dst_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,102,255,255,255 // ja bfa6 <_sk_load_8888_dst_avx+0x26>
+ .byte 15,135,102,255,255,255 // ja bf9e <_sk_load_8888_dst_avx+0x26>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,145,0,0,0 // lea 0x91(%rip),%r10 # c0dc <_sk_load_8888_dst_avx+0x15c>
+ .byte 76,141,21,145,0,0,0 // lea 0x91(%rip),%r10 # c0d4 <_sk_load_8888_dst_avx+0x15c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,122,16,12,152 // vmovss (%r8,%r11,4),%xmm9
- .byte 233,71,255,255,255 // jmpq bfa6 <_sk_load_8888_dst_avx+0x26>
+ .byte 233,71,255,255,255 // jmpq bf9e <_sk_load_8888_dst_avx+0x26>
.byte 196,129,121,110,100,152,8 // vmovd 0x8(%r8,%r11,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
.byte 196,99,85,12,204,4 // vblendps $0x4,%ymm4,%ymm5,%ymm9
.byte 196,129,123,16,36,152 // vmovsd (%r8,%r11,4),%xmm4
.byte 196,99,53,13,204,1 // vblendpd $0x1,%ymm4,%ymm9,%ymm9
- .byte 233,32,255,255,255 // jmpq bfa6 <_sk_load_8888_dst_avx+0x26>
+ .byte 233,32,255,255,255 // jmpq bf9e <_sk_load_8888_dst_avx+0x26>
.byte 196,129,121,110,100,152,24 // vmovd 0x18(%r8,%r11,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -21307,9 +21303,9 @@ _sk_load_8888_dst_avx:
.byte 196,99,53,24,204,1 // vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
.byte 196,129,121,16,36,152 // vmovupd (%r8,%r11,4),%xmm4
.byte 196,67,93,13,201,12 // vblendpd $0xc,%ymm9,%ymm4,%ymm9
- .byte 233,203,254,255,255 // jmpq bfa6 <_sk_load_8888_dst_avx+0x26>
+ .byte 233,203,254,255,255 // jmpq bf9e <_sk_load_8888_dst_avx+0x26>
.byte 144 // nop
- .byte 120,255 // js c0dd <_sk_load_8888_dst_avx+0x15d>
+ .byte 120,255 // js c0d5 <_sk_load_8888_dst_avx+0x15d>
.byte 255 // (bad)
.byte 255,153,255,255,255,131 // lcall *-0x7c000001(%rcx)
.byte 255 // (bad)
@@ -21371,10 +21367,10 @@ _sk_gather_8888_avx:
.byte 196,131,121,34,4,152,2 // vpinsrd $0x2,(%r8,%r11,4),%xmm0,%xmm0
.byte 196,131,121,34,28,144,3 // vpinsrd $0x3,(%r8,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,21,246,5,2,0 // vmovaps 0x205f6(%rip),%ymm10 # 2c7a0 <_sk_overlay_sse2_8bit+0x9c8>
+ .byte 197,124,40,21,62,4,2,0 // vmovaps 0x2043e(%rip),%ymm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x81c>
.byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,208,0,2,0 // vbroadcastss 0x200d0(%rip),%ymm9 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,13,140,9,2,0 // vbroadcastss 0x2098c(%rip),%ymm9 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1
.byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2
@@ -21411,7 +21407,7 @@ _sk_store_8888_avx:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,0,0,2,0 // vbroadcastss 0x20000(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,188,8,2,0 // vbroadcastss 0x208bc(%rip),%ymm8 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -21436,7 +21432,7 @@ _sk_store_8888_avx:
.byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8
.byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne c2d2 <_sk_store_8888_avx+0xae>
+ .byte 117,10 // jne c2ca <_sk_store_8888_avx+0xae>
.byte 196,1,124,17,4,152 // vmovups %ymm8,(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -21444,17 +21440,17 @@ _sk_store_8888_avx:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja c2ce <_sk_store_8888_avx+0xaa>
+ .byte 119,236 // ja c2c6 <_sk_store_8888_avx+0xaa>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,83,0,0,0 // lea 0x53(%rip),%r10 # c340 <_sk_store_8888_avx+0x11c>
+ .byte 76,141,21,83,0,0,0 // lea 0x53(%rip),%r10 # c338 <_sk_store_8888_avx+0x11c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,121,126,4,152 // vmovd %xmm8,(%r8,%r11,4)
- .byte 235,208 // jmp c2ce <_sk_store_8888_avx+0xaa>
+ .byte 235,208 // jmp c2c6 <_sk_store_8888_avx+0xaa>
.byte 196,3,121,22,68,152,8,2 // vpextrd $0x2,%xmm8,0x8(%r8,%r11,4)
.byte 196,1,121,214,4,152 // vmovq %xmm8,(%r8,%r11,4)
- .byte 235,192 // jmp c2ce <_sk_store_8888_avx+0xaa>
+ .byte 235,192 // jmp c2c6 <_sk_store_8888_avx+0xaa>
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,3,121,22,76,152,24,2 // vpextrd $0x2,%xmm9,0x18(%r8,%r11,4)
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -21462,7 +21458,7 @@ _sk_store_8888_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,1,122,17,76,152,16 // vmovss %xmm9,0x10(%r8,%r11,4)
.byte 196,1,121,17,4,152 // vmovupd %xmm8,(%r8,%r11,4)
- .byte 235,143 // jmp c2ce <_sk_store_8888_avx+0xaa>
+ .byte 235,143 // jmp c2c6 <_sk_store_8888_avx+0xaa>
.byte 144 // nop
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -21497,12 +21493,12 @@ _sk_load_bgra_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,135,0,0,0 // jne c403 <_sk_load_bgra_avx+0xa7>
+ .byte 15,133,135,0,0,0 // jne c3fb <_sk_load_bgra_avx+0xa7>
.byte 196,1,125,16,12,152 // vmovupd (%r8,%r11,4),%ymm9
- .byte 197,125,40,21,54,4,2,0 // vmovapd 0x20436(%rip),%ymm10 # 2c7c0 <_sk_overlay_sse2_8bit+0x9e8>
+ .byte 197,125,40,21,126,2,2,0 // vmovapd 0x2027e(%rip),%ymm10 # 2c600 <_sk_overlay_sse2_8bit+0x83c>
.byte 196,193,53,84,202 // vandpd %ymm10,%ymm9,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,98,125,24,5,240,254,1,0 // vbroadcastss 0x1fef0(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,172,7,2,0 // vbroadcastss 0x207ac(%rip),%ymm8 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,116,89,208 // vmulps %ymm8,%ymm1,%ymm2
.byte 196,193,113,114,209,8 // vpsrld $0x8,%xmm9,%xmm1
.byte 196,99,125,25,203,1 // vextractf128 $0x1,%ymm9,%xmm3
@@ -21529,21 +21525,21 @@ _sk_load_bgra_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,102,255,255,255 // ja c382 <_sk_load_bgra_avx+0x26>
+ .byte 15,135,102,255,255,255 // ja c37a <_sk_load_bgra_avx+0x26>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,145,0,0,0 // lea 0x91(%rip),%r10 # c4b8 <_sk_load_bgra_avx+0x15c>
+ .byte 76,141,21,145,0,0,0 // lea 0x91(%rip),%r10 # c4b0 <_sk_load_bgra_avx+0x15c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,122,16,12,152 // vmovss (%r8,%r11,4),%xmm9
- .byte 233,71,255,255,255 // jmpq c382 <_sk_load_bgra_avx+0x26>
+ .byte 233,71,255,255,255 // jmpq c37a <_sk_load_bgra_avx+0x26>
.byte 196,129,121,110,68,152,8 // vmovd 0x8(%r8,%r11,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,99,117,12,200,4 // vblendps $0x4,%ymm0,%ymm1,%ymm9
.byte 196,129,123,16,4,152 // vmovsd (%r8,%r11,4),%xmm0
.byte 196,99,53,13,200,1 // vblendpd $0x1,%ymm0,%ymm9,%ymm9
- .byte 233,32,255,255,255 // jmpq c382 <_sk_load_bgra_avx+0x26>
+ .byte 233,32,255,255,255 // jmpq c37a <_sk_load_bgra_avx+0x26>
.byte 196,129,121,110,68,152,24 // vmovd 0x18(%r8,%r11,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -21557,9 +21553,9 @@ _sk_load_bgra_avx:
.byte 196,99,53,24,200,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
.byte 196,129,121,16,4,152 // vmovupd (%r8,%r11,4),%xmm0
.byte 196,67,125,13,201,12 // vblendpd $0xc,%ymm9,%ymm0,%ymm9
- .byte 233,203,254,255,255 // jmpq c382 <_sk_load_bgra_avx+0x26>
+ .byte 233,203,254,255,255 // jmpq c37a <_sk_load_bgra_avx+0x26>
.byte 144 // nop
- .byte 120,255 // js c4b9 <_sk_load_bgra_avx+0x15d>
+ .byte 120,255 // js c4b1 <_sk_load_bgra_avx+0x15d>
.byte 255 // (bad)
.byte 255,153,255,255,255,131 // lcall *-0x7c000001(%rcx)
.byte 255 // (bad)
@@ -21592,12 +21588,12 @@ _sk_load_bgra_dst_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,135,0,0,0 // jne c57b <_sk_load_bgra_dst_avx+0xa7>
+ .byte 15,133,135,0,0,0 // jne c573 <_sk_load_bgra_dst_avx+0xa7>
.byte 196,1,125,16,12,152 // vmovupd (%r8,%r11,4),%ymm9
- .byte 197,125,40,21,222,2,2,0 // vmovapd 0x202de(%rip),%ymm10 # 2c7e0 <_sk_overlay_sse2_8bit+0xa08>
+ .byte 197,125,40,21,38,1,2,0 // vmovapd 0x20126(%rip),%ymm10 # 2c620 <_sk_overlay_sse2_8bit+0x85c>
.byte 196,193,53,84,234 // vandpd %ymm10,%ymm9,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,98,125,24,5,120,253,1,0 // vbroadcastss 0x1fd78(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,52,6,2,0 // vbroadcastss 0x20634(%rip),%ymm8 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,84,89,240 // vmulps %ymm8,%ymm5,%ymm6
.byte 196,193,81,114,209,8 // vpsrld $0x8,%xmm9,%xmm5
.byte 196,99,125,25,207,1 // vextractf128 $0x1,%ymm9,%xmm7
@@ -21624,21 +21620,21 @@ _sk_load_bgra_dst_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,102,255,255,255 // ja c4fa <_sk_load_bgra_dst_avx+0x26>
+ .byte 15,135,102,255,255,255 // ja c4f2 <_sk_load_bgra_dst_avx+0x26>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,145,0,0,0 // lea 0x91(%rip),%r10 # c630 <_sk_load_bgra_dst_avx+0x15c>
+ .byte 76,141,21,145,0,0,0 // lea 0x91(%rip),%r10 # c628 <_sk_load_bgra_dst_avx+0x15c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,122,16,12,152 // vmovss (%r8,%r11,4),%xmm9
- .byte 233,71,255,255,255 // jmpq c4fa <_sk_load_bgra_dst_avx+0x26>
+ .byte 233,71,255,255,255 // jmpq c4f2 <_sk_load_bgra_dst_avx+0x26>
.byte 196,129,121,110,100,152,8 // vmovd 0x8(%r8,%r11,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
.byte 196,99,85,12,204,4 // vblendps $0x4,%ymm4,%ymm5,%ymm9
.byte 196,129,123,16,36,152 // vmovsd (%r8,%r11,4),%xmm4
.byte 196,99,53,13,204,1 // vblendpd $0x1,%ymm4,%ymm9,%ymm9
- .byte 233,32,255,255,255 // jmpq c4fa <_sk_load_bgra_dst_avx+0x26>
+ .byte 233,32,255,255,255 // jmpq c4f2 <_sk_load_bgra_dst_avx+0x26>
.byte 196,129,121,110,100,152,24 // vmovd 0x18(%r8,%r11,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -21652,9 +21648,9 @@ _sk_load_bgra_dst_avx:
.byte 196,99,53,24,204,1 // vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
.byte 196,129,121,16,36,152 // vmovupd (%r8,%r11,4),%xmm4
.byte 196,67,93,13,201,12 // vblendpd $0xc,%ymm9,%ymm4,%ymm9
- .byte 233,203,254,255,255 // jmpq c4fa <_sk_load_bgra_dst_avx+0x26>
+ .byte 233,203,254,255,255 // jmpq c4f2 <_sk_load_bgra_dst_avx+0x26>
.byte 144 // nop
- .byte 120,255 // js c631 <_sk_load_bgra_dst_avx+0x15d>
+ .byte 120,255 // js c629 <_sk_load_bgra_dst_avx+0x15d>
.byte 255 // (bad)
.byte 255,153,255,255,255,131 // lcall *-0x7c000001(%rcx)
.byte 255 // (bad)
@@ -21716,10 +21712,10 @@ _sk_gather_bgra_avx:
.byte 196,131,121,34,4,152,2 // vpinsrd $0x2,(%r8,%r11,4),%xmm0,%xmm0
.byte 196,131,121,34,28,144,3 // vpinsrd $0x3,(%r8,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,13,2,1,2,0 // vmovaps 0x20102(%rip),%ymm9 # 2c800 <_sk_overlay_sse2_8bit+0xa28>
+ .byte 197,124,40,13,74,255,1,0 // vmovaps 0x1ff4a(%rip),%ymm9 # 2c640 <_sk_overlay_sse2_8bit+0x87c>
.byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,124,251,1,0 // vbroadcastss 0x1fb7c(%rip),%ymm10 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,21,56,4,2,0 // vbroadcastss 0x20438(%rip),%ymm10 # 2cb40 <_sk_overlay_sse2_8bit+0xd7c>
.byte 196,193,124,89,210 // vmulps %ymm10,%ymm0,%ymm2
.byte 196,193,121,114,208,8 // vpsrld $0x8,%xmm8,%xmm0
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
@@ -21756,7 +21752,7 @@ _sk_store_bgra_avx:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,172,250,1,0 // vbroadcastss 0x1faac(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,104,3,2,0 // vbroadcastss 0x20368(%rip),%ymm8 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -21781,7 +21777,7 @@ _sk_store_bgra_avx:
.byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8
.byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne c826 <_sk_store_bgra_avx+0xae>
+ .byte 117,10 // jne c81e <_sk_store_bgra_avx+0xae>
.byte 196,1,124,17,4,152 // vmovups %ymm8,(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -21789,17 +21785,17 @@ _sk_store_bgra_avx:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja c822 <_sk_store_bgra_avx+0xaa>
+ .byte 119,236 // ja c81a <_sk_store_bgra_avx+0xaa>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,83,0,0,0 // lea 0x53(%rip),%r10 # c894 <_sk_store_bgra_avx+0x11c>
+ .byte 76,141,21,83,0,0,0 // lea 0x53(%rip),%r10 # c88c <_sk_store_bgra_avx+0x11c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,121,126,4,152 // vmovd %xmm8,(%r8,%r11,4)
- .byte 235,208 // jmp c822 <_sk_store_bgra_avx+0xaa>
+ .byte 235,208 // jmp c81a <_sk_store_bgra_avx+0xaa>
.byte 196,3,121,22,68,152,8,2 // vpextrd $0x2,%xmm8,0x8(%r8,%r11,4)
.byte 196,1,121,214,4,152 // vmovq %xmm8,(%r8,%r11,4)
- .byte 235,192 // jmp c822 <_sk_store_bgra_avx+0xaa>
+ .byte 235,192 // jmp c81a <_sk_store_bgra_avx+0xaa>
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,3,121,22,76,152,24,2 // vpextrd $0x2,%xmm9,0x18(%r8,%r11,4)
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -21807,7 +21803,7 @@ _sk_store_bgra_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,1,122,17,76,152,16 // vmovss %xmm9,0x10(%r8,%r11,4)
.byte 196,1,121,17,4,152 // vmovupd %xmm8,(%r8,%r11,4)
- .byte 235,143 // jmp c822 <_sk_store_bgra_avx+0xaa>
+ .byte 235,143 // jmp c81a <_sk_store_bgra_avx+0xaa>
.byte 144 // nop
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -21847,7 +21843,7 @@ _sk_load_f16_avx:
.byte 197,252,17,116,36,192 // vmovups %ymm6,-0x40(%rsp)
.byte 197,252,17,108,36,160 // vmovups %ymm5,-0x60(%rsp)
.byte 197,254,127,100,36,128 // vmovdqu %ymm4,-0x80(%rsp)
- .byte 15,133,145,2,0,0 // jne cb7d <_sk_load_f16_avx+0x2cd>
+ .byte 15,133,145,2,0,0 // jne cb75 <_sk_load_f16_avx+0x2cd>
.byte 196,65,121,16,4,192 // vmovupd (%r8,%rax,8),%xmm8
.byte 196,193,121,16,84,192,16 // vmovupd 0x10(%r8,%rax,8),%xmm2
.byte 196,193,121,16,76,192,32 // vmovupd 0x20(%r8,%rax,8),%xmm1
@@ -21865,13 +21861,13 @@ _sk_load_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,75,250,1,0 // vbroadcastss 0x1fa4b(%rip),%ymm12 # 2c394 <_sk_overlay_sse2_8bit+0x5bc>
+ .byte 196,98,125,24,37,7,3,2,0 // vbroadcastss 0x20307(%rip),%ymm12 # 2cc48 <_sk_overlay_sse2_8bit+0xe84>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,15,250,1,0 // vbroadcastss 0x1fa0f(%rip),%xmm11 # 2c370 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,121,24,29,203,2,2,0 // vbroadcastss 0x202cb(%rip),%xmm11 # 2cc24 <_sk_overlay_sse2_8bit+0xe60>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,41,250,1,0 // vbroadcastss 0x1fa29(%rip),%xmm13 # 2c398 <_sk_overlay_sse2_8bit+0x5c0>
+ .byte 196,98,121,24,45,229,2,2,0 // vbroadcastss 0x202e5(%rip),%xmm13 # 2cc4c <_sk_overlay_sse2_8bit+0xe88>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -21885,7 +21881,7 @@ _sk_load_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,223,249,1,0 // vbroadcastss 0x1f9df(%rip),%xmm3 # 2c39c <_sk_overlay_sse2_8bit+0x5c4>
+ .byte 196,226,121,24,29,155,2,2,0 // vbroadcastss 0x2029b(%rip),%xmm3 # 2cc50 <_sk_overlay_sse2_8bit+0xe8c>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -21978,29 +21974,29 @@ _sk_load_f16_avx:
.byte 196,65,123,16,4,192 // vmovsd (%r8,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,85 // je cbe3 <_sk_load_f16_avx+0x333>
+ .byte 116,85 // je cbdb <_sk_load_f16_avx+0x333>
.byte 196,65,57,22,68,192,8 // vmovhpd 0x8(%r8,%rax,8),%xmm8,%xmm8
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,72 // jb cbe3 <_sk_load_f16_avx+0x333>
+ .byte 114,72 // jb cbdb <_sk_load_f16_avx+0x333>
.byte 196,193,123,16,84,192,16 // vmovsd 0x10(%r8,%rax,8),%xmm2
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 116,72 // je cbf0 <_sk_load_f16_avx+0x340>
+ .byte 116,72 // je cbe8 <_sk_load_f16_avx+0x340>
.byte 196,193,105,22,84,192,24 // vmovhpd 0x18(%r8,%rax,8),%xmm2,%xmm2
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,59 // jb cbf0 <_sk_load_f16_avx+0x340>
+ .byte 114,59 // jb cbe8 <_sk_load_f16_avx+0x340>
.byte 196,193,123,16,76,192,32 // vmovsd 0x20(%r8,%rax,8),%xmm1
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 15,132,65,253,255,255 // je c907 <_sk_load_f16_avx+0x57>
+ .byte 15,132,65,253,255,255 // je c8ff <_sk_load_f16_avx+0x57>
.byte 196,193,113,22,76,192,40 // vmovhpd 0x28(%r8,%rax,8),%xmm1,%xmm1
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 15,130,48,253,255,255 // jb c907 <_sk_load_f16_avx+0x57>
+ .byte 15,130,48,253,255,255 // jb c8ff <_sk_load_f16_avx+0x57>
.byte 196,65,122,126,76,192,48 // vmovq 0x30(%r8,%rax,8),%xmm9
- .byte 233,36,253,255,255 // jmpq c907 <_sk_load_f16_avx+0x57>
+ .byte 233,36,253,255,255 // jmpq c8ff <_sk_load_f16_avx+0x57>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,23,253,255,255 // jmpq c907 <_sk_load_f16_avx+0x57>
+ .byte 233,23,253,255,255 // jmpq c8ff <_sk_load_f16_avx+0x57>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
- .byte 233,14,253,255,255 // jmpq c907 <_sk_load_f16_avx+0x57>
+ .byte 233,14,253,255,255 // jmpq c8ff <_sk_load_f16_avx+0x57>
HIDDEN _sk_load_f16_dst_avx
.globl _sk_load_f16_dst_avx
@@ -22019,7 +22015,7 @@ _sk_load_f16_dst_avx:
.byte 197,252,17,84,36,192 // vmovups %ymm2,-0x40(%rsp)
.byte 197,252,17,76,36,160 // vmovups %ymm1,-0x60(%rsp)
.byte 197,254,127,68,36,128 // vmovdqu %ymm0,-0x80(%rsp)
- .byte 15,133,145,2,0,0 // jne cec6 <_sk_load_f16_dst_avx+0x2cd>
+ .byte 15,133,145,2,0,0 // jne cebe <_sk_load_f16_dst_avx+0x2cd>
.byte 196,65,121,16,4,192 // vmovupd (%r8,%rax,8),%xmm8
.byte 196,193,121,16,116,192,16 // vmovupd 0x10(%r8,%rax,8),%xmm6
.byte 196,193,121,16,108,192,32 // vmovupd 0x20(%r8,%rax,8),%xmm5
@@ -22037,13 +22033,13 @@ _sk_load_f16_dst_avx:
.byte 197,217,105,232 // vpunpckhwd %xmm0,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- .byte 196,98,125,24,37,2,247,1,0 // vbroadcastss 0x1f702(%rip),%ymm12 # 2c394 <_sk_overlay_sse2_8bit+0x5bc>
+ .byte 196,98,125,24,37,190,255,1,0 // vbroadcastss 0x1ffbe(%rip),%ymm12 # 2cc48 <_sk_overlay_sse2_8bit+0xe84>
.byte 196,193,92,84,236 // vandps %ymm12,%ymm4,%ymm5
.byte 197,220,87,229 // vxorps %ymm5,%ymm4,%ymm4
.byte 196,195,125,25,230,1 // vextractf128 $0x1,%ymm4,%xmm14
- .byte 196,98,121,24,29,198,246,1,0 // vbroadcastss 0x1f6c6(%rip),%xmm11 # 2c370 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,121,24,29,130,255,1,0 // vbroadcastss 0x1ff82(%rip),%xmm11 # 2cc24 <_sk_overlay_sse2_8bit+0xe60>
.byte 196,193,8,87,251 // vxorps %xmm11,%xmm14,%xmm7
- .byte 196,98,121,24,45,224,246,1,0 // vbroadcastss 0x1f6e0(%rip),%xmm13 # 2c398 <_sk_overlay_sse2_8bit+0x5c0>
+ .byte 196,98,121,24,45,156,255,1,0 // vbroadcastss 0x1ff9c(%rip),%xmm13 # 2cc4c <_sk_overlay_sse2_8bit+0xe88>
.byte 197,145,102,255 // vpcmpgtd %xmm7,%xmm13,%xmm7
.byte 196,65,88,87,211 // vxorps %xmm11,%xmm4,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -22057,7 +22053,7 @@ _sk_load_f16_dst_avx:
.byte 196,227,93,24,231,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
.byte 197,220,86,229 // vorps %ymm5,%ymm4,%ymm4
.byte 196,227,125,25,229,1 // vextractf128 $0x1,%ymm4,%xmm5
- .byte 196,226,121,24,61,150,246,1,0 // vbroadcastss 0x1f696(%rip),%xmm7 # 2c39c <_sk_overlay_sse2_8bit+0x5c4>
+ .byte 196,226,121,24,61,82,255,1,0 // vbroadcastss 0x1ff52(%rip),%xmm7 # 2cc50 <_sk_overlay_sse2_8bit+0xe8c>
.byte 197,209,254,239 // vpaddd %xmm7,%xmm5,%xmm5
.byte 197,217,254,231 // vpaddd %xmm7,%xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -22150,29 +22146,29 @@ _sk_load_f16_dst_avx:
.byte 196,65,123,16,4,192 // vmovsd (%r8,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,85 // je cf2c <_sk_load_f16_dst_avx+0x333>
+ .byte 116,85 // je cf24 <_sk_load_f16_dst_avx+0x333>
.byte 196,65,57,22,68,192,8 // vmovhpd 0x8(%r8,%rax,8),%xmm8,%xmm8
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,72 // jb cf2c <_sk_load_f16_dst_avx+0x333>
+ .byte 114,72 // jb cf24 <_sk_load_f16_dst_avx+0x333>
.byte 196,193,123,16,116,192,16 // vmovsd 0x10(%r8,%rax,8),%xmm6
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 116,72 // je cf39 <_sk_load_f16_dst_avx+0x340>
+ .byte 116,72 // je cf31 <_sk_load_f16_dst_avx+0x340>
.byte 196,193,73,22,116,192,24 // vmovhpd 0x18(%r8,%rax,8),%xmm6,%xmm6
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,59 // jb cf39 <_sk_load_f16_dst_avx+0x340>
+ .byte 114,59 // jb cf31 <_sk_load_f16_dst_avx+0x340>
.byte 196,193,123,16,108,192,32 // vmovsd 0x20(%r8,%rax,8),%xmm5
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 15,132,65,253,255,255 // je cc50 <_sk_load_f16_dst_avx+0x57>
+ .byte 15,132,65,253,255,255 // je cc48 <_sk_load_f16_dst_avx+0x57>
.byte 196,193,81,22,108,192,40 // vmovhpd 0x28(%r8,%rax,8),%xmm5,%xmm5
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 15,130,48,253,255,255 // jb cc50 <_sk_load_f16_dst_avx+0x57>
+ .byte 15,130,48,253,255,255 // jb cc48 <_sk_load_f16_dst_avx+0x57>
.byte 196,65,122,126,76,192,48 // vmovq 0x30(%r8,%rax,8),%xmm9
- .byte 233,36,253,255,255 // jmpq cc50 <_sk_load_f16_dst_avx+0x57>
+ .byte 233,36,253,255,255 // jmpq cc48 <_sk_load_f16_dst_avx+0x57>
.byte 197,209,87,237 // vxorpd %xmm5,%xmm5,%xmm5
.byte 197,201,87,246 // vxorpd %xmm6,%xmm6,%xmm6
- .byte 233,23,253,255,255 // jmpq cc50 <_sk_load_f16_dst_avx+0x57>
+ .byte 233,23,253,255,255 // jmpq cc48 <_sk_load_f16_dst_avx+0x57>
.byte 197,209,87,237 // vxorpd %xmm5,%xmm5,%xmm5
- .byte 233,14,253,255,255 // jmpq cc50 <_sk_load_f16_dst_avx+0x57>
+ .byte 233,14,253,255,255 // jmpq cc48 <_sk_load_f16_dst_avx+0x57>
HIDDEN _sk_gather_f16_avx
.globl _sk_gather_f16_avx
@@ -22236,13 +22232,13 @@ _sk_gather_f16_avx:
.byte 197,249,105,210 // vpunpckhwd %xmm2,%xmm0,%xmm2
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,194,1 // vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
- .byte 196,98,125,24,37,71,243,1,0 // vbroadcastss 0x1f347(%rip),%ymm12 # 2c394 <_sk_overlay_sse2_8bit+0x5bc>
+ .byte 196,98,125,24,37,3,252,1,0 // vbroadcastss 0x1fc03(%rip),%ymm12 # 2cc48 <_sk_overlay_sse2_8bit+0xe84>
.byte 196,193,124,84,212 // vandps %ymm12,%ymm0,%ymm2
.byte 197,252,87,194 // vxorps %ymm2,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,11,243,1,0 // vbroadcastss 0x1f30b(%rip),%xmm11 # 2c370 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,121,24,29,199,251,1,0 // vbroadcastss 0x1fbc7(%rip),%xmm11 # 2cc24 <_sk_overlay_sse2_8bit+0xe60>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,37,243,1,0 // vbroadcastss 0x1f325(%rip),%xmm13 # 2c398 <_sk_overlay_sse2_8bit+0x5c0>
+ .byte 196,98,121,24,45,225,251,1,0 // vbroadcastss 0x1fbe1(%rip),%xmm13 # 2cc4c <_sk_overlay_sse2_8bit+0xe88>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -22256,7 +22252,7 @@ _sk_gather_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,194 // vorps %ymm2,%ymm0,%ymm0
.byte 196,227,125,25,194,1 // vextractf128 $0x1,%ymm0,%xmm2
- .byte 196,226,121,24,29,219,242,1,0 // vbroadcastss 0x1f2db(%rip),%xmm3 # 2c39c <_sk_overlay_sse2_8bit+0x5c4>
+ .byte 196,226,121,24,29,151,251,1,0 // vbroadcastss 0x1fb97(%rip),%xmm3 # 2cc50 <_sk_overlay_sse2_8bit+0xe8c>
.byte 197,233,254,211 // vpaddd %xmm3,%xmm2,%xmm2
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,194,1 // vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
@@ -22360,12 +22356,12 @@ _sk_store_f16_avx:
.byte 197,252,17,52,36 // vmovups %ymm6,(%rsp)
.byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp)
.byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp)
- .byte 196,98,125,24,13,196,240,1,0 // vbroadcastss 0x1f0c4(%rip),%ymm9 # 2c370 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,125,24,13,128,249,1,0 // vbroadcastss 0x1f980(%rip),%ymm9 # 2cc24 <_sk_overlay_sse2_8bit+0xe60>
.byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
.byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11
.byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12
- .byte 196,98,121,24,5,213,240,1,0 // vbroadcastss 0x1f0d5(%rip),%xmm8 # 2c3a0 <_sk_overlay_sse2_8bit+0x5c8>
+ .byte 196,98,121,24,5,145,249,1,0 // vbroadcastss 0x1f991(%rip),%xmm8 # 2cc54 <_sk_overlay_sse2_8bit+0xe90>
.byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13
.byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14
.byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -22375,7 +22371,7 @@ _sk_store_f16_avx:
.byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
.byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11
.byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12
- .byte 196,98,125,24,21,156,240,1,0 // vbroadcastss 0x1f09c(%rip),%ymm10 # 2c3a4 <_sk_overlay_sse2_8bit+0x5cc>
+ .byte 196,98,125,24,21,88,249,1,0 // vbroadcastss 0x1f958(%rip),%ymm10 # 2cc58 <_sk_overlay_sse2_8bit+0xe94>
.byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14
.byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15
.byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12
@@ -22462,7 +22458,7 @@ _sk_store_f16_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,70 // jne d4fc <_sk_store_f16_avx+0x274>
+ .byte 117,70 // jne d4f4 <_sk_store_f16_avx+0x274>
.byte 196,65,120,17,28,192 // vmovups %xmm11,(%r8,%rax,8)
.byte 196,65,120,17,84,192,16 // vmovups %xmm10,0x10(%r8,%rax,8)
.byte 196,65,120,17,76,192,32 // vmovups %xmm9,0x20(%r8,%rax,8)
@@ -22478,22 +22474,22 @@ _sk_store_f16_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,192 // vmovq %xmm11,(%r8,%rax,8)
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,201 // je d4d1 <_sk_store_f16_avx+0x249>
+ .byte 116,201 // je d4c9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,92,192,8 // vmovhpd %xmm11,0x8(%r8,%rax,8)
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,188 // jb d4d1 <_sk_store_f16_avx+0x249>
+ .byte 114,188 // jb d4c9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,84,192,16 // vmovq %xmm10,0x10(%r8,%rax,8)
- .byte 116,179 // je d4d1 <_sk_store_f16_avx+0x249>
+ .byte 116,179 // je d4c9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,84,192,24 // vmovhpd %xmm10,0x18(%r8,%rax,8)
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,166 // jb d4d1 <_sk_store_f16_avx+0x249>
+ .byte 114,166 // jb d4c9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,76,192,32 // vmovq %xmm9,0x20(%r8,%rax,8)
- .byte 116,157 // je d4d1 <_sk_store_f16_avx+0x249>
+ .byte 116,157 // je d4c9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,76,192,40 // vmovhpd %xmm9,0x28(%r8,%rax,8)
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 114,144 // jb d4d1 <_sk_store_f16_avx+0x249>
+ .byte 114,144 // jb d4c9 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,68,192,48 // vmovq %xmm8,0x30(%r8,%rax,8)
- .byte 235,135 // jmp d4d1 <_sk_store_f16_avx+0x249>
+ .byte 235,135 // jmp d4c9 <_sk_store_f16_avx+0x249>
HIDDEN _sk_load_u16_be_avx
.globl _sk_load_u16_be_avx
@@ -22508,7 +22504,7 @@ _sk_load_u16_be_avx:
.byte 76,3,0 // add (%rax),%r8
.byte 73,99,193 // movslq %r9d,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,253,0,0,0 // jne d66e <_sk_load_u16_be_avx+0x124>
+ .byte 15,133,253,0,0,0 // jne d666 <_sk_load_u16_be_avx+0x124>
.byte 196,65,121,16,4,64 // vmovupd (%r8,%rax,2),%xmm8
.byte 196,193,121,16,84,64,16 // vmovupd 0x10(%r8,%rax,2),%xmm2
.byte 196,193,121,16,92,64,32 // vmovupd 0x20(%r8,%rax,2),%xmm3
@@ -22530,7 +22526,7 @@ _sk_load_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,198,236,1,0 // vbroadcastss 0x1ecc6(%rip),%ymm11 # 2c2a8 <_sk_overlay_sse2_8bit+0x4d0>
+ .byte 196,98,125,24,29,130,245,1,0 // vbroadcastss 0x1f582(%rip),%ymm11 # 2cb5c <_sk_overlay_sse2_8bit+0xd98>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -22564,29 +22560,29 @@ _sk_load_u16_be_avx:
.byte 196,65,123,16,4,64 // vmovsd (%r8,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,85 // je d6d4 <_sk_load_u16_be_avx+0x18a>
+ .byte 116,85 // je d6cc <_sk_load_u16_be_avx+0x18a>
.byte 196,65,57,22,68,64,8 // vmovhpd 0x8(%r8,%rax,2),%xmm8,%xmm8
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,72 // jb d6d4 <_sk_load_u16_be_avx+0x18a>
+ .byte 114,72 // jb d6cc <_sk_load_u16_be_avx+0x18a>
.byte 196,193,123,16,84,64,16 // vmovsd 0x10(%r8,%rax,2),%xmm2
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 116,72 // je d6e1 <_sk_load_u16_be_avx+0x197>
+ .byte 116,72 // je d6d9 <_sk_load_u16_be_avx+0x197>
.byte 196,193,105,22,84,64,24 // vmovhpd 0x18(%r8,%rax,2),%xmm2,%xmm2
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,59 // jb d6e1 <_sk_load_u16_be_avx+0x197>
+ .byte 114,59 // jb d6d9 <_sk_load_u16_be_avx+0x197>
.byte 196,193,123,16,92,64,32 // vmovsd 0x20(%r8,%rax,2),%xmm3
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 15,132,213,254,255,255 // je d58c <_sk_load_u16_be_avx+0x42>
+ .byte 15,132,213,254,255,255 // je d584 <_sk_load_u16_be_avx+0x42>
.byte 196,193,97,22,92,64,40 // vmovhpd 0x28(%r8,%rax,2),%xmm3,%xmm3
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 15,130,196,254,255,255 // jb d58c <_sk_load_u16_be_avx+0x42>
+ .byte 15,130,196,254,255,255 // jb d584 <_sk_load_u16_be_avx+0x42>
.byte 196,65,122,126,76,64,48 // vmovq 0x30(%r8,%rax,2),%xmm9
- .byte 233,184,254,255,255 // jmpq d58c <_sk_load_u16_be_avx+0x42>
+ .byte 233,184,254,255,255 // jmpq d584 <_sk_load_u16_be_avx+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,171,254,255,255 // jmpq d58c <_sk_load_u16_be_avx+0x42>
+ .byte 233,171,254,255,255 // jmpq d584 <_sk_load_u16_be_avx+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,162,254,255,255 // jmpq d58c <_sk_load_u16_be_avx+0x42>
+ .byte 233,162,254,255,255 // jmpq d584 <_sk_load_u16_be_avx+0x42>
HIDDEN _sk_load_rgb_u16_be_avx
.globl _sk_load_rgb_u16_be_avx
@@ -22603,7 +22599,7 @@ _sk_load_rgb_u16_be_avx:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,241,0,0,0 // jne d806 <_sk_load_rgb_u16_be_avx+0x11c>
+ .byte 15,133,241,0,0,0 // jne d7fe <_sk_load_rgb_u16_be_avx+0x11c>
.byte 196,65,122,111,28,64 // vmovdqu (%r8,%rax,2),%xmm11
.byte 196,193,122,111,92,64,12 // vmovdqu 0xc(%r8,%rax,2),%xmm3
.byte 196,193,122,111,84,64,24 // vmovdqu 0x18(%r8,%rax,2),%xmm2
@@ -22630,7 +22626,7 @@ _sk_load_rgb_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,194,1 // vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,21,8,235,1,0 // vbroadcastss 0x1eb08(%rip),%ymm2 # 2c2a8 <_sk_overlay_sse2_8bit+0x4d0>
+ .byte 196,226,125,24,21,196,243,1,0 // vbroadcastss 0x1f3c4(%rip),%ymm2 # 2cb5c <_sk_overlay_sse2_8bit+0xd98>
.byte 197,252,89,194 // vmulps %ymm2,%ymm0,%ymm0
.byte 197,185,109,201 // vpunpckhqdq %xmm1,%xmm8,%xmm1
.byte 197,225,113,241,8 // vpsllw $0x8,%xmm1,%xmm3
@@ -22651,69 +22647,69 @@ _sk_load_rgb_u16_be_avx:
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
.byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,20,234,1,0 // vbroadcastss 0x1ea14(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,208,242,1,0 // vbroadcastss 0x1f2d0(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,64 // vmovd (%r8,%rax,2),%xmm0
.byte 196,65,121,196,92,64,4,2 // vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,32 // jne d83f <_sk_load_rgb_u16_be_avx+0x155>
+ .byte 117,32 // jne d837 <_sk_load_rgb_u16_be_avx+0x155>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
- .byte 233,11,255,255,255 // jmpq d74a <_sk_load_rgb_u16_be_avx+0x60>
+ .byte 233,11,255,255,255 // jmpq d742 <_sk_load_rgb_u16_be_avx+0x60>
.byte 196,193,121,110,68,64,6 // vmovd 0x6(%r8,%rax,2),%xmm0
.byte 196,65,121,196,68,64,10,2 // vpinsrw $0x2,0xa(%r8,%rax,2),%xmm0,%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,49 // jb d88a <_sk_load_rgb_u16_be_avx+0x1a0>
+ .byte 114,49 // jb d882 <_sk_load_rgb_u16_be_avx+0x1a0>
.byte 196,193,121,110,68,64,12 // vmovd 0xc(%r8,%rax,2),%xmm0
.byte 196,193,121,196,92,64,16,2 // vpinsrw $0x2,0x10(%r8,%rax,2),%xmm0,%xmm3
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 117,50 // jne d8a5 <_sk_load_rgb_u16_be_avx+0x1bb>
+ .byte 117,50 // jne d89d <_sk_load_rgb_u16_be_avx+0x1bb>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
- .byte 233,192,254,255,255 // jmpq d74a <_sk_load_rgb_u16_be_avx+0x60>
+ .byte 233,192,254,255,255 // jmpq d742 <_sk_load_rgb_u16_be_avx+0x60>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
- .byte 233,165,254,255,255 // jmpq d74a <_sk_load_rgb_u16_be_avx+0x60>
+ .byte 233,165,254,255,255 // jmpq d742 <_sk_load_rgb_u16_be_avx+0x60>
.byte 196,193,121,110,68,64,18 // vmovd 0x12(%r8,%rax,2),%xmm0
.byte 196,65,121,196,84,64,22,2 // vpinsrw $0x2,0x16(%r8,%rax,2),%xmm0,%xmm10
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,40 // jb d8e7 <_sk_load_rgb_u16_be_avx+0x1fd>
+ .byte 114,40 // jb d8df <_sk_load_rgb_u16_be_avx+0x1fd>
.byte 196,193,121,110,68,64,24 // vmovd 0x18(%r8,%rax,2),%xmm0
.byte 196,193,121,196,84,64,28,2 // vpinsrw $0x2,0x1c(%r8,%rax,2),%xmm0,%xmm2
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 117,32 // jne d8f9 <_sk_load_rgb_u16_be_avx+0x20f>
+ .byte 117,32 // jne d8f1 <_sk_load_rgb_u16_be_avx+0x20f>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
- .byte 233,99,254,255,255 // jmpq d74a <_sk_load_rgb_u16_be_avx+0x60>
+ .byte 233,99,254,255,255 // jmpq d742 <_sk_load_rgb_u16_be_avx+0x60>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
- .byte 233,81,254,255,255 // jmpq d74a <_sk_load_rgb_u16_be_avx+0x60>
+ .byte 233,81,254,255,255 // jmpq d742 <_sk_load_rgb_u16_be_avx+0x60>
.byte 196,193,121,110,68,64,30 // vmovd 0x1e(%r8,%rax,2),%xmm0
.byte 196,65,121,196,100,64,34,2 // vpinsrw $0x2,0x22(%r8,%rax,2),%xmm0,%xmm12
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 114,25 // jb d92c <_sk_load_rgb_u16_be_avx+0x242>
+ .byte 114,25 // jb d924 <_sk_load_rgb_u16_be_avx+0x242>
.byte 196,193,121,110,68,64,36 // vmovd 0x24(%r8,%rax,2),%xmm0
.byte 196,193,121,196,68,64,40,2 // vpinsrw $0x2,0x28(%r8,%rax,2),%xmm0,%xmm0
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
- .byte 233,30,254,255,255 // jmpq d74a <_sk_load_rgb_u16_be_avx+0x60>
+ .byte 233,30,254,255,255 // jmpq d742 <_sk_load_rgb_u16_be_avx+0x60>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
- .byte 233,21,254,255,255 // jmpq d74a <_sk_load_rgb_u16_be_avx+0x60>
+ .byte 233,21,254,255,255 // jmpq d742 <_sk_load_rgb_u16_be_avx+0x60>
HIDDEN _sk_store_u16_be_avx
.globl _sk_store_u16_be_avx
@@ -22727,7 +22723,7 @@ _sk_store_u16_be_avx:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 73,99,193 // movslq %r9d,%rax
- .byte 196,98,125,24,5,212,233,1,0 // vbroadcastss 0x1e9d4(%rip),%ymm8 # 2c330 <_sk_overlay_sse2_8bit+0x558>
+ .byte 196,98,125,24,5,144,242,1,0 // vbroadcastss 0x1f290(%rip),%ymm8 # 2cbe4 <_sk_overlay_sse2_8bit+0xe20>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -22765,7 +22761,7 @@ _sk_store_u16_be_avx:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,31 // jne da40 <_sk_store_u16_be_avx+0x10b>
+ .byte 117,31 // jne da38 <_sk_store_u16_be_avx+0x10b>
.byte 196,65,120,17,28,64 // vmovups %xmm11,(%r8,%rax,2)
.byte 196,65,120,17,84,64,16 // vmovups %xmm10,0x10(%r8,%rax,2)
.byte 196,65,120,17,76,64,32 // vmovups %xmm9,0x20(%r8,%rax,2)
@@ -22774,22 +22770,22 @@ _sk_store_u16_be_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,64 // vmovq %xmm11,(%r8,%rax,2)
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,240 // je da3c <_sk_store_u16_be_avx+0x107>
+ .byte 116,240 // je da34 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,92,64,8 // vmovhpd %xmm11,0x8(%r8,%rax,2)
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,227 // jb da3c <_sk_store_u16_be_avx+0x107>
+ .byte 114,227 // jb da34 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,84,64,16 // vmovq %xmm10,0x10(%r8,%rax,2)
- .byte 116,218 // je da3c <_sk_store_u16_be_avx+0x107>
+ .byte 116,218 // je da34 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,84,64,24 // vmovhpd %xmm10,0x18(%r8,%rax,2)
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,205 // jb da3c <_sk_store_u16_be_avx+0x107>
+ .byte 114,205 // jb da34 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,76,64,32 // vmovq %xmm9,0x20(%r8,%rax,2)
- .byte 116,196 // je da3c <_sk_store_u16_be_avx+0x107>
+ .byte 116,196 // je da34 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,76,64,40 // vmovhpd %xmm9,0x28(%r8,%rax,2)
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 114,183 // jb da3c <_sk_store_u16_be_avx+0x107>
+ .byte 114,183 // jb da34 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,68,64,48 // vmovq %xmm8,0x30(%r8,%rax,2)
- .byte 235,174 // jmp da3c <_sk_store_u16_be_avx+0x107>
+ .byte 235,174 // jmp da34 <_sk_store_u16_be_avx+0x107>
HIDDEN _sk_load_f32_avx
.globl _sk_load_f32_avx
@@ -22798,7 +22794,7 @@ _sk_load_f32_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,253,87,192 // vxorpd %ymm0,%ymm0,%ymm0
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 15,135,97,1,0,0 // ja dbff <_sk_load_f32_avx+0x171>
+ .byte 15,135,97,1,0,0 // ja dbf7 <_sk_load_f32_avx+0x171>
.byte 72,131,236,24 // sub $0x18,%rsp
.byte 197,253,17,100,36,128 // vmovupd %ymm4,-0x80(%rsp)
.byte 197,253,17,108,36,160 // vmovupd %ymm5,-0x60(%rsp)
@@ -22811,7 +22807,7 @@ _sk_load_f32_avx:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 77,99,201 // movslq %r9d,%r9
- .byte 76,141,21,50,1,0,0 // lea 0x132(%rip),%r10 # dc10 <_sk_load_f32_avx+0x182>
+ .byte 76,141,21,50,1,0,0 // lea 0x132(%rip),%r10 # dc08 <_sk_load_f32_avx+0x182>
.byte 73,99,4,186 // movslq (%r10,%rdi,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 197,221,87,228 // vxorpd %ymm4,%ymm4,%ymm4
@@ -22874,7 +22870,7 @@ _sk_load_f32_avx:
.byte 197,229,87,219 // vxorpd %ymm3,%ymm3,%ymm3
.byte 196,65,45,87,210 // vxorpd %ymm10,%ymm10,%ymm10
.byte 197,245,87,201 // vxorpd %ymm1,%ymm1,%ymm1
- .byte 235,203 // jmp dbd9 <_sk_load_f32_avx+0x14b>
+ .byte 235,203 // jmp dbd1 <_sk_load_f32_avx+0x14b>
.byte 102,144 // xchg %ax,%ax
.byte 27,255 // sbb %edi,%edi
.byte 255 // (bad)
@@ -22886,7 +22882,7 @@ _sk_load_f32_avx:
.byte 255,92,255,255 // lcall *-0x1(%rdi,%rdi,8)
.byte 255,70,255 // incl -0x1(%rsi)
.byte 255 // (bad)
- .byte 255,53,255,255,255,40 // pushq 0x28ffffff(%rip) # 2900dc2c <_sk_overlay_sse2_8bit+0x28fe1e54>
+ .byte 255,53,255,255,255,40 // pushq 0x28ffffff(%rip) # 2900dc24 <_sk_overlay_sse2_8bit+0x28fe1e60>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -22898,7 +22894,7 @@ _sk_load_f32_dst_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,221,87,228 // vxorpd %ymm4,%ymm4,%ymm4
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 15,135,97,1,0,0 // ja dda1 <_sk_load_f32_dst_avx+0x171>
+ .byte 15,135,97,1,0,0 // ja dd99 <_sk_load_f32_dst_avx+0x171>
.byte 72,131,236,24 // sub $0x18,%rsp
.byte 197,253,17,68,36,128 // vmovupd %ymm0,-0x80(%rsp)
.byte 197,253,17,76,36,160 // vmovupd %ymm1,-0x60(%rsp)
@@ -22911,7 +22907,7 @@ _sk_load_f32_dst_avx:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 77,99,201 // movslq %r9d,%r9
- .byte 76,141,21,48,1,0,0 // lea 0x130(%rip),%r10 # ddb0 <_sk_load_f32_dst_avx+0x180>
+ .byte 76,141,21,48,1,0,0 // lea 0x130(%rip),%r10 # dda8 <_sk_load_f32_dst_avx+0x180>
.byte 73,99,4,186 // movslq (%r10,%rdi,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 197,253,87,192 // vxorpd %ymm0,%ymm0,%ymm0
@@ -22974,7 +22970,7 @@ _sk_load_f32_dst_avx:
.byte 197,197,87,255 // vxorpd %ymm7,%ymm7,%ymm7
.byte 196,65,45,87,210 // vxorpd %ymm10,%ymm10,%ymm10
.byte 197,213,87,237 // vxorpd %ymm5,%ymm5,%ymm5
- .byte 235,203 // jmp dd7b <_sk_load_f32_dst_avx+0x14b>
+ .byte 235,203 // jmp dd73 <_sk_load_f32_dst_avx+0x14b>
.byte 29,255,255,255,163 // sbb $0xa3ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
@@ -23014,7 +23010,7 @@ _sk_store_f32_avx:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,55 // jne de4f <_sk_store_f32_avx+0x7f>
+ .byte 117,55 // jne de47 <_sk_store_f32_avx+0x7f>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -23027,22 +23023,22 @@ _sk_store_f32_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,128 // vmovupd %xmm10,(%r8,%rax,4)
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,240 // je de4b <_sk_store_f32_avx+0x7b>
+ .byte 116,240 // je de43 <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,76,128,16 // vmovupd %xmm9,0x10(%r8,%rax,4)
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,227 // jb de4b <_sk_store_f32_avx+0x7b>
+ .byte 114,227 // jb de43 <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,68,128,32 // vmovupd %xmm8,0x20(%r8,%rax,4)
- .byte 116,218 // je de4b <_sk_store_f32_avx+0x7b>
+ .byte 116,218 // je de43 <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,92,128,48 // vmovupd %xmm11,0x30(%r8,%rax,4)
.byte 72,131,255,5 // cmp $0x5,%rdi
- .byte 114,205 // jb de4b <_sk_store_f32_avx+0x7b>
+ .byte 114,205 // jb de43 <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,84,128,64,1 // vextractf128 $0x1,%ymm10,0x40(%r8,%rax,4)
- .byte 116,195 // je de4b <_sk_store_f32_avx+0x7b>
+ .byte 116,195 // je de43 <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,76,128,80,1 // vextractf128 $0x1,%ymm9,0x50(%r8,%rax,4)
.byte 72,131,255,7 // cmp $0x7,%rdi
- .byte 114,181 // jb de4b <_sk_store_f32_avx+0x7b>
+ .byte 114,181 // jb de43 <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,68,128,96,1 // vextractf128 $0x1,%ymm8,0x60(%r8,%rax,4)
- .byte 235,171 // jmp de4b <_sk_store_f32_avx+0x7b>
+ .byte 235,171 // jmp de43 <_sk_store_f32_avx+0x7b>
HIDDEN _sk_clamp_x_avx
.globl _sk_clamp_x_avx
@@ -23135,7 +23131,7 @@ _sk_mirror_x_avx:
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,99,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- .byte 197,178,89,5,63,226,1,0 // vmulss 0x1e23f(%rip),%xmm9,%xmm0 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 197,178,89,5,251,234,1,0 // vmulss 0x1eafb(%rip),%xmm9,%xmm0 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
@@ -23169,7 +23165,7 @@ _sk_mirror_y_avx:
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,99,117,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- .byte 197,178,89,13,178,225,1,0 // vmulss 0x1e1b2(%rip),%xmm9,%xmm1 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 197,178,89,13,110,234,1,0 // vmulss 0x1ea6e(%rip),%xmm9,%xmm1 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
@@ -23196,7 +23192,7 @@ FUNCTION(_sk_clamp_x_1_avx)
_sk_clamp_x_1_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,76,225,1,0 // vbroadcastss 0x1e14c(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,8,234,1,0 // vbroadcastss 0x1ea08(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23214,9 +23210,9 @@ HIDDEN _sk_mirror_x_1_avx
.globl _sk_mirror_x_1_avx
FUNCTION(_sk_mirror_x_1_avx)
_sk_mirror_x_1_avx:
- .byte 196,98,125,24,5,67,225,1,0 // vbroadcastss 0x1e143(%rip),%ymm8 # 2c230 <_sk_overlay_sse2_8bit+0x458>
+ .byte 196,98,125,24,5,255,233,1,0 // vbroadcastss 0x1e9ff(%rip),%ymm8 # 2cae4 <_sk_overlay_sse2_8bit+0xd20>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,25,225,1,0 // vbroadcastss 0x1e119(%rip),%ymm9 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,13,213,233,1,0 // vbroadcastss 0x1e9d5(%rip),%ymm9 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -23232,12 +23228,12 @@ HIDDEN _sk_luminance_to_alpha_avx
.globl _sk_luminance_to_alpha_avx
FUNCTION(_sk_luminance_to_alpha_avx)
_sk_luminance_to_alpha_avx:
- .byte 196,226,125,24,29,5,226,1,0 // vbroadcastss 0x1e205(%rip),%ymm3 # 2c334 <_sk_overlay_sse2_8bit+0x55c>
+ .byte 196,226,125,24,29,193,234,1,0 // vbroadcastss 0x1eac1(%rip),%ymm3 # 2cbe8 <_sk_overlay_sse2_8bit+0xe24>
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,29,252,225,1,0 // vbroadcastss 0x1e1fc(%rip),%ymm3 # 2c338 <_sk_overlay_sse2_8bit+0x560>
+ .byte 196,226,125,24,29,184,234,1,0 // vbroadcastss 0x1eab8(%rip),%ymm3 # 2cbec <_sk_overlay_sse2_8bit+0xe28>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,239,225,1,0 // vbroadcastss 0x1e1ef(%rip),%ymm1 # 2c33c <_sk_overlay_sse2_8bit+0x564>
+ .byte 196,226,125,24,13,171,234,1,0 // vbroadcastss 0x1eaab(%rip),%ymm1 # 2cbf0 <_sk_overlay_sse2_8bit+0xe2c>
.byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1
.byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23485,9 +23481,9 @@ _sk_evenly_spaced_gradient_avx:
.byte 72,139,24 // mov (%rax),%rbx
.byte 72,139,104,8 // mov 0x8(%rax),%rbp
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js e4f1 <_sk_evenly_spaced_gradient_avx+0x25>
+ .byte 120,7 // js e4e9 <_sk_evenly_spaced_gradient_avx+0x25>
.byte 196,225,242,42,203 // vcvtsi2ss %rbx,%xmm1,%xmm1
- .byte 235,21 // jmp e506 <_sk_evenly_spaced_gradient_avx+0x3a>
+ .byte 235,21 // jmp e4fe <_sk_evenly_spaced_gradient_avx+0x3a>
.byte 73,137,216 // mov %rbx,%r8
.byte 73,209,232 // shr %r8
.byte 131,227,1 // and $0x1,%ebx
@@ -23645,18 +23641,18 @@ HIDDEN _sk_gauss_a_to_rgba_avx
.globl _sk_gauss_a_to_rgba_avx
FUNCTION(_sk_gauss_a_to_rgba_avx)
_sk_gauss_a_to_rgba_avx:
- .byte 196,226,125,24,5,10,219,1,0 // vbroadcastss 0x1db0a(%rip),%ymm0 # 2c344 <_sk_overlay_sse2_8bit+0x56c>
+ .byte 196,226,125,24,5,198,227,1,0 // vbroadcastss 0x1e3c6(%rip),%ymm0 # 2cbf8 <_sk_overlay_sse2_8bit+0xe34>
.byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
- .byte 196,226,125,24,13,249,218,1,0 // vbroadcastss 0x1daf9(%rip),%ymm1 # 2c340 <_sk_overlay_sse2_8bit+0x568>
+ .byte 196,226,125,24,13,181,227,1,0 // vbroadcastss 0x1e3b5(%rip),%ymm1 # 2cbf4 <_sk_overlay_sse2_8bit+0xe30>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,240,218,1,0 // vbroadcastss 0x1daf0(%rip),%ymm1 # 2c348 <_sk_overlay_sse2_8bit+0x570>
+ .byte 196,226,125,24,13,172,227,1,0 // vbroadcastss 0x1e3ac(%rip),%ymm1 # 2cbfc <_sk_overlay_sse2_8bit+0xe38>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,227,218,1,0 // vbroadcastss 0x1dae3(%rip),%ymm1 # 2c34c <_sk_overlay_sse2_8bit+0x574>
+ .byte 196,226,125,24,13,159,227,1,0 // vbroadcastss 0x1e39f(%rip),%ymm1 # 2cc00 <_sk_overlay_sse2_8bit+0xe3c>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,214,218,1,0 // vbroadcastss 0x1dad6(%rip),%ymm1 # 2c350 <_sk_overlay_sse2_8bit+0x578>
+ .byte 196,226,125,24,13,146,227,1,0 // vbroadcastss 0x1e392(%rip),%ymm1 # 2cc04 <_sk_overlay_sse2_8bit+0xe40>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -23678,12 +23674,12 @@ _sk_gradient_avx:
.byte 76,139,0 // mov (%rax),%r8
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 73,131,248,2 // cmp $0x2,%r8
- .byte 114,80 // jb e8fc <_sk_gradient_avx+0x6e>
+ .byte 114,80 // jb e8f4 <_sk_gradient_avx+0x6e>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,200 // dec %r8
.byte 72,131,195,4 // add $0x4,%rbx
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
- .byte 196,98,125,24,21,87,217,1,0 // vbroadcastss 0x1d957(%rip),%ymm10 # 2c21c <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,98,125,24,21,19,226,1,0 // vbroadcastss 0x1e213(%rip),%ymm10 # 2cad0 <_sk_overlay_sse2_8bit+0xd0c>
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,98,125,24,3 // vbroadcastss (%rbx),%ymm8
.byte 197,60,194,192,2 // vcmpleps %ymm0,%ymm8,%ymm8
@@ -23695,7 +23691,7 @@ _sk_gradient_avx:
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,200 // dec %r8
- .byte 117,205 // jne e8c9 <_sk_gradient_avx+0x3b>
+ .byte 117,205 // jne e8c1 <_sk_gradient_avx+0x3b>
.byte 196,195,249,22,200,1 // vpextrq $0x1,%xmm1,%r8
.byte 69,137,193 // mov %r8d,%r9d
.byte 73,193,232,32 // shr $0x20,%r8
@@ -23877,27 +23873,27 @@ _sk_xy_to_unit_angle_avx:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,130,214,1,0 // vbroadcastss 0x1d682(%rip),%ymm13 # 2c354 <_sk_overlay_sse2_8bit+0x57c>
+ .byte 196,98,125,24,45,62,223,1,0 // vbroadcastss 0x1df3e(%rip),%ymm13 # 2cc08 <_sk_overlay_sse2_8bit+0xe44>
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,120,214,1,0 // vbroadcastss 0x1d678(%rip),%ymm14 # 2c358 <_sk_overlay_sse2_8bit+0x580>
+ .byte 196,98,125,24,53,52,223,1,0 // vbroadcastss 0x1df34(%rip),%ymm14 # 2cc0c <_sk_overlay_sse2_8bit+0xe48>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,105,214,1,0 // vbroadcastss 0x1d669(%rip),%ymm14 # 2c35c <_sk_overlay_sse2_8bit+0x584>
+ .byte 196,98,125,24,53,37,223,1,0 // vbroadcastss 0x1df25(%rip),%ymm14 # 2cc10 <_sk_overlay_sse2_8bit+0xe4c>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12
- .byte 196,98,125,24,45,90,214,1,0 // vbroadcastss 0x1d65a(%rip),%ymm13 # 2c360 <_sk_overlay_sse2_8bit+0x588>
+ .byte 196,98,125,24,45,22,223,1,0 // vbroadcastss 0x1df16(%rip),%ymm13 # 2cc14 <_sk_overlay_sse2_8bit+0xe50>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,69,214,1,0 // vbroadcastss 0x1d645(%rip),%ymm10 # 2c364 <_sk_overlay_sse2_8bit+0x58c>
+ .byte 196,98,125,24,21,1,223,1,0 // vbroadcastss 0x1df01(%rip),%ymm10 # 2cc18 <_sk_overlay_sse2_8bit+0xe54>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,219,212,1,0 // vbroadcastss 0x1d4db(%rip),%ymm10 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,21,151,221,1,0 // vbroadcastss 0x1dd97(%rip),%ymm10 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,197,212,1,0 // vbroadcastss 0x1d4c5(%rip),%ymm10 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,21,129,221,1,0 // vbroadcastss 0x1dd81(%rip),%ymm10 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -23927,7 +23923,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,187,213,1,0 // vbroadcastss 0x1d5bb(%rip),%ymm11 # 2c368 <_sk_overlay_sse2_8bit+0x590>
+ .byte 196,98,125,24,29,119,222,1,0 // vbroadcastss 0x1de77(%rip),%ymm11 # 2cc1c <_sk_overlay_sse2_8bit+0xe58>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -23936,17 +23932,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,143,213,1,0 // vbroadcastss 0x1d58f(%rip),%ymm9 # 2c36c <_sk_overlay_sse2_8bit+0x594>
+ .byte 196,98,125,24,13,75,222,1,0 // vbroadcastss 0x1de4b(%rip),%ymm9 # 2cc20 <_sk_overlay_sse2_8bit+0xe5c>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,109,213,1,0 // vbroadcastss 0x1d56d(%rip),%ymm9 # 2c370 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,125,24,13,41,222,1,0 // vbroadcastss 0x1de29(%rip),%ymm9 # 2cc24 <_sk_overlay_sse2_8bit+0xe60>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,254,211,1,0 // vbroadcastss 0x1d3fe(%rip),%ymm11 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,29,186,220,1,0 // vbroadcastss 0x1dcba(%rip),%ymm11 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -23966,7 +23962,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,13,213,1,0 // vbroadcastss 0x1d50d(%rip),%ymm11 # 2c368 <_sk_overlay_sse2_8bit+0x590>
+ .byte 196,98,125,24,29,201,221,1,0 // vbroadcastss 0x1ddc9(%rip),%ymm11 # 2cc1c <_sk_overlay_sse2_8bit+0xe58>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -23975,17 +23971,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,225,212,1,0 // vbroadcastss 0x1d4e1(%rip),%ymm9 # 2c36c <_sk_overlay_sse2_8bit+0x594>
+ .byte 196,98,125,24,13,157,221,1,0 // vbroadcastss 0x1dd9d(%rip),%ymm9 # 2cc20 <_sk_overlay_sse2_8bit+0xe5c>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,191,212,1,0 // vbroadcastss 0x1d4bf(%rip),%ymm9 # 2c370 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,125,24,13,123,221,1,0 // vbroadcastss 0x1dd7b(%rip),%ymm9 # 2cc24 <_sk_overlay_sse2_8bit+0xe60>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,80,211,1,0 // vbroadcastss 0x1d350(%rip),%ymm11 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,29,12,220,1,0 // vbroadcastss 0x1dc0c(%rip),%ymm11 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -24004,7 +24000,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,67,121,4,201,0 // vpermilps $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,101,212,1,0 // vbroadcastss 0x1d465(%rip),%ymm10 # 2c368 <_sk_overlay_sse2_8bit+0x590>
+ .byte 196,98,125,24,21,33,221,1,0 // vbroadcastss 0x1dd21(%rip),%ymm10 # 2cc1c <_sk_overlay_sse2_8bit+0xe58>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
@@ -24013,7 +24009,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,61,212,1,0 // vbroadcastss 0x1d43d(%rip),%ymm8 # 2c370 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,125,24,5,249,220,1,0 // vbroadcastss 0x1dcf9(%rip),%ymm8 # 2cc24 <_sk_overlay_sse2_8bit+0xe60>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24054,7 +24050,7 @@ HIDDEN _sk_save_xy_avx
FUNCTION(_sk_save_xy_avx)
_sk_save_xy_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,121,210,1,0 // vbroadcastss 0x1d279(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,53,219,1,0 // vbroadcastss 0x1db35(%rip),%ymm8 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -24091,9 +24087,9 @@ HIDDEN _sk_bilinear_nx_avx
FUNCTION(_sk_bilinear_nx_avx)
_sk_bilinear_nx_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,97,211,1,0 // vbroadcastss 0x1d361(%rip),%ymm0 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,5,29,220,1,0 // vbroadcastss 0x1dc1d(%rip),%ymm0 # 2cc28 <_sk_overlay_sse2_8bit+0xe64>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,248,209,1,0 // vbroadcastss 0x1d1f8(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,180,218,1,0 // vbroadcastss 0x1dab4(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24104,7 +24100,7 @@ HIDDEN _sk_bilinear_px_avx
FUNCTION(_sk_bilinear_px_avx)
_sk_bilinear_px_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,216,209,1,0 // vbroadcastss 0x1d1d8(%rip),%ymm0 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,226,125,24,5,148,218,1,0 // vbroadcastss 0x1da94(%rip),%ymm0 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -24116,9 +24112,9 @@ HIDDEN _sk_bilinear_ny_avx
FUNCTION(_sk_bilinear_ny_avx)
_sk_bilinear_ny_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,24,211,1,0 // vbroadcastss 0x1d318(%rip),%ymm1 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,13,212,219,1,0 // vbroadcastss 0x1dbd4(%rip),%ymm1 # 2cc28 <_sk_overlay_sse2_8bit+0xe64>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,174,209,1,0 // vbroadcastss 0x1d1ae(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,106,218,1,0 // vbroadcastss 0x1da6a(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24129,7 +24125,7 @@ HIDDEN _sk_bilinear_py_avx
FUNCTION(_sk_bilinear_py_avx)
_sk_bilinear_py_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,142,209,1,0 // vbroadcastss 0x1d18e(%rip),%ymm1 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,226,125,24,13,74,218,1,0 // vbroadcastss 0x1da4a(%rip),%ymm1 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -24141,14 +24137,14 @@ HIDDEN _sk_bicubic_n3x_avx
FUNCTION(_sk_bicubic_n3x_avx)
_sk_bicubic_n3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,209,210,1,0 // vbroadcastss 0x1d2d1(%rip),%ymm0 # 2c378 <_sk_overlay_sse2_8bit+0x5a0>
+ .byte 196,226,125,24,5,141,219,1,0 // vbroadcastss 0x1db8d(%rip),%ymm0 # 2cc2c <_sk_overlay_sse2_8bit+0xe68>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,100,209,1,0 // vbroadcastss 0x1d164(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,32,218,1,0 // vbroadcastss 0x1da20(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,181,210,1,0 // vbroadcastss 0x1d2b5(%rip),%ymm10 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,113,219,1,0 // vbroadcastss 0x1db71(%rip),%ymm10 # 2cc30 <_sk_overlay_sse2_8bit+0xe6c>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,179,209,1,0 // vbroadcastss 0x1d1b3(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,98,125,24,21,111,218,1,0 // vbroadcastss 0x1da6f(%rip),%ymm10 # 2cb3c <_sk_overlay_sse2_8bit+0xd78>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -24160,19 +24156,19 @@ HIDDEN _sk_bicubic_n1x_avx
FUNCTION(_sk_bicubic_n1x_avx)
_sk_bicubic_n1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,126,210,1,0 // vbroadcastss 0x1d27e(%rip),%ymm0 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,5,58,219,1,0 // vbroadcastss 0x1db3a(%rip),%ymm0 # 2cc28 <_sk_overlay_sse2_8bit+0xe64>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,21,209,1,0 // vbroadcastss 0x1d115(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,209,217,1,0 // vbroadcastss 0x1d9d1(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,115,210,1,0 // vbroadcastss 0x1d273(%rip),%ymm9 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,13,47,219,1,0 // vbroadcastss 0x1db2f(%rip),%ymm9 # 2cc38 <_sk_overlay_sse2_8bit+0xe74>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,97,210,1,0 // vbroadcastss 0x1d261(%rip),%ymm10 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,98,125,24,21,29,219,1,0 // vbroadcastss 0x1db1d(%rip),%ymm10 # 2cc34 <_sk_overlay_sse2_8bit+0xe70>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,226,208,1,0 // vbroadcastss 0x1d0e2(%rip),%ymm10 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,21,158,217,1,0 // vbroadcastss 0x1d99e(%rip),%ymm10 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,67,210,1,0 // vbroadcastss 0x1d243(%rip),%ymm9 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,13,255,218,1,0 // vbroadcastss 0x1daff(%rip),%ymm9 # 2cc3c <_sk_overlay_sse2_8bit+0xe78>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24183,17 +24179,17 @@ HIDDEN _sk_bicubic_p1x_avx
FUNCTION(_sk_bicubic_p1x_avx)
_sk_bicubic_p1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,179,208,1,0 // vbroadcastss 0x1d0b3(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,111,217,1,0 // vbroadcastss 0x1d96f(%rip),%ymm8 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,17,210,1,0 // vbroadcastss 0x1d211(%rip),%ymm10 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,21,205,218,1,0 // vbroadcastss 0x1dacd(%rip),%ymm10 # 2cc38 <_sk_overlay_sse2_8bit+0xe74>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,255,209,1,0 // vbroadcastss 0x1d1ff(%rip),%ymm11 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,98,125,24,29,187,218,1,0 // vbroadcastss 0x1dabb(%rip),%ymm11 # 2cc34 <_sk_overlay_sse2_8bit+0xe70>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,234,209,1,0 // vbroadcastss 0x1d1ea(%rip),%ymm9 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,13,166,218,1,0 // vbroadcastss 0x1daa6(%rip),%ymm9 # 2cc3c <_sk_overlay_sse2_8bit+0xe78>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24204,13 +24200,13 @@ HIDDEN _sk_bicubic_p3x_avx
FUNCTION(_sk_bicubic_p3x_avx)
_sk_bicubic_p3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,198,209,1,0 // vbroadcastss 0x1d1c6(%rip),%ymm0 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,226,125,24,5,130,218,1,0 // vbroadcastss 0x1da82(%rip),%ymm0 # 2cc34 <_sk_overlay_sse2_8bit+0xe70>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,171,209,1,0 // vbroadcastss 0x1d1ab(%rip),%ymm10 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,103,218,1,0 // vbroadcastss 0x1da67(%rip),%ymm10 # 2cc30 <_sk_overlay_sse2_8bit+0xe6c>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,169,208,1,0 // vbroadcastss 0x1d0a9(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,98,125,24,21,101,217,1,0 // vbroadcastss 0x1d965(%rip),%ymm10 # 2cb3c <_sk_overlay_sse2_8bit+0xd78>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -24222,14 +24218,14 @@ HIDDEN _sk_bicubic_n3y_avx
FUNCTION(_sk_bicubic_n3y_avx)
_sk_bicubic_n3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,120,209,1,0 // vbroadcastss 0x1d178(%rip),%ymm1 # 2c378 <_sk_overlay_sse2_8bit+0x5a0>
+ .byte 196,226,125,24,13,52,218,1,0 // vbroadcastss 0x1da34(%rip),%ymm1 # 2cc2c <_sk_overlay_sse2_8bit+0xe68>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,10,208,1,0 // vbroadcastss 0x1d00a(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,198,216,1,0 // vbroadcastss 0x1d8c6(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,91,209,1,0 // vbroadcastss 0x1d15b(%rip),%ymm10 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,23,218,1,0 // vbroadcastss 0x1da17(%rip),%ymm10 # 2cc30 <_sk_overlay_sse2_8bit+0xe6c>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,89,208,1,0 // vbroadcastss 0x1d059(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,98,125,24,21,21,217,1,0 // vbroadcastss 0x1d915(%rip),%ymm10 # 2cb3c <_sk_overlay_sse2_8bit+0xd78>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -24241,19 +24237,19 @@ HIDDEN _sk_bicubic_n1y_avx
FUNCTION(_sk_bicubic_n1y_avx)
_sk_bicubic_n1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,36,209,1,0 // vbroadcastss 0x1d124(%rip),%ymm1 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,13,224,217,1,0 // vbroadcastss 0x1d9e0(%rip),%ymm1 # 2cc28 <_sk_overlay_sse2_8bit+0xe64>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,186,207,1,0 // vbroadcastss 0x1cfba(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,118,216,1,0 // vbroadcastss 0x1d876(%rip),%ymm8 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,24,209,1,0 // vbroadcastss 0x1d118(%rip),%ymm9 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,13,212,217,1,0 // vbroadcastss 0x1d9d4(%rip),%ymm9 # 2cc38 <_sk_overlay_sse2_8bit+0xe74>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,6,209,1,0 // vbroadcastss 0x1d106(%rip),%ymm10 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,98,125,24,21,194,217,1,0 // vbroadcastss 0x1d9c2(%rip),%ymm10 # 2cc34 <_sk_overlay_sse2_8bit+0xe70>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,135,207,1,0 // vbroadcastss 0x1cf87(%rip),%ymm10 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,21,67,216,1,0 // vbroadcastss 0x1d843(%rip),%ymm10 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,232,208,1,0 // vbroadcastss 0x1d0e8(%rip),%ymm9 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,13,164,217,1,0 // vbroadcastss 0x1d9a4(%rip),%ymm9 # 2cc3c <_sk_overlay_sse2_8bit+0xe78>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24264,17 +24260,17 @@ HIDDEN _sk_bicubic_p1y_avx
FUNCTION(_sk_bicubic_p1y_avx)
_sk_bicubic_p1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,88,207,1,0 // vbroadcastss 0x1cf58(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,20,216,1,0 // vbroadcastss 0x1d814(%rip),%ymm8 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,181,208,1,0 // vbroadcastss 0x1d0b5(%rip),%ymm10 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,21,113,217,1,0 // vbroadcastss 0x1d971(%rip),%ymm10 # 2cc38 <_sk_overlay_sse2_8bit+0xe74>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,163,208,1,0 // vbroadcastss 0x1d0a3(%rip),%ymm11 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,98,125,24,29,95,217,1,0 // vbroadcastss 0x1d95f(%rip),%ymm11 # 2cc34 <_sk_overlay_sse2_8bit+0xe70>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,142,208,1,0 // vbroadcastss 0x1d08e(%rip),%ymm9 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,13,74,217,1,0 // vbroadcastss 0x1d94a(%rip),%ymm9 # 2cc3c <_sk_overlay_sse2_8bit+0xe78>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24285,13 +24281,13 @@ HIDDEN _sk_bicubic_p3y_avx
FUNCTION(_sk_bicubic_p3y_avx)
_sk_bicubic_p3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,106,208,1,0 // vbroadcastss 0x1d06a(%rip),%ymm1 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,226,125,24,13,38,217,1,0 // vbroadcastss 0x1d926(%rip),%ymm1 # 2cc34 <_sk_overlay_sse2_8bit+0xe70>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,78,208,1,0 // vbroadcastss 0x1d04e(%rip),%ymm10 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,10,217,1,0 // vbroadcastss 0x1d90a(%rip),%ymm10 # 2cc30 <_sk_overlay_sse2_8bit+0xe6c>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,76,207,1,0 // vbroadcastss 0x1cf4c(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,98,125,24,21,8,216,1,0 // vbroadcastss 0x1d808(%rip),%ymm10 # 2cb3c <_sk_overlay_sse2_8bit+0xd78>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -24434,7 +24430,7 @@ _sk_clut_3D_avx:
.byte 197,249,127,68,36,224 // vmovdqa %xmm0,-0x20(%rsp)
.byte 72,139,0 // mov (%rax),%rax
.byte 196,193,121,254,194 // vpaddd %xmm10,%xmm0,%xmm0
- .byte 196,98,121,24,29,252,205,1,0 // vbroadcastss 0x1cdfc(%rip),%xmm11 # 2c390 <_sk_overlay_sse2_8bit+0x5b8>
+ .byte 196,98,121,24,29,184,214,1,0 // vbroadcastss 0x1d6b8(%rip),%xmm11 # 2cc44 <_sk_overlay_sse2_8bit+0xe80>
.byte 196,194,121,64,203 // vpmulld %xmm11,%xmm0,%xmm1
.byte 196,193,249,126,200 // vmovq %xmm1,%r8
.byte 69,137,193 // mov %r8d,%r9d
@@ -24468,7 +24464,7 @@ _sk_clut_3D_avx:
.byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
.byte 196,227,93,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm3
.byte 197,252,17,92,36,64 // vmovups %ymm3,0x40(%rsp)
- .byte 196,98,121,24,13,197,203,1,0 // vbroadcastss 0x1cbc5(%rip),%xmm9 # 2c21c <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,98,121,24,13,129,212,1,0 // vbroadcastss 0x1d481(%rip),%xmm9 # 2cad0 <_sk_overlay_sse2_8bit+0xd0c>
.byte 196,193,105,254,249 // vpaddd %xmm9,%xmm2,%xmm7
.byte 196,195,249,22,248,1 // vpextrq $0x1,%xmm7,%r8
.byte 196,193,249,126,249 // vmovq %xmm7,%r9
@@ -24496,7 +24492,7 @@ _sk_clut_3D_avx:
.byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7
.byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5
.byte 196,99,85,24,254,1 // vinsertf128 $0x1,%xmm6,%ymm5,%ymm15
- .byte 196,98,121,24,37,58,203,1,0 // vbroadcastss 0x1cb3a(%rip),%xmm12 # 2c224 <_sk_overlay_sse2_8bit+0x44c>
+ .byte 196,98,121,24,37,246,211,1,0 // vbroadcastss 0x1d3f6(%rip),%xmm12 # 2cad8 <_sk_overlay_sse2_8bit+0xd14>
.byte 196,193,105,254,212 // vpaddd %xmm12,%xmm2,%xmm2
.byte 196,195,249,22,208,1 // vpextrq $0x1,%xmm2,%r8
.byte 196,193,249,126,209 // vmovq %xmm2,%r9
@@ -24524,7 +24520,7 @@ _sk_clut_3D_avx:
.byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
.byte 196,227,105,33,213,48 // vinsertps $0x30,%xmm5,%xmm2,%xmm2
.byte 196,227,109,24,225,1 // vinsertf128 $0x1,%xmm1,%ymm2,%ymm4
- .byte 196,226,125,24,13,14,204,1,0 // vbroadcastss 0x1cc0e(%rip),%ymm1 # 2c38c <_sk_overlay_sse2_8bit+0x5b4>
+ .byte 196,226,125,24,13,202,212,1,0 // vbroadcastss 0x1d4ca(%rip),%ymm1 # 2cc40 <_sk_overlay_sse2_8bit+0xe7c>
.byte 197,188,88,209 // vaddps %ymm1,%ymm8,%ymm2
.byte 197,252,17,76,36,32 // vmovups %ymm1,0x20(%rsp)
.byte 197,254,91,210 // vcvttps2dq %ymm2,%ymm2
@@ -25277,7 +25273,7 @@ _sk_clut_4D_avx:
.byte 196,226,25,64,200 // vpmulld %xmm0,%xmm12,%xmm1
.byte 197,249,127,76,36,128 // vmovdqa %xmm1,-0x80(%rsp)
.byte 197,241,254,202 // vpaddd %xmm2,%xmm1,%xmm1
- .byte 196,98,121,24,61,190,188,1,0 // vbroadcastss 0x1bcbe(%rip),%xmm15 # 2c390 <_sk_overlay_sse2_8bit+0x5b8>
+ .byte 196,98,121,24,61,122,197,1,0 // vbroadcastss 0x1c57a(%rip),%xmm15 # 2cc44 <_sk_overlay_sse2_8bit+0xe80>
.byte 196,194,113,64,247 // vpmulld %xmm15,%xmm1,%xmm6
.byte 196,193,249,126,240 // vmovq %xmm6,%r8
.byte 69,137,193 // mov %r8d,%r9d
@@ -25315,7 +25311,7 @@ _sk_clut_4D_avx:
.byte 196,163,65,33,60,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
.byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
.byte 196,99,53,24,247,1 // vinsertf128 $0x1,%xmm7,%ymm9,%ymm14
- .byte 196,98,121,24,21,111,186,1,0 // vbroadcastss 0x1ba6f(%rip),%xmm10 # 2c21c <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,98,121,24,21,43,195,1,0 // vbroadcastss 0x1c32b(%rip),%xmm10 # 2cad0 <_sk_overlay_sse2_8bit+0xd0c>
.byte 196,65,97,254,202 // vpaddd %xmm10,%xmm3,%xmm9
.byte 196,67,249,22,200,1 // vpextrq $0x1,%xmm9,%r8
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -25343,7 +25339,7 @@ _sk_clut_4D_avx:
.byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7
.byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5
.byte 196,99,85,24,220,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm11
- .byte 196,98,121,24,13,228,185,1,0 // vbroadcastss 0x1b9e4(%rip),%xmm9 # 2c224 <_sk_overlay_sse2_8bit+0x44c>
+ .byte 196,98,121,24,13,160,194,1,0 // vbroadcastss 0x1c2a0(%rip),%xmm9 # 2cad8 <_sk_overlay_sse2_8bit+0xd14>
.byte 196,193,97,254,217 // vpaddd %xmm9,%xmm3,%xmm3
.byte 196,195,249,22,216,1 // vpextrq $0x1,%xmm3,%r8
.byte 196,193,249,126,217 // vmovq %xmm3,%r9
@@ -25371,7 +25367,7 @@ _sk_clut_4D_avx:
.byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
.byte 196,227,89,33,229,48 // vinsertps $0x30,%xmm5,%xmm4,%xmm4
.byte 196,227,93,24,243,1 // vinsertf128 $0x1,%xmm3,%ymm4,%ymm6
- .byte 196,226,125,24,37,184,186,1,0 // vbroadcastss 0x1bab8(%rip),%ymm4 # 2c38c <_sk_overlay_sse2_8bit+0x5b4>
+ .byte 196,226,125,24,37,116,195,1,0 // vbroadcastss 0x1c374(%rip),%ymm4 # 2cc40 <_sk_overlay_sse2_8bit+0xe7c>
.byte 197,148,88,220 // vaddps %ymm4,%ymm13,%ymm3
.byte 197,252,40,252 // vmovaps %ymm4,%ymm7
.byte 197,252,17,124,36,32 // vmovups %ymm7,0x20(%rsp)
@@ -26801,7 +26797,7 @@ _sk_clut_4D_avx:
.byte 197,220,89,210 // vmulps %ymm2,%ymm4,%ymm2
.byte 197,212,88,210 // vaddps %ymm2,%ymm5,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,198,155,1,0 // vbroadcastss 0x19bc6(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,130,164,1,0 // vbroadcastss 0x1a482(%rip),%ymm3 # 2cacc <_sk_overlay_sse2_8bit+0xd08>
.byte 197,252,16,164,36,32,2,0,0 // vmovups 0x220(%rsp),%ymm4
.byte 197,252,16,172,36,64,2,0,0 // vmovups 0x240(%rsp),%ymm5
.byte 197,252,16,180,36,96,2,0,0 // vmovups 0x260(%rsp),%ymm6
@@ -26832,13 +26828,13 @@ _sk_start_pipeline_sse41:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,192 // mov %rcx,-0x40(%rbp)
.byte 72,57,203 // cmp %rcx,%rbx
- .byte 115,83 // jae 12704 <_sk_start_pipeline_sse41+0x82>
+ .byte 115,83 // jae 126fc <_sk_start_pipeline_sse41+0x82>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,4 // lea 0x4(%rax),%rax
.byte 72,137,69,200 // mov %rax,-0x38(%rbp)
.byte 76,57,125,200 // cmp %r15,-0x38(%rbp)
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
- .byte 119,35 // ja 126ea <_sk_start_pipeline_sse41+0x68>
+ .byte 119,35 // ja 126e2 <_sk_start_pipeline_sse41+0x68>
.byte 76,139,101,208 // mov -0x30(%rbp),%r12
.byte 49,255 // xor %edi,%edi
.byte 76,137,246 // mov %r14,%rsi
@@ -26849,16 +26845,16 @@ _sk_start_pipeline_sse41:
.byte 73,131,196,8 // add $0x8,%r12
.byte 77,57,252 // cmp %r15,%r12
.byte 73,137,212 // mov %rdx,%r12
- .byte 118,225 // jbe 126cb <_sk_start_pipeline_sse41+0x49>
+ .byte 118,225 // jbe 126c3 <_sk_start_pipeline_sse41+0x49>
.byte 76,137,255 // mov %r15,%rdi
.byte 72,41,215 // sub %rdx,%rdi
- .byte 116,9 // je 126fb <_sk_start_pipeline_sse41+0x79>
+ .byte 116,9 // je 126f3 <_sk_start_pipeline_sse41+0x79>
.byte 76,137,246 // mov %r14,%rsi
.byte 72,137,217 // mov %rbx,%rcx
.byte 65,255,213 // callq *%r13
.byte 72,255,195 // inc %rbx
.byte 72,59,93,192 // cmp -0x40(%rbp),%rbx
- .byte 117,185 // jne 126bd <_sk_start_pipeline_sse41+0x3b>
+ .byte 117,185 // jne 126b5 <_sk_start_pipeline_sse41+0x3b>
.byte 72,131,196,24 // add $0x18,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -26881,15 +26877,13 @@ _sk_seed_shader_sse41:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,21,185,165,1,0 // movaps 0x1a5b9(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
- .byte 15,88,194 // addps %xmm2,%xmm0
- .byte 15,88,5,191,165,1,0 // addps 0x1a5bf(%rip),%xmm0 # 2ccf0 <_sk_overlay_sse2_8bit+0xf18>
+ .byte 15,88,5,161,165,1,0 // addps 0x1a5a1(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0xefc>
.byte 102,15,110,201 // movd %ecx,%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,88,202 // addps %xmm2,%xmm1
+ .byte 15,88,13,158,165,1,0 // addps 0x1a59e(%rip),%xmm1 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,183,165,1,0 // movaps 0x1a5b7(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,21,165,165,1,0 // movaps 0x1a5a5(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -26904,18 +26898,18 @@ _sk_dither_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 102,68,15,110,194 // movd %edx,%xmm8
.byte 102,69,15,112,200,0 // pshufd $0x0,%xmm8,%xmm9
- .byte 102,68,15,254,13,80,165,1,0 // paddd 0x1a550(%rip),%xmm9 # 2ccc0 <_sk_overlay_sse2_8bit+0xee8>
+ .byte 102,68,15,254,13,62,165,1,0 // paddd 0x1a53e(%rip),%xmm9 # 2cca0 <_sk_overlay_sse2_8bit+0xedc>
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,135,165,1,0 // movdqa 0x1a587(%rip),%xmm10 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,68,15,111,21,117,165,1,0 // movdqa 0x1a575(%rip),%xmm10 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,115,165,1,0 // movdqa 0x1a573(%rip),%xmm12 # 2cd20 <_sk_overlay_sse2_8bit+0xf48>
- .byte 102,68,15,111,45,122,165,1,0 // movdqa 0x1a57a(%rip),%xmm13 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,68,15,111,37,97,165,1,0 // movdqa 0x1a561(%rip),%xmm12 # 2cd00 <_sk_overlay_sse2_8bit+0xf3c>
+ .byte 102,68,15,111,45,104,165,1,0 // movdqa 0x1a568(%rip),%xmm13 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -26931,8 +26925,8 @@ _sk_dither_sse41:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,53,165,1,0 // mulps 0x1a535(%rip),%xmm8 # 2cd40 <_sk_overlay_sse2_8bit+0xf68>
- .byte 68,15,88,5,61,165,1,0 // addps 0x1a53d(%rip),%xmm8 # 2cd50 <_sk_overlay_sse2_8bit+0xf78>
+ .byte 68,15,89,5,35,165,1,0 // mulps 0x1a523(%rip),%xmm8 # 2cd20 <_sk_overlay_sse2_8bit+0xf5c>
+ .byte 68,15,88,5,43,165,1,0 // addps 0x1a52b(%rip),%xmm8 # 2cd30 <_sk_overlay_sse2_8bit+0xf6c>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -26974,7 +26968,7 @@ HIDDEN _sk_black_color_sse41
FUNCTION(_sk_black_color_sse41)
_sk_black_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,115,164,1,0 // movaps 0x1a473(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,97,164,1,0 // movaps 0x1a461(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -26985,7 +26979,7 @@ HIDDEN _sk_white_color_sse41
FUNCTION(_sk_white_color_sse41)
_sk_white_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,95,164,1,0 // movaps 0x1a45f(%rip),%xmm0 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,5,77,164,1,0 // movaps 0x1a44d(%rip),%xmm0 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -27031,7 +27025,7 @@ HIDDEN _sk_srcatop_sse41
FUNCTION(_sk_srcatop_sse41)
_sk_srcatop_sse41:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,15,164,1,0 // movaps 0x1a40f(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,253,163,1,0 // movaps 0x1a3fd(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -27056,7 +27050,7 @@ FUNCTION(_sk_dstatop_sse41)
_sk_dstatop_sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,194,163,1,0 // movaps 0x1a3c2(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,13,176,163,1,0 // movaps 0x1a3b0(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -27103,7 +27097,7 @@ HIDDEN _sk_srcout_sse41
.globl _sk_srcout_sse41
FUNCTION(_sk_srcout_sse41)
_sk_srcout_sse41:
- .byte 68,15,40,5,86,163,1,0 // movaps 0x1a356(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,68,163,1,0 // movaps 0x1a344(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -27116,7 +27110,7 @@ HIDDEN _sk_dstout_sse41
.globl _sk_dstout_sse41
FUNCTION(_sk_dstout_sse41)
_sk_dstout_sse41:
- .byte 68,15,40,5,54,163,1,0 // movaps 0x1a336(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,36,163,1,0 // movaps 0x1a324(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -27133,7 +27127,7 @@ HIDDEN _sk_srcover_sse41
.globl _sk_srcover_sse41
FUNCTION(_sk_srcover_sse41)
_sk_srcover_sse41:
- .byte 68,15,40,5,9,163,1,0 // movaps 0x1a309(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,247,162,1,0 // movaps 0x1a2f7(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -27153,7 +27147,7 @@ HIDDEN _sk_dstover_sse41
.globl _sk_dstover_sse41
FUNCTION(_sk_dstover_sse41)
_sk_dstover_sse41:
- .byte 68,15,40,5,205,162,1,0 // movaps 0x1a2cd(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,187,162,1,0 // movaps 0x1a2bb(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -27181,7 +27175,7 @@ HIDDEN _sk_multiply_sse41
.globl _sk_multiply_sse41
FUNCTION(_sk_multiply_sse41)
_sk_multiply_sse41:
- .byte 68,15,40,5,145,162,1,0 // movaps 0x1a291(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,127,162,1,0 // movaps 0x1a27f(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -27219,7 +27213,7 @@ HIDDEN _sk_plus__sse41
FUNCTION(_sk_plus__sse41)
_sk_plus__sse41:
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 68,15,40,5,18,162,1,0 // movaps 0x1a212(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,0,162,1,0 // movaps 0x1a200(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 65,15,93,200 // minps %xmm8,%xmm1
@@ -27261,7 +27255,7 @@ HIDDEN _sk_xor__sse41
FUNCTION(_sk_xor__sse41)
_sk_xor__sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,158,161,1,0 // movaps 0x1a19e(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,140,161,1,0 // movaps 0x1a18c(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -27309,7 +27303,7 @@ _sk_darken_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,249,160,1,0 // movaps 0x1a0f9(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,21,231,160,1,0 // movaps 0x1a0e7(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -27343,7 +27337,7 @@ _sk_lighten_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,142,160,1,0 // movaps 0x1a08e(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,21,124,160,1,0 // movaps 0x1a07c(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -27380,7 +27374,7 @@ _sk_difference_sse41:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,24,160,1,0 // movaps 0x1a018(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,21,6,160,1,0 // movaps 0x1a006(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -27408,7 +27402,7 @@ _sk_exclusion_sse41:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,200,159,1,0 // movaps 0x19fc8(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,21,182,159,1,0 // movaps 0x19fb6(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -27420,7 +27414,7 @@ HIDDEN _sk_colorburn_sse41
.globl _sk_colorburn_sse41
FUNCTION(_sk_colorburn_sse41)
_sk_colorburn_sse41:
- .byte 68,15,40,29,175,159,1,0 // movaps 0x19faf(%rip),%xmm11 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,29,157,159,1,0 // movaps 0x19f9d(%rip),%xmm11 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 68,15,92,231 // subps %xmm7,%xmm12
.byte 69,15,40,204 // movaps %xmm12,%xmm9
@@ -27504,7 +27498,7 @@ HIDDEN _sk_colordodge_sse41
FUNCTION(_sk_colordodge_sse41)
_sk_colordodge_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,121,158,1,0 // movaps 0x19e79(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,21,103,158,1,0 // movaps 0x19e67(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -27586,7 +27580,7 @@ _sk_hardlight_sse41:
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,68,157,1,0 // movaps 0x19d44(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,21,50,157,1,0 // movaps 0x19d32(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 65,15,40,234 // movaps %xmm10,%xmm5
.byte 15,92,239 // subps %xmm7,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
@@ -27669,7 +27663,7 @@ FUNCTION(_sk_overlay_sse41)
_sk_overlay_sse41:
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,40,240 // movaps %xmm0,%xmm14
- .byte 68,15,40,21,25,156,1,0 // movaps 0x19c19(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,21,7,156,1,0 // movaps 0x19c07(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -27754,7 +27748,7 @@ _sk_softlight_sse41:
.byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 65,15,84,193 // andps %xmm9,%xmm0
- .byte 15,40,13,224,154,1,0 // movaps 0x19ae0(%rip),%xmm1 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,13,206,154,1,0 // movaps 0x19ace(%rip),%xmm1 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 68,15,40,240 // movaps %xmm0,%xmm14
@@ -27767,10 +27761,10 @@ _sk_softlight_sse41:
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,210 // mulps %xmm2,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,40,45,14,155,1,0 // movaps 0x19b0e(%rip),%xmm13 # 2cd60 <_sk_overlay_sse2_8bit+0xf88>
+ .byte 68,15,40,45,252,154,1,0 // movaps 0x19afc(%rip),%xmm13 # 2cd40 <_sk_overlay_sse2_8bit+0xf7c>
.byte 69,15,88,245 // addps %xmm13,%xmm14
.byte 68,15,89,242 // mulps %xmm2,%xmm14
- .byte 68,15,40,37,14,155,1,0 // movaps 0x19b0e(%rip),%xmm12 # 2cd70 <_sk_overlay_sse2_8bit+0xf98>
+ .byte 68,15,40,37,252,154,1,0 // movaps 0x19afc(%rip),%xmm12 # 2cd50 <_sk_overlay_sse2_8bit+0xf8c>
.byte 69,15,89,252 // mulps %xmm12,%xmm15
.byte 69,15,88,254 // addps %xmm14,%xmm15
.byte 15,40,198 // movaps %xmm6,%xmm0
@@ -27956,12 +27950,12 @@ _sk_hue_sse41:
.byte 68,15,84,208 // andps %xmm0,%xmm10
.byte 15,84,200 // andps %xmm0,%xmm1
.byte 68,15,84,232 // andps %xmm0,%xmm13
- .byte 15,40,5,121,152,1,0 // movaps 0x19879(%rip),%xmm0 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
+ .byte 15,40,5,103,152,1,0 // movaps 0x19867(%rip),%xmm0 # 2cd60 <_sk_overlay_sse2_8bit+0xf9c>
.byte 68,15,89,224 // mulps %xmm0,%xmm12
- .byte 15,40,21,126,152,1,0 // movaps 0x1987e(%rip),%xmm2 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
+ .byte 15,40,21,108,152,1,0 // movaps 0x1986c(%rip),%xmm2 # 2cd70 <_sk_overlay_sse2_8bit+0xfac>
.byte 15,89,250 // mulps %xmm2,%xmm7
.byte 65,15,88,252 // addps %xmm12,%xmm7
- .byte 68,15,40,53,127,152,1,0 // movaps 0x1987f(%rip),%xmm14 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
+ .byte 68,15,40,53,109,152,1,0 // movaps 0x1986d(%rip),%xmm14 # 2cd80 <_sk_overlay_sse2_8bit+0xfbc>
.byte 68,15,40,252 // movaps %xmm4,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,255 // addps %xmm7,%xmm15
@@ -28044,7 +28038,7 @@ _sk_hue_sse41:
.byte 65,15,88,214 // addps %xmm14,%xmm2
.byte 15,40,196 // movaps %xmm4,%xmm0
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,40,13,147,150,1,0 // movaps 0x19693(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,13,129,150,1,0 // movaps 0x19681(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 65,15,40,225 // movaps %xmm9,%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0
@@ -28138,14 +28132,14 @@ _sk_saturation_sse41:
.byte 68,15,84,215 // andps %xmm7,%xmm10
.byte 68,15,84,223 // andps %xmm7,%xmm11
.byte 68,15,84,199 // andps %xmm7,%xmm8
- .byte 15,40,21,189,149,1,0 // movaps 0x195bd(%rip),%xmm2 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
+ .byte 15,40,21,171,149,1,0 // movaps 0x195ab(%rip),%xmm2 # 2cd60 <_sk_overlay_sse2_8bit+0xf9c>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,218 // mulps %xmm2,%xmm3
- .byte 15,40,13,192,149,1,0 // movaps 0x195c0(%rip),%xmm1 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
+ .byte 15,40,13,174,149,1,0 // movaps 0x195ae(%rip),%xmm1 # 2cd70 <_sk_overlay_sse2_8bit+0xfac>
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,249 // mulps %xmm1,%xmm7
.byte 15,88,251 // addps %xmm3,%xmm7
- .byte 68,15,40,45,191,149,1,0 // movaps 0x195bf(%rip),%xmm13 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
+ .byte 68,15,40,45,173,149,1,0 // movaps 0x195ad(%rip),%xmm13 # 2cd80 <_sk_overlay_sse2_8bit+0xfbc>
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 68,15,88,247 // addps %xmm7,%xmm14
.byte 65,15,40,218 // movaps %xmm10,%xmm3
@@ -28226,7 +28220,7 @@ _sk_saturation_sse41:
.byte 65,15,88,253 // addps %xmm13,%xmm7
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11
- .byte 68,15,40,13,213,147,1,0 // movaps 0x193d5(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,13,195,147,1,0 // movaps 0x193c3(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 68,15,92,204 // subps %xmm4,%xmm9
.byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7
@@ -28281,14 +28275,14 @@ _sk_color_sse41:
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 68,15,89,244 // mulps %xmm4,%xmm14
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 68,15,40,13,144,147,1,0 // movaps 0x19390(%rip),%xmm9 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
+ .byte 68,15,40,13,126,147,1,0 // movaps 0x1937e(%rip),%xmm9 # 2cd60 <_sk_overlay_sse2_8bit+0xf9c>
.byte 65,15,40,250 // movaps %xmm10,%xmm7
.byte 65,15,89,249 // mulps %xmm9,%xmm7
- .byte 68,15,40,21,144,147,1,0 // movaps 0x19390(%rip),%xmm10 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
+ .byte 68,15,40,21,126,147,1,0 // movaps 0x1937e(%rip),%xmm10 # 2cd70 <_sk_overlay_sse2_8bit+0xfac>
.byte 65,15,40,219 // movaps %xmm11,%xmm3
.byte 65,15,89,218 // mulps %xmm10,%xmm3
.byte 15,88,223 // addps %xmm7,%xmm3
- .byte 68,15,40,29,141,147,1,0 // movaps 0x1938d(%rip),%xmm11 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
+ .byte 68,15,40,29,123,147,1,0 // movaps 0x1937b(%rip),%xmm11 # 2cd80 <_sk_overlay_sse2_8bit+0xfbc>
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
@@ -28373,7 +28367,7 @@ _sk_color_sse41:
.byte 65,15,88,251 // addps %xmm11,%xmm7
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1
- .byte 68,15,40,13,153,145,1,0 // movaps 0x19199(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,13,135,145,1,0 // movaps 0x19187(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 68,15,89,192 // mulps %xmm0,%xmm8
@@ -28425,13 +28419,13 @@ _sk_luminosity_sse41:
.byte 69,15,89,216 // mulps %xmm8,%xmm11
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,89,205 // mulps %xmm5,%xmm9
- .byte 68,15,40,5,97,145,1,0 // movaps 0x19161(%rip),%xmm8 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
+ .byte 68,15,40,5,79,145,1,0 // movaps 0x1914f(%rip),%xmm8 # 2cd60 <_sk_overlay_sse2_8bit+0xf9c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 68,15,40,21,101,145,1,0 // movaps 0x19165(%rip),%xmm10 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
+ .byte 68,15,40,21,83,145,1,0 // movaps 0x19153(%rip),%xmm10 # 2cd70 <_sk_overlay_sse2_8bit+0xfac>
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 65,15,89,234 // mulps %xmm10,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 68,15,40,37,99,145,1,0 // movaps 0x19163(%rip),%xmm12 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
+ .byte 68,15,40,37,81,145,1,0 // movaps 0x19151(%rip),%xmm12 # 2cd80 <_sk_overlay_sse2_8bit+0xfbc>
.byte 68,15,40,242 // movaps %xmm2,%xmm14
.byte 69,15,89,244 // mulps %xmm12,%xmm14
.byte 68,15,88,245 // addps %xmm5,%xmm14
@@ -28516,7 +28510,7 @@ _sk_luminosity_sse41:
.byte 65,15,88,244 // addps %xmm12,%xmm6
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9
- .byte 15,40,5,105,143,1,0 // movaps 0x18f69(%rip),%xmm0 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,5,87,143,1,0 // movaps 0x18f57(%rip),%xmm0 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,92,215 // subps %xmm7,%xmm2
.byte 15,89,226 // mulps %xmm2,%xmm4
@@ -28561,23 +28555,23 @@ _sk_srcover_rgba_8888_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,219,0,0,0 // jne 13eff <_sk_srcover_rgba_8888_sse41+0xfb>
+ .byte 15,133,219,0,0,0 // jne 13ef1 <_sk_srcover_rgba_8888_sse41+0xfb>
.byte 243,65,15,111,60,128 // movdqu (%r8,%rax,4),%xmm7
.byte 72,133,255 // test %rdi,%rdi
- .byte 102,15,111,37,123,143,1,0 // movdqa 0x18f7b(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,37,105,143,1,0 // movdqa 0x18f69(%rip),%xmm4 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,119,143,1,0 // pshufb 0x18f77(%rip),%xmm5 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
+ .byte 102,15,56,0,45,101,143,1,0 // pshufb 0x18f65(%rip),%xmm5 # 2cda0 <_sk_overlay_sse2_8bit+0xfdc>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,119,143,1,0 // pshufb 0x18f77(%rip),%xmm6 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
+ .byte 102,15,56,0,53,101,143,1,0 // pshufb 0x18f65(%rip),%xmm6 # 2cdb0 <_sk_overlay_sse2_8bit+0xfec>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 68,15,40,5,148,142,1,0 // movaps 0x18e94(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,130,142,1,0 // movaps 0x18e82(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,104,143,1,0 // movaps 0x18f68(%rip),%xmm12 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
+ .byte 68,15,40,37,86,143,1,0 // movaps 0x18f56(%rip),%xmm12 # 2cdc0 <_sk_overlay_sse2_8bit+0xffc>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -28603,7 +28597,7 @@ _sk_srcover_rgba_8888_sse41:
.byte 102,15,114,240,24 // pslld $0x18,%xmm0
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 102,15,235,193 // por %xmm1,%xmm0
- .byte 117,88 // jne 13f3d <_sk_srcover_rgba_8888_sse41+0x139>
+ .byte 117,88 // jne 13f2f <_sk_srcover_rgba_8888_sse41+0x139>
.byte 243,65,15,127,4,128 // movdqu %xmm0,(%r8,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -28614,32 +28608,32 @@ _sk_srcover_rgba_8888_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,91 // je 13f67 <_sk_srcover_rgba_8888_sse41+0x163>
+ .byte 116,91 // je 13f59 <_sk_srcover_rgba_8888_sse41+0x163>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,22 // je 13f2c <_sk_srcover_rgba_8888_sse41+0x128>
+ .byte 116,22 // je 13f1e <_sk_srcover_rgba_8888_sse41+0x128>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 15,133,10,255,255,255 // jne 13e2a <_sk_srcover_rgba_8888_sse41+0x26>
+ .byte 15,133,10,255,255,255 // jne 13e1c <_sk_srcover_rgba_8888_sse41+0x26>
.byte 102,65,15,110,100,128,8 // movd 0x8(%r8,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,128 // movq (%r8,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,237,254,255,255 // jmpq 13e2a <_sk_srcover_rgba_8888_sse41+0x26>
+ .byte 233,237,254,255,255 // jmpq 13e1c <_sk_srcover_rgba_8888_sse41+0x26>
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,40 // je 13f72 <_sk_srcover_rgba_8888_sse41+0x16e>
+ .byte 116,40 // je 13f64 <_sk_srcover_rgba_8888_sse41+0x16e>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,15 // je 13f5f <_sk_srcover_rgba_8888_sse41+0x15b>
+ .byte 116,15 // je 13f51 <_sk_srcover_rgba_8888_sse41+0x15b>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,149 // jne 13eeb <_sk_srcover_rgba_8888_sse41+0xe7>
+ .byte 117,149 // jne 13edd <_sk_srcover_rgba_8888_sse41+0xe7>
.byte 102,65,15,58,22,68,128,8,2 // pextrd $0x2,%xmm0,0x8(%r8,%rax,4)
.byte 102,65,15,214,4,128 // movq %xmm0,(%r8,%rax,4)
- .byte 235,132 // jmp 13eeb <_sk_srcover_rgba_8888_sse41+0xe7>
+ .byte 235,132 // jmp 13edd <_sk_srcover_rgba_8888_sse41+0xe7>
.byte 102,65,15,110,60,128 // movd (%r8,%rax,4),%xmm7
- .byte 233,184,254,255,255 // jmpq 13e2a <_sk_srcover_rgba_8888_sse41+0x26>
+ .byte 233,184,254,255,255 // jmpq 13e1c <_sk_srcover_rgba_8888_sse41+0x26>
.byte 102,65,15,126,4,128 // movd %xmm0,(%r8,%rax,4)
- .byte 233,110,255,255,255 // jmpq 13eeb <_sk_srcover_rgba_8888_sse41+0xe7>
+ .byte 233,110,255,255,255 // jmpq 13edd <_sk_srcover_rgba_8888_sse41+0xe7>
HIDDEN _sk_clamp_0_sse41
.globl _sk_clamp_0_sse41
@@ -28657,7 +28651,7 @@ HIDDEN _sk_clamp_1_sse41
.globl _sk_clamp_1_sse41
FUNCTION(_sk_clamp_1_sse41)
_sk_clamp_1_sse41:
- .byte 68,15,40,5,99,141,1,0 // movaps 0x18d63(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,81,141,1,0 // movaps 0x18d51(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -28669,7 +28663,7 @@ HIDDEN _sk_clamp_a_sse41
.globl _sk_clamp_a_sse41
FUNCTION(_sk_clamp_a_sse41)
_sk_clamp_a_sse41:
- .byte 15,93,29,72,141,1,0 // minps 0x18d48(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,93,29,54,141,1,0 // minps 0x18d36(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -28680,7 +28674,7 @@ HIDDEN _sk_clamp_a_dst_sse41
.globl _sk_clamp_a_dst_sse41
FUNCTION(_sk_clamp_a_dst_sse41)
_sk_clamp_a_dst_sse41:
- .byte 15,93,61,52,141,1,0 // minps 0x18d34(%rip),%xmm7 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,93,61,34,141,1,0 // minps 0x18d22(%rip),%xmm7 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -28715,7 +28709,7 @@ HIDDEN _sk_invert_sse41
.globl _sk_invert_sse41
FUNCTION(_sk_invert_sse41)
_sk_invert_sse41:
- .byte 68,15,40,5,240,140,1,0 // movaps 0x18cf0(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,222,140,1,0 // movaps 0x18cde(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -28777,7 +28771,7 @@ HIDDEN _sk_unpremul_sse41
FUNCTION(_sk_unpremul_sse41)
_sk_unpremul_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,122,140,1,0 // movaps 0x18c7a(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,13,104,140,1,0 // movaps 0x18c68(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -28791,20 +28785,20 @@ HIDDEN _sk_from_srgb_sse41
.globl _sk_from_srgb_sse41
FUNCTION(_sk_from_srgb_sse41)
_sk_from_srgb_sse41:
- .byte 68,15,40,29,69,141,1,0 // movaps 0x18d45(%rip),%xmm11 # 2cdf0 <_sk_overlay_sse2_8bit+0x1018>
+ .byte 68,15,40,29,51,141,1,0 // movaps 0x18d33(%rip),%xmm11 # 2cdd0 <_sk_overlay_sse2_8bit+0x100c>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
.byte 68,15,40,208 // movaps %xmm0,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
- .byte 68,15,40,37,189,140,1,0 // movaps 0x18cbd(%rip),%xmm12 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
+ .byte 68,15,40,37,171,140,1,0 // movaps 0x18cab(%rip),%xmm12 # 2cd60 <_sk_overlay_sse2_8bit+0xf9c>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,45,141,1,0 // movaps 0x18d2d(%rip),%xmm13 # 2ce00 <_sk_overlay_sse2_8bit+0x1028>
+ .byte 68,15,40,45,27,141,1,0 // movaps 0x18d1b(%rip),%xmm13 # 2cde0 <_sk_overlay_sse2_8bit+0x101c>
.byte 69,15,88,197 // addps %xmm13,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
- .byte 68,15,40,53,45,141,1,0 // movaps 0x18d2d(%rip),%xmm14 # 2ce10 <_sk_overlay_sse2_8bit+0x1038>
+ .byte 68,15,40,53,27,141,1,0 // movaps 0x18d1b(%rip),%xmm14 # 2cdf0 <_sk_overlay_sse2_8bit+0x102c>
.byte 69,15,88,198 // addps %xmm14,%xmm8
- .byte 68,15,40,61,49,141,1,0 // movaps 0x18d31(%rip),%xmm15 # 2ce20 <_sk_overlay_sse2_8bit+0x1048>
+ .byte 68,15,40,61,31,141,1,0 // movaps 0x18d1f(%rip),%xmm15 # 2ce00 <_sk_overlay_sse2_8bit+0x103c>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,40,209 // movaps %xmm1,%xmm10
@@ -28841,19 +28835,19 @@ FUNCTION(_sk_from_srgb_dst_sse41)
_sk_from_srgb_dst_sse41:
.byte 68,15,40,204 // movaps %xmm4,%xmm9
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,29,124,140,1,0 // movaps 0x18c7c(%rip),%xmm11 # 2cdf0 <_sk_overlay_sse2_8bit+0x1018>
+ .byte 68,15,40,29,106,140,1,0 // movaps 0x18c6a(%rip),%xmm11 # 2cdd0 <_sk_overlay_sse2_8bit+0x100c>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 68,15,40,37,245,139,1,0 // movaps 0x18bf5(%rip),%xmm12 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
+ .byte 68,15,40,37,227,139,1,0 // movaps 0x18be3(%rip),%xmm12 # 2cd60 <_sk_overlay_sse2_8bit+0xf9c>
.byte 65,15,89,228 // mulps %xmm12,%xmm4
- .byte 68,15,40,45,105,140,1,0 // movaps 0x18c69(%rip),%xmm13 # 2ce00 <_sk_overlay_sse2_8bit+0x1028>
+ .byte 68,15,40,45,87,140,1,0 // movaps 0x18c57(%rip),%xmm13 # 2cde0 <_sk_overlay_sse2_8bit+0x101c>
.byte 65,15,88,229 // addps %xmm13,%xmm4
.byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 68,15,40,53,106,140,1,0 // movaps 0x18c6a(%rip),%xmm14 # 2ce10 <_sk_overlay_sse2_8bit+0x1038>
+ .byte 68,15,40,53,88,140,1,0 // movaps 0x18c58(%rip),%xmm14 # 2cdf0 <_sk_overlay_sse2_8bit+0x102c>
.byte 65,15,88,230 // addps %xmm14,%xmm4
- .byte 68,15,40,61,110,140,1,0 // movaps 0x18c6e(%rip),%xmm15 # 2ce20 <_sk_overlay_sse2_8bit+0x1048>
+ .byte 68,15,40,61,92,140,1,0 // movaps 0x18c5c(%rip),%xmm15 # 2ce00 <_sk_overlay_sse2_8bit+0x103c>
.byte 69,15,194,207,1 // cmpltps %xmm15,%xmm9
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,226 // blendvps %xmm0,%xmm10,%xmm4
@@ -28897,22 +28891,22 @@ _sk_to_srgb_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 68,15,82,192 // rsqrtps %xmm0,%xmm8
- .byte 68,15,40,29,226,139,1,0 // movaps 0x18be2(%rip),%xmm11 # 2ce30 <_sk_overlay_sse2_8bit+0x1058>
+ .byte 68,15,40,29,208,139,1,0 // movaps 0x18bd0(%rip),%xmm11 # 2ce10 <_sk_overlay_sse2_8bit+0x104c>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
- .byte 68,15,40,37,226,139,1,0 // movaps 0x18be2(%rip),%xmm12 # 2ce40 <_sk_overlay_sse2_8bit+0x1068>
+ .byte 68,15,40,37,208,139,1,0 // movaps 0x18bd0(%rip),%xmm12 # 2ce20 <_sk_overlay_sse2_8bit+0x105c>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 69,15,89,252 // mulps %xmm12,%xmm15
- .byte 68,15,40,21,226,139,1,0 // movaps 0x18be2(%rip),%xmm10 # 2ce50 <_sk_overlay_sse2_8bit+0x1078>
+ .byte 68,15,40,21,208,139,1,0 // movaps 0x18bd0(%rip),%xmm10 # 2ce30 <_sk_overlay_sse2_8bit+0x106c>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,248 // mulps %xmm8,%xmm15
- .byte 68,15,40,45,226,139,1,0 // movaps 0x18be2(%rip),%xmm13 # 2ce60 <_sk_overlay_sse2_8bit+0x1088>
+ .byte 68,15,40,45,208,139,1,0 // movaps 0x18bd0(%rip),%xmm13 # 2ce40 <_sk_overlay_sse2_8bit+0x107c>
.byte 69,15,88,253 // addps %xmm13,%xmm15
- .byte 68,15,40,53,230,139,1,0 // movaps 0x18be6(%rip),%xmm14 # 2ce70 <_sk_overlay_sse2_8bit+0x1098>
+ .byte 68,15,40,53,212,139,1,0 // movaps 0x18bd4(%rip),%xmm14 # 2ce50 <_sk_overlay_sse2_8bit+0x108c>
.byte 69,15,88,198 // addps %xmm14,%xmm8
.byte 69,15,83,192 // rcpps %xmm8,%xmm8
.byte 69,15,89,199 // mulps %xmm15,%xmm8
- .byte 68,15,40,61,226,139,1,0 // movaps 0x18be2(%rip),%xmm15 # 2ce80 <_sk_overlay_sse2_8bit+0x10a8>
+ .byte 68,15,40,61,208,139,1,0 // movaps 0x18bd0(%rip),%xmm15 # 2ce60 <_sk_overlay_sse2_8bit+0x109c>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,82,202 // rsqrtps %xmm2,%xmm9
@@ -28967,7 +28961,7 @@ _sk_rgb_to_hsl_sse41:
.byte 68,15,93,224 // minps %xmm0,%xmm12
.byte 65,15,40,203 // movaps %xmm11,%xmm1
.byte 65,15,92,204 // subps %xmm12,%xmm1
- .byte 68,15,40,53,153,137,1,0 // movaps 0x18999(%rip),%xmm14 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,53,135,137,1,0 // movaps 0x18987(%rip),%xmm14 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,94,241 // divps %xmm1,%xmm14
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10
@@ -28976,27 +28970,27 @@ _sk_rgb_to_hsl_sse41:
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15
- .byte 68,15,84,61,0,139,1,0 // andps 0x18b00(%rip),%xmm15 # 2ce90 <_sk_overlay_sse2_8bit+0x10b8>
+ .byte 68,15,84,61,238,138,1,0 // andps 0x18aee(%rip),%xmm15 # 2ce70 <_sk_overlay_sse2_8bit+0x10ac>
.byte 68,15,88,248 // addps %xmm0,%xmm15
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 68,15,40,45,243,138,1,0 // movaps 0x18af3(%rip),%xmm13 # 2cea0 <_sk_overlay_sse2_8bit+0x10c8>
+ .byte 68,15,40,45,225,138,1,0 // movaps 0x18ae1(%rip),%xmm13 # 2ce80 <_sk_overlay_sse2_8bit+0x10bc>
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,198 // mulps %xmm14,%xmm8
- .byte 68,15,88,5,239,138,1,0 // addps 0x18aef(%rip),%xmm8 # 2ceb0 <_sk_overlay_sse2_8bit+0x10d8>
+ .byte 68,15,88,5,221,138,1,0 // addps 0x18add(%rip),%xmm8 # 2ce90 <_sk_overlay_sse2_8bit+0x10cc>
.byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8
- .byte 68,15,89,5,231,138,1,0 // mulps 0x18ae7(%rip),%xmm8 # 2cec0 <_sk_overlay_sse2_8bit+0x10e8>
+ .byte 68,15,89,5,213,138,1,0 // mulps 0x18ad5(%rip),%xmm8 # 2cea0 <_sk_overlay_sse2_8bit+0x10dc>
.byte 69,15,40,203 // movaps %xmm11,%xmm9
.byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9
.byte 69,15,84,193 // andps %xmm9,%xmm8
.byte 69,15,92,235 // subps %xmm11,%xmm13
.byte 69,15,88,220 // addps %xmm12,%xmm11
- .byte 15,40,5,235,136,1,0 // movaps 0x188eb(%rip),%xmm0 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 15,40,5,233,136,1,0 // movaps 0x188e9(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 65,15,40,211 // movaps %xmm11,%xmm2
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,194,194,1 // cmpltps %xmm2,%xmm0
@@ -29018,7 +29012,7 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp)
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,208 // movaps %xmm0,%xmm10
- .byte 68,15,40,13,161,136,1,0 // movaps 0x188a1(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,40,13,159,136,1,0 // movaps 0x1889f(%rip),%xmm9 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,194,194,2 // cmpleps %xmm2,%xmm0
.byte 15,40,217 // movaps %xmm1,%xmm3
@@ -29031,19 +29025,19 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp)
.byte 69,15,88,192 // addps %xmm8,%xmm8
.byte 68,15,92,197 // subps %xmm5,%xmm8
- .byte 68,15,40,53,92,138,1,0 // movaps 0x18a5c(%rip),%xmm14 # 2ced0 <_sk_overlay_sse2_8bit+0x10f8>
+ .byte 68,15,40,53,74,138,1,0 // movaps 0x18a4a(%rip),%xmm14 # 2ceb0 <_sk_overlay_sse2_8bit+0x10ec>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0
.byte 68,15,92,240 // subps %xmm0,%xmm14
- .byte 68,15,40,29,85,138,1,0 // movaps 0x18a55(%rip),%xmm11 # 2cee0 <_sk_overlay_sse2_8bit+0x1108>
+ .byte 68,15,40,29,67,138,1,0 // movaps 0x18a43(%rip),%xmm11 # 2cec0 <_sk_overlay_sse2_8bit+0x10fc>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 65,15,92,240 // subps %xmm8,%xmm6
- .byte 15,40,61,238,137,1,0 // movaps 0x189ee(%rip),%xmm7 # 2ce90 <_sk_overlay_sse2_8bit+0x10b8>
+ .byte 15,40,61,220,137,1,0 // movaps 0x189dc(%rip),%xmm7 # 2ce70 <_sk_overlay_sse2_8bit+0x10ac>
.byte 69,15,40,238 // movaps %xmm14,%xmm13
.byte 68,15,89,239 // mulps %xmm7,%xmm13
- .byte 15,40,29,255,137,1,0 // movaps 0x189ff(%rip),%xmm3 # 2ceb0 <_sk_overlay_sse2_8bit+0x10d8>
+ .byte 15,40,29,237,137,1,0 // movaps 0x189ed(%rip),%xmm3 # 2ce90 <_sk_overlay_sse2_8bit+0x10cc>
.byte 68,15,40,227 // movaps %xmm3,%xmm12
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 68,15,89,230 // mulps %xmm6,%xmm12
@@ -29053,7 +29047,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,40,253 // movaps %xmm5,%xmm15
.byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15
- .byte 68,15,40,37,222,137,1,0 // movaps 0x189de(%rip),%xmm12 # 2cec0 <_sk_overlay_sse2_8bit+0x10e8>
+ .byte 68,15,40,37,204,137,1,0 // movaps 0x189cc(%rip),%xmm12 # 2cea0 <_sk_overlay_sse2_8bit+0x10dc>
.byte 65,15,40,196 // movaps %xmm12,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,89,238 // mulps %xmm6,%xmm13
@@ -29087,7 +29081,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,40,198 // movaps %xmm14,%xmm0
.byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,88,21,118,137,1,0 // addps 0x18976(%rip),%xmm10 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
+ .byte 68,15,88,21,100,137,1,0 // addps 0x18964(%rip),%xmm10 # 2ced0 <_sk_overlay_sse2_8bit+0x110c>
.byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11
@@ -29142,11 +29136,11 @@ _sk_scale_u8_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,52 // jne 14661 <_sk_scale_u8_sse41+0x4c>
+ .byte 117,52 // jne 14653 <_sk_scale_u8_sse41+0x4c>
.byte 102,71,15,56,49,4,16 // pmovzxbd (%r8,%r10,1),%xmm8
- .byte 102,68,15,219,5,115,135,1,0 // pand 0x18773(%rip),%xmm8 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,68,15,219,5,97,135,1,0 // pand 0x18761(%rip),%xmm8 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,183,136,1,0 // mulps 0x188b7(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,89,5,165,136,1,0 // mulps 0x188a5(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -29157,12 +29151,12 @@ _sk_scale_u8_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,59 // je 146a9 <_sk_scale_u8_sse41+0x94>
+ .byte 116,59 // je 1469b <_sk_scale_u8_sse41+0x94>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,23 // je 14690 <_sk_scale_u8_sse41+0x7b>
+ .byte 116,23 // je 14682 <_sk_scale_u8_sse41+0x7b>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,181 // jne 14634 <_sk_scale_u8_sse41+0x1f>
+ .byte 117,181 // jne 14626 <_sk_scale_u8_sse41+0x1f>
.byte 67,15,182,68,16,2 // movzbl 0x2(%r8,%r10,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -29170,10 +29164,10 @@ _sk_scale_u8_sse41:
.byte 102,68,15,110,200 // movd %eax,%xmm9
.byte 102,69,15,56,49,201 // pmovzxbd %xmm9,%xmm9
.byte 102,69,15,58,14,193,15 // pblendw $0xf,%xmm9,%xmm8
- .byte 235,139 // jmp 14634 <_sk_scale_u8_sse41+0x1f>
+ .byte 235,139 // jmp 14626 <_sk_scale_u8_sse41+0x1f>
.byte 67,15,182,4,16 // movzbl (%r8,%r10,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,124,255,255,255 // jmpq 14634 <_sk_scale_u8_sse41+0x1f>
+ .byte 233,124,255,255,255 // jmpq 14626 <_sk_scale_u8_sse41+0x1f>
HIDDEN _sk_scale_565_sse41
.globl _sk_scale_565_sse41
@@ -29188,19 +29182,19 @@ _sk_scale_565_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,159,0,0,0 // jne 1477b <_sk_scale_565_sse41+0xc3>
+ .byte 15,133,159,0,0,0 // jne 1476d <_sk_scale_565_sse41+0xc3>
.byte 102,71,15,56,51,28,80 // pmovzxwd (%r8,%r10,2),%xmm11
- .byte 102,15,111,5,37,136,1,0 // movdqa 0x18825(%rip),%xmm0 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
+ .byte 102,15,111,5,19,136,1,0 // movdqa 0x18813(%rip),%xmm0 # 2cef0 <_sk_overlay_sse2_8bit+0x112c>
.byte 102,65,15,219,195 // pand %xmm11,%xmm0
.byte 68,15,91,200 // cvtdq2ps %xmm0,%xmm9
- .byte 68,15,89,13,36,136,1,0 // mulps 0x18824(%rip),%xmm9 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
- .byte 102,15,111,5,44,136,1,0 // movdqa 0x1882c(%rip),%xmm0 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
+ .byte 68,15,89,13,18,136,1,0 // mulps 0x18812(%rip),%xmm9 # 2cf00 <_sk_overlay_sse2_8bit+0x113c>
+ .byte 102,15,111,5,26,136,1,0 // movdqa 0x1881a(%rip),%xmm0 # 2cf10 <_sk_overlay_sse2_8bit+0x114c>
.byte 102,65,15,219,195 // pand %xmm11,%xmm0
.byte 68,15,91,208 // cvtdq2ps %xmm0,%xmm10
- .byte 68,15,89,21,43,136,1,0 // mulps 0x1882b(%rip),%xmm10 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
- .byte 102,68,15,219,29,50,136,1,0 // pand 0x18832(%rip),%xmm11 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
+ .byte 68,15,89,21,25,136,1,0 // mulps 0x18819(%rip),%xmm10 # 2cf20 <_sk_overlay_sse2_8bit+0x115c>
+ .byte 102,68,15,219,29,32,136,1,0 // pand 0x18820(%rip),%xmm11 # 2cf30 <_sk_overlay_sse2_8bit+0x116c>
.byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11
- .byte 68,15,89,29,54,136,1,0 // mulps 0x18836(%rip),%xmm11 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
+ .byte 68,15,89,29,36,136,1,0 // mulps 0x18824(%rip),%xmm11 # 2cf40 <_sk_overlay_sse2_8bit+0x117c>
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
.byte 69,15,40,226 // movaps %xmm10,%xmm12
@@ -29225,22 +29219,22 @@ _sk_scale_565_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,60 // je 147c4 <_sk_scale_565_sse41+0x10c>
+ .byte 116,60 // je 147b6 <_sk_scale_565_sse41+0x10c>
.byte 102,69,15,239,219 // pxor %xmm11,%xmm11
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,26 // je 147ad <_sk_scale_565_sse41+0xf5>
+ .byte 116,26 // je 1479f <_sk_scale_565_sse41+0xf5>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 15,133,70,255,255,255 // jne 146e3 <_sk_scale_565_sse41+0x2b>
+ .byte 15,133,70,255,255,255 // jne 146d5 <_sk_scale_565_sse41+0x2b>
.byte 67,15,183,68,80,4 // movzwl 0x4(%r8,%r10,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,68,15,112,216,69 // pshufd $0x45,%xmm0,%xmm11
.byte 102,67,15,110,4,80 // movd (%r8,%r10,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,68,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm11
- .byte 233,31,255,255,255 // jmpq 146e3 <_sk_scale_565_sse41+0x2b>
+ .byte 233,31,255,255,255 // jmpq 146d5 <_sk_scale_565_sse41+0x2b>
.byte 67,15,183,4,80 // movzwl (%r8,%r10,2),%eax
.byte 102,68,15,110,216 // movd %eax,%xmm11
- .byte 233,16,255,255,255 // jmpq 146e3 <_sk_scale_565_sse41+0x2b>
+ .byte 233,16,255,255,255 // jmpq 146d5 <_sk_scale_565_sse41+0x2b>
HIDDEN _sk_lerp_1_float_sse41
.globl _sk_lerp_1_float_sse41
@@ -29275,11 +29269,11 @@ _sk_lerp_u8_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,72 // jne 1486b <_sk_lerp_u8_sse41+0x60>
+ .byte 117,72 // jne 1485d <_sk_lerp_u8_sse41+0x60>
.byte 102,71,15,56,49,4,16 // pmovzxbd (%r8,%r10,1),%xmm8
- .byte 102,68,15,219,5,125,133,1,0 // pand 0x1857d(%rip),%xmm8 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,68,15,219,5,107,133,1,0 // pand 0x1856b(%rip),%xmm8 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,193,134,1,0 // mulps 0x186c1(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,89,5,175,134,1,0 // mulps 0x186af(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -29297,12 +29291,12 @@ _sk_lerp_u8_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,62 // je 148b6 <_sk_lerp_u8_sse41+0xab>
+ .byte 116,62 // je 148a8 <_sk_lerp_u8_sse41+0xab>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,23 // je 1489a <_sk_lerp_u8_sse41+0x8f>
+ .byte 116,23 // je 1488c <_sk_lerp_u8_sse41+0x8f>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,161 // jne 1482a <_sk_lerp_u8_sse41+0x1f>
+ .byte 117,161 // jne 1481c <_sk_lerp_u8_sse41+0x1f>
.byte 67,15,182,68,16,2 // movzbl 0x2(%r8,%r10,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -29310,10 +29304,10 @@ _sk_lerp_u8_sse41:
.byte 102,68,15,110,200 // movd %eax,%xmm9
.byte 102,69,15,56,49,201 // pmovzxbd %xmm9,%xmm9
.byte 102,69,15,58,14,193,15 // pblendw $0xf,%xmm9,%xmm8
- .byte 233,116,255,255,255 // jmpq 1482a <_sk_lerp_u8_sse41+0x1f>
+ .byte 233,116,255,255,255 // jmpq 1481c <_sk_lerp_u8_sse41+0x1f>
.byte 67,15,182,4,16 // movzbl (%r8,%r10,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,101,255,255,255 // jmpq 1482a <_sk_lerp_u8_sse41+0x1f>
+ .byte 233,101,255,255,255 // jmpq 1481c <_sk_lerp_u8_sse41+0x1f>
HIDDEN _sk_lerp_565_sse41
.globl _sk_lerp_565_sse41
@@ -29328,19 +29322,19 @@ _sk_lerp_565_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,165,0,0,0 // jne 1498e <_sk_lerp_565_sse41+0xc9>
+ .byte 15,133,165,0,0,0 // jne 14980 <_sk_lerp_565_sse41+0xc9>
.byte 102,71,15,56,51,20,80 // pmovzxwd (%r8,%r10,2),%xmm10
- .byte 102,15,111,5,24,134,1,0 // movdqa 0x18618(%rip),%xmm0 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
+ .byte 102,15,111,5,6,134,1,0 // movdqa 0x18606(%rip),%xmm0 # 2cef0 <_sk_overlay_sse2_8bit+0x112c>
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 68,15,91,200 // cvtdq2ps %xmm0,%xmm9
- .byte 68,15,89,13,23,134,1,0 // mulps 0x18617(%rip),%xmm9 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
- .byte 102,15,111,5,31,134,1,0 // movdqa 0x1861f(%rip),%xmm0 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
+ .byte 68,15,89,13,5,134,1,0 // mulps 0x18605(%rip),%xmm9 # 2cf00 <_sk_overlay_sse2_8bit+0x113c>
+ .byte 102,15,111,5,13,134,1,0 // movdqa 0x1860d(%rip),%xmm0 # 2cf10 <_sk_overlay_sse2_8bit+0x114c>
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 68,15,91,216 // cvtdq2ps %xmm0,%xmm11
- .byte 68,15,89,29,30,134,1,0 // mulps 0x1861e(%rip),%xmm11 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
- .byte 102,68,15,219,21,37,134,1,0 // pand 0x18625(%rip),%xmm10 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
+ .byte 68,15,89,29,12,134,1,0 // mulps 0x1860c(%rip),%xmm11 # 2cf20 <_sk_overlay_sse2_8bit+0x115c>
+ .byte 102,68,15,219,21,19,134,1,0 // pand 0x18613(%rip),%xmm10 # 2cf30 <_sk_overlay_sse2_8bit+0x116c>
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,41,134,1,0 // mulps 0x18629(%rip),%xmm10 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
+ .byte 68,15,89,21,23,134,1,0 // mulps 0x18617(%rip),%xmm10 # 2cf40 <_sk_overlay_sse2_8bit+0x117c>
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -29368,22 +29362,22 @@ _sk_lerp_565_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,60 // je 149d7 <_sk_lerp_565_sse41+0x112>
+ .byte 116,60 // je 149c9 <_sk_lerp_565_sse41+0x112>
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,26 // je 149c0 <_sk_lerp_565_sse41+0xfb>
+ .byte 116,26 // je 149b2 <_sk_lerp_565_sse41+0xfb>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 15,133,64,255,255,255 // jne 148f0 <_sk_lerp_565_sse41+0x2b>
+ .byte 15,133,64,255,255,255 // jne 148e2 <_sk_lerp_565_sse41+0x2b>
.byte 67,15,183,68,80,4 // movzwl 0x4(%r8,%r10,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,68,15,112,208,69 // pshufd $0x45,%xmm0,%xmm10
.byte 102,67,15,110,4,80 // movd (%r8,%r10,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,68,15,58,14,208,15 // pblendw $0xf,%xmm0,%xmm10
- .byte 233,25,255,255,255 // jmpq 148f0 <_sk_lerp_565_sse41+0x2b>
+ .byte 233,25,255,255,255 // jmpq 148e2 <_sk_lerp_565_sse41+0x2b>
.byte 67,15,183,4,80 // movzwl (%r8,%r10,2),%eax
.byte 102,68,15,110,208 // movd %eax,%xmm10
- .byte 233,10,255,255,255 // jmpq 148f0 <_sk_lerp_565_sse41+0x2b>
+ .byte 233,10,255,255,255 // jmpq 148e2 <_sk_lerp_565_sse41+0x2b>
HIDDEN _sk_load_tables_sse41
.globl _sk_load_tables_sse41
@@ -29392,11 +29386,11 @@ _sk_load_tables_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,0 // mov (%rax),%r8
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,20,1,0,0 // jne 14b08 <_sk_load_tables_sse41+0x122>
+ .byte 15,133,20,1,0,0 // jne 14afa <_sk_load_tables_sse41+0x122>
.byte 243,69,15,111,4,144 // movdqu (%r8,%rdx,4),%xmm8
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,15,111,5,171,131,1,0 // movdqa 0x183ab(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,5,153,131,1,0 // movdqa 0x18399(%rip),%xmm0 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,73,15,58,22,192,1 // pextrq $0x1,%xmm0,%r8
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -29411,7 +29405,7 @@ _sk_load_tables_sse41:
.byte 102,66,15,58,33,4,155,32 // insertps $0x20,(%rbx,%r11,4),%xmm0
.byte 102,66,15,58,33,4,3,48 // insertps $0x30,(%rbx,%r8,1),%xmm0
.byte 102,65,15,111,200 // movdqa %xmm8,%xmm1
- .byte 102,15,56,0,13,102,131,1,0 // pshufb 0x18366(%rip),%xmm1 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
+ .byte 102,15,56,0,13,84,131,1,0 // pshufb 0x18354(%rip),%xmm1 # 2cda0 <_sk_overlay_sse2_8bit+0xfdc>
.byte 102,73,15,58,22,200,1 // pextrq $0x1,%xmm1,%r8
.byte 102,72,15,126,203 // movq %xmm1,%rbx
.byte 68,15,182,203 // movzbl %bl,%r9d
@@ -29426,7 +29420,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1
.byte 76,139,64,24 // mov 0x18(%rax),%r8
.byte 102,65,15,111,208 // movdqa %xmm8,%xmm2
- .byte 102,15,56,0,21,34,131,1,0 // pshufb 0x18322(%rip),%xmm2 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
+ .byte 102,15,56,0,21,16,131,1,0 // pshufb 0x18310(%rip),%xmm2 # 2cdb0 <_sk_overlay_sse2_8bit+0xfec>
.byte 102,72,15,58,22,211,1 // pextrq $0x1,%xmm2,%rbx
.byte 102,72,15,126,208 // movq %xmm2,%rax
.byte 68,15,182,200 // movzbl %al,%r9d
@@ -29441,7 +29435,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3
- .byte 15,89,29,255,131,1,0 // mulps 0x183ff(%rip),%xmm3 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 15,89,29,237,131,1,0 // mulps 0x183ed(%rip),%xmm3 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -29449,19 +29443,19 @@ _sk_load_tables_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,52 // je 14b49 <_sk_load_tables_sse41+0x163>
+ .byte 116,52 // je 14b3b <_sk_load_tables_sse41+0x163>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,23 // je 14b37 <_sk_load_tables_sse41+0x151>
+ .byte 116,23 // je 14b29 <_sk_load_tables_sse41+0x151>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 15,133,208,254,255,255 // jne 149fa <_sk_load_tables_sse41+0x14>
+ .byte 15,133,208,254,255,255 // jne 149ec <_sk_load_tables_sse41+0x14>
.byte 102,65,15,110,68,144,8 // movd 0x8(%r8,%rdx,4),%xmm0
.byte 102,68,15,112,192,69 // pshufd $0x45,%xmm0,%xmm8
.byte 243,65,15,126,4,144 // movq (%r8,%rdx,4),%xmm0
.byte 102,68,15,58,14,192,15 // pblendw $0xf,%xmm0,%xmm8
- .byte 233,177,254,255,255 // jmpq 149fa <_sk_load_tables_sse41+0x14>
+ .byte 233,177,254,255,255 // jmpq 149ec <_sk_load_tables_sse41+0x14>
.byte 102,69,15,110,4,144 // movd (%r8,%rdx,4),%xmm8
- .byte 233,166,254,255,255 // jmpq 149fa <_sk_load_tables_sse41+0x14>
+ .byte 233,166,254,255,255 // jmpq 149ec <_sk_load_tables_sse41+0x14>
HIDDEN _sk_load_tables_u16_be_sse41
.globl _sk_load_tables_u16_be_sse41
@@ -29471,7 +29465,7 @@ _sk_load_tables_u16_be_sse41:
.byte 76,139,0 // mov (%rax),%r8
.byte 76,141,12,149,0,0,0,0 // lea 0x0(,%rdx,4),%r9
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,95,1,0,0 // jne 14cc9 <_sk_load_tables_u16_be_sse41+0x175>
+ .byte 15,133,95,1,0,0 // jne 14cbb <_sk_load_tables_u16_be_sse41+0x175>
.byte 102,67,15,16,4,72 // movupd (%r8,%r9,2),%xmm0
.byte 243,67,15,111,76,72,16 // movdqu 0x10(%r8,%r9,2),%xmm1
.byte 65,86 // push %r14
@@ -29482,7 +29476,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,5,209,131,1,0 // movdqa 0x183d1(%rip),%xmm8 # 2cf70 <_sk_overlay_sse2_8bit+0x1198>
+ .byte 102,68,15,111,5,191,131,1,0 // movdqa 0x183bf(%rip),%xmm8 # 2cf50 <_sk_overlay_sse2_8bit+0x118c>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -29500,7 +29494,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,15,58,33,194,32 // insertps $0x20,%xmm2,%xmm0
.byte 243,66,15,16,20,3 // movss (%rbx,%r8,1),%xmm2
.byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0
- .byte 102,15,56,0,13,128,131,1,0 // pshufb 0x18380(%rip),%xmm1 # 2cf80 <_sk_overlay_sse2_8bit+0x11a8>
+ .byte 102,15,56,0,13,110,131,1,0 // pshufb 0x1836e(%rip),%xmm1 # 2cf60 <_sk_overlay_sse2_8bit+0x119c>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,200,1 // pextrq $0x1,%xmm1,%r8
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -29536,23 +29530,23 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,235,216 // por %xmm8,%xmm3
.byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,206,130,1,0 // mulps 0x182ce(%rip),%xmm3 # 2cf90 <_sk_overlay_sse2_8bit+0x11b8>
+ .byte 15,89,29,188,130,1,0 // mulps 0x182bc(%rip),%xmm3 # 2cf70 <_sk_overlay_sse2_8bit+0x11ac>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 255,224 // jmpq *%rax
.byte 242,67,15,16,4,72 // movsd (%r8,%r9,2),%xmm0
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,13 // jne 14ce2 <_sk_load_tables_u16_be_sse41+0x18e>
+ .byte 117,13 // jne 14cd4 <_sk_load_tables_u16_be_sse41+0x18e>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,149,254,255,255 // jmpq 14b77 <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 233,149,254,255,255 // jmpq 14b69 <_sk_load_tables_u16_be_sse41+0x23>
.byte 102,67,15,22,68,72,8 // movhpd 0x8(%r8,%r9,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 15,130,128,254,255,255 // jb 14b77 <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 15,130,128,254,255,255 // jb 14b69 <_sk_load_tables_u16_be_sse41+0x23>
.byte 243,67,15,126,76,72,16 // movq 0x10(%r8,%r9,2),%xmm1
- .byte 233,116,254,255,255 // jmpq 14b77 <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 233,116,254,255,255 // jmpq 14b69 <_sk_load_tables_u16_be_sse41+0x23>
HIDDEN _sk_load_tables_rgb_u16_be_sse41
.globl _sk_load_tables_rgb_u16_be_sse41
@@ -29562,7 +29556,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 76,139,0 // mov (%rax),%r8
.byte 76,141,12,82 // lea (%rdx,%rdx,2),%r9
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,79,1,0,0 // jne 14e64 <_sk_load_tables_rgb_u16_be_sse41+0x161>
+ .byte 15,133,79,1,0,0 // jne 14e56 <_sk_load_tables_rgb_u16_be_sse41+0x161>
.byte 243,67,15,111,20,72 // movdqu (%r8,%r9,2),%xmm2
.byte 243,67,15,111,76,72,8 // movdqu 0x8(%r8,%r9,2),%xmm1
.byte 102,15,115,217,4 // psrldq $0x4,%xmm1
@@ -29576,7 +29570,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
- .byte 102,68,15,111,5,23,130,1,0 // movdqa 0x18217(%rip),%xmm8 # 2cf70 <_sk_overlay_sse2_8bit+0x1198>
+ .byte 102,68,15,111,5,5,130,1,0 // movdqa 0x18205(%rip),%xmm8 # 2cf50 <_sk_overlay_sse2_8bit+0x118c>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -29594,7 +29588,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,15,58,33,195,32 // insertps $0x20,%xmm3,%xmm0
.byte 243,66,15,16,28,3 // movss (%rbx,%r8,1),%xmm3
.byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0
- .byte 102,15,56,0,13,230,129,1,0 // pshufb 0x181e6(%rip),%xmm1 # 2cfa0 <_sk_overlay_sse2_8bit+0x11c8>
+ .byte 102,15,56,0,13,212,129,1,0 // pshufb 0x181d4(%rip),%xmm1 # 2cf80 <_sk_overlay_sse2_8bit+0x11bc>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,200,1 // pextrq $0x1,%xmm1,%r8
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -29625,7 +29619,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 243,65,15,16,28,24 // movss (%r8,%rbx,1),%xmm3
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,161,126,1,0 // movaps 0x17ea1(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,143,126,1,0 // movaps 0x17e8f(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 255,224 // jmpq *%rax
@@ -29633,21 +29627,21 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,67,15,196,84,72,4,2 // pinsrw $0x2,0x4(%r8,%r9,2),%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,14 // jne 14e8a <_sk_load_tables_rgb_u16_be_sse41+0x187>
+ .byte 117,14 // jne 14e7c <_sk_load_tables_rgb_u16_be_sse41+0x187>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
- .byte 233,177,254,255,255 // jmpq 14d3b <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,177,254,255,255 // jmpq 14d2d <_sk_load_tables_rgb_u16_be_sse41+0x38>
.byte 102,71,15,110,76,72,6 // movd 0x6(%r8,%r9,2),%xmm9
.byte 102,71,15,196,76,72,10,2 // pinsrw $0x2,0xa(%r8,%r9,2),%xmm9
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,24 // jb 14ebb <_sk_load_tables_rgb_u16_be_sse41+0x1b8>
+ .byte 114,24 // jb 14ead <_sk_load_tables_rgb_u16_be_sse41+0x1b8>
.byte 102,67,15,110,76,72,12 // movd 0xc(%r8,%r9,2),%xmm1
.byte 102,67,15,196,76,72,16,2 // pinsrw $0x2,0x10(%r8,%r9,2),%xmm1
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,128,254,255,255 // jmpq 14d3b <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,128,254,255,255 // jmpq 14d2d <_sk_load_tables_rgb_u16_be_sse41+0x38>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,119,254,255,255 // jmpq 14d3b <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,119,254,255,255 // jmpq 14d2d <_sk_load_tables_rgb_u16_be_sse41+0x38>
HIDDEN _sk_byte_tables_sse41
.globl _sk_byte_tables_sse41
@@ -29657,7 +29651,7 @@ _sk_byte_tables_sse41:
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,13,127,1,0 // movaps 0x17f0d(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
+ .byte 68,15,40,5,251,126,1,0 // movaps 0x17efb(%rip),%xmm8 # 2cdc0 <_sk_overlay_sse2_8bit+0xffc>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,58,22,192,1 // pextrq $0x1,%xmm0,%r8
@@ -29676,7 +29670,7 @@ _sk_byte_tables_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,206,127,1,0 // movaps 0x17fce(%rip),%xmm9 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,13,188,127,1,0 // movaps 0x17fbc(%rip),%xmm9 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -29770,7 +29764,7 @@ _sk_byte_tables_rgb_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,58,126,1,0 // movaps 0x17e3a(%rip),%xmm9 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,13,40,126,1,0 // movaps 0x17e28(%rip),%xmm9 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -29948,31 +29942,31 @@ _sk_parametric_r_sse41:
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8
- .byte 68,15,89,5,44,124,1,0 // mulps 0x17c2c(%rip),%xmm8 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
- .byte 68,15,84,21,52,124,1,0 // andps 0x17c34(%rip),%xmm10 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
- .byte 68,15,86,21,76,121,1,0 // orps 0x1794c(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
- .byte 68,15,88,5,52,124,1,0 // addps 0x17c34(%rip),%xmm8 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
- .byte 68,15,40,37,60,124,1,0 // movaps 0x17c3c(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
+ .byte 68,15,89,5,26,124,1,0 // mulps 0x17c1a(%rip),%xmm8 # 2cf90 <_sk_overlay_sse2_8bit+0x11cc>
+ .byte 68,15,84,21,34,124,1,0 // andps 0x17c22(%rip),%xmm10 # 2cfa0 <_sk_overlay_sse2_8bit+0x11dc>
+ .byte 68,15,86,21,74,121,1,0 // orps 0x1794a(%rip),%xmm10 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
+ .byte 68,15,88,5,34,124,1,0 // addps 0x17c22(%rip),%xmm8 # 2cfb0 <_sk_overlay_sse2_8bit+0x11ec>
+ .byte 68,15,40,37,42,124,1,0 // movaps 0x17c2a(%rip),%xmm12 # 2cfc0 <_sk_overlay_sse2_8bit+0x11fc>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
- .byte 68,15,88,21,60,124,1,0 // addps 0x17c3c(%rip),%xmm10 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
- .byte 68,15,40,37,68,124,1,0 // movaps 0x17c44(%rip),%xmm12 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
+ .byte 68,15,88,21,42,124,1,0 // addps 0x17c2a(%rip),%xmm10 # 2cfd0 <_sk_overlay_sse2_8bit+0x120c>
+ .byte 68,15,40,37,50,124,1,0 // movaps 0x17c32(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x121c>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
.byte 69,15,89,195 // mulps %xmm11,%xmm8
.byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,5,49,124,1,0 // addps 0x17c31(%rip),%xmm8 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
- .byte 68,15,40,21,57,124,1,0 // movaps 0x17c39(%rip),%xmm10 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
+ .byte 68,15,88,5,31,124,1,0 // addps 0x17c1f(%rip),%xmm8 # 2cff0 <_sk_overlay_sse2_8bit+0x122c>
+ .byte 68,15,40,21,39,124,1,0 // movaps 0x17c27(%rip),%xmm10 # 2d000 <_sk_overlay_sse2_8bit+0x123c>
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 69,15,92,194 // subps %xmm10,%xmm8
- .byte 68,15,40,21,57,124,1,0 // movaps 0x17c39(%rip),%xmm10 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
+ .byte 68,15,40,21,39,124,1,0 // movaps 0x17c27(%rip),%xmm10 # 2d010 <_sk_overlay_sse2_8bit+0x124c>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 68,15,40,29,61,124,1,0 // movaps 0x17c3d(%rip),%xmm11 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
+ .byte 68,15,40,29,43,124,1,0 // movaps 0x17c2b(%rip),%xmm11 # 2d020 <_sk_overlay_sse2_8bit+0x125c>
.byte 69,15,94,218 // divps %xmm10,%xmm11
.byte 69,15,88,216 // addps %xmm8,%xmm11
- .byte 68,15,89,29,61,124,1,0 // mulps 0x17c3d(%rip),%xmm11 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
+ .byte 68,15,89,29,43,124,1,0 // mulps 0x17c2b(%rip),%xmm11 # 2d030 <_sk_overlay_sse2_8bit+0x126c>
.byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10
.byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
@@ -29980,7 +29974,7 @@ _sk_parametric_r_sse41:
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,196,120,1,0 // minps 0x178c4(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,93,5,178,120,1,0 // minps 0x178b2(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -30010,31 +30004,31 @@ _sk_parametric_g_sse41:
.byte 68,15,88,217 // addps %xmm1,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,5,123,1,0 // mulps 0x17b05(%rip),%xmm12 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
- .byte 68,15,84,29,13,123,1,0 // andps 0x17b0d(%rip),%xmm11 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
- .byte 68,15,86,29,37,120,1,0 // orps 0x17825(%rip),%xmm11 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
- .byte 68,15,88,37,13,123,1,0 // addps 0x17b0d(%rip),%xmm12 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
- .byte 15,40,13,22,123,1,0 // movaps 0x17b16(%rip),%xmm1 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
+ .byte 68,15,89,37,243,122,1,0 // mulps 0x17af3(%rip),%xmm12 # 2cf90 <_sk_overlay_sse2_8bit+0x11cc>
+ .byte 68,15,84,29,251,122,1,0 // andps 0x17afb(%rip),%xmm11 # 2cfa0 <_sk_overlay_sse2_8bit+0x11dc>
+ .byte 68,15,86,29,35,120,1,0 // orps 0x17823(%rip),%xmm11 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
+ .byte 68,15,88,37,251,122,1,0 // addps 0x17afb(%rip),%xmm12 # 2cfb0 <_sk_overlay_sse2_8bit+0x11ec>
+ .byte 15,40,13,4,123,1,0 // movaps 0x17b04(%rip),%xmm1 # 2cfc0 <_sk_overlay_sse2_8bit+0x11fc>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,88,29,22,123,1,0 // addps 0x17b16(%rip),%xmm11 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
- .byte 15,40,13,31,123,1,0 // movaps 0x17b1f(%rip),%xmm1 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
+ .byte 68,15,88,29,4,123,1,0 // addps 0x17b04(%rip),%xmm11 # 2cfd0 <_sk_overlay_sse2_8bit+0x120c>
+ .byte 15,40,13,13,123,1,0 // movaps 0x17b0d(%rip),%xmm1 # 2cfe0 <_sk_overlay_sse2_8bit+0x121c>
.byte 65,15,94,203 // divps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,12,123,1,0 // addps 0x17b0c(%rip),%xmm12 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
- .byte 15,40,13,21,123,1,0 // movaps 0x17b15(%rip),%xmm1 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
+ .byte 68,15,88,37,250,122,1,0 // addps 0x17afa(%rip),%xmm12 # 2cff0 <_sk_overlay_sse2_8bit+0x122c>
+ .byte 15,40,13,3,123,1,0 // movaps 0x17b03(%rip),%xmm1 # 2d000 <_sk_overlay_sse2_8bit+0x123c>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,40,21,21,123,1,0 // movaps 0x17b15(%rip),%xmm10 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
+ .byte 68,15,40,21,3,123,1,0 // movaps 0x17b03(%rip),%xmm10 # 2d010 <_sk_overlay_sse2_8bit+0x124c>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,13,26,123,1,0 // movaps 0x17b1a(%rip),%xmm1 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
+ .byte 15,40,13,8,123,1,0 // movaps 0x17b08(%rip),%xmm1 # 2d020 <_sk_overlay_sse2_8bit+0x125c>
.byte 65,15,94,202 // divps %xmm10,%xmm1
.byte 65,15,88,204 // addps %xmm12,%xmm1
- .byte 15,89,13,27,123,1,0 // mulps 0x17b1b(%rip),%xmm1 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
+ .byte 15,89,13,9,123,1,0 // mulps 0x17b09(%rip),%xmm1 # 2d030 <_sk_overlay_sse2_8bit+0x126c>
.byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10
.byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
@@ -30042,7 +30036,7 @@ _sk_parametric_g_sse41:
.byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,200 // maxps %xmm0,%xmm1
- .byte 15,93,13,166,119,1,0 // minps 0x177a6(%rip),%xmm1 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,93,13,148,119,1,0 // minps 0x17794(%rip),%xmm1 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -30072,31 +30066,31 @@ _sk_parametric_b_sse41:
.byte 68,15,88,218 // addps %xmm2,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,231,121,1,0 // mulps 0x179e7(%rip),%xmm12 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
- .byte 68,15,84,29,239,121,1,0 // andps 0x179ef(%rip),%xmm11 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
- .byte 68,15,86,29,7,119,1,0 // orps 0x17707(%rip),%xmm11 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
- .byte 68,15,88,37,239,121,1,0 // addps 0x179ef(%rip),%xmm12 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
- .byte 15,40,21,248,121,1,0 // movaps 0x179f8(%rip),%xmm2 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
+ .byte 68,15,89,37,213,121,1,0 // mulps 0x179d5(%rip),%xmm12 # 2cf90 <_sk_overlay_sse2_8bit+0x11cc>
+ .byte 68,15,84,29,221,121,1,0 // andps 0x179dd(%rip),%xmm11 # 2cfa0 <_sk_overlay_sse2_8bit+0x11dc>
+ .byte 68,15,86,29,5,119,1,0 // orps 0x17705(%rip),%xmm11 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
+ .byte 68,15,88,37,221,121,1,0 // addps 0x179dd(%rip),%xmm12 # 2cfb0 <_sk_overlay_sse2_8bit+0x11ec>
+ .byte 15,40,21,230,121,1,0 // movaps 0x179e6(%rip),%xmm2 # 2cfc0 <_sk_overlay_sse2_8bit+0x11fc>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,88,29,248,121,1,0 // addps 0x179f8(%rip),%xmm11 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
- .byte 15,40,21,1,122,1,0 // movaps 0x17a01(%rip),%xmm2 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
+ .byte 68,15,88,29,230,121,1,0 // addps 0x179e6(%rip),%xmm11 # 2cfd0 <_sk_overlay_sse2_8bit+0x120c>
+ .byte 15,40,21,239,121,1,0 // movaps 0x179ef(%rip),%xmm2 # 2cfe0 <_sk_overlay_sse2_8bit+0x121c>
.byte 65,15,94,211 // divps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,238,121,1,0 // addps 0x179ee(%rip),%xmm12 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
- .byte 15,40,21,247,121,1,0 // movaps 0x179f7(%rip),%xmm2 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
+ .byte 68,15,88,37,220,121,1,0 // addps 0x179dc(%rip),%xmm12 # 2cff0 <_sk_overlay_sse2_8bit+0x122c>
+ .byte 15,40,21,229,121,1,0 // movaps 0x179e5(%rip),%xmm2 # 2d000 <_sk_overlay_sse2_8bit+0x123c>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,40,21,247,121,1,0 // movaps 0x179f7(%rip),%xmm10 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
+ .byte 68,15,40,21,229,121,1,0 // movaps 0x179e5(%rip),%xmm10 # 2d010 <_sk_overlay_sse2_8bit+0x124c>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,21,252,121,1,0 // movaps 0x179fc(%rip),%xmm2 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
+ .byte 15,40,21,234,121,1,0 // movaps 0x179ea(%rip),%xmm2 # 2d020 <_sk_overlay_sse2_8bit+0x125c>
.byte 65,15,94,210 // divps %xmm10,%xmm2
.byte 65,15,88,212 // addps %xmm12,%xmm2
- .byte 15,89,21,253,121,1,0 // mulps 0x179fd(%rip),%xmm2 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
+ .byte 15,89,21,235,121,1,0 // mulps 0x179eb(%rip),%xmm2 # 2d030 <_sk_overlay_sse2_8bit+0x126c>
.byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10
.byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
@@ -30104,7 +30098,7 @@ _sk_parametric_b_sse41:
.byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,208 // maxps %xmm0,%xmm2
- .byte 15,93,21,136,118,1,0 // minps 0x17688(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,93,21,118,118,1,0 // minps 0x17676(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -30134,31 +30128,31 @@ _sk_parametric_a_sse41:
.byte 68,15,88,219 // addps %xmm3,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,201,120,1,0 // mulps 0x178c9(%rip),%xmm12 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
- .byte 68,15,84,29,209,120,1,0 // andps 0x178d1(%rip),%xmm11 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
- .byte 68,15,86,29,233,117,1,0 // orps 0x175e9(%rip),%xmm11 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
- .byte 68,15,88,37,209,120,1,0 // addps 0x178d1(%rip),%xmm12 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
- .byte 15,40,29,218,120,1,0 // movaps 0x178da(%rip),%xmm3 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
+ .byte 68,15,89,37,183,120,1,0 // mulps 0x178b7(%rip),%xmm12 # 2cf90 <_sk_overlay_sse2_8bit+0x11cc>
+ .byte 68,15,84,29,191,120,1,0 // andps 0x178bf(%rip),%xmm11 # 2cfa0 <_sk_overlay_sse2_8bit+0x11dc>
+ .byte 68,15,86,29,231,117,1,0 // orps 0x175e7(%rip),%xmm11 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
+ .byte 68,15,88,37,191,120,1,0 // addps 0x178bf(%rip),%xmm12 # 2cfb0 <_sk_overlay_sse2_8bit+0x11ec>
+ .byte 15,40,29,200,120,1,0 // movaps 0x178c8(%rip),%xmm3 # 2cfc0 <_sk_overlay_sse2_8bit+0x11fc>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,88,29,218,120,1,0 // addps 0x178da(%rip),%xmm11 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
- .byte 15,40,29,227,120,1,0 // movaps 0x178e3(%rip),%xmm3 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
+ .byte 68,15,88,29,200,120,1,0 // addps 0x178c8(%rip),%xmm11 # 2cfd0 <_sk_overlay_sse2_8bit+0x120c>
+ .byte 15,40,29,209,120,1,0 // movaps 0x178d1(%rip),%xmm3 # 2cfe0 <_sk_overlay_sse2_8bit+0x121c>
.byte 65,15,94,219 // divps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,208,120,1,0 // addps 0x178d0(%rip),%xmm12 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
- .byte 15,40,29,217,120,1,0 // movaps 0x178d9(%rip),%xmm3 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
+ .byte 68,15,88,37,190,120,1,0 // addps 0x178be(%rip),%xmm12 # 2cff0 <_sk_overlay_sse2_8bit+0x122c>
+ .byte 15,40,29,199,120,1,0 // movaps 0x178c7(%rip),%xmm3 # 2d000 <_sk_overlay_sse2_8bit+0x123c>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,40,21,217,120,1,0 // movaps 0x178d9(%rip),%xmm10 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
+ .byte 68,15,40,21,199,120,1,0 // movaps 0x178c7(%rip),%xmm10 # 2d010 <_sk_overlay_sse2_8bit+0x124c>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,29,222,120,1,0 // movaps 0x178de(%rip),%xmm3 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
+ .byte 15,40,29,204,120,1,0 // movaps 0x178cc(%rip),%xmm3 # 2d020 <_sk_overlay_sse2_8bit+0x125c>
.byte 65,15,94,218 // divps %xmm10,%xmm3
.byte 65,15,88,220 // addps %xmm12,%xmm3
- .byte 15,89,29,223,120,1,0 // mulps 0x178df(%rip),%xmm3 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
+ .byte 15,89,29,205,120,1,0 // mulps 0x178cd(%rip),%xmm3 # 2d030 <_sk_overlay_sse2_8bit+0x126c>
.byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10
.byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
@@ -30166,7 +30160,7 @@ _sk_parametric_a_sse41:
.byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,216 // maxps %xmm0,%xmm3
- .byte 15,93,29,106,117,1,0 // minps 0x1756a(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,93,29,88,117,1,0 // minps 0x17558(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -30183,20 +30177,20 @@ _sk_gamma_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,5,233,119,1,0 // mulps 0x177e9(%rip),%xmm0 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
- .byte 68,15,40,53,241,119,1,0 // movaps 0x177f1(%rip),%xmm14 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
+ .byte 15,89,5,215,119,1,0 // mulps 0x177d7(%rip),%xmm0 # 2cf90 <_sk_overlay_sse2_8bit+0x11cc>
+ .byte 68,15,40,53,223,119,1,0 // movaps 0x177df(%rip),%xmm14 # 2cfa0 <_sk_overlay_sse2_8bit+0x11dc>
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,37,5,117,1,0 // movaps 0x17505(%rip),%xmm12 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,40,37,3,117,1,0 // movaps 0x17503(%rip),%xmm12 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 65,15,86,212 // orps %xmm12,%xmm2
- .byte 68,15,40,21,233,119,1,0 // movaps 0x177e9(%rip),%xmm10 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
+ .byte 68,15,40,21,215,119,1,0 // movaps 0x177d7(%rip),%xmm10 # 2cfb0 <_sk_overlay_sse2_8bit+0x11ec>
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,29,237,119,1,0 // movaps 0x177ed(%rip),%xmm11 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
+ .byte 68,15,40,29,219,119,1,0 // movaps 0x177db(%rip),%xmm11 # 2cfc0 <_sk_overlay_sse2_8bit+0x11fc>
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 65,15,89,227 // mulps %xmm11,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 68,15,40,13,235,119,1,0 // movaps 0x177eb(%rip),%xmm9 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
+ .byte 68,15,40,13,217,119,1,0 // movaps 0x177d9(%rip),%xmm9 # 2cfd0 <_sk_overlay_sse2_8bit+0x120c>
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 68,15,40,45,239,119,1,0 // movaps 0x177ef(%rip),%xmm13 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
+ .byte 68,15,40,45,221,119,1,0 // movaps 0x177dd(%rip),%xmm13 # 2cfe0 <_sk_overlay_sse2_8bit+0x121c>
.byte 65,15,40,229 // movaps %xmm13,%xmm4
.byte 15,94,226 // divps %xmm2,%xmm4
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30207,21 +30201,21 @@ _sk_gamma_sse41:
.byte 102,15,58,8,208,1 // roundps $0x1,%xmm0,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,53,210,119,1,0 // movaps 0x177d2(%rip),%xmm6 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
+ .byte 15,40,53,192,119,1,0 // movaps 0x177c0(%rip),%xmm6 # 2cff0 <_sk_overlay_sse2_8bit+0x122c>
.byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,40,61,232,119,1,0 // movaps 0x177e8(%rip),%xmm7 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
+ .byte 15,40,61,214,119,1,0 // movaps 0x177d6(%rip),%xmm7 # 2d010 <_sk_overlay_sse2_8bit+0x124c>
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,37,200,119,1,0 // movaps 0x177c8(%rip),%xmm4 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
+ .byte 15,40,37,182,119,1,0 // movaps 0x177b6(%rip),%xmm4 # 2d000 <_sk_overlay_sse2_8bit+0x123c>
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,92,194 // subps %xmm2,%xmm0
- .byte 68,15,40,61,218,119,1,0 // movaps 0x177da(%rip),%xmm15 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
+ .byte 68,15,40,61,200,119,1,0 // movaps 0x177c8(%rip),%xmm15 # 2d020 <_sk_overlay_sse2_8bit+0x125c>
.byte 65,15,40,215 // movaps %xmm15,%xmm2
.byte 15,94,213 // divps %xmm5,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,5,54,119,1,0 // mulps 0x17736(%rip),%xmm0 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
+ .byte 15,89,5,36,119,1,0 // mulps 0x17724(%rip),%xmm0 # 2cf90 <_sk_overlay_sse2_8bit+0x11cc>
.byte 65,15,84,206 // andps %xmm14,%xmm1
.byte 65,15,86,204 // orps %xmm12,%xmm1
.byte 65,15,88,194 // addps %xmm10,%xmm0
@@ -30247,8 +30241,8 @@ _sk_gamma_sse41:
.byte 15,94,206 // divps %xmm6,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,5,215,118,1,0 // mulps 0x176d7(%rip),%xmm0 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
- .byte 15,84,29,224,118,1,0 // andps 0x176e0(%rip),%xmm3 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
+ .byte 15,89,5,197,118,1,0 // mulps 0x176c5(%rip),%xmm0 # 2cf90 <_sk_overlay_sse2_8bit+0x11cc>
+ .byte 15,84,29,206,118,1,0 // andps 0x176ce(%rip),%xmm3 # 2cfa0 <_sk_overlay_sse2_8bit+0x11dc>
.byte 65,15,86,220 // orps %xmm12,%xmm3
.byte 65,15,88,194 // addps %xmm10,%xmm0
.byte 68,15,89,219 // mulps %xmm3,%xmm11
@@ -30266,7 +30260,7 @@ _sk_gamma_sse41:
.byte 15,92,253 // subps %xmm5,%xmm7
.byte 68,15,94,255 // divps %xmm7,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 15,40,5,40,119,1,0 // movaps 0x17728(%rip),%xmm0 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
+ .byte 15,40,5,22,119,1,0 // movaps 0x17716(%rip),%xmm0 # 2d030 <_sk_overlay_sse2_8bit+0x126c>
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 68,15,89,248 // mulps %xmm0,%xmm15
@@ -30286,29 +30280,29 @@ HIDDEN _sk_lab_to_xyz_sse41
FUNCTION(_sk_lab_to_xyz_sse41)
_sk_lab_to_xyz_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,89,5,248,118,1,0 // mulps 0x176f8(%rip),%xmm8 # 2d060 <_sk_overlay_sse2_8bit+0x1288>
- .byte 68,15,40,13,112,116,1,0 // movaps 0x17470(%rip),%xmm9 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
+ .byte 68,15,89,5,230,118,1,0 // mulps 0x176e6(%rip),%xmm8 # 2d040 <_sk_overlay_sse2_8bit+0x127c>
+ .byte 68,15,40,13,94,116,1,0 // movaps 0x1745e(%rip),%xmm9 # 2cdc0 <_sk_overlay_sse2_8bit+0xffc>
.byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 15,40,5,245,118,1,0 // movaps 0x176f5(%rip),%xmm0 # 2d070 <_sk_overlay_sse2_8bit+0x1298>
+ .byte 15,40,5,227,118,1,0 // movaps 0x176e3(%rip),%xmm0 # 2d050 <_sk_overlay_sse2_8bit+0x128c>
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,88,5,243,118,1,0 // addps 0x176f3(%rip),%xmm8 # 2d080 <_sk_overlay_sse2_8bit+0x12a8>
- .byte 68,15,89,5,251,118,1,0 // mulps 0x176fb(%rip),%xmm8 # 2d090 <_sk_overlay_sse2_8bit+0x12b8>
- .byte 15,89,13,4,119,1,0 // mulps 0x17704(%rip),%xmm1 # 2d0a0 <_sk_overlay_sse2_8bit+0x12c8>
+ .byte 68,15,88,5,225,118,1,0 // addps 0x176e1(%rip),%xmm8 # 2d060 <_sk_overlay_sse2_8bit+0x129c>
+ .byte 68,15,89,5,233,118,1,0 // mulps 0x176e9(%rip),%xmm8 # 2d070 <_sk_overlay_sse2_8bit+0x12ac>
+ .byte 15,89,13,242,118,1,0 // mulps 0x176f2(%rip),%xmm1 # 2d080 <_sk_overlay_sse2_8bit+0x12bc>
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 15,89,21,9,119,1,0 // mulps 0x17709(%rip),%xmm2 # 2d0b0 <_sk_overlay_sse2_8bit+0x12d8>
+ .byte 15,89,21,247,118,1,0 // mulps 0x176f7(%rip),%xmm2 # 2d090 <_sk_overlay_sse2_8bit+0x12cc>
.byte 69,15,40,208 // movaps %xmm8,%xmm10
.byte 68,15,92,210 // subps %xmm2,%xmm10
.byte 68,15,40,217 // movaps %xmm1,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
- .byte 68,15,40,13,253,118,1,0 // movaps 0x176fd(%rip),%xmm9 # 2d0c0 <_sk_overlay_sse2_8bit+0x12e8>
+ .byte 68,15,40,13,235,118,1,0 // movaps 0x176eb(%rip),%xmm9 # 2d0a0 <_sk_overlay_sse2_8bit+0x12dc>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 15,40,21,253,118,1,0 // movaps 0x176fd(%rip),%xmm2 # 2d0d0 <_sk_overlay_sse2_8bit+0x12f8>
+ .byte 15,40,21,235,118,1,0 // movaps 0x176eb(%rip),%xmm2 # 2d0b0 <_sk_overlay_sse2_8bit+0x12ec>
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 68,15,40,37,2,119,1,0 // movaps 0x17702(%rip),%xmm12 # 2d0e0 <_sk_overlay_sse2_8bit+0x1308>
+ .byte 68,15,40,37,240,118,1,0 // movaps 0x176f0(%rip),%xmm12 # 2d0c0 <_sk_overlay_sse2_8bit+0x12fc>
.byte 65,15,89,204 // mulps %xmm12,%xmm1
.byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1
.byte 69,15,40,216 // movaps %xmm8,%xmm11
@@ -30327,8 +30321,8 @@ _sk_lab_to_xyz_sse41:
.byte 65,15,89,212 // mulps %xmm12,%xmm2
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2
- .byte 15,89,13,187,118,1,0 // mulps 0x176bb(%rip),%xmm1 # 2d0f0 <_sk_overlay_sse2_8bit+0x1318>
- .byte 15,89,21,196,118,1,0 // mulps 0x176c4(%rip),%xmm2 # 2d100 <_sk_overlay_sse2_8bit+0x1328>
+ .byte 15,89,13,169,118,1,0 // mulps 0x176a9(%rip),%xmm1 # 2d0d0 <_sk_overlay_sse2_8bit+0x130c>
+ .byte 15,89,21,178,118,1,0 // mulps 0x176b2(%rip),%xmm2 # 2d0e0 <_sk_overlay_sse2_8bit+0x131c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,40,200 // movaps %xmm8,%xmm1
@@ -30345,11 +30339,11 @@ _sk_load_a8_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,39 // jne 15a86 <_sk_load_a8_sse41+0x3f>
+ .byte 117,39 // jne 15a78 <_sk_load_a8_sse41+0x3f>
.byte 102,67,15,56,49,4,16 // pmovzxbd (%r8,%r10,1),%xmm0
- .byte 102,15,219,5,66,115,1,0 // pand 0x17342(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,219,5,48,115,1,0 // pand 0x17330(%rip),%xmm0 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,136,116,1,0 // mulps 0x17488(%rip),%xmm3 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 15,89,29,118,116,1,0 // mulps 0x17476(%rip),%xmm3 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -30358,12 +30352,12 @@ _sk_load_a8_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,53 // je 15ac8 <_sk_load_a8_sse41+0x81>
+ .byte 116,53 // je 15aba <_sk_load_a8_sse41+0x81>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 15ab2 <_sk_load_a8_sse41+0x6b>
+ .byte 116,21 // je 15aa4 <_sk_load_a8_sse41+0x6b>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,195 // jne 15a66 <_sk_load_a8_sse41+0x1f>
+ .byte 117,195 // jne 15a58 <_sk_load_a8_sse41+0x1f>
.byte 67,15,182,68,16,2 // movzbl 0x2(%r8,%r10,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -30371,10 +30365,10 @@ _sk_load_a8_sse41:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1
.byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0
- .byte 235,158 // jmp 15a66 <_sk_load_a8_sse41+0x1f>
+ .byte 235,158 // jmp 15a58 <_sk_load_a8_sse41+0x1f>
.byte 67,15,182,4,16 // movzbl (%r8,%r10,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,147 // jmp 15a66 <_sk_load_a8_sse41+0x1f>
+ .byte 235,147 // jmp 15a58 <_sk_load_a8_sse41+0x1f>
HIDDEN _sk_load_a8_dst_sse41
.globl _sk_load_a8_dst_sse41
@@ -30387,11 +30381,11 @@ _sk_load_a8_dst_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,39 // jne 15b12 <_sk_load_a8_dst_sse41+0x3f>
+ .byte 117,39 // jne 15b04 <_sk_load_a8_dst_sse41+0x3f>
.byte 102,67,15,56,49,36,16 // pmovzxbd (%r8,%r10,1),%xmm4
- .byte 102,15,219,37,182,114,1,0 // pand 0x172b6(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,219,37,164,114,1,0 // pand 0x172a4(%rip),%xmm4 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,252,115,1,0 // mulps 0x173fc(%rip),%xmm7 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 15,89,61,234,115,1,0 // mulps 0x173ea(%rip),%xmm7 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
@@ -30400,12 +30394,12 @@ _sk_load_a8_dst_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,53 // je 15b54 <_sk_load_a8_dst_sse41+0x81>
+ .byte 116,53 // je 15b46 <_sk_load_a8_dst_sse41+0x81>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 15b3e <_sk_load_a8_dst_sse41+0x6b>
+ .byte 116,21 // je 15b30 <_sk_load_a8_dst_sse41+0x6b>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,195 // jne 15af2 <_sk_load_a8_dst_sse41+0x1f>
+ .byte 117,195 // jne 15ae4 <_sk_load_a8_dst_sse41+0x1f>
.byte 67,15,182,68,16,2 // movzbl 0x2(%r8,%r10,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -30413,10 +30407,10 @@ _sk_load_a8_dst_sse41:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,49,237 // pmovzxbd %xmm5,%xmm5
.byte 102,15,58,14,229,15 // pblendw $0xf,%xmm5,%xmm4
- .byte 235,158 // jmp 15af2 <_sk_load_a8_dst_sse41+0x1f>
+ .byte 235,158 // jmp 15ae4 <_sk_load_a8_dst_sse41+0x1f>
.byte 67,15,182,4,16 // movzbl (%r8,%r10,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,147 // jmp 15af2 <_sk_load_a8_dst_sse41+0x1f>
+ .byte 235,147 // jmp 15ae4 <_sk_load_a8_dst_sse41+0x1f>
HIDDEN _sk_gather_a8_sse41
.globl _sk_gather_a8_sse41
@@ -30444,7 +30438,7 @@ _sk_gather_a8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,49,115,1,0 // mulps 0x17331(%rip),%xmm3 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 15,89,29,31,115,1,0 // mulps 0x1731f(%rip),%xmm3 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -30461,13 +30455,13 @@ _sk_store_a8_sse41:
.byte 77,15,175,193 // imul %r9,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
- .byte 68,15,40,5,231,113,1,0 // movaps 0x171e7(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
+ .byte 68,15,40,5,213,113,1,0 // movaps 0x171d5(%rip),%xmm8 # 2cdc0 <_sk_overlay_sse2_8bit+0xffc>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,13 // jne 15c1f <_sk_store_a8_sse41+0x41>
+ .byte 117,13 // jne 15c11 <_sk_store_a8_sse41+0x41>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 67,137,4,16 // mov %eax,(%r8,%r10,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30476,17 +30470,17 @@ _sk_store_a8_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,41 // je 15c5b <_sk_store_a8_sse41+0x7d>
+ .byte 116,41 // je 15c4d <_sk_store_a8_sse41+0x7d>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,15 // je 15c47 <_sk_store_a8_sse41+0x69>
+ .byte 116,15 // je 15c39 <_sk_store_a8_sse41+0x69>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,221 // jne 15c1b <_sk_store_a8_sse41+0x3d>
+ .byte 117,221 // jne 15c0d <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,68,16,2,8 // pextrb $0x8,%xmm8,0x2(%r8,%r10,1)
- .byte 102,68,15,56,0,5,191,116,1,0 // pshufb 0x174bf(%rip),%xmm8 # 2d110 <_sk_overlay_sse2_8bit+0x1338>
+ .byte 102,68,15,56,0,5,173,116,1,0 // pshufb 0x174ad(%rip),%xmm8 # 2d0f0 <_sk_overlay_sse2_8bit+0x132c>
.byte 102,71,15,58,21,4,16,0 // pextrw $0x0,%xmm8,(%r8,%r10,1)
- .byte 235,192 // jmp 15c1b <_sk_store_a8_sse41+0x3d>
+ .byte 235,192 // jmp 15c0d <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,4,16,0 // pextrb $0x0,%xmm8,(%r8,%r10,1)
- .byte 235,182 // jmp 15c1b <_sk_store_a8_sse41+0x3d>
+ .byte 235,182 // jmp 15c0d <_sk_store_a8_sse41+0x3d>
HIDDEN _sk_load_g8_sse41
.globl _sk_load_g8_sse41
@@ -30499,25 +30493,25 @@ _sk_load_g8_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,42 // jne 15ca7 <_sk_load_g8_sse41+0x42>
+ .byte 117,42 // jne 15c99 <_sk_load_g8_sse41+0x42>
.byte 102,67,15,56,49,4,16 // pmovzxbd (%r8,%r10,1),%xmm0
- .byte 102,15,219,5,36,113,1,0 // pand 0x17124(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,219,5,18,113,1,0 // pand 0x17112(%rip),%xmm0 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,106,114,1,0 // mulps 0x1726a(%rip),%xmm0 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 15,89,5,88,114,1,0 // mulps 0x17258(%rip),%xmm0 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,97,112,1,0 // movaps 0x17061(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,79,112,1,0 // movaps 0x1704f(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,53 // je 15ce9 <_sk_load_g8_sse41+0x84>
+ .byte 116,53 // je 15cdb <_sk_load_g8_sse41+0x84>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 15cd3 <_sk_load_g8_sse41+0x6e>
+ .byte 116,21 // je 15cc5 <_sk_load_g8_sse41+0x6e>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,192 // jne 15c84 <_sk_load_g8_sse41+0x1f>
+ .byte 117,192 // jne 15c76 <_sk_load_g8_sse41+0x1f>
.byte 67,15,182,68,16,2 // movzbl 0x2(%r8,%r10,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -30525,10 +30519,10 @@ _sk_load_g8_sse41:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1
.byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0
- .byte 235,155 // jmp 15c84 <_sk_load_g8_sse41+0x1f>
+ .byte 235,155 // jmp 15c76 <_sk_load_g8_sse41+0x1f>
.byte 67,15,182,4,16 // movzbl (%r8,%r10,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,144 // jmp 15c84 <_sk_load_g8_sse41+0x1f>
+ .byte 235,144 // jmp 15c76 <_sk_load_g8_sse41+0x1f>
HIDDEN _sk_load_g8_dst_sse41
.globl _sk_load_g8_dst_sse41
@@ -30541,25 +30535,25 @@ _sk_load_g8_dst_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,42 // jne 15d36 <_sk_load_g8_dst_sse41+0x42>
+ .byte 117,42 // jne 15d28 <_sk_load_g8_dst_sse41+0x42>
.byte 102,67,15,56,49,36,16 // pmovzxbd (%r8,%r10,1),%xmm4
- .byte 102,15,219,37,149,112,1,0 // pand 0x17095(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,219,37,131,112,1,0 // pand 0x17083(%rip),%xmm4 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,219,113,1,0 // mulps 0x171db(%rip),%xmm4 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 15,89,37,201,113,1,0 // mulps 0x171c9(%rip),%xmm4 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,210,111,1,0 // movaps 0x16fd2(%rip),%xmm7 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,61,192,111,1,0 // movaps 0x16fc0(%rip),%xmm7 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,53 // je 15d78 <_sk_load_g8_dst_sse41+0x84>
+ .byte 116,53 // je 15d6a <_sk_load_g8_dst_sse41+0x84>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 15d62 <_sk_load_g8_dst_sse41+0x6e>
+ .byte 116,21 // je 15d54 <_sk_load_g8_dst_sse41+0x6e>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,192 // jne 15d13 <_sk_load_g8_dst_sse41+0x1f>
+ .byte 117,192 // jne 15d05 <_sk_load_g8_dst_sse41+0x1f>
.byte 67,15,182,68,16,2 // movzbl 0x2(%r8,%r10,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -30567,10 +30561,10 @@ _sk_load_g8_dst_sse41:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,49,237 // pmovzxbd %xmm5,%xmm5
.byte 102,15,58,14,229,15 // pblendw $0xf,%xmm5,%xmm4
- .byte 235,155 // jmp 15d13 <_sk_load_g8_dst_sse41+0x1f>
+ .byte 235,155 // jmp 15d05 <_sk_load_g8_dst_sse41+0x1f>
.byte 67,15,182,4,16 // movzbl (%r8,%r10,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,144 // jmp 15d13 <_sk_load_g8_dst_sse41+0x1f>
+ .byte 235,144 // jmp 15d05 <_sk_load_g8_dst_sse41+0x1f>
HIDDEN _sk_gather_g8_sse41
.globl _sk_gather_g8_sse41
@@ -30598,9 +30592,9 @@ _sk_gather_g8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,13,113,1,0 // mulps 0x1710d(%rip),%xmm0 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 15,89,5,251,112,1,0 // mulps 0x170fb(%rip),%xmm0 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,4,111,1,0 // movaps 0x16f04(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,242,110,1,0 // movaps 0x16ef2(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
@@ -30617,41 +30611,41 @@ _sk_load_565_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,80 // jne 15e6f <_sk_load_565_sse41+0x6b>
+ .byte 117,80 // jne 15e61 <_sk_load_565_sse41+0x6b>
.byte 102,67,15,56,51,20,80 // pmovzxwd (%r8,%r10,2),%xmm2
- .byte 102,15,111,5,226,112,1,0 // movdqa 0x170e2(%rip),%xmm0 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
+ .byte 102,15,111,5,208,112,1,0 // movdqa 0x170d0(%rip),%xmm0 # 2cef0 <_sk_overlay_sse2_8bit+0x112c>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,228,112,1,0 // mulps 0x170e4(%rip),%xmm0 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
- .byte 102,15,111,13,236,112,1,0 // movdqa 0x170ec(%rip),%xmm1 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
+ .byte 15,89,5,210,112,1,0 // mulps 0x170d2(%rip),%xmm0 # 2cf00 <_sk_overlay_sse2_8bit+0x113c>
+ .byte 102,15,111,13,218,112,1,0 // movdqa 0x170da(%rip),%xmm1 # 2cf10 <_sk_overlay_sse2_8bit+0x114c>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,238,112,1,0 // mulps 0x170ee(%rip),%xmm1 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
- .byte 102,15,219,21,246,112,1,0 // pand 0x170f6(%rip),%xmm2 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
+ .byte 15,89,13,220,112,1,0 // mulps 0x170dc(%rip),%xmm1 # 2cf20 <_sk_overlay_sse2_8bit+0x115c>
+ .byte 102,15,219,21,228,112,1,0 // pand 0x170e4(%rip),%xmm2 # 2cf30 <_sk_overlay_sse2_8bit+0x116c>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,252,112,1,0 // mulps 0x170fc(%rip),%xmm2 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
+ .byte 15,89,21,234,112,1,0 // mulps 0x170ea(%rip),%xmm2 # 2cf40 <_sk_overlay_sse2_8bit+0x117c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,147,110,1,0 // movaps 0x16e93(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,129,110,1,0 // movaps 0x16e81(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,53 // je 15eb1 <_sk_load_565_sse41+0xad>
+ .byte 116,53 // je 15ea3 <_sk_load_565_sse41+0xad>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 15e9b <_sk_load_565_sse41+0x97>
+ .byte 116,21 // je 15e8d <_sk_load_565_sse41+0x97>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,154 // jne 15e26 <_sk_load_565_sse41+0x22>
+ .byte 117,154 // jne 15e18 <_sk_load_565_sse41+0x22>
.byte 67,15,183,68,80,4 // movzwl 0x4(%r8,%r10,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,67,15,110,4,80 // movd (%r8,%r10,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,15,58,14,208,15 // pblendw $0xf,%xmm0,%xmm2
- .byte 233,117,255,255,255 // jmpq 15e26 <_sk_load_565_sse41+0x22>
+ .byte 233,117,255,255,255 // jmpq 15e18 <_sk_load_565_sse41+0x22>
.byte 67,15,183,4,80 // movzwl (%r8,%r10,2),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,103,255,255,255 // jmpq 15e26 <_sk_load_565_sse41+0x22>
+ .byte 233,103,255,255,255 // jmpq 15e18 <_sk_load_565_sse41+0x22>
HIDDEN _sk_load_565_dst_sse41
.globl _sk_load_565_dst_sse41
@@ -30665,41 +30659,41 @@ _sk_load_565_dst_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,80 // jne 15f2a <_sk_load_565_dst_sse41+0x6b>
+ .byte 117,80 // jne 15f1c <_sk_load_565_dst_sse41+0x6b>
.byte 102,67,15,56,51,52,80 // pmovzxwd (%r8,%r10,2),%xmm6
- .byte 102,15,111,37,39,112,1,0 // movdqa 0x17027(%rip),%xmm4 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
+ .byte 102,15,111,37,21,112,1,0 // movdqa 0x17015(%rip),%xmm4 # 2cef0 <_sk_overlay_sse2_8bit+0x112c>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,41,112,1,0 // mulps 0x17029(%rip),%xmm4 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
- .byte 102,15,111,45,49,112,1,0 // movdqa 0x17031(%rip),%xmm5 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
+ .byte 15,89,37,23,112,1,0 // mulps 0x17017(%rip),%xmm4 # 2cf00 <_sk_overlay_sse2_8bit+0x113c>
+ .byte 102,15,111,45,31,112,1,0 // movdqa 0x1701f(%rip),%xmm5 # 2cf10 <_sk_overlay_sse2_8bit+0x114c>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,51,112,1,0 // mulps 0x17033(%rip),%xmm5 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
- .byte 102,15,219,53,59,112,1,0 // pand 0x1703b(%rip),%xmm6 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
+ .byte 15,89,45,33,112,1,0 // mulps 0x17021(%rip),%xmm5 # 2cf20 <_sk_overlay_sse2_8bit+0x115c>
+ .byte 102,15,219,53,41,112,1,0 // pand 0x17029(%rip),%xmm6 # 2cf30 <_sk_overlay_sse2_8bit+0x116c>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,65,112,1,0 // mulps 0x17041(%rip),%xmm6 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
+ .byte 15,89,53,47,112,1,0 // mulps 0x1702f(%rip),%xmm6 # 2cf40 <_sk_overlay_sse2_8bit+0x117c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,216,109,1,0 // movaps 0x16dd8(%rip),%xmm7 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,61,198,109,1,0 // movaps 0x16dc6(%rip),%xmm7 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,53 // je 15f6c <_sk_load_565_dst_sse41+0xad>
+ .byte 116,53 // je 15f5e <_sk_load_565_dst_sse41+0xad>
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 15f56 <_sk_load_565_dst_sse41+0x97>
+ .byte 116,21 // je 15f48 <_sk_load_565_dst_sse41+0x97>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,154 // jne 15ee1 <_sk_load_565_dst_sse41+0x22>
+ .byte 117,154 // jne 15ed3 <_sk_load_565_dst_sse41+0x22>
.byte 67,15,183,68,80,4 // movzwl 0x4(%r8,%r10,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
.byte 102,67,15,110,36,80 // movd (%r8,%r10,2),%xmm4
.byte 102,15,56,51,228 // pmovzxwd %xmm4,%xmm4
.byte 102,15,58,14,244,15 // pblendw $0xf,%xmm4,%xmm6
- .byte 233,117,255,255,255 // jmpq 15ee1 <_sk_load_565_dst_sse41+0x22>
+ .byte 233,117,255,255,255 // jmpq 15ed3 <_sk_load_565_dst_sse41+0x22>
.byte 67,15,183,4,80 // movzwl (%r8,%r10,2),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,103,255,255,255 // jmpq 15ee1 <_sk_load_565_dst_sse41+0x22>
+ .byte 233,103,255,255,255 // jmpq 15ed3 <_sk_load_565_dst_sse41+0x22>
HIDDEN _sk_gather_565_sse41
.globl _sk_gather_565_sse41
@@ -30726,19 +30720,19 @@ _sk_gather_565_sse41:
.byte 65,15,183,4,64 // movzwl (%r8,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2
- .byte 102,15,111,5,44,111,1,0 // movdqa 0x16f2c(%rip),%xmm0 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
+ .byte 102,15,111,5,26,111,1,0 // movdqa 0x16f1a(%rip),%xmm0 # 2cef0 <_sk_overlay_sse2_8bit+0x112c>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,46,111,1,0 // mulps 0x16f2e(%rip),%xmm0 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
- .byte 102,15,111,13,54,111,1,0 // movdqa 0x16f36(%rip),%xmm1 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
+ .byte 15,89,5,28,111,1,0 // mulps 0x16f1c(%rip),%xmm0 # 2cf00 <_sk_overlay_sse2_8bit+0x113c>
+ .byte 102,15,111,13,36,111,1,0 // movdqa 0x16f24(%rip),%xmm1 # 2cf10 <_sk_overlay_sse2_8bit+0x114c>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,56,111,1,0 // mulps 0x16f38(%rip),%xmm1 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
- .byte 102,15,219,21,64,111,1,0 // pand 0x16f40(%rip),%xmm2 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
+ .byte 15,89,13,38,111,1,0 // mulps 0x16f26(%rip),%xmm1 # 2cf20 <_sk_overlay_sse2_8bit+0x115c>
+ .byte 102,15,219,21,46,111,1,0 // pand 0x16f2e(%rip),%xmm2 # 2cf30 <_sk_overlay_sse2_8bit+0x116c>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,70,111,1,0 // mulps 0x16f46(%rip),%xmm2 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
+ .byte 15,89,21,52,111,1,0 // mulps 0x16f34(%rip),%xmm2 # 2cf40 <_sk_overlay_sse2_8bit+0x117c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,221,108,1,0 // movaps 0x16cdd(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,203,108,1,0 // movaps 0x16ccb(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_sse41
@@ -30752,12 +30746,12 @@ _sk_store_565_sse41:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,221,112,1,0 // movaps 0x170dd(%rip),%xmm8 # 2d120 <_sk_overlay_sse2_8bit+0x1348>
+ .byte 68,15,40,5,203,112,1,0 // movaps 0x170cb(%rip),%xmm8 # 2d100 <_sk_overlay_sse2_8bit+0x133c>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,210,112,1,0 // movaps 0x170d2(%rip),%xmm10 # 2d130 <_sk_overlay_sse2_8bit+0x1358>
+ .byte 68,15,40,21,192,112,1,0 // movaps 0x170c0(%rip),%xmm10 # 2d110 <_sk_overlay_sse2_8bit+0x134c>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -30767,7 +30761,7 @@ _sk_store_565_sse41:
.byte 102,69,15,86,194 // orpd %xmm10,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 16095 <_sk_store_565_sse41+0x70>
+ .byte 117,10 // jne 16087 <_sk_store_565_sse41+0x70>
.byte 242,69,15,17,4,64 // movsd %xmm8,(%r8,%rax,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -30775,17 +30769,17 @@ _sk_store_565_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,35 // je 160cb <_sk_store_565_sse41+0xa6>
+ .byte 116,35 // je 160bd <_sk_store_565_sse41+0xa6>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,15 // je 160bd <_sk_store_565_sse41+0x98>
+ .byte 116,15 // je 160af <_sk_store_565_sse41+0x98>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,221 // jne 16091 <_sk_store_565_sse41+0x6c>
+ .byte 117,221 // jne 16083 <_sk_store_565_sse41+0x6c>
.byte 102,69,15,58,21,68,64,4,4 // pextrw $0x4,%xmm8,0x4(%r8,%rax,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,69,15,126,4,64 // movd %xmm8,(%r8,%rax,2)
- .byte 235,198 // jmp 16091 <_sk_store_565_sse41+0x6c>
+ .byte 235,198 // jmp 16083 <_sk_store_565_sse41+0x6c>
.byte 102,69,15,58,21,4,64,0 // pextrw $0x0,%xmm8,(%r8,%rax,2)
- .byte 235,188 // jmp 16091 <_sk_store_565_sse41+0x6c>
+ .byte 235,188 // jmp 16083 <_sk_store_565_sse41+0x6c>
HIDDEN _sk_load_4444_sse41
.globl _sk_load_4444_sse41
@@ -30799,44 +30793,44 @@ _sk_load_4444_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,95 // jne 1614f <_sk_load_4444_sse41+0x7a>
+ .byte 117,95 // jne 16141 <_sk_load_4444_sse41+0x7a>
.byte 102,67,15,56,51,28,80 // pmovzxwd (%r8,%r10,2),%xmm3
- .byte 102,15,111,5,65,112,1,0 // movdqa 0x17041(%rip),%xmm0 # 2d140 <_sk_overlay_sse2_8bit+0x1368>
+ .byte 102,15,111,5,47,112,1,0 // movdqa 0x1702f(%rip),%xmm0 # 2d120 <_sk_overlay_sse2_8bit+0x135c>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,67,112,1,0 // mulps 0x17043(%rip),%xmm0 # 2d150 <_sk_overlay_sse2_8bit+0x1378>
- .byte 102,15,111,13,75,112,1,0 // movdqa 0x1704b(%rip),%xmm1 # 2d160 <_sk_overlay_sse2_8bit+0x1388>
+ .byte 15,89,5,49,112,1,0 // mulps 0x17031(%rip),%xmm0 # 2d130 <_sk_overlay_sse2_8bit+0x136c>
+ .byte 102,15,111,13,57,112,1,0 // movdqa 0x17039(%rip),%xmm1 # 2d140 <_sk_overlay_sse2_8bit+0x137c>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,77,112,1,0 // mulps 0x1704d(%rip),%xmm1 # 2d170 <_sk_overlay_sse2_8bit+0x1398>
- .byte 102,15,111,21,85,112,1,0 // movdqa 0x17055(%rip),%xmm2 # 2d180 <_sk_overlay_sse2_8bit+0x13a8>
+ .byte 15,89,13,59,112,1,0 // mulps 0x1703b(%rip),%xmm1 # 2d150 <_sk_overlay_sse2_8bit+0x138c>
+ .byte 102,15,111,21,67,112,1,0 // movdqa 0x17043(%rip),%xmm2 # 2d160 <_sk_overlay_sse2_8bit+0x139c>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,87,112,1,0 // mulps 0x17057(%rip),%xmm2 # 2d190 <_sk_overlay_sse2_8bit+0x13b8>
- .byte 102,15,219,29,95,112,1,0 // pand 0x1705f(%rip),%xmm3 # 2d1a0 <_sk_overlay_sse2_8bit+0x13c8>
+ .byte 15,89,21,69,112,1,0 // mulps 0x17045(%rip),%xmm2 # 2d170 <_sk_overlay_sse2_8bit+0x13ac>
+ .byte 102,15,219,29,77,112,1,0 // pand 0x1704d(%rip),%xmm3 # 2d180 <_sk_overlay_sse2_8bit+0x13bc>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,101,112,1,0 // mulps 0x17065(%rip),%xmm3 # 2d1b0 <_sk_overlay_sse2_8bit+0x13d8>
+ .byte 15,89,29,83,112,1,0 // mulps 0x17053(%rip),%xmm3 # 2d190 <_sk_overlay_sse2_8bit+0x13cc>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,53 // je 16191 <_sk_load_4444_sse41+0xbc>
+ .byte 116,53 // je 16183 <_sk_load_4444_sse41+0xbc>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 1617b <_sk_load_4444_sse41+0xa6>
+ .byte 116,21 // je 1616d <_sk_load_4444_sse41+0xa6>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,139 // jne 160f7 <_sk_load_4444_sse41+0x22>
+ .byte 117,139 // jne 160e9 <_sk_load_4444_sse41+0x22>
.byte 67,15,183,68,80,4 // movzwl 0x4(%r8,%r10,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,67,15,110,4,80 // movd (%r8,%r10,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,102,255,255,255 // jmpq 160f7 <_sk_load_4444_sse41+0x22>
+ .byte 233,102,255,255,255 // jmpq 160e9 <_sk_load_4444_sse41+0x22>
.byte 67,15,183,4,80 // movzwl (%r8,%r10,2),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 233,88,255,255,255 // jmpq 160f7 <_sk_load_4444_sse41+0x22>
+ .byte 233,88,255,255,255 // jmpq 160e9 <_sk_load_4444_sse41+0x22>
HIDDEN _sk_load_4444_dst_sse41
.globl _sk_load_4444_dst_sse41
@@ -30850,44 +30844,44 @@ _sk_load_4444_dst_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,95 // jne 16219 <_sk_load_4444_dst_sse41+0x7a>
+ .byte 117,95 // jne 1620b <_sk_load_4444_dst_sse41+0x7a>
.byte 102,67,15,56,51,60,80 // pmovzxwd (%r8,%r10,2),%xmm7
- .byte 102,15,111,37,119,111,1,0 // movdqa 0x16f77(%rip),%xmm4 # 2d140 <_sk_overlay_sse2_8bit+0x1368>
+ .byte 102,15,111,37,101,111,1,0 // movdqa 0x16f65(%rip),%xmm4 # 2d120 <_sk_overlay_sse2_8bit+0x135c>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,121,111,1,0 // mulps 0x16f79(%rip),%xmm4 # 2d150 <_sk_overlay_sse2_8bit+0x1378>
- .byte 102,15,111,45,129,111,1,0 // movdqa 0x16f81(%rip),%xmm5 # 2d160 <_sk_overlay_sse2_8bit+0x1388>
+ .byte 15,89,37,103,111,1,0 // mulps 0x16f67(%rip),%xmm4 # 2d130 <_sk_overlay_sse2_8bit+0x136c>
+ .byte 102,15,111,45,111,111,1,0 // movdqa 0x16f6f(%rip),%xmm5 # 2d140 <_sk_overlay_sse2_8bit+0x137c>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,131,111,1,0 // mulps 0x16f83(%rip),%xmm5 # 2d170 <_sk_overlay_sse2_8bit+0x1398>
- .byte 102,15,111,53,139,111,1,0 // movdqa 0x16f8b(%rip),%xmm6 # 2d180 <_sk_overlay_sse2_8bit+0x13a8>
+ .byte 15,89,45,113,111,1,0 // mulps 0x16f71(%rip),%xmm5 # 2d150 <_sk_overlay_sse2_8bit+0x138c>
+ .byte 102,15,111,53,121,111,1,0 // movdqa 0x16f79(%rip),%xmm6 # 2d160 <_sk_overlay_sse2_8bit+0x139c>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,141,111,1,0 // mulps 0x16f8d(%rip),%xmm6 # 2d190 <_sk_overlay_sse2_8bit+0x13b8>
- .byte 102,15,219,61,149,111,1,0 // pand 0x16f95(%rip),%xmm7 # 2d1a0 <_sk_overlay_sse2_8bit+0x13c8>
+ .byte 15,89,53,123,111,1,0 // mulps 0x16f7b(%rip),%xmm6 # 2d170 <_sk_overlay_sse2_8bit+0x13ac>
+ .byte 102,15,219,61,131,111,1,0 // pand 0x16f83(%rip),%xmm7 # 2d180 <_sk_overlay_sse2_8bit+0x13bc>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,155,111,1,0 // mulps 0x16f9b(%rip),%xmm7 # 2d1b0 <_sk_overlay_sse2_8bit+0x13d8>
+ .byte 15,89,61,137,111,1,0 // mulps 0x16f89(%rip),%xmm7 # 2d190 <_sk_overlay_sse2_8bit+0x13cc>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,53 // je 1625b <_sk_load_4444_dst_sse41+0xbc>
+ .byte 116,53 // je 1624d <_sk_load_4444_dst_sse41+0xbc>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 16245 <_sk_load_4444_dst_sse41+0xa6>
+ .byte 116,21 // je 16237 <_sk_load_4444_dst_sse41+0xa6>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,139 // jne 161c1 <_sk_load_4444_dst_sse41+0x22>
+ .byte 117,139 // jne 161b3 <_sk_load_4444_dst_sse41+0x22>
.byte 67,15,183,68,80,4 // movzwl 0x4(%r8,%r10,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 102,67,15,110,36,80 // movd (%r8,%r10,2),%xmm4
.byte 102,15,56,51,228 // pmovzxwd %xmm4,%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,102,255,255,255 // jmpq 161c1 <_sk_load_4444_dst_sse41+0x22>
+ .byte 233,102,255,255,255 // jmpq 161b3 <_sk_load_4444_dst_sse41+0x22>
.byte 67,15,183,4,80 // movzwl (%r8,%r10,2),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,88,255,255,255 // jmpq 161c1 <_sk_load_4444_dst_sse41+0x22>
+ .byte 233,88,255,255,255 // jmpq 161b3 <_sk_load_4444_dst_sse41+0x22>
HIDDEN _sk_gather_4444_sse41
.globl _sk_gather_4444_sse41
@@ -30914,21 +30908,21 @@ _sk_gather_4444_sse41:
.byte 65,15,183,4,64 // movzwl (%r8,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3
- .byte 102,15,111,5,109,110,1,0 // movdqa 0x16e6d(%rip),%xmm0 # 2d140 <_sk_overlay_sse2_8bit+0x1368>
+ .byte 102,15,111,5,91,110,1,0 // movdqa 0x16e5b(%rip),%xmm0 # 2d120 <_sk_overlay_sse2_8bit+0x135c>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,111,110,1,0 // mulps 0x16e6f(%rip),%xmm0 # 2d150 <_sk_overlay_sse2_8bit+0x1378>
- .byte 102,15,111,13,119,110,1,0 // movdqa 0x16e77(%rip),%xmm1 # 2d160 <_sk_overlay_sse2_8bit+0x1388>
+ .byte 15,89,5,93,110,1,0 // mulps 0x16e5d(%rip),%xmm0 # 2d130 <_sk_overlay_sse2_8bit+0x136c>
+ .byte 102,15,111,13,101,110,1,0 // movdqa 0x16e65(%rip),%xmm1 # 2d140 <_sk_overlay_sse2_8bit+0x137c>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,121,110,1,0 // mulps 0x16e79(%rip),%xmm1 # 2d170 <_sk_overlay_sse2_8bit+0x1398>
- .byte 102,15,111,21,129,110,1,0 // movdqa 0x16e81(%rip),%xmm2 # 2d180 <_sk_overlay_sse2_8bit+0x13a8>
+ .byte 15,89,13,103,110,1,0 // mulps 0x16e67(%rip),%xmm1 # 2d150 <_sk_overlay_sse2_8bit+0x138c>
+ .byte 102,15,111,21,111,110,1,0 // movdqa 0x16e6f(%rip),%xmm2 # 2d160 <_sk_overlay_sse2_8bit+0x139c>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,131,110,1,0 // mulps 0x16e83(%rip),%xmm2 # 2d190 <_sk_overlay_sse2_8bit+0x13b8>
- .byte 102,15,219,29,139,110,1,0 // pand 0x16e8b(%rip),%xmm3 # 2d1a0 <_sk_overlay_sse2_8bit+0x13c8>
+ .byte 15,89,21,113,110,1,0 // mulps 0x16e71(%rip),%xmm2 # 2d170 <_sk_overlay_sse2_8bit+0x13ac>
+ .byte 102,15,219,29,121,110,1,0 // pand 0x16e79(%rip),%xmm3 # 2d180 <_sk_overlay_sse2_8bit+0x13bc>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,145,110,1,0 // mulps 0x16e91(%rip),%xmm3 # 2d1b0 <_sk_overlay_sse2_8bit+0x13d8>
+ .byte 15,89,29,127,110,1,0 // mulps 0x16e7f(%rip),%xmm3 # 2d190 <_sk_overlay_sse2_8bit+0x13cc>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -30943,7 +30937,7 @@ _sk_store_4444_sse41:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,127,110,1,0 // movaps 0x16e7f(%rip),%xmm8 # 2d1c0 <_sk_overlay_sse2_8bit+0x13e8>
+ .byte 68,15,40,5,109,110,1,0 // movaps 0x16e6d(%rip),%xmm8 # 2d1a0 <_sk_overlay_sse2_8bit+0x13dc>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -30963,7 +30957,7 @@ _sk_store_4444_sse41:
.byte 102,69,15,86,194 // orpd %xmm10,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 163a7 <_sk_store_4444_sse41+0x84>
+ .byte 117,10 // jne 16399 <_sk_store_4444_sse41+0x84>
.byte 242,69,15,17,4,64 // movsd %xmm8,(%r8,%rax,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -30971,17 +30965,17 @@ _sk_store_4444_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,35 // je 163dd <_sk_store_4444_sse41+0xba>
+ .byte 116,35 // je 163cf <_sk_store_4444_sse41+0xba>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,15 // je 163cf <_sk_store_4444_sse41+0xac>
+ .byte 116,15 // je 163c1 <_sk_store_4444_sse41+0xac>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,221 // jne 163a3 <_sk_store_4444_sse41+0x80>
+ .byte 117,221 // jne 16395 <_sk_store_4444_sse41+0x80>
.byte 102,69,15,58,21,68,64,4,4 // pextrw $0x4,%xmm8,0x4(%r8,%rax,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,69,15,126,4,64 // movd %xmm8,(%r8,%rax,2)
- .byte 235,198 // jmp 163a3 <_sk_store_4444_sse41+0x80>
+ .byte 235,198 // jmp 16395 <_sk_store_4444_sse41+0x80>
.byte 102,69,15,58,21,4,64,0 // pextrw $0x0,%xmm8,(%r8,%rax,2)
- .byte 235,188 // jmp 163a3 <_sk_store_4444_sse41+0x80>
+ .byte 235,188 // jmp 16395 <_sk_store_4444_sse41+0x80>
HIDDEN _sk_load_8888_sse41
.globl _sk_load_8888_sse41
@@ -30995,19 +30989,19 @@ _sk_load_8888_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,89 // jne 1645c <_sk_load_8888_sse41+0x75>
+ .byte 117,89 // jne 1644e <_sk_load_8888_sse41+0x75>
.byte 243,65,15,111,28,128 // movdqu (%r8,%rax,4),%xmm3
- .byte 102,15,111,5,159,105,1,0 // movdqa 0x1699f(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,5,141,105,1,0 // movdqa 0x1698d(%rip),%xmm0 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,224,106,1,0 // movaps 0x16ae0(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,5,206,106,1,0 // movaps 0x16ace(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,143,105,1,0 // pshufb 0x1698f(%rip),%xmm1 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
+ .byte 102,15,56,0,13,125,105,1,0 // pshufb 0x1697d(%rip),%xmm1 # 2cda0 <_sk_overlay_sse2_8bit+0xfdc>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,139,105,1,0 // pshufb 0x1698b(%rip),%xmm2 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
+ .byte 102,15,56,0,21,121,105,1,0 // pshufb 0x16979(%rip),%xmm2 # 2cdb0 <_sk_overlay_sse2_8bit+0xfec>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -31018,19 +31012,19 @@ _sk_load_8888_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,45 // je 16496 <_sk_load_8888_sse41+0xaf>
+ .byte 116,45 // je 16488 <_sk_load_8888_sse41+0xaf>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 16485 <_sk_load_8888_sse41+0x9e>
+ .byte 116,18 // je 16477 <_sk_load_8888_sse41+0x9e>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,144 // jne 16409 <_sk_load_8888_sse41+0x22>
+ .byte 117,144 // jne 163fb <_sk_load_8888_sse41+0x22>
.byte 102,65,15,110,68,128,8 // movd 0x8(%r8,%rax,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 243,65,15,126,4,128 // movq (%r8,%rax,4),%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,115,255,255,255 // jmpq 16409 <_sk_load_8888_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 163fb <_sk_load_8888_sse41+0x22>
.byte 102,65,15,110,28,128 // movd (%r8,%rax,4),%xmm3
- .byte 233,104,255,255,255 // jmpq 16409 <_sk_load_8888_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 163fb <_sk_load_8888_sse41+0x22>
HIDDEN _sk_load_8888_dst_sse41
.globl _sk_load_8888_dst_sse41
@@ -31044,19 +31038,19 @@ _sk_load_8888_dst_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,89 // jne 16516 <_sk_load_8888_dst_sse41+0x75>
+ .byte 117,89 // jne 16508 <_sk_load_8888_dst_sse41+0x75>
.byte 243,65,15,111,60,128 // movdqu (%r8,%rax,4),%xmm7
- .byte 102,15,111,37,229,104,1,0 // movdqa 0x168e5(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,37,211,104,1,0 // movdqa 0x168d3(%rip),%xmm4 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,38,106,1,0 // movaps 0x16a26(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,5,20,106,1,0 // movaps 0x16a14(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,213,104,1,0 // pshufb 0x168d5(%rip),%xmm5 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
+ .byte 102,15,56,0,45,195,104,1,0 // pshufb 0x168c3(%rip),%xmm5 # 2cda0 <_sk_overlay_sse2_8bit+0xfdc>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,209,104,1,0 // pshufb 0x168d1(%rip),%xmm6 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
+ .byte 102,15,56,0,53,191,104,1,0 // pshufb 0x168bf(%rip),%xmm6 # 2cdb0 <_sk_overlay_sse2_8bit+0xfec>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -31067,19 +31061,19 @@ _sk_load_8888_dst_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,45 // je 16550 <_sk_load_8888_dst_sse41+0xaf>
+ .byte 116,45 // je 16542 <_sk_load_8888_dst_sse41+0xaf>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 1653f <_sk_load_8888_dst_sse41+0x9e>
+ .byte 116,18 // je 16531 <_sk_load_8888_dst_sse41+0x9e>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,144 // jne 164c3 <_sk_load_8888_dst_sse41+0x22>
+ .byte 117,144 // jne 164b5 <_sk_load_8888_dst_sse41+0x22>
.byte 102,65,15,110,100,128,8 // movd 0x8(%r8,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,128 // movq (%r8,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,115,255,255,255 // jmpq 164c3 <_sk_load_8888_dst_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 164b5 <_sk_load_8888_dst_sse41+0x22>
.byte 102,65,15,110,60,128 // movd (%r8,%rax,4),%xmm7
- .byte 233,104,255,255,255 // jmpq 164c3 <_sk_load_8888_dst_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 164b5 <_sk_load_8888_dst_sse41+0x22>
HIDDEN _sk_gather_8888_sse41
.globl _sk_gather_8888_sse41
@@ -31103,17 +31097,17 @@ _sk_gather_8888_sse41:
.byte 102,65,15,58,34,28,128,1 // pinsrd $0x1,(%r8,%rax,4),%xmm3
.byte 102,67,15,58,34,28,152,2 // pinsrd $0x2,(%r8,%r11,4),%xmm3
.byte 102,67,15,58,34,28,144,3 // pinsrd $0x3,(%r8,%r10,4),%xmm3
- .byte 102,15,111,5,245,103,1,0 // movdqa 0x167f5(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,5,227,103,1,0 // movdqa 0x167e3(%rip),%xmm0 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,54,105,1,0 // movaps 0x16936(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,5,36,105,1,0 // movaps 0x16924(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,229,103,1,0 // pshufb 0x167e5(%rip),%xmm1 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
+ .byte 102,15,56,0,13,211,103,1,0 // pshufb 0x167d3(%rip),%xmm1 # 2cda0 <_sk_overlay_sse2_8bit+0xfdc>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,225,103,1,0 // pshufb 0x167e1(%rip),%xmm2 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
+ .byte 102,15,56,0,21,207,103,1,0 // pshufb 0x167cf(%rip),%xmm2 # 2cdb0 <_sk_overlay_sse2_8bit+0xfec>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -31133,7 +31127,7 @@ _sk_store_8888_sse41:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,187,103,1,0 // movaps 0x167bb(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
+ .byte 68,15,40,5,169,103,1,0 // movaps 0x167a9(%rip),%xmm8 # 2cdc0 <_sk_overlay_sse2_8bit+0xffc>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -31152,23 +31146,23 @@ _sk_store_8888_sse41:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 16685 <_sk_store_8888_sse41+0x7f>
+ .byte 117,10 // jne 16677 <_sk_store_8888_sse41+0x7f>
.byte 243,69,15,127,4,128 // movdqu %xmm8,(%r8,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,29 // je 166af <_sk_store_8888_sse41+0xa9>
+ .byte 116,29 // je 166a1 <_sk_store_8888_sse41+0xa9>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,15 // je 166a7 <_sk_store_8888_sse41+0xa1>
+ .byte 116,15 // je 16699 <_sk_store_8888_sse41+0xa1>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,227 // jne 16681 <_sk_store_8888_sse41+0x7b>
+ .byte 117,227 // jne 16673 <_sk_store_8888_sse41+0x7b>
.byte 102,69,15,58,22,68,128,8,2 // pextrd $0x2,%xmm8,0x8(%r8,%rax,4)
.byte 102,69,15,214,4,128 // movq %xmm8,(%r8,%rax,4)
- .byte 235,210 // jmp 16681 <_sk_store_8888_sse41+0x7b>
+ .byte 235,210 // jmp 16673 <_sk_store_8888_sse41+0x7b>
.byte 102,69,15,126,4,128 // movd %xmm8,(%r8,%rax,4)
- .byte 235,202 // jmp 16681 <_sk_store_8888_sse41+0x7b>
+ .byte 235,202 // jmp 16673 <_sk_store_8888_sse41+0x7b>
HIDDEN _sk_load_bgra_sse41
.globl _sk_load_bgra_sse41
@@ -31182,19 +31176,19 @@ _sk_load_bgra_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,89 // jne 1672c <_sk_load_bgra_sse41+0x75>
+ .byte 117,89 // jne 1671e <_sk_load_bgra_sse41+0x75>
.byte 243,65,15,111,28,128 // movdqu (%r8,%rax,4),%xmm3
- .byte 102,15,111,5,207,102,1,0 // movdqa 0x166cf(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,5,189,102,1,0 // movdqa 0x166bd(%rip),%xmm0 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,16,104,1,0 // movaps 0x16810(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,5,254,103,1,0 // movaps 0x167fe(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,191,102,1,0 // pshufb 0x166bf(%rip),%xmm0 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
+ .byte 102,15,56,0,5,173,102,1,0 // pshufb 0x166ad(%rip),%xmm0 # 2cda0 <_sk_overlay_sse2_8bit+0xfdc>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,187,102,1,0 // pshufb 0x166bb(%rip),%xmm0 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
+ .byte 102,15,56,0,5,169,102,1,0 // pshufb 0x166a9(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfec>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -31205,19 +31199,19 @@ _sk_load_bgra_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,45 // je 16766 <_sk_load_bgra_sse41+0xaf>
+ .byte 116,45 // je 16758 <_sk_load_bgra_sse41+0xaf>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 16755 <_sk_load_bgra_sse41+0x9e>
+ .byte 116,18 // je 16747 <_sk_load_bgra_sse41+0x9e>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,144 // jne 166d9 <_sk_load_bgra_sse41+0x22>
+ .byte 117,144 // jne 166cb <_sk_load_bgra_sse41+0x22>
.byte 102,65,15,110,68,128,8 // movd 0x8(%r8,%rax,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 243,65,15,126,4,128 // movq (%r8,%rax,4),%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,115,255,255,255 // jmpq 166d9 <_sk_load_bgra_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 166cb <_sk_load_bgra_sse41+0x22>
.byte 102,65,15,110,28,128 // movd (%r8,%rax,4),%xmm3
- .byte 233,104,255,255,255 // jmpq 166d9 <_sk_load_bgra_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 166cb <_sk_load_bgra_sse41+0x22>
HIDDEN _sk_load_bgra_dst_sse41
.globl _sk_load_bgra_dst_sse41
@@ -31231,19 +31225,19 @@ _sk_load_bgra_dst_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,89 // jne 167e6 <_sk_load_bgra_dst_sse41+0x75>
+ .byte 117,89 // jne 167d8 <_sk_load_bgra_dst_sse41+0x75>
.byte 243,65,15,111,60,128 // movdqu (%r8,%rax,4),%xmm7
- .byte 102,15,111,37,21,102,1,0 // movdqa 0x16615(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,37,3,102,1,0 // movdqa 0x16603(%rip),%xmm4 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,244 // cvtdq2ps %xmm4,%xmm6
- .byte 68,15,40,5,86,103,1,0 // movaps 0x16756(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,5,68,103,1,0 // movaps 0x16744(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,5,102,1,0 // pshufb 0x16605(%rip),%xmm4 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
+ .byte 102,15,56,0,37,243,101,1,0 // pshufb 0x165f3(%rip),%xmm4 # 2cda0 <_sk_overlay_sse2_8bit+0xfdc>
.byte 15,91,236 // cvtdq2ps %xmm4,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,1,102,1,0 // pshufb 0x16601(%rip),%xmm4 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
+ .byte 102,15,56,0,37,239,101,1,0 // pshufb 0x165ef(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfec>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -31254,19 +31248,19 @@ _sk_load_bgra_dst_sse41:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,45 // je 16820 <_sk_load_bgra_dst_sse41+0xaf>
+ .byte 116,45 // je 16812 <_sk_load_bgra_dst_sse41+0xaf>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 1680f <_sk_load_bgra_dst_sse41+0x9e>
+ .byte 116,18 // je 16801 <_sk_load_bgra_dst_sse41+0x9e>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,144 // jne 16793 <_sk_load_bgra_dst_sse41+0x22>
+ .byte 117,144 // jne 16785 <_sk_load_bgra_dst_sse41+0x22>
.byte 102,65,15,110,100,128,8 // movd 0x8(%r8,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,128 // movq (%r8,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,115,255,255,255 // jmpq 16793 <_sk_load_bgra_dst_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 16785 <_sk_load_bgra_dst_sse41+0x22>
.byte 102,65,15,110,60,128 // movd (%r8,%rax,4),%xmm7
- .byte 233,104,255,255,255 // jmpq 16793 <_sk_load_bgra_dst_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 16785 <_sk_load_bgra_dst_sse41+0x22>
HIDDEN _sk_gather_bgra_sse41
.globl _sk_gather_bgra_sse41
@@ -31290,17 +31284,17 @@ _sk_gather_bgra_sse41:
.byte 102,65,15,58,34,28,128,1 // pinsrd $0x1,(%r8,%rax,4),%xmm3
.byte 102,67,15,58,34,28,152,2 // pinsrd $0x2,(%r8,%r11,4),%xmm3
.byte 102,67,15,58,34,28,144,3 // pinsrd $0x3,(%r8,%r10,4),%xmm3
- .byte 102,15,111,5,37,101,1,0 // movdqa 0x16525(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,5,19,101,1,0 // movdqa 0x16513(%rip),%xmm0 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,102,102,1,0 // movaps 0x16666(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,5,84,102,1,0 // movaps 0x16654(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,21,101,1,0 // pshufb 0x16515(%rip),%xmm0 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
+ .byte 102,15,56,0,5,3,101,1,0 // pshufb 0x16503(%rip),%xmm0 # 2cda0 <_sk_overlay_sse2_8bit+0xfdc>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,17,101,1,0 // pshufb 0x16511(%rip),%xmm0 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
+ .byte 102,15,56,0,5,255,100,1,0 // pshufb 0x164ff(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfec>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -31320,7 +31314,7 @@ _sk_store_bgra_sse41:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,235,100,1,0 // movaps 0x164eb(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
+ .byte 68,15,40,5,217,100,1,0 // movaps 0x164d9(%rip),%xmm8 # 2cdc0 <_sk_overlay_sse2_8bit+0xffc>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -31339,23 +31333,23 @@ _sk_store_bgra_sse41:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 16955 <_sk_store_bgra_sse41+0x7f>
+ .byte 117,10 // jne 16947 <_sk_store_bgra_sse41+0x7f>
.byte 243,69,15,127,4,128 // movdqu %xmm8,(%r8,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,29 // je 1697f <_sk_store_bgra_sse41+0xa9>
+ .byte 116,29 // je 16971 <_sk_store_bgra_sse41+0xa9>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,15 // je 16977 <_sk_store_bgra_sse41+0xa1>
+ .byte 116,15 // je 16969 <_sk_store_bgra_sse41+0xa1>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,227 // jne 16951 <_sk_store_bgra_sse41+0x7b>
+ .byte 117,227 // jne 16943 <_sk_store_bgra_sse41+0x7b>
.byte 102,69,15,58,22,68,128,8,2 // pextrd $0x2,%xmm8,0x8(%r8,%rax,4)
.byte 102,69,15,214,4,128 // movq %xmm8,(%r8,%rax,4)
- .byte 235,210 // jmp 16951 <_sk_store_bgra_sse41+0x7b>
+ .byte 235,210 // jmp 16943 <_sk_store_bgra_sse41+0x7b>
.byte 102,69,15,126,4,128 // movd %xmm8,(%r8,%rax,4)
- .byte 235,202 // jmp 16951 <_sk_store_bgra_sse41+0x7b>
+ .byte 235,202 // jmp 16943 <_sk_store_bgra_sse41+0x7b>
HIDDEN _sk_load_f16_sse41
.globl _sk_load_f16_sse41
@@ -31369,7 +31363,7 @@ _sk_load_f16_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,62,1,0,0 // jne 16ae5 <_sk_load_f16_sse41+0x15e>
+ .byte 15,133,62,1,0,0 // jne 16ad7 <_sk_load_f16_sse41+0x15e>
.byte 102,65,15,16,4,192 // movupd (%r8,%rax,8),%xmm0
.byte 243,65,15,111,76,192,16 // movdqu 0x10(%r8,%rax,8),%xmm1
.byte 102,68,15,40,200 // movapd %xmm0,%xmm9
@@ -31379,18 +31373,18 @@ _sk_load_f16_sse41:
.byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,240,103,1,0 // movdqa 0x167f0(%rip),%xmm8 # 2d1d0 <_sk_overlay_sse2_8bit+0x13f8>
+ .byte 102,68,15,111,5,222,103,1,0 // movdqa 0x167de(%rip),%xmm8 # 2d1b0 <_sk_overlay_sse2_8bit+0x13ec>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,235,103,1,0 // movdqa 0x167eb(%rip),%xmm3 # 2d1e0 <_sk_overlay_sse2_8bit+0x1408>
+ .byte 102,15,111,29,217,103,1,0 // movdqa 0x167d9(%rip),%xmm3 # 2d1c0 <_sk_overlay_sse2_8bit+0x13fc>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,215,103,1,0 // movdqa 0x167d7(%rip),%xmm10 # 2d1f0 <_sk_overlay_sse2_8bit+0x1418>
+ .byte 102,68,15,111,21,197,103,1,0 // movdqa 0x167c5(%rip),%xmm10 # 2d1d0 <_sk_overlay_sse2_8bit+0x140c>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -31433,16 +31427,16 @@ _sk_load_f16_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,192 // movsd (%r8,%rax,8),%xmm0
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,13 // jne 16afe <_sk_load_f16_sse41+0x177>
+ .byte 117,13 // jne 16af0 <_sk_load_f16_sse41+0x177>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,182,254,255,255 // jmpq 169b4 <_sk_load_f16_sse41+0x2d>
+ .byte 233,182,254,255,255 // jmpq 169a6 <_sk_load_f16_sse41+0x2d>
.byte 102,65,15,22,68,192,8 // movhpd 0x8(%r8,%rax,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 15,130,161,254,255,255 // jb 169b4 <_sk_load_f16_sse41+0x2d>
+ .byte 15,130,161,254,255,255 // jb 169a6 <_sk_load_f16_sse41+0x2d>
.byte 243,65,15,126,76,192,16 // movq 0x10(%r8,%rax,8),%xmm1
- .byte 233,149,254,255,255 // jmpq 169b4 <_sk_load_f16_sse41+0x2d>
+ .byte 233,149,254,255,255 // jmpq 169a6 <_sk_load_f16_sse41+0x2d>
HIDDEN _sk_load_f16_dst_sse41
.globl _sk_load_f16_dst_sse41
@@ -31456,7 +31450,7 @@ _sk_load_f16_dst_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,62,1,0,0 // jne 16c7d <_sk_load_f16_dst_sse41+0x15e>
+ .byte 15,133,62,1,0,0 // jne 16c6f <_sk_load_f16_dst_sse41+0x15e>
.byte 102,65,15,16,36,192 // movupd (%r8,%rax,8),%xmm4
.byte 243,65,15,111,108,192,16 // movdqu 0x10(%r8,%rax,8),%xmm5
.byte 102,68,15,40,204 // movapd %xmm4,%xmm9
@@ -31466,18 +31460,18 @@ _sk_load_f16_dst_sse41:
.byte 102,68,15,97,220 // punpcklwd %xmm4,%xmm11
.byte 102,68,15,105,204 // punpckhwd %xmm4,%xmm9
.byte 102,65,15,56,51,235 // pmovzxwd %xmm11,%xmm5
- .byte 102,68,15,111,5,88,102,1,0 // movdqa 0x16658(%rip),%xmm8 # 2d1d0 <_sk_overlay_sse2_8bit+0x13f8>
+ .byte 102,68,15,111,5,70,102,1,0 // movdqa 0x16646(%rip),%xmm8 # 2d1b0 <_sk_overlay_sse2_8bit+0x13ec>
.byte 102,15,111,245 // movdqa %xmm5,%xmm6
.byte 102,65,15,219,240 // pand %xmm8,%xmm6
.byte 102,15,239,238 // pxor %xmm6,%xmm5
- .byte 102,15,111,61,83,102,1,0 // movdqa 0x16653(%rip),%xmm7 # 2d1e0 <_sk_overlay_sse2_8bit+0x1408>
+ .byte 102,15,111,61,65,102,1,0 // movdqa 0x16641(%rip),%xmm7 # 2d1c0 <_sk_overlay_sse2_8bit+0x13fc>
.byte 102,15,114,246,16 // pslld $0x10,%xmm6
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,15,56,63,231 // pmaxud %xmm7,%xmm4
.byte 102,15,118,229 // pcmpeqd %xmm5,%xmm4
.byte 102,15,114,245,13 // pslld $0xd,%xmm5
.byte 102,15,235,238 // por %xmm6,%xmm5
- .byte 102,68,15,111,21,63,102,1,0 // movdqa 0x1663f(%rip),%xmm10 # 2d1f0 <_sk_overlay_sse2_8bit+0x1418>
+ .byte 102,68,15,111,21,45,102,1,0 // movdqa 0x1662d(%rip),%xmm10 # 2d1d0 <_sk_overlay_sse2_8bit+0x140c>
.byte 102,65,15,254,234 // paddd %xmm10,%xmm5
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -31520,16 +31514,16 @@ _sk_load_f16_dst_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,36,192 // movsd (%r8,%rax,8),%xmm4
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,13 // jne 16c96 <_sk_load_f16_dst_sse41+0x177>
+ .byte 117,13 // jne 16c88 <_sk_load_f16_dst_sse41+0x177>
.byte 243,15,126,228 // movq %xmm4,%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
- .byte 233,182,254,255,255 // jmpq 16b4c <_sk_load_f16_dst_sse41+0x2d>
+ .byte 233,182,254,255,255 // jmpq 16b3e <_sk_load_f16_dst_sse41+0x2d>
.byte 102,65,15,22,100,192,8 // movhpd 0x8(%r8,%rax,8),%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 15,130,161,254,255,255 // jb 16b4c <_sk_load_f16_dst_sse41+0x2d>
+ .byte 15,130,161,254,255,255 // jb 16b3e <_sk_load_f16_dst_sse41+0x2d>
.byte 243,65,15,126,108,192,16 // movq 0x10(%r8,%rax,8),%xmm5
- .byte 233,149,254,255,255 // jmpq 16b4c <_sk_load_f16_dst_sse41+0x2d>
+ .byte 233,149,254,255,255 // jmpq 16b3e <_sk_load_f16_dst_sse41+0x2d>
HIDDEN _sk_gather_f16_sse41
.globl _sk_gather_f16_sse41
@@ -31562,18 +31556,18 @@ _sk_gather_f16_sse41:
.byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11
.byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,147,100,1,0 // movdqa 0x16493(%rip),%xmm8 # 2d1d0 <_sk_overlay_sse2_8bit+0x13f8>
+ .byte 102,68,15,111,5,129,100,1,0 // movdqa 0x16481(%rip),%xmm8 # 2d1b0 <_sk_overlay_sse2_8bit+0x13ec>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,142,100,1,0 // movdqa 0x1648e(%rip),%xmm3 # 2d1e0 <_sk_overlay_sse2_8bit+0x1408>
+ .byte 102,15,111,29,124,100,1,0 // movdqa 0x1647c(%rip),%xmm3 # 2d1c0 <_sk_overlay_sse2_8bit+0x13fc>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,122,100,1,0 // movdqa 0x1647a(%rip),%xmm10 # 2d1f0 <_sk_overlay_sse2_8bit+0x1418>
+ .byte 102,68,15,111,21,104,100,1,0 // movdqa 0x16468(%rip),%xmm10 # 2d1d0 <_sk_overlay_sse2_8bit+0x140c>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -31626,17 +31620,17 @@ _sk_store_f16_sse41:
.byte 73,193,224,3 // shl $0x3,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,158,99,1,0 // movdqa 0x1639e(%rip),%xmm10 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
+ .byte 102,68,15,111,21,140,99,1,0 // movdqa 0x1638c(%rip),%xmm10 # 2d1e0 <_sk_overlay_sse2_8bit+0x141c>
.byte 102,68,15,111,216 // movdqa %xmm0,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,235 // pxor %xmm11,%xmm13
- .byte 102,68,15,111,13,145,99,1,0 // movdqa 0x16391(%rip),%xmm9 # 2d210 <_sk_overlay_sse2_8bit+0x1438>
+ .byte 102,68,15,111,13,127,99,1,0 // movdqa 0x1637f(%rip),%xmm9 # 2d1f0 <_sk_overlay_sse2_8bit+0x142c>
.byte 102,65,15,114,211,16 // psrld $0x10,%xmm11
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,37,130,99,1,0 // movdqa 0x16382(%rip),%xmm12 # 2d220 <_sk_overlay_sse2_8bit+0x1448>
+ .byte 102,68,15,111,37,112,99,1,0 // movdqa 0x16370(%rip),%xmm12 # 2d200 <_sk_overlay_sse2_8bit+0x143c>
.byte 102,69,15,235,220 // por %xmm12,%xmm11
.byte 102,69,15,254,221 // paddd %xmm13,%xmm11
.byte 102,69,15,223,195 // pandn %xmm11,%xmm8
@@ -31680,7 +31674,7 @@ _sk_store_f16_sse41:
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,69,15,98,203 // punpckldq %xmm11,%xmm9
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,21 // jne 16f94 <_sk_store_f16_sse41+0x152>
+ .byte 117,21 // jne 16f86 <_sk_store_f16_sse41+0x152>
.byte 69,15,17,12,192 // movups %xmm9,(%r8,%rax,8)
.byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8
.byte 243,69,15,127,68,192,16 // movdqu %xmm8,0x10(%r8,%rax,8)
@@ -31688,13 +31682,13 @@ _sk_store_f16_sse41:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,12,192 // movq %xmm9,(%r8,%rax,8)
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,240 // je 16f90 <_sk_store_f16_sse41+0x14e>
+ .byte 116,240 // je 16f82 <_sk_store_f16_sse41+0x14e>
.byte 102,69,15,23,76,192,8 // movhpd %xmm9,0x8(%r8,%rax,8)
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,227 // jb 16f90 <_sk_store_f16_sse41+0x14e>
+ .byte 114,227 // jb 16f82 <_sk_store_f16_sse41+0x14e>
.byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8
.byte 102,69,15,214,68,192,16 // movq %xmm8,0x10(%r8,%rax,8)
- .byte 235,213 // jmp 16f90 <_sk_store_f16_sse41+0x14e>
+ .byte 235,213 // jmp 16f82 <_sk_store_f16_sse41+0x14e>
HIDDEN _sk_load_u16_be_sse41
.globl _sk_load_u16_be_sse41
@@ -31709,7 +31703,7 @@ _sk_load_u16_be_sse41:
.byte 76,3,0 // add (%rax),%r8
.byte 73,99,193 // movslq %r9d,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,185,0,0,0 // jne 1709b <_sk_load_u16_be_sse41+0xe0>
+ .byte 15,133,185,0,0,0 // jne 1708d <_sk_load_u16_be_sse41+0xe0>
.byte 102,65,15,16,4,64 // movupd (%r8,%rax,2),%xmm0
.byte 243,65,15,111,76,64,16 // movdqu 0x10(%r8,%rax,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -31725,7 +31719,7 @@ _sk_load_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,98,95,1,0 // movaps 0x15f62(%rip),%xmm8 # 2cf90 <_sk_overlay_sse2_8bit+0x11b8>
+ .byte 68,15,40,5,80,95,1,0 // movaps 0x15f50(%rip),%xmm8 # 2cf70 <_sk_overlay_sse2_8bit+0x11ac>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -31753,16 +31747,16 @@ _sk_load_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,64 // movsd (%r8,%rax,2),%xmm0
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,13 // jne 170b4 <_sk_load_u16_be_sse41+0xf9>
+ .byte 117,13 // jne 170a6 <_sk_load_u16_be_sse41+0xf9>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,59,255,255,255 // jmpq 16fef <_sk_load_u16_be_sse41+0x34>
+ .byte 233,59,255,255,255 // jmpq 16fe1 <_sk_load_u16_be_sse41+0x34>
.byte 102,65,15,22,68,64,8 // movhpd 0x8(%r8,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 15,130,38,255,255,255 // jb 16fef <_sk_load_u16_be_sse41+0x34>
+ .byte 15,130,38,255,255,255 // jb 16fe1 <_sk_load_u16_be_sse41+0x34>
.byte 243,65,15,126,76,64,16 // movq 0x10(%r8,%rax,2),%xmm1
- .byte 233,26,255,255,255 // jmpq 16fef <_sk_load_u16_be_sse41+0x34>
+ .byte 233,26,255,255,255 // jmpq 16fe1 <_sk_load_u16_be_sse41+0x34>
HIDDEN _sk_load_rgb_u16_be_sse41
.globl _sk_load_rgb_u16_be_sse41
@@ -31779,7 +31773,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,170,0,0,0 // jne 171aa <_sk_load_rgb_u16_be_sse41+0xd5>
+ .byte 15,133,170,0,0,0 // jne 1719c <_sk_load_rgb_u16_be_sse41+0xd5>
.byte 243,65,15,111,20,64 // movdqu (%r8,%rax,2),%xmm2
.byte 243,65,15,111,92,64,8 // movdqu 0x8(%r8,%rax,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -31799,7 +31793,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,49,94,1,0 // movaps 0x15e31(%rip),%xmm8 # 2cf90 <_sk_overlay_sse2_8bit+0x11b8>
+ .byte 68,15,40,5,31,94,1,0 // movaps 0x15e1f(%rip),%xmm8 # 2cf70 <_sk_overlay_sse2_8bit+0x11ac>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -31816,27 +31810,27 @@ _sk_load_rgb_u16_be_sse41:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,88,91,1,0 // movaps 0x15b58(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,70,91,1,0 // movaps 0x15b46(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,64 // movd (%r8,%rax,2),%xmm2
.byte 102,65,15,196,84,64,4,2 // pinsrw $0x2,0x4(%r8,%rax,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,13 // jne 171cf <_sk_load_rgb_u16_be_sse41+0xfa>
+ .byte 117,13 // jne 171c1 <_sk_load_rgb_u16_be_sse41+0xfa>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,85,255,255,255 // jmpq 17124 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,85,255,255,255 // jmpq 17116 <_sk_load_rgb_u16_be_sse41+0x4f>
.byte 102,65,15,110,68,64,6 // movd 0x6(%r8,%rax,2),%xmm0
.byte 102,65,15,196,68,64,10,2 // pinsrw $0x2,0xa(%r8,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,24 // jb 17200 <_sk_load_rgb_u16_be_sse41+0x12b>
+ .byte 114,24 // jb 171f2 <_sk_load_rgb_u16_be_sse41+0x12b>
.byte 102,65,15,110,92,64,12 // movd 0xc(%r8,%rax,2),%xmm3
.byte 102,65,15,196,92,64,16,2 // pinsrw $0x2,0x10(%r8,%rax,2),%xmm3
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,36,255,255,255 // jmpq 17124 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,36,255,255,255 // jmpq 17116 <_sk_load_rgb_u16_be_sse41+0x4f>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,27,255,255,255 // jmpq 17124 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,27,255,255,255 // jmpq 17116 <_sk_load_rgb_u16_be_sse41+0x4f>
HIDDEN _sk_store_u16_be_sse41
.globl _sk_store_u16_be_sse41
@@ -31850,7 +31844,7 @@ _sk_store_u16_be_sse41:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 73,99,193 // movslq %r9d,%rax
- .byte 68,15,40,21,1,96,1,0 // movaps 0x16001(%rip),%xmm10 # 2d230 <_sk_overlay_sse2_8bit+0x1458>
+ .byte 68,15,40,21,239,95,1,0 // movaps 0x15fef(%rip),%xmm10 # 2d210 <_sk_overlay_sse2_8bit+0x144c>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -31887,7 +31881,7 @@ _sk_store_u16_be_sse41:
.byte 102,69,15,111,208 // movdqa %xmm8,%xmm10
.byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,21 // jne 172fd <_sk_store_u16_be_sse41+0xf4>
+ .byte 117,21 // jne 172ef <_sk_store_u16_be_sse41+0xf4>
.byte 69,15,17,20,64 // movups %xmm10,(%r8,%rax,2)
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 243,69,15,127,68,64,16 // movdqu %xmm8,0x10(%r8,%rax,2)
@@ -31895,13 +31889,13 @@ _sk_store_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,20,64 // movq %xmm10,(%r8,%rax,2)
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,240 // je 172f9 <_sk_store_u16_be_sse41+0xf0>
+ .byte 116,240 // je 172eb <_sk_store_u16_be_sse41+0xf0>
.byte 102,69,15,23,84,64,8 // movhpd %xmm10,0x8(%r8,%rax,2)
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,227 // jb 172f9 <_sk_store_u16_be_sse41+0xf0>
+ .byte 114,227 // jb 172eb <_sk_store_u16_be_sse41+0xf0>
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 102,69,15,214,68,64,16 // movq %xmm8,0x10(%r8,%rax,2)
- .byte 235,213 // jmp 172f9 <_sk_store_u16_be_sse41+0xf0>
+ .byte 235,213 // jmp 172eb <_sk_store_u16_be_sse41+0xf0>
HIDDEN _sk_load_f32_sse41
.globl _sk_load_f32_sse41
@@ -31917,7 +31911,7 @@ _sk_load_f32_sse41:
.byte 73,99,193 // movslq %r9d,%rax
.byte 69,15,16,4,128 // movups (%r8,%rax,4),%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,66 // jne 1738f <_sk_load_f32_sse41+0x6b>
+ .byte 117,66 // jne 17381 <_sk_load_f32_sse41+0x6b>
.byte 65,15,16,68,128,16 // movups 0x10(%r8,%rax,4),%xmm0
.byte 65,15,16,92,128,32 // movups 0x20(%r8,%rax,4),%xmm3
.byte 69,15,16,76,128,48 // movups 0x30(%r8,%rax,4),%xmm9
@@ -31937,17 +31931,17 @@ _sk_load_f32_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,8 // jne 173a1 <_sk_load_f32_sse41+0x7d>
+ .byte 117,8 // jne 17393 <_sk_load_f32_sse41+0x7d>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 235,190 // jmp 1735f <_sk_load_f32_sse41+0x3b>
+ .byte 235,190 // jmp 17351 <_sk_load_f32_sse41+0x3b>
.byte 65,15,16,68,128,16 // movups 0x10(%r8,%rax,4),%xmm0
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,8 // jb 173b5 <_sk_load_f32_sse41+0x91>
+ .byte 114,8 // jb 173a7 <_sk_load_f32_sse41+0x91>
.byte 65,15,16,92,128,32 // movups 0x20(%r8,%rax,4),%xmm3
- .byte 235,170 // jmp 1735f <_sk_load_f32_sse41+0x3b>
+ .byte 235,170 // jmp 17351 <_sk_load_f32_sse41+0x3b>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,165 // jmp 1735f <_sk_load_f32_sse41+0x3b>
+ .byte 235,165 // jmp 17351 <_sk_load_f32_sse41+0x3b>
HIDDEN _sk_load_f32_dst_sse41
.globl _sk_load_f32_dst_sse41
@@ -31963,7 +31957,7 @@ _sk_load_f32_dst_sse41:
.byte 73,99,193 // movslq %r9d,%rax
.byte 69,15,16,4,128 // movups (%r8,%rax,4),%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,66 // jne 17425 <_sk_load_f32_dst_sse41+0x6b>
+ .byte 117,66 // jne 17417 <_sk_load_f32_dst_sse41+0x6b>
.byte 65,15,16,100,128,16 // movups 0x10(%r8,%rax,4),%xmm4
.byte 65,15,16,124,128,32 // movups 0x20(%r8,%rax,4),%xmm7
.byte 69,15,16,76,128,48 // movups 0x30(%r8,%rax,4),%xmm9
@@ -31983,17 +31977,17 @@ _sk_load_f32_dst_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,8 // jne 17437 <_sk_load_f32_dst_sse41+0x7d>
+ .byte 117,8 // jne 17429 <_sk_load_f32_dst_sse41+0x7d>
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 235,190 // jmp 173f5 <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,190 // jmp 173e7 <_sk_load_f32_dst_sse41+0x3b>
.byte 65,15,16,100,128,16 // movups 0x10(%r8,%rax,4),%xmm4
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,8 // jb 1744b <_sk_load_f32_dst_sse41+0x91>
+ .byte 114,8 // jb 1743d <_sk_load_f32_dst_sse41+0x91>
.byte 65,15,16,124,128,32 // movups 0x20(%r8,%rax,4),%xmm7
- .byte 235,170 // jmp 173f5 <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,170 // jmp 173e7 <_sk_load_f32_dst_sse41+0x3b>
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,165 // jmp 173f5 <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,165 // jmp 173e7 <_sk_load_f32_dst_sse41+0x3b>
HIDDEN _sk_store_f32_sse41
.globl _sk_store_f32_sse41
@@ -32022,7 +32016,7 @@ _sk_store_f32_sse41:
.byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9
.byte 102,69,15,17,36,128 // movupd %xmm12,(%r8,%rax,4)
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,29 // jne 174cd <_sk_store_f32_sse41+0x7d>
+ .byte 117,29 // jne 174bf <_sk_store_f32_sse41+0x7d>
.byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10
.byte 69,15,17,68,128,16 // movups %xmm8,0x10(%r8,%rax,4)
.byte 102,69,15,17,76,128,32 // movupd %xmm9,0x20(%r8,%rax,4)
@@ -32030,12 +32024,12 @@ _sk_store_f32_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,246 // je 174c9 <_sk_store_f32_sse41+0x79>
+ .byte 116,246 // je 174bb <_sk_store_f32_sse41+0x79>
.byte 69,15,17,68,128,16 // movups %xmm8,0x10(%r8,%rax,4)
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,234 // jb 174c9 <_sk_store_f32_sse41+0x79>
+ .byte 114,234 // jb 174bb <_sk_store_f32_sse41+0x79>
.byte 102,69,15,17,76,128,32 // movupd %xmm9,0x20(%r8,%rax,4)
- .byte 235,225 // jmp 174c9 <_sk_store_f32_sse41+0x79>
+ .byte 235,225 // jmp 174bb <_sk_store_f32_sse41+0x79>
HIDDEN _sk_clamp_x_sse41
.globl _sk_clamp_x_sse41
@@ -32125,7 +32119,7 @@ _sk_mirror_x_sse41:
.byte 65,15,92,194 // subps %xmm10,%xmm0
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,31,76,1,0 // mulss 0x14c1f(%rip),%xmm9 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 243,68,15,89,13,225,84,1,0 // mulss 0x154e1(%rip),%xmm9 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -32156,7 +32150,7 @@ _sk_mirror_y_sse41:
.byte 65,15,92,202 // subps %xmm10,%xmm1
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,173,75,1,0 // mulss 0x14bad(%rip),%xmm9 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 243,68,15,89,13,111,84,1,0 // mulss 0x1546f(%rip),%xmm9 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,201 // mulps %xmm1,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -32181,7 +32175,7 @@ FUNCTION(_sk_clamp_x_1_sse41)
_sk_clamp_x_1_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,68,86,1,0 // minps 0x15644(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,93,5,50,86,1,0 // minps 0x15632(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -32199,9 +32193,9 @@ HIDDEN _sk_mirror_x_1_sse41
.globl _sk_mirror_x_1_sse41
FUNCTION(_sk_mirror_x_1_sse41)
_sk_mirror_x_1_sse41:
- .byte 68,15,40,5,133,86,1,0 // movaps 0x15685(%rip),%xmm8 # 2cd60 <_sk_overlay_sse2_8bit+0xf88>
+ .byte 68,15,40,5,115,86,1,0 // movaps 0x15673(%rip),%xmm8 # 2cd40 <_sk_overlay_sse2_8bit+0xf7c>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,249,85,1,0 // movaps 0x155f9(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,40,13,247,85,1,0 // movaps 0x155f7(%rip),%xmm9 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
.byte 69,15,88,201 // addps %xmm9,%xmm9
@@ -32218,10 +32212,10 @@ HIDDEN _sk_luminance_to_alpha_sse41
FUNCTION(_sk_luminance_to_alpha_sse41)
_sk_luminance_to_alpha_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,40,91,1,0 // mulps 0x15b28(%rip),%xmm0 # 2d240 <_sk_overlay_sse2_8bit+0x1468>
- .byte 15,89,13,49,91,1,0 // mulps 0x15b31(%rip),%xmm1 # 2d250 <_sk_overlay_sse2_8bit+0x1478>
+ .byte 15,89,5,22,91,1,0 // mulps 0x15b16(%rip),%xmm0 # 2d220 <_sk_overlay_sse2_8bit+0x145c>
+ .byte 15,89,13,31,91,1,0 // mulps 0x15b1f(%rip),%xmm1 # 2d230 <_sk_overlay_sse2_8bit+0x146c>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,55,91,1,0 // mulps 0x15b37(%rip),%xmm3 # 2d260 <_sk_overlay_sse2_8bit+0x1488>
+ .byte 15,89,29,37,91,1,0 // mulps 0x15b25(%rip),%xmm3 # 2d240 <_sk_overlay_sse2_8bit+0x147c>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -32533,9 +32527,9 @@ _sk_evenly_spaced_gradient_sse41:
.byte 72,139,24 // mov (%rax),%rbx
.byte 76,139,112,8 // mov 0x8(%rax),%r14
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 17bc9 <_sk_evenly_spaced_gradient_sse41+0x18>
+ .byte 120,7 // js 17bbb <_sk_evenly_spaced_gradient_sse41+0x18>
.byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1
- .byte 235,21 // jmp 17bde <_sk_evenly_spaced_gradient_sse41+0x2d>
+ .byte 235,21 // jmp 17bd0 <_sk_evenly_spaced_gradient_sse41+0x2d>
.byte 73,137,216 // mov %rbx,%r8
.byte 73,209,232 // shr %r8
.byte 131,227,1 // and $0x1,%ebx
@@ -32624,15 +32618,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse41
.globl _sk_gauss_a_to_rgba_sse41
FUNCTION(_sk_gauss_a_to_rgba_sse41)
_sk_gauss_a_to_rgba_sse41:
- .byte 15,40,5,230,84,1,0 // movaps 0x154e6(%rip),%xmm0 # 2d270 <_sk_overlay_sse2_8bit+0x1498>
+ .byte 15,40,5,212,84,1,0 // movaps 0x154d4(%rip),%xmm0 # 2d250 <_sk_overlay_sse2_8bit+0x148c>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,236,84,1,0 // addps 0x154ec(%rip),%xmm0 # 2d280 <_sk_overlay_sse2_8bit+0x14a8>
+ .byte 15,88,5,218,84,1,0 // addps 0x154da(%rip),%xmm0 # 2d260 <_sk_overlay_sse2_8bit+0x149c>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,242,84,1,0 // addps 0x154f2(%rip),%xmm0 # 2d290 <_sk_overlay_sse2_8bit+0x14b8>
+ .byte 15,88,5,224,84,1,0 // addps 0x154e0(%rip),%xmm0 # 2d270 <_sk_overlay_sse2_8bit+0x14ac>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,248,84,1,0 // addps 0x154f8(%rip),%xmm0 # 2d2a0 <_sk_overlay_sse2_8bit+0x14c8>
+ .byte 15,88,5,230,84,1,0 // addps 0x154e6(%rip),%xmm0 # 2d280 <_sk_overlay_sse2_8bit+0x14bc>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,254,84,1,0 // addps 0x154fe(%rip),%xmm0 # 2d2b0 <_sk_overlay_sse2_8bit+0x14d8>
+ .byte 15,88,5,236,84,1,0 // addps 0x154ec(%rip),%xmm0 # 2d290 <_sk_overlay_sse2_8bit+0x14cc>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -32647,12 +32641,12 @@ _sk_gradient_sse41:
.byte 76,139,0 // mov (%rax),%r8
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,2 // cmp $0x2,%r8
- .byte 114,51 // jb 17e01 <_sk_gradient_sse41+0x42>
+ .byte 114,51 // jb 17df3 <_sk_gradient_sse41+0x42>
.byte 76,139,72,72 // mov 0x48(%rax),%r9
.byte 73,255,200 // dec %r8
.byte 73,131,193,4 // add $0x4,%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,44,79,1,0 // movaps 0x14f2c(%rip),%xmm2 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 15,40,21,26,79,1,0 // movaps 0x14f1a(%rip),%xmm2 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 243,65,15,16,25 // movss (%r9),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -32660,7 +32654,7 @@ _sk_gradient_sse41:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 73,131,193,4 // add $0x4,%r9
.byte 73,255,200 // dec %r8
- .byte 117,227 // jne 17de4 <_sk_gradient_sse41+0x25>
+ .byte 117,227 // jne 17dd6 <_sk_gradient_sse41+0x25>
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 102,73,15,58,22,200,1 // pextrq $0x1,%xmm1,%r8
@@ -32791,26 +32785,26 @@ _sk_xy_to_unit_angle_sse41:
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,237 // mulps %xmm13,%xmm13
- .byte 68,15,40,21,107,82,1,0 // movaps 0x1526b(%rip),%xmm10 # 2d2c0 <_sk_overlay_sse2_8bit+0x14e8>
+ .byte 68,15,40,21,89,82,1,0 // movaps 0x15259(%rip),%xmm10 # 2d2a0 <_sk_overlay_sse2_8bit+0x14dc>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,111,82,1,0 // addps 0x1526f(%rip),%xmm10 # 2d2d0 <_sk_overlay_sse2_8bit+0x14f8>
+ .byte 68,15,88,21,93,82,1,0 // addps 0x1525d(%rip),%xmm10 # 2d2b0 <_sk_overlay_sse2_8bit+0x14ec>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,115,82,1,0 // addps 0x15273(%rip),%xmm10 # 2d2e0 <_sk_overlay_sse2_8bit+0x1508>
+ .byte 68,15,88,21,97,82,1,0 // addps 0x15261(%rip),%xmm10 # 2d2c0 <_sk_overlay_sse2_8bit+0x14fc>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,119,82,1,0 // addps 0x15277(%rip),%xmm10 # 2d2f0 <_sk_overlay_sse2_8bit+0x1518>
+ .byte 68,15,88,21,101,82,1,0 // addps 0x15265(%rip),%xmm10 # 2d2d0 <_sk_overlay_sse2_8bit+0x150c>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 68,15,40,29,118,82,1,0 // movaps 0x15276(%rip),%xmm11 # 2d300 <_sk_overlay_sse2_8bit+0x1528>
+ .byte 68,15,40,29,100,82,1,0 // movaps 0x15264(%rip),%xmm11 # 2d2e0 <_sk_overlay_sse2_8bit+0x151c>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,40,29,63,76,1,0 // movaps 0x14c3f(%rip),%xmm11 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,40,29,61,76,1,0 // movaps 0x14c3d(%rip),%xmm11 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0
- .byte 68,15,40,13,65,76,1,0 // movaps 0x14c41(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,13,47,76,1,0 // movaps 0x14c2f(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10
.byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8
@@ -32844,7 +32838,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,234,81,1,0 // mulps 0x151ea(%rip),%xmm9 # 2d310 <_sk_overlay_sse2_8bit+0x1538>
+ .byte 68,15,89,13,216,81,1,0 // mulps 0x151d8(%rip),%xmm9 # 2d2f0 <_sk_overlay_sse2_8bit+0x152c>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -32852,7 +32846,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,213,81,1,0 // mulps 0x151d5(%rip),%xmm10 # 2d320 <_sk_overlay_sse2_8bit+0x1548>
+ .byte 68,15,89,21,195,81,1,0 // mulps 0x151c3(%rip),%xmm10 # 2d300 <_sk_overlay_sse2_8bit+0x153c>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -32861,8 +32855,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,141,80,1,0 // xorps 0x1508d(%rip),%xmm9 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
- .byte 68,15,89,5,101,75,1,0 // mulps 0x14b65(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,87,13,123,80,1,0 // xorps 0x1507b(%rip),%xmm9 # 2d1e0 <_sk_overlay_sse2_8bit+0x141c>
+ .byte 68,15,89,5,99,75,1,0 // mulps 0x14b63(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -32883,7 +32877,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,76,81,1,0 // mulps 0x1514c(%rip),%xmm9 # 2d310 <_sk_overlay_sse2_8bit+0x1538>
+ .byte 68,15,89,13,58,81,1,0 // mulps 0x1513a(%rip),%xmm9 # 2d2f0 <_sk_overlay_sse2_8bit+0x152c>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -32891,7 +32885,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,55,81,1,0 // mulps 0x15137(%rip),%xmm10 # 2d320 <_sk_overlay_sse2_8bit+0x1548>
+ .byte 68,15,89,21,37,81,1,0 // mulps 0x15125(%rip),%xmm10 # 2d300 <_sk_overlay_sse2_8bit+0x153c>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -32900,8 +32894,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,239,79,1,0 // xorps 0x14fef(%rip),%xmm9 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
- .byte 68,15,89,5,199,74,1,0 // mulps 0x14ac7(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,87,13,221,79,1,0 // xorps 0x14fdd(%rip),%xmm9 # 2d1e0 <_sk_overlay_sse2_8bit+0x141c>
+ .byte 68,15,89,5,197,74,1,0 // mulps 0x14ac5(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -32919,7 +32913,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,191,80,1,0 // mulps 0x150bf(%rip),%xmm9 # 2d310 <_sk_overlay_sse2_8bit+0x1538>
+ .byte 68,15,89,13,173,80,1,0 // mulps 0x150ad(%rip),%xmm9 # 2d2f0 <_sk_overlay_sse2_8bit+0x152c>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -32927,7 +32921,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,139,79,1,0 // xorps 0x14f8b(%rip),%xmm0 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
+ .byte 15,87,5,121,79,1,0 // xorps 0x14f79(%rip),%xmm0 # 2d1e0 <_sk_overlay_sse2_8bit+0x141c>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -32970,7 +32964,7 @@ HIDDEN _sk_save_xy_sse41
FUNCTION(_sk_save_xy_sse41)
_sk_save_xy_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,1,74,1,0 // movaps 0x14a01(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,40,5,255,73,1,0 // movaps 0x149ff(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -33014,8 +33008,8 @@ _sk_bilinear_nx_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,195,79,1,0 // addps 0x14fc3(%rip),%xmm0 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
- .byte 68,15,40,13,139,73,1,0 // movaps 0x1498b(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,88,5,177,79,1,0 // addps 0x14fb1(%rip),%xmm0 # 2d310 <_sk_overlay_sse2_8bit+0x154c>
+ .byte 68,15,40,13,121,73,1,0 // movaps 0x14979(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33028,7 +33022,7 @@ _sk_bilinear_px_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,74,73,1,0 // addps 0x1494a(%rip),%xmm0 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 15,88,5,72,73,1,0 // addps 0x14948(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33040,8 +33034,8 @@ _sk_bilinear_ny_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,124,79,1,0 // addps 0x14f7c(%rip),%xmm1 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
- .byte 68,15,40,13,68,73,1,0 // movaps 0x14944(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,88,13,106,79,1,0 // addps 0x14f6a(%rip),%xmm1 # 2d310 <_sk_overlay_sse2_8bit+0x154c>
+ .byte 68,15,40,13,50,73,1,0 // movaps 0x14932(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33054,7 +33048,7 @@ _sk_bilinear_py_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,2,73,1,0 // addps 0x14902(%rip),%xmm1 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 15,88,13,0,73,1,0 // addps 0x14900(%rip),%xmm1 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33066,13 +33060,13 @@ _sk_bicubic_n3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,69,79,1,0 // addps 0x14f45(%rip),%xmm0 # 2d340 <_sk_overlay_sse2_8bit+0x1568>
- .byte 68,15,40,13,253,72,1,0 // movaps 0x148fd(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,88,5,51,79,1,0 // addps 0x14f33(%rip),%xmm0 # 2d320 <_sk_overlay_sse2_8bit+0x155c>
+ .byte 68,15,40,13,235,72,1,0 // movaps 0x148eb(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,57,79,1,0 // mulps 0x14f39(%rip),%xmm9 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
- .byte 68,15,88,13,209,74,1,0 // addps 0x14ad1(%rip),%xmm9 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
+ .byte 68,15,89,13,39,79,1,0 // mulps 0x14f27(%rip),%xmm9 # 2d330 <_sk_overlay_sse2_8bit+0x156c>
+ .byte 68,15,88,13,191,74,1,0 // addps 0x14abf(%rip),%xmm9 # 2ced0 <_sk_overlay_sse2_8bit+0x110c>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33085,16 +33079,16 @@ _sk_bicubic_n1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,240,78,1,0 // addps 0x14ef0(%rip),%xmm0 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
- .byte 68,15,40,13,184,72,1,0 // movaps 0x148b8(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,88,5,222,78,1,0 // addps 0x14ede(%rip),%xmm0 # 2d310 <_sk_overlay_sse2_8bit+0x154c>
+ .byte 68,15,40,13,166,72,1,0 // movaps 0x148a6(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,12,79,1,0 // movaps 0x14f0c(%rip),%xmm8 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
+ .byte 68,15,40,5,250,78,1,0 // movaps 0x14efa(%rip),%xmm8 # 2d340 <_sk_overlay_sse2_8bit+0x157c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,16,79,1,0 // addps 0x14f10(%rip),%xmm8 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
+ .byte 68,15,88,5,254,78,1,0 // addps 0x14efe(%rip),%xmm8 # 2d350 <_sk_overlay_sse2_8bit+0x158c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,116,72,1,0 // addps 0x14874(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,88,5,114,72,1,0 // addps 0x14872(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,8,79,1,0 // addps 0x14f08(%rip),%xmm8 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
+ .byte 68,15,88,5,246,78,1,0 // addps 0x14ef6(%rip),%xmm8 # 2d360 <_sk_overlay_sse2_8bit+0x159c>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33104,17 +33098,17 @@ HIDDEN _sk_bicubic_p1x_sse41
FUNCTION(_sk_bicubic_p1x_sse41)
_sk_bicubic_p1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,82,72,1,0 // movaps 0x14852(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,40,5,80,72,1,0 // movaps 0x14850(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,190,78,1,0 // movaps 0x14ebe(%rip),%xmm10 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
+ .byte 68,15,40,21,172,78,1,0 // movaps 0x14eac(%rip),%xmm10 # 2d340 <_sk_overlay_sse2_8bit+0x157c>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,194,78,1,0 // addps 0x14ec2(%rip),%xmm10 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
+ .byte 68,15,88,21,176,78,1,0 // addps 0x14eb0(%rip),%xmm10 # 2d350 <_sk_overlay_sse2_8bit+0x158c>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,190,78,1,0 // addps 0x14ebe(%rip),%xmm10 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
+ .byte 68,15,88,21,172,78,1,0 // addps 0x14eac(%rip),%xmm10 # 2d360 <_sk_overlay_sse2_8bit+0x159c>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33126,11 +33120,11 @@ _sk_bicubic_p3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,145,78,1,0 // addps 0x14e91(%rip),%xmm0 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
+ .byte 15,88,5,127,78,1,0 // addps 0x14e7f(%rip),%xmm0 # 2d350 <_sk_overlay_sse2_8bit+0x158c>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,97,78,1,0 // mulps 0x14e61(%rip),%xmm8 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
- .byte 68,15,88,5,249,73,1,0 // addps 0x149f9(%rip),%xmm8 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
+ .byte 68,15,89,5,79,78,1,0 // mulps 0x14e4f(%rip),%xmm8 # 2d330 <_sk_overlay_sse2_8bit+0x156c>
+ .byte 68,15,88,5,231,73,1,0 // addps 0x149e7(%rip),%xmm8 # 2ced0 <_sk_overlay_sse2_8bit+0x110c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33143,13 +33137,13 @@ _sk_bicubic_n3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,39,78,1,0 // addps 0x14e27(%rip),%xmm1 # 2d340 <_sk_overlay_sse2_8bit+0x1568>
- .byte 68,15,40,13,223,71,1,0 // movaps 0x147df(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,88,13,21,78,1,0 // addps 0x14e15(%rip),%xmm1 # 2d320 <_sk_overlay_sse2_8bit+0x155c>
+ .byte 68,15,40,13,205,71,1,0 // movaps 0x147cd(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,27,78,1,0 // mulps 0x14e1b(%rip),%xmm9 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
- .byte 68,15,88,13,179,73,1,0 // addps 0x149b3(%rip),%xmm9 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
+ .byte 68,15,89,13,9,78,1,0 // mulps 0x14e09(%rip),%xmm9 # 2d330 <_sk_overlay_sse2_8bit+0x156c>
+ .byte 68,15,88,13,161,73,1,0 // addps 0x149a1(%rip),%xmm9 # 2ced0 <_sk_overlay_sse2_8bit+0x110c>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33162,16 +33156,16 @@ _sk_bicubic_n1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,209,77,1,0 // addps 0x14dd1(%rip),%xmm1 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
- .byte 68,15,40,13,153,71,1,0 // movaps 0x14799(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,88,13,191,77,1,0 // addps 0x14dbf(%rip),%xmm1 # 2d310 <_sk_overlay_sse2_8bit+0x154c>
+ .byte 68,15,40,13,135,71,1,0 // movaps 0x14787(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,237,77,1,0 // movaps 0x14ded(%rip),%xmm8 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
+ .byte 68,15,40,5,219,77,1,0 // movaps 0x14ddb(%rip),%xmm8 # 2d340 <_sk_overlay_sse2_8bit+0x157c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,241,77,1,0 // addps 0x14df1(%rip),%xmm8 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
+ .byte 68,15,88,5,223,77,1,0 // addps 0x14ddf(%rip),%xmm8 # 2d350 <_sk_overlay_sse2_8bit+0x158c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,85,71,1,0 // addps 0x14755(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,88,5,83,71,1,0 // addps 0x14753(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,233,77,1,0 // addps 0x14de9(%rip),%xmm8 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
+ .byte 68,15,88,5,215,77,1,0 // addps 0x14dd7(%rip),%xmm8 # 2d360 <_sk_overlay_sse2_8bit+0x159c>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33181,17 +33175,17 @@ HIDDEN _sk_bicubic_p1y_sse41
FUNCTION(_sk_bicubic_p1y_sse41)
_sk_bicubic_p1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,51,71,1,0 // movaps 0x14733(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,40,5,49,71,1,0 // movaps 0x14731(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,158,77,1,0 // movaps 0x14d9e(%rip),%xmm10 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
+ .byte 68,15,40,21,140,77,1,0 // movaps 0x14d8c(%rip),%xmm10 # 2d340 <_sk_overlay_sse2_8bit+0x157c>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,162,77,1,0 // addps 0x14da2(%rip),%xmm10 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
+ .byte 68,15,88,21,144,77,1,0 // addps 0x14d90(%rip),%xmm10 # 2d350 <_sk_overlay_sse2_8bit+0x158c>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,158,77,1,0 // addps 0x14d9e(%rip),%xmm10 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
+ .byte 68,15,88,21,140,77,1,0 // addps 0x14d8c(%rip),%xmm10 # 2d360 <_sk_overlay_sse2_8bit+0x159c>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33203,11 +33197,11 @@ _sk_bicubic_p3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,112,77,1,0 // addps 0x14d70(%rip),%xmm1 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
+ .byte 15,88,13,94,77,1,0 // addps 0x14d5e(%rip),%xmm1 # 2d350 <_sk_overlay_sse2_8bit+0x158c>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,64,77,1,0 // mulps 0x14d40(%rip),%xmm8 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
- .byte 68,15,88,5,216,72,1,0 // addps 0x148d8(%rip),%xmm8 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
+ .byte 68,15,89,5,46,77,1,0 // mulps 0x14d2e(%rip),%xmm8 # 2d330 <_sk_overlay_sse2_8bit+0x156c>
+ .byte 68,15,88,5,198,72,1,0 // addps 0x148c6(%rip),%xmm8 # 2ced0 <_sk_overlay_sse2_8bit+0x110c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33350,10 +33344,10 @@ _sk_clut_3D_sse41:
.byte 102,68,15,56,64,227 // pmulld %xmm3,%xmm12
.byte 102,65,15,111,212 // movdqa %xmm12,%xmm2
.byte 102,15,254,209 // paddd %xmm1,%xmm2
- .byte 102,15,111,37,160,75,1,0 // movdqa 0x14ba0(%rip),%xmm4 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,37,142,75,1,0 // movdqa 0x14b8e(%rip),%xmm4 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,56,64,212 // pmulld %xmm4,%xmm2
.byte 102,68,15,111,220 // movdqa %xmm4,%xmm11
- .byte 102,68,15,111,61,253,68,1,0 // movdqa 0x144fd(%rip),%xmm15 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,68,15,111,61,235,68,1,0 // movdqa 0x144eb(%rip),%xmm15 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,111,226 // movdqa %xmm2,%xmm4
.byte 102,65,15,254,231 // paddd %xmm15,%xmm4
.byte 102,73,15,58,22,224,1 // pextrq $0x1,%xmm4,%r8
@@ -33373,7 +33367,7 @@ _sk_clut_3D_sse41:
.byte 102,65,15,58,22,209,1 // pextrd $0x1,%xmm2,%r9d
.byte 102,65,15,58,22,210,2 // pextrd $0x2,%xmm2,%r10d
.byte 102,65,15,58,22,211,3 // pextrd $0x3,%xmm2,%r11d
- .byte 102,68,15,111,13,174,68,1,0 // movdqa 0x144ae(%rip),%xmm9 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,68,15,111,13,156,68,1,0 // movdqa 0x1449c(%rip),%xmm9 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,65,15,254,209 // paddd %xmm9,%xmm2
.byte 102,73,15,58,22,214,1 // pextrq $0x1,%xmm2,%r14
.byte 102,72,15,126,211 // movq %xmm2,%rbx
@@ -33387,7 +33381,7 @@ _sk_clut_3D_sse41:
.byte 73,193,238,32 // shr $0x20,%r14
.byte 243,66,15,16,20,176 // movss (%rax,%r14,4),%xmm2
.byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6
- .byte 15,40,45,195,74,1,0 // movaps 0x14ac3(%rip),%xmm5 # 2d390 <_sk_overlay_sse2_8bit+0x15b8>
+ .byte 15,40,45,177,74,1,0 // movaps 0x14ab1(%rip),%xmm5 # 2d370 <_sk_overlay_sse2_8bit+0x15ac>
.byte 68,15,88,197 // addps %xmm5,%xmm8
.byte 68,15,41,68,36,176 // movaps %xmm8,-0x50(%rsp)
.byte 15,40,215 // movaps %xmm7,%xmm2
@@ -33556,7 +33550,7 @@ _sk_clut_3D_sse41:
.byte 102,68,15,254,232 // paddd %xmm0,%xmm13
.byte 102,65,15,111,212 // movdqa %xmm12,%xmm2
.byte 102,65,15,254,213 // paddd %xmm13,%xmm2
- .byte 102,15,111,45,118,71,1,0 // movdqa 0x14776(%rip),%xmm5 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,45,100,71,1,0 // movdqa 0x14764(%rip),%xmm5 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,56,64,213 // pmulld %xmm5,%xmm2
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,254,207 // paddd %xmm15,%xmm1
@@ -33662,7 +33656,7 @@ _sk_clut_3D_sse41:
.byte 102,69,15,58,22,225,1 // pextrd $0x1,%xmm12,%r9d
.byte 102,69,15,58,22,226,2 // pextrd $0x2,%xmm12,%r10d
.byte 102,69,15,58,22,227,3 // pextrd $0x3,%xmm12,%r11d
- .byte 102,15,111,21,209,62,1,0 // movdqa 0x13ed1(%rip),%xmm2 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,111,21,191,62,1,0 // movdqa 0x13ebf(%rip),%xmm2 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,68,15,254,226 // paddd %xmm2,%xmm12
.byte 102,76,15,58,22,225,1 // pextrq $0x1,%xmm12,%rcx
.byte 102,76,15,126,227 // movq %xmm12,%rbx
@@ -33837,8 +33831,8 @@ _sk_clut_4D_sse41:
.byte 102,65,15,111,197 // movdqa %xmm13,%xmm0
.byte 102,68,15,127,108,36,176 // movdqa %xmm13,-0x50(%rsp)
.byte 102,15,254,193 // paddd %xmm1,%xmm0
- .byte 102,15,56,64,5,63,66,1,0 // pmulld 0x1423f(%rip),%xmm0 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
- .byte 102,68,15,111,29,166,59,1,0 // movdqa 0x13ba6(%rip),%xmm11 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,56,64,5,45,66,1,0 // pmulld 0x1422d(%rip),%xmm0 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
+ .byte 102,68,15,111,29,148,59,1,0 // movdqa 0x13b94(%rip),%xmm11 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,65,15,254,211 // paddd %xmm11,%xmm2
.byte 102,73,15,58,22,208,1 // pextrq $0x1,%xmm2,%r8
@@ -33858,7 +33852,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
.byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,68,15,111,5,87,59,1,0 // movdqa 0x13b57(%rip),%xmm8 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,68,15,111,5,69,59,1,0 // movdqa 0x13b45(%rip),%xmm8 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,65,15,254,192 // paddd %xmm8,%xmm0
.byte 102,73,15,58,22,198,1 // pextrq $0x1,%xmm0,%r14
.byte 102,72,15,126,195 // movq %xmm0,%rbx
@@ -33872,7 +33866,7 @@ _sk_clut_4D_sse41:
.byte 73,193,238,32 // shr $0x20,%r14
.byte 243,66,15,16,4,176 // movss (%rax,%r14,4),%xmm0
.byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5
- .byte 15,40,53,108,65,1,0 // movaps 0x1416c(%rip),%xmm6 # 2d390 <_sk_overlay_sse2_8bit+0x15b8>
+ .byte 15,40,53,90,65,1,0 // movaps 0x1415a(%rip),%xmm6 # 2d370 <_sk_overlay_sse2_8bit+0x15ac>
.byte 68,15,88,214 // addps %xmm6,%xmm10
.byte 68,15,41,84,36,48 // movaps %xmm10,0x30(%rsp)
.byte 15,88,254 // addps %xmm6,%xmm7
@@ -33885,7 +33879,7 @@ _sk_clut_4D_sse41:
.byte 102,15,254,206 // paddd %xmm6,%xmm1
.byte 102,68,15,111,214 // movdqa %xmm6,%xmm10
.byte 102,68,15,127,84,36,160 // movdqa %xmm10,-0x60(%rsp)
- .byte 102,15,56,64,13,61,65,1,0 // pmulld 0x1413d(%rip),%xmm1 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,56,64,13,43,65,1,0 // pmulld 0x1412b(%rip),%xmm1 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,65,15,254,227 // paddd %xmm11,%xmm4
.byte 102,73,15,58,22,230,1 // pextrq $0x1,%xmm4,%r14
@@ -33943,11 +33937,11 @@ _sk_clut_4D_sse41:
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
- .byte 102,15,111,5,15,64,1,0 // movdqa 0x1400f(%rip),%xmm0 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,5,253,63,1,0 // movdqa 0x13ffd(%rip),%xmm0 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,56,64,200 // pmulld %xmm0,%xmm1
.byte 102,68,15,111,200 // movdqa %xmm0,%xmm9
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
- .byte 102,68,15,111,5,104,57,1,0 // movdqa 0x13968(%rip),%xmm8 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,68,15,111,5,86,57,1,0 // movdqa 0x13956(%rip),%xmm8 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,65,15,254,192 // paddd %xmm8,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,197 // movq %xmm0,%rbp
@@ -34049,7 +34043,7 @@ _sk_clut_4D_sse41:
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,68,15,111,108,36,176 // movdqa -0x50(%rsp),%xmm13
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
- .byte 102,15,111,45,221,61,1,0 // movdqa 0x13ddd(%rip),%xmm5 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,45,203,61,1,0 // movdqa 0x13dcb(%rip),%xmm5 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,56,64,205 // pmulld %xmm5,%xmm1
.byte 102,15,126,201 // movd %xmm1,%ecx
.byte 102,15,58,22,205,1 // pextrd $0x1,%xmm1,%ebp
@@ -34061,7 +34055,7 @@ _sk_clut_4D_sse41:
.byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
.byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,111,29,6,55,1,0 // movdqa 0x13706(%rip),%xmm3 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,111,29,244,54,1,0 // movdqa 0x136f4(%rip),%xmm3 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx
.byte 102,72,15,126,213 // movq %xmm2,%rbp
@@ -34109,7 +34103,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,195,1 // pextrd $0x1,%xmm0,%r11d
.byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
.byte 102,65,15,58,22,192,3 // pextrd $0x3,%xmm0,%r8d
- .byte 102,15,254,5,46,54,1,0 // paddd 0x1362e(%rip),%xmm0 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,254,5,28,54,1,0 // paddd 0x1361c(%rip),%xmm0 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,195 // movq %xmm0,%rbx
.byte 137,221 // mov %ebx,%ebp
@@ -34138,10 +34132,10 @@ _sk_clut_4D_sse41:
.byte 102,15,254,100,36,144 // paddd -0x70(%rsp),%xmm4
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,65,15,254,197 // paddd %xmm13,%xmm0
- .byte 102,68,15,111,45,14,60,1,0 // movdqa 0x13c0e(%rip),%xmm13 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,68,15,111,45,252,59,1,0 // movdqa 0x13bfc(%rip),%xmm13 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,65,15,56,64,197 // pmulld %xmm13,%xmm0
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,111,53,108,53,1,0 // movdqa 0x1356c(%rip),%xmm6 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,111,53,90,53,1,0 // movdqa 0x1355a(%rip),%xmm6 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,254,206 // paddd %xmm6,%xmm1
.byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
.byte 102,72,15,126,205 // movq %xmm1,%rbp
@@ -34159,7 +34153,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
.byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,15,111,61,42,53,1,0 // movdqa 0x1352a(%rip),%xmm7 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,111,61,24,53,1,0 // movdqa 0x13518(%rip),%xmm7 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,15,254,199 // paddd %xmm7,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,195 // movq %xmm0,%rbx
@@ -34176,7 +34170,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,254,227 // paddd %xmm11,%xmm4
.byte 102,65,15,56,64,229 // pmulld %xmm13,%xmm4
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
- .byte 102,68,15,111,45,178,52,1,0 // movdqa 0x134b2(%rip),%xmm13 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,68,15,111,45,160,52,1,0 // movdqa 0x134a0(%rip),%xmm13 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,65,15,254,245 // paddd %xmm13,%xmm6
.byte 102,72,15,58,22,241,1 // pextrq $0x1,%xmm6,%rcx
.byte 102,72,15,126,243 // movq %xmm6,%rbx
@@ -34255,7 +34249,7 @@ _sk_clut_4D_sse41:
.byte 102,68,15,111,76,36,176 // movdqa -0x50(%rsp),%xmm9
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,254,194 // paddd %xmm2,%xmm0
- .byte 102,15,111,29,190,57,1,0 // movdqa 0x139be(%rip),%xmm3 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,29,172,57,1,0 // movdqa 0x139ac(%rip),%xmm3 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,56,64,195 // pmulld %xmm3,%xmm0
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,69,15,111,213 // movdqa %xmm13,%xmm10
@@ -34276,7 +34270,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
.byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,15,111,45,221,50,1,0 // movdqa 0x132dd(%rip),%xmm5 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,111,45,203,50,1,0 // movdqa 0x132cb(%rip),%xmm5 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,15,254,197 // paddd %xmm5,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,195 // movq %xmm0,%rbx
@@ -34364,7 +34358,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,225,1 // pextrd $0x1,%xmm4,%r9d
.byte 102,65,15,58,22,226,2 // pextrd $0x2,%xmm4,%r10d
.byte 102,65,15,58,22,227,3 // pextrd $0x3,%xmm4,%r11d
- .byte 102,68,15,111,13,17,49,1,0 // movdqa 0x13111(%rip),%xmm9 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,68,15,111,13,255,48,1,0 // movdqa 0x130ff(%rip),%xmm9 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,65,15,254,225 // paddd %xmm9,%xmm4
.byte 102,72,15,58,22,225,1 // pextrq $0x1,%xmm4,%rcx
.byte 102,72,15,126,227 // movq %xmm4,%rbx
@@ -34446,7 +34440,7 @@ _sk_clut_4D_sse41:
.byte 102,15,254,76,36,176 // paddd -0x50(%rsp),%xmm1
.byte 102,65,15,56,64,205 // pmulld %xmm13,%xmm1
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
- .byte 102,68,15,111,37,69,47,1,0 // movdqa 0x12f45(%rip),%xmm12 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,68,15,111,37,51,47,1,0 // movdqa 0x12f33(%rip),%xmm12 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,65,15,254,196 // paddd %xmm12,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,197 // movq %xmm0,%rbp
@@ -34464,7 +34458,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,201,1 // pextrd $0x1,%xmm1,%r9d
.byte 102,65,15,58,22,202,2 // pextrd $0x2,%xmm1,%r10d
.byte 102,65,15,58,22,203,3 // pextrd $0x3,%xmm1,%r11d
- .byte 102,15,111,29,2,47,1,0 // movdqa 0x12f02(%rip),%xmm3 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,111,29,240,46,1,0 // movdqa 0x12ef0(%rip),%xmm3 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -34533,9 +34527,9 @@ _sk_clut_4D_sse41:
.byte 102,68,15,254,116,36,144 // paddd -0x70(%rsp),%xmm14
.byte 102,15,111,68,36,176 // movdqa -0x50(%rsp),%xmm0
.byte 102,65,15,254,198 // paddd %xmm14,%xmm0
- .byte 102,15,56,64,5,254,51,1,0 // pmulld 0x133fe(%rip),%xmm0 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,56,64,5,236,51,1,0 // pmulld 0x133ec(%rip),%xmm0 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,5,98,45,1,0 // paddd 0x12d62(%rip),%xmm0 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,254,5,80,45,1,0 // paddd 0x12d50(%rip),%xmm0 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,197 // movq %xmm0,%rbp
.byte 137,235 // mov %ebp,%ebx
@@ -34568,8 +34562,8 @@ _sk_clut_4D_sse41:
.byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0
.byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5
.byte 102,68,15,254,116,36,160 // paddd -0x60(%rsp),%xmm14
- .byte 102,68,15,56,64,53,67,51,1,0 // pmulld 0x13343(%rip),%xmm14 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
- .byte 102,15,111,5,171,44,1,0 // movdqa 0x12cab(%rip),%xmm0 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,68,15,56,64,53,49,51,1,0 // pmulld 0x13331(%rip),%xmm14 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
+ .byte 102,15,111,5,153,44,1,0 // movdqa 0x12c99(%rip),%xmm0 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,65,15,254,198 // paddd %xmm14,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,195 // movq %xmm0,%rbx
@@ -34650,7 +34644,7 @@ _sk_clut_4D_sse41:
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,215 // addps %xmm7,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,41,43,1,0 // movaps 0x12b29(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,23,43,1,0 // movaps 0x12b17(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 72,139,76,36,248 // mov -0x8(%rsp),%rcx
.byte 15,40,100,36,80 // movaps 0x50(%rsp),%xmm4
.byte 15,40,108,36,96 // movaps 0x60(%rsp),%xmm5
@@ -34686,13 +34680,13 @@ _sk_start_pipeline_sse2:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,192 // mov %rcx,-0x40(%rbp)
.byte 72,57,203 // cmp %rcx,%rbx
- .byte 115,83 // jae 1a288 <_sk_start_pipeline_sse2+0x82>
+ .byte 115,83 // jae 1a27a <_sk_start_pipeline_sse2+0x82>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,4 // lea 0x4(%rax),%rax
.byte 72,137,69,200 // mov %rax,-0x38(%rbp)
.byte 76,57,125,200 // cmp %r15,-0x38(%rbp)
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
- .byte 119,35 // ja 1a26e <_sk_start_pipeline_sse2+0x68>
+ .byte 119,35 // ja 1a260 <_sk_start_pipeline_sse2+0x68>
.byte 76,139,101,208 // mov -0x30(%rbp),%r12
.byte 49,255 // xor %edi,%edi
.byte 76,137,246 // mov %r14,%rsi
@@ -34703,16 +34697,16 @@ _sk_start_pipeline_sse2:
.byte 73,131,196,8 // add $0x8,%r12
.byte 77,57,252 // cmp %r15,%r12
.byte 73,137,212 // mov %rdx,%r12
- .byte 118,225 // jbe 1a24f <_sk_start_pipeline_sse2+0x49>
+ .byte 118,225 // jbe 1a241 <_sk_start_pipeline_sse2+0x49>
.byte 76,137,255 // mov %r15,%rdi
.byte 72,41,215 // sub %rdx,%rdi
- .byte 116,9 // je 1a27f <_sk_start_pipeline_sse2+0x79>
+ .byte 116,9 // je 1a271 <_sk_start_pipeline_sse2+0x79>
.byte 76,137,246 // mov %r14,%rsi
.byte 72,137,217 // mov %rbx,%rcx
.byte 65,255,213 // callq *%r13
.byte 72,255,195 // inc %rbx
.byte 72,59,93,192 // cmp -0x40(%rbp),%rbx
- .byte 117,185 // jne 1a241 <_sk_start_pipeline_sse2+0x3b>
+ .byte 117,185 // jne 1a233 <_sk_start_pipeline_sse2+0x3b>
.byte 72,131,196,24 // add $0x18,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -34735,15 +34729,13 @@ _sk_seed_shader_sse2:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,21,53,42,1,0 // movaps 0x12a35(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
- .byte 15,88,194 // addps %xmm2,%xmm0
- .byte 15,88,5,59,42,1,0 // addps 0x12a3b(%rip),%xmm0 # 2ccf0 <_sk_overlay_sse2_8bit+0xf18>
+ .byte 15,88,5,35,42,1,0 // addps 0x12a23(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0xefc>
.byte 102,15,110,201 // movd %ecx,%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,88,202 // addps %xmm2,%xmm1
+ .byte 15,88,13,32,42,1,0 // addps 0x12a20(%rip),%xmm1 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,51,42,1,0 // movaps 0x12a33(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,21,39,42,1,0 // movaps 0x12a27(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -34758,18 +34750,18 @@ _sk_dither_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 102,68,15,110,194 // movd %edx,%xmm8
.byte 102,69,15,112,200,0 // pshufd $0x0,%xmm8,%xmm9
- .byte 102,68,15,254,13,204,41,1,0 // paddd 0x129cc(%rip),%xmm9 # 2ccc0 <_sk_overlay_sse2_8bit+0xee8>
+ .byte 102,68,15,254,13,192,41,1,0 // paddd 0x129c0(%rip),%xmm9 # 2cca0 <_sk_overlay_sse2_8bit+0xedc>
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,3,42,1,0 // movdqa 0x12a03(%rip),%xmm10 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,68,15,111,21,247,41,1,0 // movdqa 0x129f7(%rip),%xmm10 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,239,41,1,0 // movdqa 0x129ef(%rip),%xmm12 # 2cd20 <_sk_overlay_sse2_8bit+0xf48>
- .byte 102,68,15,111,45,246,41,1,0 // movdqa 0x129f6(%rip),%xmm13 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,68,15,111,37,227,41,1,0 // movdqa 0x129e3(%rip),%xmm12 # 2cd00 <_sk_overlay_sse2_8bit+0xf3c>
+ .byte 102,68,15,111,45,234,41,1,0 // movdqa 0x129ea(%rip),%xmm13 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -34785,8 +34777,8 @@ _sk_dither_sse2:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,177,41,1,0 // mulps 0x129b1(%rip),%xmm8 # 2cd40 <_sk_overlay_sse2_8bit+0xf68>
- .byte 68,15,88,5,185,41,1,0 // addps 0x129b9(%rip),%xmm8 # 2cd50 <_sk_overlay_sse2_8bit+0xf78>
+ .byte 68,15,89,5,165,41,1,0 // mulps 0x129a5(%rip),%xmm8 # 2cd20 <_sk_overlay_sse2_8bit+0xf5c>
+ .byte 68,15,88,5,173,41,1,0 // addps 0x129ad(%rip),%xmm8 # 2cd30 <_sk_overlay_sse2_8bit+0xf6c>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -34828,7 +34820,7 @@ HIDDEN _sk_black_color_sse2
FUNCTION(_sk_black_color_sse2)
_sk_black_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,239,40,1,0 // movaps 0x128ef(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,227,40,1,0 // movaps 0x128e3(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -34839,7 +34831,7 @@ HIDDEN _sk_white_color_sse2
FUNCTION(_sk_white_color_sse2)
_sk_white_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,219,40,1,0 // movaps 0x128db(%rip),%xmm0 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,5,207,40,1,0 // movaps 0x128cf(%rip),%xmm0 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -34885,7 +34877,7 @@ HIDDEN _sk_srcatop_sse2
FUNCTION(_sk_srcatop_sse2)
_sk_srcatop_sse2:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,139,40,1,0 // movaps 0x1288b(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,127,40,1,0 // movaps 0x1287f(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -34910,7 +34902,7 @@ FUNCTION(_sk_dstatop_sse2)
_sk_dstatop_sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,62,40,1,0 // movaps 0x1283e(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,13,50,40,1,0 // movaps 0x12832(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -34957,7 +34949,7 @@ HIDDEN _sk_srcout_sse2
.globl _sk_srcout_sse2
FUNCTION(_sk_srcout_sse2)
_sk_srcout_sse2:
- .byte 68,15,40,5,210,39,1,0 // movaps 0x127d2(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,198,39,1,0 // movaps 0x127c6(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -34970,7 +34962,7 @@ HIDDEN _sk_dstout_sse2
.globl _sk_dstout_sse2
FUNCTION(_sk_dstout_sse2)
_sk_dstout_sse2:
- .byte 68,15,40,5,178,39,1,0 // movaps 0x127b2(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,166,39,1,0 // movaps 0x127a6(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -34987,7 +34979,7 @@ HIDDEN _sk_srcover_sse2
.globl _sk_srcover_sse2
FUNCTION(_sk_srcover_sse2)
_sk_srcover_sse2:
- .byte 68,15,40,5,133,39,1,0 // movaps 0x12785(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,121,39,1,0 // movaps 0x12779(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -35007,7 +34999,7 @@ HIDDEN _sk_dstover_sse2
.globl _sk_dstover_sse2
FUNCTION(_sk_dstover_sse2)
_sk_dstover_sse2:
- .byte 68,15,40,5,73,39,1,0 // movaps 0x12749(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,61,39,1,0 // movaps 0x1273d(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -35035,7 +35027,7 @@ HIDDEN _sk_multiply_sse2
.globl _sk_multiply_sse2
FUNCTION(_sk_multiply_sse2)
_sk_multiply_sse2:
- .byte 68,15,40,5,13,39,1,0 // movaps 0x1270d(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,1,39,1,0 // movaps 0x12701(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -35073,7 +35065,7 @@ HIDDEN _sk_plus__sse2
FUNCTION(_sk_plus__sse2)
_sk_plus__sse2:
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 68,15,40,5,142,38,1,0 // movaps 0x1268e(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,130,38,1,0 // movaps 0x12682(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 65,15,93,200 // minps %xmm8,%xmm1
@@ -35115,7 +35107,7 @@ HIDDEN _sk_xor__sse2
FUNCTION(_sk_xor__sse2)
_sk_xor__sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,26,38,1,0 // movaps 0x1261a(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,14,38,1,0 // movaps 0x1260e(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -35163,7 +35155,7 @@ _sk_darken_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,117,37,1,0 // movaps 0x12575(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,21,105,37,1,0 // movaps 0x12569(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -35197,7 +35189,7 @@ _sk_lighten_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,10,37,1,0 // movaps 0x1250a(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,21,254,36,1,0 // movaps 0x124fe(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -35234,7 +35226,7 @@ _sk_difference_sse2:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,148,36,1,0 // movaps 0x12494(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,21,136,36,1,0 // movaps 0x12488(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -35262,7 +35254,7 @@ _sk_exclusion_sse2:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,68,36,1,0 // movaps 0x12444(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,21,56,36,1,0 // movaps 0x12438(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -35275,7 +35267,7 @@ HIDDEN _sk_colorburn_sse2
FUNCTION(_sk_colorburn_sse2)
_sk_colorburn_sse2:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,13,39,36,1,0 // movaps 0x12427(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,13,27,36,1,0 // movaps 0x1241b(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -35370,7 +35362,7 @@ HIDDEN _sk_colordodge_sse2
FUNCTION(_sk_colordodge_sse2)
_sk_colordodge_sse2:
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,207,34,1,0 // movaps 0x122cf(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,21,195,34,1,0 // movaps 0x122c3(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -35462,7 +35454,7 @@ _sk_hardlight_sse2:
.byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp)
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 68,15,40,29,120,33,1,0 // movaps 0x12178(%rip),%xmm11 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,29,108,33,1,0 // movaps 0x1216c(%rip),%xmm11 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,194 // movaps %xmm10,%xmm8
@@ -35550,7 +35542,7 @@ FUNCTION(_sk_overlay_sse2)
_sk_overlay_sse2:
.byte 68,15,40,193 // movaps %xmm1,%xmm8
.byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 68,15,40,13,54,32,1,0 // movaps 0x12036(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,13,42,32,1,0 // movaps 0x1202a(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -35641,7 +35633,7 @@ _sk_softlight_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 68,15,94,215 // divps %xmm7,%xmm10
.byte 69,15,84,212 // andps %xmm12,%xmm10
- .byte 68,15,40,13,227,30,1,0 // movaps 0x11ee3(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,13,215,30,1,0 // movaps 0x11ed7(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 69,15,92,250 // subps %xmm10,%xmm15
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -35654,10 +35646,10 @@ _sk_softlight_sse2:
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,53,13,31,1,0 // movaps 0x11f0d(%rip),%xmm14 # 2cd60 <_sk_overlay_sse2_8bit+0xf88>
+ .byte 68,15,40,53,1,31,1,0 // movaps 0x11f01(%rip),%xmm14 # 2cd40 <_sk_overlay_sse2_8bit+0xf7c>
.byte 69,15,88,222 // addps %xmm14,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
- .byte 68,15,40,21,13,31,1,0 // movaps 0x11f0d(%rip),%xmm10 # 2cd70 <_sk_overlay_sse2_8bit+0xf98>
+ .byte 68,15,40,21,1,31,1,0 // movaps 0x11f01(%rip),%xmm10 # 2cd50 <_sk_overlay_sse2_8bit+0xf8c>
.byte 69,15,89,234 // mulps %xmm10,%xmm13
.byte 69,15,88,235 // addps %xmm11,%xmm13
.byte 15,88,228 // addps %xmm4,%xmm4
@@ -35802,7 +35794,7 @@ _sk_hue_sse2:
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 68,15,89,211 // mulps %xmm3,%xmm10
- .byte 68,15,40,5,160,28,1,0 // movaps 0x11ca0(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,148,28,1,0 // movaps 0x11c94(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 15,40,207 // movaps %xmm7,%xmm1
.byte 68,15,92,217 // subps %xmm1,%xmm11
@@ -35850,12 +35842,12 @@ _sk_hue_sse2:
.byte 69,15,84,206 // andps %xmm14,%xmm9
.byte 69,15,84,214 // andps %xmm14,%xmm10
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,61,93,28,1,0 // movaps 0x11c5d(%rip),%xmm15 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
+ .byte 68,15,40,61,81,28,1,0 // movaps 0x11c51(%rip),%xmm15 # 2cd60 <_sk_overlay_sse2_8bit+0xf9c>
.byte 65,15,89,231 // mulps %xmm15,%xmm4
- .byte 15,40,5,98,28,1,0 // movaps 0x11c62(%rip),%xmm0 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
+ .byte 15,40,5,86,28,1,0 // movaps 0x11c56(%rip),%xmm0 # 2cd70 <_sk_overlay_sse2_8bit+0xfac>
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
- .byte 68,15,40,53,100,28,1,0 // movaps 0x11c64(%rip),%xmm14 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
+ .byte 68,15,40,53,88,28,1,0 // movaps 0x11c58(%rip),%xmm14 # 2cd80 <_sk_overlay_sse2_8bit+0xfbc>
.byte 68,15,40,239 // movaps %xmm7,%xmm13
.byte 69,15,89,238 // mulps %xmm14,%xmm13
.byte 68,15,88,238 // addps %xmm6,%xmm13
@@ -36033,14 +36025,14 @@ _sk_saturation_sse2:
.byte 68,15,84,211 // andps %xmm3,%xmm10
.byte 68,15,84,203 // andps %xmm3,%xmm9
.byte 15,84,195 // andps %xmm3,%xmm0
- .byte 68,15,40,5,182,25,1,0 // movaps 0x119b6(%rip),%xmm8 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
+ .byte 68,15,40,5,170,25,1,0 // movaps 0x119aa(%rip),%xmm8 # 2cd60 <_sk_overlay_sse2_8bit+0xf9c>
.byte 15,40,214 // movaps %xmm6,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
- .byte 15,40,13,184,25,1,0 // movaps 0x119b8(%rip),%xmm1 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
+ .byte 15,40,13,172,25,1,0 // movaps 0x119ac(%rip),%xmm1 # 2cd70 <_sk_overlay_sse2_8bit+0xfac>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,217 // mulps %xmm1,%xmm3
.byte 15,88,218 // addps %xmm2,%xmm3
- .byte 68,15,40,37,183,25,1,0 // movaps 0x119b7(%rip),%xmm12 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
+ .byte 68,15,40,37,171,25,1,0 // movaps 0x119ab(%rip),%xmm12 # 2cd80 <_sk_overlay_sse2_8bit+0xfbc>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
.byte 65,15,40,210 // movaps %xmm10,%xmm2
@@ -36085,7 +36077,7 @@ _sk_saturation_sse2:
.byte 15,40,223 // movaps %xmm7,%xmm3
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,221 // mulps %xmm5,%xmm3
- .byte 68,15,40,5,108,24,1,0 // movaps 0x1186c(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,96,24,1,0 // movaps 0x11860(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 15,88,253 // addps %xmm5,%xmm7
@@ -36186,14 +36178,14 @@ _sk_color_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
.byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 68,15,40,45,122,23,1,0 // movaps 0x1177a(%rip),%xmm13 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
+ .byte 68,15,40,45,110,23,1,0 // movaps 0x1176e(%rip),%xmm13 # 2cd60 <_sk_overlay_sse2_8bit+0xf9c>
.byte 68,15,40,198 // movaps %xmm6,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,40,53,122,23,1,0 // movaps 0x1177a(%rip),%xmm14 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
+ .byte 68,15,40,53,110,23,1,0 // movaps 0x1176e(%rip),%xmm14 # 2cd70 <_sk_overlay_sse2_8bit+0xfac>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,29,118,23,1,0 // movaps 0x11776(%rip),%xmm11 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
+ .byte 68,15,40,29,106,23,1,0 // movaps 0x1176a(%rip),%xmm11 # 2cd80 <_sk_overlay_sse2_8bit+0xfbc>
.byte 69,15,89,227 // mulps %xmm11,%xmm12
.byte 68,15,88,224 // addps %xmm0,%xmm12
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -36201,7 +36193,7 @@ _sk_color_sse2:
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 68,15,40,5,178,22,1,0 // movaps 0x116b2(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,166,22,1,0 // movaps 0x116a6(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
.byte 15,89,252 // mulps %xmm4,%xmm7
@@ -36337,15 +36329,15 @@ _sk_luminosity_sse2:
.byte 68,15,40,205 // movaps %xmm5,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
.byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 68,15,40,37,57,21,1,0 // movaps 0x11539(%rip),%xmm12 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
+ .byte 68,15,40,37,45,21,1,0 // movaps 0x1152d(%rip),%xmm12 # 2cd60 <_sk_overlay_sse2_8bit+0xf9c>
.byte 68,15,40,199 // movaps %xmm7,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,57,21,1,0 // movaps 0x11539(%rip),%xmm13 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
+ .byte 68,15,40,45,45,21,1,0 // movaps 0x1152d(%rip),%xmm13 # 2cd70 <_sk_overlay_sse2_8bit+0xfac>
.byte 68,15,40,241 // movaps %xmm1,%xmm14
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 69,15,88,240 // addps %xmm8,%xmm14
- .byte 68,15,40,29,53,21,1,0 // movaps 0x11535(%rip),%xmm11 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
- .byte 68,15,40,5,141,20,1,0 // movaps 0x1148d(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,29,41,21,1,0 // movaps 0x11529(%rip),%xmm11 # 2cd80 <_sk_overlay_sse2_8bit+0xfbc>
+ .byte 68,15,40,5,129,20,1,0 // movaps 0x11481(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 68,15,92,248 // subps %xmm0,%xmm15
@@ -36486,10 +36478,10 @@ _sk_srcover_rgba_8888_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,228,0,0,0 // jne 1bb5e <_sk_srcover_rgba_8888_sse2+0x104>
+ .byte 15,133,228,0,0,0 // jne 1bb4a <_sk_srcover_rgba_8888_sse2+0x104>
.byte 243,69,15,111,4,128 // movdqu (%r8,%rax,4),%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 102,15,111,53,37,19,1,0 // movdqa 0x11325(%rip),%xmm6 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,53,25,19,1,0 // movdqa 0x11319(%rip),%xmm6 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,65,15,111,224 // movdqa %xmm8,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
@@ -36503,9 +36495,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 15,91,247 // cvtdq2ps %xmm7,%xmm6
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,248 // cvtdq2ps %xmm8,%xmm7
- .byte 68,15,40,5,53,18,1,0 // movaps 0x11235(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,41,18,1,0 // movaps 0x11229(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,9,19,1,0 // movaps 0x11309(%rip),%xmm12 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
+ .byte 68,15,40,37,253,18,1,0 // movaps 0x112fd(%rip),%xmm12 # 2cdc0 <_sk_overlay_sse2_8bit+0xffc>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -36531,7 +36523,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,114,240,24 // pslld $0x18,%xmm0
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 102,15,235,193 // por %xmm1,%xmm0
- .byte 117,84 // jne 1bb98 <_sk_srcover_rgba_8888_sse2+0x13e>
+ .byte 117,84 // jne 1bb84 <_sk_srcover_rgba_8888_sse2+0x13e>
.byte 243,65,15,127,4,128 // movdqu %xmm0,(%r8,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -36542,32 +36534,32 @@ _sk_srcover_rgba_8888_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,90 // je 1bbc5 <_sk_srcover_rgba_8888_sse2+0x16b>
+ .byte 116,90 // je 1bbb1 <_sk_srcover_rgba_8888_sse2+0x16b>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,23 // je 1bb8d <_sk_srcover_rgba_8888_sse2+0x133>
+ .byte 116,23 // je 1bb79 <_sk_srcover_rgba_8888_sse2+0x133>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 15,133,0,255,255,255 // jne 1ba80 <_sk_srcover_rgba_8888_sse2+0x26>
+ .byte 15,133,0,255,255,255 // jne 1ba6c <_sk_srcover_rgba_8888_sse2+0x26>
.byte 102,65,15,110,100,128,8 // movd 0x8(%r8,%rax,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
.byte 102,69,15,18,4,128 // movlpd (%r8,%rax,4),%xmm8
- .byte 233,232,254,255,255 // jmpq 1ba80 <_sk_srcover_rgba_8888_sse2+0x26>
+ .byte 233,232,254,255,255 // jmpq 1ba6c <_sk_srcover_rgba_8888_sse2+0x26>
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,43 // je 1bbd0 <_sk_srcover_rgba_8888_sse2+0x176>
+ .byte 116,43 // je 1bbbc <_sk_srcover_rgba_8888_sse2+0x176>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 1bbbd <_sk_srcover_rgba_8888_sse2+0x163>
+ .byte 116,18 // je 1bba9 <_sk_srcover_rgba_8888_sse2+0x163>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,153 // jne 1bb4a <_sk_srcover_rgba_8888_sse2+0xf0>
+ .byte 117,153 // jne 1bb36 <_sk_srcover_rgba_8888_sse2+0xf0>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,65,15,126,76,128,8 // movd %xmm1,0x8(%r8,%rax,4)
.byte 102,65,15,214,4,128 // movq %xmm0,(%r8,%rax,4)
- .byte 235,133 // jmp 1bb4a <_sk_srcover_rgba_8888_sse2+0xf0>
+ .byte 235,133 // jmp 1bb36 <_sk_srcover_rgba_8888_sse2+0xf0>
.byte 102,69,15,110,4,128 // movd (%r8,%rax,4),%xmm8
- .byte 233,176,254,255,255 // jmpq 1ba80 <_sk_srcover_rgba_8888_sse2+0x26>
+ .byte 233,176,254,255,255 // jmpq 1ba6c <_sk_srcover_rgba_8888_sse2+0x26>
.byte 102,65,15,126,4,128 // movd %xmm0,(%r8,%rax,4)
- .byte 233,111,255,255,255 // jmpq 1bb4a <_sk_srcover_rgba_8888_sse2+0xf0>
+ .byte 233,111,255,255,255 // jmpq 1bb36 <_sk_srcover_rgba_8888_sse2+0xf0>
HIDDEN _sk_clamp_0_sse2
.globl _sk_clamp_0_sse2
@@ -36585,7 +36577,7 @@ HIDDEN _sk_clamp_1_sse2
.globl _sk_clamp_1_sse2
FUNCTION(_sk_clamp_1_sse2)
_sk_clamp_1_sse2:
- .byte 68,15,40,5,5,17,1,0 // movaps 0x11105(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,249,16,1,0 // movaps 0x110f9(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -36597,7 +36589,7 @@ HIDDEN _sk_clamp_a_sse2
.globl _sk_clamp_a_sse2
FUNCTION(_sk_clamp_a_sse2)
_sk_clamp_a_sse2:
- .byte 15,93,29,234,16,1,0 // minps 0x110ea(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,93,29,222,16,1,0 // minps 0x110de(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -36608,7 +36600,7 @@ HIDDEN _sk_clamp_a_dst_sse2
.globl _sk_clamp_a_dst_sse2
FUNCTION(_sk_clamp_a_dst_sse2)
_sk_clamp_a_dst_sse2:
- .byte 15,93,61,214,16,1,0 // minps 0x110d6(%rip),%xmm7 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,93,61,202,16,1,0 // minps 0x110ca(%rip),%xmm7 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -36643,7 +36635,7 @@ HIDDEN _sk_invert_sse2
.globl _sk_invert_sse2
FUNCTION(_sk_invert_sse2)
_sk_invert_sse2:
- .byte 68,15,40,5,146,16,1,0 // movaps 0x11092(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,5,134,16,1,0 // movaps 0x11086(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -36705,7 +36697,7 @@ HIDDEN _sk_unpremul_sse2
FUNCTION(_sk_unpremul_sse2)
_sk_unpremul_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,28,16,1,0 // movaps 0x1101c(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,13,16,16,1,0 // movaps 0x11010(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -36719,20 +36711,20 @@ HIDDEN _sk_from_srgb_sse2
.globl _sk_from_srgb_sse2
FUNCTION(_sk_from_srgb_sse2)
_sk_from_srgb_sse2:
- .byte 68,15,40,5,231,16,1,0 // movaps 0x110e7(%rip),%xmm8 # 2cdf0 <_sk_overlay_sse2_8bit+0x1018>
+ .byte 68,15,40,5,219,16,1,0 // movaps 0x110db(%rip),%xmm8 # 2cdd0 <_sk_overlay_sse2_8bit+0x100c>
.byte 68,15,40,232 // movaps %xmm0,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,216 // movaps %xmm0,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,95,16,1,0 // movaps 0x1105f(%rip),%xmm9 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
+ .byte 68,15,40,13,83,16,1,0 // movaps 0x11053(%rip),%xmm9 # 2cd60 <_sk_overlay_sse2_8bit+0xf9c>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,207,16,1,0 // movaps 0x110cf(%rip),%xmm10 # 2ce00 <_sk_overlay_sse2_8bit+0x1028>
+ .byte 68,15,40,21,195,16,1,0 // movaps 0x110c3(%rip),%xmm10 # 2cde0 <_sk_overlay_sse2_8bit+0x101c>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,207,16,1,0 // movaps 0x110cf(%rip),%xmm11 # 2ce10 <_sk_overlay_sse2_8bit+0x1038>
+ .byte 68,15,40,29,195,16,1,0 // movaps 0x110c3(%rip),%xmm11 # 2cdf0 <_sk_overlay_sse2_8bit+0x102c>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,211,16,1,0 // movaps 0x110d3(%rip),%xmm12 # 2ce20 <_sk_overlay_sse2_8bit+0x1048>
+ .byte 68,15,40,37,199,16,1,0 // movaps 0x110c7(%rip),%xmm12 # 2ce00 <_sk_overlay_sse2_8bit+0x103c>
.byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0
.byte 68,15,84,232 // andps %xmm0,%xmm13
.byte 65,15,85,198 // andnps %xmm14,%xmm0
@@ -36768,20 +36760,20 @@ HIDDEN _sk_from_srgb_dst_sse2
.globl _sk_from_srgb_dst_sse2
FUNCTION(_sk_from_srgb_dst_sse2)
_sk_from_srgb_dst_sse2:
- .byte 68,15,40,5,36,16,1,0 // movaps 0x11024(%rip),%xmm8 # 2cdf0 <_sk_overlay_sse2_8bit+0x1018>
+ .byte 68,15,40,5,24,16,1,0 // movaps 0x11018(%rip),%xmm8 # 2cdd0 <_sk_overlay_sse2_8bit+0x100c>
.byte 68,15,40,236 // movaps %xmm4,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,220 // movaps %xmm4,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,156,15,1,0 // movaps 0x10f9c(%rip),%xmm9 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
+ .byte 68,15,40,13,144,15,1,0 // movaps 0x10f90(%rip),%xmm9 # 2cd60 <_sk_overlay_sse2_8bit+0xf9c>
.byte 68,15,40,244 // movaps %xmm4,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,12,16,1,0 // movaps 0x1100c(%rip),%xmm10 # 2ce00 <_sk_overlay_sse2_8bit+0x1028>
+ .byte 68,15,40,21,0,16,1,0 // movaps 0x11000(%rip),%xmm10 # 2cde0 <_sk_overlay_sse2_8bit+0x101c>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,12,16,1,0 // movaps 0x1100c(%rip),%xmm11 # 2ce10 <_sk_overlay_sse2_8bit+0x1038>
+ .byte 68,15,40,29,0,16,1,0 // movaps 0x11000(%rip),%xmm11 # 2cdf0 <_sk_overlay_sse2_8bit+0x102c>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,16,16,1,0 // movaps 0x11010(%rip),%xmm12 # 2ce20 <_sk_overlay_sse2_8bit+0x1048>
+ .byte 68,15,40,37,4,16,1,0 // movaps 0x11004(%rip),%xmm12 # 2ce00 <_sk_overlay_sse2_8bit+0x103c>
.byte 65,15,194,228,1 // cmpltps %xmm12,%xmm4
.byte 68,15,84,236 // andps %xmm4,%xmm13
.byte 65,15,85,230 // andnps %xmm14,%xmm4
@@ -36818,22 +36810,22 @@ HIDDEN _sk_to_srgb_sse2
FUNCTION(_sk_to_srgb_sse2)
_sk_to_srgb_sse2:
.byte 68,15,82,232 // rsqrtps %xmm0,%xmm13
- .byte 68,15,40,5,157,15,1,0 // movaps 0x10f9d(%rip),%xmm8 # 2ce30 <_sk_overlay_sse2_8bit+0x1058>
+ .byte 68,15,40,5,145,15,1,0 // movaps 0x10f91(%rip),%xmm8 # 2ce10 <_sk_overlay_sse2_8bit+0x104c>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,240 // mulps %xmm8,%xmm14
- .byte 68,15,40,13,157,15,1,0 // movaps 0x10f9d(%rip),%xmm9 # 2ce40 <_sk_overlay_sse2_8bit+0x1068>
+ .byte 68,15,40,13,145,15,1,0 // movaps 0x10f91(%rip),%xmm9 # 2ce20 <_sk_overlay_sse2_8bit+0x105c>
.byte 69,15,40,253 // movaps %xmm13,%xmm15
.byte 69,15,89,249 // mulps %xmm9,%xmm15
- .byte 68,15,40,21,157,15,1,0 // movaps 0x10f9d(%rip),%xmm10 # 2ce50 <_sk_overlay_sse2_8bit+0x1078>
+ .byte 68,15,40,21,145,15,1,0 // movaps 0x10f91(%rip),%xmm10 # 2ce30 <_sk_overlay_sse2_8bit+0x106c>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,253 // mulps %xmm13,%xmm15
- .byte 68,15,40,29,157,15,1,0 // movaps 0x10f9d(%rip),%xmm11 # 2ce60 <_sk_overlay_sse2_8bit+0x1088>
+ .byte 68,15,40,29,145,15,1,0 // movaps 0x10f91(%rip),%xmm11 # 2ce40 <_sk_overlay_sse2_8bit+0x107c>
.byte 69,15,88,251 // addps %xmm11,%xmm15
- .byte 68,15,40,37,161,15,1,0 // movaps 0x10fa1(%rip),%xmm12 # 2ce70 <_sk_overlay_sse2_8bit+0x1098>
+ .byte 68,15,40,37,149,15,1,0 // movaps 0x10f95(%rip),%xmm12 # 2ce50 <_sk_overlay_sse2_8bit+0x108c>
.byte 69,15,88,236 // addps %xmm12,%xmm13
.byte 69,15,83,237 // rcpps %xmm13,%xmm13
.byte 69,15,89,239 // mulps %xmm15,%xmm13
- .byte 68,15,40,61,157,15,1,0 // movaps 0x10f9d(%rip),%xmm15 # 2ce80 <_sk_overlay_sse2_8bit+0x10a8>
+ .byte 68,15,40,61,145,15,1,0 // movaps 0x10f91(%rip),%xmm15 # 2ce60 <_sk_overlay_sse2_8bit+0x109c>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,197 // andnps %xmm13,%xmm0
@@ -36885,7 +36877,7 @@ _sk_rgb_to_hsl_sse2:
.byte 68,15,93,216 // minps %xmm0,%xmm11
.byte 65,15,40,202 // movaps %xmm10,%xmm1
.byte 65,15,92,203 // subps %xmm11,%xmm1
- .byte 68,15,40,45,96,13,1,0 // movaps 0x10d60(%rip),%xmm13 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,45,84,13,1,0 // movaps 0x10d54(%rip),%xmm13 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 68,15,94,233 // divps %xmm1,%xmm13
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0
@@ -36894,30 +36886,30 @@ _sk_rgb_to_hsl_sse2:
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,40,241 // movaps %xmm9,%xmm14
.byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14
- .byte 68,15,84,53,198,14,1,0 // andps 0x10ec6(%rip),%xmm14 # 2ce90 <_sk_overlay_sse2_8bit+0x10b8>
+ .byte 68,15,84,53,186,14,1,0 // andps 0x10eba(%rip),%xmm14 # 2ce70 <_sk_overlay_sse2_8bit+0x10ac>
.byte 69,15,88,244 // addps %xmm12,%xmm14
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 68,15,40,37,185,14,1,0 // movaps 0x10eb9(%rip),%xmm12 # 2cea0 <_sk_overlay_sse2_8bit+0x10c8>
+ .byte 68,15,40,37,173,14,1,0 // movaps 0x10ead(%rip),%xmm12 # 2ce80 <_sk_overlay_sse2_8bit+0x10bc>
.byte 65,15,88,212 // addps %xmm12,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,88,5,181,14,1,0 // addps 0x10eb5(%rip),%xmm8 # 2ceb0 <_sk_overlay_sse2_8bit+0x10d8>
+ .byte 68,15,88,5,169,14,1,0 // addps 0x10ea9(%rip),%xmm8 # 2ce90 <_sk_overlay_sse2_8bit+0x10cc>
.byte 65,15,84,215 // andps %xmm15,%xmm2
.byte 69,15,85,248 // andnps %xmm8,%xmm15
.byte 68,15,86,250 // orps %xmm2,%xmm15
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,199 // andnps %xmm15,%xmm0
.byte 65,15,86,198 // orps %xmm14,%xmm0
- .byte 15,89,5,166,14,1,0 // mulps 0x10ea6(%rip),%xmm0 # 2cec0 <_sk_overlay_sse2_8bit+0x10e8>
+ .byte 15,89,5,154,14,1,0 // mulps 0x10e9a(%rip),%xmm0 # 2cea0 <_sk_overlay_sse2_8bit+0x10dc>
.byte 69,15,40,194 // movaps %xmm10,%xmm8
.byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8
.byte 65,15,84,192 // andps %xmm8,%xmm0
.byte 69,15,92,226 // subps %xmm10,%xmm12
.byte 69,15,88,211 // addps %xmm11,%xmm10
- .byte 68,15,40,13,169,12,1,0 // movaps 0x10ca9(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,40,13,173,12,1,0 // movaps 0x10cad(%rip),%xmm9 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 65,15,40,210 // movaps %xmm10,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9
@@ -36941,7 +36933,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,218 // movaps %xmm2,%xmm11
.byte 15,40,240 // movaps %xmm0,%xmm6
- .byte 68,15,40,13,88,12,1,0 // movaps 0x10c58(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,40,13,92,12,1,0 // movaps 0x10c5c(%rip),%xmm9 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
@@ -36958,28 +36950,28 @@ _sk_hsl_to_rgb_sse2:
.byte 69,15,88,211 // addps %xmm11,%xmm10
.byte 69,15,88,219 // addps %xmm11,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 15,40,5,1,14,1,0 // movaps 0x10e01(%rip),%xmm0 # 2ced0 <_sk_overlay_sse2_8bit+0x10f8>
+ .byte 15,40,5,245,13,1,0 // movaps 0x10df5(%rip),%xmm0 # 2ceb0 <_sk_overlay_sse2_8bit+0x10ec>
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,216 // movaps %xmm0,%xmm3
.byte 15,194,217,1 // cmpltps %xmm1,%xmm3
- .byte 15,84,29,25,12,1,0 // andps 0x10c19(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,84,29,13,12,1,0 // andps 0x10c0d(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
- .byte 68,15,40,45,235,13,1,0 // movaps 0x10deb(%rip),%xmm13 # 2cee0 <_sk_overlay_sse2_8bit+0x1108>
+ .byte 68,15,40,45,223,13,1,0 // movaps 0x10ddf(%rip),%xmm13 # 2cec0 <_sk_overlay_sse2_8bit+0x10fc>
.byte 69,15,40,197 // movaps %xmm13,%xmm8
.byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8
.byte 69,15,40,242 // movaps %xmm10,%xmm14
.byte 69,15,92,243 // subps %xmm11,%xmm14
.byte 65,15,40,217 // movaps %xmm9,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
- .byte 15,40,21,171,13,1,0 // movaps 0x10dab(%rip),%xmm2 # 2cec0 <_sk_overlay_sse2_8bit+0x10e8>
+ .byte 15,40,21,159,13,1,0 // movaps 0x10d9f(%rip),%xmm2 # 2cea0 <_sk_overlay_sse2_8bit+0x10dc>
.byte 68,15,40,250 // movaps %xmm2,%xmm15
.byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15
- .byte 15,40,13,107,13,1,0 // movaps 0x10d6b(%rip),%xmm1 # 2ce90 <_sk_overlay_sse2_8bit+0x10b8>
+ .byte 15,40,13,95,13,1,0 // movaps 0x10d5f(%rip),%xmm1 # 2ce70 <_sk_overlay_sse2_8bit+0x10ac>
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,45,129,13,1,0 // movaps 0x10d81(%rip),%xmm5 # 2ceb0 <_sk_overlay_sse2_8bit+0x10d8>
+ .byte 15,40,45,117,13,1,0 // movaps 0x10d75(%rip),%xmm5 # 2ce90 <_sk_overlay_sse2_8bit+0x10cc>
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,92,224 // subps %xmm0,%xmm4
.byte 65,15,89,230 // mulps %xmm14,%xmm4
@@ -37002,7 +36994,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,118,11,1,0 // andps 0x10b76(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,84,29,106,11,1,0 // andps 0x10b6a(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 68,15,40,230 // movaps %xmm6,%xmm12
.byte 68,15,92,224 // subps %xmm0,%xmm12
@@ -37032,12 +37024,12 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 15,85,227 // andnps %xmm3,%xmm4
- .byte 15,88,53,238,12,1,0 // addps 0x10cee(%rip),%xmm6 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
+ .byte 15,88,53,226,12,1,0 // addps 0x10ce2(%rip),%xmm6 # 2ced0 <_sk_overlay_sse2_8bit+0x110c>
.byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,233,10,1,0 // andps 0x10ae9(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,84,29,221,10,1,0 // andps 0x10add(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,89,206 // mulps %xmm6,%xmm1
@@ -37101,13 +37093,13 @@ _sk_scale_u8_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,61 // jne 1c318 <_sk_scale_u8_sse2+0x55>
+ .byte 117,61 // jne 1c304 <_sk_scale_u8_sse2+0x55>
.byte 102,71,15,110,4,16 // movd (%r8,%r10,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,188,10,1,0 // pand 0x10abc(%rip),%xmm8 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,68,15,219,5,176,10,1,0 // pand 0x10ab0(%rip),%xmm8 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,0,12,1,0 // mulps 0x10c00(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,89,5,244,11,1,0 // mulps 0x10bf4(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -37118,12 +37110,12 @@ _sk_scale_u8_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,61 // je 1c362 <_sk_scale_u8_sse2+0x9f>
+ .byte 116,61 // je 1c34e <_sk_scale_u8_sse2+0x9f>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,23 // je 1c347 <_sk_scale_u8_sse2+0x84>
+ .byte 116,23 // je 1c333 <_sk_scale_u8_sse2+0x84>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,181 // jne 1c2eb <_sk_scale_u8_sse2+0x28>
+ .byte 117,181 // jne 1c2d7 <_sk_scale_u8_sse2+0x28>
.byte 67,15,182,68,16,2 // movzbl 0x2(%r8,%r10,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -37132,10 +37124,10 @@ _sk_scale_u8_sse2:
.byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 242,69,15,16,193 // movsd %xmm9,%xmm8
- .byte 235,137 // jmp 1c2eb <_sk_scale_u8_sse2+0x28>
+ .byte 235,137 // jmp 1c2d7 <_sk_scale_u8_sse2+0x28>
.byte 67,15,182,4,16 // movzbl (%r8,%r10,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,122,255,255,255 // jmpq 1c2eb <_sk_scale_u8_sse2+0x28>
+ .byte 233,122,255,255,255 // jmpq 1c2d7 <_sk_scale_u8_sse2+0x28>
HIDDEN _sk_scale_565_sse2
.globl _sk_scale_565_sse2
@@ -37149,20 +37141,20 @@ _sk_scale_565_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,173,0,0,0 // jne 1c43d <_sk_scale_565_sse2+0xcc>
+ .byte 15,133,173,0,0,0 // jne 1c429 <_sk_scale_565_sse2+0xcc>
.byte 243,71,15,126,20,80 // movq (%r8,%r10,2),%xmm10
.byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
- .byte 102,68,15,111,5,108,11,1,0 // movdqa 0x10b6c(%rip),%xmm8 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
+ .byte 102,68,15,111,5,96,11,1,0 // movdqa 0x10b60(%rip),%xmm8 # 2cef0 <_sk_overlay_sse2_8bit+0x112c>
.byte 102,69,15,219,194 // pand %xmm10,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,107,11,1,0 // mulps 0x10b6b(%rip),%xmm8 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
- .byte 102,68,15,111,13,114,11,1,0 // movdqa 0x10b72(%rip),%xmm9 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
+ .byte 68,15,89,5,95,11,1,0 // mulps 0x10b5f(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x113c>
+ .byte 102,68,15,111,13,102,11,1,0 // movdqa 0x10b66(%rip),%xmm9 # 2cf10 <_sk_overlay_sse2_8bit+0x114c>
.byte 102,69,15,219,202 // pand %xmm10,%xmm9
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,113,11,1,0 // mulps 0x10b71(%rip),%xmm9 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
- .byte 102,68,15,219,21,120,11,1,0 // pand 0x10b78(%rip),%xmm10 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
+ .byte 68,15,89,13,101,11,1,0 // mulps 0x10b65(%rip),%xmm9 # 2cf20 <_sk_overlay_sse2_8bit+0x115c>
+ .byte 102,68,15,219,21,108,11,1,0 // pand 0x10b6c(%rip),%xmm10 # 2cf30 <_sk_overlay_sse2_8bit+0x116c>
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,124,11,1,0 // mulps 0x10b7c(%rip),%xmm10 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
+ .byte 68,15,89,21,112,11,1,0 // mulps 0x10b70(%rip),%xmm10 # 2cf40 <_sk_overlay_sse2_8bit+0x117c>
.byte 68,15,40,219 // movaps %xmm3,%xmm11
.byte 68,15,194,223,1 // cmpltps %xmm7,%xmm11
.byte 69,15,40,225 // movaps %xmm9,%xmm12
@@ -37189,22 +37181,22 @@ _sk_scale_565_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,59 // je 1c485 <_sk_scale_565_sse2+0x114>
+ .byte 116,59 // je 1c471 <_sk_scale_565_sse2+0x114>
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,27 // je 1c470 <_sk_scale_565_sse2+0xff>
+ .byte 116,27 // je 1c45c <_sk_scale_565_sse2+0xff>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 15,133,60,255,255,255 // jne 1c39b <_sk_scale_565_sse2+0x2a>
+ .byte 15,133,60,255,255,255 // jne 1c387 <_sk_scale_565_sse2+0x2a>
.byte 67,15,183,68,80,4 // movzwl 0x4(%r8,%r10,2),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,208,69 // pshufd $0x45,%xmm8,%xmm10
.byte 102,71,15,110,4,80 // movd (%r8,%r10,2),%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
.byte 242,69,15,16,208 // movsd %xmm8,%xmm10
- .byte 233,22,255,255,255 // jmpq 1c39b <_sk_scale_565_sse2+0x2a>
+ .byte 233,22,255,255,255 // jmpq 1c387 <_sk_scale_565_sse2+0x2a>
.byte 67,15,183,4,80 // movzwl (%r8,%r10,2),%eax
.byte 102,68,15,110,208 // movd %eax,%xmm10
- .byte 233,7,255,255,255 // jmpq 1c39b <_sk_scale_565_sse2+0x2a>
+ .byte 233,7,255,255,255 // jmpq 1c387 <_sk_scale_565_sse2+0x2a>
HIDDEN _sk_lerp_1_float_sse2
.globl _sk_lerp_1_float_sse2
@@ -37239,13 +37231,13 @@ _sk_lerp_u8_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,81 // jne 1c535 <_sk_lerp_u8_sse2+0x69>
+ .byte 117,81 // jne 1c521 <_sk_lerp_u8_sse2+0x69>
.byte 102,71,15,110,4,16 // movd (%r8,%r10,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,179,8,1,0 // pand 0x108b3(%rip),%xmm8 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,68,15,219,5,167,8,1,0 // pand 0x108a7(%rip),%xmm8 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,247,9,1,0 // mulps 0x109f7(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,89,5,235,9,1,0 // mulps 0x109eb(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -37263,12 +37255,12 @@ _sk_lerp_u8_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,64 // je 1c582 <_sk_lerp_u8_sse2+0xb6>
+ .byte 116,64 // je 1c56e <_sk_lerp_u8_sse2+0xb6>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,23 // je 1c564 <_sk_lerp_u8_sse2+0x98>
+ .byte 116,23 // je 1c550 <_sk_lerp_u8_sse2+0x98>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,161 // jne 1c4f4 <_sk_lerp_u8_sse2+0x28>
+ .byte 117,161 // jne 1c4e0 <_sk_lerp_u8_sse2+0x28>
.byte 67,15,182,68,16,2 // movzbl 0x2(%r8,%r10,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -37277,10 +37269,10 @@ _sk_lerp_u8_sse2:
.byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 242,69,15,16,193 // movsd %xmm9,%xmm8
- .byte 233,114,255,255,255 // jmpq 1c4f4 <_sk_lerp_u8_sse2+0x28>
+ .byte 233,114,255,255,255 // jmpq 1c4e0 <_sk_lerp_u8_sse2+0x28>
.byte 67,15,182,4,16 // movzbl (%r8,%r10,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,99,255,255,255 // jmpq 1c4f4 <_sk_lerp_u8_sse2+0x28>
+ .byte 233,99,255,255,255 // jmpq 1c4e0 <_sk_lerp_u8_sse2+0x28>
HIDDEN _sk_lerp_565_sse2
.globl _sk_lerp_565_sse2
@@ -37294,20 +37286,20 @@ _sk_lerp_565_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,173,0,0,0 // jne 1c65d <_sk_lerp_565_sse2+0xcc>
+ .byte 15,133,173,0,0,0 // jne 1c649 <_sk_lerp_565_sse2+0xcc>
.byte 243,71,15,126,4,80 // movq (%r8,%r10,2),%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,111,13,76,9,1,0 // movdqa 0x1094c(%rip),%xmm9 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
+ .byte 102,68,15,111,13,64,9,1,0 // movdqa 0x10940(%rip),%xmm9 # 2cef0 <_sk_overlay_sse2_8bit+0x112c>
.byte 102,69,15,219,200 // pand %xmm8,%xmm9
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,75,9,1,0 // mulps 0x1094b(%rip),%xmm9 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
- .byte 102,68,15,111,21,82,9,1,0 // movdqa 0x10952(%rip),%xmm10 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
+ .byte 68,15,89,13,63,9,1,0 // mulps 0x1093f(%rip),%xmm9 # 2cf00 <_sk_overlay_sse2_8bit+0x113c>
+ .byte 102,68,15,111,21,70,9,1,0 // movdqa 0x10946(%rip),%xmm10 # 2cf10 <_sk_overlay_sse2_8bit+0x114c>
.byte 102,69,15,219,208 // pand %xmm8,%xmm10
.byte 69,15,91,218 // cvtdq2ps %xmm10,%xmm11
- .byte 68,15,89,29,81,9,1,0 // mulps 0x10951(%rip),%xmm11 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
- .byte 102,68,15,219,5,88,9,1,0 // pand 0x10958(%rip),%xmm8 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
+ .byte 68,15,89,29,69,9,1,0 // mulps 0x10945(%rip),%xmm11 # 2cf20 <_sk_overlay_sse2_8bit+0x115c>
+ .byte 102,68,15,219,5,76,9,1,0 // pand 0x1094c(%rip),%xmm8 # 2cf30 <_sk_overlay_sse2_8bit+0x116c>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,92,9,1,0 // mulps 0x1095c(%rip),%xmm8 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
+ .byte 68,15,89,5,80,9,1,0 // mulps 0x10950(%rip),%xmm8 # 2cf40 <_sk_overlay_sse2_8bit+0x117c>
.byte 68,15,40,211 // movaps %xmm3,%xmm10
.byte 68,15,194,215,1 // cmpltps %xmm7,%xmm10
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -37336,22 +37328,22 @@ _sk_lerp_565_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,59 // je 1c6a5 <_sk_lerp_565_sse2+0x114>
+ .byte 116,59 // je 1c691 <_sk_lerp_565_sse2+0x114>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,27 // je 1c690 <_sk_lerp_565_sse2+0xff>
+ .byte 116,27 // je 1c67c <_sk_lerp_565_sse2+0xff>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 15,133,60,255,255,255 // jne 1c5bb <_sk_lerp_565_sse2+0x2a>
+ .byte 15,133,60,255,255,255 // jne 1c5a7 <_sk_lerp_565_sse2+0x2a>
.byte 67,15,183,68,80,4 // movzwl 0x4(%r8,%r10,2),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
.byte 102,71,15,110,12,80 // movd (%r8,%r10,2),%xmm9
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 242,69,15,16,193 // movsd %xmm9,%xmm8
- .byte 233,22,255,255,255 // jmpq 1c5bb <_sk_lerp_565_sse2+0x2a>
+ .byte 233,22,255,255,255 // jmpq 1c5a7 <_sk_lerp_565_sse2+0x2a>
.byte 67,15,183,4,80 // movzwl (%r8,%r10,2),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,7,255,255,255 // jmpq 1c5bb <_sk_lerp_565_sse2+0x2a>
+ .byte 233,7,255,255,255 // jmpq 1c5a7 <_sk_lerp_565_sse2+0x2a>
HIDDEN _sk_load_tables_sse2
.globl _sk_load_tables_sse2
@@ -37360,11 +37352,11 @@ _sk_load_tables_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,0 // mov (%rax),%r8
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,32,1,0,0 // jne 1c7e2 <_sk_load_tables_sse2+0x12e>
+ .byte 15,133,32,1,0,0 // jne 1c7ce <_sk_load_tables_sse2+0x12e>
.byte 243,69,15,111,12,144 // movdqu (%r8,%rdx,4),%xmm9
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,68,15,111,5,220,6,1,0 // movdqa 0x106dc(%rip),%xmm8 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,68,15,111,5,208,6,1,0 // movdqa 0x106d0(%rip),%xmm8 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
@@ -37420,7 +37412,7 @@ _sk_load_tables_sse2:
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 102,65,15,114,209,24 // psrld $0x18,%xmm9
.byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3
- .byte 15,89,29,37,7,1,0 // mulps 0x10725(%rip),%xmm3 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 15,89,29,25,7,1,0 // mulps 0x10719(%rip),%xmm3 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -37428,18 +37420,18 @@ _sk_load_tables_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,45 // je 1c81c <_sk_load_tables_sse2+0x168>
+ .byte 116,45 // je 1c808 <_sk_load_tables_sse2+0x168>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,23 // je 1c811 <_sk_load_tables_sse2+0x15d>
+ .byte 116,23 // je 1c7fd <_sk_load_tables_sse2+0x15d>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 15,133,196,254,255,255 // jne 1c6c8 <_sk_load_tables_sse2+0x14>
+ .byte 15,133,196,254,255,255 // jne 1c6b4 <_sk_load_tables_sse2+0x14>
.byte 102,65,15,110,68,144,8 // movd 0x8(%r8,%rdx,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,144 // movlpd (%r8,%rdx,4),%xmm9
- .byte 233,172,254,255,255 // jmpq 1c6c8 <_sk_load_tables_sse2+0x14>
+ .byte 233,172,254,255,255 // jmpq 1c6b4 <_sk_load_tables_sse2+0x14>
.byte 102,69,15,110,12,144 // movd (%r8,%rdx,4),%xmm9
- .byte 233,161,254,255,255 // jmpq 1c6c8 <_sk_load_tables_sse2+0x14>
+ .byte 233,161,254,255,255 // jmpq 1c6b4 <_sk_load_tables_sse2+0x14>
HIDDEN _sk_load_tables_u16_be_sse2
.globl _sk_load_tables_u16_be_sse2
@@ -37449,7 +37441,7 @@ _sk_load_tables_u16_be_sse2:
.byte 76,139,0 // mov (%rax),%r8
.byte 76,141,12,149,0,0,0,0 // lea 0x0(,%rdx,4),%r9
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,97,1,0,0 // jne 1c99e <_sk_load_tables_u16_be_sse2+0x177>
+ .byte 15,133,97,1,0,0 // jne 1c98a <_sk_load_tables_u16_be_sse2+0x177>
.byte 102,67,15,16,4,72 // movupd (%r8,%r9,2),%xmm0
.byte 102,67,15,16,76,72,16 // movupd 0x10(%r8,%r9,2),%xmm1
.byte 65,86 // push %r14
@@ -37460,7 +37452,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,21,254,6,1,0 // movdqa 0x106fe(%rip),%xmm10 # 2cf70 <_sk_overlay_sse2_8bit+0x1198>
+ .byte 102,68,15,111,21,242,6,1,0 // movdqa 0x106f2(%rip),%xmm10 # 2cf50 <_sk_overlay_sse2_8bit+0x118c>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -37522,24 +37514,24 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,235,217 // por %xmm9,%xmm3
.byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,249,5,1,0 // mulps 0x105f9(%rip),%xmm3 # 2cf90 <_sk_overlay_sse2_8bit+0x11b8>
+ .byte 15,89,29,237,5,1,0 // mulps 0x105ed(%rip),%xmm3 # 2cf70 <_sk_overlay_sse2_8bit+0x11ac>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 255,224 // jmpq *%rax
.byte 242,67,15,16,4,72 // movsd (%r8,%r9,2),%xmm0
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,17 // jne 1c9bb <_sk_load_tables_u16_be_sse2+0x194>
+ .byte 117,17 // jne 1c9a7 <_sk_load_tables_u16_be_sse2+0x194>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,143,254,255,255 // jmpq 1c84a <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 233,143,254,255,255 // jmpq 1c836 <_sk_load_tables_u16_be_sse2+0x23>
.byte 102,67,15,22,68,72,8 // movhpd 0x8(%r8,%r9,2),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 15,130,122,254,255,255 // jb 1c84a <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 15,130,122,254,255,255 // jb 1c836 <_sk_load_tables_u16_be_sse2+0x23>
.byte 242,67,15,16,76,72,16 // movsd 0x10(%r8,%r9,2),%xmm1
- .byte 233,110,254,255,255 // jmpq 1c84a <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 233,110,254,255,255 // jmpq 1c836 <_sk_load_tables_u16_be_sse2+0x23>
HIDDEN _sk_load_tables_rgb_u16_be_sse2
.globl _sk_load_tables_rgb_u16_be_sse2
@@ -37549,7 +37541,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 76,139,0 // mov (%rax),%r8
.byte 76,141,12,82 // lea (%rdx,%rdx,2),%r9
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,80,1,0,0 // jne 1cb3e <_sk_load_tables_rgb_u16_be_sse2+0x162>
+ .byte 15,133,80,1,0,0 // jne 1cb2a <_sk_load_tables_rgb_u16_be_sse2+0x162>
.byte 243,71,15,111,28,72 // movdqu (%r8,%r9,2),%xmm11
.byte 243,67,15,111,76,72,8 // movdqu 0x8(%r8,%r9,2),%xmm1
.byte 102,15,115,217,4 // psrldq $0x4,%xmm1
@@ -37563,7 +37555,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
.byte 102,65,15,111,195 // movdqa %xmm11,%xmm0
.byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0
- .byte 102,68,15,111,5,60,5,1,0 // movdqa 0x1053c(%rip),%xmm8 # 2cf70 <_sk_overlay_sse2_8bit+0x1198>
+ .byte 102,68,15,111,5,48,5,1,0 // movdqa 0x10530(%rip),%xmm8 # 2cf50 <_sk_overlay_sse2_8bit+0x118c>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -37619,7 +37611,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,199,1,1,0 // movaps 0x101c7(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,187,1,1,0 // movaps 0x101bb(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 255,224 // jmpq *%rax
@@ -37627,21 +37619,21 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,71,15,196,92,72,4,2 // pinsrw $0x2,0x4(%r8,%r9,2),%xmm11
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,14 // jne 1cb64 <_sk_load_tables_rgb_u16_be_sse2+0x188>
+ .byte 117,14 // jne 1cb50 <_sk_load_tables_rgb_u16_be_sse2+0x188>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
- .byte 233,176,254,255,255 // jmpq 1ca14 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,176,254,255,255 // jmpq 1ca00 <_sk_load_tables_rgb_u16_be_sse2+0x38>
.byte 102,71,15,110,84,72,6 // movd 0x6(%r8,%r9,2),%xmm10
.byte 102,71,15,196,84,72,10,2 // pinsrw $0x2,0xa(%r8,%r9,2),%xmm10
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,24 // jb 1cb95 <_sk_load_tables_rgb_u16_be_sse2+0x1b9>
+ .byte 114,24 // jb 1cb81 <_sk_load_tables_rgb_u16_be_sse2+0x1b9>
.byte 102,67,15,110,76,72,12 // movd 0xc(%r8,%r9,2),%xmm1
.byte 102,67,15,196,76,72,16,2 // pinsrw $0x2,0x10(%r8,%r9,2),%xmm1
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,127,254,255,255 // jmpq 1ca14 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,127,254,255,255 // jmpq 1ca00 <_sk_load_tables_rgb_u16_be_sse2+0x38>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,118,254,255,255 // jmpq 1ca14 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,118,254,255,255 // jmpq 1ca00 <_sk_load_tables_rgb_u16_be_sse2+0x38>
HIDDEN _sk_byte_tables_sse2
.globl _sk_byte_tables_sse2
@@ -37651,7 +37643,7 @@ _sk_byte_tables_sse2:
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,52,2,1,0 // movaps 0x10234(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
+ .byte 68,15,40,5,40,2,1,0 // movaps 0x10228(%rip),%xmm8 # 2cdc0 <_sk_overlay_sse2_8bit+0xffc>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,126,192 // movq %xmm0,%r8
@@ -37679,7 +37671,7 @@ _sk_byte_tables_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,222,2,1,0 // movaps 0x102de(%rip),%xmm10 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,21,210,2,1,0 // movaps 0x102d2(%rip),%xmm10 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -37798,7 +37790,7 @@ _sk_byte_tables_rgb_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,26,1,1,0 // movaps 0x1011a(%rip),%xmm10 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,21,14,1,1,0 // movaps 0x1010e(%rip),%xmm10 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -37996,15 +37988,15 @@ _sk_parametric_r_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,248,254,0,0 // mulps 0xfef8(%rip),%xmm9 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
- .byte 68,15,84,21,0,255,0,0 // andps 0xff00(%rip),%xmm10 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
- .byte 68,15,86,21,24,252,0,0 // orps 0xfc18(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
- .byte 68,15,88,13,0,255,0,0 // addps 0xff00(%rip),%xmm9 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
- .byte 68,15,40,37,8,255,0,0 // movaps 0xff08(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
+ .byte 68,15,89,13,236,254,0,0 // mulps 0xfeec(%rip),%xmm9 # 2cf90 <_sk_overlay_sse2_8bit+0x11cc>
+ .byte 68,15,84,21,244,254,0,0 // andps 0xfef4(%rip),%xmm10 # 2cfa0 <_sk_overlay_sse2_8bit+0x11dc>
+ .byte 68,15,86,21,28,252,0,0 // orps 0xfc1c(%rip),%xmm10 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
+ .byte 68,15,88,13,244,254,0,0 // addps 0xfef4(%rip),%xmm9 # 2cfb0 <_sk_overlay_sse2_8bit+0x11ec>
+ .byte 68,15,40,37,252,254,0,0 // movaps 0xfefc(%rip),%xmm12 # 2cfc0 <_sk_overlay_sse2_8bit+0x11fc>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,8,255,0,0 // addps 0xff08(%rip),%xmm10 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
- .byte 68,15,40,37,16,255,0,0 // movaps 0xff10(%rip),%xmm12 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
+ .byte 68,15,88,21,252,254,0,0 // addps 0xfefc(%rip),%xmm10 # 2cfd0 <_sk_overlay_sse2_8bit+0x120c>
+ .byte 68,15,40,37,4,255,0,0 // movaps 0xff04(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x121c>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -38012,22 +38004,22 @@ _sk_parametric_r_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,234,251,0,0 // movaps 0xfbea(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,21,222,251,0,0 // movaps 0xfbde(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,222,254,0,0 // addps 0xfede(%rip),%xmm9 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
- .byte 68,15,40,37,230,254,0,0 // movaps 0xfee6(%rip),%xmm12 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
+ .byte 68,15,88,13,210,254,0,0 // addps 0xfed2(%rip),%xmm9 # 2cff0 <_sk_overlay_sse2_8bit+0x122c>
+ .byte 68,15,40,37,218,254,0,0 // movaps 0xfeda(%rip),%xmm12 # 2d000 <_sk_overlay_sse2_8bit+0x123c>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,230,254,0,0 // movaps 0xfee6(%rip),%xmm12 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
+ .byte 68,15,40,37,218,254,0,0 // movaps 0xfeda(%rip),%xmm12 # 2d010 <_sk_overlay_sse2_8bit+0x124c>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,234,254,0,0 // movaps 0xfeea(%rip),%xmm13 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
+ .byte 68,15,40,45,222,254,0,0 // movaps 0xfede(%rip),%xmm13 # 2d020 <_sk_overlay_sse2_8bit+0x125c>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,234,254,0,0 // mulps 0xfeea(%rip),%xmm13 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
+ .byte 68,15,89,45,222,254,0,0 // mulps 0xfede(%rip),%xmm13 # 2d030 <_sk_overlay_sse2_8bit+0x126c>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -38063,15 +38055,15 @@ _sk_parametric_g_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,186,253,0,0 // mulps 0xfdba(%rip),%xmm9 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
- .byte 68,15,84,21,194,253,0,0 // andps 0xfdc2(%rip),%xmm10 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
- .byte 68,15,86,21,218,250,0,0 // orps 0xfada(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
- .byte 68,15,88,13,194,253,0,0 // addps 0xfdc2(%rip),%xmm9 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
- .byte 68,15,40,37,202,253,0,0 // movaps 0xfdca(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
+ .byte 68,15,89,13,174,253,0,0 // mulps 0xfdae(%rip),%xmm9 # 2cf90 <_sk_overlay_sse2_8bit+0x11cc>
+ .byte 68,15,84,21,182,253,0,0 // andps 0xfdb6(%rip),%xmm10 # 2cfa0 <_sk_overlay_sse2_8bit+0x11dc>
+ .byte 68,15,86,21,222,250,0,0 // orps 0xfade(%rip),%xmm10 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
+ .byte 68,15,88,13,182,253,0,0 // addps 0xfdb6(%rip),%xmm9 # 2cfb0 <_sk_overlay_sse2_8bit+0x11ec>
+ .byte 68,15,40,37,190,253,0,0 // movaps 0xfdbe(%rip),%xmm12 # 2cfc0 <_sk_overlay_sse2_8bit+0x11fc>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,202,253,0,0 // addps 0xfdca(%rip),%xmm10 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
- .byte 68,15,40,37,210,253,0,0 // movaps 0xfdd2(%rip),%xmm12 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
+ .byte 68,15,88,21,190,253,0,0 // addps 0xfdbe(%rip),%xmm10 # 2cfd0 <_sk_overlay_sse2_8bit+0x120c>
+ .byte 68,15,40,37,198,253,0,0 // movaps 0xfdc6(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x121c>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -38079,22 +38071,22 @@ _sk_parametric_g_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,172,250,0,0 // movaps 0xfaac(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,21,160,250,0,0 // movaps 0xfaa0(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,160,253,0,0 // addps 0xfda0(%rip),%xmm9 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
- .byte 68,15,40,37,168,253,0,0 // movaps 0xfda8(%rip),%xmm12 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
+ .byte 68,15,88,13,148,253,0,0 // addps 0xfd94(%rip),%xmm9 # 2cff0 <_sk_overlay_sse2_8bit+0x122c>
+ .byte 68,15,40,37,156,253,0,0 // movaps 0xfd9c(%rip),%xmm12 # 2d000 <_sk_overlay_sse2_8bit+0x123c>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,168,253,0,0 // movaps 0xfda8(%rip),%xmm12 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
+ .byte 68,15,40,37,156,253,0,0 // movaps 0xfd9c(%rip),%xmm12 # 2d010 <_sk_overlay_sse2_8bit+0x124c>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,172,253,0,0 // movaps 0xfdac(%rip),%xmm13 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
+ .byte 68,15,40,45,160,253,0,0 // movaps 0xfda0(%rip),%xmm13 # 2d020 <_sk_overlay_sse2_8bit+0x125c>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,172,253,0,0 // mulps 0xfdac(%rip),%xmm13 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
+ .byte 68,15,89,45,160,253,0,0 // mulps 0xfda0(%rip),%xmm13 # 2d030 <_sk_overlay_sse2_8bit+0x126c>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -38130,15 +38122,15 @@ _sk_parametric_b_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,124,252,0,0 // mulps 0xfc7c(%rip),%xmm9 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
- .byte 68,15,84,21,132,252,0,0 // andps 0xfc84(%rip),%xmm10 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
- .byte 68,15,86,21,156,249,0,0 // orps 0xf99c(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
- .byte 68,15,88,13,132,252,0,0 // addps 0xfc84(%rip),%xmm9 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
- .byte 68,15,40,37,140,252,0,0 // movaps 0xfc8c(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
+ .byte 68,15,89,13,112,252,0,0 // mulps 0xfc70(%rip),%xmm9 # 2cf90 <_sk_overlay_sse2_8bit+0x11cc>
+ .byte 68,15,84,21,120,252,0,0 // andps 0xfc78(%rip),%xmm10 # 2cfa0 <_sk_overlay_sse2_8bit+0x11dc>
+ .byte 68,15,86,21,160,249,0,0 // orps 0xf9a0(%rip),%xmm10 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
+ .byte 68,15,88,13,120,252,0,0 // addps 0xfc78(%rip),%xmm9 # 2cfb0 <_sk_overlay_sse2_8bit+0x11ec>
+ .byte 68,15,40,37,128,252,0,0 // movaps 0xfc80(%rip),%xmm12 # 2cfc0 <_sk_overlay_sse2_8bit+0x11fc>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,140,252,0,0 // addps 0xfc8c(%rip),%xmm10 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
- .byte 68,15,40,37,148,252,0,0 // movaps 0xfc94(%rip),%xmm12 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
+ .byte 68,15,88,21,128,252,0,0 // addps 0xfc80(%rip),%xmm10 # 2cfd0 <_sk_overlay_sse2_8bit+0x120c>
+ .byte 68,15,40,37,136,252,0,0 // movaps 0xfc88(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x121c>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -38146,22 +38138,22 @@ _sk_parametric_b_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,110,249,0,0 // movaps 0xf96e(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,21,98,249,0,0 // movaps 0xf962(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,98,252,0,0 // addps 0xfc62(%rip),%xmm9 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
- .byte 68,15,40,37,106,252,0,0 // movaps 0xfc6a(%rip),%xmm12 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
+ .byte 68,15,88,13,86,252,0,0 // addps 0xfc56(%rip),%xmm9 # 2cff0 <_sk_overlay_sse2_8bit+0x122c>
+ .byte 68,15,40,37,94,252,0,0 // movaps 0xfc5e(%rip),%xmm12 # 2d000 <_sk_overlay_sse2_8bit+0x123c>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,106,252,0,0 // movaps 0xfc6a(%rip),%xmm12 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
+ .byte 68,15,40,37,94,252,0,0 // movaps 0xfc5e(%rip),%xmm12 # 2d010 <_sk_overlay_sse2_8bit+0x124c>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,110,252,0,0 // movaps 0xfc6e(%rip),%xmm13 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
+ .byte 68,15,40,45,98,252,0,0 // movaps 0xfc62(%rip),%xmm13 # 2d020 <_sk_overlay_sse2_8bit+0x125c>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,110,252,0,0 // mulps 0xfc6e(%rip),%xmm13 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
+ .byte 68,15,89,45,98,252,0,0 // mulps 0xfc62(%rip),%xmm13 # 2d030 <_sk_overlay_sse2_8bit+0x126c>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -38197,15 +38189,15 @@ _sk_parametric_a_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,62,251,0,0 // mulps 0xfb3e(%rip),%xmm9 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
- .byte 68,15,84,21,70,251,0,0 // andps 0xfb46(%rip),%xmm10 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
- .byte 68,15,86,21,94,248,0,0 // orps 0xf85e(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
- .byte 68,15,88,13,70,251,0,0 // addps 0xfb46(%rip),%xmm9 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
- .byte 68,15,40,37,78,251,0,0 // movaps 0xfb4e(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
+ .byte 68,15,89,13,50,251,0,0 // mulps 0xfb32(%rip),%xmm9 # 2cf90 <_sk_overlay_sse2_8bit+0x11cc>
+ .byte 68,15,84,21,58,251,0,0 // andps 0xfb3a(%rip),%xmm10 # 2cfa0 <_sk_overlay_sse2_8bit+0x11dc>
+ .byte 68,15,86,21,98,248,0,0 // orps 0xf862(%rip),%xmm10 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
+ .byte 68,15,88,13,58,251,0,0 // addps 0xfb3a(%rip),%xmm9 # 2cfb0 <_sk_overlay_sse2_8bit+0x11ec>
+ .byte 68,15,40,37,66,251,0,0 // movaps 0xfb42(%rip),%xmm12 # 2cfc0 <_sk_overlay_sse2_8bit+0x11fc>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,78,251,0,0 // addps 0xfb4e(%rip),%xmm10 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
- .byte 68,15,40,37,86,251,0,0 // movaps 0xfb56(%rip),%xmm12 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
+ .byte 68,15,88,21,66,251,0,0 // addps 0xfb42(%rip),%xmm10 # 2cfd0 <_sk_overlay_sse2_8bit+0x120c>
+ .byte 68,15,40,37,74,251,0,0 // movaps 0xfb4a(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x121c>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -38213,22 +38205,22 @@ _sk_parametric_a_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,48,248,0,0 // movaps 0xf830(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,21,36,248,0,0 // movaps 0xf824(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,36,251,0,0 // addps 0xfb24(%rip),%xmm9 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
- .byte 68,15,40,37,44,251,0,0 // movaps 0xfb2c(%rip),%xmm12 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
+ .byte 68,15,88,13,24,251,0,0 // addps 0xfb18(%rip),%xmm9 # 2cff0 <_sk_overlay_sse2_8bit+0x122c>
+ .byte 68,15,40,37,32,251,0,0 // movaps 0xfb20(%rip),%xmm12 # 2d000 <_sk_overlay_sse2_8bit+0x123c>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,44,251,0,0 // movaps 0xfb2c(%rip),%xmm12 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
+ .byte 68,15,40,37,32,251,0,0 // movaps 0xfb20(%rip),%xmm12 # 2d010 <_sk_overlay_sse2_8bit+0x124c>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,48,251,0,0 // movaps 0xfb30(%rip),%xmm13 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
+ .byte 68,15,40,45,36,251,0,0 // movaps 0xfb24(%rip),%xmm13 # 2d020 <_sk_overlay_sse2_8bit+0x125c>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,48,251,0,0 // mulps 0xfb30(%rip),%xmm13 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
+ .byte 68,15,89,45,36,251,0,0 // mulps 0xfb24(%rip),%xmm13 # 2d030 <_sk_overlay_sse2_8bit+0x126c>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -38253,19 +38245,19 @@ _sk_gamma_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,5,59,250,0,0 // mulps 0xfa3b(%rip),%xmm0 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
- .byte 15,84,21,68,250,0,0 // andps 0xfa44(%rip),%xmm2 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
- .byte 68,15,40,53,92,247,0,0 // movaps 0xf75c(%rip),%xmm14 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 15,89,5,47,250,0,0 // mulps 0xfa2f(%rip),%xmm0 # 2cf90 <_sk_overlay_sse2_8bit+0x11cc>
+ .byte 15,84,21,56,250,0,0 // andps 0xfa38(%rip),%xmm2 # 2cfa0 <_sk_overlay_sse2_8bit+0x11dc>
+ .byte 68,15,40,53,96,247,0,0 // movaps 0xf760(%rip),%xmm14 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 65,15,86,214 // orps %xmm14,%xmm2
- .byte 68,15,40,37,64,250,0,0 // movaps 0xfa40(%rip),%xmm12 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
+ .byte 68,15,40,37,52,250,0,0 // movaps 0xfa34(%rip),%xmm12 # 2cfb0 <_sk_overlay_sse2_8bit+0x11ec>
.byte 65,15,88,196 // addps %xmm12,%xmm0
- .byte 68,15,40,29,68,250,0,0 // movaps 0xfa44(%rip),%xmm11 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
+ .byte 68,15,40,29,56,250,0,0 // movaps 0xfa38(%rip),%xmm11 # 2cfc0 <_sk_overlay_sse2_8bit+0x11fc>
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 65,15,89,227 // mulps %xmm11,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 68,15,40,21,66,250,0,0 // movaps 0xfa42(%rip),%xmm10 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
+ .byte 68,15,40,21,54,250,0,0 // movaps 0xfa36(%rip),%xmm10 # 2cfd0 <_sk_overlay_sse2_8bit+0x120c>
.byte 65,15,88,210 // addps %xmm10,%xmm2
- .byte 68,15,40,45,70,250,0,0 // movaps 0xfa46(%rip),%xmm13 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
+ .byte 68,15,40,45,58,250,0,0 // movaps 0xfa3a(%rip),%xmm13 # 2cfe0 <_sk_overlay_sse2_8bit+0x121c>
.byte 65,15,40,229 // movaps %xmm13,%xmm4
.byte 15,94,226 // divps %xmm2,%xmm4
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -38277,27 +38269,27 @@ _sk_gamma_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,194,226,1 // cmpltps %xmm2,%xmm4
- .byte 68,15,40,13,22,247,0,0 // movaps 0xf716(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,13,10,247,0,0 // movaps 0xf70a(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 65,15,84,225 // andps %xmm9,%xmm4
.byte 15,92,212 // subps %xmm4,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,53,18,250,0,0 // movaps 0xfa12(%rip),%xmm6 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
+ .byte 15,40,53,6,250,0,0 // movaps 0xfa06(%rip),%xmm6 # 2cff0 <_sk_overlay_sse2_8bit+0x122c>
.byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,40,61,40,250,0,0 // movaps 0xfa28(%rip),%xmm7 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
+ .byte 15,40,61,28,250,0,0 // movaps 0xfa1c(%rip),%xmm7 # 2d010 <_sk_overlay_sse2_8bit+0x124c>
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,37,8,250,0,0 // movaps 0xfa08(%rip),%xmm4 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
+ .byte 15,40,37,252,249,0,0 // movaps 0xf9fc(%rip),%xmm4 # 2d000 <_sk_overlay_sse2_8bit+0x123c>
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,92,194 // subps %xmm2,%xmm0
- .byte 68,15,40,61,26,250,0,0 // movaps 0xfa1a(%rip),%xmm15 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
+ .byte 68,15,40,61,14,250,0,0 // movaps 0xfa0e(%rip),%xmm15 # 2d020 <_sk_overlay_sse2_8bit+0x125c>
.byte 65,15,40,215 // movaps %xmm15,%xmm2
.byte 15,94,213 // divps %xmm5,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,5,118,249,0,0 // mulps 0xf976(%rip),%xmm0 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
- .byte 15,84,13,127,249,0,0 // andps 0xf97f(%rip),%xmm1 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
+ .byte 15,89,5,106,249,0,0 // mulps 0xf96a(%rip),%xmm0 # 2cf90 <_sk_overlay_sse2_8bit+0x11cc>
+ .byte 15,84,13,115,249,0,0 // andps 0xf973(%rip),%xmm1 # 2cfa0 <_sk_overlay_sse2_8bit+0x11dc>
.byte 65,15,86,206 // orps %xmm14,%xmm1
.byte 65,15,88,196 // addps %xmm12,%xmm0
.byte 15,40,233 // movaps %xmm1,%xmm5
@@ -38327,9 +38319,9 @@ _sk_gamma_sse2:
.byte 15,94,206 // divps %xmm6,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,5,5,249,0,0 // mulps 0xf905(%rip),%xmm0 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
- .byte 15,84,29,14,249,0,0 // andps 0xf90e(%rip),%xmm3 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
- .byte 15,86,29,39,246,0,0 // orps 0xf627(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 15,89,5,249,248,0,0 // mulps 0xf8f9(%rip),%xmm0 # 2cf90 <_sk_overlay_sse2_8bit+0x11cc>
+ .byte 15,84,29,2,249,0,0 // andps 0xf902(%rip),%xmm3 # 2cfa0 <_sk_overlay_sse2_8bit+0x11dc>
+ .byte 15,86,29,43,246,0,0 // orps 0xf62b(%rip),%xmm3 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 65,15,88,196 // addps %xmm12,%xmm0
.byte 68,15,89,219 // mulps %xmm3,%xmm11
.byte 65,15,92,195 // subps %xmm11,%xmm0
@@ -38351,7 +38343,7 @@ _sk_gamma_sse2:
.byte 15,92,253 // subps %xmm5,%xmm7
.byte 68,15,94,255 // divps %xmm7,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 15,40,5,68,249,0,0 // movaps 0xf944(%rip),%xmm0 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
+ .byte 15,40,5,56,249,0,0 // movaps 0xf938(%rip),%xmm0 # 2d030 <_sk_overlay_sse2_8bit+0x126c>
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 68,15,89,248 // mulps %xmm0,%xmm15
@@ -38370,29 +38362,29 @@ HIDDEN _sk_lab_to_xyz_sse2
.globl _sk_lab_to_xyz_sse2
FUNCTION(_sk_lab_to_xyz_sse2)
_sk_lab_to_xyz_sse2:
- .byte 15,89,5,25,249,0,0 // mulps 0xf919(%rip),%xmm0 # 2d060 <_sk_overlay_sse2_8bit+0x1288>
- .byte 68,15,40,5,145,246,0,0 // movaps 0xf691(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
+ .byte 15,89,5,13,249,0,0 // mulps 0xf90d(%rip),%xmm0 # 2d040 <_sk_overlay_sse2_8bit+0x127c>
+ .byte 68,15,40,5,133,246,0,0 // movaps 0xf685(%rip),%xmm8 # 2cdc0 <_sk_overlay_sse2_8bit+0xffc>
.byte 65,15,89,200 // mulps %xmm8,%xmm1
- .byte 68,15,40,13,21,249,0,0 // movaps 0xf915(%rip),%xmm9 # 2d070 <_sk_overlay_sse2_8bit+0x1298>
+ .byte 68,15,40,13,9,249,0,0 // movaps 0xf909(%rip),%xmm9 # 2d050 <_sk_overlay_sse2_8bit+0x128c>
.byte 65,15,88,201 // addps %xmm9,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 15,88,5,18,249,0,0 // addps 0xf912(%rip),%xmm0 # 2d080 <_sk_overlay_sse2_8bit+0x12a8>
- .byte 15,89,5,27,249,0,0 // mulps 0xf91b(%rip),%xmm0 # 2d090 <_sk_overlay_sse2_8bit+0x12b8>
- .byte 15,89,13,36,249,0,0 // mulps 0xf924(%rip),%xmm1 # 2d0a0 <_sk_overlay_sse2_8bit+0x12c8>
+ .byte 15,88,5,6,249,0,0 // addps 0xf906(%rip),%xmm0 # 2d060 <_sk_overlay_sse2_8bit+0x129c>
+ .byte 15,89,5,15,249,0,0 // mulps 0xf90f(%rip),%xmm0 # 2d070 <_sk_overlay_sse2_8bit+0x12ac>
+ .byte 15,89,13,24,249,0,0 // mulps 0xf918(%rip),%xmm1 # 2d080 <_sk_overlay_sse2_8bit+0x12bc>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,21,42,249,0,0 // mulps 0xf92a(%rip),%xmm2 # 2d0b0 <_sk_overlay_sse2_8bit+0x12d8>
+ .byte 15,89,21,30,249,0,0 // mulps 0xf91e(%rip),%xmm2 # 2d090 <_sk_overlay_sse2_8bit+0x12cc>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 68,15,92,202 // subps %xmm2,%xmm9
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
.byte 68,15,89,225 // mulps %xmm1,%xmm12
- .byte 15,40,21,31,249,0,0 // movaps 0xf91f(%rip),%xmm2 # 2d0c0 <_sk_overlay_sse2_8bit+0x12e8>
+ .byte 15,40,21,19,249,0,0 // movaps 0xf913(%rip),%xmm2 # 2d0a0 <_sk_overlay_sse2_8bit+0x12dc>
.byte 68,15,40,194 // movaps %xmm2,%xmm8
.byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8
- .byte 68,15,40,21,30,249,0,0 // movaps 0xf91e(%rip),%xmm10 # 2d0d0 <_sk_overlay_sse2_8bit+0x12f8>
+ .byte 68,15,40,21,18,249,0,0 // movaps 0xf912(%rip),%xmm10 # 2d0b0 <_sk_overlay_sse2_8bit+0x12ec>
.byte 65,15,88,202 // addps %xmm10,%xmm1
- .byte 68,15,40,29,34,249,0,0 // movaps 0xf922(%rip),%xmm11 # 2d0e0 <_sk_overlay_sse2_8bit+0x1308>
+ .byte 68,15,40,29,22,249,0,0 // movaps 0xf916(%rip),%xmm11 # 2d0c0 <_sk_overlay_sse2_8bit+0x12fc>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 69,15,84,224 // andps %xmm8,%xmm12
.byte 68,15,85,193 // andnps %xmm1,%xmm8
@@ -38416,8 +38408,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,84,194 // andps %xmm2,%xmm0
.byte 65,15,85,209 // andnps %xmm9,%xmm2
.byte 15,86,208 // orps %xmm0,%xmm2
- .byte 68,15,89,5,210,248,0,0 // mulps 0xf8d2(%rip),%xmm8 # 2d0f0 <_sk_overlay_sse2_8bit+0x1318>
- .byte 15,89,21,219,248,0,0 // mulps 0xf8db(%rip),%xmm2 # 2d100 <_sk_overlay_sse2_8bit+0x1328>
+ .byte 68,15,89,5,198,248,0,0 // mulps 0xf8c6(%rip),%xmm8 # 2d0d0 <_sk_overlay_sse2_8bit+0x130c>
+ .byte 15,89,21,207,248,0,0 // mulps 0xf8cf(%rip),%xmm2 # 2d0e0 <_sk_overlay_sse2_8bit+0x131c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -38433,13 +38425,13 @@ _sk_load_a8_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,46 // jne 1d873 <_sk_load_a8_sse2+0x46>
+ .byte 117,46 // jne 1d85f <_sk_load_a8_sse2+0x46>
.byte 102,67,15,110,4,16 // movd (%r8,%r10,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,85,245,0,0 // pand 0xf555(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,219,5,73,245,0,0 // pand 0xf549(%rip),%xmm0 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,155,246,0,0 // mulps 0xf69b(%rip),%xmm3 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 15,89,29,143,246,0,0 // mulps 0xf68f(%rip),%xmm3 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
@@ -38448,12 +38440,12 @@ _sk_load_a8_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,54 // je 1d8b6 <_sk_load_a8_sse2+0x89>
+ .byte 116,54 // je 1d8a2 <_sk_load_a8_sse2+0x89>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 1d89f <_sk_load_a8_sse2+0x72>
+ .byte 116,21 // je 1d88b <_sk_load_a8_sse2+0x72>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,195 // jne 1d853 <_sk_load_a8_sse2+0x26>
+ .byte 117,195 // jne 1d83f <_sk_load_a8_sse2+0x26>
.byte 67,15,182,68,16,2 // movzbl 0x2(%r8,%r10,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -38462,10 +38454,10 @@ _sk_load_a8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,157 // jmp 1d853 <_sk_load_a8_sse2+0x26>
+ .byte 235,157 // jmp 1d83f <_sk_load_a8_sse2+0x26>
.byte 67,15,182,4,16 // movzbl (%r8,%r10,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,146 // jmp 1d853 <_sk_load_a8_sse2+0x26>
+ .byte 235,146 // jmp 1d83f <_sk_load_a8_sse2+0x26>
HIDDEN _sk_load_a8_dst_sse2
.globl _sk_load_a8_dst_sse2
@@ -38478,13 +38470,13 @@ _sk_load_a8_dst_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,46 // jne 1d907 <_sk_load_a8_dst_sse2+0x46>
+ .byte 117,46 // jne 1d8f3 <_sk_load_a8_dst_sse2+0x46>
.byte 102,67,15,110,36,16 // movd (%r8,%r10,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,193,244,0,0 // pand 0xf4c1(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,219,37,181,244,0,0 // pand 0xf4b5(%rip),%xmm4 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,7,246,0,0 // mulps 0xf607(%rip),%xmm7 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 15,89,61,251,245,0,0 // mulps 0xf5fb(%rip),%xmm7 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
@@ -38493,12 +38485,12 @@ _sk_load_a8_dst_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,54 // je 1d94a <_sk_load_a8_dst_sse2+0x89>
+ .byte 116,54 // je 1d936 <_sk_load_a8_dst_sse2+0x89>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 1d933 <_sk_load_a8_dst_sse2+0x72>
+ .byte 116,21 // je 1d91f <_sk_load_a8_dst_sse2+0x72>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,195 // jne 1d8e7 <_sk_load_a8_dst_sse2+0x26>
+ .byte 117,195 // jne 1d8d3 <_sk_load_a8_dst_sse2+0x26>
.byte 67,15,182,68,16,2 // movzbl 0x2(%r8,%r10,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -38507,10 +38499,10 @@ _sk_load_a8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,157 // jmp 1d8e7 <_sk_load_a8_dst_sse2+0x26>
+ .byte 235,157 // jmp 1d8d3 <_sk_load_a8_dst_sse2+0x26>
.byte 67,15,182,4,16 // movzbl (%r8,%r10,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,146 // jmp 1d8e7 <_sk_load_a8_dst_sse2+0x26>
+ .byte 235,146 // jmp 1d8d3 <_sk_load_a8_dst_sse2+0x26>
HIDDEN _sk_gather_a8_sse2
.globl _sk_gather_a8_sse2
@@ -38550,7 +38542,7 @@ _sk_gather_a8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,22,245,0,0 // mulps 0xf516(%rip),%xmm3 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 15,89,29,10,245,0,0 // mulps 0xf50a(%rip),%xmm3 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -38567,7 +38559,7 @@ _sk_store_a8_sse2:
.byte 77,15,175,193 // imul %r9,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
- .byte 68,15,40,5,204,243,0,0 // movaps 0xf3cc(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
+ .byte 68,15,40,5,192,243,0,0 // movaps 0xf3c0(%rip),%xmm8 # 2cdc0 <_sk_overlay_sse2_8bit+0xffc>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,65,15,114,240,16 // pslld $0x10,%xmm8
@@ -38575,7 +38567,7 @@ _sk_store_a8_sse2:
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,13 // jne 1da45 <_sk_store_a8_sse2+0x4c>
+ .byte 117,13 // jne 1da31 <_sk_store_a8_sse2+0x4c>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 67,137,4,16 // mov %eax,(%r8,%r10,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -38585,24 +38577,24 @@ _sk_store_a8_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,59 // je 1da97 <_sk_store_a8_sse2+0x9e>
+ .byte 116,59 // je 1da83 <_sk_store_a8_sse2+0x9e>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,22 // je 1da78 <_sk_store_a8_sse2+0x7f>
+ .byte 116,22 // je 1da64 <_sk_store_a8_sse2+0x7f>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,217 // jne 1da41 <_sk_store_a8_sse2+0x48>
+ .byte 117,217 // jne 1da2d <_sk_store_a8_sse2+0x48>
.byte 102,68,15,127,68,36,232 // movdqa %xmm8,-0x18(%rsp)
.byte 138,68,36,240 // mov -0x10(%rsp),%al
.byte 67,136,68,16,2 // mov %al,0x2(%r8,%r10,1)
- .byte 102,68,15,219,5,47,243,0,0 // pand 0xf32f(%rip),%xmm8 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,68,15,219,5,35,243,0,0 // pand 0xf323(%rip),%xmm8 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,16 // mov %ax,(%r8,%r10,1)
- .byte 235,170 // jmp 1da41 <_sk_store_a8_sse2+0x48>
+ .byte 235,170 // jmp 1da2d <_sk_store_a8_sse2+0x48>
.byte 102,68,15,127,68,36,216 // movdqa %xmm8,-0x28(%rsp)
.byte 138,68,36,216 // mov -0x28(%rsp),%al
.byte 67,136,4,16 // mov %al,(%r8,%r10,1)
- .byte 235,153 // jmp 1da41 <_sk_store_a8_sse2+0x48>
+ .byte 235,153 // jmp 1da2d <_sk_store_a8_sse2+0x48>
HIDDEN _sk_load_g8_sse2
.globl _sk_load_g8_sse2
@@ -38615,27 +38607,27 @@ _sk_load_g8_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,49 // jne 1daf1 <_sk_load_g8_sse2+0x49>
+ .byte 117,49 // jne 1dadd <_sk_load_g8_sse2+0x49>
.byte 102,67,15,110,4,16 // movd (%r8,%r10,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,218,242,0,0 // pand 0xf2da(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,219,5,206,242,0,0 // pand 0xf2ce(%rip),%xmm0 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,32,244,0,0 // mulps 0xf420(%rip),%xmm0 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 15,89,5,20,244,0,0 // mulps 0xf414(%rip),%xmm0 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,23,242,0,0 // movaps 0xf217(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,11,242,0,0 // movaps 0xf20b(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,54 // je 1db34 <_sk_load_g8_sse2+0x8c>
+ .byte 116,54 // je 1db20 <_sk_load_g8_sse2+0x8c>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 1db1d <_sk_load_g8_sse2+0x75>
+ .byte 116,21 // je 1db09 <_sk_load_g8_sse2+0x75>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,192 // jne 1dace <_sk_load_g8_sse2+0x26>
+ .byte 117,192 // jne 1daba <_sk_load_g8_sse2+0x26>
.byte 67,15,182,68,16,2 // movzbl 0x2(%r8,%r10,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -38644,10 +38636,10 @@ _sk_load_g8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,154 // jmp 1dace <_sk_load_g8_sse2+0x26>
+ .byte 235,154 // jmp 1daba <_sk_load_g8_sse2+0x26>
.byte 67,15,182,4,16 // movzbl (%r8,%r10,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,143 // jmp 1dace <_sk_load_g8_sse2+0x26>
+ .byte 235,143 // jmp 1daba <_sk_load_g8_sse2+0x26>
HIDDEN _sk_load_g8_dst_sse2
.globl _sk_load_g8_dst_sse2
@@ -38660,27 +38652,27 @@ _sk_load_g8_dst_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,49 // jne 1db88 <_sk_load_g8_dst_sse2+0x49>
+ .byte 117,49 // jne 1db74 <_sk_load_g8_dst_sse2+0x49>
.byte 102,67,15,110,36,16 // movd (%r8,%r10,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,67,242,0,0 // pand 0xf243(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,219,37,55,242,0,0 // pand 0xf237(%rip),%xmm4 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,137,243,0,0 // mulps 0xf389(%rip),%xmm4 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 15,89,37,125,243,0,0 // mulps 0xf37d(%rip),%xmm4 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,128,241,0,0 // movaps 0xf180(%rip),%xmm7 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,61,116,241,0,0 // movaps 0xf174(%rip),%xmm7 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,54 // je 1dbcb <_sk_load_g8_dst_sse2+0x8c>
+ .byte 116,54 // je 1dbb7 <_sk_load_g8_dst_sse2+0x8c>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 1dbb4 <_sk_load_g8_dst_sse2+0x75>
+ .byte 116,21 // je 1dba0 <_sk_load_g8_dst_sse2+0x75>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,192 // jne 1db65 <_sk_load_g8_dst_sse2+0x26>
+ .byte 117,192 // jne 1db51 <_sk_load_g8_dst_sse2+0x26>
.byte 67,15,182,68,16,2 // movzbl 0x2(%r8,%r10,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -38689,10 +38681,10 @@ _sk_load_g8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,154 // jmp 1db65 <_sk_load_g8_dst_sse2+0x26>
+ .byte 235,154 // jmp 1db51 <_sk_load_g8_dst_sse2+0x26>
.byte 67,15,182,4,16 // movzbl (%r8,%r10,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,143 // jmp 1db65 <_sk_load_g8_dst_sse2+0x26>
+ .byte 235,143 // jmp 1db51 <_sk_load_g8_dst_sse2+0x26>
HIDDEN _sk_gather_g8_sse2
.globl _sk_gather_g8_sse2
@@ -38732,9 +38724,9 @@ _sk_gather_g8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,149,242,0,0 // mulps 0xf295(%rip),%xmm0 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 15,89,5,137,242,0,0 // mulps 0xf289(%rip),%xmm0 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,140,240,0,0 // movaps 0xf08c(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,128,240,0,0 // movaps 0xf080(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
@@ -38751,42 +38743,42 @@ _sk_load_565_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,83 // jne 1dcea <_sk_load_565_sse2+0x6e>
+ .byte 117,83 // jne 1dcd6 <_sk_load_565_sse2+0x6e>
.byte 243,67,15,126,20,80 // movq (%r8,%r10,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,103,242,0,0 // movdqa 0xf267(%rip),%xmm0 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
+ .byte 102,15,111,5,91,242,0,0 // movdqa 0xf25b(%rip),%xmm0 # 2cef0 <_sk_overlay_sse2_8bit+0x112c>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,105,242,0,0 // mulps 0xf269(%rip),%xmm0 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
- .byte 102,15,111,13,113,242,0,0 // movdqa 0xf271(%rip),%xmm1 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
+ .byte 15,89,5,93,242,0,0 // mulps 0xf25d(%rip),%xmm0 # 2cf00 <_sk_overlay_sse2_8bit+0x113c>
+ .byte 102,15,111,13,101,242,0,0 // movdqa 0xf265(%rip),%xmm1 # 2cf10 <_sk_overlay_sse2_8bit+0x114c>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,115,242,0,0 // mulps 0xf273(%rip),%xmm1 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
- .byte 102,15,219,21,123,242,0,0 // pand 0xf27b(%rip),%xmm2 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
+ .byte 15,89,13,103,242,0,0 // mulps 0xf267(%rip),%xmm1 # 2cf20 <_sk_overlay_sse2_8bit+0x115c>
+ .byte 102,15,219,21,111,242,0,0 // pand 0xf26f(%rip),%xmm2 # 2cf30 <_sk_overlay_sse2_8bit+0x116c>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,129,242,0,0 // mulps 0xf281(%rip),%xmm2 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
+ .byte 15,89,21,117,242,0,0 // mulps 0xf275(%rip),%xmm2 # 2cf40 <_sk_overlay_sse2_8bit+0x117c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,24,240,0,0 // movaps 0xf018(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,12,240,0,0 // movaps 0xf00c(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,50 // je 1dd29 <_sk_load_565_sse2+0xad>
+ .byte 116,50 // je 1dd15 <_sk_load_565_sse2+0xad>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 1dd16 <_sk_load_565_sse2+0x9a>
+ .byte 116,21 // je 1dd02 <_sk_load_565_sse2+0x9a>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,154 // jne 1dca1 <_sk_load_565_sse2+0x25>
+ .byte 117,154 // jne 1dc8d <_sk_load_565_sse2+0x25>
.byte 67,15,183,68,80,4 // movzwl 0x4(%r8,%r10,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,67,15,110,4,80 // movd (%r8,%r10,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,208 // movsd %xmm0,%xmm2
- .byte 233,120,255,255,255 // jmpq 1dca1 <_sk_load_565_sse2+0x25>
+ .byte 233,120,255,255,255 // jmpq 1dc8d <_sk_load_565_sse2+0x25>
.byte 67,15,183,4,80 // movzwl (%r8,%r10,2),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,106,255,255,255 // jmpq 1dca1 <_sk_load_565_sse2+0x25>
+ .byte 233,106,255,255,255 // jmpq 1dc8d <_sk_load_565_sse2+0x25>
HIDDEN _sk_load_565_dst_sse2
.globl _sk_load_565_dst_sse2
@@ -38800,42 +38792,42 @@ _sk_load_565_dst_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,83 // jne 1dda5 <_sk_load_565_dst_sse2+0x6e>
+ .byte 117,83 // jne 1dd91 <_sk_load_565_dst_sse2+0x6e>
.byte 243,67,15,126,52,80 // movq (%r8,%r10,2),%xmm6
.byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,37,172,241,0,0 // movdqa 0xf1ac(%rip),%xmm4 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
+ .byte 102,15,111,37,160,241,0,0 // movdqa 0xf1a0(%rip),%xmm4 # 2cef0 <_sk_overlay_sse2_8bit+0x112c>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,174,241,0,0 // mulps 0xf1ae(%rip),%xmm4 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
- .byte 102,15,111,45,182,241,0,0 // movdqa 0xf1b6(%rip),%xmm5 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
+ .byte 15,89,37,162,241,0,0 // mulps 0xf1a2(%rip),%xmm4 # 2cf00 <_sk_overlay_sse2_8bit+0x113c>
+ .byte 102,15,111,45,170,241,0,0 // movdqa 0xf1aa(%rip),%xmm5 # 2cf10 <_sk_overlay_sse2_8bit+0x114c>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,184,241,0,0 // mulps 0xf1b8(%rip),%xmm5 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
- .byte 102,15,219,53,192,241,0,0 // pand 0xf1c0(%rip),%xmm6 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
+ .byte 15,89,45,172,241,0,0 // mulps 0xf1ac(%rip),%xmm5 # 2cf20 <_sk_overlay_sse2_8bit+0x115c>
+ .byte 102,15,219,53,180,241,0,0 // pand 0xf1b4(%rip),%xmm6 # 2cf30 <_sk_overlay_sse2_8bit+0x116c>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,198,241,0,0 // mulps 0xf1c6(%rip),%xmm6 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
+ .byte 15,89,53,186,241,0,0 // mulps 0xf1ba(%rip),%xmm6 # 2cf40 <_sk_overlay_sse2_8bit+0x117c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,93,239,0,0 // movaps 0xef5d(%rip),%xmm7 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,61,81,239,0,0 // movaps 0xef51(%rip),%xmm7 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,50 // je 1dde4 <_sk_load_565_dst_sse2+0xad>
+ .byte 116,50 // je 1ddd0 <_sk_load_565_dst_sse2+0xad>
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 1ddd1 <_sk_load_565_dst_sse2+0x9a>
+ .byte 116,21 // je 1ddbd <_sk_load_565_dst_sse2+0x9a>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,154 // jne 1dd5c <_sk_load_565_dst_sse2+0x25>
+ .byte 117,154 // jne 1dd48 <_sk_load_565_dst_sse2+0x25>
.byte 67,15,183,68,80,4 // movzwl 0x4(%r8,%r10,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
.byte 102,67,15,110,36,80 // movd (%r8,%r10,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,244 // movsd %xmm4,%xmm6
- .byte 233,120,255,255,255 // jmpq 1dd5c <_sk_load_565_dst_sse2+0x25>
+ .byte 233,120,255,255,255 // jmpq 1dd48 <_sk_load_565_dst_sse2+0x25>
.byte 67,15,183,4,80 // movzwl (%r8,%r10,2),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,106,255,255,255 // jmpq 1dd5c <_sk_load_565_dst_sse2+0x25>
+ .byte 233,106,255,255,255 // jmpq 1dd48 <_sk_load_565_dst_sse2+0x25>
HIDDEN _sk_gather_565_sse2
.globl _sk_gather_565_sse2
@@ -38869,19 +38861,19 @@ _sk_gather_565_sse2:
.byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,152,240,0,0 // movdqa 0xf098(%rip),%xmm0 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
+ .byte 102,15,111,5,140,240,0,0 // movdqa 0xf08c(%rip),%xmm0 # 2cef0 <_sk_overlay_sse2_8bit+0x112c>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,154,240,0,0 // mulps 0xf09a(%rip),%xmm0 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
- .byte 102,15,111,13,162,240,0,0 // movdqa 0xf0a2(%rip),%xmm1 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
+ .byte 15,89,5,142,240,0,0 // mulps 0xf08e(%rip),%xmm0 # 2cf00 <_sk_overlay_sse2_8bit+0x113c>
+ .byte 102,15,111,13,150,240,0,0 // movdqa 0xf096(%rip),%xmm1 # 2cf10 <_sk_overlay_sse2_8bit+0x114c>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,164,240,0,0 // mulps 0xf0a4(%rip),%xmm1 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
- .byte 102,15,219,21,172,240,0,0 // pand 0xf0ac(%rip),%xmm2 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
+ .byte 15,89,13,152,240,0,0 // mulps 0xf098(%rip),%xmm1 # 2cf20 <_sk_overlay_sse2_8bit+0x115c>
+ .byte 102,15,219,21,160,240,0,0 // pand 0xf0a0(%rip),%xmm2 # 2cf30 <_sk_overlay_sse2_8bit+0x116c>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,178,240,0,0 // mulps 0xf0b2(%rip),%xmm2 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
+ .byte 15,89,21,166,240,0,0 // mulps 0xf0a6(%rip),%xmm2 # 2cf40 <_sk_overlay_sse2_8bit+0x117c>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,73,238,0,0 // movaps 0xee49(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,61,238,0,0 // movaps 0xee3d(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_sse2
@@ -38895,12 +38887,12 @@ _sk_store_565_sse2:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
- .byte 68,15,40,5,73,242,0,0 // movaps 0xf249(%rip),%xmm8 # 2d120 <_sk_overlay_sse2_8bit+0x1348>
+ .byte 68,15,40,5,61,242,0,0 // movaps 0xf23d(%rip),%xmm8 # 2d100 <_sk_overlay_sse2_8bit+0x133c>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,62,242,0,0 // movaps 0xf23e(%rip),%xmm10 # 2d130 <_sk_overlay_sse2_8bit+0x1358>
+ .byte 68,15,40,21,50,242,0,0 // movaps 0xf232(%rip),%xmm10 # 2d110 <_sk_overlay_sse2_8bit+0x134c>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -38912,7 +38904,7 @@ _sk_store_565_sse2:
.byte 102,65,15,114,224,16 // psrad $0x10,%xmm8
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 1df34 <_sk_store_565_sse2+0x7b>
+ .byte 117,10 // jne 1df20 <_sk_store_565_sse2+0x7b>
.byte 242,71,15,17,4,80 // movsd %xmm8,(%r8,%r10,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -38920,19 +38912,19 @@ _sk_store_565_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,38 // je 1df6c <_sk_store_565_sse2+0xb3>
+ .byte 116,38 // je 1df58 <_sk_store_565_sse2+0xb3>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 1df5e <_sk_store_565_sse2+0xa5>
+ .byte 116,18 // je 1df4a <_sk_store_565_sse2+0xa5>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,222 // jne 1df30 <_sk_store_565_sse2+0x77>
+ .byte 117,222 // jne 1df1c <_sk_store_565_sse2+0x77>
.byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax
.byte 102,67,137,68,80,4 // mov %ax,0x4(%r8,%r10,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,71,15,126,4,80 // movd %xmm8,(%r8,%r10,2)
- .byte 235,196 // jmp 1df30 <_sk_store_565_sse2+0x77>
+ .byte 235,196 // jmp 1df1c <_sk_store_565_sse2+0x77>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,80 // mov %ax,(%r8,%r10,2)
- .byte 235,184 // jmp 1df30 <_sk_store_565_sse2+0x77>
+ .byte 235,184 // jmp 1df1c <_sk_store_565_sse2+0x77>
HIDDEN _sk_load_4444_sse2
.globl _sk_load_4444_sse2
@@ -38946,45 +38938,45 @@ _sk_load_4444_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,98 // jne 1dff5 <_sk_load_4444_sse2+0x7d>
+ .byte 117,98 // jne 1dfe1 <_sk_load_4444_sse2+0x7d>
.byte 243,67,15,126,28,80 // movq (%r8,%r10,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,155,241,0,0 // movdqa 0xf19b(%rip),%xmm0 # 2d140 <_sk_overlay_sse2_8bit+0x1368>
+ .byte 102,15,111,5,143,241,0,0 // movdqa 0xf18f(%rip),%xmm0 # 2d120 <_sk_overlay_sse2_8bit+0x135c>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,157,241,0,0 // mulps 0xf19d(%rip),%xmm0 # 2d150 <_sk_overlay_sse2_8bit+0x1378>
- .byte 102,15,111,13,165,241,0,0 // movdqa 0xf1a5(%rip),%xmm1 # 2d160 <_sk_overlay_sse2_8bit+0x1388>
+ .byte 15,89,5,145,241,0,0 // mulps 0xf191(%rip),%xmm0 # 2d130 <_sk_overlay_sse2_8bit+0x136c>
+ .byte 102,15,111,13,153,241,0,0 // movdqa 0xf199(%rip),%xmm1 # 2d140 <_sk_overlay_sse2_8bit+0x137c>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,167,241,0,0 // mulps 0xf1a7(%rip),%xmm1 # 2d170 <_sk_overlay_sse2_8bit+0x1398>
- .byte 102,15,111,21,175,241,0,0 // movdqa 0xf1af(%rip),%xmm2 # 2d180 <_sk_overlay_sse2_8bit+0x13a8>
+ .byte 15,89,13,155,241,0,0 // mulps 0xf19b(%rip),%xmm1 # 2d150 <_sk_overlay_sse2_8bit+0x138c>
+ .byte 102,15,111,21,163,241,0,0 // movdqa 0xf1a3(%rip),%xmm2 # 2d160 <_sk_overlay_sse2_8bit+0x139c>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,177,241,0,0 // mulps 0xf1b1(%rip),%xmm2 # 2d190 <_sk_overlay_sse2_8bit+0x13b8>
- .byte 102,15,219,29,185,241,0,0 // pand 0xf1b9(%rip),%xmm3 # 2d1a0 <_sk_overlay_sse2_8bit+0x13c8>
+ .byte 15,89,21,165,241,0,0 // mulps 0xf1a5(%rip),%xmm2 # 2d170 <_sk_overlay_sse2_8bit+0x13ac>
+ .byte 102,15,219,29,173,241,0,0 // pand 0xf1ad(%rip),%xmm3 # 2d180 <_sk_overlay_sse2_8bit+0x13bc>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,191,241,0,0 // mulps 0xf1bf(%rip),%xmm3 # 2d1b0 <_sk_overlay_sse2_8bit+0x13d8>
+ .byte 15,89,29,179,241,0,0 // mulps 0xf1b3(%rip),%xmm3 # 2d190 <_sk_overlay_sse2_8bit+0x13cc>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,50 // je 1e034 <_sk_load_4444_sse2+0xbc>
+ .byte 116,50 // je 1e020 <_sk_load_4444_sse2+0xbc>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 1e021 <_sk_load_4444_sse2+0xa9>
+ .byte 116,21 // je 1e00d <_sk_load_4444_sse2+0xa9>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,139 // jne 1df9d <_sk_load_4444_sse2+0x25>
+ .byte 117,139 // jne 1df89 <_sk_load_4444_sse2+0x25>
.byte 67,15,183,68,80,4 // movzwl 0x4(%r8,%r10,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,67,15,110,4,80 // movd (%r8,%r10,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,216 // movsd %xmm0,%xmm3
- .byte 233,105,255,255,255 // jmpq 1df9d <_sk_load_4444_sse2+0x25>
+ .byte 233,105,255,255,255 // jmpq 1df89 <_sk_load_4444_sse2+0x25>
.byte 67,15,183,4,80 // movzwl (%r8,%r10,2),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 233,91,255,255,255 // jmpq 1df9d <_sk_load_4444_sse2+0x25>
+ .byte 233,91,255,255,255 // jmpq 1df89 <_sk_load_4444_sse2+0x25>
HIDDEN _sk_load_4444_dst_sse2
.globl _sk_load_4444_dst_sse2
@@ -38998,45 +38990,45 @@ _sk_load_4444_dst_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,98 // jne 1e0bf <_sk_load_4444_dst_sse2+0x7d>
+ .byte 117,98 // jne 1e0ab <_sk_load_4444_dst_sse2+0x7d>
.byte 243,67,15,126,60,80 // movq (%r8,%r10,2),%xmm7
.byte 102,15,97,248 // punpcklwd %xmm0,%xmm7
- .byte 102,15,111,37,209,240,0,0 // movdqa 0xf0d1(%rip),%xmm4 # 2d140 <_sk_overlay_sse2_8bit+0x1368>
+ .byte 102,15,111,37,197,240,0,0 // movdqa 0xf0c5(%rip),%xmm4 # 2d120 <_sk_overlay_sse2_8bit+0x135c>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,211,240,0,0 // mulps 0xf0d3(%rip),%xmm4 # 2d150 <_sk_overlay_sse2_8bit+0x1378>
- .byte 102,15,111,45,219,240,0,0 // movdqa 0xf0db(%rip),%xmm5 # 2d160 <_sk_overlay_sse2_8bit+0x1388>
+ .byte 15,89,37,199,240,0,0 // mulps 0xf0c7(%rip),%xmm4 # 2d130 <_sk_overlay_sse2_8bit+0x136c>
+ .byte 102,15,111,45,207,240,0,0 // movdqa 0xf0cf(%rip),%xmm5 # 2d140 <_sk_overlay_sse2_8bit+0x137c>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,221,240,0,0 // mulps 0xf0dd(%rip),%xmm5 # 2d170 <_sk_overlay_sse2_8bit+0x1398>
- .byte 102,15,111,53,229,240,0,0 // movdqa 0xf0e5(%rip),%xmm6 # 2d180 <_sk_overlay_sse2_8bit+0x13a8>
+ .byte 15,89,45,209,240,0,0 // mulps 0xf0d1(%rip),%xmm5 # 2d150 <_sk_overlay_sse2_8bit+0x138c>
+ .byte 102,15,111,53,217,240,0,0 // movdqa 0xf0d9(%rip),%xmm6 # 2d160 <_sk_overlay_sse2_8bit+0x139c>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,231,240,0,0 // mulps 0xf0e7(%rip),%xmm6 # 2d190 <_sk_overlay_sse2_8bit+0x13b8>
- .byte 102,15,219,61,239,240,0,0 // pand 0xf0ef(%rip),%xmm7 # 2d1a0 <_sk_overlay_sse2_8bit+0x13c8>
+ .byte 15,89,53,219,240,0,0 // mulps 0xf0db(%rip),%xmm6 # 2d170 <_sk_overlay_sse2_8bit+0x13ac>
+ .byte 102,15,219,61,227,240,0,0 // pand 0xf0e3(%rip),%xmm7 # 2d180 <_sk_overlay_sse2_8bit+0x13bc>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,245,240,0,0 // mulps 0xf0f5(%rip),%xmm7 # 2d1b0 <_sk_overlay_sse2_8bit+0x13d8>
+ .byte 15,89,61,233,240,0,0 // mulps 0xf0e9(%rip),%xmm7 # 2d190 <_sk_overlay_sse2_8bit+0x13cc>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,50 // je 1e0fe <_sk_load_4444_dst_sse2+0xbc>
+ .byte 116,50 // je 1e0ea <_sk_load_4444_dst_sse2+0xbc>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 1e0eb <_sk_load_4444_dst_sse2+0xa9>
+ .byte 116,21 // je 1e0d7 <_sk_load_4444_dst_sse2+0xa9>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,139 // jne 1e067 <_sk_load_4444_dst_sse2+0x25>
+ .byte 117,139 // jne 1e053 <_sk_load_4444_dst_sse2+0x25>
.byte 67,15,183,68,80,4 // movzwl 0x4(%r8,%r10,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 102,67,15,110,36,80 // movd (%r8,%r10,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,252 // movsd %xmm4,%xmm7
- .byte 233,105,255,255,255 // jmpq 1e067 <_sk_load_4444_dst_sse2+0x25>
+ .byte 233,105,255,255,255 // jmpq 1e053 <_sk_load_4444_dst_sse2+0x25>
.byte 67,15,183,4,80 // movzwl (%r8,%r10,2),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,91,255,255,255 // jmpq 1e067 <_sk_load_4444_dst_sse2+0x25>
+ .byte 233,91,255,255,255 // jmpq 1e053 <_sk_load_4444_dst_sse2+0x25>
HIDDEN _sk_gather_4444_sse2
.globl _sk_gather_4444_sse2
@@ -39070,21 +39062,21 @@ _sk_gather_4444_sse2:
.byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,174,239,0,0 // movdqa 0xefae(%rip),%xmm0 # 2d140 <_sk_overlay_sse2_8bit+0x1368>
+ .byte 102,15,111,5,162,239,0,0 // movdqa 0xefa2(%rip),%xmm0 # 2d120 <_sk_overlay_sse2_8bit+0x135c>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,176,239,0,0 // mulps 0xefb0(%rip),%xmm0 # 2d150 <_sk_overlay_sse2_8bit+0x1378>
- .byte 102,15,111,13,184,239,0,0 // movdqa 0xefb8(%rip),%xmm1 # 2d160 <_sk_overlay_sse2_8bit+0x1388>
+ .byte 15,89,5,164,239,0,0 // mulps 0xefa4(%rip),%xmm0 # 2d130 <_sk_overlay_sse2_8bit+0x136c>
+ .byte 102,15,111,13,172,239,0,0 // movdqa 0xefac(%rip),%xmm1 # 2d140 <_sk_overlay_sse2_8bit+0x137c>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,186,239,0,0 // mulps 0xefba(%rip),%xmm1 # 2d170 <_sk_overlay_sse2_8bit+0x1398>
- .byte 102,15,111,21,194,239,0,0 // movdqa 0xefc2(%rip),%xmm2 # 2d180 <_sk_overlay_sse2_8bit+0x13a8>
+ .byte 15,89,13,174,239,0,0 // mulps 0xefae(%rip),%xmm1 # 2d150 <_sk_overlay_sse2_8bit+0x138c>
+ .byte 102,15,111,21,182,239,0,0 // movdqa 0xefb6(%rip),%xmm2 # 2d160 <_sk_overlay_sse2_8bit+0x139c>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,196,239,0,0 // mulps 0xefc4(%rip),%xmm2 # 2d190 <_sk_overlay_sse2_8bit+0x13b8>
- .byte 102,15,219,29,204,239,0,0 // pand 0xefcc(%rip),%xmm3 # 2d1a0 <_sk_overlay_sse2_8bit+0x13c8>
+ .byte 15,89,21,184,239,0,0 // mulps 0xefb8(%rip),%xmm2 # 2d170 <_sk_overlay_sse2_8bit+0x13ac>
+ .byte 102,15,219,29,192,239,0,0 // pand 0xefc0(%rip),%xmm3 # 2d180 <_sk_overlay_sse2_8bit+0x13bc>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,210,239,0,0 // mulps 0xefd2(%rip),%xmm3 # 2d1b0 <_sk_overlay_sse2_8bit+0x13d8>
+ .byte 15,89,29,198,239,0,0 // mulps 0xefc6(%rip),%xmm3 # 2d190 <_sk_overlay_sse2_8bit+0x13cc>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39099,7 +39091,7 @@ _sk_store_4444_sse2:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
- .byte 68,15,40,5,192,239,0,0 // movaps 0xefc0(%rip),%xmm8 # 2d1c0 <_sk_overlay_sse2_8bit+0x13e8>
+ .byte 68,15,40,5,180,239,0,0 // movaps 0xefb4(%rip),%xmm8 # 2d1a0 <_sk_overlay_sse2_8bit+0x13dc>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -39121,7 +39113,7 @@ _sk_store_4444_sse2:
.byte 102,65,15,114,224,16 // psrad $0x10,%xmm8
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 1e271 <_sk_store_4444_sse2+0x8f>
+ .byte 117,10 // jne 1e25d <_sk_store_4444_sse2+0x8f>
.byte 242,71,15,17,4,80 // movsd %xmm8,(%r8,%r10,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39129,19 +39121,19 @@ _sk_store_4444_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,38 // je 1e2a9 <_sk_store_4444_sse2+0xc7>
+ .byte 116,38 // je 1e295 <_sk_store_4444_sse2+0xc7>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 1e29b <_sk_store_4444_sse2+0xb9>
+ .byte 116,18 // je 1e287 <_sk_store_4444_sse2+0xb9>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,222 // jne 1e26d <_sk_store_4444_sse2+0x8b>
+ .byte 117,222 // jne 1e259 <_sk_store_4444_sse2+0x8b>
.byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax
.byte 102,67,137,68,80,4 // mov %ax,0x4(%r8,%r10,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,71,15,126,4,80 // movd %xmm8,(%r8,%r10,2)
- .byte 235,196 // jmp 1e26d <_sk_store_4444_sse2+0x8b>
+ .byte 235,196 // jmp 1e259 <_sk_store_4444_sse2+0x8b>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,80 // mov %ax,(%r8,%r10,2)
- .byte 235,184 // jmp 1e26d <_sk_store_4444_sse2+0x8b>
+ .byte 235,184 // jmp 1e259 <_sk_store_4444_sse2+0x8b>
HIDDEN _sk_load_8888_sse2
.globl _sk_load_8888_sse2
@@ -39155,13 +39147,13 @@ _sk_load_8888_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,98 // jne 1e333 <_sk_load_8888_sse2+0x7e>
+ .byte 117,98 // jne 1e31f <_sk_load_8888_sse2+0x7e>
.byte 243,69,15,111,12,128 // movdqu (%r8,%rax,4),%xmm9
- .byte 102,15,111,21,209,234,0,0 // movdqa 0xead1(%rip),%xmm2 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,21,197,234,0,0 // movdqa 0xeac5(%rip),%xmm2 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,13,236,0,0 // movaps 0xec0d(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,5,1,236,0,0 // movaps 0xec01(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -39181,18 +39173,18 @@ _sk_load_8888_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,41 // je 1e369 <_sk_load_8888_sse2+0xb4>
+ .byte 116,41 // je 1e355 <_sk_load_8888_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,19 // je 1e35e <_sk_load_8888_sse2+0xa9>
+ .byte 116,19 // je 1e34a <_sk_load_8888_sse2+0xa9>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,134 // jne 1e2d7 <_sk_load_8888_sse2+0x22>
+ .byte 117,134 // jne 1e2c3 <_sk_load_8888_sse2+0x22>
.byte 102,65,15,110,68,128,8 // movd 0x8(%r8,%rax,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,128 // movlpd (%r8,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1e2d7 <_sk_load_8888_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1e2c3 <_sk_load_8888_sse2+0x22>
.byte 102,69,15,110,12,128 // movd (%r8,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1e2d7 <_sk_load_8888_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1e2c3 <_sk_load_8888_sse2+0x22>
HIDDEN _sk_load_8888_dst_sse2
.globl _sk_load_8888_dst_sse2
@@ -39206,13 +39198,13 @@ _sk_load_8888_dst_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,98 // jne 1e3f2 <_sk_load_8888_dst_sse2+0x7e>
+ .byte 117,98 // jne 1e3de <_sk_load_8888_dst_sse2+0x7e>
.byte 243,69,15,111,12,128 // movdqu (%r8,%rax,4),%xmm9
- .byte 102,15,111,53,18,234,0,0 // movdqa 0xea12(%rip),%xmm6 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,53,6,234,0,0 // movdqa 0xea06(%rip),%xmm6 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,65,15,111,225 // movdqa %xmm9,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,78,235,0,0 // movaps 0xeb4e(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,5,66,235,0,0 // movaps 0xeb42(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -39232,18 +39224,18 @@ _sk_load_8888_dst_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,41 // je 1e428 <_sk_load_8888_dst_sse2+0xb4>
+ .byte 116,41 // je 1e414 <_sk_load_8888_dst_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,19 // je 1e41d <_sk_load_8888_dst_sse2+0xa9>
+ .byte 116,19 // je 1e409 <_sk_load_8888_dst_sse2+0xa9>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,134 // jne 1e396 <_sk_load_8888_dst_sse2+0x22>
+ .byte 117,134 // jne 1e382 <_sk_load_8888_dst_sse2+0x22>
.byte 102,65,15,110,100,128,8 // movd 0x8(%r8,%rax,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,69,15,18,12,128 // movlpd (%r8,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1e396 <_sk_load_8888_dst_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1e382 <_sk_load_8888_dst_sse2+0x22>
.byte 102,69,15,110,12,128 // movd (%r8,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1e396 <_sk_load_8888_dst_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1e382 <_sk_load_8888_dst_sse2+0x22>
HIDDEN _sk_gather_8888_sse2
.globl _sk_gather_8888_sse2
@@ -39276,11 +39268,11 @@ _sk_gather_8888_sse2:
.byte 102,67,15,110,12,136 // movd (%r8,%r9,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,21,252,232,0,0 // movdqa 0xe8fc(%rip),%xmm2 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,21,240,232,0,0 // movdqa 0xe8f0(%rip),%xmm2 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,56,234,0,0 // movaps 0xea38(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,5,44,234,0,0 // movaps 0xea2c(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -39309,7 +39301,7 @@ _sk_store_8888_sse2:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,185,232,0,0 // movaps 0xe8b9(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
+ .byte 68,15,40,5,173,232,0,0 // movaps 0xe8ad(%rip),%xmm8 # 2cdc0 <_sk_overlay_sse2_8bit+0xffc>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -39328,24 +39320,24 @@ _sk_store_8888_sse2:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 1e587 <_sk_store_8888_sse2+0x7f>
+ .byte 117,10 // jne 1e573 <_sk_store_8888_sse2+0x7f>
.byte 243,69,15,127,4,128 // movdqu %xmm8,(%r8,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,33 // je 1e5b5 <_sk_store_8888_sse2+0xad>
+ .byte 116,33 // je 1e5a1 <_sk_store_8888_sse2+0xad>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,19 // je 1e5ad <_sk_store_8888_sse2+0xa5>
+ .byte 116,19 // je 1e599 <_sk_store_8888_sse2+0xa5>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,227 // jne 1e583 <_sk_store_8888_sse2+0x7b>
+ .byte 117,227 // jne 1e56f <_sk_store_8888_sse2+0x7b>
.byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
.byte 102,69,15,126,76,128,8 // movd %xmm9,0x8(%r8,%rax,4)
.byte 102,69,15,214,4,128 // movq %xmm8,(%r8,%rax,4)
- .byte 235,206 // jmp 1e583 <_sk_store_8888_sse2+0x7b>
+ .byte 235,206 // jmp 1e56f <_sk_store_8888_sse2+0x7b>
.byte 102,69,15,126,4,128 // movd %xmm8,(%r8,%rax,4)
- .byte 235,198 // jmp 1e583 <_sk_store_8888_sse2+0x7b>
+ .byte 235,198 // jmp 1e56f <_sk_store_8888_sse2+0x7b>
HIDDEN _sk_load_bgra_sse2
.globl _sk_load_bgra_sse2
@@ -39359,13 +39351,13 @@ _sk_load_bgra_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,98 // jne 1e63b <_sk_load_bgra_sse2+0x7e>
+ .byte 117,98 // jne 1e627 <_sk_load_bgra_sse2+0x7e>
.byte 243,69,15,111,12,128 // movdqu (%r8,%rax,4),%xmm9
- .byte 102,15,111,5,201,231,0,0 // movdqa 0xe7c9(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,5,189,231,0,0 // movdqa 0xe7bd(%rip),%xmm0 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,5,233,0,0 // movaps 0xe905(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,5,249,232,0,0 // movaps 0xe8f9(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -39385,18 +39377,18 @@ _sk_load_bgra_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,41 // je 1e671 <_sk_load_bgra_sse2+0xb4>
+ .byte 116,41 // je 1e65d <_sk_load_bgra_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,19 // je 1e666 <_sk_load_bgra_sse2+0xa9>
+ .byte 116,19 // je 1e652 <_sk_load_bgra_sse2+0xa9>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,134 // jne 1e5df <_sk_load_bgra_sse2+0x22>
+ .byte 117,134 // jne 1e5cb <_sk_load_bgra_sse2+0x22>
.byte 102,65,15,110,68,128,8 // movd 0x8(%r8,%rax,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,128 // movlpd (%r8,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1e5df <_sk_load_bgra_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1e5cb <_sk_load_bgra_sse2+0x22>
.byte 102,69,15,110,12,128 // movd (%r8,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1e5df <_sk_load_bgra_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1e5cb <_sk_load_bgra_sse2+0x22>
HIDDEN _sk_load_bgra_dst_sse2
.globl _sk_load_bgra_dst_sse2
@@ -39410,13 +39402,13 @@ _sk_load_bgra_dst_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,98 // jne 1e6fa <_sk_load_bgra_dst_sse2+0x7e>
+ .byte 117,98 // jne 1e6e6 <_sk_load_bgra_dst_sse2+0x7e>
.byte 243,69,15,111,12,128 // movdqu (%r8,%rax,4),%xmm9
- .byte 102,15,111,37,10,231,0,0 // movdqa 0xe70a(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,37,254,230,0,0 // movdqa 0xe6fe(%rip),%xmm4 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,245 // cvtdq2ps %xmm5,%xmm6
- .byte 68,15,40,5,70,232,0,0 // movaps 0xe846(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,5,58,232,0,0 // movaps 0xe83a(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -39436,18 +39428,18 @@ _sk_load_bgra_dst_sse2:
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,41 // je 1e730 <_sk_load_bgra_dst_sse2+0xb4>
+ .byte 116,41 // je 1e71c <_sk_load_bgra_dst_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,19 // je 1e725 <_sk_load_bgra_dst_sse2+0xa9>
+ .byte 116,19 // je 1e711 <_sk_load_bgra_dst_sse2+0xa9>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,134 // jne 1e69e <_sk_load_bgra_dst_sse2+0x22>
+ .byte 117,134 // jne 1e68a <_sk_load_bgra_dst_sse2+0x22>
.byte 102,65,15,110,100,128,8 // movd 0x8(%r8,%rax,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,69,15,18,12,128 // movlpd (%r8,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1e69e <_sk_load_bgra_dst_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1e68a <_sk_load_bgra_dst_sse2+0x22>
.byte 102,69,15,110,12,128 // movd (%r8,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1e69e <_sk_load_bgra_dst_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1e68a <_sk_load_bgra_dst_sse2+0x22>
HIDDEN _sk_gather_bgra_sse2
.globl _sk_gather_bgra_sse2
@@ -39480,11 +39472,11 @@ _sk_gather_bgra_sse2:
.byte 102,67,15,110,12,136 // movd (%r8,%r9,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,5,244,229,0,0 // movdqa 0xe5f4(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
+ .byte 102,15,111,5,232,229,0,0 // movdqa 0xe5e8(%rip),%xmm0 # 2cd90 <_sk_overlay_sse2_8bit+0xfcc>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,48,231,0,0 // movaps 0xe730(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
+ .byte 68,15,40,5,36,231,0,0 // movaps 0xe724(%rip),%xmm8 # 2cee0 <_sk_overlay_sse2_8bit+0x111c>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -39513,7 +39505,7 @@ _sk_store_bgra_sse2:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,177,229,0,0 // movaps 0xe5b1(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
+ .byte 68,15,40,5,165,229,0,0 // movaps 0xe5a5(%rip),%xmm8 # 2cdc0 <_sk_overlay_sse2_8bit+0xffc>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -39532,24 +39524,24 @@ _sk_store_bgra_sse2:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 1e88f <_sk_store_bgra_sse2+0x7f>
+ .byte 117,10 // jne 1e87b <_sk_store_bgra_sse2+0x7f>
.byte 243,69,15,127,4,128 // movdqu %xmm8,(%r8,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,33 // je 1e8bd <_sk_store_bgra_sse2+0xad>
+ .byte 116,33 // je 1e8a9 <_sk_store_bgra_sse2+0xad>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,19 // je 1e8b5 <_sk_store_bgra_sse2+0xa5>
+ .byte 116,19 // je 1e8a1 <_sk_store_bgra_sse2+0xa5>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,227 // jne 1e88b <_sk_store_bgra_sse2+0x7b>
+ .byte 117,227 // jne 1e877 <_sk_store_bgra_sse2+0x7b>
.byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
.byte 102,69,15,126,76,128,8 // movd %xmm9,0x8(%r8,%rax,4)
.byte 102,69,15,214,4,128 // movq %xmm8,(%r8,%rax,4)
- .byte 235,206 // jmp 1e88b <_sk_store_bgra_sse2+0x7b>
+ .byte 235,206 // jmp 1e877 <_sk_store_bgra_sse2+0x7b>
.byte 102,69,15,126,4,128 // movd %xmm8,(%r8,%rax,4)
- .byte 235,198 // jmp 1e88b <_sk_store_bgra_sse2+0x7b>
+ .byte 235,198 // jmp 1e877 <_sk_store_bgra_sse2+0x7b>
HIDDEN _sk_load_f16_sse2
.globl _sk_load_f16_sse2
@@ -39563,7 +39555,7 @@ _sk_load_f16_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,98,1,0,0 // jne 1ea47 <_sk_load_f16_sse2+0x182>
+ .byte 15,133,98,1,0,0 // jne 1ea33 <_sk_load_f16_sse2+0x182>
.byte 102,65,15,16,4,192 // movupd (%r8,%rax,8),%xmm0
.byte 102,65,15,16,76,192,16 // movupd 0x10(%r8,%rax,8),%xmm1
.byte 102,68,15,40,192 // movapd %xmm0,%xmm8
@@ -39575,7 +39567,7 @@ _sk_load_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,169,232,0,0 // movdqa 0xe8a9(%rip),%xmm9 # 2d1d0 <_sk_overlay_sse2_8bit+0x13f8>
+ .byte 102,68,15,111,13,157,232,0,0 // movdqa 0xe89d(%rip),%xmm9 # 2d1b0 <_sk_overlay_sse2_8bit+0x13ec>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -39583,11 +39575,11 @@ _sk_load_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,158,232,0,0 // movdqa 0xe89e(%rip),%xmm11 # 2d1f0 <_sk_overlay_sse2_8bit+0x1418>
+ .byte 102,68,15,111,29,146,232,0,0 // movdqa 0xe892(%rip),%xmm11 # 2d1d0 <_sk_overlay_sse2_8bit+0x140c>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,160,232,0,0 // movdqa 0xe8a0(%rip),%xmm12 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
+ .byte 102,68,15,111,37,148,232,0,0 // movdqa 0xe894(%rip),%xmm12 # 2d1e0 <_sk_overlay_sse2_8bit+0x141c>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,67,234,0,0 // movdqa 0xea43(%rip),%xmm3 # 2d3b0 <_sk_overlay_sse2_8bit+0x15d8>
+ .byte 102,15,111,29,55,234,0,0 // movdqa 0xea37(%rip),%xmm3 # 2d390 <_sk_overlay_sse2_8bit+0x15cc>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -39635,17 +39627,17 @@ _sk_load_f16_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,192 // movsd (%r8,%rax,8),%xmm0
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,17 // jne 1ea64 <_sk_load_f16_sse2+0x19f>
+ .byte 117,17 // jne 1ea50 <_sk_load_f16_sse2+0x19f>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,142,254,255,255 // jmpq 1e8f2 <_sk_load_f16_sse2+0x2d>
+ .byte 233,142,254,255,255 // jmpq 1e8de <_sk_load_f16_sse2+0x2d>
.byte 102,65,15,22,68,192,8 // movhpd 0x8(%r8,%rax,8),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 15,130,121,254,255,255 // jb 1e8f2 <_sk_load_f16_sse2+0x2d>
+ .byte 15,130,121,254,255,255 // jb 1e8de <_sk_load_f16_sse2+0x2d>
.byte 242,65,15,16,76,192,16 // movsd 0x10(%r8,%rax,8),%xmm1
- .byte 233,109,254,255,255 // jmpq 1e8f2 <_sk_load_f16_sse2+0x2d>
+ .byte 233,109,254,255,255 // jmpq 1e8de <_sk_load_f16_sse2+0x2d>
HIDDEN _sk_load_f16_dst_sse2
.globl _sk_load_f16_dst_sse2
@@ -39659,7 +39651,7 @@ _sk_load_f16_dst_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,98,1,0,0 // jne 1ec07 <_sk_load_f16_dst_sse2+0x182>
+ .byte 15,133,98,1,0,0 // jne 1ebf3 <_sk_load_f16_dst_sse2+0x182>
.byte 102,65,15,16,36,192 // movupd (%r8,%rax,8),%xmm4
.byte 102,65,15,16,108,192,16 // movupd 0x10(%r8,%rax,8),%xmm5
.byte 102,68,15,40,196 // movapd %xmm4,%xmm8
@@ -39671,7 +39663,7 @@ _sk_load_f16_dst_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,238 // movdqa %xmm14,%xmm5
.byte 102,65,15,97,234 // punpcklwd %xmm10,%xmm5
- .byte 102,68,15,111,13,233,230,0,0 // movdqa 0xe6e9(%rip),%xmm9 # 2d1d0 <_sk_overlay_sse2_8bit+0x13f8>
+ .byte 102,68,15,111,13,221,230,0,0 // movdqa 0xe6dd(%rip),%xmm9 # 2d1b0 <_sk_overlay_sse2_8bit+0x13ec>
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,65,15,219,225 // pand %xmm9,%xmm4
.byte 102,15,239,236 // pxor %xmm4,%xmm5
@@ -39679,11 +39671,11 @@ _sk_load_f16_dst_sse2:
.byte 102,68,15,111,237 // movdqa %xmm5,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,236 // por %xmm4,%xmm13
- .byte 102,68,15,111,29,222,230,0,0 // movdqa 0xe6de(%rip),%xmm11 # 2d1f0 <_sk_overlay_sse2_8bit+0x1418>
+ .byte 102,68,15,111,29,210,230,0,0 // movdqa 0xe6d2(%rip),%xmm11 # 2d1d0 <_sk_overlay_sse2_8bit+0x140c>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,224,230,0,0 // movdqa 0xe6e0(%rip),%xmm12 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
+ .byte 102,68,15,111,37,212,230,0,0 // movdqa 0xe6d4(%rip),%xmm12 # 2d1e0 <_sk_overlay_sse2_8bit+0x141c>
.byte 102,65,15,239,236 // pxor %xmm12,%xmm5
- .byte 102,15,111,61,131,232,0,0 // movdqa 0xe883(%rip),%xmm7 # 2d3b0 <_sk_overlay_sse2_8bit+0x15d8>
+ .byte 102,15,111,61,119,232,0,0 // movdqa 0xe877(%rip),%xmm7 # 2d390 <_sk_overlay_sse2_8bit+0x15cc>
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,102,229 // pcmpgtd %xmm5,%xmm4
.byte 102,65,15,223,229 // pandn %xmm13,%xmm4
@@ -39731,17 +39723,17 @@ _sk_load_f16_dst_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,36,192 // movsd (%r8,%rax,8),%xmm4
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,17 // jne 1ec24 <_sk_load_f16_dst_sse2+0x19f>
+ .byte 117,17 // jne 1ec10 <_sk_load_f16_dst_sse2+0x19f>
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
.byte 102,15,20,229 // unpcklpd %xmm5,%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
- .byte 233,142,254,255,255 // jmpq 1eab2 <_sk_load_f16_dst_sse2+0x2d>
+ .byte 233,142,254,255,255 // jmpq 1ea9e <_sk_load_f16_dst_sse2+0x2d>
.byte 102,65,15,22,100,192,8 // movhpd 0x8(%r8,%rax,8),%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 15,130,121,254,255,255 // jb 1eab2 <_sk_load_f16_dst_sse2+0x2d>
+ .byte 15,130,121,254,255,255 // jb 1ea9e <_sk_load_f16_dst_sse2+0x2d>
.byte 242,65,15,16,108,192,16 // movsd 0x10(%r8,%rax,8),%xmm5
- .byte 233,109,254,255,255 // jmpq 1eab2 <_sk_load_f16_dst_sse2+0x2d>
+ .byte 233,109,254,255,255 // jmpq 1ea9e <_sk_load_f16_dst_sse2+0x2d>
HIDDEN _sk_gather_f16_sse2
.globl _sk_gather_f16_sse2
@@ -39782,7 +39774,7 @@ _sk_gather_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,227,228,0,0 // movdqa 0xe4e3(%rip),%xmm9 # 2d1d0 <_sk_overlay_sse2_8bit+0x13f8>
+ .byte 102,68,15,111,13,215,228,0,0 // movdqa 0xe4d7(%rip),%xmm9 # 2d1b0 <_sk_overlay_sse2_8bit+0x13ec>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -39790,11 +39782,11 @@ _sk_gather_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,216,228,0,0 // movdqa 0xe4d8(%rip),%xmm11 # 2d1f0 <_sk_overlay_sse2_8bit+0x1418>
+ .byte 102,68,15,111,29,204,228,0,0 // movdqa 0xe4cc(%rip),%xmm11 # 2d1d0 <_sk_overlay_sse2_8bit+0x140c>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,218,228,0,0 // movdqa 0xe4da(%rip),%xmm12 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
+ .byte 102,68,15,111,37,206,228,0,0 // movdqa 0xe4ce(%rip),%xmm12 # 2d1e0 <_sk_overlay_sse2_8bit+0x141c>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,125,230,0,0 // movdqa 0xe67d(%rip),%xmm3 # 2d3b0 <_sk_overlay_sse2_8bit+0x15d8>
+ .byte 102,15,111,29,113,230,0,0 // movdqa 0xe671(%rip),%xmm3 # 2d390 <_sk_overlay_sse2_8bit+0x15cc>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -39852,17 +39844,17 @@ _sk_store_f16_sse2:
.byte 73,193,224,3 // shl $0x3,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,211,227,0,0 // movdqa 0xe3d3(%rip),%xmm10 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
+ .byte 102,68,15,111,21,199,227,0,0 // movdqa 0xe3c7(%rip),%xmm10 # 2d1e0 <_sk_overlay_sse2_8bit+0x141c>
.byte 102,68,15,111,224 // movdqa %xmm0,%xmm12
.byte 102,69,15,219,226 // pand %xmm10,%xmm12
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,236 // pxor %xmm12,%xmm13
- .byte 102,68,15,111,13,198,227,0,0 // movdqa 0xe3c6(%rip),%xmm9 # 2d210 <_sk_overlay_sse2_8bit+0x1438>
+ .byte 102,68,15,111,13,186,227,0,0 // movdqa 0xe3ba(%rip),%xmm9 # 2d1f0 <_sk_overlay_sse2_8bit+0x142c>
.byte 102,65,15,114,212,16 // psrld $0x10,%xmm12
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,29,183,227,0,0 // movdqa 0xe3b7(%rip),%xmm11 # 2d220 <_sk_overlay_sse2_8bit+0x1448>
+ .byte 102,68,15,111,29,171,227,0,0 // movdqa 0xe3ab(%rip),%xmm11 # 2d200 <_sk_overlay_sse2_8bit+0x143c>
.byte 102,69,15,235,227 // por %xmm11,%xmm12
.byte 102,69,15,254,229 // paddd %xmm13,%xmm12
.byte 102,65,15,114,244,16 // pslld $0x10,%xmm12
@@ -39914,7 +39906,7 @@ _sk_store_f16_sse2:
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,69,15,98,204 // punpckldq %xmm12,%xmm9
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,21 // jne 1ef8b <_sk_store_f16_sse2+0x17e>
+ .byte 117,21 // jne 1ef77 <_sk_store_f16_sse2+0x17e>
.byte 69,15,17,12,192 // movups %xmm9,(%r8,%rax,8)
.byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8
.byte 243,69,15,127,68,192,16 // movdqu %xmm8,0x10(%r8,%rax,8)
@@ -39922,13 +39914,13 @@ _sk_store_f16_sse2:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,12,192 // movq %xmm9,(%r8,%rax,8)
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,240 // je 1ef87 <_sk_store_f16_sse2+0x17a>
+ .byte 116,240 // je 1ef73 <_sk_store_f16_sse2+0x17a>
.byte 102,69,15,23,76,192,8 // movhpd %xmm9,0x8(%r8,%rax,8)
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,227 // jb 1ef87 <_sk_store_f16_sse2+0x17a>
+ .byte 114,227 // jb 1ef73 <_sk_store_f16_sse2+0x17a>
.byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8
.byte 102,69,15,214,68,192,16 // movq %xmm8,0x10(%r8,%rax,8)
- .byte 235,213 // jmp 1ef87 <_sk_store_f16_sse2+0x17a>
+ .byte 235,213 // jmp 1ef73 <_sk_store_f16_sse2+0x17a>
HIDDEN _sk_load_u16_be_sse2
.globl _sk_load_u16_be_sse2
@@ -39943,7 +39935,7 @@ _sk_load_u16_be_sse2:
.byte 76,3,0 // add (%rax),%r8
.byte 73,99,193 // movslq %r9d,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,190,0,0,0 // jne 1f097 <_sk_load_u16_be_sse2+0xe5>
+ .byte 15,133,190,0,0,0 // jne 1f083 <_sk_load_u16_be_sse2+0xe5>
.byte 102,65,15,16,4,64 // movupd (%r8,%rax,2),%xmm0
.byte 102,65,15,16,76,64,16 // movupd 0x10(%r8,%rax,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -39960,7 +39952,7 @@ _sk_load_u16_be_sse2:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,5,102,223,0,0 // movaps 0xdf66(%rip),%xmm8 # 2cf90 <_sk_overlay_sse2_8bit+0x11b8>
+ .byte 68,15,40,5,90,223,0,0 // movaps 0xdf5a(%rip),%xmm8 # 2cf70 <_sk_overlay_sse2_8bit+0x11ac>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -39988,17 +39980,17 @@ _sk_load_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,64 // movsd (%r8,%rax,2),%xmm0
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,17 // jne 1f0b4 <_sk_load_u16_be_sse2+0x102>
+ .byte 117,17 // jne 1f0a0 <_sk_load_u16_be_sse2+0x102>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,50,255,255,255 // jmpq 1efe6 <_sk_load_u16_be_sse2+0x34>
+ .byte 233,50,255,255,255 // jmpq 1efd2 <_sk_load_u16_be_sse2+0x34>
.byte 102,65,15,22,68,64,8 // movhpd 0x8(%r8,%rax,2),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 15,130,29,255,255,255 // jb 1efe6 <_sk_load_u16_be_sse2+0x34>
+ .byte 15,130,29,255,255,255 // jb 1efd2 <_sk_load_u16_be_sse2+0x34>
.byte 242,65,15,16,76,64,16 // movsd 0x10(%r8,%rax,2),%xmm1
- .byte 233,17,255,255,255 // jmpq 1efe6 <_sk_load_u16_be_sse2+0x34>
+ .byte 233,17,255,255,255 // jmpq 1efd2 <_sk_load_u16_be_sse2+0x34>
HIDDEN _sk_load_rgb_u16_be_sse2
.globl _sk_load_rgb_u16_be_sse2
@@ -40015,7 +40007,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,175,0,0,0 // jne 1f1af <_sk_load_rgb_u16_be_sse2+0xda>
+ .byte 15,133,175,0,0,0 // jne 1f19b <_sk_load_rgb_u16_be_sse2+0xda>
.byte 243,65,15,111,20,64 // movdqu (%r8,%rax,2),%xmm2
.byte 243,65,15,111,92,64,8 // movdqu 0x8(%r8,%rax,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -40036,7 +40028,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,65,15,97,200 // punpcklwd %xmm8,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,13,44,222,0,0 // movaps 0xde2c(%rip),%xmm9 # 2cf90 <_sk_overlay_sse2_8bit+0x11b8>
+ .byte 68,15,40,13,32,222,0,0 // movaps 0xde20(%rip),%xmm9 # 2cf70 <_sk_overlay_sse2_8bit+0x11ac>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -40053,27 +40045,27 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,83,219,0,0 // movaps 0xdb53(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,71,219,0,0 // movaps 0xdb47(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,64 // movd (%r8,%rax,2),%xmm2
.byte 102,65,15,196,84,64,4,2 // pinsrw $0x2,0x4(%r8,%rax,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,13 // jne 1f1d4 <_sk_load_rgb_u16_be_sse2+0xff>
+ .byte 117,13 // jne 1f1c0 <_sk_load_rgb_u16_be_sse2+0xff>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,80,255,255,255 // jmpq 1f124 <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,80,255,255,255 // jmpq 1f110 <_sk_load_rgb_u16_be_sse2+0x4f>
.byte 102,65,15,110,68,64,6 // movd 0x6(%r8,%rax,2),%xmm0
.byte 102,65,15,196,68,64,10,2 // pinsrw $0x2,0xa(%r8,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,24 // jb 1f205 <_sk_load_rgb_u16_be_sse2+0x130>
+ .byte 114,24 // jb 1f1f1 <_sk_load_rgb_u16_be_sse2+0x130>
.byte 102,65,15,110,92,64,12 // movd 0xc(%r8,%rax,2),%xmm3
.byte 102,65,15,196,92,64,16,2 // pinsrw $0x2,0x10(%r8,%rax,2),%xmm3
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,31,255,255,255 // jmpq 1f124 <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,31,255,255,255 // jmpq 1f110 <_sk_load_rgb_u16_be_sse2+0x4f>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,22,255,255,255 // jmpq 1f124 <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,22,255,255,255 // jmpq 1f110 <_sk_load_rgb_u16_be_sse2+0x4f>
HIDDEN _sk_store_u16_be_sse2
.globl _sk_store_u16_be_sse2
@@ -40087,7 +40079,7 @@ _sk_store_u16_be_sse2:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 73,99,193 // movslq %r9d,%rax
- .byte 68,15,40,21,252,223,0,0 // movaps 0xdffc(%rip),%xmm10 # 2d230 <_sk_overlay_sse2_8bit+0x1458>
+ .byte 68,15,40,21,240,223,0,0 // movaps 0xdff0(%rip),%xmm10 # 2d210 <_sk_overlay_sse2_8bit+0x144c>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -40132,7 +40124,7 @@ _sk_store_u16_be_sse2:
.byte 102,69,15,111,208 // movdqa %xmm8,%xmm10
.byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,21 // jne 1f32e <_sk_store_u16_be_sse2+0x120>
+ .byte 117,21 // jne 1f31a <_sk_store_u16_be_sse2+0x120>
.byte 69,15,17,20,64 // movups %xmm10,(%r8,%rax,2)
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 243,69,15,127,68,64,16 // movdqu %xmm8,0x10(%r8,%rax,2)
@@ -40140,13 +40132,13 @@ _sk_store_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,20,64 // movq %xmm10,(%r8,%rax,2)
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,240 // je 1f32a <_sk_store_u16_be_sse2+0x11c>
+ .byte 116,240 // je 1f316 <_sk_store_u16_be_sse2+0x11c>
.byte 102,69,15,23,84,64,8 // movhpd %xmm10,0x8(%r8,%rax,2)
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,227 // jb 1f32a <_sk_store_u16_be_sse2+0x11c>
+ .byte 114,227 // jb 1f316 <_sk_store_u16_be_sse2+0x11c>
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 102,69,15,214,68,64,16 // movq %xmm8,0x10(%r8,%rax,2)
- .byte 235,213 // jmp 1f32a <_sk_store_u16_be_sse2+0x11c>
+ .byte 235,213 // jmp 1f316 <_sk_store_u16_be_sse2+0x11c>
HIDDEN _sk_load_f32_sse2
.globl _sk_load_f32_sse2
@@ -40162,7 +40154,7 @@ _sk_load_f32_sse2:
.byte 73,99,193 // movslq %r9d,%rax
.byte 69,15,16,4,128 // movups (%r8,%rax,4),%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,66 // jne 1f3c0 <_sk_load_f32_sse2+0x6b>
+ .byte 117,66 // jne 1f3ac <_sk_load_f32_sse2+0x6b>
.byte 65,15,16,68,128,16 // movups 0x10(%r8,%rax,4),%xmm0
.byte 65,15,16,92,128,32 // movups 0x20(%r8,%rax,4),%xmm3
.byte 69,15,16,76,128,48 // movups 0x30(%r8,%rax,4),%xmm9
@@ -40182,17 +40174,17 @@ _sk_load_f32_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,8 // jne 1f3d2 <_sk_load_f32_sse2+0x7d>
+ .byte 117,8 // jne 1f3be <_sk_load_f32_sse2+0x7d>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 235,190 // jmp 1f390 <_sk_load_f32_sse2+0x3b>
+ .byte 235,190 // jmp 1f37c <_sk_load_f32_sse2+0x3b>
.byte 65,15,16,68,128,16 // movups 0x10(%r8,%rax,4),%xmm0
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,8 // jb 1f3e6 <_sk_load_f32_sse2+0x91>
+ .byte 114,8 // jb 1f3d2 <_sk_load_f32_sse2+0x91>
.byte 65,15,16,92,128,32 // movups 0x20(%r8,%rax,4),%xmm3
- .byte 235,170 // jmp 1f390 <_sk_load_f32_sse2+0x3b>
+ .byte 235,170 // jmp 1f37c <_sk_load_f32_sse2+0x3b>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,165 // jmp 1f390 <_sk_load_f32_sse2+0x3b>
+ .byte 235,165 // jmp 1f37c <_sk_load_f32_sse2+0x3b>
HIDDEN _sk_load_f32_dst_sse2
.globl _sk_load_f32_dst_sse2
@@ -40208,7 +40200,7 @@ _sk_load_f32_dst_sse2:
.byte 73,99,193 // movslq %r9d,%rax
.byte 69,15,16,4,128 // movups (%r8,%rax,4),%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,66 // jne 1f456 <_sk_load_f32_dst_sse2+0x6b>
+ .byte 117,66 // jne 1f442 <_sk_load_f32_dst_sse2+0x6b>
.byte 65,15,16,100,128,16 // movups 0x10(%r8,%rax,4),%xmm4
.byte 65,15,16,124,128,32 // movups 0x20(%r8,%rax,4),%xmm7
.byte 69,15,16,76,128,48 // movups 0x30(%r8,%rax,4),%xmm9
@@ -40228,17 +40220,17 @@ _sk_load_f32_dst_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 117,8 // jne 1f468 <_sk_load_f32_dst_sse2+0x7d>
+ .byte 117,8 // jne 1f454 <_sk_load_f32_dst_sse2+0x7d>
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 235,190 // jmp 1f426 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,190 // jmp 1f412 <_sk_load_f32_dst_sse2+0x3b>
.byte 65,15,16,100,128,16 // movups 0x10(%r8,%rax,4),%xmm4
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,8 // jb 1f47c <_sk_load_f32_dst_sse2+0x91>
+ .byte 114,8 // jb 1f468 <_sk_load_f32_dst_sse2+0x91>
.byte 65,15,16,124,128,32 // movups 0x20(%r8,%rax,4),%xmm7
- .byte 235,170 // jmp 1f426 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,170 // jmp 1f412 <_sk_load_f32_dst_sse2+0x3b>
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,165 // jmp 1f426 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,165 // jmp 1f412 <_sk_load_f32_dst_sse2+0x3b>
HIDDEN _sk_store_f32_sse2
.globl _sk_store_f32_sse2
@@ -40267,7 +40259,7 @@ _sk_store_f32_sse2:
.byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9
.byte 102,69,15,17,36,128 // movupd %xmm12,(%r8,%rax,4)
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,29 // jne 1f4fe <_sk_store_f32_sse2+0x7d>
+ .byte 117,29 // jne 1f4ea <_sk_store_f32_sse2+0x7d>
.byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10
.byte 69,15,17,68,128,16 // movups %xmm8,0x10(%r8,%rax,4)
.byte 102,69,15,17,76,128,32 // movupd %xmm9,0x20(%r8,%rax,4)
@@ -40275,12 +40267,12 @@ _sk_store_f32_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 72,131,255,1 // cmp $0x1,%rdi
- .byte 116,246 // je 1f4fa <_sk_store_f32_sse2+0x79>
+ .byte 116,246 // je 1f4e6 <_sk_store_f32_sse2+0x79>
.byte 69,15,17,68,128,16 // movups %xmm8,0x10(%r8,%rax,4)
.byte 72,131,255,3 // cmp $0x3,%rdi
- .byte 114,234 // jb 1f4fa <_sk_store_f32_sse2+0x79>
+ .byte 114,234 // jb 1f4e6 <_sk_store_f32_sse2+0x79>
.byte 102,69,15,17,76,128,32 // movupd %xmm9,0x20(%r8,%rax,4)
- .byte 235,225 // jmp 1f4fa <_sk_store_f32_sse2+0x79>
+ .byte 235,225 // jmp 1f4e6 <_sk_store_f32_sse2+0x79>
HIDDEN _sk_clamp_x_sse2
.globl _sk_clamp_x_sse2
@@ -40326,7 +40318,7 @@ _sk_repeat_x_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,105,215,0,0 // andps 0xd769(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,84,21,93,215,0,0 // andps 0xd75d(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -40352,7 +40344,7 @@ _sk_repeat_y_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,15,215,0,0 // andps 0xd70f(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,84,21,3,215,0,0 // andps 0xd703(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -40378,13 +40370,13 @@ _sk_mirror_x_sse2:
.byte 65,15,92,193 // subps %xmm9,%xmm0
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,200,203,0,0 // mulss 0xcbc8(%rip),%xmm11 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 243,68,15,89,29,144,212,0,0 // mulss 0xd490(%rip),%xmm11 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,149,214,0,0 // andps 0xd695(%rip),%xmm11 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,84,29,137,214,0,0 // andps 0xd689(%rip),%xmm11 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -40413,13 +40405,13 @@ _sk_mirror_y_sse2:
.byte 65,15,92,201 // subps %xmm9,%xmm1
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,67,203,0,0 // mulss 0xcb43(%rip),%xmm11 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 243,68,15,89,29,11,212,0,0 // mulss 0xd40b(%rip),%xmm11 # 2cac8 <_sk_overlay_sse2_8bit+0xd04>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,16,214,0,0 // andps 0xd610(%rip),%xmm11 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,84,29,4,214,0,0 // andps 0xd604(%rip),%xmm11 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -40442,7 +40434,7 @@ FUNCTION(_sk_clamp_x_1_sse2)
_sk_clamp_x_1_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,199,213,0,0 // minps 0xd5c7(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,93,5,187,213,0,0 // minps 0xd5bb(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -40455,7 +40447,7 @@ _sk_repeat_x_1_sse2:
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,84,13,165,213,0,0 // andps 0xd5a5(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,84,13,153,213,0,0 // andps 0xd599(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -40465,14 +40457,14 @@ HIDDEN _sk_mirror_x_1_sse2
.globl _sk_mirror_x_1_sse2
FUNCTION(_sk_mirror_x_1_sse2)
_sk_mirror_x_1_sse2:
- .byte 68,15,40,5,241,213,0,0 // movaps 0xd5f1(%rip),%xmm8 # 2cd60 <_sk_overlay_sse2_8bit+0xf88>
+ .byte 68,15,40,5,229,213,0,0 // movaps 0xd5e5(%rip),%xmm8 # 2cd40 <_sk_overlay_sse2_8bit+0xf7c>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,101,213,0,0 // movaps 0xd565(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,40,13,105,213,0,0 // movaps 0xd569(%rip),%xmm9 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,84,13,107,213,0,0 // andps 0xd56b(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,84,13,95,213,0,0 // andps 0xd55f(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,88,210 // addps %xmm10,%xmm10
@@ -40488,10 +40480,10 @@ HIDDEN _sk_luminance_to_alpha_sse2
FUNCTION(_sk_luminance_to_alpha_sse2)
_sk_luminance_to_alpha_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,129,218,0,0 // mulps 0xda81(%rip),%xmm0 # 2d240 <_sk_overlay_sse2_8bit+0x1468>
- .byte 15,89,13,138,218,0,0 // mulps 0xda8a(%rip),%xmm1 # 2d250 <_sk_overlay_sse2_8bit+0x1478>
+ .byte 15,89,5,117,218,0,0 // mulps 0xda75(%rip),%xmm0 # 2d220 <_sk_overlay_sse2_8bit+0x145c>
+ .byte 15,89,13,126,218,0,0 // mulps 0xda7e(%rip),%xmm1 # 2d230 <_sk_overlay_sse2_8bit+0x146c>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,144,218,0,0 // mulps 0xda90(%rip),%xmm3 # 2d260 <_sk_overlay_sse2_8bit+0x1488>
+ .byte 15,89,29,132,218,0,0 // mulps 0xda84(%rip),%xmm3 # 2d240 <_sk_overlay_sse2_8bit+0x147c>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -40803,9 +40795,9 @@ _sk_evenly_spaced_gradient_sse2:
.byte 72,139,24 // mov (%rax),%rbx
.byte 76,139,112,8 // mov 0x8(%rax),%r14
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 1fc70 <_sk_evenly_spaced_gradient_sse2+0x18>
+ .byte 120,7 // js 1fc5c <_sk_evenly_spaced_gradient_sse2+0x18>
.byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1
- .byte 235,21 // jmp 1fc85 <_sk_evenly_spaced_gradient_sse2+0x2d>
+ .byte 235,21 // jmp 1fc71 <_sk_evenly_spaced_gradient_sse2+0x2d>
.byte 73,137,216 // mov %rbx,%r8
.byte 73,209,232 // shr %r8
.byte 131,227,1 // and $0x1,%ebx
@@ -40903,15 +40895,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse2
.globl _sk_gauss_a_to_rgba_sse2
FUNCTION(_sk_gauss_a_to_rgba_sse2)
_sk_gauss_a_to_rgba_sse2:
- .byte 15,40,5,95,212,0,0 // movaps 0xd45f(%rip),%xmm0 # 2d270 <_sk_overlay_sse2_8bit+0x1498>
+ .byte 15,40,5,83,212,0,0 // movaps 0xd453(%rip),%xmm0 # 2d250 <_sk_overlay_sse2_8bit+0x148c>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,101,212,0,0 // addps 0xd465(%rip),%xmm0 # 2d280 <_sk_overlay_sse2_8bit+0x14a8>
+ .byte 15,88,5,89,212,0,0 // addps 0xd459(%rip),%xmm0 # 2d260 <_sk_overlay_sse2_8bit+0x149c>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,107,212,0,0 // addps 0xd46b(%rip),%xmm0 # 2d290 <_sk_overlay_sse2_8bit+0x14b8>
+ .byte 15,88,5,95,212,0,0 // addps 0xd45f(%rip),%xmm0 # 2d270 <_sk_overlay_sse2_8bit+0x14ac>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,113,212,0,0 // addps 0xd471(%rip),%xmm0 # 2d2a0 <_sk_overlay_sse2_8bit+0x14c8>
+ .byte 15,88,5,101,212,0,0 // addps 0xd465(%rip),%xmm0 # 2d280 <_sk_overlay_sse2_8bit+0x14bc>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,119,212,0,0 // addps 0xd477(%rip),%xmm0 # 2d2b0 <_sk_overlay_sse2_8bit+0x14d8>
+ .byte 15,88,5,107,212,0,0 // addps 0xd46b(%rip),%xmm0 # 2d290 <_sk_overlay_sse2_8bit+0x14cc>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -40926,12 +40918,12 @@ _sk_gradient_sse2:
.byte 76,139,0 // mov (%rax),%r8
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,2 // cmp $0x2,%r8
- .byte 114,51 // jb 1fe88 <_sk_gradient_sse2+0x42>
+ .byte 114,51 // jb 1fe74 <_sk_gradient_sse2+0x42>
.byte 76,139,72,72 // mov 0x48(%rax),%r9
.byte 73,255,200 // dec %r8
.byte 73,131,193,4 // add $0x4,%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,165,206,0,0 // movaps 0xcea5(%rip),%xmm2 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 15,40,21,153,206,0,0 // movaps 0xce99(%rip),%xmm2 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 243,65,15,16,25 // movss (%r9),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -40939,7 +40931,7 @@ _sk_gradient_sse2:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 73,131,193,4 // add $0x4,%r9
.byte 73,255,200 // dec %r8
- .byte 117,227 // jne 1fe6b <_sk_gradient_sse2+0x25>
+ .byte 117,227 // jne 1fe57 <_sk_gradient_sse2+0x25>
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
@@ -41079,29 +41071,29 @@ _sk_xy_to_unit_angle_sse2:
.byte 69,15,94,220 // divps %xmm12,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
- .byte 68,15,40,45,4,210,0,0 // movaps 0xd204(%rip),%xmm13 # 2d2c0 <_sk_overlay_sse2_8bit+0x14e8>
+ .byte 68,15,40,45,248,209,0,0 // movaps 0xd1f8(%rip),%xmm13 # 2d2a0 <_sk_overlay_sse2_8bit+0x14dc>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,8,210,0,0 // addps 0xd208(%rip),%xmm13 # 2d2d0 <_sk_overlay_sse2_8bit+0x14f8>
+ .byte 68,15,88,45,252,209,0,0 // addps 0xd1fc(%rip),%xmm13 # 2d2b0 <_sk_overlay_sse2_8bit+0x14ec>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,12,210,0,0 // addps 0xd20c(%rip),%xmm13 # 2d2e0 <_sk_overlay_sse2_8bit+0x1508>
+ .byte 68,15,88,45,0,210,0,0 // addps 0xd200(%rip),%xmm13 # 2d2c0 <_sk_overlay_sse2_8bit+0x14fc>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,16,210,0,0 // addps 0xd210(%rip),%xmm13 # 2d2f0 <_sk_overlay_sse2_8bit+0x1518>
+ .byte 68,15,88,45,4,210,0,0 // addps 0xd204(%rip),%xmm13 # 2d2d0 <_sk_overlay_sse2_8bit+0x150c>
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,40,21,15,210,0,0 // movaps 0xd20f(%rip),%xmm10 # 2d300 <_sk_overlay_sse2_8bit+0x1528>
+ .byte 68,15,40,21,3,210,0,0 // movaps 0xd203(%rip),%xmm10 # 2d2e0 <_sk_overlay_sse2_8bit+0x151c>
.byte 69,15,92,213 // subps %xmm13,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,205 // andnps %xmm13,%xmm9
.byte 69,15,86,202 // orps %xmm10,%xmm9
.byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8
- .byte 68,15,40,21,210,203,0,0 // movaps 0xcbd2(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,40,21,214,203,0,0 // movaps 0xcbd6(%rip),%xmm10 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,84,208 // andps %xmm8,%xmm10
.byte 69,15,85,193 // andnps %xmm9,%xmm8
.byte 69,15,86,194 // orps %xmm10,%xmm8
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9
- .byte 68,15,40,21,209,203,0,0 // movaps 0xcbd1(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,21,197,203,0,0 // movaps 0xcbc5(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,208 // subps %xmm8,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,200 // andnps %xmm8,%xmm9
@@ -41136,7 +41128,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,120,209,0,0 // mulps 0xd178(%rip),%xmm9 # 2d310 <_sk_overlay_sse2_8bit+0x1538>
+ .byte 68,15,89,13,108,209,0,0 // mulps 0xd16c(%rip),%xmm9 # 2d2f0 <_sk_overlay_sse2_8bit+0x152c>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -41144,7 +41136,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,99,209,0,0 // mulps 0xd163(%rip),%xmm10 # 2d320 <_sk_overlay_sse2_8bit+0x1548>
+ .byte 68,15,89,21,87,209,0,0 // mulps 0xd157(%rip),%xmm10 # 2d300 <_sk_overlay_sse2_8bit+0x153c>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -41153,8 +41145,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,27,208,0,0 // xorps 0xd01b(%rip),%xmm9 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
- .byte 68,15,89,5,243,202,0,0 // mulps 0xcaf3(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,87,13,15,208,0,0 // xorps 0xd00f(%rip),%xmm9 # 2d1e0 <_sk_overlay_sse2_8bit+0x141c>
+ .byte 68,15,89,5,247,202,0,0 // mulps 0xcaf7(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -41175,7 +41167,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,218,208,0,0 // mulps 0xd0da(%rip),%xmm9 # 2d310 <_sk_overlay_sse2_8bit+0x1538>
+ .byte 68,15,89,13,206,208,0,0 // mulps 0xd0ce(%rip),%xmm9 # 2d2f0 <_sk_overlay_sse2_8bit+0x152c>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -41183,7 +41175,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,197,208,0,0 // mulps 0xd0c5(%rip),%xmm10 # 2d320 <_sk_overlay_sse2_8bit+0x1548>
+ .byte 68,15,89,21,185,208,0,0 // mulps 0xd0b9(%rip),%xmm10 # 2d300 <_sk_overlay_sse2_8bit+0x153c>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -41192,8 +41184,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,125,207,0,0 // xorps 0xcf7d(%rip),%xmm9 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
- .byte 68,15,89,5,85,202,0,0 // mulps 0xca55(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,87,13,113,207,0,0 // xorps 0xcf71(%rip),%xmm9 # 2d1e0 <_sk_overlay_sse2_8bit+0x141c>
+ .byte 68,15,89,5,89,202,0,0 // mulps 0xca59(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -41211,7 +41203,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,77,208,0,0 // mulps 0xd04d(%rip),%xmm9 # 2d310 <_sk_overlay_sse2_8bit+0x1538>
+ .byte 68,15,89,13,65,208,0,0 // mulps 0xd041(%rip),%xmm9 # 2d2f0 <_sk_overlay_sse2_8bit+0x152c>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -41219,7 +41211,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,25,207,0,0 // xorps 0xcf19(%rip),%xmm0 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
+ .byte 15,87,5,13,207,0,0 // xorps 0xcf0d(%rip),%xmm0 # 2d1e0 <_sk_overlay_sse2_8bit+0x141c>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41262,7 +41254,7 @@ HIDDEN _sk_save_xy_sse2
FUNCTION(_sk_save_xy_sse2)
_sk_save_xy_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,143,201,0,0 // movaps 0xc98f(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,40,5,147,201,0,0 // movaps 0xc993(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -41270,7 +41262,7 @@ _sk_save_xy_sse2:
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,40,217 // movaps %xmm9,%xmm11
.byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11
- .byte 68,15,40,37,138,201,0,0 // movaps 0xc98a(%rip),%xmm12 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 68,15,40,37,126,201,0,0 // movaps 0xc97e(%rip),%xmm12 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,84,220 // andps %xmm12,%xmm11
.byte 69,15,92,211 // subps %xmm11,%xmm10
.byte 69,15,92,202 // subps %xmm10,%xmm9
@@ -41317,8 +41309,8 @@ _sk_bilinear_nx_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,35,207,0,0 // addps 0xcf23(%rip),%xmm0 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
- .byte 68,15,40,13,235,200,0,0 // movaps 0xc8eb(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,88,5,23,207,0,0 // addps 0xcf17(%rip),%xmm0 # 2d310 <_sk_overlay_sse2_8bit+0x154c>
+ .byte 68,15,40,13,223,200,0,0 // movaps 0xc8df(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41331,7 +41323,7 @@ _sk_bilinear_px_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,170,200,0,0 // addps 0xc8aa(%rip),%xmm0 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 15,88,5,174,200,0,0 // addps 0xc8ae(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41343,8 +41335,8 @@ _sk_bilinear_ny_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,220,206,0,0 // addps 0xcedc(%rip),%xmm1 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
- .byte 68,15,40,13,164,200,0,0 // movaps 0xc8a4(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,88,13,208,206,0,0 // addps 0xced0(%rip),%xmm1 # 2d310 <_sk_overlay_sse2_8bit+0x154c>
+ .byte 68,15,40,13,152,200,0,0 // movaps 0xc898(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41357,7 +41349,7 @@ _sk_bilinear_py_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,98,200,0,0 // addps 0xc862(%rip),%xmm1 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 15,88,13,102,200,0,0 // addps 0xc866(%rip),%xmm1 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41369,13 +41361,13 @@ _sk_bicubic_n3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,165,206,0,0 // addps 0xcea5(%rip),%xmm0 # 2d340 <_sk_overlay_sse2_8bit+0x1568>
- .byte 68,15,40,13,93,200,0,0 // movaps 0xc85d(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,88,5,153,206,0,0 // addps 0xce99(%rip),%xmm0 # 2d320 <_sk_overlay_sse2_8bit+0x155c>
+ .byte 68,15,40,13,81,200,0,0 // movaps 0xc851(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,153,206,0,0 // mulps 0xce99(%rip),%xmm9 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
- .byte 68,15,88,13,49,202,0,0 // addps 0xca31(%rip),%xmm9 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
+ .byte 68,15,89,13,141,206,0,0 // mulps 0xce8d(%rip),%xmm9 # 2d330 <_sk_overlay_sse2_8bit+0x156c>
+ .byte 68,15,88,13,37,202,0,0 // addps 0xca25(%rip),%xmm9 # 2ced0 <_sk_overlay_sse2_8bit+0x110c>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41388,16 +41380,16 @@ _sk_bicubic_n1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,80,206,0,0 // addps 0xce50(%rip),%xmm0 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
- .byte 68,15,40,13,24,200,0,0 // movaps 0xc818(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,88,5,68,206,0,0 // addps 0xce44(%rip),%xmm0 # 2d310 <_sk_overlay_sse2_8bit+0x154c>
+ .byte 68,15,40,13,12,200,0,0 // movaps 0xc80c(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,108,206,0,0 // movaps 0xce6c(%rip),%xmm8 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
+ .byte 68,15,40,5,96,206,0,0 // movaps 0xce60(%rip),%xmm8 # 2d340 <_sk_overlay_sse2_8bit+0x157c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,112,206,0,0 // addps 0xce70(%rip),%xmm8 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
+ .byte 68,15,88,5,100,206,0,0 // addps 0xce64(%rip),%xmm8 # 2d350 <_sk_overlay_sse2_8bit+0x158c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,212,199,0,0 // addps 0xc7d4(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,88,5,216,199,0,0 // addps 0xc7d8(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,104,206,0,0 // addps 0xce68(%rip),%xmm8 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
+ .byte 68,15,88,5,92,206,0,0 // addps 0xce5c(%rip),%xmm8 # 2d360 <_sk_overlay_sse2_8bit+0x159c>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41407,17 +41399,17 @@ HIDDEN _sk_bicubic_p1x_sse2
FUNCTION(_sk_bicubic_p1x_sse2)
_sk_bicubic_p1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,178,199,0,0 // movaps 0xc7b2(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,40,5,182,199,0,0 // movaps 0xc7b6(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,30,206,0,0 // movaps 0xce1e(%rip),%xmm10 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
+ .byte 68,15,40,21,18,206,0,0 // movaps 0xce12(%rip),%xmm10 # 2d340 <_sk_overlay_sse2_8bit+0x157c>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,34,206,0,0 // addps 0xce22(%rip),%xmm10 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
+ .byte 68,15,88,21,22,206,0,0 // addps 0xce16(%rip),%xmm10 # 2d350 <_sk_overlay_sse2_8bit+0x158c>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,30,206,0,0 // addps 0xce1e(%rip),%xmm10 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
+ .byte 68,15,88,21,18,206,0,0 // addps 0xce12(%rip),%xmm10 # 2d360 <_sk_overlay_sse2_8bit+0x159c>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41429,11 +41421,11 @@ _sk_bicubic_p3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,241,205,0,0 // addps 0xcdf1(%rip),%xmm0 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
+ .byte 15,88,5,229,205,0,0 // addps 0xcde5(%rip),%xmm0 # 2d350 <_sk_overlay_sse2_8bit+0x158c>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,193,205,0,0 // mulps 0xcdc1(%rip),%xmm8 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
- .byte 68,15,88,5,89,201,0,0 // addps 0xc959(%rip),%xmm8 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
+ .byte 68,15,89,5,181,205,0,0 // mulps 0xcdb5(%rip),%xmm8 # 2d330 <_sk_overlay_sse2_8bit+0x156c>
+ .byte 68,15,88,5,77,201,0,0 // addps 0xc94d(%rip),%xmm8 # 2ced0 <_sk_overlay_sse2_8bit+0x110c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41446,13 +41438,13 @@ _sk_bicubic_n3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,135,205,0,0 // addps 0xcd87(%rip),%xmm1 # 2d340 <_sk_overlay_sse2_8bit+0x1568>
- .byte 68,15,40,13,63,199,0,0 // movaps 0xc73f(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,88,13,123,205,0,0 // addps 0xcd7b(%rip),%xmm1 # 2d320 <_sk_overlay_sse2_8bit+0x155c>
+ .byte 68,15,40,13,51,199,0,0 // movaps 0xc733(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,123,205,0,0 // mulps 0xcd7b(%rip),%xmm9 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
- .byte 68,15,88,13,19,201,0,0 // addps 0xc913(%rip),%xmm9 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
+ .byte 68,15,89,13,111,205,0,0 // mulps 0xcd6f(%rip),%xmm9 # 2d330 <_sk_overlay_sse2_8bit+0x156c>
+ .byte 68,15,88,13,7,201,0,0 // addps 0xc907(%rip),%xmm9 # 2ced0 <_sk_overlay_sse2_8bit+0x110c>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41465,16 +41457,16 @@ _sk_bicubic_n1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,49,205,0,0 // addps 0xcd31(%rip),%xmm1 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
- .byte 68,15,40,13,249,198,0,0 // movaps 0xc6f9(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,88,13,37,205,0,0 // addps 0xcd25(%rip),%xmm1 # 2d310 <_sk_overlay_sse2_8bit+0x154c>
+ .byte 68,15,40,13,237,198,0,0 // movaps 0xc6ed(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,77,205,0,0 // movaps 0xcd4d(%rip),%xmm8 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
+ .byte 68,15,40,5,65,205,0,0 // movaps 0xcd41(%rip),%xmm8 # 2d340 <_sk_overlay_sse2_8bit+0x157c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,81,205,0,0 // addps 0xcd51(%rip),%xmm8 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
+ .byte 68,15,88,5,69,205,0,0 // addps 0xcd45(%rip),%xmm8 # 2d350 <_sk_overlay_sse2_8bit+0x158c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,181,198,0,0 // addps 0xc6b5(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,88,5,185,198,0,0 // addps 0xc6b9(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,73,205,0,0 // addps 0xcd49(%rip),%xmm8 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
+ .byte 68,15,88,5,61,205,0,0 // addps 0xcd3d(%rip),%xmm8 # 2d360 <_sk_overlay_sse2_8bit+0x159c>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41484,17 +41476,17 @@ HIDDEN _sk_bicubic_p1y_sse2
FUNCTION(_sk_bicubic_p1y_sse2)
_sk_bicubic_p1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,147,198,0,0 // movaps 0xc693(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,40,5,151,198,0,0 // movaps 0xc697(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xf0c>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,254,204,0,0 // movaps 0xccfe(%rip),%xmm10 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
+ .byte 68,15,40,21,242,204,0,0 // movaps 0xccf2(%rip),%xmm10 # 2d340 <_sk_overlay_sse2_8bit+0x157c>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,2,205,0,0 // addps 0xcd02(%rip),%xmm10 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
+ .byte 68,15,88,21,246,204,0,0 // addps 0xccf6(%rip),%xmm10 # 2d350 <_sk_overlay_sse2_8bit+0x158c>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,254,204,0,0 // addps 0xccfe(%rip),%xmm10 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
+ .byte 68,15,88,21,242,204,0,0 // addps 0xccf2(%rip),%xmm10 # 2d360 <_sk_overlay_sse2_8bit+0x159c>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41506,11 +41498,11 @@ _sk_bicubic_p3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,208,204,0,0 // addps 0xccd0(%rip),%xmm1 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
+ .byte 15,88,13,196,204,0,0 // addps 0xccc4(%rip),%xmm1 # 2d350 <_sk_overlay_sse2_8bit+0x158c>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,160,204,0,0 // mulps 0xcca0(%rip),%xmm8 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
- .byte 68,15,88,5,56,200,0,0 // addps 0xc838(%rip),%xmm8 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
+ .byte 68,15,89,5,148,204,0,0 // mulps 0xcc94(%rip),%xmm8 # 2d330 <_sk_overlay_sse2_8bit+0x156c>
+ .byte 68,15,88,5,44,200,0,0 // addps 0xc82c(%rip),%xmm8 # 2ced0 <_sk_overlay_sse2_8bit+0x110c>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41656,7 +41648,7 @@ _sk_clut_3D_sse2:
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,65,15,111,198 // movdqa %xmm14,%xmm0
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,45,223,202,0,0 // movdqa 0xcadf(%rip),%xmm5 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,45,211,202,0,0 // movdqa 0xcad3(%rip),%xmm5 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
.byte 102,15,244,197 // pmuludq %xmm5,%xmm0
.byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
@@ -41679,7 +41671,7 @@ _sk_clut_3D_sse2:
.byte 15,20,241 // unpcklps %xmm1,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,226,195,0,0 // paddd 0xc3e2(%rip),%xmm1 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,254,13,214,195,0,0 // paddd 0xc3d6(%rip),%xmm1 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,112,233,78 // pshufd $0x4e,%xmm1,%xmm5
.byte 102,73,15,126,232 // movq %xmm5,%r8
.byte 102,73,15,126,201 // movq %xmm1,%r9
@@ -41696,7 +41688,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,44,131 // movss (%r11,%r8,4),%xmm5
.byte 15,20,253 // unpcklps %xmm5,%xmm7
.byte 15,20,249 // unpcklps %xmm1,%xmm7
- .byte 102,15,254,5,182,195,0,0 // paddd 0xc3b6(%rip),%xmm0 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,254,5,170,195,0,0 // paddd 0xc3aa(%rip),%xmm0 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,73,15,126,200 // movq %xmm1,%r8
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -41713,7 +41705,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,44,131 // movss (%r11,%r8,4),%xmm5
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,20,200 // unpcklps %xmm0,%xmm1
- .byte 15,40,45,203,201,0,0 // movaps 0xc9cb(%rip),%xmm5 # 2d390 <_sk_overlay_sse2_8bit+0x15b8>
+ .byte 15,40,45,191,201,0,0 // movaps 0xc9bf(%rip),%xmm5 # 2d370 <_sk_overlay_sse2_8bit+0x15ac>
.byte 15,88,229 // addps %xmm5,%xmm4
.byte 15,41,100,36,192 // movaps %xmm4,-0x40(%rsp)
.byte 68,15,88,213 // addps %xmm5,%xmm10
@@ -41728,7 +41720,7 @@ _sk_clut_3D_sse2:
.byte 102,15,127,68,36,160 // movdqa %xmm0,-0x60(%rsp)
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
- .byte 102,15,111,5,148,201,0,0 // movdqa 0xc994(%rip),%xmm0 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,5,136,201,0,0 // movdqa 0xc988(%rip),%xmm0 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,244,216 // pmuludq %xmm0,%xmm3
.byte 102,15,112,211,232 // pshufd $0xe8,%xmm3,%xmm2
.byte 102,15,244,224 // pmuludq %xmm0,%xmm4
@@ -41750,7 +41742,7 @@ _sk_clut_3D_sse2:
.byte 15,20,227 // unpcklps %xmm3,%xmm4
.byte 15,20,229 // unpcklps %xmm5,%xmm4
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
- .byte 102,15,254,29,155,194,0,0 // paddd 0xc29b(%rip),%xmm3 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,254,29,143,194,0,0 // paddd 0xc28f(%rip),%xmm3 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,112,235,78 // pshufd $0x4e,%xmm3,%xmm5
.byte 102,73,15,126,232 // movq %xmm5,%r8
.byte 102,73,15,126,217 // movq %xmm3,%r9
@@ -41767,7 +41759,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,4,131 // movss (%r11,%r8,4),%xmm0
.byte 15,20,216 // unpcklps %xmm0,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
- .byte 102,15,254,21,111,194,0,0 // paddd 0xc26f(%rip),%xmm2 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,254,21,99,194,0,0 // paddd 0xc263(%rip),%xmm2 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
.byte 102,73,15,126,192 // movq %xmm0,%r8
.byte 102,73,15,126,209 // movq %xmm2,%r9
@@ -41829,7 +41821,7 @@ _sk_clut_3D_sse2:
.byte 68,15,20,193 // unpcklps %xmm1,%xmm8
.byte 68,15,20,199 // unpcklps %xmm7,%xmm8
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,68,15,111,21,55,193,0,0 // movdqa 0xc137(%rip),%xmm10 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,68,15,111,21,43,193,0,0 // movdqa 0xc12b(%rip),%xmm10 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,112,249,78 // pshufd $0x4e,%xmm1,%xmm7
.byte 102,73,15,126,248 // movq %xmm7,%r8
@@ -41847,7 +41839,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,44,131 // movss (%r11,%r8,4),%xmm5
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,111,45,6,193,0,0 // movdqa 0xc106(%rip),%xmm5 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,111,45,250,192,0,0 // movdqa 0xc0fa(%rip),%xmm5 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,15,254,197 // paddd %xmm5,%xmm0
.byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
.byte 102,73,15,126,232 // movq %xmm5,%r8
@@ -41905,7 +41897,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,60,131 // movss (%r11,%r8,4),%xmm7
.byte 68,15,20,223 // unpcklps %xmm7,%xmm11
.byte 68,15,20,221 // unpcklps %xmm5,%xmm11
- .byte 102,15,111,45,253,191,0,0 // movdqa 0xbffd(%rip),%xmm5 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,111,45,241,191,0,0 // movdqa 0xbff1(%rip),%xmm5 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,15,254,245 // paddd %xmm5,%xmm6
.byte 102,15,111,253 // movdqa %xmm5,%xmm7
.byte 102,15,112,238,78 // pshufd $0x4e,%xmm6,%xmm5
@@ -41952,7 +41944,7 @@ _sk_clut_3D_sse2:
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,254,201 // paddd %xmm9,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,5,157,197,0,0 // movdqa 0xc59d(%rip),%xmm0 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,5,145,197,0,0 // movdqa 0xc591(%rip),%xmm0 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,244,200 // pmuludq %xmm0,%xmm1
.byte 102,15,112,217,232 // pshufd $0xe8,%xmm1,%xmm3
.byte 102,15,244,208 // pmuludq %xmm0,%xmm2
@@ -41974,7 +41966,7 @@ _sk_clut_3D_sse2:
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,202 // unpcklps %xmm2,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,111,5,165,190,0,0 // movdqa 0xbea5(%rip),%xmm0 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,111,5,153,190,0,0 // movdqa 0xbe99(%rip),%xmm0 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4
.byte 102,73,15,126,224 // movq %xmm4,%r8
@@ -42050,7 +42042,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,4,131 // movss (%r11,%r8,4),%xmm0
.byte 15,20,240 // unpcklps %xmm0,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
- .byte 102,15,254,29,111,189,0,0 // paddd 0xbd6f(%rip),%xmm3 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,254,29,99,189,0,0 // paddd 0xbd63(%rip),%xmm3 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,15,112,195,78 // pshufd $0x4e,%xmm3,%xmm0
.byte 102,73,15,126,192 // movq %xmm0,%r8
.byte 102,73,15,126,217 // movq %xmm3,%r9
@@ -42101,7 +42093,7 @@ _sk_clut_3D_sse2:
.byte 68,15,20,201 // unpcklps %xmm1,%xmm9
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,104,188,0,0 // paddd 0xbc68(%rip),%xmm1 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,254,13,92,188,0,0 // paddd 0xbc5c(%rip),%xmm1 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,208 // movq %xmm2,%r8
.byte 102,73,15,126,201 // movq %xmm1,%r9
@@ -42118,7 +42110,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,20,131 // movss (%r11,%r8,4),%xmm2
.byte 68,15,20,242 // unpcklps %xmm2,%xmm14
.byte 68,15,20,241 // unpcklps %xmm1,%xmm14
- .byte 102,15,254,5,58,188,0,0 // paddd 0xbc3a(%rip),%xmm0 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,254,5,46,188,0,0 // paddd 0xbc2e(%rip),%xmm0 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,73,15,126,200 // movq %xmm1,%r8
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -42156,7 +42148,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,60,131 // movss (%r11,%r8,4),%xmm7
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
- .byte 102,15,111,37,105,187,0,0 // movdqa 0xbb69(%rip),%xmm4 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,111,37,93,187,0,0 // movdqa 0xbb5d(%rip),%xmm4 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,254,226 // paddd %xmm2,%xmm4
.byte 102,15,112,204,78 // pshufd $0x4e,%xmm4,%xmm1
.byte 102,73,15,126,200 // movq %xmm1,%r8
@@ -42174,7 +42166,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,36,131 // movss (%r11,%r8,4),%xmm4
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,254,21,57,187,0,0 // paddd 0xbb39(%rip),%xmm2 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,254,21,45,187,0,0 // paddd 0xbb2d(%rip),%xmm2 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4
.byte 102,73,15,126,224 // movq %xmm4,%r8
.byte 102,73,15,126,209 // movq %xmm2,%r9
@@ -42325,7 +42317,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,209 // paddd %xmm1,%xmm2
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
.byte 102,15,254,218 // paddd %xmm2,%xmm3
- .byte 102,68,15,111,21,35,191,0,0 // movdqa 0xbf23(%rip),%xmm10 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,68,15,111,21,23,191,0,0 // movdqa 0xbf17(%rip),%xmm10 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,112,235,245 // pshufd $0xf5,%xmm3,%xmm5
.byte 102,65,15,244,218 // pmuludq %xmm10,%xmm3
.byte 102,15,112,227,232 // pshufd $0xe8,%xmm3,%xmm4
@@ -42348,7 +42340,7 @@ _sk_clut_4D_sse2:
.byte 15,20,222 // unpcklps %xmm6,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 102,15,111,236 // movdqa %xmm4,%xmm5
- .byte 102,15,254,45,36,184,0,0 // paddd 0xb824(%rip),%xmm5 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,254,45,24,184,0,0 // paddd 0xb818(%rip),%xmm5 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,112,245,78 // pshufd $0x4e,%xmm5,%xmm6
.byte 102,73,15,126,240 // movq %xmm6,%r8
.byte 102,73,15,126,233 // movq %xmm5,%r9
@@ -42365,7 +42357,7 @@ _sk_clut_4D_sse2:
.byte 243,67,15,16,60,131 // movss (%r11,%r8,4),%xmm7
.byte 15,20,247 // unpcklps %xmm7,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
- .byte 102,15,254,37,248,183,0,0 // paddd 0xb7f8(%rip),%xmm4 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,254,37,236,183,0,0 // paddd 0xb7ec(%rip),%xmm4 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,73,15,126,232 // movq %xmm5,%r8
.byte 102,73,15,126,225 // movq %xmm4,%r9
@@ -42382,7 +42374,7 @@ _sk_clut_4D_sse2:
.byte 243,67,15,16,60,131 // movss (%r11,%r8,4),%xmm7
.byte 15,20,239 // unpcklps %xmm7,%xmm5
.byte 15,20,236 // unpcklps %xmm4,%xmm5
- .byte 15,40,61,13,190,0,0 // movaps 0xbe0d(%rip),%xmm7 # 2d390 <_sk_overlay_sse2_8bit+0x15b8>
+ .byte 15,40,61,1,190,0,0 // movaps 0xbe01(%rip),%xmm7 # 2d370 <_sk_overlay_sse2_8bit+0x15ac>
.byte 68,15,88,199 // addps %xmm7,%xmm8
.byte 68,15,41,68,36,176 // movaps %xmm8,-0x50(%rsp)
.byte 68,15,88,207 // addps %xmm7,%xmm9
@@ -42420,7 +42412,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,234 // unpcklps %xmm2,%xmm13
.byte 68,15,20,239 // unpcklps %xmm7,%xmm13
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
- .byte 102,15,254,21,211,182,0,0 // paddd 0xb6d3(%rip),%xmm2 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,254,21,199,182,0,0 // paddd 0xb6c7(%rip),%xmm2 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7
.byte 102,73,15,126,248 // movq %xmm7,%r8
.byte 102,73,15,126,209 // movq %xmm2,%r9
@@ -42437,7 +42429,7 @@ _sk_clut_4D_sse2:
.byte 243,71,15,16,12,131 // movss (%r11,%r8,4),%xmm9
.byte 65,15,20,209 // unpcklps %xmm9,%xmm2
.byte 15,20,215 // unpcklps %xmm7,%xmm2
- .byte 102,15,254,5,166,182,0,0 // paddd 0xb6a6(%rip),%xmm0 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,254,5,154,182,0,0 // paddd 0xb69a(%rip),%xmm0 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,15,112,248,78 // pshufd $0x4e,%xmm0,%xmm7
.byte 102,73,15,126,248 // movq %xmm7,%r8
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -42478,7 +42470,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,217 // movdqa %xmm1,%xmm3
.byte 102,15,254,92,36,160 // paddd -0x60(%rsp),%xmm3
.byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
- .byte 102,68,15,111,53,96,188,0,0 // movdqa 0xbc60(%rip),%xmm14 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,68,15,111,53,84,188,0,0 // movdqa 0xbc54(%rip),%xmm14 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,65,15,244,222 // pmuludq %xmm14,%xmm3
.byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
.byte 102,65,15,244,230 // pmuludq %xmm14,%xmm4
@@ -42499,7 +42491,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,228 // unpcklps %xmm4,%xmm12
.byte 68,15,20,229 // unpcklps %xmm5,%xmm12
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
- .byte 102,15,111,61,104,181,0,0 // movdqa 0xb568(%rip),%xmm7 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,111,61,92,181,0,0 // movdqa 0xb55c(%rip),%xmm7 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,254,231 // paddd %xmm7,%xmm4
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,73,15,126,232 // movq %xmm5,%r8
@@ -42517,7 +42509,7 @@ _sk_clut_4D_sse2:
.byte 243,67,15,16,44,131 // movss (%r11,%r8,4),%xmm5
.byte 15,20,245 // unpcklps %xmm5,%xmm6
.byte 15,20,244 // unpcklps %xmm4,%xmm6
- .byte 102,68,15,111,5,55,181,0,0 // movdqa 0xb537(%rip),%xmm8 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,68,15,111,5,43,181,0,0 // movdqa 0xb52b(%rip),%xmm8 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,65,15,254,216 // paddd %xmm8,%xmm3
.byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
.byte 102,73,15,126,224 // movq %xmm4,%r8
@@ -42631,7 +42623,7 @@ _sk_clut_4D_sse2:
.byte 102,68,15,111,108,36,160 // movdqa -0x60(%rsp),%xmm13
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,29,158,185,0,0 // movdqa 0xb99e(%rip),%xmm3 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,29,146,185,0,0 // movdqa 0xb992(%rip),%xmm3 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,211 // pmuludq %xmm3,%xmm2
@@ -42653,7 +42645,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 68,15,20,205 // unpcklps %xmm5,%xmm9
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,111,29,164,178,0,0 // movdqa 0xb2a4(%rip),%xmm3 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,111,29,152,178,0,0 // movdqa 0xb298(%rip),%xmm3 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,234,78 // pshufd $0x4e,%xmm2,%xmm5
.byte 102,73,15,126,232 // movq %xmm5,%r8
@@ -42761,7 +42753,7 @@ _sk_clut_4D_sse2:
.byte 102,65,15,111,211 // movdqa %xmm11,%xmm2
.byte 102,65,15,254,213 // paddd %xmm13,%xmm2
.byte 102,15,112,218,245 // pshufd $0xf5,%xmm2,%xmm3
- .byte 102,15,111,5,92,183,0,0 // movdqa 0xb75c(%rip),%xmm0 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,5,80,183,0,0 // movdqa 0xb750(%rip),%xmm0 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,244,208 // pmuludq %xmm0,%xmm2
.byte 102,15,112,250,232 // pshufd $0xe8,%xmm2,%xmm7
.byte 102,15,244,216 // pmuludq %xmm0,%xmm3
@@ -42782,7 +42774,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 68,15,20,203 // unpcklps %xmm3,%xmm9
.byte 102,15,111,215 // movdqa %xmm7,%xmm2
- .byte 102,15,111,5,102,176,0,0 // movdqa 0xb066(%rip),%xmm0 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,111,5,90,176,0,0 // movdqa 0xb05a(%rip),%xmm0 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
.byte 102,73,15,126,216 // movq %xmm3,%r8
@@ -42800,7 +42792,7 @@ _sk_clut_4D_sse2:
.byte 243,67,15,16,28,131 // movss (%r11,%r8,4),%xmm3
.byte 15,20,243 // unpcklps %xmm3,%xmm6
.byte 15,20,242 // unpcklps %xmm2,%xmm6
- .byte 102,68,15,111,45,53,176,0,0 // movdqa 0xb035(%rip),%xmm13 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,68,15,111,45,41,176,0,0 // movdqa 0xb029(%rip),%xmm13 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,65,15,254,253 // paddd %xmm13,%xmm7
.byte 102,15,112,215,78 // pshufd $0x4e,%xmm7,%xmm2
.byte 102,73,15,126,208 // movq %xmm2,%r8
@@ -42820,7 +42812,7 @@ _sk_clut_4D_sse2:
.byte 15,20,250 // unpcklps %xmm2,%xmm7
.byte 102,68,15,254,220 // paddd %xmm4,%xmm11
.byte 102,65,15,112,219,245 // pshufd $0xf5,%xmm11,%xmm3
- .byte 102,15,111,37,73,182,0,0 // movdqa 0xb649(%rip),%xmm4 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,37,61,182,0,0 // movdqa 0xb63d(%rip),%xmm4 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,68,15,244,220 // pmuludq %xmm4,%xmm11
.byte 102,65,15,112,211,232 // pshufd $0xe8,%xmm11,%xmm2
.byte 102,15,244,220 // pmuludq %xmm4,%xmm3
@@ -42921,7 +42913,7 @@ _sk_clut_4D_sse2:
.byte 102,65,15,111,202 // movdqa %xmm10,%xmm1
.byte 102,15,254,200 // paddd %xmm0,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,29,136,180,0,0 // movdqa 0xb488(%rip),%xmm3 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,29,124,180,0,0 // movdqa 0xb47c(%rip),%xmm3 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,211 // pmuludq %xmm3,%xmm2
@@ -42943,7 +42935,7 @@ _sk_clut_4D_sse2:
.byte 15,20,212 // unpcklps %xmm4,%xmm2
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 102,15,111,217 // movdqa %xmm1,%xmm3
- .byte 102,15,111,61,143,173,0,0 // movdqa 0xad8f(%rip),%xmm7 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,111,61,131,173,0,0 // movdqa 0xad83(%rip),%xmm7 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,254,223 // paddd %xmm7,%xmm3
.byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
.byte 102,73,15,126,224 // movq %xmm4,%r8
@@ -42961,7 +42953,7 @@ _sk_clut_4D_sse2:
.byte 243,67,15,16,44,131 // movss (%r11,%r8,4),%xmm5
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 15,20,220 // unpcklps %xmm4,%xmm3
- .byte 102,68,15,111,13,94,173,0,0 // movdqa 0xad5e(%rip),%xmm9 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,68,15,111,13,82,173,0,0 // movdqa 0xad52(%rip),%xmm9 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,65,15,254,201 // paddd %xmm9,%xmm1
.byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
.byte 102,73,15,126,224 // movq %xmm4,%r8
@@ -43073,7 +43065,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,246 // unpcklps %xmm6,%xmm14
.byte 68,15,20,243 // unpcklps %xmm3,%xmm14
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
- .byte 102,68,15,111,21,72,171,0,0 // movdqa 0xab48(%rip),%xmm10 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,68,15,111,21,60,171,0,0 // movdqa 0xab3c(%rip),%xmm10 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,65,15,254,218 // paddd %xmm10,%xmm3
.byte 102,15,112,243,78 // pshufd $0x4e,%xmm3,%xmm6
.byte 102,73,15,126,240 // movq %xmm6,%r8
@@ -43194,7 +43186,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,116,36,160 // movdqa -0x60(%rsp),%xmm6
.byte 102,15,254,198 // paddd %xmm6,%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,29,187,175,0,0 // movdqa 0xafbb(%rip),%xmm3 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,29,175,175,0,0 // movdqa 0xafaf(%rip),%xmm3 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,244,195 // pmuludq %xmm3,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
@@ -43216,7 +43208,7 @@ _sk_clut_4D_sse2:
.byte 15,20,195 // unpcklps %xmm3,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
- .byte 102,68,15,111,5,193,168,0,0 // movdqa 0xa8c1(%rip),%xmm8 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,68,15,111,5,181,168,0,0 // movdqa 0xa8b5(%rip),%xmm8 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,65,15,254,200 // paddd %xmm8,%xmm1
.byte 102,15,112,217,78 // pshufd $0x4e,%xmm1,%xmm3
.byte 102,73,15,126,216 // movq %xmm3,%r8
@@ -43322,7 +43314,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,124,36,128 // paddd -0x80(%rsp),%xmm7
.byte 102,15,254,247 // paddd %xmm7,%xmm6
.byte 102,15,112,206,245 // pshufd $0xf5,%xmm6,%xmm1
- .byte 102,15,111,21,123,173,0,0 // movdqa 0xad7b(%rip),%xmm2 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,21,111,173,0,0 // movdqa 0xad6f(%rip),%xmm2 # 2d380 <_sk_overlay_sse2_8bit+0x15bc>
.byte 102,15,244,242 // pmuludq %xmm2,%xmm6
.byte 102,15,112,198,232 // pshufd $0xe8,%xmm6,%xmm0
.byte 102,15,244,202 // pmuludq %xmm2,%xmm1
@@ -43344,7 +43336,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,201 // unpcklps %xmm1,%xmm9
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,129,166,0,0 // paddd 0xa681(%rip),%xmm1 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,254,13,117,166,0,0 // paddd 0xa675(%rip),%xmm1 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,208 // movq %xmm2,%r8
.byte 102,73,15,126,201 // movq %xmm1,%r9
@@ -43400,7 +43392,7 @@ _sk_clut_4D_sse2:
.byte 243,67,15,16,60,131 // movss (%r11,%r8,4),%xmm7
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
- .byte 102,15,111,53,129,165,0,0 // movdqa 0xa581(%rip),%xmm6 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
+ .byte 102,15,111,53,117,165,0,0 // movdqa 0xa575(%rip),%xmm6 # 2ccf0 <_sk_overlay_sse2_8bit+0xf2c>
.byte 102,15,254,242 // paddd %xmm2,%xmm6
.byte 102,15,112,206,78 // pshufd $0x4e,%xmm6,%xmm1
.byte 102,73,15,126,200 // movq %xmm1,%r8
@@ -43418,7 +43410,7 @@ _sk_clut_4D_sse2:
.byte 243,71,15,16,60,131 // movss (%r11,%r8,4),%xmm15
.byte 65,15,20,207 // unpcklps %xmm15,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,254,21,80,165,0,0 // paddd 0xa550(%rip),%xmm2 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
+ .byte 102,15,254,21,68,165,0,0 // paddd 0xa544(%rip),%xmm2 # 2cd10 <_sk_overlay_sse2_8bit+0xf4c>
.byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7
.byte 102,73,15,126,248 // movq %xmm7,%r8
.byte 102,73,15,126,209 // movq %xmm2,%r9
@@ -43480,7 +43472,7 @@ _sk_clut_4D_sse2:
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,51,164,0,0 // movaps 0xa433(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
+ .byte 15,40,29,39,164,0,0 // movaps 0xa427(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf1c>
.byte 15,40,100,36,112 // movaps 0x70(%rsp),%xmm4
.byte 15,40,172,36,128,0,0,0 // movaps 0x80(%rsp),%xmm5
.byte 15,40,180,36,144,0,0,0 // movaps 0x90(%rsp),%xmm6
@@ -43510,13 +43502,13 @@ _sk_start_pipeline_hsw_8bit:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,192 // mov %rcx,-0x40(%rbp)
.byte 72,57,203 // cmp %rcx,%rbx
- .byte 115,83 // jae 22976 <_sk_start_pipeline_hsw_8bit+0x82>
+ .byte 115,83 // jae 22962 <_sk_start_pipeline_hsw_8bit+0x82>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,16 // lea 0x10(%rax),%rax
.byte 72,137,69,200 // mov %rax,-0x38(%rbp)
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
.byte 76,57,125,200 // cmp %r15,-0x38(%rbp)
- .byte 119,35 // ja 2295c <_sk_start_pipeline_hsw_8bit+0x68>
+ .byte 119,35 // ja 22948 <_sk_start_pipeline_hsw_8bit+0x68>
.byte 76,139,101,208 // mov -0x30(%rbp),%r12
.byte 49,255 // xor %edi,%edi
.byte 76,137,246 // mov %r14,%rsi
@@ -43527,16 +43519,16 @@ _sk_start_pipeline_hsw_8bit:
.byte 73,131,196,32 // add $0x20,%r12
.byte 77,57,252 // cmp %r15,%r12
.byte 73,137,212 // mov %rdx,%r12
- .byte 118,225 // jbe 2293d <_sk_start_pipeline_hsw_8bit+0x49>
+ .byte 118,225 // jbe 22929 <_sk_start_pipeline_hsw_8bit+0x49>
.byte 76,137,255 // mov %r15,%rdi
.byte 72,41,215 // sub %rdx,%rdi
- .byte 116,9 // je 2296d <_sk_start_pipeline_hsw_8bit+0x79>
+ .byte 116,9 // je 22959 <_sk_start_pipeline_hsw_8bit+0x79>
.byte 76,137,246 // mov %r14,%rsi
.byte 72,137,217 // mov %rbx,%rcx
.byte 65,255,213 // callq *%r13
.byte 72,255,195 // inc %rbx
.byte 72,59,93,192 // cmp -0x40(%rbp),%rbx
- .byte 117,185 // jne 2292f <_sk_start_pipeline_hsw_8bit+0x3b>
+ .byte 117,185 // jne 2291b <_sk_start_pipeline_hsw_8bit+0x3b>
.byte 72,131,196,24 // add $0x18,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -43568,7 +43560,7 @@ HIDDEN _sk_set_rgb_hsw_8bit
FUNCTION(_sk_set_rgb_hsw_8bit)
_sk_set_rgb_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 197,250,16,37,161,152,0,0 // vmovss 0x98a1(%rip),%xmm4 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 197,250,16,37,105,161,0,0 // vmovss 0xa169(%rip),%xmm4 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 197,218,89,40 // vmulss (%rax),%xmm4,%xmm5
.byte 196,97,250,44,197 // vcvttss2si %xmm5,%r8
.byte 197,218,89,104,4 // vmulss 0x4(%rax),%xmm4,%xmm5
@@ -43581,7 +43573,7 @@ _sk_set_rgb_hsw_8bit:
.byte 68,9,200 // or %r9d,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,88,228 // vpbroadcastd %xmm4,%ymm4
- .byte 197,253,111,45,66,158,0,0 // vmovdqa 0x9e42(%rip),%ymm5 # 2c820 <_sk_overlay_sse2_8bit+0xa48>
+ .byte 197,253,111,45,150,156,0,0 // vmovdqa 0x9c96(%rip),%ymm5 # 2c660 <_sk_overlay_sse2_8bit+0x89c>
.byte 197,245,219,205 // vpand %ymm5,%ymm1,%ymm1
.byte 197,253,219,197 // vpand %ymm5,%ymm0,%ymm0
.byte 197,221,235,192 // vpor %ymm0,%ymm4,%ymm0
@@ -43593,10 +43585,10 @@ HIDDEN _sk_premul_hsw_8bit
.globl _sk_premul_hsw_8bit
FUNCTION(_sk_premul_hsw_8bit)
_sk_premul_hsw_8bit:
- .byte 197,253,111,37,70,158,0,0 // vmovdqa 0x9e46(%rip),%ymm4 # 2c840 <_sk_overlay_sse2_8bit+0xa68>
+ .byte 197,253,111,37,154,156,0,0 // vmovdqa 0x9c9a(%rip),%ymm4 # 2c680 <_sk_overlay_sse2_8bit+0x8bc>
.byte 196,226,125,0,236 // vpshufb %ymm4,%ymm0,%ymm5
.byte 196,226,117,0,228 // vpshufb %ymm4,%ymm1,%ymm4
- .byte 197,253,111,53,84,158,0,0 // vmovdqa 0x9e54(%rip),%ymm6 # 2c860 <_sk_overlay_sse2_8bit+0xa88>
+ .byte 197,253,111,53,168,156,0,0 // vmovdqa 0x9ca8(%rip),%ymm6 # 2c6a0 <_sk_overlay_sse2_8bit+0x8dc>
.byte 197,221,235,230 // vpor %ymm6,%ymm4,%ymm4
.byte 197,213,235,238 // vpor %ymm6,%ymm5,%ymm5
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -43636,7 +43628,7 @@ HIDDEN _sk_swap_rb_hsw_8bit
.globl _sk_swap_rb_hsw_8bit
FUNCTION(_sk_swap_rb_hsw_8bit)
_sk_swap_rb_hsw_8bit:
- .byte 197,253,111,37,204,157,0,0 // vmovdqa 0x9dcc(%rip),%ymm4 # 2c880 <_sk_overlay_sse2_8bit+0xaa8>
+ .byte 197,253,111,37,32,156,0,0 // vmovdqa 0x9c20(%rip),%ymm4 # 2c6c0 <_sk_overlay_sse2_8bit+0x8fc>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43664,7 +43656,7 @@ _sk_load_8888_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 22aff <_sk_load_8888_hsw_8bit+0x2d>
+ .byte 117,17 // jne 22aeb <_sk_load_8888_hsw_8bit+0x2d>
.byte 196,129,126,111,76,152,32 // vmovdqu 0x20(%r8,%r11,4),%ymm1
.byte 196,129,126,111,4,152 // vmovdqu (%r8,%r11,4),%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43675,14 +43667,14 @@ _sk_load_8888_hsw_8bit:
.byte 197,253,239,192 // vpxor %ymm0,%ymm0,%ymm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,228 // ja 22afb <_sk_load_8888_hsw_8bit+0x29>
+ .byte 119,228 // ja 22ae7 <_sk_load_8888_hsw_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,22,1,0,0 // lea 0x116(%rip),%r10 # 22c38 <_sk_load_8888_hsw_8bit+0x166>
+ .byte 76,141,21,22,1,0,0 // lea 0x116(%rip),%r10 # 22c24 <_sk_load_8888_hsw_8bit+0x166>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,152 // vmovd (%r8,%r11,4),%xmm0
- .byte 235,200 // jmp 22afb <_sk_load_8888_hsw_8bit+0x29>
+ .byte 235,200 // jmp 22ae7 <_sk_load_8888_hsw_8bit+0x29>
.byte 196,129,121,110,68,152,8 // vmovd 0x8(%r8,%r11,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -43690,7 +43682,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,130,121,53,36,152 // vpmovzxdq (%r8,%r11,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,125,2,196,3 // vpblendd $0x3,%ymm4,%ymm0,%ymm0
- .byte 235,159 // jmp 22afb <_sk_load_8888_hsw_8bit+0x29>
+ .byte 235,159 // jmp 22ae7 <_sk_load_8888_hsw_8bit+0x29>
.byte 196,129,121,110,68,152,24 // vmovd 0x18(%r8,%r11,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -43703,7 +43695,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,227,125,56,196,1 // vinserti128 $0x1,%xmm4,%ymm0,%ymm0
.byte 196,129,122,111,36,152 // vmovdqu (%r8,%r11,4),%xmm4
.byte 196,227,93,2,192,240 // vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- .byte 233,80,255,255,255 // jmpq 22afb <_sk_load_8888_hsw_8bit+0x29>
+ .byte 233,80,255,255,255 // jmpq 22ae7 <_sk_load_8888_hsw_8bit+0x29>
.byte 196,129,121,110,68,152,40 // vmovd 0x28(%r8,%r11,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -43712,7 +43704,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,227,117,2,200,15 // vpblendd $0xf,%ymm0,%ymm1,%ymm1
.byte 196,129,121,110,68,152,32 // vmovd 0x20(%r8,%r11,4),%xmm0
.byte 196,227,117,2,200,1 // vpblendd $0x1,%ymm0,%ymm1,%ymm1
- .byte 233,20,255,255,255 // jmpq 22af5 <_sk_load_8888_hsw_8bit+0x23>
+ .byte 233,20,255,255,255 // jmpq 22ae1 <_sk_load_8888_hsw_8bit+0x23>
.byte 196,129,121,110,68,152,56 // vmovd 0x38(%r8,%r11,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -43726,7 +43718,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,129,126,111,4,152 // vmovdqu (%r8,%r11,4),%ymm0
.byte 196,129,122,111,100,152,32 // vmovdqu 0x20(%r8,%r11,4),%xmm4
.byte 196,227,93,2,201,240 // vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- .byte 233,196,254,255,255 // jmpq 22afb <_sk_load_8888_hsw_8bit+0x29>
+ .byte 233,196,254,255,255 // jmpq 22ae7 <_sk_load_8888_hsw_8bit+0x29>
.byte 144 // nop
.byte 243,254 // repz (bad)
.byte 255 // (bad)
@@ -43777,7 +43769,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 22ca1 <_sk_load_8888_dst_hsw_8bit+0x2d>
+ .byte 117,17 // jne 22c8d <_sk_load_8888_dst_hsw_8bit+0x2d>
.byte 196,129,126,111,92,152,32 // vmovdqu 0x20(%r8,%r11,4),%ymm3
.byte 196,129,126,111,20,152 // vmovdqu (%r8,%r11,4),%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43788,14 +43780,14 @@ _sk_load_8888_dst_hsw_8bit:
.byte 197,237,239,210 // vpxor %ymm2,%ymm2,%ymm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,228 // ja 22c9d <_sk_load_8888_dst_hsw_8bit+0x29>
+ .byte 119,228 // ja 22c89 <_sk_load_8888_dst_hsw_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,24,1,0,0 // lea 0x118(%rip),%r10 # 22ddc <_sk_load_8888_dst_hsw_8bit+0x168>
+ .byte 76,141,21,24,1,0,0 // lea 0x118(%rip),%r10 # 22dc8 <_sk_load_8888_dst_hsw_8bit+0x168>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,20,152 // vmovd (%r8,%r11,4),%xmm2
- .byte 235,200 // jmp 22c9d <_sk_load_8888_dst_hsw_8bit+0x29>
+ .byte 235,200 // jmp 22c89 <_sk_load_8888_dst_hsw_8bit+0x29>
.byte 196,129,121,110,84,152,8 // vmovd 0x8(%r8,%r11,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -43803,7 +43795,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,130,121,53,36,152 // vpmovzxdq (%r8,%r11,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,109,2,212,3 // vpblendd $0x3,%ymm4,%ymm2,%ymm2
- .byte 235,159 // jmp 22c9d <_sk_load_8888_dst_hsw_8bit+0x29>
+ .byte 235,159 // jmp 22c89 <_sk_load_8888_dst_hsw_8bit+0x29>
.byte 196,129,121,110,84,152,24 // vmovd 0x18(%r8,%r11,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -43816,7 +43808,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,227,109,56,212,1 // vinserti128 $0x1,%xmm4,%ymm2,%ymm2
.byte 196,129,122,111,36,152 // vmovdqu (%r8,%r11,4),%xmm4
.byte 196,227,93,2,210,240 // vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- .byte 233,80,255,255,255 // jmpq 22c9d <_sk_load_8888_dst_hsw_8bit+0x29>
+ .byte 233,80,255,255,255 // jmpq 22c89 <_sk_load_8888_dst_hsw_8bit+0x29>
.byte 196,129,121,110,84,152,40 // vmovd 0x28(%r8,%r11,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -43825,7 +43817,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,227,101,2,218,15 // vpblendd $0xf,%ymm2,%ymm3,%ymm3
.byte 196,129,121,110,84,152,32 // vmovd 0x20(%r8,%r11,4),%xmm2
.byte 196,227,101,2,218,1 // vpblendd $0x1,%ymm2,%ymm3,%ymm3
- .byte 233,20,255,255,255 // jmpq 22c97 <_sk_load_8888_dst_hsw_8bit+0x23>
+ .byte 233,20,255,255,255 // jmpq 22c83 <_sk_load_8888_dst_hsw_8bit+0x23>
.byte 196,129,121,110,84,152,56 // vmovd 0x38(%r8,%r11,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -43839,7 +43831,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,129,126,111,20,152 // vmovdqu (%r8,%r11,4),%ymm2
.byte 196,129,122,111,100,152,32 // vmovdqu 0x20(%r8,%r11,4),%xmm4
.byte 196,227,93,2,219,240 // vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- .byte 233,196,254,255,255 // jmpq 22c9d <_sk_load_8888_dst_hsw_8bit+0x29>
+ .byte 233,196,254,255,255 // jmpq 22c89 <_sk_load_8888_dst_hsw_8bit+0x29>
.byte 15,31,0 // nopl (%rax)
.byte 241 // icebp
.byte 254 // (bad)
@@ -43891,7 +43883,7 @@ _sk_store_8888_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 22e45 <_sk_store_8888_hsw_8bit+0x2d>
+ .byte 117,17 // jne 22e31 <_sk_store_8888_hsw_8bit+0x2d>
.byte 196,129,126,127,4,152 // vmovdqu %ymm0,(%r8,%r11,4)
.byte 196,129,126,127,76,152,32 // vmovdqu %ymm1,0x20(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43900,17 +43892,17 @@ _sk_store_8888_hsw_8bit:
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,236 // ja 22e41 <_sk_store_8888_hsw_8bit+0x29>
+ .byte 119,236 // ja 22e2d <_sk_store_8888_hsw_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,176,0,0,0 // lea 0xb0(%rip),%r10 # 22f10 <_sk_store_8888_hsw_8bit+0xf8>
+ .byte 76,141,21,176,0,0,0 // lea 0xb0(%rip),%r10 # 22efc <_sk_store_8888_hsw_8bit+0xf8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,129,121,126,4,152 // vmovd %xmm0,(%r8,%r11,4)
- .byte 235,208 // jmp 22e41 <_sk_store_8888_hsw_8bit+0x29>
+ .byte 235,208 // jmp 22e2d <_sk_store_8888_hsw_8bit+0x29>
.byte 196,131,121,22,68,152,8,2 // vpextrd $0x2,%xmm0,0x8(%r8,%r11,4)
.byte 196,129,121,214,4,152 // vmovq %xmm0,(%r8,%r11,4)
- .byte 235,192 // jmp 22e41 <_sk_store_8888_hsw_8bit+0x29>
+ .byte 235,192 // jmp 22e2d <_sk_store_8888_hsw_8bit+0x29>
.byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4
.byte 196,131,121,22,100,152,24,2 // vpextrd $0x2,%xmm4,0x18(%r8,%r11,4)
.byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4
@@ -43918,12 +43910,12 @@ _sk_store_8888_hsw_8bit:
.byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4
.byte 196,129,121,126,100,152,16 // vmovd %xmm4,0x10(%r8,%r11,4)
.byte 196,129,122,127,4,152 // vmovdqu %xmm0,(%r8,%r11,4)
- .byte 235,143 // jmp 22e41 <_sk_store_8888_hsw_8bit+0x29>
+ .byte 235,143 // jmp 22e2d <_sk_store_8888_hsw_8bit+0x29>
.byte 196,131,121,22,76,152,40,2 // vpextrd $0x2,%xmm1,0x28(%r8,%r11,4)
.byte 196,131,121,22,76,152,36,1 // vpextrd $0x1,%xmm1,0x24(%r8,%r11,4)
.byte 196,129,121,126,76,152,32 // vmovd %xmm1,0x20(%r8,%r11,4)
.byte 196,129,126,127,4,152 // vmovdqu %ymm0,(%r8,%r11,4)
- .byte 233,109,255,255,255 // jmpq 22e41 <_sk_store_8888_hsw_8bit+0x29>
+ .byte 233,109,255,255,255 // jmpq 22e2d <_sk_store_8888_hsw_8bit+0x29>
.byte 196,227,125,57,204,1 // vextracti128 $0x1,%ymm1,%xmm4
.byte 196,131,121,22,100,152,56,2 // vpextrd $0x2,%xmm4,0x38(%r8,%r11,4)
.byte 196,227,125,57,204,1 // vextracti128 $0x1,%ymm1,%xmm4
@@ -43932,7 +43924,7 @@ _sk_store_8888_hsw_8bit:
.byte 196,129,121,126,100,152,48 // vmovd %xmm4,0x30(%r8,%r11,4)
.byte 196,129,126,127,4,152 // vmovdqu %ymm0,(%r8,%r11,4)
.byte 196,129,122,127,76,152,32 // vmovdqu %xmm1,0x20(%r8,%r11,4)
- .byte 233,50,255,255,255 // jmpq 22e41 <_sk_store_8888_hsw_8bit+0x29>
+ .byte 233,50,255,255,255 // jmpq 22e2d <_sk_store_8888_hsw_8bit+0x29>
.byte 144 // nop
.byte 89 // pop %rcx
.byte 255 // (bad)
@@ -43945,7 +43937,7 @@ _sk_store_8888_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,255 // jg 22f25 <_sk_store_8888_hsw_8bit+0x10d>
+ .byte 127,255 // jg 22f11 <_sk_store_8888_hsw_8bit+0x10d>
.byte 255 // (bad)
.byte 255,113,255 // pushq -0x1(%rcx)
.byte 255 // (bad)
@@ -43983,10 +43975,10 @@ _sk_load_bgra_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,35 // jne 22f8b <_sk_load_bgra_hsw_8bit+0x3f>
+ .byte 117,35 // jne 22f77 <_sk_load_bgra_hsw_8bit+0x3f>
.byte 196,129,126,111,76,152,32 // vmovdqu 0x20(%r8,%r11,4),%ymm1
.byte 196,129,126,111,4,152 // vmovdqu (%r8,%r11,4),%ymm0
- .byte 197,253,111,37,35,153,0,0 // vmovdqa 0x9923(%rip),%ymm4 # 2c8a0 <_sk_overlay_sse2_8bit+0xac8>
+ .byte 197,253,111,37,119,151,0,0 // vmovdqa 0x9777(%rip),%ymm4 # 2c6e0 <_sk_overlay_sse2_8bit+0x91c>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43997,14 +43989,14 @@ _sk_load_bgra_hsw_8bit:
.byte 197,253,239,192 // vpxor %ymm0,%ymm0,%ymm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,210 // ja 22f75 <_sk_load_bgra_hsw_8bit+0x29>
+ .byte 119,210 // ja 22f61 <_sk_load_bgra_hsw_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,22,1,0,0 // lea 0x116(%rip),%r10 # 230c4 <_sk_load_bgra_hsw_8bit+0x178>
+ .byte 76,141,21,22,1,0,0 // lea 0x116(%rip),%r10 # 230b0 <_sk_load_bgra_hsw_8bit+0x178>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,152 // vmovd (%r8,%r11,4),%xmm0
- .byte 235,182 // jmp 22f75 <_sk_load_bgra_hsw_8bit+0x29>
+ .byte 235,182 // jmp 22f61 <_sk_load_bgra_hsw_8bit+0x29>
.byte 196,129,121,110,68,152,8 // vmovd 0x8(%r8,%r11,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -44012,7 +44004,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,130,121,53,36,152 // vpmovzxdq (%r8,%r11,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,125,2,196,3 // vpblendd $0x3,%ymm4,%ymm0,%ymm0
- .byte 235,141 // jmp 22f75 <_sk_load_bgra_hsw_8bit+0x29>
+ .byte 235,141 // jmp 22f61 <_sk_load_bgra_hsw_8bit+0x29>
.byte 196,129,121,110,68,152,24 // vmovd 0x18(%r8,%r11,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -44025,7 +44017,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,227,125,56,196,1 // vinserti128 $0x1,%xmm4,%ymm0,%ymm0
.byte 196,129,122,111,36,152 // vmovdqu (%r8,%r11,4),%xmm4
.byte 196,227,93,2,192,240 // vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- .byte 233,62,255,255,255 // jmpq 22f75 <_sk_load_bgra_hsw_8bit+0x29>
+ .byte 233,62,255,255,255 // jmpq 22f61 <_sk_load_bgra_hsw_8bit+0x29>
.byte 196,129,121,110,68,152,40 // vmovd 0x28(%r8,%r11,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -44034,7 +44026,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,227,117,2,200,15 // vpblendd $0xf,%ymm0,%ymm1,%ymm1
.byte 196,129,121,110,68,152,32 // vmovd 0x20(%r8,%r11,4),%xmm0
.byte 196,227,117,2,200,1 // vpblendd $0x1,%ymm0,%ymm1,%ymm1
- .byte 233,2,255,255,255 // jmpq 22f6f <_sk_load_bgra_hsw_8bit+0x23>
+ .byte 233,2,255,255,255 // jmpq 22f5b <_sk_load_bgra_hsw_8bit+0x23>
.byte 196,129,121,110,68,152,56 // vmovd 0x38(%r8,%r11,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -44048,7 +44040,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,129,126,111,4,152 // vmovdqu (%r8,%r11,4),%ymm0
.byte 196,129,122,111,100,152,32 // vmovdqu 0x20(%r8,%r11,4),%xmm4
.byte 196,227,93,2,201,240 // vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- .byte 233,178,254,255,255 // jmpq 22f75 <_sk_load_bgra_hsw_8bit+0x29>
+ .byte 233,178,254,255,255 // jmpq 22f61 <_sk_load_bgra_hsw_8bit+0x29>
.byte 144 // nop
.byte 243,254 // repz (bad)
.byte 255 // (bad)
@@ -44098,10 +44090,10 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,35 // jne 2313f <_sk_load_bgra_dst_hsw_8bit+0x3f>
+ .byte 117,35 // jne 2312b <_sk_load_bgra_dst_hsw_8bit+0x3f>
.byte 196,129,126,111,92,152,32 // vmovdqu 0x20(%r8,%r11,4),%ymm3
.byte 196,129,126,111,20,152 // vmovdqu (%r8,%r11,4),%ymm2
- .byte 197,253,111,37,143,151,0,0 // vmovdqa 0x978f(%rip),%ymm4 # 2c8c0 <_sk_overlay_sse2_8bit+0xae8>
+ .byte 197,253,111,37,227,149,0,0 // vmovdqa 0x95e3(%rip),%ymm4 # 2c700 <_sk_overlay_sse2_8bit+0x93c>
.byte 196,226,109,0,212 // vpshufb %ymm4,%ymm2,%ymm2
.byte 196,226,101,0,220 // vpshufb %ymm4,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44112,14 +44104,14 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 197,237,239,210 // vpxor %ymm2,%ymm2,%ymm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,210 // ja 23129 <_sk_load_bgra_dst_hsw_8bit+0x29>
+ .byte 119,210 // ja 23115 <_sk_load_bgra_dst_hsw_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,22,1,0,0 // lea 0x116(%rip),%r10 # 23278 <_sk_load_bgra_dst_hsw_8bit+0x178>
+ .byte 76,141,21,22,1,0,0 // lea 0x116(%rip),%r10 # 23264 <_sk_load_bgra_dst_hsw_8bit+0x178>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,20,152 // vmovd (%r8,%r11,4),%xmm2
- .byte 235,182 // jmp 23129 <_sk_load_bgra_dst_hsw_8bit+0x29>
+ .byte 235,182 // jmp 23115 <_sk_load_bgra_dst_hsw_8bit+0x29>
.byte 196,129,121,110,84,152,8 // vmovd 0x8(%r8,%r11,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -44127,7 +44119,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,130,121,53,36,152 // vpmovzxdq (%r8,%r11,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,109,2,212,3 // vpblendd $0x3,%ymm4,%ymm2,%ymm2
- .byte 235,141 // jmp 23129 <_sk_load_bgra_dst_hsw_8bit+0x29>
+ .byte 235,141 // jmp 23115 <_sk_load_bgra_dst_hsw_8bit+0x29>
.byte 196,129,121,110,84,152,24 // vmovd 0x18(%r8,%r11,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -44140,7 +44132,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,227,109,56,212,1 // vinserti128 $0x1,%xmm4,%ymm2,%ymm2
.byte 196,129,122,111,36,152 // vmovdqu (%r8,%r11,4),%xmm4
.byte 196,227,93,2,210,240 // vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- .byte 233,62,255,255,255 // jmpq 23129 <_sk_load_bgra_dst_hsw_8bit+0x29>
+ .byte 233,62,255,255,255 // jmpq 23115 <_sk_load_bgra_dst_hsw_8bit+0x29>
.byte 196,129,121,110,84,152,40 // vmovd 0x28(%r8,%r11,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -44149,7 +44141,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,227,101,2,218,15 // vpblendd $0xf,%ymm2,%ymm3,%ymm3
.byte 196,129,121,110,84,152,32 // vmovd 0x20(%r8,%r11,4),%xmm2
.byte 196,227,101,2,218,1 // vpblendd $0x1,%ymm2,%ymm3,%ymm3
- .byte 233,2,255,255,255 // jmpq 23123 <_sk_load_bgra_dst_hsw_8bit+0x23>
+ .byte 233,2,255,255,255 // jmpq 2310f <_sk_load_bgra_dst_hsw_8bit+0x23>
.byte 196,129,121,110,84,152,56 // vmovd 0x38(%r8,%r11,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -44163,7 +44155,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,129,126,111,20,152 // vmovdqu (%r8,%r11,4),%ymm2
.byte 196,129,122,111,100,152,32 // vmovdqu 0x20(%r8,%r11,4),%xmm4
.byte 196,227,93,2,219,240 // vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- .byte 233,178,254,255,255 // jmpq 23129 <_sk_load_bgra_dst_hsw_8bit+0x29>
+ .byte 233,178,254,255,255 // jmpq 23115 <_sk_load_bgra_dst_hsw_8bit+0x29>
.byte 144 // nop
.byte 243,254 // repz (bad)
.byte 255 // (bad)
@@ -44212,11 +44204,11 @@ _sk_store_bgra_hsw_8bit:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 197,253,111,37,13,150,0,0 // vmovdqa 0x960d(%rip),%ymm4 # 2c8e0 <_sk_overlay_sse2_8bit+0xb08>
+ .byte 197,253,111,37,97,148,0,0 // vmovdqa 0x9461(%rip),%ymm4 # 2c720 <_sk_overlay_sse2_8bit+0x95c>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 232f3 <_sk_store_bgra_hsw_8bit+0x3f>
+ .byte 117,17 // jne 232df <_sk_store_bgra_hsw_8bit+0x3f>
.byte 196,129,126,127,36,152 // vmovdqu %ymm4,(%r8,%r11,4)
.byte 196,129,126,127,108,152,32 // vmovdqu %ymm5,0x20(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44225,17 +44217,17 @@ _sk_store_bgra_hsw_8bit:
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,236 // ja 232ef <_sk_store_bgra_hsw_8bit+0x3b>
+ .byte 119,236 // ja 232db <_sk_store_bgra_hsw_8bit+0x3b>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,178,0,0,0 // lea 0xb2(%rip),%r10 # 233c0 <_sk_store_bgra_hsw_8bit+0x10c>
+ .byte 76,141,21,178,0,0,0 // lea 0xb2(%rip),%r10 # 233ac <_sk_store_bgra_hsw_8bit+0x10c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,129,121,126,36,152 // vmovd %xmm4,(%r8,%r11,4)
- .byte 235,208 // jmp 232ef <_sk_store_bgra_hsw_8bit+0x3b>
+ .byte 235,208 // jmp 232db <_sk_store_bgra_hsw_8bit+0x3b>
.byte 196,131,121,22,100,152,8,2 // vpextrd $0x2,%xmm4,0x8(%r8,%r11,4)
.byte 196,129,121,214,36,152 // vmovq %xmm4,(%r8,%r11,4)
- .byte 235,192 // jmp 232ef <_sk_store_bgra_hsw_8bit+0x3b>
+ .byte 235,192 // jmp 232db <_sk_store_bgra_hsw_8bit+0x3b>
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,131,121,22,108,152,24,2 // vpextrd $0x2,%xmm5,0x18(%r8,%r11,4)
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
@@ -44243,12 +44235,12 @@ _sk_store_bgra_hsw_8bit:
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,129,121,126,108,152,16 // vmovd %xmm5,0x10(%r8,%r11,4)
.byte 196,129,122,127,36,152 // vmovdqu %xmm4,(%r8,%r11,4)
- .byte 235,143 // jmp 232ef <_sk_store_bgra_hsw_8bit+0x3b>
+ .byte 235,143 // jmp 232db <_sk_store_bgra_hsw_8bit+0x3b>
.byte 196,131,121,22,108,152,40,2 // vpextrd $0x2,%xmm5,0x28(%r8,%r11,4)
.byte 196,131,121,22,108,152,36,1 // vpextrd $0x1,%xmm5,0x24(%r8,%r11,4)
.byte 196,129,121,126,108,152,32 // vmovd %xmm5,0x20(%r8,%r11,4)
.byte 196,129,126,127,36,152 // vmovdqu %ymm4,(%r8,%r11,4)
- .byte 233,109,255,255,255 // jmpq 232ef <_sk_store_bgra_hsw_8bit+0x3b>
+ .byte 233,109,255,255,255 // jmpq 232db <_sk_store_bgra_hsw_8bit+0x3b>
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
.byte 196,131,121,22,116,152,56,2 // vpextrd $0x2,%xmm6,0x38(%r8,%r11,4)
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
@@ -44257,7 +44249,7 @@ _sk_store_bgra_hsw_8bit:
.byte 196,129,121,126,116,152,48 // vmovd %xmm6,0x30(%r8,%r11,4)
.byte 196,129,126,127,36,152 // vmovdqu %ymm4,(%r8,%r11,4)
.byte 196,129,122,127,108,152,32 // vmovdqu %xmm5,0x20(%r8,%r11,4)
- .byte 233,50,255,255,255 // jmpq 232ef <_sk_store_bgra_hsw_8bit+0x3b>
+ .byte 233,50,255,255,255 // jmpq 232db <_sk_store_bgra_hsw_8bit+0x3b>
.byte 15,31,0 // nopl (%rax)
.byte 87 // push %rdi
.byte 255 // (bad)
@@ -44270,7 +44262,7 @@ _sk_store_bgra_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 125,255 // jge 233d5 <_sk_store_bgra_hsw_8bit+0x121>
+ .byte 125,255 // jge 233c1 <_sk_store_bgra_hsw_8bit+0x121>
.byte 255 // (bad)
.byte 255,111,255 // ljmp *-0x1(%rdi)
.byte 255 // (bad)
@@ -44281,7 +44273,7 @@ _sk_store_bgra_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 235,255 // jmp 233ed <_sk_store_bgra_hsw_8bit+0x139>
+ .byte 235,255 // jmp 233d9 <_sk_store_bgra_hsw_8bit+0x139>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 222,255 // fdivrp %st,%st(7)
@@ -44305,17 +44297,17 @@ _sk_store_565_hsw_8bit:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 197,253,111,37,230,148,0,0 // vmovdqa 0x94e6(%rip),%ymm4 # 2c900 <_sk_overlay_sse2_8bit+0xb28>
+ .byte 197,253,111,37,58,147,0,0 // vmovdqa 0x933a(%rip),%ymm4 # 2c740 <_sk_overlay_sse2_8bit+0x97c>
.byte 197,253,219,236 // vpand %ymm4,%ymm0,%ymm5
.byte 197,245,219,228 // vpand %ymm4,%ymm1,%ymm4
.byte 197,221,114,244,8 // vpslld $0x8,%ymm4,%ymm4
.byte 197,213,114,245,8 // vpslld $0x8,%ymm5,%ymm5
- .byte 197,253,111,53,236,148,0,0 // vmovdqa 0x94ec(%rip),%ymm6 # 2c920 <_sk_overlay_sse2_8bit+0xb48>
+ .byte 197,253,111,53,64,147,0,0 // vmovdqa 0x9340(%rip),%ymm6 # 2c760 <_sk_overlay_sse2_8bit+0x99c>
.byte 197,253,219,254 // vpand %ymm6,%ymm0,%ymm7
.byte 197,245,219,246 // vpand %ymm6,%ymm1,%ymm6
.byte 197,205,114,214,5 // vpsrld $0x5,%ymm6,%ymm6
.byte 197,197,114,215,5 // vpsrld $0x5,%ymm7,%ymm7
- .byte 197,125,111,5,242,148,0,0 // vmovdqa 0x94f2(%rip),%ymm8 # 2c940 <_sk_overlay_sse2_8bit+0xb68>
+ .byte 197,125,111,5,70,147,0,0 // vmovdqa 0x9346(%rip),%ymm8 # 2c780 <_sk_overlay_sse2_8bit+0x9bc>
.byte 196,65,117,219,200 // vpand %ymm8,%ymm1,%ymm9
.byte 196,65,125,219,192 // vpand %ymm8,%ymm0,%ymm8
.byte 196,193,61,114,208,19 // vpsrld $0x13,%ymm8,%ymm8
@@ -44324,14 +44316,14 @@ _sk_store_565_hsw_8bit:
.byte 197,221,235,230 // vpor %ymm6,%ymm4,%ymm4
.byte 196,193,93,235,225 // vpor %ymm9,%ymm4,%ymm4
.byte 196,193,85,235,232 // vpor %ymm8,%ymm5,%ymm5
- .byte 197,253,111,53,226,148,0,0 // vmovdqa 0x94e2(%rip),%ymm6 # 2c960 <_sk_overlay_sse2_8bit+0xb88>
+ .byte 197,253,111,53,54,147,0,0 // vmovdqa 0x9336(%rip),%ymm6 # 2c7a0 <_sk_overlay_sse2_8bit+0x9dc>
.byte 196,226,85,0,238 // vpshufb %ymm6,%ymm5,%ymm5
.byte 196,227,253,0,237,232 // vpermq $0xe8,%ymm5,%ymm5
.byte 196,226,93,0,230 // vpshufb %ymm6,%ymm4,%ymm4
.byte 196,227,253,0,228,232 // vpermq $0xe8,%ymm4,%ymm4
.byte 196,227,85,56,228,1 // vinserti128 $0x1,%xmm4,%ymm5,%ymm4
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 234a9 <_sk_store_565_hsw_8bit+0xad>
+ .byte 117,10 // jne 23495 <_sk_store_565_hsw_8bit+0xad>
.byte 196,129,126,127,36,88 // vmovdqu %ymm4,(%r8,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -44339,29 +44331,29 @@ _sk_store_565_hsw_8bit:
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,236 // ja 234a5 <_sk_store_565_hsw_8bit+0xa9>
+ .byte 119,236 // ja 23491 <_sk_store_565_hsw_8bit+0xa9>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,176,0,0,0 // lea 0xb0(%rip),%r10 # 23574 <_sk_store_565_hsw_8bit+0x178>
+ .byte 76,141,21,176,0,0,0 // lea 0xb0(%rip),%r10 # 23560 <_sk_store_565_hsw_8bit+0x178>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,131,121,21,36,88,0 // vpextrw $0x0,%xmm4,(%r8,%r11,2)
- .byte 235,207 // jmp 234a5 <_sk_store_565_hsw_8bit+0xa9>
+ .byte 235,207 // jmp 23491 <_sk_store_565_hsw_8bit+0xa9>
.byte 196,131,121,21,100,88,4,2 // vpextrw $0x2,%xmm4,0x4(%r8,%r11,2)
.byte 196,129,121,126,36,88 // vmovd %xmm4,(%r8,%r11,2)
- .byte 235,191 // jmp 234a5 <_sk_store_565_hsw_8bit+0xa9>
+ .byte 235,191 // jmp 23491 <_sk_store_565_hsw_8bit+0xa9>
.byte 196,131,121,21,100,88,12,6 // vpextrw $0x6,%xmm4,0xc(%r8,%r11,2)
.byte 196,131,121,21,100,88,10,5 // vpextrw $0x5,%xmm4,0xa(%r8,%r11,2)
.byte 196,131,121,21,100,88,8,4 // vpextrw $0x4,%xmm4,0x8(%r8,%r11,2)
.byte 196,129,121,214,36,88 // vmovq %xmm4,(%r8,%r11,2)
- .byte 235,159 // jmp 234a5 <_sk_store_565_hsw_8bit+0xa9>
+ .byte 235,159 // jmp 23491 <_sk_store_565_hsw_8bit+0xa9>
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,131,121,21,108,88,20,2 // vpextrw $0x2,%xmm5,0x14(%r8,%r11,2)
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,131,121,21,108,88,18,1 // vpextrw $0x1,%xmm5,0x12(%r8,%r11,2)
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,131,121,21,108,88,16,0 // vpextrw $0x0,%xmm5,0x10(%r8,%r11,2)
- .byte 235,55 // jmp 23569 <_sk_store_565_hsw_8bit+0x16d>
+ .byte 235,55 // jmp 23555 <_sk_store_565_hsw_8bit+0x16d>
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,131,121,21,108,88,28,6 // vpextrw $0x6,%xmm5,0x1c(%r8,%r11,2)
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
@@ -44371,7 +44363,7 @@ _sk_store_565_hsw_8bit:
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,129,121,214,108,88,16 // vmovq %xmm5,0x10(%r8,%r11,2)
.byte 196,129,122,127,36,88 // vmovdqu %xmm4,(%r8,%r11,2)
- .byte 233,49,255,255,255 // jmpq 234a5 <_sk_store_565_hsw_8bit+0xa9>
+ .byte 233,49,255,255,255 // jmpq 23491 <_sk_store_565_hsw_8bit+0xa9>
.byte 89 // pop %rcx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -44383,7 +44375,7 @@ _sk_store_565_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 122,255 // jp 23589 <_sk_store_565_hsw_8bit+0x18d>
+ .byte 122,255 // jp 23575 <_sk_store_565_hsw_8bit+0x18d>
.byte 255 // (bad)
.byte 255,114,255 // pushq -0x1(%rdx)
.byte 255 // (bad)
@@ -44420,17 +44412,17 @@ _sk_load_565_dst_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,222,0,0,0 // jne 236ad <_sk_load_565_dst_hsw_8bit+0xfd>
+ .byte 15,133,222,0,0,0 // jne 23699 <_sk_load_565_dst_hsw_8bit+0xfd>
.byte 196,129,126,111,20,88 // vmovdqu (%r8,%r11,2),%ymm2
.byte 196,227,125,57,211,1 // vextracti128 $0x1,%ymm2,%xmm3
.byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3
.byte 196,226,125,51,210 // vpmovzxwd %xmm2,%ymm2
- .byte 196,226,125,88,37,162,140,0,0 // vpbroadcastd 0x8ca2(%rip),%ymm4 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,226,125,88,37,106,149,0,0 // vpbroadcastd 0x956a(%rip),%ymm4 # 2cb44 <_sk_overlay_sse2_8bit+0xd80>
.byte 197,237,219,236 // vpand %ymm4,%ymm2,%ymm5
.byte 197,229,219,228 // vpand %ymm4,%ymm3,%ymm4
.byte 197,221,114,212,8 // vpsrld $0x8,%ymm4,%ymm4
.byte 197,213,114,213,8 // vpsrld $0x8,%ymm5,%ymm5
- .byte 196,226,125,88,53,151,140,0,0 // vpbroadcastd 0x8c97(%rip),%ymm6 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,226,125,88,53,95,149,0,0 // vpbroadcastd 0x955f(%rip),%ymm6 # 2cb54 <_sk_overlay_sse2_8bit+0xd90>
.byte 197,237,219,254 // vpand %ymm6,%ymm2,%ymm7
.byte 197,229,219,246 // vpand %ymm6,%ymm3,%ymm6
.byte 197,205,114,246,19 // vpslld $0x13,%ymm6,%ymm6
@@ -44439,22 +44431,22 @@ _sk_load_565_dst_hsw_8bit:
.byte 197,221,235,230 // vpor %ymm6,%ymm4,%ymm4
.byte 197,205,114,212,5 // vpsrld $0x5,%ymm4,%ymm6
.byte 197,197,114,213,5 // vpsrld $0x5,%ymm5,%ymm7
- .byte 196,98,125,88,5,114,141,0,0 // vpbroadcastd 0x8d72(%rip),%ymm8 # 2c3a8 <_sk_overlay_sse2_8bit+0x5d0>
+ .byte 196,98,125,88,5,58,150,0,0 // vpbroadcastd 0x963a(%rip),%ymm8 # 2cc5c <_sk_overlay_sse2_8bit+0xe98>
.byte 196,193,69,219,248 // vpand %ymm8,%ymm7,%ymm7
.byte 196,193,77,219,240 // vpand %ymm8,%ymm6,%ymm6
- .byte 196,98,125,88,5,79,140,0,0 // vpbroadcastd 0x8c4f(%rip),%ymm8 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,98,125,88,5,23,149,0,0 // vpbroadcastd 0x9517(%rip),%ymm8 # 2cb4c <_sk_overlay_sse2_8bit+0xd88>
.byte 196,65,101,219,200 // vpand %ymm8,%ymm3,%ymm9
.byte 196,65,109,219,192 // vpand %ymm8,%ymm2,%ymm8
.byte 196,193,61,114,240,5 // vpslld $0x5,%ymm8,%ymm8
.byte 196,193,53,114,241,5 // vpslld $0x5,%ymm9,%ymm9
- .byte 196,98,125,88,21,68,141,0,0 // vpbroadcastd 0x8d44(%rip),%ymm10 # 2c3ac <_sk_overlay_sse2_8bit+0x5d4>
+ .byte 196,98,125,88,21,12,150,0,0 // vpbroadcastd 0x960c(%rip),%ymm10 # 2cc60 <_sk_overlay_sse2_8bit+0xe9c>
.byte 196,193,101,219,218 // vpand %ymm10,%ymm3,%ymm3
.byte 196,193,109,219,210 // vpand %ymm10,%ymm2,%ymm2
.byte 197,237,114,210,1 // vpsrld $0x1,%ymm2,%ymm2
.byte 197,229,114,211,1 // vpsrld $0x1,%ymm3,%ymm3
.byte 196,193,101,235,217 // vpor %ymm9,%ymm3,%ymm3
.byte 196,193,109,235,208 // vpor %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,33,141,0,0 // vpbroadcastd 0x8d21(%rip),%ymm8 # 2c3b0 <_sk_overlay_sse2_8bit+0x5d8>
+ .byte 196,98,125,88,5,233,149,0,0 // vpbroadcastd 0x95e9(%rip),%ymm8 # 2cc64 <_sk_overlay_sse2_8bit+0xea0>
.byte 197,237,235,213 // vpor %ymm5,%ymm2,%ymm2
.byte 197,229,235,220 // vpor %ymm4,%ymm3,%ymm3
.byte 196,193,109,235,208 // vpor %ymm8,%ymm2,%ymm2
@@ -44468,21 +44460,21 @@ _sk_load_565_dst_hsw_8bit:
.byte 197,237,239,210 // vpxor %ymm2,%ymm2,%ymm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 15,135,16,255,255,255 // ja 235d5 <_sk_load_565_dst_hsw_8bit+0x25>
+ .byte 15,135,16,255,255,255 // ja 235c1 <_sk_load_565_dst_hsw_8bit+0x25>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,28,1,0,0 // lea 0x11c(%rip),%r10 # 237ec <_sk_load_565_dst_hsw_8bit+0x23c>
+ .byte 76,141,21,28,1,0,0 // lea 0x11c(%rip),%r10 # 237d8 <_sk_load_565_dst_hsw_8bit+0x23c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
- .byte 233,238,254,255,255 // jmpq 235d5 <_sk_load_565_dst_hsw_8bit+0x25>
+ .byte 233,238,254,255,255 // jmpq 235c1 <_sk_load_565_dst_hsw_8bit+0x25>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,129,105,196,92,88,4,2 // vpinsrw $0x2,0x4(%r8,%r11,2),%xmm2,%xmm3
.byte 196,227,101,56,210,1 // vinserti128 $0x1,%xmm2,%ymm3,%ymm2
.byte 196,129,121,110,28,88 // vmovd (%r8,%r11,2),%xmm3
.byte 196,227,109,2,211,1 // vpblendd $0x1,%ymm3,%ymm2,%ymm2
- .byte 233,203,254,255,255 // jmpq 235d5 <_sk_load_565_dst_hsw_8bit+0x25>
+ .byte 233,203,254,255,255 // jmpq 235c1 <_sk_load_565_dst_hsw_8bit+0x25>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,129,105,196,92,88,12,6 // vpinsrw $0x6,0xc(%r8,%r11,2),%xmm2,%xmm3
.byte 196,227,101,56,210,1 // vinserti128 $0x1,%xmm2,%ymm3,%ymm2
@@ -44492,7 +44484,7 @@ _sk_load_565_dst_hsw_8bit:
.byte 196,227,109,2,211,15 // vpblendd $0xf,%ymm3,%ymm2,%ymm2
.byte 196,129,122,126,28,88 // vmovq (%r8,%r11,2),%xmm3
.byte 196,227,109,2,211,3 // vpblendd $0x3,%ymm3,%ymm2,%ymm2
- .byte 233,140,254,255,255 // jmpq 235d5 <_sk_load_565_dst_hsw_8bit+0x25>
+ .byte 233,140,254,255,255 // jmpq 235c1 <_sk_load_565_dst_hsw_8bit+0x25>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,129,105,196,92,88,20,2 // vpinsrw $0x2,0x14(%r8,%r11,2),%xmm2,%xmm3
.byte 196,227,109,56,211,1 // vinserti128 $0x1,%xmm3,%ymm2,%ymm2
@@ -44504,7 +44496,7 @@ _sk_load_565_dst_hsw_8bit:
.byte 196,227,109,56,211,1 // vinserti128 $0x1,%xmm3,%ymm2,%ymm2
.byte 196,129,122,111,28,88 // vmovdqu (%r8,%r11,2),%xmm3
.byte 196,227,101,2,210,240 // vpblendd $0xf0,%ymm2,%ymm3,%ymm2
- .byte 233,65,254,255,255 // jmpq 235d5 <_sk_load_565_dst_hsw_8bit+0x25>
+ .byte 233,65,254,255,255 // jmpq 235c1 <_sk_load_565_dst_hsw_8bit+0x25>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,129,105,196,92,88,28,6 // vpinsrw $0x6,0x1c(%r8,%r11,2),%xmm2,%xmm3
.byte 196,227,109,56,211,1 // vinserti128 $0x1,%xmm3,%ymm2,%ymm2
@@ -44518,11 +44510,11 @@ _sk_load_565_dst_hsw_8bit:
.byte 196,129,122,111,36,88 // vmovdqu (%r8,%r11,2),%xmm4
.byte 196,227,93,56,219,1 // vinserti128 $0x1,%xmm3,%ymm4,%ymm3
.byte 196,227,101,2,210,192 // vpblendd $0xc0,%ymm2,%ymm3,%ymm2
- .byte 233,233,253,255,255 // jmpq 235d5 <_sk_load_565_dst_hsw_8bit+0x25>
+ .byte 233,233,253,255,255 // jmpq 235c1 <_sk_load_565_dst_hsw_8bit+0x25>
.byte 237 // in (%dx),%eax
.byte 254 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,251 // decl -0x4000001(%rip) # fffffffffc0237f4 <_sk_overlay_sse2_8bit+0xfffffffffbff7a1c>
+ .byte 255,13,255,255,255,251 // decl -0x4000001(%rip) # fffffffffc0237e0 <_sk_overlay_sse2_8bit+0xfffffffffbff7a1c>
.byte 254 // (bad)
.byte 255 // (bad)
.byte 255,76,255,255 // decl -0x1(%rdi,%rdi,8)
@@ -44565,7 +44557,7 @@ _sk_load_a8_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,35 // jne 23863 <_sk_load_a8_hsw_8bit+0x3b>
+ .byte 117,35 // jne 2384f <_sk_load_a8_hsw_8bit+0x3b>
.byte 196,129,122,111,4,24 // vmovdqu (%r8,%r11,1),%xmm0
.byte 197,249,112,200,78 // vpshufd $0x4e,%xmm0,%xmm1
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
@@ -44579,35 +44571,35 @@ _sk_load_a8_hsw_8bit:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,207 // ja 23846 <_sk_load_a8_hsw_8bit+0x1e>
+ .byte 119,207 // ja 23832 <_sk_load_a8_hsw_8bit+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,194,0,0,0 // lea 0xc2(%rip),%r10 # 23944 <_sk_load_a8_hsw_8bit+0x11c>
+ .byte 76,141,21,194,0,0,0 // lea 0xc2(%rip),%r10 # 23930 <_sk_load_a8_hsw_8bit+0x11c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,176 // jmp 23846 <_sk_load_a8_hsw_8bit+0x1e>
+ .byte 235,176 // jmp 23832 <_sk_load_a8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,2,2 // vpinsrb $0x2,0x2(%r8,%r11,1),%xmm0,%xmm0
.byte 67,15,183,4,24 // movzwl (%r8,%r11,1),%eax
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,227,121,14,193,1 // vpblendw $0x1,%xmm1,%xmm0,%xmm0
- .byte 235,147 // jmp 23846 <_sk_load_a8_hsw_8bit+0x1e>
+ .byte 235,147 // jmp 23832 <_sk_load_a8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,6,6 // vpinsrb $0x6,0x6(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,5,5 // vpinsrb $0x5,0x5(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,4,4 // vpinsrb $0x4,0x4(%r8,%r11,1),%xmm0,%xmm0
.byte 196,129,121,110,12,24 // vmovd (%r8,%r11,1),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,102,255,255,255 // jmpq 23846 <_sk_load_a8_hsw_8bit+0x1e>
+ .byte 233,102,255,255,255 // jmpq 23832 <_sk_load_a8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,10,10 // vpinsrb $0xa,0xa(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,9,9 // vpinsrb $0x9,0x9(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,8,8 // vpinsrb $0x8,0x8(%r8,%r11,1),%xmm0,%xmm0
.byte 196,129,122,126,12,24 // vmovq (%r8,%r11,1),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,57,255,255,255 // jmpq 23846 <_sk_load_a8_hsw_8bit+0x1e>
+ .byte 233,57,255,255,255 // jmpq 23832 <_sk_load_a8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,14,14 // vpinsrb $0xe,0xe(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,13,13 // vpinsrb $0xd,0xd(%r8,%r11,1),%xmm0,%xmm0
@@ -44615,7 +44607,7 @@ _sk_load_a8_hsw_8bit:
.byte 196,129,122,126,12,24 // vmovq (%r8,%r11,1),%xmm1
.byte 196,131,113,34,76,24,8,2 // vpinsrd $0x2,0x8(%r8,%r11,1),%xmm1,%xmm1
.byte 196,227,113,2,192,8 // vpblendd $0x8,%xmm0,%xmm1,%xmm0
- .byte 233,4,255,255,255 // jmpq 23846 <_sk_load_a8_hsw_8bit+0x1e>
+ .byte 233,4,255,255,255 // jmpq 23832 <_sk_load_a8_hsw_8bit+0x1e>
.byte 102,144 // xchg %ax,%ax
.byte 71,255 // rex.RXB (bad)
.byte 255 // (bad)
@@ -44627,7 +44619,7 @@ _sk_load_a8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 123,255 // jnp 23959 <_sk_load_a8_hsw_8bit+0x131>
+ .byte 123,255 // jnp 23945 <_sk_load_a8_hsw_8bit+0x131>
.byte 255 // (bad)
.byte 255,111,255 // ljmp *-0x1(%rdi)
.byte 255 // (bad)
@@ -44663,7 +44655,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,35 // jne 239bb <_sk_load_a8_dst_hsw_8bit+0x3b>
+ .byte 117,35 // jne 239a7 <_sk_load_a8_dst_hsw_8bit+0x3b>
.byte 196,129,122,111,20,24 // vmovdqu (%r8,%r11,1),%xmm2
.byte 197,249,112,218,78 // vpshufd $0x4e,%xmm2,%xmm3
.byte 196,226,125,49,219 // vpmovzxbd %xmm3,%ymm3
@@ -44677,35 +44669,35 @@ _sk_load_a8_dst_hsw_8bit:
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,207 // ja 2399e <_sk_load_a8_dst_hsw_8bit+0x1e>
+ .byte 119,207 // ja 2398a <_sk_load_a8_dst_hsw_8bit+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,194,0,0,0 // lea 0xc2(%rip),%r10 # 23a9c <_sk_load_a8_dst_hsw_8bit+0x11c>
+ .byte 76,141,21,194,0,0,0 // lea 0xc2(%rip),%r10 # 23a88 <_sk_load_a8_dst_hsw_8bit+0x11c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
- .byte 235,176 // jmp 2399e <_sk_load_a8_dst_hsw_8bit+0x1e>
+ .byte 235,176 // jmp 2398a <_sk_load_a8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,2,2 // vpinsrb $0x2,0x2(%r8,%r11,1),%xmm2,%xmm2
.byte 67,15,183,4,24 // movzwl (%r8,%r11,1),%eax
.byte 197,249,110,216 // vmovd %eax,%xmm3
.byte 196,227,105,14,211,1 // vpblendw $0x1,%xmm3,%xmm2,%xmm2
- .byte 235,147 // jmp 2399e <_sk_load_a8_dst_hsw_8bit+0x1e>
+ .byte 235,147 // jmp 2398a <_sk_load_a8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,6,6 // vpinsrb $0x6,0x6(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,5,5 // vpinsrb $0x5,0x5(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,4,4 // vpinsrb $0x4,0x4(%r8,%r11,1),%xmm2,%xmm2
.byte 196,129,121,110,28,24 // vmovd (%r8,%r11,1),%xmm3
.byte 196,227,105,2,211,1 // vpblendd $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,102,255,255,255 // jmpq 2399e <_sk_load_a8_dst_hsw_8bit+0x1e>
+ .byte 233,102,255,255,255 // jmpq 2398a <_sk_load_a8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,10,10 // vpinsrb $0xa,0xa(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,9,9 // vpinsrb $0x9,0x9(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,8,8 // vpinsrb $0x8,0x8(%r8,%r11,1),%xmm2,%xmm2
.byte 196,129,122,126,28,24 // vmovq (%r8,%r11,1),%xmm3
.byte 196,227,97,2,210,12 // vpblendd $0xc,%xmm2,%xmm3,%xmm2
- .byte 233,57,255,255,255 // jmpq 2399e <_sk_load_a8_dst_hsw_8bit+0x1e>
+ .byte 233,57,255,255,255 // jmpq 2398a <_sk_load_a8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,14,14 // vpinsrb $0xe,0xe(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,13,13 // vpinsrb $0xd,0xd(%r8,%r11,1),%xmm2,%xmm2
@@ -44713,7 +44705,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 196,129,122,126,28,24 // vmovq (%r8,%r11,1),%xmm3
.byte 196,131,97,34,92,24,8,2 // vpinsrd $0x2,0x8(%r8,%r11,1),%xmm3,%xmm3
.byte 196,227,97,2,210,8 // vpblendd $0x8,%xmm2,%xmm3,%xmm2
- .byte 233,4,255,255,255 // jmpq 2399e <_sk_load_a8_dst_hsw_8bit+0x1e>
+ .byte 233,4,255,255,255 // jmpq 2398a <_sk_load_a8_dst_hsw_8bit+0x1e>
.byte 102,144 // xchg %ax,%ax
.byte 71,255 // rex.RXB (bad)
.byte 255 // (bad)
@@ -44725,7 +44717,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 123,255 // jnp 23ab1 <_sk_load_a8_dst_hsw_8bit+0x131>
+ .byte 123,255 // jnp 23a9d <_sk_load_a8_dst_hsw_8bit+0x131>
.byte 255 // (bad)
.byte 255,111,255 // ljmp *-0x1(%rdi)
.byte 255 // (bad)
@@ -44760,17 +44752,17 @@ _sk_store_a8_hsw_8bit:
.byte 77,15,175,193 // imul %r9,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 197,253,111,37,141,142,0,0 // vmovdqa 0x8e8d(%rip),%ymm4 # 2c980 <_sk_overlay_sse2_8bit+0xba8>
+ .byte 197,253,111,37,225,140,0,0 // vmovdqa 0x8ce1(%rip),%ymm4 # 2c7c0 <_sk_overlay_sse2_8bit+0x9fc>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,227,253,0,237,232 // vpermq $0xe8,%ymm5,%ymm5
- .byte 197,249,111,53,186,152,0,0 // vmovdqa 0x98ba(%rip),%xmm6 # 2d3c0 <_sk_overlay_sse2_8bit+0x15e8>
+ .byte 197,249,111,53,174,152,0,0 // vmovdqa 0x98ae(%rip),%xmm6 # 2d3a0 <_sk_overlay_sse2_8bit+0x15dc>
.byte 196,226,81,0,238 // vpshufb %xmm6,%xmm5,%xmm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 196,227,253,0,228,232 // vpermq $0xe8,%ymm4,%ymm4
.byte 196,226,89,0,230 // vpshufb %xmm6,%xmm4,%xmm4
.byte 197,217,108,229 // vpunpcklqdq %xmm5,%xmm4,%xmm4
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 23b2e <_sk_store_a8_hsw_8bit+0x56>
+ .byte 117,10 // jne 23b1a <_sk_store_a8_hsw_8bit+0x56>
.byte 196,129,122,127,36,24 // vmovdqu %xmm4,(%r8,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -44778,34 +44770,34 @@ _sk_store_a8_hsw_8bit:
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,236 // ja 23b2a <_sk_store_a8_hsw_8bit+0x52>
+ .byte 119,236 // ja 23b16 <_sk_store_a8_hsw_8bit+0x52>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,139,0,0,0 // lea 0x8b(%rip),%r10 # 23bd4 <_sk_store_a8_hsw_8bit+0xfc>
+ .byte 76,141,21,139,0,0,0 // lea 0x8b(%rip),%r10 # 23bc0 <_sk_store_a8_hsw_8bit+0xfc>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,131,121,20,36,24,0 // vpextrb $0x0,%xmm4,(%r8,%r11,1)
- .byte 235,207 // jmp 23b2a <_sk_store_a8_hsw_8bit+0x52>
+ .byte 235,207 // jmp 23b16 <_sk_store_a8_hsw_8bit+0x52>
.byte 196,131,121,20,100,24,2,2 // vpextrb $0x2,%xmm4,0x2(%r8,%r11,1)
.byte 196,131,121,21,36,24,0 // vpextrw $0x0,%xmm4,(%r8,%r11,1)
- .byte 235,190 // jmp 23b2a <_sk_store_a8_hsw_8bit+0x52>
+ .byte 235,190 // jmp 23b16 <_sk_store_a8_hsw_8bit+0x52>
.byte 196,131,121,20,100,24,6,6 // vpextrb $0x6,%xmm4,0x6(%r8,%r11,1)
.byte 196,131,121,20,100,24,5,5 // vpextrb $0x5,%xmm4,0x5(%r8,%r11,1)
.byte 196,131,121,20,100,24,4,4 // vpextrb $0x4,%xmm4,0x4(%r8,%r11,1)
.byte 196,129,121,126,36,24 // vmovd %xmm4,(%r8,%r11,1)
- .byte 235,158 // jmp 23b2a <_sk_store_a8_hsw_8bit+0x52>
+ .byte 235,158 // jmp 23b16 <_sk_store_a8_hsw_8bit+0x52>
.byte 196,131,121,20,100,24,10,10 // vpextrb $0xa,%xmm4,0xa(%r8,%r11,1)
.byte 196,131,121,20,100,24,9,9 // vpextrb $0x9,%xmm4,0x9(%r8,%r11,1)
.byte 196,131,121,20,100,24,8,8 // vpextrb $0x8,%xmm4,0x8(%r8,%r11,1)
- .byte 235,32 // jmp 23bc6 <_sk_store_a8_hsw_8bit+0xee>
+ .byte 235,32 // jmp 23bb2 <_sk_store_a8_hsw_8bit+0xee>
.byte 196,131,121,20,100,24,14,14 // vpextrb $0xe,%xmm4,0xe(%r8,%r11,1)
.byte 196,131,121,20,100,24,13,13 // vpextrb $0xd,%xmm4,0xd(%r8,%r11,1)
.byte 196,131,121,20,100,24,12,12 // vpextrb $0xc,%xmm4,0xc(%r8,%r11,1)
.byte 196,131,121,22,100,24,8,2 // vpextrd $0x2,%xmm4,0x8(%r8,%r11,1)
.byte 196,129,121,214,36,24 // vmovq %xmm4,(%r8,%r11,1)
- .byte 233,89,255,255,255 // jmpq 23b2a <_sk_store_a8_hsw_8bit+0x52>
+ .byte 233,89,255,255,255 // jmpq 23b16 <_sk_store_a8_hsw_8bit+0x52>
.byte 15,31,0 // nopl (%rax)
- .byte 126,255 // jle 23bd5 <_sk_store_a8_hsw_8bit+0xfd>
+ .byte 126,255 // jle 23bc1 <_sk_store_a8_hsw_8bit+0xfd>
.byte 255 // (bad)
.byte 255,143,255,255,255,135 // decl -0x78000001(%rdi)
.byte 255 // (bad)
@@ -44851,15 +44843,15 @@ _sk_load_g8_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,61 // jne 23c65 <_sk_load_g8_hsw_8bit+0x55>
+ .byte 117,61 // jne 23c51 <_sk_load_g8_hsw_8bit+0x55>
.byte 196,129,122,111,4,24 // vmovdqu (%r8,%r11,1),%xmm0
.byte 196,226,125,49,200 // vpmovzxbd %xmm0,%ymm1
.byte 197,249,112,192,78 // vpshufd $0x4e,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
- .byte 196,226,125,88,37,110,135,0,0 // vpbroadcastd 0x876e(%rip),%ymm4 # 2c3b4 <_sk_overlay_sse2_8bit+0x5dc>
+ .byte 196,226,125,88,37,54,144,0,0 // vpbroadcastd 0x9036(%rip),%ymm4 # 2cc68 <_sk_overlay_sse2_8bit+0xea4>
.byte 196,226,125,64,236 // vpmulld %ymm4,%ymm0,%ymm5
.byte 196,226,117,64,196 // vpmulld %ymm4,%ymm1,%ymm0
- .byte 196,226,125,88,13,87,135,0,0 // vpbroadcastd 0x8757(%rip),%ymm1 # 2c3b0 <_sk_overlay_sse2_8bit+0x5d8>
+ .byte 196,226,125,88,13,31,144,0,0 // vpbroadcastd 0x901f(%rip),%ymm1 # 2cc64 <_sk_overlay_sse2_8bit+0xea0>
.byte 197,253,235,193 // vpor %ymm1,%ymm0,%ymm0
.byte 197,213,235,201 // vpor %ymm1,%ymm5,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44869,35 +44861,35 @@ _sk_load_g8_hsw_8bit:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,181 // ja 23c2e <_sk_load_g8_hsw_8bit+0x1e>
+ .byte 119,181 // ja 23c1a <_sk_load_g8_hsw_8bit+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,196,0,0,0 // lea 0xc4(%rip),%r10 # 23d48 <_sk_load_g8_hsw_8bit+0x138>
+ .byte 76,141,21,196,0,0,0 // lea 0xc4(%rip),%r10 # 23d34 <_sk_load_g8_hsw_8bit+0x138>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,150 // jmp 23c2e <_sk_load_g8_hsw_8bit+0x1e>
+ .byte 235,150 // jmp 23c1a <_sk_load_g8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,2,2 // vpinsrb $0x2,0x2(%r8,%r11,1),%xmm0,%xmm0
.byte 67,15,183,4,24 // movzwl (%r8,%r11,1),%eax
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,227,121,14,193,1 // vpblendw $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,118,255,255,255 // jmpq 23c2e <_sk_load_g8_hsw_8bit+0x1e>
+ .byte 233,118,255,255,255 // jmpq 23c1a <_sk_load_g8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,6,6 // vpinsrb $0x6,0x6(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,5,5 // vpinsrb $0x5,0x5(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,4,4 // vpinsrb $0x4,0x4(%r8,%r11,1),%xmm0,%xmm0
.byte 196,129,121,110,12,24 // vmovd (%r8,%r11,1),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,73,255,255,255 // jmpq 23c2e <_sk_load_g8_hsw_8bit+0x1e>
+ .byte 233,73,255,255,255 // jmpq 23c1a <_sk_load_g8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,10,10 // vpinsrb $0xa,0xa(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,9,9 // vpinsrb $0x9,0x9(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,8,8 // vpinsrb $0x8,0x8(%r8,%r11,1),%xmm0,%xmm0
.byte 196,129,122,126,12,24 // vmovq (%r8,%r11,1),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,28,255,255,255 // jmpq 23c2e <_sk_load_g8_hsw_8bit+0x1e>
+ .byte 233,28,255,255,255 // jmpq 23c1a <_sk_load_g8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,14,14 // vpinsrb $0xe,0xe(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,13,13 // vpinsrb $0xd,0xd(%r8,%r11,1),%xmm0,%xmm0
@@ -44905,7 +44897,7 @@ _sk_load_g8_hsw_8bit:
.byte 196,129,122,126,12,24 // vmovq (%r8,%r11,1),%xmm1
.byte 196,131,113,34,76,24,8,2 // vpinsrd $0x2,0x8(%r8,%r11,1),%xmm1,%xmm1
.byte 196,227,113,2,192,8 // vpblendd $0x8,%xmm0,%xmm1,%xmm0
- .byte 233,231,254,255,255 // jmpq 23c2e <_sk_load_g8_hsw_8bit+0x1e>
+ .byte 233,231,254,255,255 // jmpq 23c1a <_sk_load_g8_hsw_8bit+0x1e>
.byte 144 // nop
.byte 69,255 // rex.RB (bad)
.byte 255 // (bad)
@@ -44915,7 +44907,7 @@ _sk_load_g8_hsw_8bit:
.byte 255,140,255,255,255,132,255 // decl -0x7b0001(%rdi,%rdi,8)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 124,255 // jl 23d5d <_sk_load_g8_hsw_8bit+0x14d>
+ .byte 124,255 // jl 23d49 <_sk_load_g8_hsw_8bit+0x14d>
.byte 255 // (bad)
.byte 255,112,255 // pushq -0x1(%rax)
.byte 255 // (bad)
@@ -44951,15 +44943,15 @@ _sk_load_g8_dst_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,61 // jne 23dd9 <_sk_load_g8_dst_hsw_8bit+0x55>
+ .byte 117,61 // jne 23dc5 <_sk_load_g8_dst_hsw_8bit+0x55>
.byte 196,129,122,111,20,24 // vmovdqu (%r8,%r11,1),%xmm2
.byte 196,226,125,49,218 // vpmovzxbd %xmm2,%ymm3
.byte 197,249,112,210,78 // vpshufd $0x4e,%xmm2,%xmm2
.byte 196,226,125,49,210 // vpmovzxbd %xmm2,%ymm2
- .byte 196,226,125,88,37,250,133,0,0 // vpbroadcastd 0x85fa(%rip),%ymm4 # 2c3b4 <_sk_overlay_sse2_8bit+0x5dc>
+ .byte 196,226,125,88,37,194,142,0,0 // vpbroadcastd 0x8ec2(%rip),%ymm4 # 2cc68 <_sk_overlay_sse2_8bit+0xea4>
.byte 196,226,109,64,236 // vpmulld %ymm4,%ymm2,%ymm5
.byte 196,226,101,64,212 // vpmulld %ymm4,%ymm3,%ymm2
- .byte 196,226,125,88,29,227,133,0,0 // vpbroadcastd 0x85e3(%rip),%ymm3 # 2c3b0 <_sk_overlay_sse2_8bit+0x5d8>
+ .byte 196,226,125,88,29,171,142,0,0 // vpbroadcastd 0x8eab(%rip),%ymm3 # 2cc64 <_sk_overlay_sse2_8bit+0xea0>
.byte 197,237,235,211 // vpor %ymm3,%ymm2,%ymm2
.byte 197,213,235,219 // vpor %ymm3,%ymm5,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44969,35 +44961,35 @@ _sk_load_g8_dst_hsw_8bit:
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,181 // ja 23da2 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ .byte 119,181 // ja 23d8e <_sk_load_g8_dst_hsw_8bit+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,196,0,0,0 // lea 0xc4(%rip),%r10 # 23ebc <_sk_load_g8_dst_hsw_8bit+0x138>
+ .byte 76,141,21,196,0,0,0 // lea 0xc4(%rip),%r10 # 23ea8 <_sk_load_g8_dst_hsw_8bit+0x138>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
- .byte 235,150 // jmp 23da2 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ .byte 235,150 // jmp 23d8e <_sk_load_g8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,2,2 // vpinsrb $0x2,0x2(%r8,%r11,1),%xmm2,%xmm2
.byte 67,15,183,4,24 // movzwl (%r8,%r11,1),%eax
.byte 197,249,110,216 // vmovd %eax,%xmm3
.byte 196,227,105,14,211,1 // vpblendw $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,118,255,255,255 // jmpq 23da2 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ .byte 233,118,255,255,255 // jmpq 23d8e <_sk_load_g8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,6,6 // vpinsrb $0x6,0x6(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,5,5 // vpinsrb $0x5,0x5(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,4,4 // vpinsrb $0x4,0x4(%r8,%r11,1),%xmm2,%xmm2
.byte 196,129,121,110,28,24 // vmovd (%r8,%r11,1),%xmm3
.byte 196,227,105,2,211,1 // vpblendd $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,73,255,255,255 // jmpq 23da2 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ .byte 233,73,255,255,255 // jmpq 23d8e <_sk_load_g8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,10,10 // vpinsrb $0xa,0xa(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,9,9 // vpinsrb $0x9,0x9(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,8,8 // vpinsrb $0x8,0x8(%r8,%r11,1),%xmm2,%xmm2
.byte 196,129,122,126,28,24 // vmovq (%r8,%r11,1),%xmm3
.byte 196,227,97,2,210,12 // vpblendd $0xc,%xmm2,%xmm3,%xmm2
- .byte 233,28,255,255,255 // jmpq 23da2 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ .byte 233,28,255,255,255 // jmpq 23d8e <_sk_load_g8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,14,14 // vpinsrb $0xe,0xe(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,13,13 // vpinsrb $0xd,0xd(%r8,%r11,1),%xmm2,%xmm2
@@ -45005,7 +44997,7 @@ _sk_load_g8_dst_hsw_8bit:
.byte 196,129,122,126,28,24 // vmovq (%r8,%r11,1),%xmm3
.byte 196,131,97,34,92,24,8,2 // vpinsrd $0x2,0x8(%r8,%r11,1),%xmm3,%xmm3
.byte 196,227,97,2,210,8 // vpblendd $0x8,%xmm2,%xmm3,%xmm2
- .byte 233,231,254,255,255 // jmpq 23da2 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ .byte 233,231,254,255,255 // jmpq 23d8e <_sk_load_g8_dst_hsw_8bit+0x1e>
.byte 144 // nop
.byte 69,255 // rex.RB (bad)
.byte 255 // (bad)
@@ -45015,7 +45007,7 @@ _sk_load_g8_dst_hsw_8bit:
.byte 255,140,255,255,255,132,255 // decl -0x7b0001(%rdi,%rdi,8)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 124,255 // jl 23ed1 <_sk_load_g8_dst_hsw_8bit+0x14d>
+ .byte 124,255 // jl 23ebd <_sk_load_g8_dst_hsw_8bit+0x14d>
.byte 255 // (bad)
.byte 255,112,255 // pushq -0x1(%rax)
.byte 255 // (bad)
@@ -45052,10 +45044,10 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,222,0,0,0 // jne 23ff6 <_sk_srcover_rgba_8888_hsw_8bit+0xfe>
+ .byte 15,133,222,0,0,0 // jne 23fe2 <_sk_srcover_rgba_8888_hsw_8bit+0xfe>
.byte 196,1,126,111,76,152,32 // vmovdqu 0x20(%r8,%r11,4),%ymm9
.byte 196,1,126,111,28,152 // vmovdqu (%r8,%r11,4),%ymm11
- .byte 197,253,111,53,115,138,0,0 // vmovdqa 0x8a73(%rip),%ymm6 # 2c9a0 <_sk_overlay_sse2_8bit+0xbc8>
+ .byte 197,253,111,53,199,136,0,0 // vmovdqa 0x88c7(%rip),%ymm6 # 2c7e0 <_sk_overlay_sse2_8bit+0xa1c>
.byte 196,226,117,0,254 // vpshufb %ymm6,%ymm1,%ymm7
.byte 196,226,125,0,246 // vpshufb %ymm6,%ymm0,%ymm6
.byte 196,66,125,48,195 // vpmovzxbw %xmm11,%ymm8
@@ -45093,7 +45085,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 197,221,252,224 // vpaddb %ymm0,%ymm4,%ymm4
.byte 197,213,252,233 // vpaddb %ymm1,%ymm5,%ymm5
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,78 // jne 24033 <_sk_srcover_rgba_8888_hsw_8bit+0x13b>
+ .byte 117,78 // jne 2401f <_sk_srcover_rgba_8888_hsw_8bit+0x13b>
.byte 196,129,126,127,36,152 // vmovdqu %ymm4,(%r8,%r11,4)
.byte 196,129,126,127,108,152,32 // vmovdqu %ymm5,0x20(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -45104,26 +45096,26 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,65,37,239,219 // vpxor %ymm11,%ymm11,%ymm11
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 15,135,17,255,255,255 // ja 23f25 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ .byte 15,135,17,255,255,255 // ja 23f11 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,237,1,0,0 // lea 0x1ed(%rip),%r10 # 2420c <_sk_srcover_rgba_8888_hsw_8bit+0x314>
+ .byte 76,141,21,237,1,0,0 // lea 0x1ed(%rip),%r10 # 241f8 <_sk_srcover_rgba_8888_hsw_8bit+0x314>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,121,110,28,152 // vmovd (%r8,%r11,4),%xmm11
- .byte 233,242,254,255,255 // jmpq 23f25 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ .byte 233,242,254,255,255 // jmpq 23f11 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,175 // ja 23ff2 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ .byte 119,175 // ja 23fde <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 76,141,13,250,1,0,0 // lea 0x1fa(%rip),%r9 # 24248 <_sk_srcover_rgba_8888_hsw_8bit+0x350>
+ .byte 76,141,13,250,1,0,0 // lea 0x1fa(%rip),%r9 # 24234 <_sk_srcover_rgba_8888_hsw_8bit+0x350>
.byte 73,99,4,129 // movslq (%r9,%rax,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
.byte 196,129,121,126,36,152 // vmovd %xmm4,(%r8,%r11,4)
- .byte 235,147 // jmp 23ff2 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ .byte 235,147 // jmp 23fde <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
.byte 196,129,121,110,100,152,8 // vmovd 0x8(%r8,%r11,4),%xmm4
.byte 196,226,121,89,236 // vpbroadcastq %xmm4,%xmm5
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
@@ -45131,7 +45123,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,130,121,53,52,152 // vpmovzxdq (%r8,%r11,4),%xmm6
.byte 197,249,112,246,232 // vpshufd $0xe8,%xmm6,%xmm6
.byte 196,99,37,2,222,3 // vpblendd $0x3,%ymm6,%ymm11,%ymm11
- .byte 233,153,254,255,255 // jmpq 23f25 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ .byte 233,153,254,255,255 // jmpq 23f11 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
.byte 196,129,121,110,100,152,24 // vmovd 0x18(%r8,%r11,4),%xmm4
.byte 196,226,125,89,236 // vpbroadcastq %xmm4,%ymm5
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
@@ -45144,7 +45136,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,99,37,56,222,1 // vinserti128 $0x1,%xmm6,%ymm11,%ymm11
.byte 196,129,122,111,52,152 // vmovdqu (%r8,%r11,4),%xmm6
.byte 196,67,77,2,219,240 // vpblendd $0xf0,%ymm11,%ymm6,%ymm11
- .byte 233,73,254,255,255 // jmpq 23f25 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ .byte 233,73,254,255,255 // jmpq 23f11 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
.byte 196,129,121,110,100,152,40 // vmovd 0x28(%r8,%r11,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -45153,7 +45145,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,99,53,2,205,15 // vpblendd $0xf,%ymm5,%ymm9,%ymm9
.byte 196,129,121,110,108,152,32 // vmovd 0x20(%r8,%r11,4),%xmm5
.byte 196,99,53,2,205,1 // vpblendd $0x1,%ymm5,%ymm9,%ymm9
- .byte 233,13,254,255,255 // jmpq 23f1f <_sk_srcover_rgba_8888_hsw_8bit+0x27>
+ .byte 233,13,254,255,255 // jmpq 23f0b <_sk_srcover_rgba_8888_hsw_8bit+0x27>
.byte 196,129,121,110,100,152,56 // vmovd 0x38(%r8,%r11,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -45167,10 +45159,10 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,1,126,111,28,152 // vmovdqu (%r8,%r11,4),%ymm11
.byte 196,129,122,111,116,152,32 // vmovdqu 0x20(%r8,%r11,4),%xmm6
.byte 196,67,77,2,201,240 // vpblendd $0xf0,%ymm9,%ymm6,%ymm9
- .byte 233,189,253,255,255 // jmpq 23f25 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ .byte 233,189,253,255,255 // jmpq 23f11 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
.byte 196,131,121,22,100,152,8,2 // vpextrd $0x2,%xmm4,0x8(%r8,%r11,4)
.byte 196,129,121,214,36,152 // vmovq %xmm4,(%r8,%r11,4)
- .byte 233,119,254,255,255 // jmpq 23ff2 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ .byte 233,119,254,255,255 // jmpq 23fde <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,131,121,22,108,152,24,2 // vpextrd $0x2,%xmm5,0x18(%r8,%r11,4)
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
@@ -45178,12 +45170,12 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,129,121,126,108,152,16 // vmovd %xmm5,0x10(%r8,%r11,4)
.byte 196,129,122,127,36,152 // vmovdqu %xmm4,(%r8,%r11,4)
- .byte 233,67,254,255,255 // jmpq 23ff2 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ .byte 233,67,254,255,255 // jmpq 23fde <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
.byte 196,131,121,22,108,152,40,2 // vpextrd $0x2,%xmm5,0x28(%r8,%r11,4)
.byte 196,131,121,22,108,152,36,1 // vpextrd $0x1,%xmm5,0x24(%r8,%r11,4)
.byte 196,129,121,126,108,152,32 // vmovd %xmm5,0x20(%r8,%r11,4)
.byte 196,129,126,127,36,152 // vmovdqu %ymm4,(%r8,%r11,4)
- .byte 233,33,254,255,255 // jmpq 23ff2 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ .byte 233,33,254,255,255 // jmpq 23fde <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
.byte 196,131,121,22,116,152,56,2 // vpextrd $0x2,%xmm6,0x38(%r8,%r11,4)
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
@@ -45192,7 +45184,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,129,121,126,116,152,48 // vmovd %xmm6,0x30(%r8,%r11,4)
.byte 196,129,126,127,36,152 // vmovdqu %ymm4,(%r8,%r11,4)
.byte 196,129,122,127,108,152,32 // vmovdqu %xmm5,0x20(%r8,%r11,4)
- .byte 233,230,253,255,255 // jmpq 23ff2 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ .byte 233,230,253,255,255 // jmpq 23fde <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
.byte 28,254 // sbb $0xfe,%al
.byte 255 // (bad)
.byte 255,106,254 // ljmp *-0x2(%rdx)
@@ -45245,7 +45237,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 126,255 // jle 24265 <_sk_srcover_rgba_8888_hsw_8bit+0x36d>
+ .byte 126,255 // jle 24251 <_sk_srcover_rgba_8888_hsw_8bit+0x36d>
.byte 255 // (bad)
.byte 255,119,255 // pushq -0x1(%rdi)
.byte 255 // (bad)
@@ -45267,7 +45259,7 @@ FUNCTION(_sk_scale_1_float_hsw_8bit)
_sk_scale_1_float_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,250,16,32 // vmovss (%rax),%xmm4
- .byte 197,218,89,37,178,127,0,0 // vmulss 0x7fb2(%rip),%xmm4,%xmm4 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 197,218,89,37,122,136,0,0 // vmulss 0x887a(%rip),%xmm4,%xmm4 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 197,250,44,196 // vcvttss2si %xmm4,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,120,228 // vpbroadcastb %xmm4,%ymm4
@@ -45277,7 +45269,7 @@ _sk_scale_1_float_hsw_8bit:
.byte 196,226,125,48,241 // vpmovzxbw %xmm1,%ymm6
.byte 196,227,125,57,201,1 // vextracti128 $0x1,%ymm1,%xmm1
.byte 196,226,125,48,201 // vpmovzxbw %xmm1,%ymm1
- .byte 197,221,219,37,249,134,0,0 // vpand 0x86f9(%rip),%ymm4,%ymm4 # 2c9c0 <_sk_overlay_sse2_8bit+0xbe8>
+ .byte 197,221,219,37,77,133,0,0 // vpand 0x854d(%rip),%ymm4,%ymm4 # 2c800 <_sk_overlay_sse2_8bit+0xa3c>
.byte 197,221,213,249 // vpmullw %ymm1,%ymm4,%ymm7
.byte 197,93,213,198 // vpmullw %ymm6,%ymm4,%ymm8
.byte 197,93,213,200 // vpmullw %ymm0,%ymm4,%ymm9
@@ -45310,12 +45302,12 @@ _sk_scale_u8_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,191,0,0,0 // jne 243fa <_sk_scale_u8_hsw_8bit+0xdb>
+ .byte 15,133,191,0,0,0 // jne 243e6 <_sk_scale_u8_hsw_8bit+0xdb>
.byte 196,129,122,111,36,24 // vmovdqu (%r8,%r11,1),%xmm4
.byte 196,226,125,49,236 // vpmovzxbd %xmm4,%ymm5
.byte 197,249,112,228,78 // vpshufd $0x4e,%xmm4,%xmm4
.byte 196,226,125,49,228 // vpmovzxbd %xmm4,%ymm4
- .byte 197,253,111,53,136,134,0,0 // vmovdqa 0x8688(%rip),%ymm6 # 2c9e0 <_sk_overlay_sse2_8bit+0xc08>
+ .byte 197,253,111,53,220,132,0,0 // vmovdqa 0x84dc(%rip),%ymm6 # 2c820 <_sk_overlay_sse2_8bit+0xa5c>
.byte 196,226,93,0,230 // vpshufb %ymm6,%ymm4,%ymm4
.byte 196,226,85,0,238 // vpshufb %ymm6,%ymm5,%ymm5
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -45355,35 +45347,35 @@ _sk_scale_u8_hsw_8bit:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 15,135,47,255,255,255 // ja 24341 <_sk_scale_u8_hsw_8bit+0x22>
+ .byte 15,135,47,255,255,255 // ja 2432d <_sk_scale_u8_hsw_8bit+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,199,0,0,0 // lea 0xc7(%rip),%r10 # 244e4 <_sk_scale_u8_hsw_8bit+0x1c5>
+ .byte 76,141,21,199,0,0,0 // lea 0xc7(%rip),%r10 # 244d0 <_sk_scale_u8_hsw_8bit+0x1c5>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,13,255,255,255 // jmpq 24341 <_sk_scale_u8_hsw_8bit+0x22>
+ .byte 233,13,255,255,255 // jmpq 2432d <_sk_scale_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,2,2 // vpinsrb $0x2,0x2(%r8,%r11,1),%xmm4,%xmm4
.byte 67,15,183,4,24 // movzwl (%r8,%r11,1),%eax
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,227,89,14,229,1 // vpblendw $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,237,254,255,255 // jmpq 24341 <_sk_scale_u8_hsw_8bit+0x22>
+ .byte 233,237,254,255,255 // jmpq 2432d <_sk_scale_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,6,6 // vpinsrb $0x6,0x6(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,5,5 // vpinsrb $0x5,0x5(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,4,4 // vpinsrb $0x4,0x4(%r8,%r11,1),%xmm4,%xmm4
.byte 196,129,121,110,44,24 // vmovd (%r8,%r11,1),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,192,254,255,255 // jmpq 24341 <_sk_scale_u8_hsw_8bit+0x22>
+ .byte 233,192,254,255,255 // jmpq 2432d <_sk_scale_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,10,10 // vpinsrb $0xa,0xa(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,9,9 // vpinsrb $0x9,0x9(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,8,8 // vpinsrb $0x8,0x8(%r8,%r11,1),%xmm4,%xmm4
.byte 196,129,122,126,44,24 // vmovq (%r8,%r11,1),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,147,254,255,255 // jmpq 24341 <_sk_scale_u8_hsw_8bit+0x22>
+ .byte 233,147,254,255,255 // jmpq 2432d <_sk_scale_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,14,14 // vpinsrb $0xe,0xe(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,13,13 // vpinsrb $0xd,0xd(%r8,%r11,1),%xmm4,%xmm4
@@ -45391,7 +45383,7 @@ _sk_scale_u8_hsw_8bit:
.byte 196,129,122,126,44,24 // vmovq (%r8,%r11,1),%xmm5
.byte 196,131,81,34,108,24,8,2 // vpinsrd $0x2,0x8(%r8,%r11,1),%xmm5,%xmm5
.byte 196,227,81,2,228,8 // vpblendd $0x8,%xmm4,%xmm5,%xmm4
- .byte 233,94,254,255,255 // jmpq 24341 <_sk_scale_u8_hsw_8bit+0x22>
+ .byte 233,94,254,255,255 // jmpq 2432d <_sk_scale_u8_hsw_8bit+0x22>
.byte 144 // nop
.byte 66,255 // rex.X (bad)
.byte 255 // (bad)
@@ -45401,7 +45393,7 @@ _sk_scale_u8_hsw_8bit:
.byte 255,140,255,255,255,132,255 // decl -0x7b0001(%rdi,%rdi,8)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 124,255 // jl 244f9 <_sk_scale_u8_hsw_8bit+0x1da>
+ .byte 124,255 // jl 244e5 <_sk_scale_u8_hsw_8bit+0x1da>
.byte 255 // (bad)
.byte 255,112,255 // pushq -0x1(%rax)
.byte 255 // (bad)
@@ -45432,7 +45424,7 @@ FUNCTION(_sk_lerp_1_float_hsw_8bit)
_sk_lerp_1_float_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,250,16,32 // vmovss (%rax),%xmm4
- .byte 197,218,89,37,22,125,0,0 // vmulss 0x7d16(%rip),%xmm4,%xmm4 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 197,218,89,37,222,133,0,0 // vmulss 0x85de(%rip),%xmm4,%xmm4 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 197,250,44,196 // vcvttss2si %xmm4,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,120,228 // vpbroadcastb %xmm4,%ymm4
@@ -45442,7 +45434,7 @@ _sk_lerp_1_float_hsw_8bit:
.byte 196,226,125,48,241 // vpmovzxbw %xmm1,%ymm6
.byte 196,227,125,57,201,1 // vextracti128 $0x1,%ymm1,%xmm1
.byte 196,226,125,48,201 // vpmovzxbw %xmm1,%ymm1
- .byte 197,221,219,61,157,132,0,0 // vpand 0x849d(%rip),%ymm4,%ymm7 # 2ca00 <_sk_overlay_sse2_8bit+0xc28>
+ .byte 197,221,219,61,241,130,0,0 // vpand 0x82f1(%rip),%ymm4,%ymm7 # 2c840 <_sk_overlay_sse2_8bit+0xa7c>
.byte 197,69,213,193 // vpmullw %ymm1,%ymm7,%ymm8
.byte 197,69,213,206 // vpmullw %ymm6,%ymm7,%ymm9
.byte 197,69,213,208 // vpmullw %ymm0,%ymm7,%ymm10
@@ -45506,12 +45498,12 @@ _sk_lerp_u8_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,106,1,0,0 // jne 247d6 <_sk_lerp_u8_hsw_8bit+0x186>
+ .byte 15,133,106,1,0,0 // jne 247c2 <_sk_lerp_u8_hsw_8bit+0x186>
.byte 196,129,122,111,36,24 // vmovdqu (%r8,%r11,1),%xmm4
.byte 196,226,125,49,236 // vpmovzxbd %xmm4,%ymm5
.byte 197,249,112,228,78 // vpshufd $0x4e,%xmm4,%xmm4
.byte 196,226,125,49,228 // vpmovzxbd %xmm4,%ymm4
- .byte 197,253,111,53,151,131,0,0 // vmovdqa 0x8397(%rip),%ymm6 # 2ca20 <_sk_overlay_sse2_8bit+0xc48>
+ .byte 197,253,111,53,235,129,0,0 // vmovdqa 0x81eb(%rip),%ymm6 # 2c860 <_sk_overlay_sse2_8bit+0xa9c>
.byte 196,98,93,0,206 // vpshufb %ymm6,%ymm4,%ymm9
.byte 196,98,85,0,222 // vpshufb %ymm6,%ymm5,%ymm11
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -45586,35 +45578,35 @@ _sk_lerp_u8_hsw_8bit:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 15,135,132,254,255,255 // ja 24672 <_sk_lerp_u8_hsw_8bit+0x22>
+ .byte 15,135,132,254,255,255 // ja 2465e <_sk_lerp_u8_hsw_8bit+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,199,0,0,0 // lea 0xc7(%rip),%r10 # 248c0 <_sk_lerp_u8_hsw_8bit+0x270>
+ .byte 76,141,21,199,0,0,0 // lea 0xc7(%rip),%r10 # 248ac <_sk_lerp_u8_hsw_8bit+0x270>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,98,254,255,255 // jmpq 24672 <_sk_lerp_u8_hsw_8bit+0x22>
+ .byte 233,98,254,255,255 // jmpq 2465e <_sk_lerp_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,2,2 // vpinsrb $0x2,0x2(%r8,%r11,1),%xmm4,%xmm4
.byte 67,15,183,4,24 // movzwl (%r8,%r11,1),%eax
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,227,89,14,229,1 // vpblendw $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,66,254,255,255 // jmpq 24672 <_sk_lerp_u8_hsw_8bit+0x22>
+ .byte 233,66,254,255,255 // jmpq 2465e <_sk_lerp_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,6,6 // vpinsrb $0x6,0x6(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,5,5 // vpinsrb $0x5,0x5(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,4,4 // vpinsrb $0x4,0x4(%r8,%r11,1),%xmm4,%xmm4
.byte 196,129,121,110,44,24 // vmovd (%r8,%r11,1),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,21,254,255,255 // jmpq 24672 <_sk_lerp_u8_hsw_8bit+0x22>
+ .byte 233,21,254,255,255 // jmpq 2465e <_sk_lerp_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,10,10 // vpinsrb $0xa,0xa(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,9,9 // vpinsrb $0x9,0x9(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,8,8 // vpinsrb $0x8,0x8(%r8,%r11,1),%xmm4,%xmm4
.byte 196,129,122,126,44,24 // vmovq (%r8,%r11,1),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,232,253,255,255 // jmpq 24672 <_sk_lerp_u8_hsw_8bit+0x22>
+ .byte 233,232,253,255,255 // jmpq 2465e <_sk_lerp_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,14,14 // vpinsrb $0xe,0xe(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,13,13 // vpinsrb $0xd,0xd(%r8,%r11,1),%xmm4,%xmm4
@@ -45622,7 +45614,7 @@ _sk_lerp_u8_hsw_8bit:
.byte 196,129,122,126,44,24 // vmovq (%r8,%r11,1),%xmm5
.byte 196,131,81,34,108,24,8,2 // vpinsrd $0x2,0x8(%r8,%r11,1),%xmm5,%xmm5
.byte 196,227,81,2,228,8 // vpblendd $0x8,%xmm4,%xmm5,%xmm4
- .byte 233,179,253,255,255 // jmpq 24672 <_sk_lerp_u8_hsw_8bit+0x22>
+ .byte 233,179,253,255,255 // jmpq 2465e <_sk_lerp_u8_hsw_8bit+0x22>
.byte 144 // nop
.byte 66,255 // rex.X (bad)
.byte 255 // (bad)
@@ -45632,7 +45624,7 @@ _sk_lerp_u8_hsw_8bit:
.byte 255,140,255,255,255,132,255 // decl -0x7b0001(%rdi,%rdi,8)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 124,255 // jl 248d5 <_sk_lerp_u8_hsw_8bit+0x285>
+ .byte 124,255 // jl 248c1 <_sk_lerp_u8_hsw_8bit+0x285>
.byte 255 // (bad)
.byte 255,112,255 // pushq -0x1(%rax)
.byte 255 // (bad)
@@ -45680,7 +45672,7 @@ HIDDEN _sk_black_color_hsw_8bit
FUNCTION(_sk_black_color_hsw_8bit)
_sk_black_color_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,145,122,0,0 // vbroadcastss 0x7a91(%rip),%ymm0 # 2c3b0 <_sk_overlay_sse2_8bit+0x5d8>
+ .byte 196,226,125,24,5,89,131,0,0 // vbroadcastss 0x8359(%rip),%ymm0 # 2cc64 <_sk_overlay_sse2_8bit+0xea0>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 255,224 // jmpq *%rax
@@ -45706,7 +45698,7 @@ HIDDEN _sk_srcatop_hsw_8bit
.globl _sk_srcatop_hsw_8bit
FUNCTION(_sk_srcatop_hsw_8bit)
_sk_srcatop_hsw_8bit:
- .byte 197,125,111,5,251,128,0,0 // vmovdqa 0x80fb(%rip),%ymm8 # 2ca40 <_sk_overlay_sse2_8bit+0xc68>
+ .byte 197,125,111,5,79,127,0,0 // vmovdqa 0x7f4f(%rip),%ymm8 # 2c880 <_sk_overlay_sse2_8bit+0xabc>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,232 // vpshufb %ymm8,%ymm2,%ymm5
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -45783,7 +45775,7 @@ HIDDEN _sk_dstatop_hsw_8bit
.globl _sk_dstatop_hsw_8bit
FUNCTION(_sk_dstatop_hsw_8bit)
_sk_dstatop_hsw_8bit:
- .byte 197,125,111,5,182,127,0,0 // vmovdqa 0x7fb6(%rip),%ymm8 # 2ca60 <_sk_overlay_sse2_8bit+0xc88>
+ .byte 197,125,111,5,10,126,0,0 // vmovdqa 0x7e0a(%rip),%ymm8 # 2c8a0 <_sk_overlay_sse2_8bit+0xadc>
.byte 196,194,117,0,224 // vpshufb %ymm8,%ymm1,%ymm4
.byte 196,194,125,0,232 // vpshufb %ymm8,%ymm0,%ymm5
.byte 196,98,125,48,210 // vpmovzxbw %xmm2,%ymm10
@@ -45860,7 +45852,7 @@ HIDDEN _sk_srcin_hsw_8bit
.globl _sk_srcin_hsw_8bit
FUNCTION(_sk_srcin_hsw_8bit)
_sk_srcin_hsw_8bit:
- .byte 197,253,111,37,109,126,0,0 // vmovdqa 0x7e6d(%rip),%ymm4 # 2ca80 <_sk_overlay_sse2_8bit+0xca8>
+ .byte 197,253,111,37,193,124,0,0 // vmovdqa 0x7cc1(%rip),%ymm4 # 2c8c0 <_sk_overlay_sse2_8bit+0xafc>
.byte 196,226,101,0,236 // vpshufb %ymm4,%ymm3,%ymm5
.byte 196,226,109,0,228 // vpshufb %ymm4,%ymm2,%ymm4
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -45900,7 +45892,7 @@ HIDDEN _sk_dstin_hsw_8bit
.globl _sk_dstin_hsw_8bit
FUNCTION(_sk_dstin_hsw_8bit)
_sk_dstin_hsw_8bit:
- .byte 197,253,111,37,227,125,0,0 // vmovdqa 0x7de3(%rip),%ymm4 # 2caa0 <_sk_overlay_sse2_8bit+0xcc8>
+ .byte 197,253,111,37,55,124,0,0 // vmovdqa 0x7c37(%rip),%ymm4 # 2c8e0 <_sk_overlay_sse2_8bit+0xb1c>
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,125,48,226 // vpmovzxbw %xmm2,%ymm4
@@ -45940,7 +45932,7 @@ HIDDEN _sk_srcout_hsw_8bit
.globl _sk_srcout_hsw_8bit
FUNCTION(_sk_srcout_hsw_8bit)
_sk_srcout_hsw_8bit:
- .byte 197,253,111,37,87,125,0,0 // vmovdqa 0x7d57(%rip),%ymm4 # 2cac0 <_sk_overlay_sse2_8bit+0xce8>
+ .byte 197,253,111,37,171,123,0,0 // vmovdqa 0x7bab(%rip),%ymm4 # 2c900 <_sk_overlay_sse2_8bit+0xb3c>
.byte 196,226,109,0,236 // vpshufb %ymm4,%ymm2,%ymm5
.byte 196,226,101,0,228 // vpshufb %ymm4,%ymm3,%ymm4
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
@@ -45983,7 +45975,7 @@ HIDDEN _sk_dstout_hsw_8bit
.globl _sk_dstout_hsw_8bit
FUNCTION(_sk_dstout_hsw_8bit)
_sk_dstout_hsw_8bit:
- .byte 197,253,111,37,193,124,0,0 // vmovdqa 0x7cc1(%rip),%ymm4 # 2cae0 <_sk_overlay_sse2_8bit+0xd08>
+ .byte 197,253,111,37,21,123,0,0 // vmovdqa 0x7b15(%rip),%ymm4 # 2c920 <_sk_overlay_sse2_8bit+0xb5c>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 197,221,118,228 // vpcmpeqd %ymm4,%ymm4,%ymm4
@@ -46026,7 +46018,7 @@ HIDDEN _sk_srcover_hsw_8bit
.globl _sk_srcover_hsw_8bit
FUNCTION(_sk_srcover_hsw_8bit)
_sk_srcover_hsw_8bit:
- .byte 197,253,111,37,41,124,0,0 // vmovdqa 0x7c29(%rip),%ymm4 # 2cb00 <_sk_overlay_sse2_8bit+0xd28>
+ .byte 197,253,111,37,125,122,0,0 // vmovdqa 0x7a7d(%rip),%ymm4 # 2c940 <_sk_overlay_sse2_8bit+0xb7c>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 196,98,125,48,202 // vpmovzxbw %xmm2,%ymm9
@@ -46070,7 +46062,7 @@ HIDDEN _sk_dstover_hsw_8bit
.globl _sk_dstover_hsw_8bit
FUNCTION(_sk_dstover_hsw_8bit)
_sk_dstover_hsw_8bit:
- .byte 197,253,111,37,138,123,0,0 // vmovdqa 0x7b8a(%rip),%ymm4 # 2cb20 <_sk_overlay_sse2_8bit+0xd48>
+ .byte 197,253,111,37,222,121,0,0 // vmovdqa 0x79de(%rip),%ymm4 # 2c960 <_sk_overlay_sse2_8bit+0xb9c>
.byte 196,226,101,0,236 // vpshufb %ymm4,%ymm3,%ymm5
.byte 196,226,109,0,228 // vpshufb %ymm4,%ymm2,%ymm4
.byte 196,98,125,48,200 // vpmovzxbw %xmm0,%ymm9
@@ -46153,7 +46145,7 @@ FUNCTION(_sk_multiply_hsw_8bit)
_sk_multiply_hsw_8bit:
.byte 197,253,111,243 // vmovdqa %ymm3,%ymm6
.byte 197,253,111,218 // vmovdqa %ymm2,%ymm3
- .byte 197,125,111,13,75,122,0,0 // vmovdqa 0x7a4b(%rip),%ymm9 # 2cb40 <_sk_overlay_sse2_8bit+0xd68>
+ .byte 197,125,111,13,159,120,0,0 // vmovdqa 0x789f(%rip),%ymm9 # 2c980 <_sk_overlay_sse2_8bit+0xbbc>
.byte 196,194,101,0,225 // vpshufb %ymm9,%ymm3,%ymm4
.byte 196,194,77,0,233 // vpshufb %ymm9,%ymm6,%ymm5
.byte 196,65,45,118,210 // vpcmpeqd %ymm10,%ymm10,%ymm10
@@ -46297,7 +46289,7 @@ HIDDEN _sk_xor__hsw_8bit
.globl _sk_xor__hsw_8bit
FUNCTION(_sk_xor__hsw_8bit)
_sk_xor__hsw_8bit:
- .byte 197,125,111,13,217,119,0,0 // vmovdqa 0x77d9(%rip),%ymm9 # 2cb60 <_sk_overlay_sse2_8bit+0xd88>
+ .byte 197,125,111,13,45,118,0,0 // vmovdqa 0x762d(%rip),%ymm9 # 2c9a0 <_sk_overlay_sse2_8bit+0xbdc>
.byte 196,194,109,0,225 // vpshufb %ymm9,%ymm2,%ymm4
.byte 196,194,101,0,249 // vpshufb %ymm9,%ymm3,%ymm7
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -46385,7 +46377,7 @@ HIDDEN _sk_darken_hsw_8bit
.globl _sk_darken_hsw_8bit
FUNCTION(_sk_darken_hsw_8bit)
_sk_darken_hsw_8bit:
- .byte 197,125,111,5,123,118,0,0 // vmovdqa 0x767b(%rip),%ymm8 # 2cb80 <_sk_overlay_sse2_8bit+0xda8>
+ .byte 197,125,111,5,207,116,0,0 // vmovdqa 0x74cf(%rip),%ymm8 # 2c9c0 <_sk_overlay_sse2_8bit+0xbfc>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -46458,7 +46450,7 @@ _sk_darken_hsw_8bit:
.byte 197,253,248,246 // vpsubb %ymm6,%ymm0,%ymm6
.byte 197,245,248,205 // vpsubb %ymm5,%ymm1,%ymm1
.byte 197,253,248,196 // vpsubb %ymm4,%ymm0,%ymm0
- .byte 196,226,125,88,37,68,109,0,0 // vpbroadcastd 0x6d44(%rip),%ymm4 # 2c3b8 <_sk_overlay_sse2_8bit+0x5e0>
+ .byte 196,226,125,88,37,12,118,0,0 // vpbroadcastd 0x760c(%rip),%ymm4 # 2cc6c <_sk_overlay_sse2_8bit+0xea8>
.byte 196,227,125,76,198,64 // vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
.byte 196,227,117,76,207,64 // vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -46468,7 +46460,7 @@ HIDDEN _sk_lighten_hsw_8bit
.globl _sk_lighten_hsw_8bit
FUNCTION(_sk_lighten_hsw_8bit)
_sk_lighten_hsw_8bit:
- .byte 197,125,111,5,20,117,0,0 // vmovdqa 0x7514(%rip),%ymm8 # 2cba0 <_sk_overlay_sse2_8bit+0xdc8>
+ .byte 197,125,111,5,104,115,0,0 // vmovdqa 0x7368(%rip),%ymm8 # 2c9e0 <_sk_overlay_sse2_8bit+0xc1c>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -46541,7 +46533,7 @@ _sk_lighten_hsw_8bit:
.byte 197,253,248,246 // vpsubb %ymm6,%ymm0,%ymm6
.byte 197,245,248,205 // vpsubb %ymm5,%ymm1,%ymm1
.byte 197,253,248,196 // vpsubb %ymm4,%ymm0,%ymm0
- .byte 196,226,125,88,37,189,107,0,0 // vpbroadcastd 0x6bbd(%rip),%ymm4 # 2c3b8 <_sk_overlay_sse2_8bit+0x5e0>
+ .byte 196,226,125,88,37,133,116,0,0 // vpbroadcastd 0x7485(%rip),%ymm4 # 2cc6c <_sk_overlay_sse2_8bit+0xea8>
.byte 196,227,125,76,198,64 // vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
.byte 196,227,117,76,207,64 // vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -46581,7 +46573,7 @@ _sk_exclusion_hsw_8bit:
.byte 196,227,77,56,252,1 // vinserti128 $0x1,%xmm4,%ymm6,%ymm7
.byte 196,227,77,70,228,49 // vperm2i128 $0x31,%ymm4,%ymm6,%ymm4
.byte 197,197,103,228 // vpackuswb %ymm4,%ymm7,%ymm4
- .byte 197,253,111,53,22,115,0,0 // vmovdqa 0x7316(%rip),%ymm6 # 2cbc0 <_sk_overlay_sse2_8bit+0xde8>
+ .byte 197,253,111,53,106,113,0,0 // vmovdqa 0x716a(%rip),%ymm6 # 2ca00 <_sk_overlay_sse2_8bit+0xc3c>
.byte 197,221,219,254 // vpand %ymm6,%ymm4,%ymm7
.byte 197,213,219,246 // vpand %ymm6,%ymm5,%ymm6
.byte 197,237,252,192 // vpaddb %ymm0,%ymm2,%ymm0
@@ -46597,7 +46589,7 @@ HIDDEN _sk_difference_hsw_8bit
.globl _sk_difference_hsw_8bit
FUNCTION(_sk_difference_hsw_8bit)
_sk_difference_hsw_8bit:
- .byte 197,125,111,5,10,115,0,0 // vmovdqa 0x730a(%rip),%ymm8 # 2cbe0 <_sk_overlay_sse2_8bit+0xe08>
+ .byte 197,125,111,5,94,113,0,0 // vmovdqa 0x715e(%rip),%ymm8 # 2ca20 <_sk_overlay_sse2_8bit+0xc5c>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -46664,7 +46656,7 @@ _sk_difference_hsw_8bit:
.byte 197,197,103,237 // vpackuswb %ymm5,%ymm7,%ymm5
.byte 197,181,218,228 // vpminub %ymm4,%ymm9,%ymm4
.byte 197,165,218,237 // vpminub %ymm5,%ymm11,%ymm5
- .byte 197,253,111,53,212,113,0,0 // vmovdqa 0x71d4(%rip),%ymm6 # 2cc00 <_sk_overlay_sse2_8bit+0xe28>
+ .byte 197,253,111,53,40,112,0,0 // vmovdqa 0x7028(%rip),%ymm6 # 2ca40 <_sk_overlay_sse2_8bit+0xc7c>
.byte 197,213,219,254 // vpand %ymm6,%ymm5,%ymm7
.byte 197,221,219,246 // vpand %ymm6,%ymm4,%ymm6
.byte 197,237,252,192 // vpaddb %ymm0,%ymm2,%ymm0
@@ -46689,7 +46681,7 @@ _sk_hardlight_hsw_8bit:
.byte 196,227,125,57,204,1 // vextracti128 $0x1,%ymm1,%xmm4
.byte 196,98,125,48,196 // vpmovzxbw %xmm4,%ymm8
.byte 197,126,127,68,36,96 // vmovdqu %ymm8,0x60(%rsp)
- .byte 197,253,111,45,151,113,0,0 // vmovdqa 0x7197(%rip),%ymm5 # 2cc20 <_sk_overlay_sse2_8bit+0xe48>
+ .byte 197,253,111,45,235,111,0,0 // vmovdqa 0x6feb(%rip),%ymm5 # 2ca60 <_sk_overlay_sse2_8bit+0xc9c>
.byte 196,226,125,0,229 // vpshufb %ymm5,%ymm0,%ymm4
.byte 196,226,117,0,205 // vpshufb %ymm5,%ymm1,%ymm1
.byte 196,227,125,57,200,1 // vextracti128 $0x1,%ymm1,%xmm0
@@ -46715,10 +46707,10 @@ _sk_hardlight_hsw_8bit:
.byte 197,253,117,193 // vpcmpeqw %ymm1,%ymm0,%ymm0
.byte 197,254,127,132,36,128,0,0,0 // vmovdqu %ymm0,0x80(%rsp)
.byte 197,253,111,226 // vmovdqa %ymm2,%ymm4
- .byte 197,125,111,37,5,113,0,0 // vmovdqa 0x7105(%rip),%ymm12 # 2cc20 <_sk_overlay_sse2_8bit+0xe48>
+ .byte 197,125,111,37,89,111,0,0 // vmovdqa 0x6f59(%rip),%ymm12 # 2ca60 <_sk_overlay_sse2_8bit+0xc9c>
.byte 196,66,93,0,196 // vpshufb %ymm12,%ymm4,%ymm8
.byte 196,194,125,48,208 // vpmovzxbw %xmm8,%ymm2
- .byte 196,226,125,121,5,18,113,0,0 // vpbroadcastw 0x7112(%rip),%ymm0 # 2cc40 <_sk_overlay_sse2_8bit+0xe68>
+ .byte 196,226,125,121,5,102,111,0,0 // vpbroadcastw 0x6f66(%rip),%ymm0 # 2ca80 <_sk_overlay_sse2_8bit+0xcbc>
.byte 197,109,239,232 // vpxor %ymm0,%ymm2,%ymm13
.byte 197,149,213,207 // vpmullw %ymm7,%ymm13,%ymm1
.byte 197,254,127,140,36,224,0,0,0 // vmovdqu %ymm1,0xe0(%rsp)
@@ -46818,7 +46810,7 @@ _sk_hardlight_hsw_8bit:
.byte 197,254,111,116,36,160 // vmovdqu -0x60(%rsp),%ymm6
.byte 197,205,253,116,36,192 // vpaddw -0x40(%rsp),%ymm6,%ymm6
.byte 196,193,53,253,252 // vpaddw %ymm12,%ymm9,%ymm7
- .byte 196,98,125,121,5,20,111,0,0 // vpbroadcastw 0x6f14(%rip),%ymm8 # 2cc42 <_sk_overlay_sse2_8bit+0xe6a>
+ .byte 196,98,125,121,5,104,109,0,0 // vpbroadcastw 0x6d68(%rip),%ymm8 # 2ca82 <_sk_overlay_sse2_8bit+0xcbe>
.byte 196,193,93,253,224 // vpaddw %ymm8,%ymm4,%ymm4
.byte 197,229,253,220 // vpaddw %ymm4,%ymm3,%ymm3
.byte 196,193,85,253,224 // vpaddw %ymm8,%ymm5,%ymm4
@@ -46827,7 +46819,7 @@ _sk_hardlight_hsw_8bit:
.byte 197,245,253,204 // vpaddw %ymm4,%ymm1,%ymm1
.byte 196,193,69,253,224 // vpaddw %ymm8,%ymm7,%ymm4
.byte 197,253,253,196 // vpaddw %ymm4,%ymm0,%ymm0
- .byte 196,226,125,121,37,233,110,0,0 // vpbroadcastw 0x6ee9(%rip),%ymm4 # 2cc44 <_sk_overlay_sse2_8bit+0xe6c>
+ .byte 196,226,125,121,37,61,109,0,0 // vpbroadcastw 0x6d3d(%rip),%ymm4 # 2ca84 <_sk_overlay_sse2_8bit+0xcc0>
.byte 197,253,228,196 // vpmulhuw %ymm4,%ymm0,%ymm0
.byte 197,245,228,204 // vpmulhuw %ymm4,%ymm1,%ymm1
.byte 197,237,228,212 // vpmulhuw %ymm4,%ymm2,%ymm2
@@ -46854,7 +46846,7 @@ FUNCTION(_sk_overlay_hsw_8bit)
_sk_overlay_hsw_8bit:
.byte 72,129,236,152,1,0,0 // sub $0x198,%rsp
.byte 197,252,17,140,36,64,1,0,0 // vmovups %ymm1,0x140(%rsp)
- .byte 197,253,111,45,140,110,0,0 // vmovdqa 0x6e8c(%rip),%ymm5 # 2cc60 <_sk_overlay_sse2_8bit+0xe88>
+ .byte 197,253,111,45,224,108,0,0 // vmovdqa 0x6ce0(%rip),%ymm5 # 2caa0 <_sk_overlay_sse2_8bit+0xcdc>
.byte 197,253,111,226 // vmovdqa %ymm2,%ymm4
.byte 196,227,125,57,225,1 // vextracti128 $0x1,%ymm4,%xmm1
.byte 196,98,125,48,193 // vpmovzxbw %xmm1,%ymm8
@@ -46889,7 +46881,7 @@ _sk_overlay_hsw_8bit:
.byte 197,93,117,251 // vpcmpeqw %ymm3,%ymm4,%ymm15
.byte 197,253,111,216 // vmovdqa %ymm0,%ymm3
.byte 196,226,125,48,227 // vpmovzxbw %xmm3,%ymm4
- .byte 196,226,125,121,5,230,109,0,0 // vpbroadcastw 0x6de6(%rip),%ymm0 # 2cc80 <_sk_overlay_sse2_8bit+0xea8>
+ .byte 196,226,125,121,5,58,108,0,0 // vpbroadcastw 0x6c3a(%rip),%ymm0 # 2cac0 <_sk_overlay_sse2_8bit+0xcfc>
.byte 197,117,239,232 // vpxor %ymm0,%ymm1,%ymm13
.byte 197,21,213,212 // vpmullw %ymm4,%ymm13,%ymm10
.byte 197,126,127,148,36,192,0,0,0 // vmovdqu %ymm10,0xc0(%rsp)
@@ -46990,7 +46982,7 @@ _sk_overlay_hsw_8bit:
.byte 197,254,111,116,36,192 // vmovdqu -0x40(%rsp),%ymm6
.byte 197,205,253,116,36,224 // vpaddw -0x20(%rsp),%ymm6,%ymm6
.byte 196,193,29,253,253 // vpaddw %ymm13,%ymm12,%ymm7
- .byte 196,98,125,121,5,241,107,0,0 // vpbroadcastw 0x6bf1(%rip),%ymm8 # 2cc82 <_sk_overlay_sse2_8bit+0xeaa>
+ .byte 196,98,125,121,5,69,106,0,0 // vpbroadcastw 0x6a45(%rip),%ymm8 # 2cac2 <_sk_overlay_sse2_8bit+0xcfe>
.byte 196,193,109,253,208 // vpaddw %ymm8,%ymm2,%ymm2
.byte 197,229,253,210 // vpaddw %ymm2,%ymm3,%ymm2
.byte 196,193,85,253,216 // vpaddw %ymm8,%ymm5,%ymm3
@@ -46999,7 +46991,7 @@ _sk_overlay_hsw_8bit:
.byte 197,245,253,204 // vpaddw %ymm4,%ymm1,%ymm1
.byte 196,193,69,253,224 // vpaddw %ymm8,%ymm7,%ymm4
.byte 197,253,253,196 // vpaddw %ymm4,%ymm0,%ymm0
- .byte 196,226,125,121,37,198,107,0,0 // vpbroadcastw 0x6bc6(%rip),%ymm4 # 2cc84 <_sk_overlay_sse2_8bit+0xeac>
+ .byte 196,226,125,121,37,26,106,0,0 // vpbroadcastw 0x6a1a(%rip),%ymm4 # 2cac4 <_sk_overlay_sse2_8bit+0xd00>
.byte 197,253,228,196 // vpmulhuw %ymm4,%ymm0,%ymm0
.byte 197,245,228,204 // vpmulhuw %ymm4,%ymm1,%ymm1
.byte 197,229,228,220 // vpmulhuw %ymm4,%ymm3,%ymm3
@@ -47042,13 +47034,13 @@ _sk_start_pipeline_sse41_8bit:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,192 // mov %rcx,-0x40(%rbp)
.byte 72,57,203 // cmp %rcx,%rbx
- .byte 115,83 // jae 261a2 <_sk_start_pipeline_sse41_8bit+0x82>
+ .byte 115,83 // jae 2618e <_sk_start_pipeline_sse41_8bit+0x82>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,8 // lea 0x8(%rax),%rax
.byte 72,137,69,200 // mov %rax,-0x38(%rbp)
.byte 76,57,125,200 // cmp %r15,-0x38(%rbp)
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
- .byte 119,35 // ja 26188 <_sk_start_pipeline_sse41_8bit+0x68>
+ .byte 119,35 // ja 26174 <_sk_start_pipeline_sse41_8bit+0x68>
.byte 76,139,101,208 // mov -0x30(%rbp),%r12
.byte 49,255 // xor %edi,%edi
.byte 76,137,246 // mov %r14,%rsi
@@ -47059,16 +47051,16 @@ _sk_start_pipeline_sse41_8bit:
.byte 73,131,196,16 // add $0x10,%r12
.byte 77,57,252 // cmp %r15,%r12
.byte 73,137,212 // mov %rdx,%r12
- .byte 118,225 // jbe 26169 <_sk_start_pipeline_sse41_8bit+0x49>
+ .byte 118,225 // jbe 26155 <_sk_start_pipeline_sse41_8bit+0x49>
.byte 76,137,255 // mov %r15,%rdi
.byte 72,41,215 // sub %rdx,%rdi
- .byte 116,9 // je 26199 <_sk_start_pipeline_sse41_8bit+0x79>
+ .byte 116,9 // je 26185 <_sk_start_pipeline_sse41_8bit+0x79>
.byte 76,137,246 // mov %r14,%rsi
.byte 72,137,217 // mov %rbx,%rcx
.byte 65,255,213 // callq *%r13
.byte 72,255,195 // inc %rbx
.byte 72,59,93,192 // cmp -0x40(%rbp),%rbx
- .byte 117,185 // jne 2615b <_sk_start_pipeline_sse41_8bit+0x3b>
+ .byte 117,185 // jne 26147 <_sk_start_pipeline_sse41_8bit+0x3b>
.byte 72,131,196,24 // add $0x18,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -47100,7 +47092,7 @@ HIDDEN _sk_set_rgb_sse41_8bit
FUNCTION(_sk_set_rgb_sse41_8bit)
_sk_set_rgb_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,37,116,96,0,0 // movss 0x6074(%rip),%xmm4 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 243,15,16,37,60,105,0,0 // movss 0x693c(%rip),%xmm4 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 243,15,16,40 // movss (%rax),%xmm5
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 243,76,15,44,197 // cvttss2si %xmm5,%r8
@@ -47115,7 +47107,7 @@ _sk_set_rgb_sse41_8bit:
.byte 68,9,200 // or %r9d,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
- .byte 102,15,111,45,189,113,0,0 // movdqa 0x71bd(%rip),%xmm5 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
+ .byte 102,15,111,45,177,113,0,0 // movdqa 0x71b1(%rip),%xmm5 # 2d3b0 <_sk_overlay_sse2_8bit+0x15ec>
.byte 102,15,219,205 // pand %xmm5,%xmm1
.byte 102,15,219,197 // pand %xmm5,%xmm0
.byte 102,15,235,196 // por %xmm4,%xmm0
@@ -47129,12 +47121,12 @@ FUNCTION(_sk_premul_sse41_8bit)
_sk_premul_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,169,113,0,0 // movdqa 0x71a9(%rip),%xmm0 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,15,111,5,157,113,0,0 // movdqa 0x719d(%rip),%xmm0 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,15,111,253 // movdqa %xmm5,%xmm7
.byte 102,15,56,0,248 // pshufb %xmm0,%xmm7
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,56,0,240 // pshufb %xmm0,%xmm6
- .byte 102,15,111,5,127,113,0,0 // movdqa 0x717f(%rip),%xmm0 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
+ .byte 102,15,111,5,115,113,0,0 // movdqa 0x7173(%rip),%xmm0 # 2d3b0 <_sk_overlay_sse2_8bit+0x15ec>
.byte 102,15,235,240 // por %xmm0,%xmm6
.byte 102,15,235,248 // por %xmm0,%xmm7
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -47167,7 +47159,7 @@ HIDDEN _sk_swap_rb_sse41_8bit
.globl _sk_swap_rb_sse41_8bit
FUNCTION(_sk_swap_rb_sse41_8bit)
_sk_swap_rb_sse41_8bit:
- .byte 102,15,111,37,28,113,0,0 // movdqa 0x711c(%rip),%xmm4 # 2d3f0 <_sk_overlay_sse2_8bit+0x1618>
+ .byte 102,15,111,37,16,113,0,0 // movdqa 0x7110(%rip),%xmm4 # 2d3d0 <_sk_overlay_sse2_8bit+0x160c>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47195,7 +47187,7 @@ _sk_load_8888_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 2631f <_sk_load_8888_sse41_8bit+0x2d>
+ .byte 117,17 // jne 2630b <_sk_load_8888_sse41_8bit+0x2d>
.byte 243,67,15,111,76,152,16 // movdqu 0x10(%r8,%r11,4),%xmm1
.byte 243,67,15,111,4,152 // movdqu (%r8,%r11,4),%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47206,24 +47198,24 @@ _sk_load_8888_sse41_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,228 // ja 2631b <_sk_load_8888_sse41_8bit+0x29>
+ .byte 119,228 // ja 26307 <_sk_load_8888_sse41_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,78,0,0,0 // lea 0x4e(%rip),%r10 # 26390 <_sk_load_8888_sse41_8bit+0x9e>
+ .byte 76,141,21,78,0,0,0 // lea 0x4e(%rip),%r10 # 2637c <_sk_load_8888_sse41_8bit+0x9e>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,110,4,152 // movd (%r8,%r11,4),%xmm0
- .byte 235,200 // jmp 2631b <_sk_load_8888_sse41_8bit+0x29>
+ .byte 235,200 // jmp 26307 <_sk_load_8888_sse41_8bit+0x29>
.byte 102,67,15,110,68,152,8 // movd 0x8(%r8,%r11,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 243,67,15,126,36,152 // movq (%r8,%r11,4),%xmm4
.byte 102,15,58,14,196,15 // pblendw $0xf,%xmm4,%xmm0
- .byte 235,174 // jmp 2631b <_sk_load_8888_sse41_8bit+0x29>
+ .byte 235,174 // jmp 26307 <_sk_load_8888_sse41_8bit+0x29>
.byte 102,67,15,110,68,152,24 // movd 0x18(%r8,%r11,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 102,67,15,58,34,76,152,20,1 // pinsrd $0x1,0x14(%r8,%r11,4),%xmm1
.byte 102,67,15,58,34,76,152,16,0 // pinsrd $0x0,0x10(%r8,%r11,4),%xmm1
- .byte 235,136 // jmp 26315 <_sk_load_8888_sse41_8bit+0x23>
+ .byte 235,136 // jmp 26301 <_sk_load_8888_sse41_8bit+0x23>
.byte 15,31,0 // nopl (%rax)
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
@@ -47235,7 +47227,7 @@ _sk_load_8888_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,221 // jmpq ffffffffde0263a8 <_sk_overlay_sse2_8bit+0xffffffffddffa5d0>
+ .byte 233,255,255,255,221 // jmpq ffffffffde026394 <_sk_overlay_sse2_8bit+0xffffffffddffa5d0>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -47252,7 +47244,7 @@ _sk_load_8888_dst_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 263d9 <_sk_load_8888_dst_sse41_8bit+0x2d>
+ .byte 117,17 // jne 263c5 <_sk_load_8888_dst_sse41_8bit+0x2d>
.byte 243,67,15,111,92,152,16 // movdqu 0x10(%r8,%r11,4),%xmm3
.byte 243,67,15,111,20,152 // movdqu (%r8,%r11,4),%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47263,24 +47255,24 @@ _sk_load_8888_dst_sse41_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,228 // ja 263d5 <_sk_load_8888_dst_sse41_8bit+0x29>
+ .byte 119,228 // ja 263c1 <_sk_load_8888_dst_sse41_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,76,0,0,0 // lea 0x4c(%rip),%r10 # 26448 <_sk_load_8888_dst_sse41_8bit+0x9c>
+ .byte 76,141,21,76,0,0,0 // lea 0x4c(%rip),%r10 # 26434 <_sk_load_8888_dst_sse41_8bit+0x9c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,110,20,152 // movd (%r8,%r11,4),%xmm2
- .byte 235,200 // jmp 263d5 <_sk_load_8888_dst_sse41_8bit+0x29>
+ .byte 235,200 // jmp 263c1 <_sk_load_8888_dst_sse41_8bit+0x29>
.byte 102,67,15,110,84,152,8 // movd 0x8(%r8,%r11,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 243,67,15,126,36,152 // movq (%r8,%r11,4),%xmm4
.byte 102,15,58,14,212,15 // pblendw $0xf,%xmm4,%xmm2
- .byte 235,174 // jmp 263d5 <_sk_load_8888_dst_sse41_8bit+0x29>
+ .byte 235,174 // jmp 263c1 <_sk_load_8888_dst_sse41_8bit+0x29>
.byte 102,67,15,110,84,152,24 // movd 0x18(%r8,%r11,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 102,67,15,58,34,92,152,20,1 // pinsrd $0x1,0x14(%r8,%r11,4),%xmm3
.byte 102,67,15,58,34,92,152,16,0 // pinsrd $0x0,0x10(%r8,%r11,4),%xmm3
- .byte 235,136 // jmp 263cf <_sk_load_8888_dst_sse41_8bit+0x23>
+ .byte 235,136 // jmp 263bb <_sk_load_8888_dst_sse41_8bit+0x23>
.byte 144 // nop
.byte 189,255,255,255,209 // mov $0xd1ffffff,%ebp
.byte 255 // (bad)
@@ -47292,7 +47284,7 @@ _sk_load_8888_dst_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 235,255 // jmp 2645d <_sk_load_8888_dst_sse41_8bit+0xb1>
+ .byte 235,255 // jmp 26449 <_sk_load_8888_dst_sse41_8bit+0xb1>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 223,255 // (bad)
@@ -47311,7 +47303,7 @@ _sk_store_8888_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 26491 <_sk_store_8888_sse41_8bit+0x2d>
+ .byte 117,17 // jne 2647d <_sk_store_8888_sse41_8bit+0x2d>
.byte 243,67,15,127,4,152 // movdqu %xmm0,(%r8,%r11,4)
.byte 243,67,15,127,76,152,16 // movdqu %xmm1,0x10(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47320,22 +47312,22 @@ _sk_store_8888_sse41_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 2648d <_sk_store_8888_sse41_8bit+0x29>
+ .byte 119,236 // ja 26479 <_sk_store_8888_sse41_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,68,0,0,0 // lea 0x44(%rip),%r10 # 264f0 <_sk_store_8888_sse41_8bit+0x8c>
+ .byte 76,141,21,68,0,0,0 // lea 0x44(%rip),%r10 # 264dc <_sk_store_8888_sse41_8bit+0x8c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,126,4,152 // movd %xmm0,(%r8,%r11,4)
- .byte 235,208 // jmp 2648d <_sk_store_8888_sse41_8bit+0x29>
+ .byte 235,208 // jmp 26479 <_sk_store_8888_sse41_8bit+0x29>
.byte 102,67,15,58,22,68,152,8,2 // pextrd $0x2,%xmm0,0x8(%r8,%r11,4)
.byte 102,67,15,214,4,152 // movq %xmm0,(%r8,%r11,4)
- .byte 235,191 // jmp 2648d <_sk_store_8888_sse41_8bit+0x29>
+ .byte 235,191 // jmp 26479 <_sk_store_8888_sse41_8bit+0x29>
.byte 102,67,15,58,22,76,152,24,2 // pextrd $0x2,%xmm1,0x18(%r8,%r11,4)
.byte 102,67,15,58,22,76,152,20,1 // pextrd $0x1,%xmm1,0x14(%r8,%r11,4)
.byte 102,67,15,126,76,152,16 // movd %xmm1,0x10(%r8,%r11,4)
.byte 243,67,15,127,4,152 // movdqu %xmm0,(%r8,%r11,4)
- .byte 235,158 // jmp 2648d <_sk_store_8888_sse41_8bit+0x29>
+ .byte 235,158 // jmp 26479 <_sk_store_8888_sse41_8bit+0x29>
.byte 144 // nop
.byte 197,255,255 // (bad)
.byte 255,214 // callq *%rsi
@@ -47370,10 +47362,10 @@ _sk_load_bgra_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,35 // jne 2654b <_sk_load_bgra_sse41_8bit+0x3f>
+ .byte 117,35 // jne 26537 <_sk_load_bgra_sse41_8bit+0x3f>
.byte 243,67,15,111,76,152,16 // movdqu 0x10(%r8,%r11,4),%xmm1
.byte 243,67,15,111,4,152 // movdqu (%r8,%r11,4),%xmm0
- .byte 102,15,111,37,179,110,0,0 // movdqa 0x6eb3(%rip),%xmm4 # 2d3f0 <_sk_overlay_sse2_8bit+0x1618>
+ .byte 102,15,111,37,167,110,0,0 // movdqa 0x6ea7(%rip),%xmm4 # 2d3d0 <_sk_overlay_sse2_8bit+0x160c>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47384,24 +47376,24 @@ _sk_load_bgra_sse41_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,210 // ja 26535 <_sk_load_bgra_sse41_8bit+0x29>
+ .byte 119,210 // ja 26521 <_sk_load_bgra_sse41_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,78,0,0,0 // lea 0x4e(%rip),%r10 # 265bc <_sk_load_bgra_sse41_8bit+0xb0>
+ .byte 76,141,21,78,0,0,0 // lea 0x4e(%rip),%r10 # 265a8 <_sk_load_bgra_sse41_8bit+0xb0>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,110,4,152 // movd (%r8,%r11,4),%xmm0
- .byte 235,182 // jmp 26535 <_sk_load_bgra_sse41_8bit+0x29>
+ .byte 235,182 // jmp 26521 <_sk_load_bgra_sse41_8bit+0x29>
.byte 102,67,15,110,68,152,8 // movd 0x8(%r8,%r11,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 243,67,15,126,36,152 // movq (%r8,%r11,4),%xmm4
.byte 102,15,58,14,196,15 // pblendw $0xf,%xmm4,%xmm0
- .byte 235,156 // jmp 26535 <_sk_load_bgra_sse41_8bit+0x29>
+ .byte 235,156 // jmp 26521 <_sk_load_bgra_sse41_8bit+0x29>
.byte 102,67,15,110,68,152,24 // movd 0x18(%r8,%r11,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 102,67,15,58,34,76,152,20,1 // pinsrd $0x1,0x14(%r8,%r11,4),%xmm1
.byte 102,67,15,58,34,76,152,16,0 // pinsrd $0x0,0x10(%r8,%r11,4),%xmm1
- .byte 233,115,255,255,255 // jmpq 2652f <_sk_load_bgra_sse41_8bit+0x23>
+ .byte 233,115,255,255,255 // jmpq 2651b <_sk_load_bgra_sse41_8bit+0x23>
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -47414,7 +47406,7 @@ _sk_load_bgra_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,221 // jmpq ffffffffde0265d4 <_sk_overlay_sse2_8bit+0xffffffffddffa7fc>
+ .byte 233,255,255,255,221 // jmpq ffffffffde0265c0 <_sk_overlay_sse2_8bit+0xffffffffddffa7fc>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -47431,10 +47423,10 @@ _sk_load_bgra_dst_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,35 // jne 26617 <_sk_load_bgra_dst_sse41_8bit+0x3f>
+ .byte 117,35 // jne 26603 <_sk_load_bgra_dst_sse41_8bit+0x3f>
.byte 243,67,15,111,92,152,16 // movdqu 0x10(%r8,%r11,4),%xmm3
.byte 243,67,15,111,20,152 // movdqu (%r8,%r11,4),%xmm2
- .byte 102,15,111,37,231,109,0,0 // movdqa 0x6de7(%rip),%xmm4 # 2d3f0 <_sk_overlay_sse2_8bit+0x1618>
+ .byte 102,15,111,37,219,109,0,0 // movdqa 0x6ddb(%rip),%xmm4 # 2d3d0 <_sk_overlay_sse2_8bit+0x160c>
.byte 102,15,56,0,212 // pshufb %xmm4,%xmm2
.byte 102,15,56,0,220 // pshufb %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47445,24 +47437,24 @@ _sk_load_bgra_dst_sse41_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,210 // ja 26601 <_sk_load_bgra_dst_sse41_8bit+0x29>
+ .byte 119,210 // ja 265ed <_sk_load_bgra_dst_sse41_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,78,0,0,0 // lea 0x4e(%rip),%r10 # 26688 <_sk_load_bgra_dst_sse41_8bit+0xb0>
+ .byte 76,141,21,78,0,0,0 // lea 0x4e(%rip),%r10 # 26674 <_sk_load_bgra_dst_sse41_8bit+0xb0>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,110,20,152 // movd (%r8,%r11,4),%xmm2
- .byte 235,182 // jmp 26601 <_sk_load_bgra_dst_sse41_8bit+0x29>
+ .byte 235,182 // jmp 265ed <_sk_load_bgra_dst_sse41_8bit+0x29>
.byte 102,67,15,110,84,152,8 // movd 0x8(%r8,%r11,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 243,67,15,126,36,152 // movq (%r8,%r11,4),%xmm4
.byte 102,15,58,14,212,15 // pblendw $0xf,%xmm4,%xmm2
- .byte 235,156 // jmp 26601 <_sk_load_bgra_dst_sse41_8bit+0x29>
+ .byte 235,156 // jmp 265ed <_sk_load_bgra_dst_sse41_8bit+0x29>
.byte 102,67,15,110,84,152,24 // movd 0x18(%r8,%r11,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 102,67,15,58,34,92,152,20,1 // pinsrd $0x1,0x14(%r8,%r11,4),%xmm3
.byte 102,67,15,58,34,92,152,16,0 // pinsrd $0x0,0x10(%r8,%r11,4),%xmm3
- .byte 233,115,255,255,255 // jmpq 265fb <_sk_load_bgra_dst_sse41_8bit+0x23>
+ .byte 233,115,255,255,255 // jmpq 265e7 <_sk_load_bgra_dst_sse41_8bit+0x23>
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -47475,7 +47467,7 @@ _sk_load_bgra_dst_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,221 // jmpq ffffffffde0266a0 <_sk_overlay_sse2_8bit+0xffffffffddffa8c8>
+ .byte 233,255,255,255,221 // jmpq ffffffffde02668c <_sk_overlay_sse2_8bit+0xffffffffddffa8c8>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -47491,13 +47483,13 @@ _sk_store_bgra_sse41_8bit:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 102,15,111,53,45,109,0,0 // movdqa 0x6d2d(%rip),%xmm6 # 2d3f0 <_sk_overlay_sse2_8bit+0x1618>
+ .byte 102,15,111,53,33,109,0,0 // movdqa 0x6d21(%rip),%xmm6 # 2d3d0 <_sk_overlay_sse2_8bit+0x160c>
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
.byte 102,15,56,0,238 // pshufb %xmm6,%xmm5
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,56,0,230 // pshufb %xmm6,%xmm4
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 266eb <_sk_store_bgra_sse41_8bit+0x47>
+ .byte 117,17 // jne 266d7 <_sk_store_bgra_sse41_8bit+0x47>
.byte 243,67,15,127,36,152 // movdqu %xmm4,(%r8,%r11,4)
.byte 243,67,15,127,108,152,16 // movdqu %xmm5,0x10(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47506,22 +47498,22 @@ _sk_store_bgra_sse41_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 266e7 <_sk_store_bgra_sse41_8bit+0x43>
+ .byte 119,236 // ja 266d3 <_sk_store_bgra_sse41_8bit+0x43>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,70,0,0,0 // lea 0x46(%rip),%r10 # 2674c <_sk_store_bgra_sse41_8bit+0xa8>
+ .byte 76,141,21,70,0,0,0 // lea 0x46(%rip),%r10 # 26738 <_sk_store_bgra_sse41_8bit+0xa8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,126,36,152 // movd %xmm4,(%r8,%r11,4)
- .byte 235,208 // jmp 266e7 <_sk_store_bgra_sse41_8bit+0x43>
+ .byte 235,208 // jmp 266d3 <_sk_store_bgra_sse41_8bit+0x43>
.byte 102,67,15,58,22,100,152,8,2 // pextrd $0x2,%xmm4,0x8(%r8,%r11,4)
.byte 102,67,15,214,36,152 // movq %xmm4,(%r8,%r11,4)
- .byte 235,191 // jmp 266e7 <_sk_store_bgra_sse41_8bit+0x43>
+ .byte 235,191 // jmp 266d3 <_sk_store_bgra_sse41_8bit+0x43>
.byte 102,67,15,58,22,108,152,24,2 // pextrd $0x2,%xmm5,0x18(%r8,%r11,4)
.byte 102,67,15,58,22,108,152,20,1 // pextrd $0x1,%xmm5,0x14(%r8,%r11,4)
.byte 102,67,15,126,108,152,16 // movd %xmm5,0x10(%r8,%r11,4)
.byte 243,67,15,127,36,152 // movdqu %xmm4,(%r8,%r11,4)
- .byte 235,158 // jmp 266e7 <_sk_store_bgra_sse41_8bit+0x43>
+ .byte 235,158 // jmp 266d3 <_sk_store_bgra_sse41_8bit+0x43>
.byte 15,31,0 // nopl (%rax)
.byte 195 // retq
.byte 255 // (bad)
@@ -47558,19 +47550,19 @@ _sk_store_565_sse41_8bit:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 102,68,15,111,13,121,108,0,0 // movdqa 0x6c79(%rip),%xmm9 # 2d400 <_sk_overlay_sse2_8bit+0x1628>
+ .byte 102,68,15,111,13,109,108,0,0 // movdqa 0x6c6d(%rip),%xmm9 # 2d3e0 <_sk_overlay_sse2_8bit+0x161c>
.byte 102,68,15,111,193 // movdqa %xmm1,%xmm8
.byte 102,69,15,219,193 // pand %xmm9,%xmm8
.byte 102,68,15,219,200 // pand %xmm0,%xmm9
.byte 102,65,15,114,241,8 // pslld $0x8,%xmm9
.byte 102,65,15,114,240,8 // pslld $0x8,%xmm8
- .byte 102,15,111,37,102,108,0,0 // movdqa 0x6c66(%rip),%xmm4 # 2d410 <_sk_overlay_sse2_8bit+0x1638>
+ .byte 102,15,111,37,90,108,0,0 // movdqa 0x6c5a(%rip),%xmm4 # 2d3f0 <_sk_overlay_sse2_8bit+0x162c>
.byte 102,15,111,249 // movdqa %xmm1,%xmm7
.byte 102,15,219,252 // pand %xmm4,%xmm7
.byte 102,15,219,224 // pand %xmm0,%xmm4
.byte 102,15,114,212,5 // psrld $0x5,%xmm4
.byte 102,15,114,215,5 // psrld $0x5,%xmm7
- .byte 102,15,111,53,88,108,0,0 // movdqa 0x6c58(%rip),%xmm6 # 2d420 <_sk_overlay_sse2_8bit+0x1648>
+ .byte 102,15,111,53,76,108,0,0 // movdqa 0x6c4c(%rip),%xmm6 # 2d400 <_sk_overlay_sse2_8bit+0x163c>
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 102,15,219,241 // pand %xmm1,%xmm6
@@ -47580,12 +47572,12 @@ _sk_store_565_sse41_8bit:
.byte 102,65,15,235,225 // por %xmm9,%xmm4
.byte 102,15,235,229 // por %xmm5,%xmm4
.byte 102,15,235,254 // por %xmm6,%xmm7
- .byte 102,15,111,45,56,108,0,0 // movdqa 0x6c38(%rip),%xmm5 # 2d430 <_sk_overlay_sse2_8bit+0x1658>
+ .byte 102,15,111,45,44,108,0,0 // movdqa 0x6c2c(%rip),%xmm5 # 2d410 <_sk_overlay_sse2_8bit+0x164c>
.byte 102,15,56,0,253 // pshufb %xmm5,%xmm7
.byte 102,15,56,0,229 // pshufb %xmm5,%xmm4
.byte 102,15,108,231 // punpcklqdq %xmm7,%xmm4
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 26815 <_sk_store_565_sse41_8bit+0xad>
+ .byte 117,10 // jne 26801 <_sk_store_565_sse41_8bit+0xad>
.byte 243,67,15,127,36,88 // movdqu %xmm4,(%r8,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -47593,22 +47585,22 @@ _sk_store_565_sse41_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 26811 <_sk_store_565_sse41_8bit+0xa9>
+ .byte 119,236 // ja 267fd <_sk_store_565_sse41_8bit+0xa9>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,72,0,0,0 // lea 0x48(%rip),%r10 # 26878 <_sk_store_565_sse41_8bit+0x110>
+ .byte 76,141,21,72,0,0,0 // lea 0x48(%rip),%r10 # 26864 <_sk_store_565_sse41_8bit+0x110>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,58,21,36,88,0 // pextrw $0x0,%xmm4,(%r8,%r11,2)
- .byte 235,206 // jmp 26811 <_sk_store_565_sse41_8bit+0xa9>
+ .byte 235,206 // jmp 267fd <_sk_store_565_sse41_8bit+0xa9>
.byte 102,67,15,58,21,100,88,4,2 // pextrw $0x2,%xmm4,0x4(%r8,%r11,2)
.byte 102,67,15,126,36,88 // movd %xmm4,(%r8,%r11,2)
- .byte 235,189 // jmp 26811 <_sk_store_565_sse41_8bit+0xa9>
+ .byte 235,189 // jmp 267fd <_sk_store_565_sse41_8bit+0xa9>
.byte 102,67,15,58,21,100,88,12,6 // pextrw $0x6,%xmm4,0xc(%r8,%r11,2)
.byte 102,67,15,58,21,100,88,10,5 // pextrw $0x5,%xmm4,0xa(%r8,%r11,2)
.byte 102,67,15,58,21,100,88,8,4 // pextrw $0x4,%xmm4,0x8(%r8,%r11,2)
.byte 102,67,15,214,36,88 // movq %xmm4,(%r8,%r11,2)
- .byte 235,154 // jmp 26811 <_sk_store_565_sse41_8bit+0xa9>
+ .byte 235,154 // jmp 267fd <_sk_store_565_sse41_8bit+0xa9>
.byte 144 // nop
.byte 193,255,255 // sar $0xff,%edi
.byte 255,212 // callq *%rsp
@@ -47644,18 +47636,18 @@ _sk_load_565_dst_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,216,0,0,0 // jne 2698b <_sk_load_565_dst_sse41_8bit+0xf7>
+ .byte 15,133,216,0,0,0 // jne 26977 <_sk_load_565_dst_sse41_8bit+0xf7>
.byte 243,67,15,111,28,88 // movdqu (%r8,%r11,2),%xmm3
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,211 // pmovzxwd %xmm3,%xmm2
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
- .byte 102,15,111,53,66,102,0,0 // movdqa 0x6642(%rip),%xmm6 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
+ .byte 102,15,111,53,54,102,0,0 // movdqa 0x6636(%rip),%xmm6 # 2cef0 <_sk_overlay_sse2_8bit+0x112c>
.byte 102,15,111,250 // movdqa %xmm2,%xmm7
.byte 102,15,219,254 // pand %xmm6,%xmm7
.byte 102,15,219,243 // pand %xmm3,%xmm6
.byte 102,15,114,214,8 // psrld $0x8,%xmm6
.byte 102,15,114,215,8 // psrld $0x8,%xmm7
- .byte 102,15,111,45,100,102,0,0 // movdqa 0x6664(%rip),%xmm5 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
+ .byte 102,15,111,45,88,102,0,0 // movdqa 0x6658(%rip),%xmm5 # 2cf30 <_sk_overlay_sse2_8bit+0x116c>
.byte 102,15,111,226 // movdqa %xmm2,%xmm4
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,15,219,235 // pand %xmm3,%xmm5
@@ -47663,11 +47655,11 @@ _sk_load_565_dst_sse41_8bit:
.byte 102,15,114,244,19 // pslld $0x13,%xmm4
.byte 102,15,235,231 // por %xmm7,%xmm4
.byte 102,15,235,238 // por %xmm6,%xmm5
- .byte 102,15,111,53,30,102,0,0 // movdqa 0x661e(%rip),%xmm6 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
+ .byte 102,15,111,53,18,102,0,0 // movdqa 0x6612(%rip),%xmm6 # 2cf10 <_sk_overlay_sse2_8bit+0x114c>
.byte 102,15,111,251 // movdqa %xmm3,%xmm7
.byte 102,15,219,254 // pand %xmm6,%xmm7
.byte 102,15,114,247,5 // pslld $0x5,%xmm7
- .byte 102,68,15,111,5,40,107,0,0 // movdqa 0x6b28(%rip),%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0x1678>
+ .byte 102,68,15,111,5,28,107,0,0 // movdqa 0x6b1c(%rip),%xmm8 # 2d430 <_sk_overlay_sse2_8bit+0x166c>
.byte 102,65,15,219,216 // pand %xmm8,%xmm3
.byte 102,15,114,211,1 // psrld $0x1,%xmm3
.byte 102,15,235,223 // por %xmm7,%xmm3
@@ -47680,10 +47672,10 @@ _sk_load_565_dst_sse41_8bit:
.byte 102,15,235,214 // por %xmm6,%xmm2
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,114,212,5 // psrld $0x5,%xmm4
- .byte 102,15,111,53,217,106,0,0 // movdqa 0x6ad9(%rip),%xmm6 # 2d440 <_sk_overlay_sse2_8bit+0x1668>
+ .byte 102,15,111,53,205,106,0,0 // movdqa 0x6acd(%rip),%xmm6 # 2d420 <_sk_overlay_sse2_8bit+0x165c>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 102,15,219,238 // pand %xmm6,%xmm5
- .byte 102,15,111,53,89,106,0,0 // movdqa 0x6a59(%rip),%xmm6 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
+ .byte 102,15,111,53,77,106,0,0 // movdqa 0x6a4d(%rip),%xmm6 # 2d3b0 <_sk_overlay_sse2_8bit+0x15ec>
.byte 102,15,235,214 // por %xmm6,%xmm2
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,235,222 // por %xmm6,%xmm3
@@ -47695,27 +47687,27 @@ _sk_load_565_dst_sse41_8bit:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,22,255,255,255 // ja 268b9 <_sk_load_565_dst_sse41_8bit+0x25>
+ .byte 15,135,22,255,255,255 // ja 268a5 <_sk_load_565_dst_sse41_8bit+0x25>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,98,0,0,0 // lea 0x62(%rip),%r10 # 26a10 <_sk_load_565_dst_sse41_8bit+0x17c>
+ .byte 76,141,21,98,0,0,0 // lea 0x62(%rip),%r10 # 269fc <_sk_load_565_dst_sse41_8bit+0x17c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 233,244,254,255,255 // jmpq 268b9 <_sk_load_565_dst_sse41_8bit+0x25>
+ .byte 233,244,254,255,255 // jmpq 268a5 <_sk_load_565_dst_sse41_8bit+0x25>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,67,15,196,92,88,4,2 // pinsrw $0x2,0x4(%r8,%r11,2),%xmm3
.byte 102,67,15,110,20,88 // movd (%r8,%r11,2),%xmm2
.byte 102,15,58,14,218,3 // pblendw $0x3,%xmm2,%xmm3
- .byte 233,215,254,255,255 // jmpq 268b9 <_sk_load_565_dst_sse41_8bit+0x25>
+ .byte 233,215,254,255,255 // jmpq 268a5 <_sk_load_565_dst_sse41_8bit+0x25>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,67,15,196,92,88,12,6 // pinsrw $0x6,0xc(%r8,%r11,2),%xmm3
.byte 102,67,15,196,92,88,10,5 // pinsrw $0x5,0xa(%r8,%r11,2),%xmm3
.byte 102,67,15,196,92,88,8,4 // pinsrw $0x4,0x8(%r8,%r11,2),%xmm3
.byte 243,67,15,126,20,88 // movq (%r8,%r11,2),%xmm2
.byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3
- .byte 233,170,254,255,255 // jmpq 268b9 <_sk_load_565_dst_sse41_8bit+0x25>
+ .byte 233,170,254,255,255 // jmpq 268a5 <_sk_load_565_dst_sse41_8bit+0x25>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -47748,9 +47740,9 @@ _sk_load_a8_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,42 // jne 26a6e <_sk_load_a8_sse41_8bit+0x42>
+ .byte 117,42 // jne 26a5a <_sk_load_a8_sse41_8bit+0x42>
.byte 102,67,15,56,48,12,24 // pmovzxbw (%r8,%r11,1),%xmm1
- .byte 102,15,219,13,61,98,0,0 // pand 0x623d(%rip),%xmm1 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,13,49,98,0,0 // pand 0x6231(%rip),%xmm1 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
@@ -47763,15 +47755,15 @@ _sk_load_a8_sse41_8bit:
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,201 // ja 26a4b <_sk_load_a8_sse41_8bit+0x1f>
+ .byte 119,201 // ja 26a37 <_sk_load_a8_sse41_8bit+0x1f>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 26b04 <_sk_load_a8_sse41_8bit+0xd8>
+ .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 26af0 <_sk_load_a8_sse41_8bit+0xd8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 235,170 // jmp 26a4b <_sk_load_a8_sse41_8bit+0x1f>
+ .byte 235,170 // jmp 26a37 <_sk_load_a8_sse41_8bit+0x1f>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,2 // pinsrw $0x2,%eax,%xmm1
@@ -47779,7 +47771,7 @@ _sk_load_a8_sse41_8bit:
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,3 // pblendw $0x3,%xmm0,%xmm1
- .byte 235,133 // jmp 26a4b <_sk_load_a8_sse41_8bit+0x1f>
+ .byte 235,133 // jmp 26a37 <_sk_load_a8_sse41_8bit+0x1f>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,6 // pinsrw $0x6,%eax,%xmm1
@@ -47790,7 +47782,7 @@ _sk_load_a8_sse41_8bit:
.byte 102,67,15,110,4,24 // movd (%r8,%r11,1),%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,15 // pblendw $0xf,%xmm0,%xmm1
- .byte 233,74,255,255,255 // jmpq 26a4b <_sk_load_a8_sse41_8bit+0x1f>
+ .byte 233,74,255,255,255 // jmpq 26a37 <_sk_load_a8_sse41_8bit+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
@@ -47822,9 +47814,9 @@ _sk_load_a8_dst_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,42 // jne 26b62 <_sk_load_a8_dst_sse41_8bit+0x42>
+ .byte 117,42 // jne 26b4e <_sk_load_a8_dst_sse41_8bit+0x42>
.byte 102,67,15,56,48,28,24 // pmovzxbw (%r8,%r11,1),%xmm3
- .byte 102,15,219,29,73,97,0,0 // pand 0x6149(%rip),%xmm3 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,29,61,97,0,0 // pand 0x613d(%rip),%xmm3 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,211 // pmovzxwd %xmm3,%xmm2
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
@@ -47837,15 +47829,15 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,201 // ja 26b3f <_sk_load_a8_dst_sse41_8bit+0x1f>
+ .byte 119,201 // ja 26b2b <_sk_load_a8_dst_sse41_8bit+0x1f>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 26bf8 <_sk_load_a8_dst_sse41_8bit+0xd8>
+ .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 26be4 <_sk_load_a8_dst_sse41_8bit+0xd8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 235,170 // jmp 26b3f <_sk_load_a8_dst_sse41_8bit+0x1f>
+ .byte 235,170 // jmp 26b2b <_sk_load_a8_dst_sse41_8bit+0x1f>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3
@@ -47853,7 +47845,7 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,3 // pblendw $0x3,%xmm2,%xmm3
- .byte 235,133 // jmp 26b3f <_sk_load_a8_dst_sse41_8bit+0x1f>
+ .byte 235,133 // jmp 26b2b <_sk_load_a8_dst_sse41_8bit+0x1f>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,6 // pinsrw $0x6,%eax,%xmm3
@@ -47864,7 +47856,7 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,67,15,110,20,24 // movd (%r8,%r11,1),%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3
- .byte 233,74,255,255,255 // jmpq 26b3f <_sk_load_a8_dst_sse41_8bit+0x1f>
+ .byte 233,74,255,255,255 // jmpq 26b2b <_sk_load_a8_dst_sse41_8bit+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
@@ -47895,15 +47887,15 @@ _sk_store_a8_sse41_8bit:
.byte 77,15,175,193 // imul %r9,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 102,15,111,45,49,104,0,0 // movdqa 0x6831(%rip),%xmm5 # 2d460 <_sk_overlay_sse2_8bit+0x1688>
+ .byte 102,15,111,45,37,104,0,0 // movdqa 0x6825(%rip),%xmm5 # 2d440 <_sk_overlay_sse2_8bit+0x167c>
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,56,0,245 // pshufb %xmm5,%xmm6
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,56,0,229 // pshufb %xmm5,%xmm4
.byte 102,15,108,230 // punpcklqdq %xmm6,%xmm4
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,19 // jne 26c5d <_sk_store_a8_sse41_8bit+0x49>
- .byte 102,15,56,0,37,109,103,0,0 // pshufb 0x676d(%rip),%xmm4 # 2d3c0 <_sk_overlay_sse2_8bit+0x15e8>
+ .byte 117,19 // jne 26c49 <_sk_store_a8_sse41_8bit+0x49>
+ .byte 102,15,56,0,37,97,103,0,0 // pshufb 0x6761(%rip),%xmm4 # 2d3a0 <_sk_overlay_sse2_8bit+0x15dc>
.byte 102,67,15,214,36,24 // movq %xmm4,(%r8,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -47911,24 +47903,24 @@ _sk_store_a8_sse41_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 26c59 <_sk_store_a8_sse41_8bit+0x45>
+ .byte 119,236 // ja 26c45 <_sk_store_a8_sse41_8bit+0x45>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,92,0,0,0 // lea 0x5c(%rip),%r10 # 26cd4 <_sk_store_a8_sse41_8bit+0xc0>
+ .byte 76,141,21,92,0,0,0 // lea 0x5c(%rip),%r10 # 26cc0 <_sk_store_a8_sse41_8bit+0xc0>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,58,20,36,24,0 // pextrb $0x0,%xmm4,(%r8,%r11,1)
- .byte 235,206 // jmp 26c59 <_sk_store_a8_sse41_8bit+0x45>
+ .byte 235,206 // jmp 26c45 <_sk_store_a8_sse41_8bit+0x45>
.byte 102,67,15,58,20,100,24,2,4 // pextrb $0x4,%xmm4,0x2(%r8,%r11,1)
- .byte 102,15,56,0,37,3,96,0,0 // pshufb 0x6003(%rip),%xmm4 # 2cca0 <_sk_overlay_sse2_8bit+0xec8>
+ .byte 102,15,56,0,37,247,95,0,0 // pshufb 0x5ff7(%rip),%xmm4 # 2cc80 <_sk_overlay_sse2_8bit+0xebc>
.byte 102,67,15,58,21,36,24,0 // pextrw $0x0,%xmm4,(%r8,%r11,1)
- .byte 235,178 // jmp 26c59 <_sk_store_a8_sse41_8bit+0x45>
+ .byte 235,178 // jmp 26c45 <_sk_store_a8_sse41_8bit+0x45>
.byte 102,67,15,58,20,100,24,6,12 // pextrb $0xc,%xmm4,0x6(%r8,%r11,1)
.byte 102,67,15,58,20,100,24,5,10 // pextrb $0xa,%xmm4,0x5(%r8,%r11,1)
.byte 102,67,15,58,20,100,24,4,8 // pextrb $0x8,%xmm4,0x4(%r8,%r11,1)
- .byte 102,15,56,0,37,229,95,0,0 // pshufb 0x5fe5(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0xed8>
+ .byte 102,15,56,0,37,217,95,0,0 // pshufb 0x5fd9(%rip),%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xecc>
.byte 102,67,15,126,36,24 // movd %xmm4,(%r8,%r11,1)
- .byte 235,134 // jmp 26c59 <_sk_store_a8_sse41_8bit+0x45>
+ .byte 235,134 // jmp 26c45 <_sk_store_a8_sse41_8bit+0x45>
.byte 144 // nop
.byte 173 // lods %ds:(%rsi),%eax
.byte 255 // (bad)
@@ -47961,16 +47953,16 @@ _sk_load_g8_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,66 // jne 26d4a <_sk_load_g8_sse41_8bit+0x5a>
+ .byte 117,66 // jne 26d36 <_sk_load_g8_sse41_8bit+0x5a>
.byte 102,67,15,56,48,12,24 // pmovzxbw (%r8,%r11,1),%xmm1
- .byte 102,15,219,13,121,95,0,0 // pand 0x5f79(%rip),%xmm1 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,13,109,95,0,0 // pand 0x5f6d(%rip),%xmm1 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
- .byte 102,15,111,37,68,103,0,0 // movdqa 0x6744(%rip),%xmm4 # 2d470 <_sk_overlay_sse2_8bit+0x1698>
+ .byte 102,15,111,37,56,103,0,0 // movdqa 0x6738(%rip),%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0x168c>
.byte 102,15,56,64,204 // pmulld %xmm4,%xmm1
.byte 102,15,56,64,196 // pmulld %xmm4,%xmm0
- .byte 102,15,111,37,146,102,0,0 // movdqa 0x6692(%rip),%xmm4 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
+ .byte 102,15,111,37,134,102,0,0 // movdqa 0x6686(%rip),%xmm4 # 2d3b0 <_sk_overlay_sse2_8bit+0x15ec>
.byte 102,15,235,196 // por %xmm4,%xmm0
.byte 102,15,235,204 // por %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47980,15 +47972,15 @@ _sk_load_g8_sse41_8bit:
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,177 // ja 26d0f <_sk_load_g8_sse41_8bit+0x1f>
+ .byte 119,177 // ja 26cfb <_sk_load_g8_sse41_8bit+0x1f>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 26de0 <_sk_load_g8_sse41_8bit+0xf0>
+ .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 26dcc <_sk_load_g8_sse41_8bit+0xf0>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 235,146 // jmp 26d0f <_sk_load_g8_sse41_8bit+0x1f>
+ .byte 235,146 // jmp 26cfb <_sk_load_g8_sse41_8bit+0x1f>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,2 // pinsrw $0x2,%eax,%xmm1
@@ -47996,7 +47988,7 @@ _sk_load_g8_sse41_8bit:
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,3 // pblendw $0x3,%xmm0,%xmm1
- .byte 233,106,255,255,255 // jmpq 26d0f <_sk_load_g8_sse41_8bit+0x1f>
+ .byte 233,106,255,255,255 // jmpq 26cfb <_sk_load_g8_sse41_8bit+0x1f>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,6 // pinsrw $0x6,%eax,%xmm1
@@ -48007,7 +47999,7 @@ _sk_load_g8_sse41_8bit:
.byte 102,67,15,110,4,24 // movd (%r8,%r11,1),%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,15 // pblendw $0xf,%xmm0,%xmm1
- .byte 233,47,255,255,255 // jmpq 26d0f <_sk_load_g8_sse41_8bit+0x1f>
+ .byte 233,47,255,255,255 // jmpq 26cfb <_sk_load_g8_sse41_8bit+0x1f>
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -48039,16 +48031,16 @@ _sk_load_g8_dst_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,66 // jne 26e56 <_sk_load_g8_dst_sse41_8bit+0x5a>
+ .byte 117,66 // jne 26e42 <_sk_load_g8_dst_sse41_8bit+0x5a>
.byte 102,67,15,56,48,28,24 // pmovzxbw (%r8,%r11,1),%xmm3
- .byte 102,15,219,29,109,94,0,0 // pand 0x5e6d(%rip),%xmm3 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,29,97,94,0,0 // pand 0x5e61(%rip),%xmm3 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,211 // pmovzxwd %xmm3,%xmm2
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
- .byte 102,15,111,37,56,102,0,0 // movdqa 0x6638(%rip),%xmm4 # 2d470 <_sk_overlay_sse2_8bit+0x1698>
+ .byte 102,15,111,37,44,102,0,0 // movdqa 0x662c(%rip),%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0x168c>
.byte 102,15,56,64,220 // pmulld %xmm4,%xmm3
.byte 102,15,56,64,212 // pmulld %xmm4,%xmm2
- .byte 102,15,111,37,134,101,0,0 // movdqa 0x6586(%rip),%xmm4 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
+ .byte 102,15,111,37,122,101,0,0 // movdqa 0x657a(%rip),%xmm4 # 2d3b0 <_sk_overlay_sse2_8bit+0x15ec>
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,235,220 // por %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48058,15 +48050,15 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,177 // ja 26e1b <_sk_load_g8_dst_sse41_8bit+0x1f>
+ .byte 119,177 // ja 26e07 <_sk_load_g8_dst_sse41_8bit+0x1f>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 26eec <_sk_load_g8_dst_sse41_8bit+0xf0>
+ .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 26ed8 <_sk_load_g8_dst_sse41_8bit+0xf0>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 235,146 // jmp 26e1b <_sk_load_g8_dst_sse41_8bit+0x1f>
+ .byte 235,146 // jmp 26e07 <_sk_load_g8_dst_sse41_8bit+0x1f>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3
@@ -48074,7 +48066,7 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,3 // pblendw $0x3,%xmm2,%xmm3
- .byte 233,106,255,255,255 // jmpq 26e1b <_sk_load_g8_dst_sse41_8bit+0x1f>
+ .byte 233,106,255,255,255 // jmpq 26e07 <_sk_load_g8_dst_sse41_8bit+0x1f>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,6 // pinsrw $0x6,%eax,%xmm3
@@ -48085,7 +48077,7 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,67,15,110,20,24 // movd (%r8,%r11,1),%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3
- .byte 233,47,255,255,255 // jmpq 26e1b <_sk_load_g8_dst_sse41_8bit+0x1f>
+ .byte 233,47,255,255,255 // jmpq 26e07 <_sk_load_g8_dst_sse41_8bit+0x1f>
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -48118,11 +48110,11 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,206,0,0,0 // jne 26ff6 <_sk_srcover_rgba_8888_sse41_8bit+0xee>
+ .byte 15,133,206,0,0,0 // jne 26fe2 <_sk_srcover_rgba_8888_sse41_8bit+0xee>
.byte 243,71,15,111,68,152,16 // movdqu 0x10(%r8,%r11,4),%xmm8
.byte 243,71,15,111,12,152 // movdqu (%r8,%r11,4),%xmm9
.byte 72,133,255 // test %rdi,%rdi
- .byte 102,15,111,37,160,100,0,0 // movdqa 0x64a0(%rip),%xmm4 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,15,111,37,148,100,0,0 // movdqa 0x6494(%rip),%xmm4 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,56,0,244 // pshufb %xmm4,%xmm6
.byte 102,15,111,248 // movdqa %xmm0,%xmm7
@@ -48156,7 +48148,7 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 102,68,15,248,204 // psubb %xmm4,%xmm9
.byte 102,68,15,252,200 // paddb %xmm0,%xmm9
.byte 102,68,15,252,193 // paddb %xmm1,%xmm8
- .byte 117,78 // jne 27033 <_sk_srcover_rgba_8888_sse41_8bit+0x12b>
+ .byte 117,78 // jne 2701f <_sk_srcover_rgba_8888_sse41_8bit+0x12b>
.byte 243,71,15,127,12,152 // movdqu %xmm9,(%r8,%r11,4)
.byte 243,71,15,127,68,152,16 // movdqu %xmm8,0x10(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48167,44 +48159,44 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,33,255,255,255 // ja 26f35 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
+ .byte 15,135,33,255,255,255 // ja 26f21 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,189,0,0,0 // lea 0xbd(%rip),%r10 # 270dc <_sk_srcover_rgba_8888_sse41_8bit+0x1d4>
+ .byte 76,141,21,189,0,0,0 // lea 0xbd(%rip),%r10 # 270c8 <_sk_srcover_rgba_8888_sse41_8bit+0x1d4>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,71,15,110,12,152 // movd (%r8,%r11,4),%xmm9
- .byte 233,2,255,255,255 // jmpq 26f35 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
+ .byte 233,2,255,255,255 // jmpq 26f21 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,175 // ja 26ff2 <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ .byte 119,175 // ja 26fde <_sk_srcover_rgba_8888_sse41_8bit+0xea>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 76,141,13,170,0,0,0 // lea 0xaa(%rip),%r9 # 270f8 <_sk_srcover_rgba_8888_sse41_8bit+0x1f0>
+ .byte 76,141,13,170,0,0,0 // lea 0xaa(%rip),%r9 # 270e4 <_sk_srcover_rgba_8888_sse41_8bit+0x1f0>
.byte 73,99,4,129 // movslq (%r9,%rax,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
.byte 102,71,15,126,12,152 // movd %xmm9,(%r8,%r11,4)
- .byte 235,147 // jmp 26ff2 <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ .byte 235,147 // jmp 26fde <_sk_srcover_rgba_8888_sse41_8bit+0xea>
.byte 102,67,15,110,100,152,8 // movd 0x8(%r8,%r11,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 243,67,15,126,36,152 // movq (%r8,%r11,4),%xmm4
.byte 102,68,15,58,14,204,15 // pblendw $0xf,%xmm4,%xmm9
- .byte 233,183,254,255,255 // jmpq 26f35 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
+ .byte 233,183,254,255,255 // jmpq 26f21 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
.byte 102,67,15,110,100,152,24 // movd 0x18(%r8,%r11,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
.byte 102,71,15,58,34,68,152,20,1 // pinsrd $0x1,0x14(%r8,%r11,4),%xmm8
.byte 102,71,15,58,34,68,152,16,0 // pinsrd $0x0,0x10(%r8,%r11,4),%xmm8
- .byte 233,141,254,255,255 // jmpq 26f2f <_sk_srcover_rgba_8888_sse41_8bit+0x27>
+ .byte 233,141,254,255,255 // jmpq 26f1b <_sk_srcover_rgba_8888_sse41_8bit+0x27>
.byte 102,71,15,58,22,76,152,8,2 // pextrd $0x2,%xmm9,0x8(%r8,%r11,4)
.byte 102,71,15,214,12,152 // movq %xmm9,(%r8,%r11,4)
- .byte 233,60,255,255,255 // jmpq 26ff2 <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ .byte 233,60,255,255,255 // jmpq 26fde <_sk_srcover_rgba_8888_sse41_8bit+0xea>
.byte 102,71,15,58,22,68,152,24,2 // pextrd $0x2,%xmm8,0x18(%r8,%r11,4)
.byte 102,71,15,58,22,68,152,20,1 // pextrd $0x1,%xmm8,0x14(%r8,%r11,4)
.byte 102,71,15,126,68,152,16 // movd %xmm8,0x10(%r8,%r11,4)
.byte 243,71,15,127,12,152 // movdqu %xmm9,(%r8,%r11,4)
- .byte 233,24,255,255,255 // jmpq 26ff2 <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ .byte 233,24,255,255,255 // jmpq 26fde <_sk_srcover_rgba_8888_sse41_8bit+0xea>
.byte 102,144 // xchg %ax,%ax
.byte 76,255 // rex.WR (bad)
.byte 255 // (bad)
@@ -48246,7 +48238,7 @@ _sk_scale_1_float_sse41_8bit:
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,0 // movss (%rax),%xmm0
- .byte 243,15,89,5,26,81,0,0 // mulss 0x511a(%rip),%xmm0 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 243,15,89,5,226,89,0,0 // mulss 0x59e2(%rip),%xmm0 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 243,15,44,192 // cvttss2si %xmm0,%eax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,68,15,56,48,197 // pmovzxbw %xmm5,%xmm8
@@ -48254,7 +48246,7 @@ _sk_scale_1_float_sse41_8bit:
.byte 102,68,15,56,48,204 // pmovzxbw %xmm4,%xmm9
.byte 102,15,104,224 // punpckhbw %xmm0,%xmm4
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 102,15,56,0,53,46,99,0,0 // pshufb 0x632e(%rip),%xmm6 # 2d480 <_sk_overlay_sse2_8bit+0x16a8>
+ .byte 102,15,56,0,53,34,99,0,0 // pshufb 0x6322(%rip),%xmm6 # 2d460 <_sk_overlay_sse2_8bit+0x169c>
.byte 102,15,111,206 // movdqa %xmm6,%xmm1
.byte 102,65,15,213,201 // pmullw %xmm9,%xmm1
.byte 102,15,111,198 // movdqa %xmm6,%xmm0
@@ -48286,13 +48278,13 @@ _sk_scale_u8_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,160,0,0,0 // jne 2725e <_sk_scale_u8_sse41_8bit+0xbc>
+ .byte 15,133,160,0,0,0 // jne 2724a <_sk_scale_u8_sse41_8bit+0xbc>
.byte 102,67,15,56,48,52,24 // pmovzxbw (%r8,%r11,1),%xmm6
- .byte 102,15,219,53,195,90,0,0 // pand 0x5ac3(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,53,183,90,0,0 // pand 0x5ab7(%rip),%xmm6 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
- .byte 102,15,56,0,61,177,98,0,0 // pshufb 0x62b1(%rip),%xmm7 # 2d490 <_sk_overlay_sse2_8bit+0x16b8>
- .byte 102,15,56,0,53,184,98,0,0 // pshufb 0x62b8(%rip),%xmm6 # 2d4a0 <_sk_overlay_sse2_8bit+0x16c8>
+ .byte 102,15,56,0,61,165,98,0,0 // pshufb 0x62a5(%rip),%xmm7 # 2d470 <_sk_overlay_sse2_8bit+0x16ac>
+ .byte 102,15,56,0,53,172,98,0,0 // pshufb 0x62ac(%rip),%xmm6 # 2d480 <_sk_overlay_sse2_8bit+0x16bc>
.byte 102,68,15,56,48,200 // pmovzxbw %xmm0,%xmm9
.byte 102,65,15,104,192 // punpckhbw %xmm8,%xmm0
.byte 102,68,15,56,48,209 // pmovzxbw %xmm1,%xmm10
@@ -48324,15 +48316,15 @@ _sk_scale_u8_sse41_8bit:
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,79,255,255,255 // ja 271c5 <_sk_scale_u8_sse41_8bit+0x23>
+ .byte 15,135,79,255,255,255 // ja 271b1 <_sk_scale_u8_sse41_8bit+0x23>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,123,0,0,0 // lea 0x7b(%rip),%r10 # 272fc <_sk_scale_u8_sse41_8bit+0x15a>
+ .byte 76,141,21,123,0,0,0 // lea 0x7b(%rip),%r10 # 272e8 <_sk_scale_u8_sse41_8bit+0x15a>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,45,255,255,255 // jmpq 271c5 <_sk_scale_u8_sse41_8bit+0x23>
+ .byte 233,45,255,255,255 // jmpq 271b1 <_sk_scale_u8_sse41_8bit+0x23>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,15,196,240,2 // pinsrw $0x2,%eax,%xmm6
@@ -48340,7 +48332,7 @@ _sk_scale_u8_sse41_8bit:
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,56,48,228 // pmovzxbw %xmm4,%xmm4
.byte 102,15,58,14,244,3 // pblendw $0x3,%xmm4,%xmm6
- .byte 233,5,255,255,255 // jmpq 271c5 <_sk_scale_u8_sse41_8bit+0x23>
+ .byte 233,5,255,255,255 // jmpq 271b1 <_sk_scale_u8_sse41_8bit+0x23>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,15,196,240,6 // pinsrw $0x6,%eax,%xmm6
@@ -48351,7 +48343,7 @@ _sk_scale_u8_sse41_8bit:
.byte 102,67,15,110,36,24 // movd (%r8,%r11,1),%xmm4
.byte 102,15,56,48,228 // pmovzxbw %xmm4,%xmm4
.byte 102,15,58,14,244,15 // pblendw $0xf,%xmm4,%xmm6
- .byte 233,202,254,255,255 // jmpq 271c5 <_sk_scale_u8_sse41_8bit+0x23>
+ .byte 233,202,254,255,255 // jmpq 271b1 <_sk_scale_u8_sse41_8bit+0x23>
.byte 144 // nop
.byte 142,255 // mov %edi,%?
.byte 255 // (bad)
@@ -48359,7 +48351,7 @@ _sk_scale_u8_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf02730c <_sk_overlay_sse2_8bit+0xffffffffdeffb534>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf0272f8 <_sk_overlay_sse2_8bit+0xffffffffdeffb534>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -48376,7 +48368,7 @@ FUNCTION(_sk_lerp_1_float_sse41_8bit)
_sk_lerp_1_float_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,32 // movss (%rax),%xmm4
- .byte 243,15,89,37,30,79,0,0 // mulss 0x4f1e(%rip),%xmm4 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 243,15,89,37,230,87,0,0 // mulss 0x57e6(%rip),%xmm4 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 243,15,44,196 // cvttss2si %xmm4,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,228 // punpcklbw %xmm4,%xmm4
@@ -48387,7 +48379,7 @@ _sk_lerp_1_float_sse41_8bit:
.byte 102,65,15,104,193 // punpckhbw %xmm9,%xmm0
.byte 102,68,15,56,48,217 // pmovzxbw %xmm1,%xmm11
.byte 102,65,15,104,201 // punpckhbw %xmm9,%xmm1
- .byte 102,15,56,0,61,79,97,0,0 // pshufb 0x614f(%rip),%xmm7 # 2d4b0 <_sk_overlay_sse2_8bit+0x16d8>
+ .byte 102,15,56,0,61,67,97,0,0 // pshufb 0x6143(%rip),%xmm7 # 2d490 <_sk_overlay_sse2_8bit+0x16cc>
.byte 102,68,15,111,231 // movdqa %xmm7,%xmm12
.byte 102,69,15,213,227 // pmullw %xmm11,%xmm12
.byte 102,68,15,111,239 // movdqa %xmm7,%xmm13
@@ -48447,13 +48439,13 @@ _sk_lerp_u8_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,46,1,0,0 // jne 27584 <_sk_lerp_u8_sse41_8bit+0x14a>
+ .byte 15,133,46,1,0,0 // jne 27570 <_sk_lerp_u8_sse41_8bit+0x14a>
.byte 102,67,15,56,48,60,24 // pmovzxbw (%r8,%r11,1),%xmm7
- .byte 102,15,219,61,43,88,0,0 // pand 0x582b(%rip),%xmm7 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,61,31,88,0,0 // pand 0x581f(%rip),%xmm7 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,25,96,0,0 // pshufb 0x6019(%rip),%xmm6 # 2d490 <_sk_overlay_sse2_8bit+0x16b8>
- .byte 102,15,56,0,61,32,96,0,0 // pshufb 0x6020(%rip),%xmm7 # 2d4a0 <_sk_overlay_sse2_8bit+0x16c8>
+ .byte 102,15,56,0,53,13,96,0,0 // pshufb 0x600d(%rip),%xmm6 # 2d470 <_sk_overlay_sse2_8bit+0x16ac>
+ .byte 102,15,56,0,61,20,96,0,0 // pshufb 0x6014(%rip),%xmm7 # 2d480 <_sk_overlay_sse2_8bit+0x16bc>
.byte 102,68,15,56,48,200 // pmovzxbw %xmm0,%xmm9
.byte 102,65,15,104,192 // punpckhbw %xmm8,%xmm0
.byte 102,68,15,56,48,209 // pmovzxbw %xmm1,%xmm10
@@ -48514,15 +48506,15 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,193,254,255,255 // ja 2745d <_sk_lerp_u8_sse41_8bit+0x23>
+ .byte 15,135,193,254,255,255 // ja 27449 <_sk_lerp_u8_sse41_8bit+0x23>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,125,0,0,0 // lea 0x7d(%rip),%r10 # 27624 <_sk_lerp_u8_sse41_8bit+0x1ea>
+ .byte 76,141,21,125,0,0,0 // lea 0x7d(%rip),%r10 # 27610 <_sk_lerp_u8_sse41_8bit+0x1ea>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,159,254,255,255 // jmpq 2745d <_sk_lerp_u8_sse41_8bit+0x23>
+ .byte 233,159,254,255,255 // jmpq 27449 <_sk_lerp_u8_sse41_8bit+0x23>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 102,15,196,248,2 // pinsrw $0x2,%eax,%xmm7
@@ -48530,7 +48522,7 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,48,237 // pmovzxbw %xmm5,%xmm5
.byte 102,15,58,14,253,3 // pblendw $0x3,%xmm5,%xmm7
- .byte 233,119,254,255,255 // jmpq 2745d <_sk_lerp_u8_sse41_8bit+0x23>
+ .byte 233,119,254,255,255 // jmpq 27449 <_sk_lerp_u8_sse41_8bit+0x23>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 102,15,196,248,6 // pinsrw $0x6,%eax,%xmm7
@@ -48541,7 +48533,7 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,67,15,110,44,24 // movd (%r8,%r11,1),%xmm5
.byte 102,15,56,48,237 // pmovzxbw %xmm5,%xmm5
.byte 102,15,58,14,253,15 // pblendw $0xf,%xmm5,%xmm7
- .byte 233,60,254,255,255 // jmpq 2745d <_sk_lerp_u8_sse41_8bit+0x23>
+ .byte 233,60,254,255,255 // jmpq 27449 <_sk_lerp_u8_sse41_8bit+0x23>
.byte 15,31,0 // nopl (%rax)
.byte 140,255 // mov %?,%edi
.byte 255 // (bad)
@@ -48585,7 +48577,7 @@ HIDDEN _sk_black_color_sse41_8bit
FUNCTION(_sk_black_color_sse41_8bit)
_sk_black_color_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,115,93,0,0 // movaps 0x5d73(%rip),%xmm0 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
+ .byte 15,40,5,103,93,0,0 // movaps 0x5d67(%rip),%xmm0 # 2d3b0 <_sk_overlay_sse2_8bit+0x15ec>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 255,224 // jmpq *%rax
@@ -48611,7 +48603,7 @@ HIDDEN _sk_srcatop_sse41_8bit
.globl _sk_srcatop_sse41_8bit
FUNCTION(_sk_srcatop_sse41_8bit)
_sk_srcatop_sse41_8bit:
- .byte 102,68,15,111,21,95,93,0,0 // movdqa 0x5d5f(%rip),%xmm10 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,68,15,111,21,83,93,0,0 // movdqa 0x5d53(%rip),%xmm10 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,195 // pmovzxbw %xmm3,%xmm8
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
@@ -48681,7 +48673,7 @@ HIDDEN _sk_dstatop_sse41_8bit
.globl _sk_dstatop_sse41_8bit
FUNCTION(_sk_dstatop_sse41_8bit)
_sk_dstatop_sse41_8bit:
- .byte 102,68,15,111,29,36,92,0,0 // movdqa 0x5c24(%rip),%xmm11 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,68,15,111,29,24,92,0,0 // movdqa 0x5c18(%rip),%xmm11 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,69,15,56,0,235 // pshufb %xmm11,%xmm13
.byte 102,68,15,111,248 // movdqa %xmm0,%xmm15
@@ -48753,7 +48745,7 @@ FUNCTION(_sk_srcin_sse41_8bit)
_sk_srcin_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,219,90,0,0 // movdqa 0x5adb(%rip),%xmm0 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,15,111,5,207,90,0,0 // movdqa 0x5acf(%rip),%xmm0 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
.byte 102,15,56,0,240 // pshufb %xmm0,%xmm6
.byte 102,15,111,250 // movdqa %xmm2,%xmm7
@@ -48789,7 +48781,7 @@ HIDDEN _sk_dstin_sse41_8bit
FUNCTION(_sk_dstin_sse41_8bit)
_sk_dstin_sse41_8bit:
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,74,90,0,0 // movdqa 0x5a4a(%rip),%xmm0 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,15,111,5,62,90,0,0 // movdqa 0x5a3e(%rip),%xmm0 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,15,56,0,200 // pshufb %xmm0,%xmm1
.byte 102,15,56,0,232 // pshufb %xmm0,%xmm5
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
@@ -48827,7 +48819,7 @@ FUNCTION(_sk_srcout_sse41_8bit)
_sk_srcout_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,177,89,0,0 // movdqa 0x59b1(%rip),%xmm0 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,15,111,5,165,89,0,0 // movdqa 0x59a5(%rip),%xmm0 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,15,111,250 // movdqa %xmm2,%xmm7
.byte 102,15,56,0,248 // pshufb %xmm0,%xmm7
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -48865,7 +48857,7 @@ HIDDEN _sk_dstout_sse41_8bit
.globl _sk_dstout_sse41_8bit
FUNCTION(_sk_dstout_sse41_8bit)
_sk_dstout_sse41_8bit:
- .byte 102,15,111,37,24,89,0,0 // movdqa 0x5918(%rip),%xmm4 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,15,111,37,12,89,0,0 // movdqa 0x590c(%rip),%xmm4 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 102,15,118,228 // pcmpeqd %xmm4,%xmm4
@@ -48905,7 +48897,7 @@ HIDDEN _sk_srcover_sse41_8bit
.globl _sk_srcover_sse41_8bit
FUNCTION(_sk_srcover_sse41_8bit)
_sk_srcover_sse41_8bit:
- .byte 102,15,111,53,119,88,0,0 // movdqa 0x5877(%rip),%xmm6 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,15,111,53,107,88,0,0 // movdqa 0x586b(%rip),%xmm6 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,68,15,111,217 // movdqa %xmm1,%xmm11
.byte 102,68,15,56,0,222 // pshufb %xmm6,%xmm11
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
@@ -48946,7 +48938,7 @@ HIDDEN _sk_dstover_sse41_8bit
.globl _sk_dstover_sse41_8bit
FUNCTION(_sk_dstover_sse41_8bit)
_sk_dstover_sse41_8bit:
- .byte 102,68,15,111,5,199,87,0,0 // movdqa 0x57c7(%rip),%xmm8 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,68,15,111,5,187,87,0,0 // movdqa 0x57bb(%rip),%xmm8 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,68,15,111,209 // movdqa %xmm1,%xmm10
.byte 102,68,15,56,48,201 // pmovzxbw %xmm1,%xmm9
.byte 102,15,252,203 // paddb %xmm3,%xmm1
@@ -49025,7 +49017,7 @@ _sk_multiply_sse41_8bit:
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,68,15,111,53,133,86,0,0 // movdqa 0x5685(%rip),%xmm14 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,68,15,111,53,121,86,0,0 // movdqa 0x5679(%rip),%xmm14 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,68,15,111,195 // movdqa %xmm3,%xmm8
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
.byte 102,65,15,56,0,238 // pshufb %xmm14,%xmm5
@@ -49154,7 +49146,7 @@ HIDDEN _sk_xor__sse41_8bit
.globl _sk_xor__sse41_8bit
FUNCTION(_sk_xor__sse41_8bit)
_sk_xor__sse41_8bit:
- .byte 102,68,15,111,21,67,84,0,0 // movdqa 0x5443(%rip),%xmm10 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,68,15,111,21,55,84,0,0 // movdqa 0x5437(%rip),%xmm10 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,68,15,111,226 // movdqa %xmm2,%xmm12
.byte 102,68,15,56,48,194 // pmovzxbw %xmm2,%xmm8
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
@@ -49236,7 +49228,7 @@ HIDDEN _sk_darken_sse41_8bit
FUNCTION(_sk_darken_sse41_8bit)
_sk_darken_sse41_8bit:
.byte 102,68,15,111,240 // movdqa %xmm0,%xmm14
- .byte 102,68,15,111,5,234,82,0,0 // movdqa 0x52ea(%rip),%xmm8 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,68,15,111,5,222,82,0,0 // movdqa 0x52de(%rip),%xmm8 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -49303,7 +49295,7 @@ _sk_darken_sse41_8bit:
.byte 102,15,248,231 // psubb %xmm7,%xmm4
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,68,15,248,245 // psubb %xmm5,%xmm14
- .byte 15,40,5,126,82,0,0 // movaps 0x527e(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
+ .byte 15,40,5,114,82,0,0 // movaps 0x5272(%rip),%xmm0 # 2d4a0 <_sk_overlay_sse2_8bit+0x16dc>
.byte 102,68,15,56,16,244 // pblendvb %xmm0,%xmm4,%xmm14
.byte 102,65,15,56,16,200 // pblendvb %xmm0,%xmm8,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -49315,7 +49307,7 @@ HIDDEN _sk_lighten_sse41_8bit
FUNCTION(_sk_lighten_sse41_8bit)
_sk_lighten_sse41_8bit:
.byte 102,68,15,111,240 // movdqa %xmm0,%xmm14
- .byte 102,68,15,111,5,123,81,0,0 // movdqa 0x517b(%rip),%xmm8 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,68,15,111,5,111,81,0,0 // movdqa 0x516f(%rip),%xmm8 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -49382,7 +49374,7 @@ _sk_lighten_sse41_8bit:
.byte 102,15,248,231 // psubb %xmm7,%xmm4
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,68,15,248,245 // psubb %xmm5,%xmm14
- .byte 15,40,5,15,81,0,0 // movaps 0x510f(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
+ .byte 15,40,5,3,81,0,0 // movaps 0x5103(%rip),%xmm0 # 2d4a0 <_sk_overlay_sse2_8bit+0x16dc>
.byte 102,68,15,56,16,244 // pblendvb %xmm0,%xmm4,%xmm14
.byte 102,65,15,56,16,200 // pblendvb %xmm0,%xmm8,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -49422,7 +49414,7 @@ _sk_exclusion_sse41_8bit:
.byte 102,15,113,215,8 // psrlw $0x8,%xmm7
.byte 102,15,103,253 // packuswb %xmm5,%xmm7
.byte 102,15,103,230 // packuswb %xmm6,%xmm4
- .byte 102,15,111,45,101,80,0,0 // movdqa 0x5065(%rip),%xmm5 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
+ .byte 102,15,111,45,89,80,0,0 // movdqa 0x5059(%rip),%xmm5 # 2d4a0 <_sk_overlay_sse2_8bit+0x16dc>
.byte 102,15,248,204 // psubb %xmm4,%xmm1
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,15,219,239 // pand %xmm7,%xmm5
@@ -49437,7 +49429,7 @@ HIDDEN _sk_difference_sse41_8bit
FUNCTION(_sk_difference_sse41_8bit)
_sk_difference_sse41_8bit:
.byte 102,68,15,111,193 // movdqa %xmm1,%xmm8
- .byte 102,15,111,13,92,79,0,0 // movdqa 0x4f5c(%rip),%xmm1 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,15,111,13,80,79,0,0 // movdqa 0x4f50(%rip),%xmm1 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -49475,7 +49467,7 @@ _sk_difference_sse41_8bit:
.byte 102,15,113,214,8 // psrlw $0x8,%xmm6
.byte 102,15,113,215,8 // psrlw $0x8,%xmm7
.byte 102,15,103,254 // packuswb %xmm6,%xmm7
- .byte 102,15,111,37,161,78,0,0 // movdqa 0x4ea1(%rip),%xmm4 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,15,111,37,149,78,0,0 // movdqa 0x4e95(%rip),%xmm4 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 102,15,56,0,236 // pshufb %xmm4,%xmm5
.byte 102,69,15,104,236 // punpckhbw %xmm12,%xmm13
@@ -49500,7 +49492,7 @@ _sk_difference_sse41_8bit:
.byte 102,15,103,241 // packuswb %xmm1,%xmm6
.byte 102,65,15,218,230 // pminub %xmm14,%xmm4
.byte 102,15,218,247 // pminub %xmm7,%xmm6
- .byte 102,15,111,13,4,79,0,0 // movdqa 0x4f04(%rip),%xmm1 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
+ .byte 102,15,111,13,248,78,0,0 // movdqa 0x4ef8(%rip),%xmm1 # 2d4a0 <_sk_overlay_sse2_8bit+0x16dc>
.byte 102,68,15,248,198 // psubb %xmm6,%xmm8
.byte 102,15,219,241 // pand %xmm1,%xmm6
.byte 102,15,219,204 // pand %xmm4,%xmm1
@@ -49528,7 +49520,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,15,127,76,36,128 // movdqa %xmm1,-0x80(%rsp)
.byte 102,69,15,56,48,221 // pmovzxbw %xmm13,%xmm11
.byte 102,68,15,127,92,36,48 // movdqa %xmm11,0x30(%rsp)
- .byte 102,15,111,13,180,77,0,0 // movdqa 0x4db4(%rip),%xmm1 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,15,111,13,168,77,0,0 // movdqa 0x4da8(%rip),%xmm1 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,68,15,56,0,241 // pshufb %xmm1,%xmm14
.byte 102,68,15,56,0,233 // pshufb %xmm1,%xmm13
.byte 102,69,15,56,48,197 // pmovzxbw %xmm13,%xmm8
@@ -49578,7 +49570,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,65,15,56,58,247 // pminuw %xmm15,%xmm6
.byte 102,15,117,240 // pcmpeqw %xmm0,%xmm6
.byte 102,15,127,116,36,64 // movdqa %xmm6,0x40(%rsp)
- .byte 102,15,111,53,100,69,0,0 // movdqa 0x4564(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,111,53,88,69,0,0 // movdqa 0x4558(%rip),%xmm6 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,15,213,196 // pmullw %xmm4,%xmm0
@@ -49689,7 +49681,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,15,253,116,36,32 // paddw 0x20(%rsp),%xmm6
.byte 102,68,15,253,68,36,160 // paddw -0x60(%rsp),%xmm8
.byte 102,15,253,124,36,128 // paddw -0x80(%rsp),%xmm7
- .byte 102,15,111,5,116,75,0,0 // movdqa 0x4b74(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0x16f8>
+ .byte 102,15,111,5,104,75,0,0 // movdqa 0x4b68(%rip),%xmm0 # 2d4b0 <_sk_overlay_sse2_8bit+0x16ec>
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
.byte 102,68,15,253,219 // paddw %xmm3,%xmm11
.byte 102,15,253,240 // paddw %xmm0,%xmm6
@@ -49698,7 +49690,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,68,15,253,196 // paddw %xmm4,%xmm8
.byte 102,15,253,248 // paddw %xmm0,%xmm7
.byte 102,15,253,250 // paddw %xmm2,%xmm7
- .byte 102,15,111,5,88,75,0,0 // movdqa 0x4b58(%rip),%xmm0 # 2d4e0 <_sk_overlay_sse2_8bit+0x1708>
+ .byte 102,15,111,5,76,75,0,0 // movdqa 0x4b4c(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0x16fc>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
.byte 102,15,228,248 // pmulhuw %xmm0,%xmm7
@@ -49733,7 +49725,7 @@ _sk_overlay_sse41_8bit:
.byte 102,15,127,76,36,128 // movdqa %xmm1,-0x80(%rsp)
.byte 102,65,15,56,48,206 // pmovzxbw %xmm14,%xmm1
.byte 102,15,127,140,36,144,0,0,0 // movdqa %xmm1,0x90(%rsp)
- .byte 102,15,111,13,190,73,0,0 // movdqa 0x49be(%rip),%xmm1 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
+ .byte 102,15,111,13,178,73,0,0 // movdqa 0x49b2(%rip),%xmm1 # 2d3c0 <_sk_overlay_sse2_8bit+0x15fc>
.byte 102,68,15,56,0,249 // pshufb %xmm1,%xmm15
.byte 102,68,15,56,0,241 // pshufb %xmm1,%xmm14
.byte 102,65,15,56,48,238 // pmovzxbw %xmm14,%xmm5
@@ -49785,7 +49777,7 @@ _sk_overlay_sse41_8bit:
.byte 102,65,15,56,58,221 // pminuw %xmm13,%xmm3
.byte 102,15,117,216 // pcmpeqw %xmm0,%xmm3
.byte 102,15,127,92,36,48 // movdqa %xmm3,0x30(%rsp)
- .byte 102,15,111,53,96,65,0,0 // movdqa 0x4160(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,111,53,84,65,0,0 // movdqa 0x4154(%rip),%xmm6 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,15,213,196 // pmullw %xmm4,%xmm0
@@ -49894,7 +49886,7 @@ _sk_overlay_sse41_8bit:
.byte 102,15,253,116,36,32 // paddw 0x20(%rsp),%xmm6
.byte 102,68,15,253,4,36 // paddw (%rsp),%xmm8
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
- .byte 102,15,111,5,124,71,0,0 // movdqa 0x477c(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0x16f8>
+ .byte 102,15,111,5,112,71,0,0 // movdqa 0x4770(%rip),%xmm0 # 2d4b0 <_sk_overlay_sse2_8bit+0x16ec>
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
.byte 102,69,15,253,217 // paddw %xmm9,%xmm11
.byte 102,15,253,240 // paddw %xmm0,%xmm6
@@ -49903,7 +49895,7 @@ _sk_overlay_sse41_8bit:
.byte 102,68,15,253,195 // paddw %xmm3,%xmm8
.byte 102,15,253,232 // paddw %xmm0,%xmm5
.byte 102,15,253,234 // paddw %xmm2,%xmm5
- .byte 102,15,111,5,96,71,0,0 // movdqa 0x4760(%rip),%xmm0 # 2d4e0 <_sk_overlay_sse2_8bit+0x1708>
+ .byte 102,15,111,5,84,71,0,0 // movdqa 0x4754(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0x16fc>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
@@ -49946,13 +49938,13 @@ _sk_start_pipeline_sse2_8bit:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,192 // mov %rcx,-0x40(%rbp)
.byte 72,57,203 // cmp %rcx,%rbx
- .byte 115,83 // jae 28e5a <_sk_start_pipeline_sse2_8bit+0x82>
+ .byte 115,83 // jae 28e46 <_sk_start_pipeline_sse2_8bit+0x82>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,8 // lea 0x8(%rax),%rax
.byte 72,137,69,200 // mov %rax,-0x38(%rbp)
.byte 76,57,125,200 // cmp %r15,-0x38(%rbp)
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
- .byte 119,35 // ja 28e40 <_sk_start_pipeline_sse2_8bit+0x68>
+ .byte 119,35 // ja 28e2c <_sk_start_pipeline_sse2_8bit+0x68>
.byte 76,139,101,208 // mov -0x30(%rbp),%r12
.byte 49,255 // xor %edi,%edi
.byte 76,137,246 // mov %r14,%rsi
@@ -49963,16 +49955,16 @@ _sk_start_pipeline_sse2_8bit:
.byte 73,131,196,16 // add $0x10,%r12
.byte 77,57,252 // cmp %r15,%r12
.byte 73,137,212 // mov %rdx,%r12
- .byte 118,225 // jbe 28e21 <_sk_start_pipeline_sse2_8bit+0x49>
+ .byte 118,225 // jbe 28e0d <_sk_start_pipeline_sse2_8bit+0x49>
.byte 76,137,255 // mov %r15,%rdi
.byte 72,41,215 // sub %rdx,%rdi
- .byte 116,9 // je 28e51 <_sk_start_pipeline_sse2_8bit+0x79>
+ .byte 116,9 // je 28e3d <_sk_start_pipeline_sse2_8bit+0x79>
.byte 76,137,246 // mov %r14,%rsi
.byte 72,137,217 // mov %rbx,%rcx
.byte 65,255,213 // callq *%r13
.byte 72,255,195 // inc %rbx
.byte 72,59,93,192 // cmp -0x40(%rbp),%rbx
- .byte 117,185 // jne 28e13 <_sk_start_pipeline_sse2_8bit+0x3b>
+ .byte 117,185 // jne 28dff <_sk_start_pipeline_sse2_8bit+0x3b>
.byte 72,131,196,24 // add $0x18,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -50004,7 +49996,7 @@ HIDDEN _sk_set_rgb_sse2_8bit
FUNCTION(_sk_set_rgb_sse2_8bit)
_sk_set_rgb_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,37,188,51,0,0 // movss 0x33bc(%rip),%xmm4 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 243,15,16,37,132,60,0,0 // movss 0x3c84(%rip),%xmm4 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 243,15,16,40 // movss (%rax),%xmm5
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 243,76,15,44,197 // cvttss2si %xmm5,%r8
@@ -50019,7 +50011,7 @@ _sk_set_rgb_sse2_8bit:
.byte 68,9,200 // or %r9d,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
- .byte 102,15,111,45,5,69,0,0 // movdqa 0x4505(%rip),%xmm5 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
+ .byte 102,15,111,45,249,68,0,0 // movdqa 0x44f9(%rip),%xmm5 # 2d3b0 <_sk_overlay_sse2_8bit+0x15ec>
.byte 102,15,219,205 // pand %xmm5,%xmm1
.byte 102,15,219,197 // pand %xmm5,%xmm0
.byte 102,15,235,196 // por %xmm4,%xmm0
@@ -50044,7 +50036,7 @@ _sk_premul_sse2_8bit:
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 242,15,112,192,95 // pshuflw $0x5f,%xmm0,%xmm0
.byte 243,15,112,248,95 // pshufhw $0x5f,%xmm0,%xmm7
- .byte 102,15,111,5,169,68,0,0 // movdqa 0x44a9(%rip),%xmm0 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
+ .byte 102,15,111,5,157,68,0,0 // movdqa 0x449d(%rip),%xmm0 # 2d3b0 <_sk_overlay_sse2_8bit+0x15ec>
.byte 102,15,235,248 // por %xmm0,%xmm7
.byte 102,15,235,240 // por %xmm0,%xmm6
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -50124,7 +50116,7 @@ _sk_load_8888_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,16 // jne 29042 <_sk_load_8888_sse2_8bit+0x2c>
+ .byte 117,16 // jne 2902e <_sk_load_8888_sse2_8bit+0x2c>
.byte 67,15,16,76,152,16 // movups 0x10(%r8,%r11,4),%xmm1
.byte 102,67,15,16,4,152 // movupd (%r8,%r11,4),%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50135,18 +50127,18 @@ _sk_load_8888_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,228 // ja 2903e <_sk_load_8888_sse2_8bit+0x28>
+ .byte 119,228 // ja 2902a <_sk_load_8888_sse2_8bit+0x28>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,83,0,0,0 // lea 0x53(%rip),%r10 # 290b8 <_sk_load_8888_sse2_8bit+0xa2>
+ .byte 76,141,21,83,0,0,0 // lea 0x53(%rip),%r10 # 290a4 <_sk_load_8888_sse2_8bit+0xa2>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 243,67,15,16,4,152 // movss (%r8,%r11,4),%xmm0
- .byte 235,200 // jmp 2903e <_sk_load_8888_sse2_8bit+0x28>
+ .byte 235,200 // jmp 2902a <_sk_load_8888_sse2_8bit+0x28>
.byte 102,67,15,110,68,152,8 // movd 0x8(%r8,%r11,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 102,67,15,18,4,152 // movlpd (%r8,%r11,4),%xmm0
- .byte 235,180 // jmp 2903e <_sk_load_8888_sse2_8bit+0x28>
+ .byte 235,180 // jmp 2902a <_sk_load_8888_sse2_8bit+0x28>
.byte 102,67,15,110,68,152,24 // movd 0x18(%r8,%r11,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 243,67,15,16,68,152,20 // movss 0x14(%r8,%r11,4),%xmm0
@@ -50155,7 +50147,7 @@ _sk_load_8888_sse2_8bit:
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 243,67,15,16,68,152,16 // movss 0x10(%r8,%r11,4),%xmm0
.byte 243,15,16,200 // movss %xmm0,%xmm1
- .byte 235,131 // jmp 29038 <_sk_load_8888_sse2_8bit+0x22>
+ .byte 235,131 // jmp 29024 <_sk_load_8888_sse2_8bit+0x22>
.byte 15,31,0 // nopl (%rax)
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -50189,7 +50181,7 @@ _sk_load_8888_dst_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,16 // jne 29100 <_sk_load_8888_dst_sse2_8bit+0x2c>
+ .byte 117,16 // jne 290ec <_sk_load_8888_dst_sse2_8bit+0x2c>
.byte 67,15,16,92,152,16 // movups 0x10(%r8,%r11,4),%xmm3
.byte 102,67,15,16,20,152 // movupd (%r8,%r11,4),%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50200,18 +50192,18 @@ _sk_load_8888_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,228 // ja 290fc <_sk_load_8888_dst_sse2_8bit+0x28>
+ .byte 119,228 // ja 290e8 <_sk_load_8888_dst_sse2_8bit+0x28>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,81,0,0,0 // lea 0x51(%rip),%r10 # 29174 <_sk_load_8888_dst_sse2_8bit+0xa0>
+ .byte 76,141,21,81,0,0,0 // lea 0x51(%rip),%r10 # 29160 <_sk_load_8888_dst_sse2_8bit+0xa0>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 243,67,15,16,20,152 // movss (%r8,%r11,4),%xmm2
- .byte 235,200 // jmp 290fc <_sk_load_8888_dst_sse2_8bit+0x28>
+ .byte 235,200 // jmp 290e8 <_sk_load_8888_dst_sse2_8bit+0x28>
.byte 102,67,15,110,84,152,8 // movd 0x8(%r8,%r11,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,67,15,18,20,152 // movlpd (%r8,%r11,4),%xmm2
- .byte 235,180 // jmp 290fc <_sk_load_8888_dst_sse2_8bit+0x28>
+ .byte 235,180 // jmp 290e8 <_sk_load_8888_dst_sse2_8bit+0x28>
.byte 102,67,15,110,84,152,24 // movd 0x18(%r8,%r11,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 243,67,15,16,84,152,20 // movss 0x14(%r8,%r11,4),%xmm2
@@ -50220,7 +50212,7 @@ _sk_load_8888_dst_sse2_8bit:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 243,67,15,16,84,152,16 // movss 0x10(%r8,%r11,4),%xmm2
.byte 243,15,16,218 // movss %xmm2,%xmm3
- .byte 235,131 // jmp 290f6 <_sk_load_8888_dst_sse2_8bit+0x22>
+ .byte 235,131 // jmp 290e2 <_sk_load_8888_dst_sse2_8bit+0x22>
.byte 144 // nop
.byte 184,255,255,255,204 // mov $0xccffffff,%eax
.byte 255 // (bad)
@@ -50251,7 +50243,7 @@ _sk_store_8888_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 291bd <_sk_store_8888_sse2_8bit+0x2d>
+ .byte 117,17 // jne 291a9 <_sk_store_8888_sse2_8bit+0x2d>
.byte 243,67,15,127,4,152 // movdqu %xmm0,(%r8,%r11,4)
.byte 243,67,15,127,76,152,16 // movdqu %xmm1,0x10(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50260,25 +50252,25 @@ _sk_store_8888_sse2_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 291b9 <_sk_store_8888_sse2_8bit+0x29>
+ .byte 119,236 // ja 291a5 <_sk_store_8888_sse2_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,76,0,0,0 // lea 0x4c(%rip),%r10 # 29224 <_sk_store_8888_sse2_8bit+0x94>
+ .byte 76,141,21,76,0,0,0 // lea 0x4c(%rip),%r10 # 29210 <_sk_store_8888_sse2_8bit+0x94>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,126,4,152 // movd %xmm0,(%r8,%r11,4)
- .byte 235,208 // jmp 291b9 <_sk_store_8888_sse2_8bit+0x29>
+ .byte 235,208 // jmp 291a5 <_sk_store_8888_sse2_8bit+0x29>
.byte 102,15,112,224,78 // pshufd $0x4e,%xmm0,%xmm4
.byte 102,67,15,126,100,152,8 // movd %xmm4,0x8(%r8,%r11,4)
.byte 102,67,15,214,4,152 // movq %xmm0,(%r8,%r11,4)
- .byte 235,188 // jmp 291b9 <_sk_store_8888_sse2_8bit+0x29>
+ .byte 235,188 // jmp 291a5 <_sk_store_8888_sse2_8bit+0x29>
.byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
.byte 102,67,15,126,100,152,24 // movd %xmm4,0x18(%r8,%r11,4)
.byte 102,15,112,225,229 // pshufd $0xe5,%xmm1,%xmm4
.byte 102,67,15,126,100,152,20 // movd %xmm4,0x14(%r8,%r11,4)
.byte 102,67,15,126,76,152,16 // movd %xmm1,0x10(%r8,%r11,4)
.byte 243,67,15,127,4,152 // movdqu %xmm0,(%r8,%r11,4)
- .byte 235,149 // jmp 291b9 <_sk_store_8888_sse2_8bit+0x29>
+ .byte 235,149 // jmp 291a5 <_sk_store_8888_sse2_8bit+0x29>
.byte 189,255,255,255,209 // mov $0xd1ffffff,%ebp
.byte 255 // (bad)
.byte 255 // (bad)
@@ -50312,7 +50304,7 @@ _sk_load_bgra_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,92 // jne 292b8 <_sk_load_bgra_sse2_8bit+0x78>
+ .byte 117,92 // jne 292a4 <_sk_load_bgra_sse2_8bit+0x78>
.byte 67,15,16,76,152,16 // movups 0x10(%r8,%r11,4),%xmm1
.byte 102,67,15,16,4,152 // movupd (%r8,%r11,4),%xmm0
.byte 102,15,239,228 // pxor %xmm4,%xmm4
@@ -50340,18 +50332,18 @@ _sk_load_bgra_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,152 // ja 29268 <_sk_load_bgra_sse2_8bit+0x28>
+ .byte 119,152 // ja 29254 <_sk_load_bgra_sse2_8bit+0x28>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,89,0,0,0 // lea 0x59(%rip),%r10 # 29334 <_sk_load_bgra_sse2_8bit+0xf4>
+ .byte 76,141,21,89,0,0,0 // lea 0x59(%rip),%r10 # 29320 <_sk_load_bgra_sse2_8bit+0xf4>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 243,67,15,16,4,152 // movss (%r8,%r11,4),%xmm0
- .byte 233,121,255,255,255 // jmpq 29268 <_sk_load_bgra_sse2_8bit+0x28>
+ .byte 233,121,255,255,255 // jmpq 29254 <_sk_load_bgra_sse2_8bit+0x28>
.byte 102,67,15,110,68,152,8 // movd 0x8(%r8,%r11,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 102,67,15,18,4,152 // movlpd (%r8,%r11,4),%xmm0
- .byte 233,98,255,255,255 // jmpq 29268 <_sk_load_bgra_sse2_8bit+0x28>
+ .byte 233,98,255,255,255 // jmpq 29254 <_sk_load_bgra_sse2_8bit+0x28>
.byte 102,67,15,110,68,152,24 // movd 0x18(%r8,%r11,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 243,67,15,16,68,152,20 // movss 0x14(%r8,%r11,4),%xmm0
@@ -50360,7 +50352,7 @@ _sk_load_bgra_sse2_8bit:
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 243,67,15,16,68,152,16 // movss 0x10(%r8,%r11,4),%xmm0
.byte 243,15,16,200 // movss %xmm0,%xmm1
- .byte 233,46,255,255,255 // jmpq 29262 <_sk_load_bgra_sse2_8bit+0x22>
+ .byte 233,46,255,255,255 // jmpq 2924e <_sk_load_bgra_sse2_8bit+0x22>
.byte 176,255 // mov $0xff,%al
.byte 255 // (bad)
.byte 255,199 // inc %edi
@@ -50393,7 +50385,7 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,92 // jne 293c8 <_sk_load_bgra_dst_sse2_8bit+0x78>
+ .byte 117,92 // jne 293b4 <_sk_load_bgra_dst_sse2_8bit+0x78>
.byte 67,15,16,92,152,16 // movups 0x10(%r8,%r11,4),%xmm3
.byte 102,67,15,16,20,152 // movupd (%r8,%r11,4),%xmm2
.byte 102,15,239,228 // pxor %xmm4,%xmm4
@@ -50421,18 +50413,18 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,152 // ja 29378 <_sk_load_bgra_dst_sse2_8bit+0x28>
+ .byte 119,152 // ja 29364 <_sk_load_bgra_dst_sse2_8bit+0x28>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,89,0,0,0 // lea 0x59(%rip),%r10 # 29444 <_sk_load_bgra_dst_sse2_8bit+0xf4>
+ .byte 76,141,21,89,0,0,0 // lea 0x59(%rip),%r10 # 29430 <_sk_load_bgra_dst_sse2_8bit+0xf4>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 243,67,15,16,20,152 // movss (%r8,%r11,4),%xmm2
- .byte 233,121,255,255,255 // jmpq 29378 <_sk_load_bgra_dst_sse2_8bit+0x28>
+ .byte 233,121,255,255,255 // jmpq 29364 <_sk_load_bgra_dst_sse2_8bit+0x28>
.byte 102,67,15,110,84,152,8 // movd 0x8(%r8,%r11,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,67,15,18,20,152 // movlpd (%r8,%r11,4),%xmm2
- .byte 233,98,255,255,255 // jmpq 29378 <_sk_load_bgra_dst_sse2_8bit+0x28>
+ .byte 233,98,255,255,255 // jmpq 29364 <_sk_load_bgra_dst_sse2_8bit+0x28>
.byte 102,67,15,110,84,152,24 // movd 0x18(%r8,%r11,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 243,67,15,16,84,152,20 // movss 0x14(%r8,%r11,4),%xmm2
@@ -50441,7 +50433,7 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 243,67,15,16,84,152,16 // movss 0x10(%r8,%r11,4),%xmm2
.byte 243,15,16,218 // movss %xmm2,%xmm3
- .byte 233,46,255,255,255 // jmpq 29372 <_sk_load_bgra_dst_sse2_8bit+0x22>
+ .byte 233,46,255,255,255 // jmpq 2935e <_sk_load_bgra_dst_sse2_8bit+0x22>
.byte 176,255 // mov $0xff,%al
.byte 255 // (bad)
.byte 255,199 // inc %edi
@@ -50493,7 +50485,7 @@ _sk_store_bgra_sse2_8bit:
.byte 243,15,112,237,198 // pshufhw $0xc6,%xmm5,%xmm5
.byte 102,15,103,238 // packuswb %xmm6,%xmm5
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 294e1 <_sk_store_bgra_sse2_8bit+0x81>
+ .byte 117,17 // jne 294cd <_sk_store_bgra_sse2_8bit+0x81>
.byte 243,67,15,127,44,152 // movdqu %xmm5,(%r8,%r11,4)
.byte 243,67,15,127,100,152,16 // movdqu %xmm4,0x10(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50502,25 +50494,25 @@ _sk_store_bgra_sse2_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 294dd <_sk_store_bgra_sse2_8bit+0x7d>
+ .byte 119,236 // ja 294c9 <_sk_store_bgra_sse2_8bit+0x7d>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,76,0,0,0 // lea 0x4c(%rip),%r10 # 29548 <_sk_store_bgra_sse2_8bit+0xe8>
+ .byte 76,141,21,76,0,0,0 // lea 0x4c(%rip),%r10 # 29534 <_sk_store_bgra_sse2_8bit+0xe8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,126,44,152 // movd %xmm5,(%r8,%r11,4)
- .byte 235,208 // jmp 294dd <_sk_store_bgra_sse2_8bit+0x7d>
+ .byte 235,208 // jmp 294c9 <_sk_store_bgra_sse2_8bit+0x7d>
.byte 102,15,112,229,78 // pshufd $0x4e,%xmm5,%xmm4
.byte 102,67,15,126,100,152,8 // movd %xmm4,0x8(%r8,%r11,4)
.byte 102,67,15,214,44,152 // movq %xmm5,(%r8,%r11,4)
- .byte 235,188 // jmp 294dd <_sk_store_bgra_sse2_8bit+0x7d>
+ .byte 235,188 // jmp 294c9 <_sk_store_bgra_sse2_8bit+0x7d>
.byte 102,15,112,244,78 // pshufd $0x4e,%xmm4,%xmm6
.byte 102,67,15,126,116,152,24 // movd %xmm6,0x18(%r8,%r11,4)
.byte 102,15,112,244,229 // pshufd $0xe5,%xmm4,%xmm6
.byte 102,67,15,126,116,152,20 // movd %xmm6,0x14(%r8,%r11,4)
.byte 102,67,15,126,100,152,16 // movd %xmm4,0x10(%r8,%r11,4)
.byte 243,67,15,127,44,152 // movdqu %xmm5,(%r8,%r11,4)
- .byte 235,149 // jmp 294dd <_sk_store_bgra_sse2_8bit+0x7d>
+ .byte 235,149 // jmp 294c9 <_sk_store_bgra_sse2_8bit+0x7d>
.byte 189,255,255,255,209 // mov $0xd1ffffff,%ebp
.byte 255 // (bad)
.byte 255 // (bad)
@@ -50553,19 +50545,19 @@ _sk_store_565_sse2_8bit:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 102,68,15,111,13,125,62,0,0 // movdqa 0x3e7d(%rip),%xmm9 # 2d400 <_sk_overlay_sse2_8bit+0x1628>
+ .byte 102,68,15,111,13,113,62,0,0 // movdqa 0x3e71(%rip),%xmm9 # 2d3e0 <_sk_overlay_sse2_8bit+0x161c>
.byte 102,68,15,111,193 // movdqa %xmm1,%xmm8
.byte 102,69,15,219,193 // pand %xmm9,%xmm8
.byte 102,68,15,219,200 // pand %xmm0,%xmm9
.byte 102,65,15,114,241,8 // pslld $0x8,%xmm9
.byte 102,65,15,114,240,8 // pslld $0x8,%xmm8
- .byte 102,15,111,37,106,62,0,0 // movdqa 0x3e6a(%rip),%xmm4 # 2d410 <_sk_overlay_sse2_8bit+0x1638>
+ .byte 102,15,111,37,94,62,0,0 // movdqa 0x3e5e(%rip),%xmm4 # 2d3f0 <_sk_overlay_sse2_8bit+0x162c>
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,219,224 // pand %xmm0,%xmm4
.byte 102,15,114,212,5 // psrld $0x5,%xmm4
.byte 102,15,114,213,5 // psrld $0x5,%xmm5
- .byte 102,15,111,61,92,62,0,0 // movdqa 0x3e5c(%rip),%xmm7 # 2d420 <_sk_overlay_sse2_8bit+0x1648>
+ .byte 102,15,111,61,80,62,0,0 // movdqa 0x3e50(%rip),%xmm7 # 2d400 <_sk_overlay_sse2_8bit+0x163c>
.byte 102,15,111,240 // movdqa %xmm0,%xmm6
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 102,15,219,249 // pand %xmm1,%xmm7
@@ -50581,7 +50573,7 @@ _sk_store_565_sse2_8bit:
.byte 102,15,114,228,16 // psrad $0x10,%xmm4
.byte 102,15,107,229 // packssdw %xmm5,%xmm4
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 29613 <_sk_store_565_sse2_8bit+0xaf>
+ .byte 117,10 // jne 295ff <_sk_store_565_sse2_8bit+0xaf>
.byte 243,67,15,127,36,88 // movdqu %xmm4,(%r8,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -50589,19 +50581,19 @@ _sk_store_565_sse2_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 2960f <_sk_store_565_sse2_8bit+0xab>
+ .byte 119,236 // ja 295fb <_sk_store_565_sse2_8bit+0xab>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,82,0,0,0 // lea 0x52(%rip),%r10 # 29680 <_sk_store_565_sse2_8bit+0x11c>
+ .byte 76,141,21,82,0,0,0 // lea 0x52(%rip),%r10 # 2966c <_sk_store_565_sse2_8bit+0x11c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,15,126,224 // movd %xmm4,%eax
.byte 102,67,137,4,88 // mov %ax,(%r8,%r11,2)
- .byte 235,205 // jmp 2960f <_sk_store_565_sse2_8bit+0xab>
+ .byte 235,205 // jmp 295fb <_sk_store_565_sse2_8bit+0xab>
.byte 102,15,197,196,2 // pextrw $0x2,%xmm4,%eax
.byte 102,67,137,68,88,4 // mov %ax,0x4(%r8,%r11,2)
.byte 102,67,15,126,36,88 // movd %xmm4,(%r8,%r11,2)
- .byte 235,186 // jmp 2960f <_sk_store_565_sse2_8bit+0xab>
+ .byte 235,186 // jmp 295fb <_sk_store_565_sse2_8bit+0xab>
.byte 102,15,197,196,6 // pextrw $0x6,%xmm4,%eax
.byte 102,67,137,68,88,12 // mov %ax,0xc(%r8,%r11,2)
.byte 102,15,197,196,5 // pextrw $0x5,%xmm4,%eax
@@ -50609,7 +50601,7 @@ _sk_store_565_sse2_8bit:
.byte 102,15,197,196,4 // pextrw $0x4,%xmm4,%eax
.byte 102,67,137,68,88,8 // mov %ax,0x8(%r8,%r11,2)
.byte 102,67,15,214,36,88 // movq %xmm4,(%r8,%r11,2)
- .byte 235,145 // jmp 2960f <_sk_store_565_sse2_8bit+0xab>
+ .byte 235,145 // jmp 295fb <_sk_store_565_sse2_8bit+0xab>
.byte 102,144 // xchg %ax,%ax
.byte 183,255 // mov $0xff,%bh
.byte 255 // (bad)
@@ -50623,7 +50615,7 @@ _sk_store_565_sse2_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 235,255 // jmp 29691 <_sk_store_565_sse2_8bit+0x12d>
+ .byte 235,255 // jmp 2967d <_sk_store_565_sse2_8bit+0x12d>
.byte 255 // (bad)
.byte 255,224 // jmpq *%rax
.byte 255 // (bad)
@@ -50645,19 +50637,19 @@ _sk_load_565_dst_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,219,0,0,0 // jne 29796 <_sk_load_565_dst_sse2_8bit+0xfa>
+ .byte 15,133,219,0,0,0 // jne 29782 <_sk_load_565_dst_sse2_8bit+0xfa>
.byte 243,67,15,111,20,88 // movdqu (%r8,%r11,2),%xmm2
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
.byte 102,15,97,212 // punpcklwd %xmm4,%xmm2
- .byte 102,15,111,53,55,56,0,0 // movdqa 0x3837(%rip),%xmm6 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
+ .byte 102,15,111,53,43,56,0,0 // movdqa 0x382b(%rip),%xmm6 # 2cef0 <_sk_overlay_sse2_8bit+0x112c>
.byte 102,15,111,250 // movdqa %xmm2,%xmm7
.byte 102,15,219,254 // pand %xmm6,%xmm7
.byte 102,15,219,243 // pand %xmm3,%xmm6
.byte 102,15,114,214,8 // psrld $0x8,%xmm6
.byte 102,15,114,215,8 // psrld $0x8,%xmm7
- .byte 102,15,111,45,89,56,0,0 // movdqa 0x3859(%rip),%xmm5 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
+ .byte 102,15,111,45,77,56,0,0 // movdqa 0x384d(%rip),%xmm5 # 2cf30 <_sk_overlay_sse2_8bit+0x116c>
.byte 102,15,111,226 // movdqa %xmm2,%xmm4
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,15,219,235 // pand %xmm3,%xmm5
@@ -50665,11 +50657,11 @@ _sk_load_565_dst_sse2_8bit:
.byte 102,15,114,244,19 // pslld $0x13,%xmm4
.byte 102,15,235,231 // por %xmm7,%xmm4
.byte 102,15,235,238 // por %xmm6,%xmm5
- .byte 102,15,111,53,19,56,0,0 // movdqa 0x3813(%rip),%xmm6 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
+ .byte 102,15,111,53,7,56,0,0 // movdqa 0x3807(%rip),%xmm6 # 2cf10 <_sk_overlay_sse2_8bit+0x114c>
.byte 102,15,111,251 // movdqa %xmm3,%xmm7
.byte 102,15,219,254 // pand %xmm6,%xmm7
.byte 102,15,114,247,5 // pslld $0x5,%xmm7
- .byte 102,68,15,111,5,29,61,0,0 // movdqa 0x3d1d(%rip),%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0x1678>
+ .byte 102,68,15,111,5,17,61,0,0 // movdqa 0x3d11(%rip),%xmm8 # 2d430 <_sk_overlay_sse2_8bit+0x166c>
.byte 102,65,15,219,216 // pand %xmm8,%xmm3
.byte 102,15,114,211,1 // psrld $0x1,%xmm3
.byte 102,15,235,223 // por %xmm7,%xmm3
@@ -50682,10 +50674,10 @@ _sk_load_565_dst_sse2_8bit:
.byte 102,15,235,214 // por %xmm6,%xmm2
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,114,212,5 // psrld $0x5,%xmm4
- .byte 102,15,111,53,206,60,0,0 // movdqa 0x3cce(%rip),%xmm6 # 2d440 <_sk_overlay_sse2_8bit+0x1668>
+ .byte 102,15,111,53,194,60,0,0 // movdqa 0x3cc2(%rip),%xmm6 # 2d420 <_sk_overlay_sse2_8bit+0x165c>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 102,15,219,238 // pand %xmm6,%xmm5
- .byte 102,15,111,53,78,60,0,0 // movdqa 0x3c4e(%rip),%xmm6 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
+ .byte 102,15,111,53,66,60,0,0 // movdqa 0x3c42(%rip),%xmm6 # 2d3b0 <_sk_overlay_sse2_8bit+0x15ec>
.byte 102,15,235,214 // por %xmm6,%xmm2
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,235,222 // por %xmm6,%xmm3
@@ -50697,26 +50689,26 @@ _sk_load_565_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,19,255,255,255 // ja 296c1 <_sk_load_565_dst_sse2_8bit+0x25>
+ .byte 15,135,19,255,255,255 // ja 296ad <_sk_load_565_dst_sse2_8bit+0x25>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,91,0,0,0 // lea 0x5b(%rip),%r10 # 29814 <_sk_load_565_dst_sse2_8bit+0x178>
+ .byte 76,141,21,91,0,0,0 // lea 0x5b(%rip),%r10 # 29800 <_sk_load_565_dst_sse2_8bit+0x178>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,241,254,255,255 // jmpq 296c1 <_sk_load_565_dst_sse2_8bit+0x25>
+ .byte 233,241,254,255,255 // jmpq 296ad <_sk_load_565_dst_sse2_8bit+0x25>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,67,15,196,84,88,4,2 // pinsrw $0x2,0x4(%r8,%r11,2),%xmm2
.byte 243,67,15,16,28,88 // movss (%r8,%r11,2),%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 233,214,254,255,255 // jmpq 296c1 <_sk_load_565_dst_sse2_8bit+0x25>
+ .byte 233,214,254,255,255 // jmpq 296ad <_sk_load_565_dst_sse2_8bit+0x25>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,67,15,196,84,88,12,6 // pinsrw $0x6,0xc(%r8,%r11,2),%xmm2
.byte 102,67,15,196,84,88,10,5 // pinsrw $0x5,0xa(%r8,%r11,2),%xmm2
.byte 102,67,15,196,84,88,8,4 // pinsrw $0x4,0x8(%r8,%r11,2),%xmm2
.byte 102,67,15,18,20,88 // movlpd (%r8,%r11,2),%xmm2
- .byte 233,175,254,255,255 // jmpq 296c1 <_sk_load_565_dst_sse2_8bit+0x25>
+ .byte 233,175,254,255,255 // jmpq 296ad <_sk_load_565_dst_sse2_8bit+0x25>
.byte 102,144 // xchg %ax,%ax
.byte 174 // scas %es:(%rdi),%al
.byte 255 // (bad)
@@ -50729,7 +50721,7 @@ _sk_load_565_dst_sse2_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 235,255 // jmp 29825 <_sk_load_565_dst_sse2_8bit+0x189>
+ .byte 235,255 // jmp 29811 <_sk_load_565_dst_sse2_8bit+0x189>
.byte 255 // (bad)
.byte 255,227 // jmpq *%rbx
.byte 255 // (bad)
@@ -50750,10 +50742,10 @@ _sk_load_a8_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,48 // jne 29878 <_sk_load_a8_sse2_8bit+0x48>
+ .byte 117,48 // jne 29864 <_sk_load_a8_sse2_8bit+0x48>
.byte 243,67,15,126,4,24 // movq (%r8,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
- .byte 102,15,219,5,54,52,0,0 // pand 0x3436(%rip),%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,5,42,52,0,0 // pand 0x342a(%rip),%xmm0 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
@@ -50767,15 +50759,15 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,198 // ja 29852 <_sk_load_a8_sse2_8bit+0x22>
+ .byte 119,198 // ja 2983e <_sk_load_a8_sse2_8bit+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,113,0,0,0 // lea 0x71(%rip),%r10 # 29908 <_sk_load_a8_sse2_8bit+0xd8>
+ .byte 76,141,21,113,0,0,0 // lea 0x71(%rip),%r10 # 298f4 <_sk_load_a8_sse2_8bit+0xd8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,167 // jmp 29852 <_sk_load_a8_sse2_8bit+0x22>
+ .byte 235,167 // jmp 2983e <_sk_load_a8_sse2_8bit+0x22>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0
@@ -50783,7 +50775,7 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 235,133 // jmp 29852 <_sk_load_a8_sse2_8bit+0x22>
+ .byte 235,133 // jmp 2983e <_sk_load_a8_sse2_8bit+0x22>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,6 // pinsrw $0x6,%eax,%xmm0
@@ -50794,7 +50786,7 @@ _sk_load_a8_sse2_8bit:
.byte 102,67,15,110,12,24 // movd (%r8,%r11,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 233,77,255,255,255 // jmpq 29852 <_sk_load_a8_sse2_8bit+0x22>
+ .byte 233,77,255,255,255 // jmpq 2983e <_sk_load_a8_sse2_8bit+0x22>
.byte 15,31,0 // nopl (%rax)
.byte 152 // cwtl
.byte 255 // (bad)
@@ -50828,10 +50820,10 @@ _sk_load_a8_dst_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,48 // jne 2996c <_sk_load_a8_dst_sse2_8bit+0x48>
+ .byte 117,48 // jne 29958 <_sk_load_a8_dst_sse2_8bit+0x48>
.byte 243,67,15,126,20,24 // movq (%r8,%r11,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
- .byte 102,15,219,21,66,51,0,0 // pand 0x3342(%rip),%xmm2 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,21,54,51,0,0 // pand 0x3336(%rip),%xmm2 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
@@ -50845,15 +50837,15 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,198 // ja 29946 <_sk_load_a8_dst_sse2_8bit+0x22>
+ .byte 119,198 // ja 29932 <_sk_load_a8_dst_sse2_8bit+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,113,0,0,0 // lea 0x71(%rip),%r10 # 299fc <_sk_load_a8_dst_sse2_8bit+0xd8>
+ .byte 76,141,21,113,0,0,0 // lea 0x71(%rip),%r10 # 299e8 <_sk_load_a8_dst_sse2_8bit+0xd8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 235,167 // jmp 29946 <_sk_load_a8_dst_sse2_8bit+0x22>
+ .byte 235,167 // jmp 29932 <_sk_load_a8_dst_sse2_8bit+0x22>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,2 // pinsrw $0x2,%eax,%xmm2
@@ -50861,7 +50853,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,110,216 // movd %eax,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 235,133 // jmp 29946 <_sk_load_a8_dst_sse2_8bit+0x22>
+ .byte 235,133 // jmp 29932 <_sk_load_a8_dst_sse2_8bit+0x22>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,6 // pinsrw $0x6,%eax,%xmm2
@@ -50872,7 +50864,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,67,15,110,28,24 // movd (%r8,%r11,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,77,255,255,255 // jmpq 29946 <_sk_load_a8_dst_sse2_8bit+0x22>
+ .byte 233,77,255,255,255 // jmpq 29932 <_sk_load_a8_dst_sse2_8bit+0x22>
.byte 15,31,0 // nopl (%rax)
.byte 152 // cwtl
.byte 255 // (bad)
@@ -50915,8 +50907,8 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,114,228,16 // psrad $0x10,%xmm4
.byte 102,15,107,229 // packssdw %xmm5,%xmm4
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,22 // jne 29a70 <_sk_store_a8_sse2_8bit+0x58>
- .byte 102,15,219,37,46,50,0,0 // pand 0x322e(%rip),%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 117,22 // jne 29a5c <_sk_store_a8_sse2_8bit+0x58>
+ .byte 102,15,219,37,34,50,0,0 // pand 0x3222(%rip),%xmm4 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,67,15,214,36,24 // movq %xmm4,(%r8,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50925,24 +50917,24 @@ _sk_store_a8_sse2_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 29a6c <_sk_store_a8_sse2_8bit+0x54>
+ .byte 119,236 // ja 29a58 <_sk_store_a8_sse2_8bit+0x54>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,133,0,0,0 // lea 0x85(%rip),%r10 # 29b10 <_sk_store_a8_sse2_8bit+0xf8>
+ .byte 76,141,21,133,0,0,0 // lea 0x85(%rip),%r10 # 29afc <_sk_store_a8_sse2_8bit+0xf8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,15,127,100,36,232 // movdqa %xmm4,-0x18(%rsp)
.byte 138,68,36,232 // mov -0x18(%rsp),%al
.byte 67,136,4,24 // mov %al,(%r8,%r11,1)
- .byte 235,200 // jmp 29a6c <_sk_store_a8_sse2_8bit+0x54>
+ .byte 235,200 // jmp 29a58 <_sk_store_a8_sse2_8bit+0x54>
.byte 102,15,127,100,36,216 // movdqa %xmm4,-0x28(%rsp)
.byte 138,68,36,220 // mov -0x24(%rsp),%al
.byte 67,136,68,24,2 // mov %al,0x2(%r8,%r11,1)
- .byte 102,15,219,37,213,49,0,0 // pand 0x31d5(%rip),%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,37,201,49,0,0 // pand 0x31c9(%rip),%xmm4 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,126,224 // movd %xmm4,%eax
.byte 102,67,137,4,24 // mov %ax,(%r8,%r11,1)
- .byte 235,162 // jmp 29a6c <_sk_store_a8_sse2_8bit+0x54>
+ .byte 235,162 // jmp 29a58 <_sk_store_a8_sse2_8bit+0x54>
.byte 102,15,127,100,36,200 // movdqa %xmm4,-0x38(%rsp)
.byte 138,68,36,212 // mov -0x2c(%rsp),%al
.byte 67,136,68,24,6 // mov %al,0x6(%r8,%r11,1)
@@ -50952,10 +50944,10 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,127,100,36,168 // movdqa %xmm4,-0x58(%rsp)
.byte 138,68,36,176 // mov -0x50(%rsp),%al
.byte 67,136,68,24,4 // mov %al,0x4(%r8,%r11,1)
- .byte 102,15,219,37,145,49,0,0 // pand 0x3191(%rip),%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,37,133,49,0,0 // pand 0x3185(%rip),%xmm4 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,67,15,126,36,24 // movd %xmm4,(%r8,%r11,1)
- .byte 233,94,255,255,255 // jmpq 29a6c <_sk_store_a8_sse2_8bit+0x54>
+ .byte 233,94,255,255,255 // jmpq 29a58 <_sk_store_a8_sse2_8bit+0x54>
.byte 102,144 // xchg %ax,%ax
.byte 132,255 // test %bh,%bh
.byte 255 // (bad)
@@ -50988,15 +50980,15 @@ _sk_load_g8_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,116 // jne 29bb8 <_sk_load_g8_sse2_8bit+0x8c>
+ .byte 117,116 // jne 29ba4 <_sk_load_g8_sse2_8bit+0x8c>
.byte 243,67,15,126,4,24 // movq (%r8,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
- .byte 102,15,219,5,58,49,0,0 // pand 0x313a(%rip),%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,5,46,49,0,0 // pand 0x312e(%rip),%xmm0 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
.byte 102,15,105,193 // punpckhwd %xmm1,%xmm0
- .byte 102,15,111,45,2,57,0,0 // movdqa 0x3902(%rip),%xmm5 # 2d470 <_sk_overlay_sse2_8bit+0x1698>
+ .byte 102,15,111,45,246,56,0,0 // movdqa 0x38f6(%rip),%xmm5 # 2d450 <_sk_overlay_sse2_8bit+0x168c>
.byte 102,15,112,240,245 // pshufd $0xf5,%xmm0,%xmm6
.byte 102,15,244,197 // pmuludq %xmm5,%xmm0
.byte 102,15,112,200,232 // pshufd $0xe8,%xmm0,%xmm1
@@ -51009,7 +51001,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,244,245 // pmuludq %xmm5,%xmm6
.byte 102,15,112,230,232 // pshufd $0xe8,%xmm6,%xmm4
.byte 102,15,98,196 // punpckldq %xmm4,%xmm0
- .byte 102,15,111,37,36,56,0,0 // movdqa 0x3824(%rip),%xmm4 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
+ .byte 102,15,111,37,24,56,0,0 // movdqa 0x3818(%rip),%xmm4 # 2d3b0 <_sk_overlay_sse2_8bit+0x15ec>
.byte 102,15,235,196 // por %xmm4,%xmm0
.byte 102,15,235,204 // por %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -51019,15 +51011,15 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,130 // ja 29b4e <_sk_load_g8_sse2_8bit+0x22>
+ .byte 119,130 // ja 29b3a <_sk_load_g8_sse2_8bit+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,117,0,0,0 // lea 0x75(%rip),%r10 # 29c4c <_sk_load_g8_sse2_8bit+0x120>
+ .byte 76,141,21,117,0,0,0 // lea 0x75(%rip),%r10 # 29c38 <_sk_load_g8_sse2_8bit+0x120>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 233,96,255,255,255 // jmpq 29b4e <_sk_load_g8_sse2_8bit+0x22>
+ .byte 233,96,255,255,255 // jmpq 29b3a <_sk_load_g8_sse2_8bit+0x22>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0
@@ -51035,7 +51027,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 233,59,255,255,255 // jmpq 29b4e <_sk_load_g8_sse2_8bit+0x22>
+ .byte 233,59,255,255,255 // jmpq 29b3a <_sk_load_g8_sse2_8bit+0x22>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,6 // pinsrw $0x6,%eax,%xmm0
@@ -51046,7 +51038,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,67,15,110,12,24 // movd (%r8,%r11,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 233,3,255,255,255 // jmpq 29b4e <_sk_load_g8_sse2_8bit+0x22>
+ .byte 233,3,255,255,255 // jmpq 29b3a <_sk_load_g8_sse2_8bit+0x22>
.byte 144 // nop
.byte 148 // xchg %eax,%esp
.byte 255 // (bad)
@@ -51080,15 +51072,15 @@ _sk_load_g8_dst_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,116 // jne 29cf4 <_sk_load_g8_dst_sse2_8bit+0x8c>
+ .byte 117,116 // jne 29ce0 <_sk_load_g8_dst_sse2_8bit+0x8c>
.byte 243,67,15,126,20,24 // movq (%r8,%r11,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
- .byte 102,15,219,21,254,47,0,0 // pand 0x2ffe(%rip),%xmm2 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,21,242,47,0,0 // pand 0x2ff2(%rip),%xmm2 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,111,226 // movdqa %xmm2,%xmm4
.byte 102,15,97,227 // punpcklwd %xmm3,%xmm4
.byte 102,15,105,211 // punpckhwd %xmm3,%xmm2
- .byte 102,15,111,45,198,55,0,0 // movdqa 0x37c6(%rip),%xmm5 # 2d470 <_sk_overlay_sse2_8bit+0x1698>
+ .byte 102,15,111,45,186,55,0,0 // movdqa 0x37ba(%rip),%xmm5 # 2d450 <_sk_overlay_sse2_8bit+0x168c>
.byte 102,15,112,242,245 // pshufd $0xf5,%xmm2,%xmm6
.byte 102,15,244,213 // pmuludq %xmm5,%xmm2
.byte 102,15,112,218,232 // pshufd $0xe8,%xmm2,%xmm3
@@ -51101,7 +51093,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,244,245 // pmuludq %xmm5,%xmm6
.byte 102,15,112,230,232 // pshufd $0xe8,%xmm6,%xmm4
.byte 102,15,98,212 // punpckldq %xmm4,%xmm2
- .byte 102,15,111,37,232,54,0,0 // movdqa 0x36e8(%rip),%xmm4 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
+ .byte 102,15,111,37,220,54,0,0 // movdqa 0x36dc(%rip),%xmm4 # 2d3b0 <_sk_overlay_sse2_8bit+0x15ec>
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,235,220 // por %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -51111,15 +51103,15 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,130 // ja 29c8a <_sk_load_g8_dst_sse2_8bit+0x22>
+ .byte 119,130 // ja 29c76 <_sk_load_g8_dst_sse2_8bit+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,117,0,0,0 // lea 0x75(%rip),%r10 # 29d88 <_sk_load_g8_dst_sse2_8bit+0x120>
+ .byte 76,141,21,117,0,0,0 // lea 0x75(%rip),%r10 # 29d74 <_sk_load_g8_dst_sse2_8bit+0x120>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,96,255,255,255 // jmpq 29c8a <_sk_load_g8_dst_sse2_8bit+0x22>
+ .byte 233,96,255,255,255 // jmpq 29c76 <_sk_load_g8_dst_sse2_8bit+0x22>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,2 // pinsrw $0x2,%eax,%xmm2
@@ -51127,7 +51119,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,110,216 // movd %eax,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 233,59,255,255,255 // jmpq 29c8a <_sk_load_g8_dst_sse2_8bit+0x22>
+ .byte 233,59,255,255,255 // jmpq 29c76 <_sk_load_g8_dst_sse2_8bit+0x22>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,6 // pinsrw $0x6,%eax,%xmm2
@@ -51138,7 +51130,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,67,15,110,28,24 // movd (%r8,%r11,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,3,255,255,255 // jmpq 29c8a <_sk_load_g8_dst_sse2_8bit+0x22>
+ .byte 233,3,255,255,255 // jmpq 29c76 <_sk_load_g8_dst_sse2_8bit+0x22>
.byte 144 // nop
.byte 148 // xchg %eax,%esp
.byte 255 // (bad)
@@ -51173,7 +51165,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,253,0,0,0 // jne 29ec1 <_sk_srcover_rgba_8888_sse2_8bit+0x11d>
+ .byte 15,133,253,0,0,0 // jne 29ead <_sk_srcover_rgba_8888_sse2_8bit+0x11d>
.byte 71,15,16,68,152,16 // movups 0x10(%r8,%r11,4),%xmm8
.byte 102,71,15,16,12,152 // movupd (%r8,%r11,4),%xmm9
.byte 72,133,255 // test %rdi,%rdi
@@ -51222,7 +51214,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,68,15,248,207 // psubb %xmm7,%xmm9
.byte 102,68,15,252,200 // paddb %xmm0,%xmm9
.byte 102,68,15,252,193 // paddb %xmm1,%xmm8
- .byte 117,78 // jne 29efe <_sk_srcover_rgba_8888_sse2_8bit+0x15a>
+ .byte 117,78 // jne 29eea <_sk_srcover_rgba_8888_sse2_8bit+0x15a>
.byte 243,71,15,127,12,152 // movdqu %xmm9,(%r8,%r11,4)
.byte 243,71,15,127,68,152,16 // movdqu %xmm8,0x10(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -51233,30 +51225,30 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,241,254,255,255 // ja 29dd0 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
+ .byte 15,135,241,254,255,255 // ja 29dbc <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,210,0,0,0 // lea 0xd2(%rip),%r10 # 29fbc <_sk_srcover_rgba_8888_sse2_8bit+0x218>
+ .byte 76,141,21,210,0,0,0 // lea 0xd2(%rip),%r10 # 29fa8 <_sk_srcover_rgba_8888_sse2_8bit+0x218>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 243,71,15,16,12,152 // movss (%r8,%r11,4),%xmm9
- .byte 233,210,254,255,255 // jmpq 29dd0 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
+ .byte 233,210,254,255,255 // jmpq 29dbc <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,175 // ja 29ebd <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ .byte 119,175 // ja 29ea9 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 76,141,13,191,0,0,0 // lea 0xbf(%rip),%r9 # 29fd8 <_sk_srcover_rgba_8888_sse2_8bit+0x234>
+ .byte 76,141,13,191,0,0,0 // lea 0xbf(%rip),%r9 # 29fc4 <_sk_srcover_rgba_8888_sse2_8bit+0x234>
.byte 73,99,4,129 // movslq (%r9,%rax,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
.byte 102,71,15,126,12,152 // movd %xmm9,(%r8,%r11,4)
- .byte 235,147 // jmp 29ebd <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ .byte 235,147 // jmp 29ea9 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
.byte 102,67,15,110,100,152,8 // movd 0x8(%r8,%r11,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,71,15,18,12,152 // movlpd (%r8,%r11,4),%xmm9
- .byte 233,142,254,255,255 // jmpq 29dd0 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
+ .byte 233,142,254,255,255 // jmpq 29dbc <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
.byte 102,67,15,110,100,152,24 // movd 0x18(%r8,%r11,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
.byte 243,67,15,16,100,152,20 // movss 0x14(%r8,%r11,4),%xmm4
@@ -51265,24 +51257,24 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 68,15,40,196 // movaps %xmm4,%xmm8
.byte 243,67,15,16,100,152,16 // movss 0x10(%r8,%r11,4),%xmm4
.byte 243,68,15,16,196 // movss %xmm4,%xmm8
- .byte 233,85,254,255,255 // jmpq 29dca <_sk_srcover_rgba_8888_sse2_8bit+0x26>
+ .byte 233,85,254,255,255 // jmpq 29db6 <_sk_srcover_rgba_8888_sse2_8bit+0x26>
.byte 102,65,15,112,225,78 // pshufd $0x4e,%xmm9,%xmm4
.byte 102,67,15,126,100,152,8 // movd %xmm4,0x8(%r8,%r11,4)
.byte 102,71,15,214,12,152 // movq %xmm9,(%r8,%r11,4)
- .byte 233,48,255,255,255 // jmpq 29ebd <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ .byte 233,48,255,255,255 // jmpq 29ea9 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
.byte 102,65,15,112,224,78 // pshufd $0x4e,%xmm8,%xmm4
.byte 102,67,15,126,100,152,24 // movd %xmm4,0x18(%r8,%r11,4)
.byte 102,65,15,112,224,229 // pshufd $0xe5,%xmm8,%xmm4
.byte 102,67,15,126,100,152,20 // movd %xmm4,0x14(%r8,%r11,4)
.byte 102,71,15,126,68,152,16 // movd %xmm8,0x10(%r8,%r11,4)
.byte 243,71,15,127,12,152 // movdqu %xmm9,(%r8,%r11,4)
- .byte 233,4,255,255,255 // jmpq 29ebd <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ .byte 233,4,255,255,255 // jmpq 29ea9 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
.byte 15,31,0 // nopl (%rax)
.byte 55 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 123,255 // jnp 29fc1 <_sk_srcover_rgba_8888_sse2_8bit+0x21d>
+ .byte 123,255 // jnp 29fad <_sk_srcover_rgba_8888_sse2_8bit+0x21d>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -51320,7 +51312,7 @@ _sk_scale_1_float_sse2_8bit:
.byte 102,68,15,111,200 // movdqa %xmm0,%xmm9
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,0 // movss (%rax),%xmm0
- .byte 243,15,89,5,56,34,0,0 // mulss 0x2238(%rip),%xmm0 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 243,15,89,5,0,43,0,0 // mulss 0x2b00(%rip),%xmm0 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 243,15,44,192 // cvttss2si %xmm0,%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
@@ -51332,7 +51324,7 @@ _sk_scale_1_float_sse2_8bit:
.byte 102,15,96,246 // punpcklbw %xmm6,%xmm6
.byte 242,15,112,246,0 // pshuflw $0x0,%xmm6,%xmm6
.byte 102,15,112,246,80 // pshufd $0x50,%xmm6,%xmm6
- .byte 102,15,219,53,75,44,0,0 // pand 0x2c4b(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,53,63,44,0,0 // pand 0x2c3f(%rip),%xmm6 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
.byte 102,65,15,213,248 // pmullw %xmm8,%xmm7
.byte 102,15,111,230 // movdqa %xmm6,%xmm4
@@ -51364,10 +51356,10 @@ _sk_scale_u8_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,239,0,0,0 // jne 2a1a0 <_sk_scale_u8_sse2_8bit+0x10b>
+ .byte 15,133,239,0,0,0 // jne 2a18c <_sk_scale_u8_sse2_8bit+0x10b>
.byte 243,67,15,126,36,24 // movq (%r8,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
- .byte 102,15,219,37,205,43,0,0 // pand 0x2bcd(%rip),%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,37,193,43,0,0 // pand 0x2bc1(%rip),%xmm4 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,111,236 // movdqa %xmm4,%xmm5
.byte 102,65,15,105,232 // punpckhwd %xmm8,%xmm5
@@ -51421,15 +51413,15 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,3,255,255,255 // ja 2a0bb <_sk_scale_u8_sse2_8bit+0x26>
+ .byte 15,135,3,255,255,255 // ja 2a0a7 <_sk_scale_u8_sse2_8bit+0x26>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,117,0,0,0 // lea 0x75(%rip),%r10 # 2a238 <_sk_scale_u8_sse2_8bit+0x1a3>
+ .byte 76,141,21,117,0,0,0 // lea 0x75(%rip),%r10 # 2a224 <_sk_scale_u8_sse2_8bit+0x1a3>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 233,225,254,255,255 // jmpq 2a0bb <_sk_scale_u8_sse2_8bit+0x26>
+ .byte 233,225,254,255,255 // jmpq 2a0a7 <_sk_scale_u8_sse2_8bit+0x26>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,196,224,2 // pinsrw $0x2,%eax,%xmm4
@@ -51437,7 +51429,7 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 243,15,16,229 // movss %xmm5,%xmm4
- .byte 233,188,254,255,255 // jmpq 2a0bb <_sk_scale_u8_sse2_8bit+0x26>
+ .byte 233,188,254,255,255 // jmpq 2a0a7 <_sk_scale_u8_sse2_8bit+0x26>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,196,224,6 // pinsrw $0x6,%eax,%xmm4
@@ -51448,7 +51440,7 @@ _sk_scale_u8_sse2_8bit:
.byte 102,67,15,110,44,24 // movd (%r8,%r11,1),%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,132,254,255,255 // jmpq 2a0bb <_sk_scale_u8_sse2_8bit+0x26>
+ .byte 233,132,254,255,255 // jmpq 2a0a7 <_sk_scale_u8_sse2_8bit+0x26>
.byte 144 // nop
.byte 148 // xchg %eax,%esp
.byte 255 // (bad)
@@ -51477,7 +51469,7 @@ FUNCTION(_sk_lerp_1_float_sse2_8bit)
_sk_lerp_1_float_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,32 // movss (%rax),%xmm4
- .byte 243,15,89,37,226,31,0,0 // mulss 0x1fe2(%rip),%xmm4 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 243,15,89,37,170,40,0,0 // mulss 0x28aa(%rip),%xmm4 # 2caf8 <_sk_overlay_sse2_8bit+0xd34>
.byte 243,15,44,196 // cvttss2si %xmm4,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,228 // punpcklbw %xmm4,%xmm4
@@ -51490,7 +51482,7 @@ _sk_lerp_1_float_sse2_8bit:
.byte 102,68,15,111,217 // movdqa %xmm1,%xmm11
.byte 102,69,15,96,217 // punpcklbw %xmm9,%xmm11
.byte 102,65,15,104,201 // punpckhbw %xmm9,%xmm1
- .byte 102,15,111,53,237,41,0,0 // movdqa 0x29ed(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,111,53,225,41,0,0 // movdqa 0x29e1(%rip),%xmm6 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,65,15,219,240 // pand %xmm8,%xmm6
.byte 102,15,111,230 // movdqa %xmm6,%xmm4
.byte 102,15,213,225 // pmullw %xmm1,%xmm4
@@ -51554,10 +51546,10 @@ _sk_lerp_u8_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,141,1,0,0 // jne 2a533 <_sk_lerp_u8_sse2_8bit+0x1a9>
+ .byte 15,133,141,1,0,0 // jne 2a51f <_sk_lerp_u8_sse2_8bit+0x1a9>
.byte 243,67,15,126,44,24 // movq (%r8,%r11,1),%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
- .byte 102,15,219,45,216,40,0,0 // pand 0x28d8(%rip),%xmm5 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,219,45,204,40,0,0 // pand 0x28cc(%rip),%xmm5 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,65,15,105,224 // punpckhwd %xmm8,%xmm4
@@ -51644,15 +51636,15 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,101,254,255,255 // ja 2a3b0 <_sk_lerp_u8_sse2_8bit+0x26>
+ .byte 15,135,101,254,255,255 // ja 2a39c <_sk_lerp_u8_sse2_8bit+0x26>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,118,0,0,0 // lea 0x76(%rip),%r10 # 2a5cc <_sk_lerp_u8_sse2_8bit+0x242>
+ .byte 76,141,21,118,0,0,0 // lea 0x76(%rip),%r10 # 2a5b8 <_sk_lerp_u8_sse2_8bit+0x242>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,232 // movd %eax,%xmm5
- .byte 233,67,254,255,255 // jmpq 2a3b0 <_sk_lerp_u8_sse2_8bit+0x26>
+ .byte 233,67,254,255,255 // jmpq 2a39c <_sk_lerp_u8_sse2_8bit+0x26>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,196,232,2 // pinsrw $0x2,%eax,%xmm5
@@ -51660,7 +51652,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 243,15,16,236 // movss %xmm4,%xmm5
- .byte 233,30,254,255,255 // jmpq 2a3b0 <_sk_lerp_u8_sse2_8bit+0x26>
+ .byte 233,30,254,255,255 // jmpq 2a39c <_sk_lerp_u8_sse2_8bit+0x26>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,196,232,6 // pinsrw $0x6,%eax,%xmm5
@@ -51671,7 +51663,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,67,15,110,36,24 // movd (%r8,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 242,15,16,236 // movsd %xmm4,%xmm5
- .byte 233,230,253,255,255 // jmpq 2a3b0 <_sk_lerp_u8_sse2_8bit+0x26>
+ .byte 233,230,253,255,255 // jmpq 2a39c <_sk_lerp_u8_sse2_8bit+0x26>
.byte 102,144 // xchg %ax,%ax
.byte 147 // xchg %eax,%ebx
.byte 255 // (bad)
@@ -51680,7 +51672,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 235,255 // jmp 2a5d9 <_sk_lerp_u8_sse2_8bit+0x24f>
+ .byte 235,255 // jmp 2a5c5 <_sk_lerp_u8_sse2_8bit+0x24f>
.byte 255 // (bad)
.byte 255,224 // jmpq *%rax
.byte 255 // (bad)
@@ -51716,7 +51708,7 @@ HIDDEN _sk_black_color_sse2_8bit
FUNCTION(_sk_black_color_sse2_8bit)
_sk_black_color_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,203,45,0,0 // movaps 0x2dcb(%rip),%xmm0 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
+ .byte 15,40,5,191,45,0,0 // movaps 0x2dbf(%rip),%xmm0 # 2d3b0 <_sk_overlay_sse2_8bit+0x15ec>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 255,224 // jmpq *%rax
@@ -52617,7 +52609,7 @@ _sk_darken_sse2_8bit:
.byte 102,65,15,248,234 // psubb %xmm10,%xmm5
.byte 102,15,248,207 // psubb %xmm7,%xmm1
.byte 102,15,248,196 // psubb %xmm4,%xmm0
- .byte 102,15,111,37,187,31,0,0 // movdqa 0x1fbb(%rip),%xmm4 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
+ .byte 102,15,111,37,175,31,0,0 // movdqa 0x1faf(%rip),%xmm4 # 2d4a0 <_sk_overlay_sse2_8bit+0x16dc>
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,252 // movdqa %xmm4,%xmm7
.byte 102,15,223,248 // pandn %xmm0,%xmm7
@@ -52725,7 +52717,7 @@ _sk_lighten_sse2_8bit:
.byte 102,65,15,248,234 // psubb %xmm10,%xmm5
.byte 102,15,248,207 // psubb %xmm7,%xmm1
.byte 102,15,248,196 // psubb %xmm4,%xmm0
- .byte 102,15,111,37,207,29,0,0 // movdqa 0x1dcf(%rip),%xmm4 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
+ .byte 102,15,111,37,195,29,0,0 // movdqa 0x1dc3(%rip),%xmm4 # 2d4a0 <_sk_overlay_sse2_8bit+0x16dc>
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,252 // movdqa %xmm4,%xmm7
.byte 102,15,223,248 // pandn %xmm0,%xmm7
@@ -52775,7 +52767,7 @@ _sk_exclusion_sse2_8bit:
.byte 102,15,113,214,8 // psrlw $0x8,%xmm6
.byte 102,15,103,244 // packuswb %xmm4,%xmm6
.byte 102,15,103,239 // packuswb %xmm7,%xmm5
- .byte 102,15,111,37,2,29,0,0 // movdqa 0x1d02(%rip),%xmm4 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
+ .byte 102,15,111,37,246,28,0,0 // movdqa 0x1cf6(%rip),%xmm4 # 2d4a0 <_sk_overlay_sse2_8bit+0x16dc>
.byte 102,15,248,205 // psubb %xmm5,%xmm1
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,219,230 // pand %xmm6,%xmm4
@@ -52874,7 +52866,7 @@ _sk_difference_sse2_8bit:
.byte 102,65,15,103,244 // packuswb %xmm12,%xmm6
.byte 102,65,15,218,226 // pminub %xmm10,%xmm4
.byte 102,65,15,218,243 // pminub %xmm11,%xmm6
- .byte 102,15,111,45,63,27,0,0 // movdqa 0x1b3f(%rip),%xmm5 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
+ .byte 102,15,111,45,51,27,0,0 // movdqa 0x1b33(%rip),%xmm5 # 2d4a0 <_sk_overlay_sse2_8bit+0x16dc>
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 102,15,219,236 // pand %xmm4,%xmm5
@@ -52971,7 +52963,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,68,15,111,220 // movdqa %xmm4,%xmm11
.byte 102,69,15,217,211 // psubusw %xmm11,%xmm10
.byte 102,68,15,117,213 // pcmpeqw %xmm5,%xmm10
- .byte 102,15,111,45,74,17,0,0 // movdqa 0x114a(%rip),%xmm5 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,111,45,62,17,0,0 // movdqa 0x113e(%rip),%xmm5 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,15,111,198 // movdqa %xmm6,%xmm0
.byte 102,15,239,197 // pxor %xmm5,%xmm0
.byte 102,65,15,213,198 // pmullw %xmm14,%xmm0
@@ -53075,7 +53067,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,68,15,253,124,36,32 // paddw 0x20(%rsp),%xmm15
.byte 102,68,15,253,68,36,144 // paddw -0x70(%rsp),%xmm8
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
- .byte 102,15,111,5,126,23,0,0 // movdqa 0x177e(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0x16f8>
+ .byte 102,15,111,5,114,23,0,0 // movdqa 0x1772(%rip),%xmm0 # 2d4b0 <_sk_overlay_sse2_8bit+0x16ec>
.byte 102,15,253,208 // paddw %xmm0,%xmm2
.byte 102,68,15,253,210 // paddw %xmm2,%xmm10
.byte 102,68,15,253,248 // paddw %xmm0,%xmm15
@@ -53084,7 +53076,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,69,15,253,200 // paddw %xmm8,%xmm9
.byte 102,15,253,232 // paddw %xmm0,%xmm5
.byte 102,15,253,233 // paddw %xmm1,%xmm5
- .byte 102,15,111,5,97,23,0,0 // movdqa 0x1761(%rip),%xmm0 # 2d4e0 <_sk_overlay_sse2_8bit+0x1708>
+ .byte 102,15,111,5,85,23,0,0 // movdqa 0x1755(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0x16fc>
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
.byte 102,68,15,228,200 // pmulhuw %xmm0,%xmm9
.byte 102,68,15,228,248 // pmulhuw %xmm0,%xmm15
@@ -53189,7 +53181,7 @@ _sk_overlay_sse2_8bit:
.byte 102,15,217,234 // psubusw %xmm2,%xmm5
.byte 102,15,117,236 // pcmpeqw %xmm4,%xmm5
.byte 102,15,127,108,36,32 // movdqa %xmm5,0x20(%rsp)
- .byte 102,15,111,53,26,13,0,0 // movdqa 0xd1a(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
+ .byte 102,15,111,53,14,13,0,0 // movdqa 0xd0e(%rip),%xmm6 # 2cc70 <_sk_overlay_sse2_8bit+0xeac>
.byte 102,15,111,194 // movdqa %xmm2,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,65,15,213,199 // pmullw %xmm15,%xmm0
@@ -53297,7 +53289,7 @@ _sk_overlay_sse2_8bit:
.byte 102,68,15,253,92,36,240 // paddw -0x10(%rsp),%xmm11
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
.byte 102,15,253,116,36,144 // paddw -0x70(%rsp),%xmm6
- .byte 102,15,111,5,61,19,0,0 // movdqa 0x133d(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0x16f8>
+ .byte 102,15,111,5,49,19,0,0 // movdqa 0x1331(%rip),%xmm0 # 2d4b0 <_sk_overlay_sse2_8bit+0x16ec>
.byte 102,68,15,253,224 // paddw %xmm0,%xmm12
.byte 102,68,15,253,227 // paddw %xmm3,%xmm12
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
@@ -53306,7 +53298,7 @@ _sk_overlay_sse2_8bit:
.byte 102,15,253,234 // paddw %xmm2,%xmm5
.byte 102,15,253,240 // paddw %xmm0,%xmm6
.byte 102,15,253,241 // paddw %xmm1,%xmm6
- .byte 102,15,111,5,33,19,0,0 // movdqa 0x1321(%rip),%xmm0 # 2d4e0 <_sk_overlay_sse2_8bit+0x1708>
+ .byte 102,15,111,5,21,19,0,0 // movdqa 0x1315(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0x16fc>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
@@ -53325,179 +53317,21 @@ _sk_overlay_sse2_8bit:
.byte 72,129,196,200,0,0,0 // add $0xc8,%rsp
.byte 255,224 // jmpq *%rax
-BALIGN4
+BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 128,63,1 // cmpb $0x1,(%rdi)
- .byte 0,0 // add %al,(%rax)
- .byte 0,4,0 // add %al,(%rax,%rax,1)
- .byte 0,0 // add %al,(%rax)
- .byte 2,0 // add (%rax),%al
- .byte 0,0 // add %al,(%rax)
- .byte 0,0 // add %al,(%rax)
- .byte 128,60,0,0 // cmpb $0x0,(%rax,%rax,1)
- .byte 252 // cld
- .byte 190,0,0,128,191 // mov $0xbf800000,%esi
- .byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2c278 <.literal4+0x64>
- .byte 154 // (bad)
- .byte 153 // cltd
- .byte 153 // cltd
- .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 2c281 <.literal4+0x6d>
- .byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2c28b <.literal4+0x77>
- .byte 145 // xchg %eax,%ecx
- .byte 131,158,61,92,143,50,63 // sbbl $0x3f,0x328f5c3d(%rsi)
- .byte 10,215 // or %bh,%dl
- .byte 35,59 // and (%rbx),%edi
- .byte 174 // scas %es:(%rdi),%al
- .byte 71,97 // rex.RXB (bad)
- .byte 61,82,184,78,65 // cmp $0x414eb852,%eax
- .byte 186,159,98,60,57 // mov $0x393c629f,%edx
- .byte 215 // xlat %ds:(%rbx)
- .byte 32,187,109,165,144,63 // and %bh,0x3f90a56d(%rbx)
- .byte 252 // cld
- .byte 191,16,62,168,177 // mov $0xb1a83e10,%edi
- .byte 152 // cwtl
- .byte 59,0 // cmp (%rax),%eax
- .byte 0,192 // add %al,%al
+ .byte 192,63,0 // sarb $0x0,(%rdi)
+ .byte 0,32 // add %ah,(%rax)
.byte 64,0,0 // add %al,(%rax)
- .byte 0,64,0 // add %al,0x0(%rax)
- .byte 0,128,64,171,170,42 // add %al,0x2aaaab40(%rax)
- .byte 62,171 // ds stos %eax,%es:(%rdi)
- .byte 170 // stos %al,%es:(%rdi)
- .byte 170 // stos %al,%es:(%rdi)
- .byte 62,171 // ds stos %eax,%es:(%rdi)
- .byte 170 // stos %al,%es:(%rdi)
- .byte 42,63 // sub (%rdi),%bh
- .byte 171 // stos %eax,%es:(%rdi)
- .byte 170 // stos %al,%es:(%rdi)
- .byte 170 // stos %al,%es:(%rdi)
- .byte 190,129,128,128,59 // mov $0x3b808081,%esi
- .byte 0,248 // add %bh,%al
- .byte 0,0 // add %al,(%rax)
- .byte 8,33 // or %ah,(%rcx)
- .byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 2c2a1 <.literal4+0x8d>
- .byte 0,0 // add %al,(%rax)
- .byte 33,8 // and %ecx,(%rax)
- .byte 2,58 // add (%rdx),%bh
- .byte 31 // (bad)
- .byte 0,0 // add %al,(%rax)
- .byte 0,8 // add %cl,(%rax)
- .byte 33,4,61,128,0,128,55 // and %eax,0x37800080(,%rdi,1)
- .byte 0,0 // add %al,(%rax)
- .byte 0,52,255 // add %dh,(%rdi,%rdi,8)
- .byte 255 // (bad)
- .byte 127,0 // jg 2c2b4 <.literal4+0xa0>
- .byte 119,115 // ja 2c329 <.literal4+0x115>
- .byte 248 // clc
- .byte 194,117,191 // retq $0xbf75
- .byte 191,63,249,68,180 // mov $0xb444f93f,%edi
- .byte 62,163,233,220,63,81,140,242,66,141 // movabs %eax,%ds:0x8d42f28c513fdce9
- .byte 188,190,63,248,245 // mov $0xf5f83fbe,%esp
- .byte 154 // (bad)
- .byte 64,254 // rex (bad)
- .byte 210,221 // rcr %cl,%ch
- .byte 65,0,0 // add %al,(%r8)
- .byte 0,75,0 // add %cl,0x0(%rbx)
- .byte 0,200 // add %cl,%al
- .byte 66,0,0 // rex.X add %al,(%rax)
- .byte 0,195 // add %al,%bl
- .byte 0,0 // add %al,(%rax)
- .byte 128,65,203,61 // addb $0x3d,-0x35(%rcx)
- .byte 13,60,111,18,3 // or $0x3126f3c,%eax
- .byte 59,10 // cmp (%rdx),%ecx
- .byte 215 // xlat %ds:(%rbx)
- .byte 163,59,194,24,17,60,203,61,13 // movabs %eax,0xd3dcb3c1118c23b
- .byte 190,80,128,3,62 // mov $0x3e038050,%esi
- .byte 31 // (bad)
- .byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2c33f <.literal4+0x12b>
- .byte 246,64,83,63 // testb $0x3f,0x53(%rax)
- .byte 0,0 // add %al,(%rax)
- .byte 248 // clc
- .byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 2c34e <.literal4+0x13a>
- .byte 0,240 // add %dh,%al
- .byte 0,0 // add %al,(%rax)
- .byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
- .byte 0,0 // add %al,(%rax)
- .byte 137,136,136,57,240,0 // mov %ecx,0xf03988(%rax)
- .byte 0,0 // add %al,(%rax)
- .byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
- .byte 0,0 // add %al,(%rax)
- .byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 2c371 <.literal4+0x15d>
- .byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2c37b <.literal4+0x167>
- .byte 208 // (bad)
- .byte 179,89 // mov $0x59,%bl
- .byte 62,89 // ds pop %rcx
- .byte 23 // (bad)
- .byte 55 // (bad)
- .byte 63 // (bad)
- .byte 152 // cwtl
- .byte 221,147,61,18,120,57 // fstl 0x3978123d(%rbx)
- .byte 64,45,16,17,192,32 // rex sub $0x20c01110,%eax
- .byte 148 // xchg %eax,%esp
- .byte 90 // pop %rdx
- .byte 62,4,157 // ds add $0x9d,%al
- .byte 30 // (bad)
- .byte 62,0,24 // add %bl,%ds:(%rax)
- .byte 161,57,111,43,231,187,159,215,202 // movabs 0xcad79fbbe72b6f39,%eax
- .byte 60,212 // cmp $0xd4,%al
- .byte 100,84 // fs push %rsp
- .byte 189,169,240,34,62 // mov $0x3e22f0a9,%ebp
- .byte 0,0 // add %al,(%rax)
- .byte 128,62,0 // cmpb $0x0,(%rsi)
- .byte 0,0 // add %al,(%rax)
- .byte 192,0,0 // rolb $0x0,(%rax)
- .byte 128,192,0 // add $0x0,%al
- .byte 0,0 // add %al,(%rax)
- .byte 128,0,0 // addb $0x0,(%rax)
- .byte 0,191,0,0,192,191 // add %bh,-0x40400000(%rdi)
- .byte 114,28 // jb 2c39a <.literal4+0x186>
- .byte 199 // (bad)
- .byte 62,0,0 // add %al,%ds:(%rax)
- .byte 192,63,85 // sarb $0x55,(%rdi)
- .byte 85 // push %rbp
- .byte 149 // xchg %eax,%ebp
- .byte 191,57,142,99,61 // mov $0x3d638e39,%edi
- .byte 114,249 // jb 2c387 <.literal4+0x173>
- .byte 127,63 // jg 2c3cf <_sk_overlay_sse2_8bit+0x5f7>
- .byte 3,0 // add (%rax),%eax
- .byte 0,0 // add %al,(%rax)
- .byte 0,128,0,0,0,4 // add %al,0x4000000(%rax)
- .byte 0,128,0,0,0,56 // add %al,0x38000000(%rax)
- .byte 0,0 // add %al,(%rax)
- .byte 128,56,0 // cmpb $0x0,(%rax)
- .byte 64,254 // rex (bad)
- .byte 255,7 // incl (%rdi)
- .byte 0,7 // add %al,(%rdi)
- .byte 0,0 // add %al,(%rax)
- .byte 12,0 // or $0x0,%al
- .byte 0,0 // add %al,(%rax)
- .byte 0,0 // add %al,(%rax)
- .byte 255,1 // incl (%rcx)
- .byte 1,1 // add %eax,(%rcx)
- .byte 0,255 // add %bh,%bh
- .byte 255 // (bad)
- .byte 255,0 // incl (%rax)
-
-BALIGN32
- .byte 0,0 // add %al,(%rax)
- .byte 0,0 // add %al,(%rax)
- .byte 0,0 // add %al,(%rax)
- .byte 128,63,0 // cmpb $0x0,(%rdi)
- .byte 0,0 // add %al,(%rax)
+ .byte 96 // (bad)
.byte 64,0,0 // add %al,(%rax)
- .byte 64 // rex
+ .byte 144 // nop
.byte 64,0,0 // add %al,(%rax)
- .byte 128,64,0,0 // addb $0x0,0x0(%rax)
- .byte 160,64,0,0,192,64,0,0,224 // movabs 0xe0000040c0000040,%al
+ .byte 176,64 // mov $0x40,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 208,64,0 // rolb 0x0(%rax)
+ .byte 0,240 // add %dh,%al
.byte 64,0,0 // add %al,(%rax)
.byte 0,0 // add %al,(%rax)
.byte 1,0 // add %eax,(%rax)
@@ -53531,16 +53365,16 @@ BALIGN32
.byte 0,1 // add %al,(%rcx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c428 <_sk_overlay_sse2_8bit+0xa000650>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c268 <_sk_overlay_sse2_8bit+0xa0004a4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c430 <_sk_overlay_sse2_8bit+0x12000658>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c270 <_sk_overlay_sse2_8bit+0x120004ac>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c438 <_sk_overlay_sse2_8bit+0x1a000660>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c278 <_sk_overlay_sse2_8bit+0x1a0004b4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c440 <_sk_overlay_sse2_8bit+0x3000668>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c280 <_sk_overlay_sse2_8bit+0x30004bc>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53583,16 +53417,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c488 <_sk_overlay_sse2_8bit+0xa0006b0>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c2c8 <_sk_overlay_sse2_8bit+0xa000504>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c490 <_sk_overlay_sse2_8bit+0x120006b8>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c2d0 <_sk_overlay_sse2_8bit+0x1200050c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c498 <_sk_overlay_sse2_8bit+0x1a0006c0>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c2d8 <_sk_overlay_sse2_8bit+0x1a000514>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c4a0 <_sk_overlay_sse2_8bit+0x30006c8>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c2e0 <_sk_overlay_sse2_8bit+0x300051c>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53635,16 +53469,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c4e8 <_sk_overlay_sse2_8bit+0xa000710>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c328 <_sk_overlay_sse2_8bit+0xa000564>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c4f0 <_sk_overlay_sse2_8bit+0x12000718>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c330 <_sk_overlay_sse2_8bit+0x1200056c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c4f8 <_sk_overlay_sse2_8bit+0x1a000720>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c338 <_sk_overlay_sse2_8bit+0x1a000574>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c500 <_sk_overlay_sse2_8bit+0x3000728>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c340 <_sk_overlay_sse2_8bit+0x300057c>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53687,16 +53521,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c548 <_sk_overlay_sse2_8bit+0xa000770>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c388 <_sk_overlay_sse2_8bit+0xa0005c4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c550 <_sk_overlay_sse2_8bit+0x12000778>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c390 <_sk_overlay_sse2_8bit+0x120005cc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c558 <_sk_overlay_sse2_8bit+0x1a000780>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c398 <_sk_overlay_sse2_8bit+0x1a0005d4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c560 <_sk_overlay_sse2_8bit+0x3000788>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c3a0 <_sk_overlay_sse2_8bit+0x30005dc>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53739,16 +53573,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c5a8 <_sk_overlay_sse2_8bit+0xa0007d0>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c3e8 <_sk_overlay_sse2_8bit+0xa000624>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c5b0 <_sk_overlay_sse2_8bit+0x120007d8>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c3f0 <_sk_overlay_sse2_8bit+0x1200062c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c5b8 <_sk_overlay_sse2_8bit+0x1a0007e0>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c3f8 <_sk_overlay_sse2_8bit+0x1a000634>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c5c0 <_sk_overlay_sse2_8bit+0x30007e8>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c400 <_sk_overlay_sse2_8bit+0x300063c>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53791,16 +53625,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c608 <_sk_overlay_sse2_8bit+0xa000830>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c448 <_sk_overlay_sse2_8bit+0xa000684>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c610 <_sk_overlay_sse2_8bit+0x12000838>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c450 <_sk_overlay_sse2_8bit+0x1200068c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c618 <_sk_overlay_sse2_8bit+0x1a000840>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c458 <_sk_overlay_sse2_8bit+0x1a000694>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c620 <_sk_overlay_sse2_8bit+0x3000848>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c460 <_sk_overlay_sse2_8bit+0x300069c>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53843,16 +53677,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c668 <_sk_overlay_sse2_8bit+0xa000890>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c4a8 <_sk_overlay_sse2_8bit+0xa0006e4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c670 <_sk_overlay_sse2_8bit+0x12000898>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c4b0 <_sk_overlay_sse2_8bit+0x120006ec>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c678 <_sk_overlay_sse2_8bit+0x1a0008a0>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c4b8 <_sk_overlay_sse2_8bit+0x1a0006f4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c680 <_sk_overlay_sse2_8bit+0x30008a8>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c4c0 <_sk_overlay_sse2_8bit+0x30006fc>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53895,16 +53729,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c6c8 <_sk_overlay_sse2_8bit+0xa0008f0>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c508 <_sk_overlay_sse2_8bit+0xa000744>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c6d0 <_sk_overlay_sse2_8bit+0x120008f8>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c510 <_sk_overlay_sse2_8bit+0x1200074c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c6d8 <_sk_overlay_sse2_8bit+0x1a000900>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c518 <_sk_overlay_sse2_8bit+0x1a000754>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c6e0 <_sk_overlay_sse2_8bit+0x3000908>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c520 <_sk_overlay_sse2_8bit+0x300075c>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53930,13 +53764,19 @@ BALIGN32
.byte 255 // (bad)
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
+ .byte 63 // (bad)
.byte 0,0 // add %al,(%rax)
- .byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
+ .byte 192,63,0 // sarb $0x0,(%rdi)
+ .byte 0,32 // add %ah,(%rax)
.byte 64,0,0 // add %al,(%rax)
- .byte 64 // rex
+ .byte 96 // (bad)
.byte 64,0,0 // add %al,(%rax)
- .byte 128,64,0,0 // addb $0x0,0x0(%rax)
- .byte 160,64,0,0,192,64,0,0,224 // movabs 0xe0000040c0000040,%al
+ .byte 144 // nop
+ .byte 64,0,0 // add %al,(%rax)
+ .byte 176,64 // mov $0x40,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 208,64,0 // rolb 0x0(%rax)
+ .byte 0,240 // add %dh,%al
.byte 64,255,0 // rex incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -54729,6 +54569,168 @@ BALIGN32
.byte 129 // .byte 0x81
.byte 128 // .byte 0x80
+BALIGN4
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,63,1 // cmpb $0x1,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,4,0 // add %al,(%rax,%rax,1)
+ .byte 0,0 // add %al,(%rax)
+ .byte 2,0 // add (%rax),%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,60,0,0 // cmpb $0x0,(%rax,%rax,1)
+ .byte 252 // cld
+ .byte 190,0,0,128,191 // mov $0xbf800000,%esi
+ .byte 0,0 // add %al,(%rax)
+ .byte 224,64 // loopne 2cb2c <.literal4+0x64>
+ .byte 154 // (bad)
+ .byte 153 // cltd
+ .byte 153 // cltd
+ .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
+ .byte 71,225,61 // rex.RXB loope 2cb35 <.literal4+0x6d>
+ .byte 0,0 // add %al,(%rax)
+ .byte 127,67 // jg 2cb3f <.literal4+0x77>
+ .byte 145 // xchg %eax,%ecx
+ .byte 131,158,61,92,143,50,63 // sbbl $0x3f,0x328f5c3d(%rsi)
+ .byte 10,215 // or %bh,%dl
+ .byte 35,59 // and (%rbx),%edi
+ .byte 174 // scas %es:(%rdi),%al
+ .byte 71,97 // rex.RXB (bad)
+ .byte 61,82,184,78,65 // cmp $0x414eb852,%eax
+ .byte 186,159,98,60,57 // mov $0x393c629f,%edx
+ .byte 215 // xlat %ds:(%rbx)
+ .byte 32,187,109,165,144,63 // and %bh,0x3f90a56d(%rbx)
+ .byte 252 // cld
+ .byte 191,16,62,168,177 // mov $0xb1a83e10,%edi
+ .byte 152 // cwtl
+ .byte 59,0 // cmp (%rax),%eax
+ .byte 0,192 // add %al,%al
+ .byte 64,0,0 // add %al,(%rax)
+ .byte 0,64,0 // add %al,0x0(%rax)
+ .byte 0,128,64,171,170,42 // add %al,0x2aaaab40(%rax)
+ .byte 62,171 // ds stos %eax,%es:(%rdi)
+ .byte 170 // stos %al,%es:(%rdi)
+ .byte 170 // stos %al,%es:(%rdi)
+ .byte 62,171 // ds stos %eax,%es:(%rdi)
+ .byte 170 // stos %al,%es:(%rdi)
+ .byte 42,63 // sub (%rdi),%bh
+ .byte 171 // stos %eax,%es:(%rdi)
+ .byte 170 // stos %al,%es:(%rdi)
+ .byte 170 // stos %al,%es:(%rdi)
+ .byte 190,129,128,128,59 // mov $0x3b808081,%esi
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 8,33 // or %ah,(%rcx)
+ .byte 132,55 // test %dh,(%rdi)
+ .byte 224,7 // loopne 2cb55 <.literal4+0x8d>
+ .byte 0,0 // add %al,(%rax)
+ .byte 33,8 // and %ecx,(%rax)
+ .byte 2,58 // add (%rdx),%bh
+ .byte 31 // (bad)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,8 // add %cl,(%rax)
+ .byte 33,4,61,128,0,128,55 // and %eax,0x37800080(,%rdi,1)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,52,255 // add %dh,(%rdi,%rdi,8)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 2cb68 <.literal4+0xa0>
+ .byte 119,115 // ja 2cbdd <.literal4+0x115>
+ .byte 248 // clc
+ .byte 194,117,191 // retq $0xbf75
+ .byte 191,63,249,68,180 // mov $0xb444f93f,%edi
+ .byte 62,163,233,220,63,81,140,242,66,141 // movabs %eax,%ds:0x8d42f28c513fdce9
+ .byte 188,190,63,248,245 // mov $0xf5f83fbe,%esp
+ .byte 154 // (bad)
+ .byte 64,254 // rex (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,0,0 // add %al,(%r8)
+ .byte 0,75,0 // add %cl,0x0(%rbx)
+ .byte 0,200 // add %cl,%al
+ .byte 66,0,0 // rex.X add %al,(%rax)
+ .byte 0,195 // add %al,%bl
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,65,203,61 // addb $0x3d,-0x35(%rcx)
+ .byte 13,60,111,18,3 // or $0x3126f3c,%eax
+ .byte 59,10 // cmp (%rdx),%ecx
+ .byte 215 // xlat %ds:(%rbx)
+ .byte 163,59,194,24,17,60,203,61,13 // movabs %eax,0xd3dcb3c1118c23b
+ .byte 190,80,128,3,62 // mov $0x3e038050,%esi
+ .byte 31 // (bad)
+ .byte 215 // xlat %ds:(%rbx)
+ .byte 118,63 // jbe 2cbf3 <.literal4+0x12b>
+ .byte 246,64,83,63 // testb $0x3f,0x53(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 248 // clc
+ .byte 65,0,0 // add %al,(%r8)
+ .byte 124,66 // jl 2cc02 <.literal4+0x13a>
+ .byte 0,240 // add %dh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 137,136,136,57,240,0 // mov %ecx,0xf03988(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
+ .byte 112,65 // jo 2cc25 <.literal4+0x15d>
+ .byte 0,255 // add %bh,%bh
+ .byte 127,71 // jg 2cc2f <.literal4+0x167>
+ .byte 208 // (bad)
+ .byte 179,89 // mov $0x59,%bl
+ .byte 62,89 // ds pop %rcx
+ .byte 23 // (bad)
+ .byte 55 // (bad)
+ .byte 63 // (bad)
+ .byte 152 // cwtl
+ .byte 221,147,61,18,120,57 // fstl 0x3978123d(%rbx)
+ .byte 64,45,16,17,192,32 // rex sub $0x20c01110,%eax
+ .byte 148 // xchg %eax,%esp
+ .byte 90 // pop %rdx
+ .byte 62,4,157 // ds add $0x9d,%al
+ .byte 30 // (bad)
+ .byte 62,0,24 // add %bl,%ds:(%rax)
+ .byte 161,57,111,43,231,187,159,215,202 // movabs 0xcad79fbbe72b6f39,%eax
+ .byte 60,212 // cmp $0xd4,%al
+ .byte 100,84 // fs push %rsp
+ .byte 189,169,240,34,62 // mov $0x3e22f0a9,%ebp
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,62,0 // cmpb $0x0,(%rsi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 192,0,0 // rolb $0x0,(%rax)
+ .byte 128,192,0 // add $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,0,0 // addb $0x0,(%rax)
+ .byte 0,191,0,0,192,191 // add %bh,-0x40400000(%rdi)
+ .byte 114,28 // jb 2cc4e <.literal4+0x186>
+ .byte 199 // (bad)
+ .byte 62,0,0 // add %al,%ds:(%rax)
+ .byte 192,63,85 // sarb $0x55,(%rdi)
+ .byte 85 // push %rbp
+ .byte 149 // xchg %eax,%ebp
+ .byte 191,57,142,99,61 // mov $0x3d638e39,%edi
+ .byte 114,249 // jb 2cc3b <.literal4+0x173>
+ .byte 127,63 // jg 2cc83 <_sk_overlay_sse2_8bit+0xebf>
+ .byte 3,0 // add (%rax),%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,128,0,0,0,4 // add %al,0x4000000(%rax)
+ .byte 0,128,0,0,0,56 // add %al,0x38000000(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,56,0 // cmpb $0x0,(%rax)
+ .byte 64,254 // rex (bad)
+ .byte 255,7 // incl (%rdi)
+ .byte 0,7 // add %al,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 12,0 // or $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 255,1 // incl (%rcx)
+ .byte 1,1 // add %eax,(%rcx)
+ .byte 0,255 // add %bh,%bh
+ .byte 255 // (bad)
+ .byte 255,0 // incl (%rax)
+
BALIGN16
.byte 255,0 // incl (%rax)
.byte 255,0 // incl (%rax)
@@ -54772,19 +54774,19 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 63 // (bad)
.byte 0,0 // add %al,(%rax)
+ .byte 192,63,0 // sarb $0x0,(%rdi)
+ .byte 0,32 // add %ah,(%rax)
+ .byte 64,0,0 // add %al,(%rax)
+ .byte 96 // (bad)
+ .byte 64,0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 0,0 // add %al,(%rax)
- .byte 128,63,0 // cmpb $0x0,(%rdi)
- .byte 0,0 // add %al,(%rax)
- .byte 64,0,0 // add %al,(%rax)
- .byte 64 // rex
- .byte 64,0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
.byte 63 // (bad)
@@ -54828,11 +54830,11 @@ BALIGN16
.byte 0,128,191,0,0,128 // add %al,-0x7fffff41(%rax)
.byte 191,0,0,224,64 // mov $0x40e00000,%edi
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2cdb8 <.literal16+0x128>
+ .byte 224,64 // loopne 2cd98 <.literal16+0x128>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2cdbc <.literal16+0x12c>
+ .byte 224,64 // loopne 2cd9c <.literal16+0x12c>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2cdc0 <.literal16+0x130>
+ .byte 224,64 // loopne 2cda0 <.literal16+0x130>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
@@ -54852,13 +54854,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2cde1 <.literal16+0x151>
+ .byte 71,225,61 // rex.RXB loope 2cdc1 <.literal16+0x151>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2cde5 <.literal16+0x155>
+ .byte 71,225,61 // rex.RXB loope 2cdc5 <.literal16+0x155>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2cde9 <.literal16+0x159>
+ .byte 71,225,61 // rex.RXB loope 2cdc9 <.literal16+0x159>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2cded <.literal16+0x15d>
+ .byte 71,225,61 // rex.RXB loope 2cdcd <.literal16+0x15d>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -54869,10 +54871,10 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02cdc8 <_sk_overlay_sse2_8bit+0xa000ff0>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02cda8 <_sk_overlay_sse2_8bit+0xa000fe4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 302cdd0 <_sk_overlay_sse2_8bit+0x3000ff8>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 302cdb0 <_sk_overlay_sse2_8bit+0x3000fec>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -54887,11 +54889,11 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2ce2b <.literal16+0x19b>
+ .byte 127,67 // jg 2ce0b <.literal16+0x19b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2ce2f <.literal16+0x19f>
+ .byte 127,67 // jg 2ce0f <.literal16+0x19f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2ce33 <.literal16+0x1a3>
+ .byte 127,67 // jg 2ce13 <.literal16+0x1a3>
.byte 145 // xchg %eax,%ecx
.byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%rsi)
.byte 145 // xchg %eax,%ecx
@@ -55042,13 +55044,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 2cf39 <.literal16+0x2a9>
+ .byte 224,7 // loopne 2cf19 <.literal16+0x2a9>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2cf3d <.literal16+0x2ad>
+ .byte 224,7 // loopne 2cf1d <.literal16+0x2ad>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2cf41 <.literal16+0x2b1>
+ .byte 224,7 // loopne 2cf21 <.literal16+0x2b1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2cf45 <.literal16+0x2b5>
+ .byte 224,7 // loopne 2cf25 <.literal16+0x2b5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -55108,17 +55110,17 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 2cfc4 <.literal16+0x334>
+ .byte 127,0 // jg 2cfa4 <.literal16+0x334>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2cfc8 <.literal16+0x338>
+ .byte 127,0 // jg 2cfa8 <.literal16+0x338>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2cfcc <.literal16+0x33c>
+ .byte 127,0 // jg 2cfac <.literal16+0x33c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2cfd0 <.literal16+0x340>
- .byte 119,115 // ja 2d045 <.literal16+0x3b5>
+ .byte 127,0 // jg 2cfb0 <.literal16+0x340>
+ .byte 119,115 // ja 2d025 <.literal16+0x3b5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -55129,7 +55131,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 2cfa9 <.literal16+0x319>
+ .byte 117,191 // jne 2cf89 <.literal16+0x319>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -55141,7 +55143,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a60fea <_sk_overlay_sse2_8bit+0xffffffffe9a35212>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a60fca <_sk_overlay_sse2_8bit+0xffffffffe9a35206>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -55231,16 +55233,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2d133 <.literal16+0x4a3>
+ .byte 118,63 // jbe 2d113 <.literal16+0x4a3>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2d137 <.literal16+0x4a7>
+ .byte 118,63 // jbe 2d117 <.literal16+0x4a7>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2d13b <.literal16+0x4ab>
+ .byte 118,63 // jbe 2d11b <.literal16+0x4ab>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2d13f <.literal16+0x4af>
+ .byte 118,63 // jbe 2d11f <.literal16+0x4af>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -55261,13 +55263,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 2d176 <.literal16+0x4e6>
+ .byte 124,66 // jl 2d156 <.literal16+0x4e6>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2d17a <.literal16+0x4ea>
+ .byte 124,66 // jl 2d15a <.literal16+0x4ea>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2d17e <.literal16+0x4ee>
+ .byte 124,66 // jl 2d15e <.literal16+0x4ee>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2d182 <.literal16+0x4f2>
+ .byte 124,66 // jl 2d162 <.literal16+0x4f2>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -55313,13 +55315,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2d205 <.literal16+0x575>
+ .byte 112,65 // jo 2d1e5 <.literal16+0x575>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2d209 <.literal16+0x579>
+ .byte 112,65 // jo 2d1e9 <.literal16+0x579>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2d20d <.literal16+0x57d>
+ .byte 112,65 // jo 2d1ed <.literal16+0x57d>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2d211 <.literal16+0x581>
+ .byte 112,65 // jo 2d1f1 <.literal16+0x581>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -55358,13 +55360,13 @@ BALIGN16
.byte 64,254 // rex (bad)
.byte 255,0 // incl (%rax)
.byte 255 // (bad)
- .byte 127,71 // jg 2d27b <.literal16+0x5eb>
+ .byte 127,71 // jg 2d25b <.literal16+0x5eb>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2d27f <.literal16+0x5ef>
+ .byte 127,71 // jg 2d25f <.literal16+0x5ef>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2d283 <.literal16+0x5f3>
+ .byte 127,71 // jg 2d263 <.literal16+0x5f3>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2d287 <.literal16+0x5f7>
+ .byte 127,71 // jg 2d267 <.literal16+0x5f7>
.byte 208 // (bad)
.byte 179,89 // mov $0x59,%bl
.byte 62,208 // ds (bad)
@@ -55394,10 +55396,10 @@ BALIGN16
.byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax
.byte 152 // cwtl
.byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx)
- .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc2e38a <_sk_overlay_sse2_8bit+0x2dc025b2>
+ .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc2e36a <_sk_overlay_sse2_8bit+0x2dc025a6>
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 2d2bc <.literal16+0x62c>
+ .byte 120,57 // js 2d29c <.literal16+0x62c>
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
@@ -55462,13 +55464,13 @@ BALIGN16
.byte 192,191,0,0,192,191,0 // sarb $0x0,-0x40400000(%rdi)
.byte 0,192 // add %al,%al
.byte 191,0,0,192,191 // mov $0xbfc00000,%edi
- .byte 114,28 // jb 2d36e <.literal16+0x6de>
+ .byte 114,28 // jb 2d34e <.literal16+0x6de>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2d372 <.literal16+0x6e2>
+ .byte 62,114,28 // jb,pt 2d352 <.literal16+0x6e2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2d376 <.literal16+0x6e6>
+ .byte 62,114,28 // jb,pt 2d356 <.literal16+0x6e6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2d37a <.literal16+0x6ea>
+ .byte 62,114,28 // jb,pt 2d35a <.literal16+0x6ea>
.byte 199 // (bad)
.byte 62,85 // ds push %rbp
.byte 85 // push %rbp
@@ -55487,15 +55489,15 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6661c5 <_sk_overlay_sse2_8bit+0x3d63a3ed>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6661a5 <_sk_overlay_sse2_8bit+0x3d63a3e1>
.byte 57,142,99,61,114,249 // cmp %ecx,-0x68dc29d(%rsi)
- .byte 127,63 // jg 2d3d3 <.literal16+0x743>
- .byte 114,249 // jb 2d38f <.literal16+0x6ff>
- .byte 127,63 // jg 2d3d7 <.literal16+0x747>
- .byte 114,249 // jb 2d393 <.literal16+0x703>
- .byte 127,63 // jg 2d3db <.literal16+0x74b>
- .byte 114,249 // jb 2d397 <.literal16+0x707>
- .byte 127,63 // jg 2d3df <.literal16+0x74f>
+ .byte 127,63 // jg 2d3b3 <.literal16+0x743>
+ .byte 114,249 // jb 2d36f <.literal16+0x6ff>
+ .byte 127,63 // jg 2d3b7 <.literal16+0x747>
+ .byte 114,249 // jb 2d373 <.literal16+0x703>
+ .byte 127,63 // jg 2d3bb <.literal16+0x74b>
+ .byte 114,249 // jb 2d377 <.literal16+0x707>
+ .byte 127,63 // jg 2d3bf <.literal16+0x74f>
.byte 3,0 // add (%rax),%eax
.byte 0,0 // add %al,(%rax)
.byte 3,0 // add (%rax),%eax
@@ -55649,14 +55651,14 @@ BALIGN16
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,0 // incl (%rax)
- .byte 127,0 // jg 2d4d2 <.literal16+0x842>
- .byte 127,0 // jg 2d4d4 <.literal16+0x844>
- .byte 127,0 // jg 2d4d6 <.literal16+0x846>
- .byte 127,0 // jg 2d4d8 <.literal16+0x848>
- .byte 127,0 // jg 2d4da <.literal16+0x84a>
- .byte 127,0 // jg 2d4dc <.literal16+0x84c>
- .byte 127,0 // jg 2d4de <.literal16+0x84e>
- .byte 127,0 // jg 2d4e0 <.literal16+0x850>
+ .byte 127,0 // jg 2d4b2 <.literal16+0x842>
+ .byte 127,0 // jg 2d4b4 <.literal16+0x844>
+ .byte 127,0 // jg 2d4b6 <.literal16+0x846>
+ .byte 127,0 // jg 2d4b8 <.literal16+0x848>
+ .byte 127,0 // jg 2d4ba <.literal16+0x84a>
+ .byte 127,0 // jg 2d4bc <.literal16+0x84c>
+ .byte 127,0 // jg 2d4be <.literal16+0x84e>
+ .byte 127,0 // jg 2d4c0 <.literal16+0x850>
.byte 129,128,129,128,129,128,129,128,129,128// addl $0x80818081,-0x7f7e7f7f(%rax)
.byte 129 // .byte 0x81
.byte 128 // .byte 0x80
@@ -55751,13 +55753,11 @@ _sk_seed_shader_sse2:
.byte 102,15,110,2 // movd (%edx),%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,144,140,207,0,0 // movaps 0xcf8c(%eax),%xmm2
- .byte 15,88,194 // addps %xmm2,%xmm0
- .byte 15,88,128,156,207,0,0 // addps 0xcf9c(%eax),%xmm0
+ .byte 15,88,128,140,207,0,0 // addps 0xcf8c(%eax),%xmm0
.byte 102,15,110,74,4 // movd 0x4(%edx),%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,88,202 // addps %xmm2,%xmm1
+ .byte 15,88,136,156,207,0,0 // addps 0xcf9c(%eax),%xmm1
.byte 141,113,4 // lea 0x4(%ecx),%esi
.byte 15,87,210 // xorps %xmm2,%xmm2
.byte 15,41,82,64 // movaps %xmm2,0x40(%edx)
@@ -55787,25 +55787,25 @@ _sk_dither_sse2:
.byte 15,41,85,232 // movaps %xmm2,-0x18(%ebp)
.byte 15,40,217 // movaps %xmm1,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 10f <_sk_dither_sse2+0x1a>
+ .byte 232,0,0,0,0 // call 109 <_sk_dither_sse2+0x1a>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 102,15,110,32 // movd (%eax),%xmm4
.byte 102,15,112,236,0 // pshufd $0x0,%xmm4,%xmm5
- .byte 102,15,254,169,65,207,0,0 // paddd 0xcf41(%ecx),%xmm5
+ .byte 102,15,254,169,71,207,0,0 // paddd 0xcf47(%ecx),%xmm5
.byte 102,15,110,96,4 // movd 0x4(%eax),%xmm4
.byte 102,15,112,252,0 // pshufd $0x0,%xmm4,%xmm7
.byte 102,15,239,253 // pxor %xmm5,%xmm7
- .byte 102,15,111,177,81,207,0,0 // movdqa 0xcf51(%ecx),%xmm6
+ .byte 102,15,111,177,87,207,0,0 // movdqa 0xcf57(%ecx),%xmm6
.byte 102,15,111,207 // movdqa %xmm7,%xmm1
.byte 102,15,219,206 // pand %xmm6,%xmm1
.byte 102,15,219,245 // pand %xmm5,%xmm6
- .byte 102,15,111,129,113,207,0,0 // movdqa 0xcf71(%ecx),%xmm0
+ .byte 102,15,111,129,119,207,0,0 // movdqa 0xcf77(%ecx),%xmm0
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,219,224 // pand %xmm0,%xmm4
.byte 102,15,219,197 // pand %xmm5,%xmm0
- .byte 102,15,219,185,97,207,0,0 // pand 0xcf61(%ecx),%xmm7
- .byte 102,15,219,169,97,207,0,0 // pand 0xcf61(%ecx),%xmm5
+ .byte 102,15,219,185,103,207,0,0 // pand 0xcf67(%ecx),%xmm7
+ .byte 102,15,219,169,103,207,0,0 // pand 0xcf67(%ecx),%xmm5
.byte 102,15,114,246,4 // pslld $0x4,%xmm6
.byte 102,15,254,192 // paddd %xmm0,%xmm0
.byte 102,15,235,198 // por %xmm6,%xmm0
@@ -55820,8 +55820,8 @@ _sk_dither_sse2:
.byte 102,15,114,215,1 // psrld $0x1,%xmm7
.byte 102,15,235,231 // por %xmm7,%xmm4
.byte 15,91,196 // cvtdq2ps %xmm4,%xmm0
- .byte 15,89,129,129,207,0,0 // mulps 0xcf81(%ecx),%xmm0
- .byte 15,88,129,145,207,0,0 // addps 0xcf91(%ecx),%xmm0
+ .byte 15,89,129,135,207,0,0 // mulps 0xcf87(%ecx),%xmm0
+ .byte 15,88,129,151,207,0,0 // addps 0xcf97(%ecx),%xmm0
.byte 243,15,16,14 // movss (%esi),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
@@ -55884,12 +55884,12 @@ _sk_black_color_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 24b <_sk_black_color_sse2+0xb>
+ .byte 232,0,0,0,0 // call 245 <_sk_black_color_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,152,245,205,0,0 // movaps 0xcdf5(%eax),%xmm3
+ .byte 15,40,152,251,205,0,0 // movaps 0xcdfb(%eax),%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -55907,12 +55907,12 @@ _sk_white_color_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 27b <_sk_white_color_sse2+0xb>
+ .byte 232,0,0,0,0 // call 275 <_sk_white_color_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,128,197,205,0,0 // movaps 0xcdc5(%eax),%xmm0
+ .byte 15,40,128,203,205,0,0 // movaps 0xcdcb(%eax),%xmm0
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -55996,13 +55996,13 @@ _sk_srcatop_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 32a <_sk_srcatop_sse2+0xb>
+ .byte 232,0,0,0,0 // call 324 <_sk_srcatop_sse2+0xb>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,97,64 // movaps 0x40(%ecx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,170,22,205,0,0 // movaps 0xcd16(%edx),%xmm5
+ .byte 15,40,170,28,205,0,0 // movaps 0xcd1c(%edx),%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
@@ -56034,14 +56034,14 @@ _sk_dstatop_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 389 <_sk_dstatop_sse2+0xb>
+ .byte 232,0,0,0,0 // call 383 <_sk_dstatop_sse2+0xb>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
.byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
- .byte 15,40,162,183,204,0,0 // movaps 0xccb7(%edx),%xmm4
+ .byte 15,40,162,189,204,0,0 // movaps 0xccbd(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,198 // addps %xmm6,%xmm0
@@ -56121,11 +56121,11 @@ _sk_srcout_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 44a <_sk_srcout_sse2+0xb>
+ .byte 232,0,0,0,0 // call 444 <_sk_srcout_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,246,203,0,0 // movaps 0xcbf6(%eax),%xmm4
+ .byte 15,40,160,252,203,0,0 // movaps 0xcbfc(%eax),%xmm4
.byte 15,92,98,64 // subps 0x40(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
@@ -56147,11 +56147,11 @@ _sk_dstout_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 482 <_sk_dstout_sse2+0xb>
+ .byte 232,0,0,0,0 // call 47c <_sk_dstout_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,190,203,0,0 // movaps 0xcbbe(%eax),%xmm4
+ .byte 15,40,160,196,203,0,0 // movaps 0xcbc4(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
.byte 15,40,66,16 // movaps 0x10(%edx),%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -56177,11 +56177,11 @@ _sk_srcover_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 4c9 <_sk_srcover_sse2+0xb>
+ .byte 232,0,0,0,0 // call 4c3 <_sk_srcover_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,119,203,0,0 // movaps 0xcb77(%eax),%xmm4
+ .byte 15,40,160,125,203,0,0 // movaps 0xcb7d(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
.byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -56210,12 +56210,12 @@ _sk_dstover_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 519 <_sk_dstover_sse2+0xb>
+ .byte 232,0,0,0,0 // call 513 <_sk_dstover_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,40,106,64 // movaps 0x40(%edx),%xmm5
- .byte 15,40,160,39,203,0,0 // movaps 0xcb27(%eax),%xmm4
+ .byte 15,40,160,45,203,0,0 // movaps 0xcb2d(%eax),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,66,16 // addps 0x10(%edx),%xmm0
@@ -56266,12 +56266,12 @@ _sk_multiply_sse2:
.byte 131,236,56 // sub $0x38,%esp
.byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp)
.byte 15,40,232 // movaps %xmm0,%xmm5
- .byte 232,0,0,0,0 // call 598 <_sk_multiply_sse2+0x12>
+ .byte 232,0,0,0,0 // call 592 <_sk_multiply_sse2+0x12>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
.byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
- .byte 15,40,129,168,202,0,0 // movaps 0xcaa8(%ecx),%xmm0
+ .byte 15,40,129,174,202,0,0 // movaps 0xcaae(%ecx),%xmm0
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
@@ -56326,12 +56326,12 @@ _sk_plus__sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 63e <_sk_plus__sse2+0xb>
+ .byte 232,0,0,0,0 // call 638 <_sk_plus__sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,88,66,16 // addps 0x10(%edx),%xmm0
- .byte 15,40,160,2,202,0,0 // movaps 0xca02(%eax),%xmm4
+ .byte 15,40,160,8,202,0,0 // movaps 0xca08(%eax),%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
.byte 15,88,74,32 // addps 0x20(%edx),%xmm1
.byte 15,93,204 // minps %xmm4,%xmm1
@@ -56398,12 +56398,12 @@ _sk_xor__sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 232,0,0,0,0 // call 6ec <_sk_xor__sse2+0xe>
+ .byte 232,0,0,0,0 // call 6e6 <_sk_xor__sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
- .byte 15,40,154,84,201,0,0 // movaps 0xc954(%edx),%xmm3
+ .byte 15,40,154,90,201,0,0 // movaps 0xc95a(%edx),%xmm3
.byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 15,89,198 // mulps %xmm6,%xmm0
@@ -56439,7 +56439,7 @@ _sk_darken_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 754 <_sk_darken_sse2+0xe>
+ .byte 232,0,0,0,0 // call 74e <_sk_darken_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56465,7 +56465,7 @@ _sk_darken_sse2:
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,95,209 // maxps %xmm1,%xmm2
.byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,138,236,200,0,0 // movaps 0xc8ec(%edx),%xmm1
+ .byte 15,40,138,242,200,0,0 // movaps 0xc8f2(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -56488,7 +56488,7 @@ _sk_lighten_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 7d4 <_sk_lighten_sse2+0xe>
+ .byte 232,0,0,0,0 // call 7ce <_sk_lighten_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56514,7 +56514,7 @@ _sk_lighten_sse2:
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,93,209 // minps %xmm1,%xmm2
.byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,138,108,200,0,0 // movaps 0xc86c(%edx),%xmm1
+ .byte 15,40,138,114,200,0,0 // movaps 0xc872(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -56538,7 +56538,7 @@ _sk_difference_sse2:
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,225 // movaps %xmm1,%xmm4
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 857 <_sk_difference_sse2+0x11>
+ .byte 232,0,0,0,0 // call 851 <_sk_difference_sse2+0x11>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56567,7 +56567,7 @@ _sk_difference_sse2:
.byte 15,93,214 // minps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,146,233,199,0,0 // movaps 0xc7e9(%edx),%xmm2
+ .byte 15,40,146,239,199,0,0 // movaps 0xc7ef(%edx),%xmm2
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -56589,7 +56589,7 @@ _sk_exclusion_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 8dd <_sk_exclusion_sse2+0xe>
+ .byte 232,0,0,0,0 // call 8d7 <_sk_exclusion_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56611,7 +56611,7 @@ _sk_exclusion_sse2:
.byte 15,89,202 // mulps %xmm2,%xmm1
.byte 15,88,201 // addps %xmm1,%xmm1
.byte 15,92,233 // subps %xmm1,%xmm5
- .byte 15,40,138,99,199,0,0 // movaps 0xc763(%edx),%xmm1
+ .byte 15,40,138,105,199,0,0 // movaps 0xc769(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,73,64 // mulps 0x40(%ecx),%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -56637,7 +56637,7 @@ _sk_colorburn_sse2:
.byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 95c <_sk_colorburn_sse2+0x19>
+ .byte 232,0,0,0,0 // call 956 <_sk_colorburn_sse2+0x19>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
@@ -56652,7 +56652,7 @@ _sk_colorburn_sse2:
.byte 15,93,198 // minps %xmm6,%xmm0
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,92,232 // subps %xmm0,%xmm5
- .byte 15,40,177,228,198,0,0 // movaps 0xc6e4(%ecx),%xmm6
+ .byte 15,40,177,234,198,0,0 // movaps 0xc6ea(%ecx),%xmm6
.byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
@@ -56765,11 +56765,11 @@ _sk_colordodge_sse2:
.byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
.byte 15,41,77,232 // movaps %xmm1,-0x18(%ebp)
- .byte 232,0,0,0,0 // call ae5 <_sk_colordodge_sse2+0x16>
+ .byte 232,0,0,0,0 // call adf <_sk_colordodge_sse2+0x16>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,16 // movaps 0x10(%eax),%xmm1
- .byte 15,40,145,91,197,0,0 // movaps 0xc55b(%ecx),%xmm2
+ .byte 15,40,145,97,197,0,0 // movaps 0xc561(%ecx),%xmm2
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 15,40,250 // movaps %xmm2,%xmm7
@@ -56882,11 +56882,11 @@ _sk_hardlight_sse2:
.byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp)
.byte 15,41,77,232 // movaps %xmm1,-0x18(%ebp)
- .byte 232,0,0,0,0 // call c46 <_sk_hardlight_sse2+0x16>
+ .byte 232,0,0,0,0 // call c40 <_sk_hardlight_sse2+0x16>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
- .byte 15,40,145,250,195,0,0 // movaps 0xc3fa(%ecx),%xmm2
+ .byte 15,40,145,0,196,0,0 // movaps 0xc400(%ecx),%xmm2
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,40,225 // movaps %xmm1,%xmm4
@@ -56992,11 +56992,11 @@ _sk_overlay_sse2:
.byte 15,41,85,152 // movaps %xmm2,-0x68(%ebp)
.byte 15,41,77,168 // movaps %xmm1,-0x58(%ebp)
.byte 15,40,232 // movaps %xmm0,%xmm5
- .byte 232,0,0,0,0 // call d91 <_sk_overlay_sse2+0x1a>
+ .byte 232,0,0,0,0 // call d8b <_sk_overlay_sse2+0x1a>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
- .byte 15,40,161,175,194,0,0 // movaps 0xc2af(%ecx),%xmm4
+ .byte 15,40,161,181,194,0,0 // movaps 0xc2b5(%ecx),%xmm4
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
@@ -57121,20 +57121,20 @@ _sk_softlight_sse2:
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
.byte 15,88,241 // addps %xmm1,%xmm6
- .byte 232,0,0,0,0 // call f21 <_sk_softlight_sse2+0x52>
+ .byte 232,0,0,0,0 // call f1b <_sk_softlight_sse2+0x52>
.byte 89 // pop %ecx
.byte 15,40,194 // movaps %xmm2,%xmm0
- .byte 15,40,137,143,193,0,0 // movaps 0xc18f(%ecx),%xmm1
+ .byte 15,40,137,149,193,0,0 // movaps 0xc195(%ecx),%xmm1
.byte 15,41,141,104,255,255,255 // movaps %xmm1,-0x98(%ebp)
.byte 15,88,193 // addps %xmm1,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,185,31,193,0,0 // movaps 0xc11f(%ecx),%xmm7
+ .byte 15,40,185,37,193,0,0 // movaps 0xc125(%ecx),%xmm7
.byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,92,250 // subps %xmm2,%xmm7
.byte 15,82,242 // rsqrtps %xmm2,%xmm6
.byte 15,83,206 // rcpps %xmm6,%xmm1
.byte 15,92,202 // subps %xmm2,%xmm1
- .byte 15,40,161,159,193,0,0 // movaps 0xc19f(%ecx),%xmm4
+ .byte 15,40,161,165,193,0,0 // movaps 0xc1a5(%ecx),%xmm4
.byte 15,41,101,152 // movaps %xmm4,-0x68(%ebp)
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
@@ -57330,7 +57330,7 @@ _sk_hue_sse2:
.byte 15,93,200 // minps %xmm0,%xmm1
.byte 15,92,225 // subps %xmm1,%xmm4
.byte 15,41,101,168 // movaps %xmm4,-0x58(%ebp)
- .byte 232,0,0,0,0 // call 11e2 <_sk_hue_sse2+0x4f>
+ .byte 232,0,0,0,0 // call 11dc <_sk_hue_sse2+0x4f>
.byte 89 // pop %ecx
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,40,197 // movaps %xmm5,%xmm0
@@ -57340,7 +57340,7 @@ _sk_hue_sse2:
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
- .byte 15,40,169,94,190,0,0 // movaps 0xbe5e(%ecx),%xmm5
+ .byte 15,40,169,100,190,0,0 // movaps 0xbe64(%ecx),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
@@ -57373,17 +57373,17 @@ _sk_hue_sse2:
.byte 15,89,233 // mulps %xmm1,%xmm5
.byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp)
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,153,238,190,0,0 // movaps 0xbeee(%ecx),%xmm3
+ .byte 15,40,153,244,190,0,0 // movaps 0xbef4(%ecx),%xmm3
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,117,152 // movaps -0x68(%ebp),%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
.byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,40,153,254,190,0,0 // movaps 0xbefe(%ecx),%xmm3
+ .byte 15,40,153,4,191,0,0 // movaps 0xbf04(%ecx),%xmm3
.byte 15,40,109,136 // movaps -0x78(%ebp),%xmm5
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,89,251 // mulps %xmm3,%xmm7
.byte 15,88,249 // addps %xmm1,%xmm7
- .byte 15,40,137,94,190,0,0 // movaps 0xbe5e(%ecx),%xmm1
+ .byte 15,40,137,100,190,0,0 // movaps 0xbe64(%ecx),%xmm1
.byte 15,92,77,184 // subps -0x48(%ebp),%xmm1
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 15,41,117,152 // movaps %xmm6,-0x68(%ebp)
@@ -57393,7 +57393,7 @@ _sk_hue_sse2:
.byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 15,41,117,168 // movaps %xmm6,-0x58(%ebp)
- .byte 15,40,169,14,191,0,0 // movaps 0xbf0e(%ecx),%xmm5
+ .byte 15,40,169,20,191,0,0 // movaps 0xbf14(%ecx),%xmm5
.byte 15,89,205 // mulps %xmm5,%xmm1
.byte 15,88,207 // addps %xmm7,%xmm1
.byte 15,94,212 // divps %xmm4,%xmm2
@@ -57584,19 +57584,19 @@ _sk_saturation_sse2:
.byte 15,89,221 // mulps %xmm5,%xmm3
.byte 15,40,211 // movaps %xmm3,%xmm2
.byte 15,89,253 // mulps %xmm5,%xmm7
- .byte 232,0,0,0,0 // call 1536 <_sk_saturation_sse2+0xb0>
+ .byte 232,0,0,0,0 // call 1530 <_sk_saturation_sse2+0xb0>
.byte 89 // pop %ecx
- .byte 15,40,153,154,187,0,0 // movaps 0xbb9a(%ecx),%xmm3
+ .byte 15,40,153,160,187,0,0 // movaps 0xbba0(%ecx),%xmm3
.byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
.byte 15,40,77,184 // movaps -0x48(%ebp),%xmm1
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,40,153,170,187,0,0 // movaps 0xbbaa(%ecx),%xmm3
+ .byte 15,40,153,176,187,0,0 // movaps 0xbbb0(%ecx),%xmm3
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,238 // movaps %xmm6,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,129,10,187,0,0 // movaps 0xbb0a(%ecx),%xmm0
+ .byte 15,40,129,16,187,0,0 // movaps 0xbb10(%ecx),%xmm0
.byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
.byte 15,92,69,216 // subps -0x28(%ebp),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
@@ -57608,7 +57608,7 @@ _sk_saturation_sse2:
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,41,141,120,255,255,255 // movaps %xmm1,-0x88(%ebp)
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 15,40,129,186,187,0,0 // movaps 0xbbba(%ecx),%xmm0
+ .byte 15,40,129,192,187,0,0 // movaps 0xbbc0(%ecx),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,40,109,168 // movaps -0x58(%ebp),%xmm5
@@ -57762,21 +57762,21 @@ _sk_color_sse2:
.byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp)
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp)
- .byte 232,0,0,0,0 // call 1791 <_sk_color_sse2+0x2a>
+ .byte 232,0,0,0,0 // call 178b <_sk_color_sse2+0x2a>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,16 // movaps 0x10(%eax),%xmm2
.byte 15,40,72,32 // movaps 0x20(%eax),%xmm1
- .byte 15,40,177,63,185,0,0 // movaps 0xb93f(%ecx),%xmm6
+ .byte 15,40,177,69,185,0,0 // movaps 0xb945(%ecx),%xmm6
.byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,153,79,185,0,0 // movaps 0xb94f(%ecx),%xmm3
+ .byte 15,40,153,85,185,0,0 // movaps 0xb955(%ecx),%xmm3
.byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 15,40,129,175,184,0,0 // movaps 0xb8af(%ecx),%xmm0
+ .byte 15,40,129,181,184,0,0 // movaps 0xb8b5(%ecx),%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
.byte 15,92,69,200 // subps -0x38(%ebp),%xmm0
.byte 15,89,208 // mulps %xmm0,%xmm2
@@ -57786,7 +57786,7 @@ _sk_color_sse2:
.byte 15,40,80,48 // movaps 0x30(%eax),%xmm2
.byte 15,89,194 // mulps %xmm2,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
- .byte 15,40,137,95,185,0,0 // movaps 0xb95f(%ecx),%xmm1
+ .byte 15,40,137,101,185,0,0 // movaps 0xb965(%ecx),%xmm1
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,88,214 // addps %xmm6,%xmm2
.byte 15,40,88,64 // movaps 0x40(%eax),%xmm3
@@ -57942,21 +57942,21 @@ _sk_luminosity_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 129,236,184,0,0,0 // sub $0xb8,%esp
.byte 15,40,242 // movaps %xmm2,%xmm6
- .byte 232,0,0,0,0 // call 19f4 <_sk_luminosity_sse2+0x11>
+ .byte 232,0,0,0,0 // call 19ee <_sk_luminosity_sse2+0x11>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 15,40,161,220,182,0,0 // movaps 0xb6dc(%ecx),%xmm4
+ .byte 15,40,161,226,182,0,0 // movaps 0xb6e2(%ecx),%xmm4
.byte 15,41,101,232 // movaps %xmm4,-0x18(%ebp)
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 15,40,161,236,182,0,0 // movaps 0xb6ec(%ecx),%xmm4
+ .byte 15,40,161,242,182,0,0 // movaps 0xb6f2(%ecx),%xmm4
.byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,88,234 // addps %xmm2,%xmm5
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
.byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp)
- .byte 15,40,161,76,182,0,0 // movaps 0xb64c(%ecx),%xmm4
+ .byte 15,40,161,82,182,0,0 // movaps 0xb652(%ecx),%xmm4
.byte 15,40,252 // movaps %xmm4,%xmm7
.byte 15,92,250 // subps %xmm2,%xmm7
.byte 15,89,199 // mulps %xmm7,%xmm0
@@ -57966,7 +57966,7 @@ _sk_luminosity_sse2:
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,41,189,104,255,255,255 // movaps %xmm7,-0x98(%ebp)
.byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 15,40,137,252,182,0,0 // movaps 0xb6fc(%ecx),%xmm1
+ .byte 15,40,137,2,183,0,0 // movaps 0xb702(%ecx),%xmm1
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,88,213 // addps %xmm5,%xmm2
.byte 15,40,104,16 // movaps 0x10(%eax),%xmm5
@@ -58128,7 +58128,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 131,236,44 // sub $0x2c,%esp
.byte 102,15,127,85,200 // movdqa %xmm2,-0x38(%ebp)
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
- .byte 232,0,0,0,0 // call 1c5f <_sk_srcover_rgba_8888_sse2+0x17>
+ .byte 232,0,0,0,0 // call 1c59 <_sk_srcover_rgba_8888_sse2+0x17>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -58140,9 +58140,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,133,224,0,0,0 // jne 1d61 <_sk_srcover_rgba_8888_sse2+0x119>
+ .byte 15,133,224,0,0,0 // jne 1d5b <_sk_srcover_rgba_8888_sse2+0x119>
.byte 243,15,111,20,178 // movdqu (%edx,%esi,4),%xmm2
- .byte 102,15,111,167,161,180,0,0 // movdqa 0xb4a1(%edi),%xmm4
+ .byte 102,15,111,167,167,180,0,0 // movdqa 0xb4a7(%edi),%xmm4
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,242 // movdqa %xmm2,%xmm6
@@ -58153,9 +58153,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,219,252 // pand %xmm4,%xmm7
.byte 15,91,229 // cvtdq2ps %xmm5,%xmm4
.byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
- .byte 15,40,175,225,179,0,0 // movaps 0xb3e1(%edi),%xmm5
+ .byte 15,40,175,231,179,0,0 // movaps 0xb3e7(%edi),%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
- .byte 15,40,143,177,180,0,0 // movaps 0xb4b1(%edi),%xmm1
+ .byte 15,40,143,183,180,0,0 // movaps 0xb4b7(%edi),%xmm1
.byte 15,89,193 // mulps %xmm1,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,88,224 // addps %xmm0,%xmm4
@@ -58188,7 +58188,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 102,15,235,193 // por %xmm1,%xmm0
.byte 133,219 // test %ebx,%ebx
- .byte 117,95 // jne 1d9c <_sk_srcover_rgba_8888_sse2+0x154>
+ .byte 117,95 // jne 1d96 <_sk_srcover_rgba_8888_sse2+0x154>
.byte 243,15,127,4,178 // movdqu %xmm0,(%edx,%esi,4)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -58209,33 +58209,33 @@ _sk_srcover_rgba_8888_sse2:
.byte 136,69,243 // mov %al,-0xd(%ebp)
.byte 128,101,243,3 // andb $0x3,-0xd(%ebp)
.byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp)
- .byte 116,80 // je 1dc0 <_sk_srcover_rgba_8888_sse2+0x178>
+ .byte 116,80 // je 1dba <_sk_srcover_rgba_8888_sse2+0x178>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp)
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 116,21 // je 1d92 <_sk_srcover_rgba_8888_sse2+0x14a>
+ .byte 116,21 // je 1d8c <_sk_srcover_rgba_8888_sse2+0x14a>
.byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp)
- .byte 15,133,255,254,255,255 // jne 1c86 <_sk_srcover_rgba_8888_sse2+0x3e>
+ .byte 15,133,255,254,255,255 // jne 1c80 <_sk_srcover_rgba_8888_sse2+0x3e>
.byte 102,15,110,84,178,8 // movd 0x8(%edx,%esi,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,15,18,20,178 // movlpd (%edx,%esi,4),%xmm2
- .byte 233,234,254,255,255 // jmp 1c86 <_sk_srcover_rgba_8888_sse2+0x3e>
+ .byte 233,234,254,255,255 // jmp 1c80 <_sk_srcover_rgba_8888_sse2+0x3e>
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,41 // je 1dcd <_sk_srcover_rgba_8888_sse2+0x185>
+ .byte 116,41 // je 1dc7 <_sk_srcover_rgba_8888_sse2+0x185>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 1db9 <_sk_srcover_rgba_8888_sse2+0x171>
+ .byte 116,16 // je 1db3 <_sk_srcover_rgba_8888_sse2+0x171>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,148 // jne 1d42 <_sk_srcover_rgba_8888_sse2+0xfa>
+ .byte 117,148 // jne 1d3c <_sk_srcover_rgba_8888_sse2+0xfa>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,15,126,76,178,8 // movd %xmm1,0x8(%edx,%esi,4)
.byte 102,15,214,4,178 // movq %xmm0,(%edx,%esi,4)
- .byte 235,130 // jmp 1d42 <_sk_srcover_rgba_8888_sse2+0xfa>
+ .byte 235,130 // jmp 1d3c <_sk_srcover_rgba_8888_sse2+0xfa>
.byte 102,15,110,20,178 // movd (%edx,%esi,4),%xmm2
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 233,185,254,255,255 // jmp 1c86 <_sk_srcover_rgba_8888_sse2+0x3e>
+ .byte 233,185,254,255,255 // jmp 1c80 <_sk_srcover_rgba_8888_sse2+0x3e>
.byte 102,15,126,4,178 // movd %xmm0,(%edx,%esi,4)
- .byte 233,107,255,255,255 // jmp 1d42 <_sk_srcover_rgba_8888_sse2+0xfa>
+ .byte 233,107,255,255,255 // jmp 1d3c <_sk_srcover_rgba_8888_sse2+0xfa>
HIDDEN _sk_clamp_0_sse2
.globl _sk_clamp_0_sse2
@@ -58266,10 +58266,10 @@ _sk_clamp_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 1e0b <_sk_clamp_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 1e05 <_sk_clamp_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,160,53,178,0,0 // movaps 0xb235(%eax),%xmm4
+ .byte 15,40,160,59,178,0,0 // movaps 0xb23b(%eax),%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
.byte 15,93,204 // minps %xmm4,%xmm1
.byte 15,93,212 // minps %xmm4,%xmm2
@@ -58290,10 +58290,10 @@ _sk_clamp_a_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 1e3e <_sk_clamp_a_sse2+0xb>
+ .byte 232,0,0,0,0 // call 1e38 <_sk_clamp_a_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,93,152,2,178,0,0 // minps 0xb202(%eax),%xmm3
+ .byte 15,93,152,8,178,0,0 // minps 0xb208(%eax),%xmm3
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -58313,12 +58313,12 @@ _sk_clamp_a_dst_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 1e6e <_sk_clamp_a_dst_sse2+0xb>
+ .byte 232,0,0,0,0 // call 1e68 <_sk_clamp_a_dst_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,40,98,64 // movaps 0x40(%edx),%xmm4
- .byte 15,93,160,210,177,0,0 // minps 0xb1d2(%eax),%xmm4
+ .byte 15,93,160,216,177,0,0 // minps 0xb1d8(%eax),%xmm4
.byte 15,41,98,64 // movaps %xmm4,0x40(%edx)
.byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,93,236 // minps %xmm4,%xmm5
@@ -58389,10 +58389,10 @@ _sk_invert_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 1f19 <_sk_invert_sse2+0xb>
+ .byte 232,0,0,0,0 // call 1f13 <_sk_invert_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,160,39,177,0,0 // movaps 0xb127(%eax),%xmm4
+ .byte 15,40,160,45,177,0,0 // movaps 0xb12d(%eax),%xmm4
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,92,232 // subps %xmm0,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
@@ -58511,11 +58511,11 @@ _sk_unpremul_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 2017 <_sk_unpremul_sse2+0xb>
+ .byte 232,0,0,0,0 // call 2011 <_sk_unpremul_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 15,40,168,41,176,0,0 // movaps 0xb029(%eax),%xmm5
+ .byte 15,40,168,47,176,0,0 // movaps 0xb02f(%eax),%xmm5
.byte 15,94,235 // divps %xmm3,%xmm5
.byte 15,194,227,4 // cmpneqps %xmm3,%xmm4
.byte 15,84,229 // andps %xmm5,%xmm4
@@ -58542,23 +58542,23 @@ _sk_from_srgb_sse2:
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,40,217 // movaps %xmm1,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 2061 <_sk_from_srgb_sse2+0x18>
+ .byte 232,0,0,0,0 // call 205b <_sk_from_srgb_sse2+0x18>
.byte 88 // pop %eax
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,201 // mulps %xmm1,%xmm1
- .byte 15,40,160,111,176,0,0 // movaps 0xb06f(%eax),%xmm4
+ .byte 15,40,160,117,176,0,0 // movaps 0xb075(%eax),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,176,207,176,0,0 // movaps 0xb0cf(%eax),%xmm6
+ .byte 15,40,176,213,176,0,0 // movaps 0xb0d5(%eax),%xmm6
.byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,176,191,176,0,0 // movaps 0xb0bf(%eax),%xmm6
+ .byte 15,40,176,197,176,0,0 // movaps 0xb0c5(%eax),%xmm6
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,184,223,176,0,0 // movaps 0xb0df(%eax),%xmm7
+ .byte 15,40,184,229,176,0,0 // movaps 0xb0e5(%eax),%xmm7
.byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,184,239,176,0,0 // movaps 0xb0ef(%eax),%xmm7
+ .byte 15,40,184,245,176,0,0 // movaps 0xb0f5(%eax),%xmm7
.byte 15,194,215,1 // cmpltps %xmm7,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -58612,24 +58612,24 @@ _sk_from_srgb_dst_sse2:
.byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
.byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp)
- .byte 232,0,0,0,0 // call 213c <_sk_from_srgb_dst_sse2+0x1b>
+ .byte 232,0,0,0,0 // call 2136 <_sk_from_srgb_dst_sse2+0x1b>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,16 // movaps 0x10(%eax),%xmm1
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,40,161,148,175,0,0 // movaps 0xaf94(%ecx),%xmm4
+ .byte 15,40,161,154,175,0,0 // movaps 0xaf9a(%ecx),%xmm4
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,177,244,175,0,0 // movaps 0xaff4(%ecx),%xmm6
+ .byte 15,40,177,250,175,0,0 // movaps 0xaffa(%ecx),%xmm6
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,169,228,175,0,0 // movaps 0xafe4(%ecx),%xmm5
+ .byte 15,40,169,234,175,0,0 // movaps 0xafea(%ecx),%xmm5
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,40,185,4,176,0,0 // movaps 0xb004(%ecx),%xmm7
+ .byte 15,40,185,10,176,0,0 // movaps 0xb00a(%ecx),%xmm7
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,153,20,176,0,0 // movaps 0xb014(%ecx),%xmm3
+ .byte 15,40,153,26,176,0,0 // movaps 0xb01a(%ecx),%xmm3
.byte 15,194,203,1 // cmpltps %xmm3,%xmm1
.byte 15,84,209 // andps %xmm1,%xmm2
.byte 15,85,200 // andnps %xmm0,%xmm1
@@ -58688,28 +58688,28 @@ _sk_to_srgb_sse2:
.byte 15,40,250 // movaps %xmm2,%xmm7
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 2227 <_sk_to_srgb_sse2+0x18>
+ .byte 232,0,0,0,0 // call 2221 <_sk_to_srgb_sse2+0x18>
.byte 88 // pop %eax
.byte 15,82,218 // rsqrtps %xmm2,%xmm3
- .byte 15,40,160,73,175,0,0 // movaps 0xaf49(%eax),%xmm4
+ .byte 15,40,160,79,175,0,0 // movaps 0xaf4f(%eax),%xmm4
.byte 15,40,235 // movaps %xmm3,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,40,128,89,175,0,0 // movaps 0xaf59(%eax),%xmm0
+ .byte 15,40,128,95,175,0,0 // movaps 0xaf5f(%eax),%xmm0
.byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,40,128,105,175,0,0 // movaps 0xaf69(%eax),%xmm0
+ .byte 15,40,128,111,175,0,0 // movaps 0xaf6f(%eax),%xmm0
.byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,128,121,175,0,0 // movaps 0xaf79(%eax),%xmm0
+ .byte 15,40,128,127,175,0,0 // movaps 0xaf7f(%eax),%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 15,88,216 // addps %xmm0,%xmm3
.byte 15,83,195 // rcpps %xmm3,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,168,57,175,0,0 // movaps 0xaf39(%eax),%xmm5
+ .byte 15,40,168,63,175,0,0 // movaps 0xaf3f(%eax),%xmm5
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,40,152,137,175,0,0 // movaps 0xaf89(%eax),%xmm3
+ .byte 15,40,152,143,175,0,0 // movaps 0xaf8f(%eax),%xmm3
.byte 15,194,211,1 // cmpltps %xmm3,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -58766,7 +58766,7 @@ _sk_rgb_to_hsl_sse2:
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 15,40,249 // movaps %xmm1,%xmm7
.byte 15,40,224 // movaps %xmm0,%xmm4
- .byte 232,0,0,0,0 // call 231e <_sk_rgb_to_hsl_sse2+0x15>
+ .byte 232,0,0,0,0 // call 2318 <_sk_rgb_to_hsl_sse2+0x15>
.byte 88 // pop %eax
.byte 15,40,199 // movaps %xmm7,%xmm0
.byte 15,95,194 // maxps %xmm2,%xmm0
@@ -58780,14 +58780,14 @@ _sk_rgb_to_hsl_sse2:
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
- .byte 15,40,136,34,173,0,0 // movaps 0xad22(%eax),%xmm1
+ .byte 15,40,136,40,173,0,0 // movaps 0xad28(%eax),%xmm1
.byte 15,94,200 // divps %xmm0,%xmm1
.byte 15,40,199 // movaps %xmm7,%xmm0
.byte 15,92,194 // subps %xmm2,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,194,234,1 // cmpltps %xmm2,%xmm5
- .byte 15,84,168,162,174,0,0 // andps 0xaea2(%eax),%xmm5
+ .byte 15,84,168,168,174,0,0 // andps 0xaea8(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,194,196,0 // cmpeqps %xmm4,%xmm0
@@ -58797,9 +58797,9 @@ _sk_rgb_to_hsl_sse2:
.byte 15,92,231 // subps %xmm7,%xmm4
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,89,225 // mulps %xmm1,%xmm4
- .byte 15,40,136,178,174,0,0 // movaps 0xaeb2(%eax),%xmm1
+ .byte 15,40,136,184,174,0,0 // movaps 0xaeb8(%eax),%xmm1
.byte 15,88,209 // addps %xmm1,%xmm2
- .byte 15,88,160,194,174,0,0 // addps 0xaec2(%eax),%xmm4
+ .byte 15,88,160,200,174,0,0 // addps 0xaec8(%eax),%xmm4
.byte 15,84,214 // andps %xmm6,%xmm2
.byte 15,85,244 // andnps %xmm4,%xmm6
.byte 15,86,242 // orps %xmm2,%xmm6
@@ -58811,7 +58811,7 @@ _sk_rgb_to_hsl_sse2:
.byte 15,194,226,4 // cmpneqps %xmm2,%xmm4
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,88,218 // addps %xmm2,%xmm3
- .byte 15,40,168,2,173,0,0 // movaps 0xad02(%eax),%xmm5
+ .byte 15,40,168,24,173,0,0 // movaps 0xad18(%eax),%xmm5
.byte 15,92,202 // subps %xmm2,%xmm1
.byte 15,40,211 // movaps %xmm3,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
@@ -58821,7 +58821,7 @@ _sk_rgb_to_hsl_sse2:
.byte 15,86,233 // orps %xmm1,%xmm5
.byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
.byte 15,94,205 // divps %xmm5,%xmm1
- .byte 15,89,128,210,174,0,0 // mulps 0xaed2(%eax),%xmm0
+ .byte 15,89,128,216,174,0,0 // mulps 0xaed8(%eax),%xmm0
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,84,204 // andps %xmm4,%xmm1
.byte 139,69,12 // mov 0xc(%ebp),%eax
@@ -58844,9 +58844,9 @@ _sk_hsl_to_rgb_sse2:
.byte 129,236,200,0,0,0 // sub $0xc8,%esp
.byte 15,41,157,56,255,255,255 // movaps %xmm3,-0xc8(%ebp)
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
- .byte 232,0,0,0,0 // call 2419 <_sk_hsl_to_rgb_sse2+0x19>
+ .byte 232,0,0,0,0 // call 2413 <_sk_hsl_to_rgb_sse2+0x19>
.byte 88 // pop %eax
- .byte 15,40,160,7,172,0,0 // movaps 0xac07(%eax),%xmm4
+ .byte 15,40,160,29,172,0,0 // movaps 0xac1d(%eax),%xmm4
.byte 15,40,220 // movaps %xmm4,%xmm3
.byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp)
.byte 15,194,218,2 // cmpleps %xmm2,%xmm3
@@ -58859,13 +58859,13 @@ _sk_hsl_to_rgb_sse2:
.byte 15,84,243 // andps %xmm3,%xmm6
.byte 15,85,217 // andnps %xmm1,%xmm3
.byte 15,86,222 // orps %xmm6,%xmm3
- .byte 15,40,168,231,173,0,0 // movaps 0xade7(%eax),%xmm5
+ .byte 15,40,168,237,173,0,0 // movaps 0xaded(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 243,15,91,205 // cvttps2dq %xmm5,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,193,1 // cmpltps %xmm1,%xmm0
- .byte 15,40,176,39,172,0,0 // movaps 0xac27(%eax),%xmm6
+ .byte 15,40,176,45,172,0,0 // movaps 0xac2d(%eax),%xmm6
.byte 15,41,117,136 // movaps %xmm6,-0x78(%ebp)
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,200 // subps %xmm0,%xmm1
@@ -58875,19 +58875,19 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,211 // subps %xmm3,%xmm2
- .byte 15,40,184,247,173,0,0 // movaps 0xadf7(%eax),%xmm7
+ .byte 15,40,184,253,173,0,0 // movaps 0xadfd(%eax),%xmm7
.byte 15,41,189,88,255,255,255 // movaps %xmm7,-0xa8(%ebp)
.byte 15,194,253,2 // cmpleps %xmm5,%xmm7
.byte 15,92,218 // subps %xmm2,%xmm3
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 15,40,204 // movaps %xmm4,%xmm1
.byte 15,194,205,2 // cmpleps %xmm5,%xmm1
- .byte 15,40,160,215,173,0,0 // movaps 0xadd7(%eax),%xmm4
+ .byte 15,40,160,221,173,0,0 // movaps 0xaddd(%eax),%xmm4
.byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp)
.byte 15,194,229,2 // cmpleps %xmm5,%xmm4
- .byte 15,40,176,167,173,0,0 // movaps 0xada7(%eax),%xmm6
+ .byte 15,40,176,173,173,0,0 // movaps 0xadad(%eax),%xmm6
.byte 15,89,238 // mulps %xmm6,%xmm5
- .byte 15,40,128,199,173,0,0 // movaps 0xadc7(%eax),%xmm0
+ .byte 15,40,128,205,173,0,0 // movaps 0xadcd(%eax),%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
@@ -58913,18 +58913,18 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,194,200,1 // cmpltps %xmm0,%xmm1
- .byte 15,84,136,39,172,0,0 // andps 0xac27(%eax),%xmm1
+ .byte 15,84,136,45,172,0,0 // andps 0xac2d(%eax),%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,40,128,247,173,0,0 // movaps 0xadf7(%eax),%xmm0
+ .byte 15,40,128,253,173,0,0 // movaps 0xadfd(%eax),%xmm0
.byte 15,194,193,2 // cmpleps %xmm1,%xmm0
- .byte 15,40,152,7,172,0,0 // movaps 0xac07(%eax),%xmm3
+ .byte 15,40,152,29,172,0,0 // movaps 0xac1d(%eax),%xmm3
.byte 15,194,217,2 // cmpleps %xmm1,%xmm3
- .byte 15,40,160,215,173,0,0 // movaps 0xadd7(%eax),%xmm4
+ .byte 15,40,160,221,173,0,0 // movaps 0xaddd(%eax),%xmm4
.byte 15,194,225,2 // cmpleps %xmm1,%xmm4
.byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,168,199,173,0,0 // movaps 0xadc7(%eax),%xmm5
+ .byte 15,40,168,205,173,0,0 // movaps 0xadcd(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,89,239 // mulps %xmm7,%xmm5
.byte 15,88,234 // addps %xmm2,%xmm5
@@ -58944,7 +58944,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,125,232 // movaps -0x18(%ebp),%xmm7
.byte 15,85,252 // andnps %xmm4,%xmm7
.byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
- .byte 15,88,152,7,174,0,0 // addps 0xae07(%eax),%xmm3
+ .byte 15,88,152,13,174,0,0 // addps 0xae0d(%eax),%xmm3
.byte 243,15,91,195 // cvttps2dq %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
@@ -59031,7 +59031,7 @@ _sk_scale_u8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 2693 <_sk_scale_u8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 268d <_sk_scale_u8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -59042,13 +59042,13 @@ _sk_scale_u8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,65 // jne 26ef <_sk_scale_u8_sse2+0x6a>
+ .byte 117,65 // jne 26e9 <_sk_scale_u8_sse2+0x6a>
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,109,170,0,0 // pand 0xaa6d(%edx),%xmm4
+ .byte 102,15,219,162,115,170,0,0 // pand 0xaa73(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,157,171,0,0 // mulps 0xab9d(%edx),%xmm4
+ .byte 15,89,162,163,171,0,0 // mulps 0xaba3(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 15,89,212 // mulps %xmm4,%xmm2
@@ -59067,12 +59067,12 @@ _sk_scale_u8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 2729 <_sk_scale_u8_sse2+0xa4>
+ .byte 116,50 // je 2723 <_sk_scale_u8_sse2+0xa4>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 2713 <_sk_scale_u8_sse2+0x8e>
+ .byte 116,19 // je 270d <_sk_scale_u8_sse2+0x8e>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,182 // jne 26bb <_sk_scale_u8_sse2+0x36>
+ .byte 117,182 // jne 26b5 <_sk_scale_u8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -59081,10 +59081,10 @@ _sk_scale_u8_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,146 // jmp 26bb <_sk_scale_u8_sse2+0x36>
+ .byte 235,146 // jmp 26b5 <_sk_scale_u8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 235,136 // jmp 26bb <_sk_scale_u8_sse2+0x36>
+ .byte 235,136 // jmp 26b5 <_sk_scale_u8_sse2+0x36>
HIDDEN _sk_scale_565_sse2
.globl _sk_scale_565_sse2
@@ -59099,7 +59099,7 @@ _sk_scale_565_sse2:
.byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 274d <_sk_scale_565_sse2+0x1a>
+ .byte 232,0,0,0,0 // call 2747 <_sk_scale_565_sse2+0x1a>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -59111,20 +59111,20 @@ _sk_scale_565_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,157,0,0,0 // jne 280b <_sk_scale_565_sse2+0xd8>
+ .byte 15,133,157,0,0,0 // jne 2805 <_sk_scale_565_sse2+0xd8>
.byte 243,15,126,52,126 // movq (%esi,%edi,2),%xmm6
.byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,162,243,170,0,0 // movdqa 0xaaf3(%edx),%xmm4
+ .byte 102,15,111,162,249,170,0,0 // movdqa 0xaaf9(%edx),%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,212 // cvtdq2ps %xmm4,%xmm2
- .byte 15,89,146,3,171,0,0 // mulps 0xab03(%edx),%xmm2
- .byte 102,15,111,170,19,171,0,0 // movdqa 0xab13(%edx),%xmm5
+ .byte 15,89,146,9,171,0,0 // mulps 0xab09(%edx),%xmm2
+ .byte 102,15,111,170,25,171,0,0 // movdqa 0xab19(%edx),%xmm5
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,35,171,0,0 // mulps 0xab23(%edx),%xmm5
- .byte 102,15,219,178,51,171,0,0 // pand 0xab33(%edx),%xmm6
+ .byte 15,89,170,41,171,0,0 // mulps 0xab29(%edx),%xmm5
+ .byte 102,15,219,178,57,171,0,0 // pand 0xab39(%edx),%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,178,67,171,0,0 // mulps 0xab43(%edx),%xmm6
+ .byte 15,89,178,73,171,0,0 // mulps 0xab49(%edx),%xmm6
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,93,254 // minps %xmm6,%xmm7
.byte 15,40,226 // movaps %xmm2,%xmm4
@@ -59159,22 +59159,22 @@ _sk_scale_565_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 2845 <_sk_scale_565_sse2+0x112>
+ .byte 116,50 // je 283f <_sk_scale_565_sse2+0x112>
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,23 // je 2833 <_sk_scale_565_sse2+0x100>
+ .byte 116,23 // je 282d <_sk_scale_565_sse2+0x100>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,82,255,255,255 // jne 2777 <_sk_scale_565_sse2+0x44>
+ .byte 15,133,82,255,255,255 // jne 2771 <_sk_scale_565_sse2+0x44>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
.byte 102,15,110,36,126 // movd (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,244 // movsd %xmm4,%xmm6
- .byte 233,50,255,255,255 // jmp 2777 <_sk_scale_565_sse2+0x44>
+ .byte 233,50,255,255,255 // jmp 2771 <_sk_scale_565_sse2+0x44>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,246 // movd %esi,%xmm6
- .byte 233,37,255,255,255 // jmp 2777 <_sk_scale_565_sse2+0x44>
+ .byte 233,37,255,255,255 // jmp 2771 <_sk_scale_565_sse2+0x44>
HIDDEN _sk_lerp_1_float_sse2
.globl _sk_lerp_1_float_sse2
@@ -59223,7 +59223,7 @@ _sk_lerp_u8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 28ba <_sk_lerp_u8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 28b4 <_sk_lerp_u8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -59234,13 +59234,13 @@ _sk_lerp_u8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,102 // jne 293b <_sk_lerp_u8_sse2+0x8f>
+ .byte 117,102 // jne 2935 <_sk_lerp_u8_sse2+0x8f>
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,70,168,0,0 // pand 0xa846(%edx),%xmm4
+ .byte 102,15,219,162,76,168,0,0 // pand 0xa84c(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,118,169,0,0 // mulps 0xa976(%edx),%xmm4
+ .byte 15,89,162,124,169,0,0 // mulps 0xa97c(%edx),%xmm4
.byte 15,40,105,16 // movaps 0x10(%ecx),%xmm5
.byte 15,40,113,32 // movaps 0x20(%ecx),%xmm6
.byte 15,92,197 // subps %xmm5,%xmm0
@@ -59270,12 +59270,12 @@ _sk_lerp_u8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,53 // je 2978 <_sk_lerp_u8_sse2+0xcc>
+ .byte 116,53 // je 2972 <_sk_lerp_u8_sse2+0xcc>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 295f <_sk_lerp_u8_sse2+0xb3>
+ .byte 116,19 // je 2959 <_sk_lerp_u8_sse2+0xb3>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,145 // jne 28e2 <_sk_lerp_u8_sse2+0x36>
+ .byte 117,145 // jne 28dc <_sk_lerp_u8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -59284,10 +59284,10 @@ _sk_lerp_u8_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,106,255,255,255 // jmp 28e2 <_sk_lerp_u8_sse2+0x36>
+ .byte 233,106,255,255,255 // jmp 28dc <_sk_lerp_u8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 233,93,255,255,255 // jmp 28e2 <_sk_lerp_u8_sse2+0x36>
+ .byte 233,93,255,255,255 // jmp 28dc <_sk_lerp_u8_sse2+0x36>
HIDDEN _sk_lerp_565_sse2
.globl _sk_lerp_565_sse2
@@ -59303,7 +59303,7 @@ _sk_lerp_565_sse2:
.byte 15,41,85,136 // movaps %xmm2,-0x78(%ebp)
.byte 15,41,77,152 // movaps %xmm1,-0x68(%ebp)
.byte 102,15,127,69,184 // movdqa %xmm0,-0x48(%ebp)
- .byte 232,0,0,0,0 // call 29a4 <_sk_lerp_565_sse2+0x1f>
+ .byte 232,0,0,0,0 // call 299e <_sk_lerp_565_sse2+0x1f>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -59315,20 +59315,20 @@ _sk_lerp_565_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,211,0,0,0 // jne 2a98 <_sk_lerp_565_sse2+0x113>
+ .byte 15,133,211,0,0,0 // jne 2a92 <_sk_lerp_565_sse2+0x113>
.byte 243,15,126,44,126 // movq (%esi,%edi,2),%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
- .byte 102,15,111,162,156,168,0,0 // movdqa 0xa89c(%edx),%xmm4
+ .byte 102,15,111,162,162,168,0,0 // movdqa 0xa8a2(%edx),%xmm4
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 15,91,204 // cvtdq2ps %xmm4,%xmm1
- .byte 15,89,138,172,168,0,0 // mulps 0xa8ac(%edx),%xmm1
- .byte 102,15,111,178,188,168,0,0 // movdqa 0xa8bc(%edx),%xmm6
+ .byte 15,89,138,178,168,0,0 // mulps 0xa8b2(%edx),%xmm1
+ .byte 102,15,111,178,194,168,0,0 // movdqa 0xa8c2(%edx),%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,178,204,168,0,0 // mulps 0xa8cc(%edx),%xmm6
- .byte 102,15,219,170,220,168,0,0 // pand 0xa8dc(%edx),%xmm5
+ .byte 15,89,178,210,168,0,0 // mulps 0xa8d2(%edx),%xmm6
+ .byte 102,15,219,170,226,168,0,0 // pand 0xa8e2(%edx),%xmm5
.byte 15,91,213 // cvtdq2ps %xmm5,%xmm2
- .byte 15,89,146,236,168,0,0 // mulps 0xa8ec(%edx),%xmm2
+ .byte 15,89,146,242,168,0,0 // mulps 0xa8f2(%edx),%xmm2
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 15,40,254 // movaps %xmm6,%xmm7
@@ -59378,22 +59378,22 @@ _sk_lerp_565_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 2ad2 <_sk_lerp_565_sse2+0x14d>
+ .byte 116,50 // je 2acc <_sk_lerp_565_sse2+0x14d>
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,23 // je 2ac0 <_sk_lerp_565_sse2+0x13b>
+ .byte 116,23 // je 2aba <_sk_lerp_565_sse2+0x13b>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,28,255,255,255 // jne 29ce <_sk_lerp_565_sse2+0x49>
+ .byte 15,133,28,255,255,255 // jne 29c8 <_sk_lerp_565_sse2+0x49>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,236,69 // pshufd $0x45,%xmm4,%xmm5
.byte 102,15,110,36,126 // movd (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,236 // movsd %xmm4,%xmm5
- .byte 233,252,254,255,255 // jmp 29ce <_sk_lerp_565_sse2+0x49>
+ .byte 233,252,254,255,255 // jmp 29c8 <_sk_lerp_565_sse2+0x49>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,238 // movd %esi,%xmm5
- .byte 233,239,254,255,255 // jmp 29ce <_sk_lerp_565_sse2+0x49>
+ .byte 233,239,254,255,255 // jmp 29c8 <_sk_lerp_565_sse2+0x49>
HIDDEN _sk_load_tables_sse2
.globl _sk_load_tables_sse2
@@ -59405,7 +59405,7 @@ _sk_load_tables_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 2aed <_sk_load_tables_sse2+0xe>
+ .byte 232,0,0,0,0 // call 2ae7 <_sk_load_tables_sse2+0xe>
.byte 90 // pop %edx
.byte 139,117,12 // mov 0xc(%ebp),%esi
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -59414,9 +59414,9 @@ _sk_load_tables_sse2:
.byte 133,192 // test %eax,%eax
.byte 139,54 // mov (%esi),%esi
.byte 139,30 // mov (%esi),%ebx
- .byte 15,133,19,1,0,0 // jne 2c18 <_sk_load_tables_sse2+0x139>
+ .byte 15,133,19,1,0,0 // jne 2c12 <_sk_load_tables_sse2+0x139>
.byte 243,15,111,28,187 // movdqu (%ebx,%edi,4),%xmm3
- .byte 102,15,111,146,19,166,0,0 // movdqa 0xa613(%edx),%xmm2
+ .byte 102,15,111,146,25,166,0,0 // movdqa 0xa619(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
@@ -59472,7 +59472,7 @@ _sk_load_tables_sse2:
.byte 15,20,215 // unpcklps %xmm7,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,67,167,0,0 // mulps 0xa743(%edx),%xmm3
+ .byte 15,89,154,73,167,0,0 // mulps 0xa749(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,194 // mov %eax,%edx
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -59488,18 +59488,18 @@ _sk_load_tables_sse2:
.byte 195 // ret
.byte 36,3 // and $0x3,%al
.byte 60,1 // cmp $0x1,%al
- .byte 116,37 // je 2c43 <_sk_load_tables_sse2+0x164>
+ .byte 116,37 // je 2c3d <_sk_load_tables_sse2+0x164>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 60,2 // cmp $0x2,%al
- .byte 116,19 // je 2c39 <_sk_load_tables_sse2+0x15a>
+ .byte 116,19 // je 2c33 <_sk_load_tables_sse2+0x15a>
.byte 60,3 // cmp $0x3,%al
- .byte 15,133,220,254,255,255 // jne 2b0a <_sk_load_tables_sse2+0x2b>
+ .byte 15,133,220,254,255,255 // jne 2b04 <_sk_load_tables_sse2+0x2b>
.byte 102,15,110,68,187,8 // movd 0x8(%ebx,%edi,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,18,28,187 // movlpd (%ebx,%edi,4),%xmm3
- .byte 233,199,254,255,255 // jmp 2b0a <_sk_load_tables_sse2+0x2b>
+ .byte 233,199,254,255,255 // jmp 2b04 <_sk_load_tables_sse2+0x2b>
.byte 102,15,110,28,187 // movd (%ebx,%edi,4),%xmm3
- .byte 233,189,254,255,255 // jmp 2b0a <_sk_load_tables_sse2+0x2b>
+ .byte 233,189,254,255,255 // jmp 2b04 <_sk_load_tables_sse2+0x2b>
HIDDEN _sk_load_tables_u16_be_sse2
.globl _sk_load_tables_u16_be_sse2
@@ -59511,7 +59511,7 @@ _sk_load_tables_u16_be_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,44 // sub $0x2c,%esp
- .byte 232,0,0,0,0 // call 2c5b <_sk_load_tables_u16_be_sse2+0xe>
+ .byte 232,0,0,0,0 // call 2c55 <_sk_load_tables_u16_be_sse2+0xe>
.byte 90 // pop %edx
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
@@ -59522,7 +59522,7 @@ _sk_load_tables_u16_be_sse2:
.byte 139,57 // mov (%ecx),%edi
.byte 139,15 // mov (%edi),%ecx
.byte 190,255,0,255,0 // mov $0xff00ff,%esi
- .byte 15,133,166,1,0,0 // jne 2e21 <_sk_load_tables_u16_be_sse2+0x1d4>
+ .byte 15,133,166,1,0,0 // jne 2e1b <_sk_load_tables_u16_be_sse2+0x1d4>
.byte 102,15,16,4,89 // movupd (%ecx,%ebx,2),%xmm0
.byte 243,15,111,76,89,16 // movdqu 0x10(%ecx,%ebx,2),%xmm1
.byte 102,15,40,216 // movapd %xmm0,%xmm3
@@ -59619,7 +59619,7 @@ _sk_load_tables_u16_be_sse2:
.byte 243,15,126,93,208 // movq -0x30(%ebp),%xmm3
.byte 102,15,97,223 // punpcklwd %xmm7,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,69,166,0,0 // mulps 0xa645(%edx),%xmm3
+ .byte 15,89,154,75,166,0,0 // mulps 0xa64b(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,193 // mov %eax,%ecx
.byte 141,65,8 // lea 0x8(%ecx),%eax
@@ -59636,12 +59636,12 @@ _sk_load_tables_u16_be_sse2:
.byte 242,15,16,4,89 // movsd (%ecx,%ebx,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,248,1 // cmp $0x1,%eax
- .byte 15,132,83,254,255,255 // je 2c86 <_sk_load_tables_u16_be_sse2+0x39>
+ .byte 15,132,83,254,255,255 // je 2c80 <_sk_load_tables_u16_be_sse2+0x39>
.byte 102,15,22,68,89,8 // movhpd 0x8(%ecx,%ebx,2),%xmm0
.byte 131,248,3 // cmp $0x3,%eax
- .byte 15,130,68,254,255,255 // jb 2c86 <_sk_load_tables_u16_be_sse2+0x39>
+ .byte 15,130,68,254,255,255 // jb 2c80 <_sk_load_tables_u16_be_sse2+0x39>
.byte 243,15,126,76,89,16 // movq 0x10(%ecx,%ebx,2),%xmm1
- .byte 233,57,254,255,255 // jmp 2c86 <_sk_load_tables_u16_be_sse2+0x39>
+ .byte 233,57,254,255,255 // jmp 2c80 <_sk_load_tables_u16_be_sse2+0x39>
HIDDEN _sk_load_tables_rgb_u16_be_sse2
.globl _sk_load_tables_rgb_u16_be_sse2
@@ -59653,7 +59653,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,28 // sub $0x1c,%esp
- .byte 232,0,0,0,0 // call 2e5b <_sk_load_tables_rgb_u16_be_sse2+0xe>
+ .byte 232,0,0,0,0 // call 2e55 <_sk_load_tables_rgb_u16_be_sse2+0xe>
.byte 88 // pop %eax
.byte 137,69,240 // mov %eax,-0x10(%ebp)
.byte 139,69,12 // mov 0xc(%ebp),%eax
@@ -59664,7 +59664,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 139,56 // mov (%eax),%edi
.byte 139,7 // mov (%edi),%eax
.byte 190,255,0,255,0 // mov $0xff00ff,%esi
- .byte 15,133,141,1,0,0 // jne 3009 <_sk_load_tables_rgb_u16_be_sse2+0x1bc>
+ .byte 15,133,141,1,0,0 // jne 3003 <_sk_load_tables_rgb_u16_be_sse2+0x1bc>
.byte 243,15,111,12,88 // movdqu (%eax,%ebx,2),%xmm1
.byte 243,15,111,92,88,8 // movdqu 0x8(%eax,%ebx,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -59758,7 +59758,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 141,65,8 // lea 0x8(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 139,85,240 // mov -0x10(%ebp),%edx
- .byte 15,40,162,229,161,0,0 // movaps 0xa1e5(%edx),%xmm4
+ .byte 15,40,162,235,161,0,0 // movaps 0xa1eb(%edx),%xmm4
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,40,220 // movaps %xmm4,%xmm3
.byte 80 // push %eax
@@ -59774,20 +59774,20 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,15,196,76,88,4,2 // pinsrw $0x2,0x4(%eax,%ebx,2),%xmm1
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 131,249,1 // cmp $0x1,%ecx
- .byte 117,13 // jne 302b <_sk_load_tables_rgb_u16_be_sse2+0x1de>
+ .byte 117,13 // jne 3025 <_sk_load_tables_rgb_u16_be_sse2+0x1de>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,115,254,255,255 // jmp 2e9e <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ .byte 233,115,254,255,255 // jmp 2e98 <_sk_load_tables_rgb_u16_be_sse2+0x51>
.byte 102,15,110,68,88,6 // movd 0x6(%eax,%ebx,2),%xmm0
.byte 102,15,196,68,88,10,2 // pinsrw $0x2,0xa(%eax,%ebx,2),%xmm0
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 131,249,3 // cmp $0x3,%ecx
- .byte 114,18 // jb 3053 <_sk_load_tables_rgb_u16_be_sse2+0x206>
+ .byte 114,18 // jb 304d <_sk_load_tables_rgb_u16_be_sse2+0x206>
.byte 102,15,110,92,88,12 // movd 0xc(%eax,%ebx,2),%xmm3
.byte 102,15,196,92,88,16,2 // pinsrw $0x2,0x10(%eax,%ebx,2),%xmm3
- .byte 233,75,254,255,255 // jmp 2e9e <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ .byte 233,75,254,255,255 // jmp 2e98 <_sk_load_tables_rgb_u16_be_sse2+0x51>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,66,254,255,255 // jmp 2e9e <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ .byte 233,66,254,255,255 // jmp 2e98 <_sk_load_tables_rgb_u16_be_sse2+0x51>
HIDDEN _sk_byte_tables_sse2
.globl _sk_byte_tables_sse2
@@ -59799,11 +59799,11 @@ _sk_byte_tables_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 306a <_sk_byte_tables_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3064 <_sk_byte_tables_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
- .byte 15,40,162,166,160,0,0 // movaps 0xa0a6(%edx),%xmm4
+ .byte 15,40,162,172,160,0,0 // movaps 0xa0ac(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
@@ -59825,7 +59825,7 @@ _sk_byte_tables_sse2:
.byte 102,15,196,192,0 // pinsrw $0x0,%eax,%xmm0
.byte 139,65,4 // mov 0x4(%ecx),%eax
.byte 102,15,196,195,1 // pinsrw $0x1,%ebx,%xmm0
- .byte 15,40,170,198,161,0,0 // movaps 0xa1c6(%edx),%xmm5
+ .byte 15,40,170,204,161,0,0 // movaps 0xa1cc(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -59950,12 +59950,12 @@ _sk_byte_tables_rgb_sse2:
.byte 15,182,60,31 // movzbl (%edi,%ebx,1),%edi
.byte 193,231,8 // shl $0x8,%edi
.byte 9,215 // or %edx,%edi
- .byte 232,0,0,0,0 // call 326a <_sk_byte_tables_rgb_sse2+0x65>
+ .byte 232,0,0,0,0 // call 3264 <_sk_byte_tables_rgb_sse2+0x65>
.byte 90 // pop %edx
.byte 102,15,196,199,0 // pinsrw $0x0,%edi,%xmm0
.byte 139,121,4 // mov 0x4(%ecx),%edi
.byte 102,15,196,198,1 // pinsrw $0x1,%esi,%xmm0
- .byte 15,40,170,198,159,0,0 // movaps 0x9fc6(%edx),%xmm5
+ .byte 15,40,170,204,159,0,0 // movaps 0x9fcc(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -60191,7 +60191,7 @@ _sk_parametric_r_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 3539 <_sk_parametric_r_sse2+0x18>
+ .byte 232,0,0,0,0 // call 3533 <_sk_parametric_r_sse2+0x18>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
@@ -60211,15 +60211,15 @@ _sk_parametric_r_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,119,157,0,0 // mulps 0x9d77(%edx),%xmm5
- .byte 15,84,178,135,157,0,0 // andps 0x9d87(%edx),%xmm6
- .byte 15,86,178,231,154,0,0 // orps 0x9ae7(%edx),%xmm6
- .byte 15,88,170,151,157,0,0 // addps 0x9d97(%edx),%xmm5
- .byte 15,40,186,167,157,0,0 // movaps 0x9da7(%edx),%xmm7
+ .byte 15,89,170,125,157,0,0 // mulps 0x9d7d(%edx),%xmm5
+ .byte 15,84,178,141,157,0,0 // andps 0x9d8d(%edx),%xmm6
+ .byte 15,86,178,253,154,0,0 // orps 0x9afd(%edx),%xmm6
+ .byte 15,88,170,157,157,0,0 // addps 0x9d9d(%edx),%xmm5
+ .byte 15,40,186,173,157,0,0 // movaps 0x9dad(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,183,157,0,0 // addps 0x9db7(%edx),%xmm6
- .byte 15,40,186,199,157,0,0 // movaps 0x9dc7(%edx),%xmm7
+ .byte 15,88,178,189,157,0,0 // addps 0x9dbd(%edx),%xmm6
+ .byte 15,40,186,205,157,0,0 // movaps 0x9dcd(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -60229,21 +60229,21 @@ _sk_parametric_r_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,7,155,0,0 // movaps 0x9b07(%edx),%xmm6
+ .byte 15,40,178,13,155,0,0 // movaps 0x9b0d(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,215,157,0,0 // addps 0x9dd7(%edx),%xmm5
- .byte 15,40,186,231,157,0,0 // movaps 0x9de7(%edx),%xmm7
+ .byte 15,88,170,221,157,0,0 // addps 0x9ddd(%edx),%xmm5
+ .byte 15,40,186,237,157,0,0 // movaps 0x9ded(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,247,157,0,0 // movaps 0x9df7(%edx),%xmm7
+ .byte 15,40,186,253,157,0,0 // movaps 0x9dfd(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,7,158,0,0 // movaps 0x9e07(%edx),%xmm0
+ .byte 15,40,130,13,158,0,0 // movaps 0x9e0d(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,23,158,0,0 // mulps 0x9e17(%edx),%xmm0
+ .byte 15,89,130,29,158,0,0 // mulps 0x9e1d(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -60277,7 +60277,7 @@ _sk_parametric_g_sse2:
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 3670 <_sk_parametric_g_sse2+0x15>
+ .byte 232,0,0,0,0 // call 366a <_sk_parametric_g_sse2+0x15>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
@@ -60297,15 +60297,15 @@ _sk_parametric_g_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,64,156,0,0 // mulps 0x9c40(%edx),%xmm5
- .byte 15,84,178,80,156,0,0 // andps 0x9c50(%edx),%xmm6
- .byte 15,86,178,176,153,0,0 // orps 0x99b0(%edx),%xmm6
- .byte 15,88,170,96,156,0,0 // addps 0x9c60(%edx),%xmm5
- .byte 15,40,186,112,156,0,0 // movaps 0x9c70(%edx),%xmm7
+ .byte 15,89,170,70,156,0,0 // mulps 0x9c46(%edx),%xmm5
+ .byte 15,84,178,86,156,0,0 // andps 0x9c56(%edx),%xmm6
+ .byte 15,86,178,198,153,0,0 // orps 0x99c6(%edx),%xmm6
+ .byte 15,88,170,102,156,0,0 // addps 0x9c66(%edx),%xmm5
+ .byte 15,40,186,118,156,0,0 // movaps 0x9c76(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,128,156,0,0 // addps 0x9c80(%edx),%xmm6
- .byte 15,40,186,144,156,0,0 // movaps 0x9c90(%edx),%xmm7
+ .byte 15,88,178,134,156,0,0 // addps 0x9c86(%edx),%xmm6
+ .byte 15,40,186,150,156,0,0 // movaps 0x9c96(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -60315,21 +60315,21 @@ _sk_parametric_g_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,208,153,0,0 // movaps 0x99d0(%edx),%xmm6
+ .byte 15,40,178,214,153,0,0 // movaps 0x99d6(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,160,156,0,0 // addps 0x9ca0(%edx),%xmm5
- .byte 15,40,186,176,156,0,0 // movaps 0x9cb0(%edx),%xmm7
+ .byte 15,88,170,166,156,0,0 // addps 0x9ca6(%edx),%xmm5
+ .byte 15,40,186,182,156,0,0 // movaps 0x9cb6(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,192,156,0,0 // movaps 0x9cc0(%edx),%xmm7
+ .byte 15,40,186,198,156,0,0 // movaps 0x9cc6(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,208,156,0,0 // movaps 0x9cd0(%edx),%xmm0
+ .byte 15,40,130,214,156,0,0 // movaps 0x9cd6(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,224,156,0,0 // mulps 0x9ce0(%edx),%xmm0
+ .byte 15,89,130,230,156,0,0 // mulps 0x9ce6(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -60362,7 +60362,7 @@ _sk_parametric_b_sse2:
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,217 // movaps %xmm1,%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 37a4 <_sk_parametric_b_sse2+0x15>
+ .byte 232,0,0,0,0 // call 379e <_sk_parametric_b_sse2+0x15>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
@@ -60382,15 +60382,15 @@ _sk_parametric_b_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,12,155,0,0 // mulps 0x9b0c(%edx),%xmm5
- .byte 15,84,178,28,155,0,0 // andps 0x9b1c(%edx),%xmm6
- .byte 15,86,178,124,152,0,0 // orps 0x987c(%edx),%xmm6
- .byte 15,88,170,44,155,0,0 // addps 0x9b2c(%edx),%xmm5
- .byte 15,40,186,60,155,0,0 // movaps 0x9b3c(%edx),%xmm7
+ .byte 15,89,170,18,155,0,0 // mulps 0x9b12(%edx),%xmm5
+ .byte 15,84,178,34,155,0,0 // andps 0x9b22(%edx),%xmm6
+ .byte 15,86,178,146,152,0,0 // orps 0x9892(%edx),%xmm6
+ .byte 15,88,170,50,155,0,0 // addps 0x9b32(%edx),%xmm5
+ .byte 15,40,186,66,155,0,0 // movaps 0x9b42(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,76,155,0,0 // addps 0x9b4c(%edx),%xmm6
- .byte 15,40,186,92,155,0,0 // movaps 0x9b5c(%edx),%xmm7
+ .byte 15,88,178,82,155,0,0 // addps 0x9b52(%edx),%xmm6
+ .byte 15,40,186,98,155,0,0 // movaps 0x9b62(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -60400,21 +60400,21 @@ _sk_parametric_b_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,156,152,0,0 // movaps 0x989c(%edx),%xmm6
+ .byte 15,40,178,162,152,0,0 // movaps 0x98a2(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,108,155,0,0 // addps 0x9b6c(%edx),%xmm5
- .byte 15,40,186,124,155,0,0 // movaps 0x9b7c(%edx),%xmm7
+ .byte 15,88,170,114,155,0,0 // addps 0x9b72(%edx),%xmm5
+ .byte 15,40,186,130,155,0,0 // movaps 0x9b82(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,140,155,0,0 // movaps 0x9b8c(%edx),%xmm7
+ .byte 15,40,186,146,155,0,0 // movaps 0x9b92(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,156,155,0,0 // movaps 0x9b9c(%edx),%xmm0
+ .byte 15,40,130,162,155,0,0 // movaps 0x9ba2(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,172,155,0,0 // mulps 0x9bac(%edx),%xmm0
+ .byte 15,89,130,178,155,0,0 // mulps 0x9bb2(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -60447,7 +60447,7 @@ _sk_parametric_a_sse2:
.byte 15,41,85,232 // movaps %xmm2,-0x18(%ebp)
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 38d8 <_sk_parametric_a_sse2+0x15>
+ .byte 232,0,0,0,0 // call 38d2 <_sk_parametric_a_sse2+0x15>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
@@ -60467,15 +60467,15 @@ _sk_parametric_a_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,216,153,0,0 // mulps 0x99d8(%edx),%xmm5
- .byte 15,84,178,232,153,0,0 // andps 0x99e8(%edx),%xmm6
- .byte 15,86,178,72,151,0,0 // orps 0x9748(%edx),%xmm6
- .byte 15,88,170,248,153,0,0 // addps 0x99f8(%edx),%xmm5
- .byte 15,40,186,8,154,0,0 // movaps 0x9a08(%edx),%xmm7
+ .byte 15,89,170,222,153,0,0 // mulps 0x99de(%edx),%xmm5
+ .byte 15,84,178,238,153,0,0 // andps 0x99ee(%edx),%xmm6
+ .byte 15,86,178,94,151,0,0 // orps 0x975e(%edx),%xmm6
+ .byte 15,88,170,254,153,0,0 // addps 0x99fe(%edx),%xmm5
+ .byte 15,40,186,14,154,0,0 // movaps 0x9a0e(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,24,154,0,0 // addps 0x9a18(%edx),%xmm6
- .byte 15,40,186,40,154,0,0 // movaps 0x9a28(%edx),%xmm7
+ .byte 15,88,178,30,154,0,0 // addps 0x9a1e(%edx),%xmm6
+ .byte 15,40,186,46,154,0,0 // movaps 0x9a2e(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -60485,21 +60485,21 @@ _sk_parametric_a_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,104,151,0,0 // movaps 0x9768(%edx),%xmm6
+ .byte 15,40,178,110,151,0,0 // movaps 0x976e(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,56,154,0,0 // addps 0x9a38(%edx),%xmm5
- .byte 15,40,186,72,154,0,0 // movaps 0x9a48(%edx),%xmm7
+ .byte 15,88,170,62,154,0,0 // addps 0x9a3e(%edx),%xmm5
+ .byte 15,40,186,78,154,0,0 // movaps 0x9a4e(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,88,154,0,0 // movaps 0x9a58(%edx),%xmm7
+ .byte 15,40,186,94,154,0,0 // movaps 0x9a5e(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,104,154,0,0 // movaps 0x9a68(%edx),%xmm0
+ .byte 15,40,130,110,154,0,0 // movaps 0x9a6e(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,120,154,0,0 // mulps 0x9a78(%edx),%xmm0
+ .byte 15,89,130,126,154,0,0 // mulps 0x9a7e(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -60531,18 +60531,18 @@ _sk_gamma_sse2:
.byte 131,236,40 // sub $0x28,%esp
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 15,40,216 // movaps %xmm0,%xmm3
- .byte 232,0,0,0,0 // call 3a09 <_sk_gamma_sse2+0x12>
+ .byte 232,0,0,0,0 // call 3a03 <_sk_gamma_sse2+0x12>
.byte 88 // pop %eax
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,128,167,152,0,0 // mulps 0x98a7(%eax),%xmm0
- .byte 15,84,152,183,152,0,0 // andps 0x98b7(%eax),%xmm3
- .byte 15,86,152,23,150,0,0 // orps 0x9617(%eax),%xmm3
- .byte 15,88,128,199,152,0,0 // addps 0x98c7(%eax),%xmm0
+ .byte 15,89,128,173,152,0,0 // mulps 0x98ad(%eax),%xmm0
+ .byte 15,84,152,189,152,0,0 // andps 0x98bd(%eax),%xmm3
+ .byte 15,86,152,45,150,0,0 // orps 0x962d(%eax),%xmm3
+ .byte 15,88,128,205,152,0,0 // addps 0x98cd(%eax),%xmm0
.byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 15,89,160,215,152,0,0 // mulps 0x98d7(%eax),%xmm4
+ .byte 15,89,160,221,152,0,0 // mulps 0x98dd(%eax),%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,88,152,231,152,0,0 // addps 0x98e7(%eax),%xmm3
- .byte 15,40,160,247,152,0,0 // movaps 0x98f7(%eax),%xmm4
+ .byte 15,88,152,237,152,0,0 // addps 0x98ed(%eax),%xmm3
+ .byte 15,40,160,253,152,0,0 // movaps 0x98fd(%eax),%xmm4
.byte 15,94,227 // divps %xmm3,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 139,77,12 // mov 0xc(%ebp),%ecx
@@ -60555,30 +60555,30 @@ _sk_gamma_sse2:
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,194,227,1 // cmpltps %xmm3,%xmm4
- .byte 15,84,160,55,150,0,0 // andps 0x9637(%eax),%xmm4
+ .byte 15,84,160,61,150,0,0 // andps 0x963d(%eax),%xmm4
.byte 15,92,220 // subps %xmm4,%xmm3
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
- .byte 15,88,128,7,153,0,0 // addps 0x9907(%eax),%xmm0
- .byte 15,40,176,39,153,0,0 // movaps 0x9927(%eax),%xmm6
+ .byte 15,88,128,13,153,0,0 // addps 0x990d(%eax),%xmm0
+ .byte 15,40,176,45,153,0,0 // movaps 0x992d(%eax),%xmm6
.byte 15,92,244 // subps %xmm4,%xmm6
- .byte 15,40,168,23,153,0,0 // movaps 0x9917(%eax),%xmm5
+ .byte 15,40,168,29,153,0,0 // movaps 0x991d(%eax),%xmm5
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,40,152,55,153,0,0 // movaps 0x9937(%eax),%xmm3
+ .byte 15,40,152,61,153,0,0 // movaps 0x993d(%eax),%xmm3
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,94,230 // divps %xmm6,%xmm4
.byte 15,88,224 // addps %xmm0,%xmm4
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,128,167,152,0,0 // mulps 0x98a7(%eax),%xmm0
- .byte 15,84,136,183,152,0,0 // andps 0x98b7(%eax),%xmm1
- .byte 15,86,136,23,150,0,0 // orps 0x9617(%eax),%xmm1
- .byte 15,88,128,199,152,0,0 // addps 0x98c7(%eax),%xmm0
+ .byte 15,89,128,173,152,0,0 // mulps 0x98ad(%eax),%xmm0
+ .byte 15,84,136,189,152,0,0 // andps 0x98bd(%eax),%xmm1
+ .byte 15,86,136,45,150,0,0 // orps 0x962d(%eax),%xmm1
+ .byte 15,88,128,205,152,0,0 // addps 0x98cd(%eax),%xmm0
.byte 15,40,241 // movaps %xmm1,%xmm6
- .byte 15,89,176,215,152,0,0 // mulps 0x98d7(%eax),%xmm6
+ .byte 15,89,176,221,152,0,0 // mulps 0x98dd(%eax),%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
- .byte 15,88,136,231,152,0,0 // addps 0x98e7(%eax),%xmm1
- .byte 15,40,176,247,152,0,0 // movaps 0x98f7(%eax),%xmm6
+ .byte 15,88,136,237,152,0,0 // addps 0x98ed(%eax),%xmm1
+ .byte 15,40,176,253,152,0,0 // movaps 0x98fd(%eax),%xmm6
.byte 15,94,241 // divps %xmm1,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
@@ -60586,12 +60586,12 @@ _sk_gamma_sse2:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,194,241,1 // cmpltps %xmm1,%xmm6
- .byte 15,84,176,55,150,0,0 // andps 0x9637(%eax),%xmm6
+ .byte 15,84,176,61,150,0,0 // andps 0x963d(%eax),%xmm6
.byte 15,92,206 // subps %xmm6,%xmm1
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,241 // subps %xmm1,%xmm6
- .byte 15,88,128,7,153,0,0 // addps 0x9907(%eax),%xmm0
- .byte 15,40,184,39,153,0,0 // movaps 0x9927(%eax),%xmm7
+ .byte 15,88,128,13,153,0,0 // addps 0x990d(%eax),%xmm0
+ .byte 15,40,184,45,153,0,0 // movaps 0x992d(%eax),%xmm7
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
@@ -60599,15 +60599,15 @@ _sk_gamma_sse2:
.byte 15,94,207 // divps %xmm7,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,128,167,152,0,0 // mulps 0x98a7(%eax),%xmm0
- .byte 15,84,144,183,152,0,0 // andps 0x98b7(%eax),%xmm2
- .byte 15,86,144,23,150,0,0 // orps 0x9617(%eax),%xmm2
- .byte 15,88,128,199,152,0,0 // addps 0x98c7(%eax),%xmm0
- .byte 15,40,176,215,152,0,0 // movaps 0x98d7(%eax),%xmm6
+ .byte 15,89,128,173,152,0,0 // mulps 0x98ad(%eax),%xmm0
+ .byte 15,84,144,189,152,0,0 // andps 0x98bd(%eax),%xmm2
+ .byte 15,86,144,45,150,0,0 // orps 0x962d(%eax),%xmm2
+ .byte 15,88,128,205,152,0,0 // addps 0x98cd(%eax),%xmm0
+ .byte 15,40,176,221,152,0,0 // movaps 0x98dd(%eax),%xmm6
.byte 15,89,242 // mulps %xmm2,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
- .byte 15,88,144,231,152,0,0 // addps 0x98e7(%eax),%xmm2
- .byte 15,40,176,247,152,0,0 // movaps 0x98f7(%eax),%xmm6
+ .byte 15,88,144,237,152,0,0 // addps 0x98ed(%eax),%xmm2
+ .byte 15,40,176,253,152,0,0 // movaps 0x98fd(%eax),%xmm6
.byte 15,94,242 // divps %xmm2,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
.byte 15,89,69,232 // mulps -0x18(%ebp),%xmm0
@@ -60615,18 +60615,18 @@ _sk_gamma_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,194,242,1 // cmpltps %xmm2,%xmm6
- .byte 15,84,176,55,150,0,0 // andps 0x9637(%eax),%xmm6
+ .byte 15,84,176,61,150,0,0 // andps 0x963d(%eax),%xmm6
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
- .byte 15,88,128,7,153,0,0 // addps 0x9907(%eax),%xmm0
+ .byte 15,88,128,13,153,0,0 // addps 0x990d(%eax),%xmm0
.byte 15,89,238 // mulps %xmm6,%xmm5
.byte 15,92,197 // subps %xmm5,%xmm0
- .byte 15,40,144,39,153,0,0 // movaps 0x9927(%eax),%xmm2
+ .byte 15,40,144,45,153,0,0 // movaps 0x992d(%eax),%xmm2
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 15,94,218 // divps %xmm2,%xmm3
.byte 15,88,216 // addps %xmm0,%xmm3
- .byte 15,40,128,71,153,0,0 // movaps 0x9947(%eax),%xmm0
+ .byte 15,40,128,77,153,0,0 // movaps 0x994d(%eax),%xmm0
.byte 15,89,224 // mulps %xmm0,%xmm4
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,89,216 // mulps %xmm0,%xmm3
@@ -60653,31 +60653,31 @@ _sk_lab_to_xyz_sse2:
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 3bf1 <_sk_lab_to_xyz_sse2+0x15>
+ .byte 232,0,0,0,0 // call 3beb <_sk_lab_to_xyz_sse2+0x15>
.byte 88 // pop %eax
- .byte 15,89,144,111,151,0,0 // mulps 0x976f(%eax),%xmm2
- .byte 15,40,160,31,149,0,0 // movaps 0x951f(%eax),%xmm4
+ .byte 15,89,144,117,151,0,0 // mulps 0x9775(%eax),%xmm2
+ .byte 15,40,160,37,149,0,0 // movaps 0x9525(%eax),%xmm4
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,40,168,127,151,0,0 // movaps 0x977f(%eax),%xmm5
+ .byte 15,40,168,133,151,0,0 // movaps 0x9785(%eax),%xmm5
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,89,220 // mulps %xmm4,%xmm3
.byte 15,88,221 // addps %xmm5,%xmm3
- .byte 15,88,144,143,151,0,0 // addps 0x978f(%eax),%xmm2
- .byte 15,89,144,159,151,0,0 // mulps 0x979f(%eax),%xmm2
- .byte 15,89,136,175,151,0,0 // mulps 0x97af(%eax),%xmm1
+ .byte 15,88,144,149,151,0,0 // addps 0x9795(%eax),%xmm2
+ .byte 15,89,144,165,151,0,0 // mulps 0x97a5(%eax),%xmm2
+ .byte 15,89,136,181,151,0,0 // mulps 0x97b5(%eax),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,89,152,191,151,0,0 // mulps 0x97bf(%eax),%xmm3
+ .byte 15,89,152,197,151,0,0 // mulps 0x97c5(%eax),%xmm3
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,152,207,151,0,0 // movaps 0x97cf(%eax),%xmm3
+ .byte 15,40,152,213,151,0,0 // movaps 0x97d5(%eax),%xmm3
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,194,224,1 // cmpltps %xmm0,%xmm4
- .byte 15,40,176,223,151,0,0 // movaps 0x97df(%eax),%xmm6
+ .byte 15,40,176,229,151,0,0 // movaps 0x97e5(%eax),%xmm6
.byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,40,184,239,151,0,0 // movaps 0x97ef(%eax),%xmm7
+ .byte 15,40,184,245,151,0,0 // movaps 0x97f5(%eax),%xmm7
.byte 15,89,207 // mulps %xmm7,%xmm1
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,85,225 // andnps %xmm1,%xmm4
@@ -60702,8 +60702,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,85,221 // andnps %xmm5,%xmm3
.byte 15,86,216 // orps %xmm0,%xmm3
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,89,160,255,151,0,0 // mulps 0x97ff(%eax),%xmm4
- .byte 15,89,152,15,152,0,0 // mulps 0x980f(%eax),%xmm3
+ .byte 15,89,160,5,152,0,0 // mulps 0x9805(%eax),%xmm4
+ .byte 15,89,152,21,152,0,0 // mulps 0x9815(%eax),%xmm3
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
@@ -60726,7 +60726,7 @@ _sk_load_a8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3ce1 <_sk_load_a8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3cdb <_sk_load_a8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -60737,13 +60737,13 @@ _sk_load_a8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,60 // jne 3d38 <_sk_load_a8_sse2+0x65>
+ .byte 117,60 // jne 3d32 <_sk_load_a8_sse2+0x65>
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,130,31,148,0,0 // pand 0x941f(%edx),%xmm0
+ .byte 102,15,219,130,37,148,0,0 // pand 0x9425(%edx),%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,154,79,149,0,0 // mulps 0x954f(%edx),%xmm3
+ .byte 15,89,154,85,149,0,0 // mulps 0x9555(%edx),%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -60760,12 +60760,12 @@ _sk_load_a8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 3d72 <_sk_load_a8_sse2+0x9f>
+ .byte 116,50 // je 3d6c <_sk_load_a8_sse2+0x9f>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3d5c <_sk_load_a8_sse2+0x89>
+ .byte 116,19 // je 3d56 <_sk_load_a8_sse2+0x89>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,187 // jne 3d09 <_sk_load_a8_sse2+0x36>
+ .byte 117,187 // jne 3d03 <_sk_load_a8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -60774,10 +60774,10 @@ _sk_load_a8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,151 // jmp 3d09 <_sk_load_a8_sse2+0x36>
+ .byte 235,151 // jmp 3d03 <_sk_load_a8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,198 // movd %esi,%xmm0
- .byte 235,141 // jmp 3d09 <_sk_load_a8_sse2+0x36>
+ .byte 235,141 // jmp 3d03 <_sk_load_a8_sse2+0x36>
HIDDEN _sk_load_a8_dst_sse2
.globl _sk_load_a8_dst_sse2
@@ -60802,15 +60802,15 @@ _sk_load_a8_dst_sse2:
.byte 102,15,127,97,32 // movdqa %xmm4,0x20(%ecx)
.byte 102,15,127,97,16 // movdqa %xmm4,0x10(%ecx)
.byte 133,219 // test %ebx,%ebx
- .byte 232,0,0,0,0 // call 3db5 <_sk_load_a8_dst_sse2+0x39>
+ .byte 232,0,0,0,0 // call 3daf <_sk_load_a8_dst_sse2+0x39>
.byte 90 // pop %edx
- .byte 117,54 // jne 3dee <_sk_load_a8_dst_sse2+0x72>
+ .byte 117,54 // jne 3de8 <_sk_load_a8_dst_sse2+0x72>
.byte 102,15,110,36,55 // movd (%edi,%esi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,75,147,0,0 // pand 0x934b(%edx),%xmm4
+ .byte 102,15,219,162,81,147,0,0 // pand 0x9351(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,123,148,0,0 // mulps 0x947b(%edx),%xmm4
+ .byte 15,89,162,129,148,0,0 // mulps 0x9481(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -60825,11 +60825,11 @@ _sk_load_a8_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 3e24 <_sk_load_a8_dst_sse2+0xa8>
+ .byte 116,46 // je 3e1e <_sk_load_a8_dst_sse2+0xa8>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3e0e <_sk_load_a8_dst_sse2+0x92>
+ .byte 116,19 // je 3e08 <_sk_load_a8_dst_sse2+0x92>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,197 // jne 3dc5 <_sk_load_a8_dst_sse2+0x49>
+ .byte 117,197 // jne 3dbf <_sk_load_a8_dst_sse2+0x49>
.byte 15,182,92,55,2 // movzbl 0x2(%edi,%esi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -60838,10 +60838,10 @@ _sk_load_a8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,161 // jmp 3dc5 <_sk_load_a8_dst_sse2+0x49>
+ .byte 235,161 // jmp 3dbf <_sk_load_a8_dst_sse2+0x49>
.byte 15,182,52,55 // movzbl (%edi,%esi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 235,151 // jmp 3dc5 <_sk_load_a8_dst_sse2+0x49>
+ .byte 235,151 // jmp 3dbf <_sk_load_a8_dst_sse2+0x49>
HIDDEN _sk_gather_a8_sse2
.globl _sk_gather_a8_sse2
@@ -60882,13 +60882,13 @@ _sk_gather_a8_sse2:
.byte 9,202 // or %ecx,%edx
.byte 102,15,196,194,0 // pinsrw $0x0,%edx,%xmm0
.byte 102,15,196,199,1 // pinsrw $0x1,%edi,%xmm0
- .byte 232,0,0,0,0 // call 3eb3 <_sk_gather_a8_sse2+0x85>
+ .byte 232,0,0,0,0 // call 3ead <_sk_gather_a8_sse2+0x85>
.byte 89 // pop %ecx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,153,125,147,0,0 // mulps 0x937d(%ecx),%xmm3
+ .byte 15,89,153,131,147,0,0 // mulps 0x9383(%ecx),%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -60913,7 +60913,7 @@ _sk_store_a8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
- .byte 232,0,0,0,0 // call 3ef7 <_sk_store_a8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3ef1 <_sk_store_a8_sse2+0xe>
.byte 94 // pop %esi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -60922,7 +60922,7 @@ _sk_store_a8_sse2:
.byte 15,175,81,4 // imul 0x4(%ecx),%edx
.byte 3,23 // add (%edi),%edx
.byte 139,89,8 // mov 0x8(%ecx),%ebx
- .byte 15,40,166,25,146,0,0 // movaps 0x9219(%esi),%xmm4
+ .byte 15,40,166,31,146,0,0 // movaps 0x921f(%esi),%xmm4
.byte 15,89,227 // mulps %xmm3,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
.byte 102,15,114,244,16 // pslld $0x10,%xmm4
@@ -60931,7 +60931,7 @@ _sk_store_a8_sse2:
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,26 // jne 3f4c <_sk_store_a8_sse2+0x63>
+ .byte 117,26 // jne 3f46 <_sk_store_a8_sse2+0x63>
.byte 102,15,126,230 // movd %xmm4,%esi
.byte 137,52,58 // mov %esi,(%edx,%edi,1)
.byte 141,80,8 // lea 0x8(%eax),%edx
@@ -60949,26 +60949,26 @@ _sk_store_a8_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,57 // je 3f95 <_sk_store_a8_sse2+0xac>
+ .byte 116,57 // je 3f8f <_sk_store_a8_sse2+0xac>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,17 // je 3f72 <_sk_store_a8_sse2+0x89>
+ .byte 116,17 // je 3f6c <_sk_store_a8_sse2+0x89>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,211 // jne 3f39 <_sk_store_a8_sse2+0x50>
+ .byte 117,211 // jne 3f33 <_sk_store_a8_sse2+0x50>
.byte 102,15,127,101,200 // movdqa %xmm4,-0x38(%ebp)
.byte 138,93,208 // mov -0x30(%ebp),%bl
.byte 136,92,58,2 // mov %bl,0x2(%edx,%edi,1)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
- .byte 102,15,219,166,25,149,0,0 // pand 0x9519(%esi),%xmm4
+ .byte 102,15,219,166,31,149,0,0 // pand 0x951f(%esi),%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,126,230 // movd %xmm4,%esi
.byte 102,137,52,58 // mov %si,(%edx,%edi,1)
- .byte 235,164 // jmp 3f39 <_sk_store_a8_sse2+0x50>
+ .byte 235,164 // jmp 3f33 <_sk_store_a8_sse2+0x50>
.byte 102,15,127,101,216 // movdqa %xmm4,-0x28(%ebp)
.byte 138,93,216 // mov -0x28(%ebp),%bl
.byte 136,28,58 // mov %bl,(%edx,%edi,1)
- .byte 235,151 // jmp 3f39 <_sk_store_a8_sse2+0x50>
+ .byte 235,151 // jmp 3f33 <_sk_store_a8_sse2+0x50>
HIDDEN _sk_load_g8_sse2
.globl _sk_load_g8_sse2
@@ -60980,7 +60980,7 @@ _sk_load_g8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3fb0 <_sk_load_g8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3faa <_sk_load_g8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -60991,16 +60991,16 @@ _sk_load_g8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,63 // jne 400a <_sk_load_g8_sse2+0x68>
+ .byte 117,63 // jne 4004 <_sk_load_g8_sse2+0x68>
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,130,80,145,0,0 // pand 0x9150(%edx),%xmm0
+ .byte 102,15,219,130,86,145,0,0 // pand 0x9156(%edx),%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,128,146,0,0 // mulps 0x9280(%edx),%xmm0
+ .byte 15,89,130,134,146,0,0 // mulps 0x9286(%edx),%xmm0
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,144,144,0,0 // movaps 0x9090(%edx),%xmm3
+ .byte 15,40,154,150,144,0,0 // movaps 0x9096(%edx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 86 // push %esi
@@ -61014,12 +61014,12 @@ _sk_load_g8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 4044 <_sk_load_g8_sse2+0xa2>
+ .byte 116,50 // je 403e <_sk_load_g8_sse2+0xa2>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 402e <_sk_load_g8_sse2+0x8c>
+ .byte 116,19 // je 4028 <_sk_load_g8_sse2+0x8c>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,184 // jne 3fd8 <_sk_load_g8_sse2+0x36>
+ .byte 117,184 // jne 3fd2 <_sk_load_g8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -61028,10 +61028,10 @@ _sk_load_g8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,148 // jmp 3fd8 <_sk_load_g8_sse2+0x36>
+ .byte 235,148 // jmp 3fd2 <_sk_load_g8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,198 // movd %esi,%xmm0
- .byte 235,138 // jmp 3fd8 <_sk_load_g8_sse2+0x36>
+ .byte 235,138 // jmp 3fd2 <_sk_load_g8_sse2+0x36>
HIDDEN _sk_load_g8_dst_sse2
.globl _sk_load_g8_dst_sse2
@@ -61043,7 +61043,7 @@ _sk_load_g8_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 405c <_sk_load_g8_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4056 <_sk_load_g8_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -61054,17 +61054,17 @@ _sk_load_g8_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,73 // jne 40c0 <_sk_load_g8_dst_sse2+0x72>
+ .byte 117,73 // jne 40ba <_sk_load_g8_dst_sse2+0x72>
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,164,144,0,0 // pand 0x90a4(%edx),%xmm4
+ .byte 102,15,219,162,170,144,0,0 // pand 0x90aa(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,212,145,0,0 // mulps 0x91d4(%edx),%xmm4
+ .byte 15,89,162,218,145,0,0 // mulps 0x91da(%edx),%xmm4
.byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
.byte 15,41,97,32 // movaps %xmm4,0x20(%ecx)
.byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
- .byte 15,40,162,228,143,0,0 // movaps 0x8fe4(%edx),%xmm4
+ .byte 15,40,162,234,143,0,0 // movaps 0x8fea(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -61079,12 +61079,12 @@ _sk_load_g8_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 40fa <_sk_load_g8_dst_sse2+0xac>
+ .byte 116,50 // je 40f4 <_sk_load_g8_dst_sse2+0xac>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 40e4 <_sk_load_g8_dst_sse2+0x96>
+ .byte 116,19 // je 40de <_sk_load_g8_dst_sse2+0x96>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,174 // jne 4084 <_sk_load_g8_dst_sse2+0x36>
+ .byte 117,174 // jne 407e <_sk_load_g8_dst_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -61093,10 +61093,10 @@ _sk_load_g8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,138 // jmp 4084 <_sk_load_g8_dst_sse2+0x36>
+ .byte 235,138 // jmp 407e <_sk_load_g8_dst_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 235,128 // jmp 4084 <_sk_load_g8_dst_sse2+0x36>
+ .byte 235,128 // jmp 407e <_sk_load_g8_dst_sse2+0x36>
HIDDEN _sk_gather_g8_sse2
.globl _sk_gather_g8_sse2
@@ -61136,17 +61136,17 @@ _sk_gather_g8_sse2:
.byte 193,226,8 // shl $0x8,%edx
.byte 9,202 // or %ecx,%edx
.byte 102,15,196,194,0 // pinsrw $0x0,%edx,%xmm0
- .byte 232,0,0,0,0 // call 4184 <_sk_gather_g8_sse2+0x80>
+ .byte 232,0,0,0,0 // call 417e <_sk_gather_g8_sse2+0x80>
.byte 89 // pop %ecx
.byte 102,15,196,199,1 // pinsrw $0x1,%edi,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,129,172,144,0,0 // mulps 0x90ac(%ecx),%xmm0
+ .byte 15,89,129,178,144,0,0 // mulps 0x90b2(%ecx),%xmm0
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,153,188,142,0,0 // movaps 0x8ebc(%ecx),%xmm3
+ .byte 15,40,153,194,142,0,0 // movaps 0x8ec2(%ecx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 82 // push %edx
@@ -61168,7 +61168,7 @@ _sk_load_565_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 41cf <_sk_load_565_sse2+0xe>
+ .byte 232,0,0,0,0 // call 41c9 <_sk_load_565_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -61180,23 +61180,23 @@ _sk_load_565_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,97 // jne 424d <_sk_load_565_sse2+0x8c>
+ .byte 117,97 // jne 4247 <_sk_load_565_sse2+0x8c>
.byte 243,15,126,20,126 // movq (%esi,%edi,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,130,113,144,0,0 // movdqa 0x9071(%edx),%xmm0
+ .byte 102,15,111,130,119,144,0,0 // movdqa 0x9077(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,129,144,0,0 // mulps 0x9081(%edx),%xmm0
- .byte 102,15,111,138,145,144,0,0 // movdqa 0x9091(%edx),%xmm1
+ .byte 15,89,130,135,144,0,0 // mulps 0x9087(%edx),%xmm0
+ .byte 102,15,111,138,151,144,0,0 // movdqa 0x9097(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,161,144,0,0 // mulps 0x90a1(%edx),%xmm1
- .byte 102,15,219,146,177,144,0,0 // pand 0x90b1(%edx),%xmm2
+ .byte 15,89,138,167,144,0,0 // mulps 0x90a7(%edx),%xmm1
+ .byte 102,15,219,146,183,144,0,0 // pand 0x90b7(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,193,144,0,0 // mulps 0x90c1(%edx),%xmm2
+ .byte 15,89,146,199,144,0,0 // mulps 0x90c7(%edx),%xmm2
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,113,142,0,0 // movaps 0x8e71(%edx),%xmm3
+ .byte 15,40,154,119,142,0,0 // movaps 0x8e77(%edx),%xmm3
.byte 86 // push %esi
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
@@ -61208,22 +61208,22 @@ _sk_load_565_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 4283 <_sk_load_565_sse2+0xc2>
+ .byte 116,46 // je 427d <_sk_load_565_sse2+0xc2>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 4271 <_sk_load_565_sse2+0xb0>
+ .byte 116,19 // je 426b <_sk_load_565_sse2+0xb0>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,146 // jne 41f5 <_sk_load_565_sse2+0x34>
+ .byte 117,146 // jne 41ef <_sk_load_565_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,15,110,4,126 // movd (%esi,%edi,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,208 // movsd %xmm0,%xmm2
- .byte 233,114,255,255,255 // jmp 41f5 <_sk_load_565_sse2+0x34>
+ .byte 233,114,255,255,255 // jmp 41ef <_sk_load_565_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,214 // movd %esi,%xmm2
- .byte 233,101,255,255,255 // jmp 41f5 <_sk_load_565_sse2+0x34>
+ .byte 233,101,255,255,255 // jmp 41ef <_sk_load_565_sse2+0x34>
HIDDEN _sk_load_565_dst_sse2
.globl _sk_load_565_dst_sse2
@@ -61235,7 +61235,7 @@ _sk_load_565_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 429e <_sk_load_565_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4298 <_sk_load_565_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -61247,24 +61247,24 @@ _sk_load_565_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,113 // jne 432c <_sk_load_565_dst_sse2+0x9c>
+ .byte 117,113 // jne 4326 <_sk_load_565_dst_sse2+0x9c>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,162,143,0,0 // movdqa 0x8fa2(%edx),%xmm5
+ .byte 102,15,111,170,168,143,0,0 // movdqa 0x8fa8(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,178,143,0,0 // mulps 0x8fb2(%edx),%xmm5
+ .byte 15,89,170,184,143,0,0 // mulps 0x8fb8(%edx),%xmm5
.byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
- .byte 102,15,111,170,194,143,0,0 // movdqa 0x8fc2(%edx),%xmm5
+ .byte 102,15,111,170,200,143,0,0 // movdqa 0x8fc8(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,210,143,0,0 // mulps 0x8fd2(%edx),%xmm5
+ .byte 15,89,170,216,143,0,0 // mulps 0x8fd8(%edx),%xmm5
.byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
- .byte 102,15,219,162,226,143,0,0 // pand 0x8fe2(%edx),%xmm4
+ .byte 102,15,219,162,232,143,0,0 // pand 0x8fe8(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,242,143,0,0 // mulps 0x8ff2(%edx),%xmm4
+ .byte 15,89,162,248,143,0,0 // mulps 0x8ff8(%edx),%xmm4
.byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
- .byte 15,40,162,162,141,0,0 // movaps 0x8da2(%edx),%xmm4
+ .byte 15,40,162,168,141,0,0 // movaps 0x8da8(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -61279,22 +61279,22 @@ _sk_load_565_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 4362 <_sk_load_565_dst_sse2+0xd2>
+ .byte 116,46 // je 435c <_sk_load_565_dst_sse2+0xd2>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 4350 <_sk_load_565_dst_sse2+0xc0>
+ .byte 116,19 // je 434a <_sk_load_565_dst_sse2+0xc0>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,130 // jne 42c4 <_sk_load_565_dst_sse2+0x34>
+ .byte 117,130 // jne 42be <_sk_load_565_dst_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,110,44,126 // movd (%esi,%edi,2),%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,98,255,255,255 // jmp 42c4 <_sk_load_565_dst_sse2+0x34>
+ .byte 233,98,255,255,255 // jmp 42be <_sk_load_565_dst_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 233,85,255,255,255 // jmp 42c4 <_sk_load_565_dst_sse2+0x34>
+ .byte 233,85,255,255,255 // jmp 42be <_sk_load_565_dst_sse2+0x34>
HIDDEN _sk_gather_565_sse2
.globl _sk_gather_565_sse2
@@ -61329,25 +61329,25 @@ _sk_gather_565_sse2:
.byte 102,15,196,209,2 // pinsrw $0x2,%ecx,%xmm2
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx
- .byte 232,0,0,0,0 // call 43ea <_sk_gather_565_sse2+0x7b>
+ .byte 232,0,0,0,0 // call 43e4 <_sk_gather_565_sse2+0x7b>
.byte 90 // pop %edx
.byte 102,15,196,209,3 // pinsrw $0x3,%ecx,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,130,86,142,0,0 // movdqa 0x8e56(%edx),%xmm0
+ .byte 102,15,111,130,92,142,0,0 // movdqa 0x8e5c(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,102,142,0,0 // mulps 0x8e66(%edx),%xmm0
- .byte 102,15,111,138,118,142,0,0 // movdqa 0x8e76(%edx),%xmm1
+ .byte 15,89,130,108,142,0,0 // mulps 0x8e6c(%edx),%xmm0
+ .byte 102,15,111,138,124,142,0,0 // movdqa 0x8e7c(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,134,142,0,0 // mulps 0x8e86(%edx),%xmm1
- .byte 102,15,219,146,150,142,0,0 // pand 0x8e96(%edx),%xmm2
+ .byte 15,89,138,140,142,0,0 // mulps 0x8e8c(%edx),%xmm1
+ .byte 102,15,219,146,156,142,0,0 // pand 0x8e9c(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,166,142,0,0 // mulps 0x8ea6(%edx),%xmm2
+ .byte 15,89,146,172,142,0,0 // mulps 0x8eac(%edx),%xmm2
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,86,140,0,0 // movaps 0x8c56(%edx),%xmm3
+ .byte 15,40,154,92,140,0,0 // movaps 0x8c5c(%edx),%xmm3
.byte 81 // push %ecx
.byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,80,4 // call *0x4(%eax)
@@ -61365,7 +61365,7 @@ _sk_store_565_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 445d <_sk_store_565_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4457 <_sk_store_565_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -61375,8 +61375,8 @@ _sk_store_565_sse2:
.byte 1,210 // add %edx,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,195,143,0,0 // movaps 0x8fc3(%edi),%xmm4
- .byte 15,40,175,211,143,0,0 // movaps 0x8fd3(%edi),%xmm5
+ .byte 15,40,167,201,143,0,0 // movaps 0x8fc9(%edi),%xmm4
+ .byte 15,40,175,217,143,0,0 // movaps 0x8fd9(%edi),%xmm5
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,89,244 // mulps %xmm4,%xmm6
@@ -61396,7 +61396,7 @@ _sk_store_565_sse2:
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,109,236 // movd %xmm5,-0x14(%ebp)
.byte 133,219 // test %ebx,%ebx
- .byte 117,34 // jne 44f1 <_sk_store_565_sse2+0xa2>
+ .byte 117,34 // jne 44eb <_sk_store_565_sse2+0xa2>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,15,126,235 // movd %xmm5,%ebx
.byte 137,60,114 // mov %edi,(%edx,%esi,2)
@@ -61416,20 +61416,20 @@ _sk_store_565_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,37 // je 4527 <_sk_store_565_sse2+0xd8>
+ .byte 116,37 // je 4521 <_sk_store_565_sse2+0xd8>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,15 // je 4516 <_sk_store_565_sse2+0xc7>
+ .byte 116,15 // je 4510 <_sk_store_565_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,210 // jne 44de <_sk_store_565_sse2+0x8f>
+ .byte 117,210 // jne 44d8 <_sk_store_565_sse2+0x8f>
.byte 102,15,197,252,4 // pextrw $0x4,%xmm4,%edi
.byte 102,137,124,114,4 // mov %di,0x4(%edx,%esi,2)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
.byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4
.byte 102,15,126,36,114 // movd %xmm4,(%edx,%esi,2)
- .byte 235,183 // jmp 44de <_sk_store_565_sse2+0x8f>
+ .byte 235,183 // jmp 44d8 <_sk_store_565_sse2+0x8f>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,137,60,114 // mov %di,(%edx,%esi,2)
- .byte 235,173 // jmp 44de <_sk_store_565_sse2+0x8f>
+ .byte 235,173 // jmp 44d8 <_sk_store_565_sse2+0x8f>
HIDDEN _sk_load_4444_sse2
.globl _sk_load_4444_sse2
@@ -61441,7 +61441,7 @@ _sk_load_4444_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 453f <_sk_load_4444_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4539 <_sk_load_4444_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -61453,24 +61453,24 @@ _sk_load_4444_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,112 // jne 45cc <_sk_load_4444_sse2+0x9b>
+ .byte 117,112 // jne 45c6 <_sk_load_4444_sse2+0x9b>
.byte 243,15,126,28,126 // movq (%esi,%edi,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,130,1,143,0,0 // movdqa 0x8f01(%edx),%xmm0
+ .byte 102,15,111,130,7,143,0,0 // movdqa 0x8f07(%edx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,17,143,0,0 // mulps 0x8f11(%edx),%xmm0
- .byte 102,15,111,138,33,143,0,0 // movdqa 0x8f21(%edx),%xmm1
+ .byte 15,89,130,23,143,0,0 // mulps 0x8f17(%edx),%xmm0
+ .byte 102,15,111,138,39,143,0,0 // movdqa 0x8f27(%edx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,49,143,0,0 // mulps 0x8f31(%edx),%xmm1
- .byte 102,15,111,146,65,143,0,0 // movdqa 0x8f41(%edx),%xmm2
+ .byte 15,89,138,55,143,0,0 // mulps 0x8f37(%edx),%xmm1
+ .byte 102,15,111,146,71,143,0,0 // movdqa 0x8f47(%edx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,81,143,0,0 // mulps 0x8f51(%edx),%xmm2
- .byte 102,15,219,154,97,143,0,0 // pand 0x8f61(%edx),%xmm3
+ .byte 15,89,146,87,143,0,0 // mulps 0x8f57(%edx),%xmm2
+ .byte 102,15,219,154,103,143,0,0 // pand 0x8f67(%edx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,113,143,0,0 // mulps 0x8f71(%edx),%xmm3
+ .byte 15,89,154,119,143,0,0 // mulps 0x8f77(%edx),%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
.byte 82 // push %edx
@@ -61484,22 +61484,22 @@ _sk_load_4444_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 4602 <_sk_load_4444_sse2+0xd1>
+ .byte 116,46 // je 45fc <_sk_load_4444_sse2+0xd1>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 45f0 <_sk_load_4444_sse2+0xbf>
+ .byte 116,19 // je 45ea <_sk_load_4444_sse2+0xbf>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,131 // jne 4565 <_sk_load_4444_sse2+0x34>
+ .byte 117,131 // jne 455f <_sk_load_4444_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,110,4,126 // movd (%esi,%edi,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,216 // movsd %xmm0,%xmm3
- .byte 233,99,255,255,255 // jmp 4565 <_sk_load_4444_sse2+0x34>
+ .byte 233,99,255,255,255 // jmp 455f <_sk_load_4444_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,222 // movd %esi,%xmm3
- .byte 233,86,255,255,255 // jmp 4565 <_sk_load_4444_sse2+0x34>
+ .byte 233,86,255,255,255 // jmp 455f <_sk_load_4444_sse2+0x34>
HIDDEN _sk_load_4444_dst_sse2
.globl _sk_load_4444_dst_sse2
@@ -61511,7 +61511,7 @@ _sk_load_4444_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 461d <_sk_load_4444_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4617 <_sk_load_4444_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -61523,27 +61523,27 @@ _sk_load_4444_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,128,0,0,0 // jne 46be <_sk_load_4444_dst_sse2+0xaf>
+ .byte 15,133,128,0,0,0 // jne 46b8 <_sk_load_4444_dst_sse2+0xaf>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,35,142,0,0 // movdqa 0x8e23(%edx),%xmm5
+ .byte 102,15,111,170,41,142,0,0 // movdqa 0x8e29(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,51,142,0,0 // mulps 0x8e33(%edx),%xmm5
+ .byte 15,89,170,57,142,0,0 // mulps 0x8e39(%edx),%xmm5
.byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
- .byte 102,15,111,170,67,142,0,0 // movdqa 0x8e43(%edx),%xmm5
+ .byte 102,15,111,170,73,142,0,0 // movdqa 0x8e49(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,83,142,0,0 // mulps 0x8e53(%edx),%xmm5
+ .byte 15,89,170,89,142,0,0 // mulps 0x8e59(%edx),%xmm5
.byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
- .byte 102,15,111,170,99,142,0,0 // movdqa 0x8e63(%edx),%xmm5
+ .byte 102,15,111,170,105,142,0,0 // movdqa 0x8e69(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,115,142,0,0 // mulps 0x8e73(%edx),%xmm5
+ .byte 15,89,170,121,142,0,0 // mulps 0x8e79(%edx),%xmm5
.byte 15,41,105,48 // movaps %xmm5,0x30(%ecx)
- .byte 102,15,219,162,131,142,0,0 // pand 0x8e83(%edx),%xmm4
+ .byte 102,15,219,162,137,142,0,0 // pand 0x8e89(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,147,142,0,0 // mulps 0x8e93(%edx),%xmm4
+ .byte 15,89,162,153,142,0,0 // mulps 0x8e99(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -61558,22 +61558,22 @@ _sk_load_4444_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 46f8 <_sk_load_4444_dst_sse2+0xe9>
+ .byte 116,50 // je 46f2 <_sk_load_4444_dst_sse2+0xe9>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,23 // je 46e6 <_sk_load_4444_dst_sse2+0xd7>
+ .byte 116,23 // je 46e0 <_sk_load_4444_dst_sse2+0xd7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,111,255,255,255 // jne 4647 <_sk_load_4444_dst_sse2+0x38>
+ .byte 15,133,111,255,255,255 // jne 4641 <_sk_load_4444_dst_sse2+0x38>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,110,44,126 // movd (%esi,%edi,2),%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,79,255,255,255 // jmp 4647 <_sk_load_4444_dst_sse2+0x38>
+ .byte 233,79,255,255,255 // jmp 4641 <_sk_load_4444_dst_sse2+0x38>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 233,66,255,255,255 // jmp 4647 <_sk_load_4444_dst_sse2+0x38>
+ .byte 233,66,255,255,255 // jmp 4641 <_sk_load_4444_dst_sse2+0x38>
HIDDEN _sk_gather_4444_sse2
.globl _sk_gather_4444_sse2
@@ -61609,25 +61609,25 @@ _sk_gather_4444_sse2:
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx
.byte 102,15,196,217,3 // pinsrw $0x3,%ecx,%xmm3
- .byte 232,0,0,0,0 // call 4785 <_sk_gather_4444_sse2+0x80>
+ .byte 232,0,0,0,0 // call 477f <_sk_gather_4444_sse2+0x80>
.byte 89 // pop %ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,129,187,140,0,0 // movdqa 0x8cbb(%ecx),%xmm0
+ .byte 102,15,111,129,193,140,0,0 // movdqa 0x8cc1(%ecx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,129,203,140,0,0 // mulps 0x8ccb(%ecx),%xmm0
- .byte 102,15,111,137,219,140,0,0 // movdqa 0x8cdb(%ecx),%xmm1
+ .byte 15,89,129,209,140,0,0 // mulps 0x8cd1(%ecx),%xmm0
+ .byte 102,15,111,137,225,140,0,0 // movdqa 0x8ce1(%ecx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,137,235,140,0,0 // mulps 0x8ceb(%ecx),%xmm1
- .byte 102,15,111,145,251,140,0,0 // movdqa 0x8cfb(%ecx),%xmm2
+ .byte 15,89,137,241,140,0,0 // mulps 0x8cf1(%ecx),%xmm1
+ .byte 102,15,111,145,1,141,0,0 // movdqa 0x8d01(%ecx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,145,11,141,0,0 // mulps 0x8d0b(%ecx),%xmm2
- .byte 102,15,219,153,27,141,0,0 // pand 0x8d1b(%ecx),%xmm3
+ .byte 15,89,145,17,141,0,0 // mulps 0x8d11(%ecx),%xmm2
+ .byte 102,15,219,153,33,141,0,0 // pand 0x8d21(%ecx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,153,43,141,0,0 // mulps 0x8d2b(%ecx),%xmm3
+ .byte 15,89,153,49,141,0,0 // mulps 0x8d31(%ecx),%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
.byte 81 // push %ecx
@@ -61647,7 +61647,7 @@ _sk_store_4444_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4802 <_sk_store_4444_sse2+0xe>
+ .byte 232,0,0,0,0 // call 47fc <_sk_store_4444_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -61657,7 +61657,7 @@ _sk_store_4444_sse2:
.byte 1,210 // add %edx,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,190,140,0,0 // movaps 0x8cbe(%edi),%xmm4
+ .byte 15,40,167,196,140,0,0 // movaps 0x8cc4(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -61683,7 +61683,7 @@ _sk_store_4444_sse2:
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,109,236 // movd %xmm5,-0x14(%ebp)
.byte 133,219 // test %ebx,%ebx
- .byte 117,34 // jne 48a5 <_sk_store_4444_sse2+0xb1>
+ .byte 117,34 // jne 489f <_sk_store_4444_sse2+0xb1>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,15,126,235 // movd %xmm5,%ebx
.byte 137,60,114 // mov %edi,(%edx,%esi,2)
@@ -61703,20 +61703,20 @@ _sk_store_4444_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,37 // je 48db <_sk_store_4444_sse2+0xe7>
+ .byte 116,37 // je 48d5 <_sk_store_4444_sse2+0xe7>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,15 // je 48ca <_sk_store_4444_sse2+0xd6>
+ .byte 116,15 // je 48c4 <_sk_store_4444_sse2+0xd6>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,210 // jne 4892 <_sk_store_4444_sse2+0x9e>
+ .byte 117,210 // jne 488c <_sk_store_4444_sse2+0x9e>
.byte 102,15,197,252,4 // pextrw $0x4,%xmm4,%edi
.byte 102,137,124,114,4 // mov %di,0x4(%edx,%esi,2)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
.byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4
.byte 102,15,126,36,114 // movd %xmm4,(%edx,%esi,2)
- .byte 235,183 // jmp 4892 <_sk_store_4444_sse2+0x9e>
+ .byte 235,183 // jmp 488c <_sk_store_4444_sse2+0x9e>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,137,60,114 // mov %di,(%edx,%esi,2)
- .byte 235,173 // jmp 4892 <_sk_store_4444_sse2+0x9e>
+ .byte 235,173 // jmp 488c <_sk_store_4444_sse2+0x9e>
HIDDEN _sk_load_8888_sse2
.globl _sk_load_8888_sse2
@@ -61728,7 +61728,7 @@ _sk_load_8888_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 48f3 <_sk_load_8888_sse2+0xe>
+ .byte 232,0,0,0,0 // call 48ed <_sk_load_8888_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -61740,13 +61740,13 @@ _sk_load_8888_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,102 // jne 4977 <_sk_load_8888_sse2+0x92>
+ .byte 117,102 // jne 4971 <_sk_load_8888_sse2+0x92>
.byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
- .byte 102,15,111,146,13,136,0,0 // movdqa 0x880d(%edx),%xmm2
+ .byte 102,15,111,146,19,136,0,0 // movdqa 0x8813(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,162,61,137,0,0 // movaps 0x893d(%edx),%xmm4
+ .byte 15,40,162,67,137,0,0 // movaps 0x8943(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -61774,18 +61774,18 @@ _sk_load_8888_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,35 // je 49a2 <_sk_load_8888_sse2+0xbd>
+ .byte 116,35 // je 499c <_sk_load_8888_sse2+0xbd>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4998 <_sk_load_8888_sse2+0xb3>
+ .byte 116,16 // je 4992 <_sk_load_8888_sse2+0xb3>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,137 // jne 4916 <_sk_load_8888_sse2+0x31>
+ .byte 117,137 // jne 4910 <_sk_load_8888_sse2+0x31>
.byte 102,15,110,68,190,8 // movd 0x8(%esi,%edi,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,18,28,190 // movlpd (%esi,%edi,4),%xmm3
- .byte 233,116,255,255,255 // jmp 4916 <_sk_load_8888_sse2+0x31>
+ .byte 233,116,255,255,255 // jmp 4910 <_sk_load_8888_sse2+0x31>
.byte 102,15,110,28,190 // movd (%esi,%edi,4),%xmm3
- .byte 233,106,255,255,255 // jmp 4916 <_sk_load_8888_sse2+0x31>
+ .byte 233,106,255,255,255 // jmp 4910 <_sk_load_8888_sse2+0x31>
HIDDEN _sk_load_8888_dst_sse2
.globl _sk_load_8888_dst_sse2
@@ -61797,7 +61797,7 @@ _sk_load_8888_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 49ba <_sk_load_8888_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 49b4 <_sk_load_8888_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -61809,13 +61809,13 @@ _sk_load_8888_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,118 // jne 4a4e <_sk_load_8888_dst_sse2+0xa2>
+ .byte 117,118 // jne 4a48 <_sk_load_8888_dst_sse2+0xa2>
.byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
- .byte 102,15,111,170,70,135,0,0 // movdqa 0x8746(%edx),%xmm5
+ .byte 102,15,111,170,76,135,0,0 // movdqa 0x874c(%edx),%xmm5
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,186,118,136,0,0 // movaps 0x8876(%edx),%xmm7
+ .byte 15,40,186,124,136,0,0 // movaps 0x887c(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
.byte 15,41,113,16 // movaps %xmm6,0x10(%ecx)
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
@@ -61847,18 +61847,18 @@ _sk_load_8888_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,39 // je 4a7d <_sk_load_8888_dst_sse2+0xd1>
+ .byte 116,39 // je 4a77 <_sk_load_8888_dst_sse2+0xd1>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,20 // je 4a73 <_sk_load_8888_dst_sse2+0xc7>
+ .byte 116,20 // je 4a6d <_sk_load_8888_dst_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,117,255,255,255 // jne 49dd <_sk_load_8888_dst_sse2+0x31>
+ .byte 15,133,117,255,255,255 // jne 49d7 <_sk_load_8888_dst_sse2+0x31>
.byte 102,15,110,100,190,8 // movd 0x8(%esi,%edi,4),%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,18,36,190 // movlpd (%esi,%edi,4),%xmm4
- .byte 233,96,255,255,255 // jmp 49dd <_sk_load_8888_dst_sse2+0x31>
+ .byte 233,96,255,255,255 // jmp 49d7 <_sk_load_8888_dst_sse2+0x31>
.byte 102,15,110,36,190 // movd (%esi,%edi,4),%xmm4
- .byte 233,86,255,255,255 // jmp 49dd <_sk_load_8888_dst_sse2+0x31>
+ .byte 233,86,255,255,255 // jmp 49d7 <_sk_load_8888_dst_sse2+0x31>
HIDDEN _sk_gather_8888_sse2
.globl _sk_gather_8888_sse2
@@ -61892,16 +61892,16 @@ _sk_gather_8888_sse2:
.byte 102,15,110,28,138 // movd (%edx,%ecx,4),%xmm3
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,110,4,138 // movd (%edx,%ecx,4),%xmm0
- .byte 232,0,0,0,0 // call 4afd <_sk_gather_8888_sse2+0x76>
+ .byte 232,0,0,0,0 // call 4af7 <_sk_gather_8888_sse2+0x76>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,145,3,134,0,0 // movdqa 0x8603(%ecx),%xmm2
+ .byte 102,15,111,145,9,134,0,0 // movdqa 0x8609(%ecx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,161,51,135,0,0 // movaps 0x8733(%ecx),%xmm4
+ .byte 15,40,161,57,135,0,0 // movaps 0x8739(%ecx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -61935,7 +61935,7 @@ _sk_store_8888_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4b78 <_sk_store_8888_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4b72 <_sk_store_8888_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -61945,7 +61945,7 @@ _sk_store_8888_sse2:
.byte 193,226,2 // shl $0x2,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,152,133,0,0 // movaps 0x8598(%edi),%xmm4
+ .byte 15,40,167,158,133,0,0 // movaps 0x859e(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -61965,7 +61965,7 @@ _sk_store_8888_sse2:
.byte 102,15,235,229 // por %xmm5,%xmm4
.byte 102,15,235,230 // por %xmm6,%xmm4
.byte 133,219 // test %ebx,%ebx
- .byte 117,24 // jne 4bf5 <_sk_store_8888_sse2+0x8b>
+ .byte 117,24 // jne 4bef <_sk_store_8888_sse2+0x8b>
.byte 243,15,127,36,178 // movdqu %xmm4,(%edx,%esi,4)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -61980,17 +61980,17 @@ _sk_store_8888_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,28 // je 4c19 <_sk_store_8888_sse2+0xaf>
+ .byte 116,28 // je 4c13 <_sk_store_8888_sse2+0xaf>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4c12 <_sk_store_8888_sse2+0xa8>
+ .byte 116,16 // je 4c0c <_sk_store_8888_sse2+0xa8>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,219 // jne 4be2 <_sk_store_8888_sse2+0x78>
+ .byte 117,219 // jne 4bdc <_sk_store_8888_sse2+0x78>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,15,126,108,178,8 // movd %xmm5,0x8(%edx,%esi,4)
.byte 102,15,214,36,178 // movq %xmm4,(%edx,%esi,4)
- .byte 235,201 // jmp 4be2 <_sk_store_8888_sse2+0x78>
+ .byte 235,201 // jmp 4bdc <_sk_store_8888_sse2+0x78>
.byte 102,15,126,36,178 // movd %xmm4,(%edx,%esi,4)
- .byte 235,194 // jmp 4be2 <_sk_store_8888_sse2+0x78>
+ .byte 235,194 // jmp 4bdc <_sk_store_8888_sse2+0x78>
HIDDEN _sk_load_bgra_sse2
.globl _sk_load_bgra_sse2
@@ -62002,7 +62002,7 @@ _sk_load_bgra_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4c2e <_sk_load_bgra_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4c28 <_sk_load_bgra_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -62014,13 +62014,13 @@ _sk_load_bgra_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,102 // jne 4cb2 <_sk_load_bgra_sse2+0x92>
+ .byte 117,102 // jne 4cac <_sk_load_bgra_sse2+0x92>
.byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
- .byte 102,15,111,130,210,132,0,0 // movdqa 0x84d2(%edx),%xmm0
+ .byte 102,15,111,130,216,132,0,0 // movdqa 0x84d8(%edx),%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,162,2,134,0,0 // movaps 0x8602(%edx),%xmm4
+ .byte 15,40,162,8,134,0,0 // movaps 0x8608(%edx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -62048,18 +62048,18 @@ _sk_load_bgra_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,35 // je 4cdd <_sk_load_bgra_sse2+0xbd>
+ .byte 116,35 // je 4cd7 <_sk_load_bgra_sse2+0xbd>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4cd3 <_sk_load_bgra_sse2+0xb3>
+ .byte 116,16 // je 4ccd <_sk_load_bgra_sse2+0xb3>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,137 // jne 4c51 <_sk_load_bgra_sse2+0x31>
+ .byte 117,137 // jne 4c4b <_sk_load_bgra_sse2+0x31>
.byte 102,15,110,68,190,8 // movd 0x8(%esi,%edi,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,18,28,190 // movlpd (%esi,%edi,4),%xmm3
- .byte 233,116,255,255,255 // jmp 4c51 <_sk_load_bgra_sse2+0x31>
+ .byte 233,116,255,255,255 // jmp 4c4b <_sk_load_bgra_sse2+0x31>
.byte 102,15,110,28,190 // movd (%esi,%edi,4),%xmm3
- .byte 233,106,255,255,255 // jmp 4c51 <_sk_load_bgra_sse2+0x31>
+ .byte 233,106,255,255,255 // jmp 4c4b <_sk_load_bgra_sse2+0x31>
HIDDEN _sk_load_bgra_dst_sse2
.globl _sk_load_bgra_dst_sse2
@@ -62071,7 +62071,7 @@ _sk_load_bgra_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4cf5 <_sk_load_bgra_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4cef <_sk_load_bgra_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -62083,13 +62083,13 @@ _sk_load_bgra_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,118 // jne 4d89 <_sk_load_bgra_dst_sse2+0xa2>
+ .byte 117,118 // jne 4d83 <_sk_load_bgra_dst_sse2+0xa2>
.byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
- .byte 102,15,111,170,11,132,0,0 // movdqa 0x840b(%edx),%xmm5
+ .byte 102,15,111,170,17,132,0,0 // movdqa 0x8411(%edx),%xmm5
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,186,59,133,0,0 // movaps 0x853b(%edx),%xmm7
+ .byte 15,40,186,65,133,0,0 // movaps 0x8541(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
.byte 15,41,113,48 // movaps %xmm6,0x30(%ecx)
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
@@ -62121,18 +62121,18 @@ _sk_load_bgra_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,39 // je 4db8 <_sk_load_bgra_dst_sse2+0xd1>
+ .byte 116,39 // je 4db2 <_sk_load_bgra_dst_sse2+0xd1>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,20 // je 4dae <_sk_load_bgra_dst_sse2+0xc7>
+ .byte 116,20 // je 4da8 <_sk_load_bgra_dst_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,117,255,255,255 // jne 4d18 <_sk_load_bgra_dst_sse2+0x31>
+ .byte 15,133,117,255,255,255 // jne 4d12 <_sk_load_bgra_dst_sse2+0x31>
.byte 102,15,110,100,190,8 // movd 0x8(%esi,%edi,4),%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,18,36,190 // movlpd (%esi,%edi,4),%xmm4
- .byte 233,96,255,255,255 // jmp 4d18 <_sk_load_bgra_dst_sse2+0x31>
+ .byte 233,96,255,255,255 // jmp 4d12 <_sk_load_bgra_dst_sse2+0x31>
.byte 102,15,110,36,190 // movd (%esi,%edi,4),%xmm4
- .byte 233,86,255,255,255 // jmp 4d18 <_sk_load_bgra_dst_sse2+0x31>
+ .byte 233,86,255,255,255 // jmp 4d12 <_sk_load_bgra_dst_sse2+0x31>
HIDDEN _sk_gather_bgra_sse2
.globl _sk_gather_bgra_sse2
@@ -62166,16 +62166,16 @@ _sk_gather_bgra_sse2:
.byte 102,15,110,28,138 // movd (%edx,%ecx,4),%xmm3
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,110,4,138 // movd (%edx,%ecx,4),%xmm0
- .byte 232,0,0,0,0 // call 4e38 <_sk_gather_bgra_sse2+0x76>
+ .byte 232,0,0,0,0 // call 4e32 <_sk_gather_bgra_sse2+0x76>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,129,200,130,0,0 // movdqa 0x82c8(%ecx),%xmm0
+ .byte 102,15,111,129,206,130,0,0 // movdqa 0x82ce(%ecx),%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,161,248,131,0,0 // movaps 0x83f8(%ecx),%xmm4
+ .byte 15,40,161,254,131,0,0 // movaps 0x83fe(%ecx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -62209,7 +62209,7 @@ _sk_store_bgra_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4eb3 <_sk_store_bgra_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4ead <_sk_store_bgra_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -62219,7 +62219,7 @@ _sk_store_bgra_sse2:
.byte 193,226,2 // shl $0x2,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,93,130,0,0 // movaps 0x825d(%edi),%xmm4
+ .byte 15,40,167,99,130,0,0 // movaps 0x8263(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -62239,7 +62239,7 @@ _sk_store_bgra_sse2:
.byte 102,15,235,229 // por %xmm5,%xmm4
.byte 102,15,235,230 // por %xmm6,%xmm4
.byte 133,219 // test %ebx,%ebx
- .byte 117,24 // jne 4f30 <_sk_store_bgra_sse2+0x8b>
+ .byte 117,24 // jne 4f2a <_sk_store_bgra_sse2+0x8b>
.byte 243,15,127,36,178 // movdqu %xmm4,(%edx,%esi,4)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -62254,17 +62254,17 @@ _sk_store_bgra_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,28 // je 4f54 <_sk_store_bgra_sse2+0xaf>
+ .byte 116,28 // je 4f4e <_sk_store_bgra_sse2+0xaf>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4f4d <_sk_store_bgra_sse2+0xa8>
+ .byte 116,16 // je 4f47 <_sk_store_bgra_sse2+0xa8>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,219 // jne 4f1d <_sk_store_bgra_sse2+0x78>
+ .byte 117,219 // jne 4f17 <_sk_store_bgra_sse2+0x78>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,15,126,108,178,8 // movd %xmm5,0x8(%edx,%esi,4)
.byte 102,15,214,36,178 // movq %xmm4,(%edx,%esi,4)
- .byte 235,201 // jmp 4f1d <_sk_store_bgra_sse2+0x78>
+ .byte 235,201 // jmp 4f17 <_sk_store_bgra_sse2+0x78>
.byte 102,15,126,36,178 // movd %xmm4,(%edx,%esi,4)
- .byte 235,194 // jmp 4f1d <_sk_store_bgra_sse2+0x78>
+ .byte 235,194 // jmp 4f17 <_sk_store_bgra_sse2+0x78>
HIDDEN _sk_load_f16_sse2
.globl _sk_load_f16_sse2
@@ -62276,7 +62276,7 @@ _sk_load_f16_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,92 // sub $0x5c,%esp
- .byte 232,0,0,0,0 // call 4f69 <_sk_load_f16_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4f63 <_sk_load_f16_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -62288,7 +62288,7 @@ _sk_load_f16_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,160,1,0,0 // jne 512b <_sk_load_f16_sse2+0x1d0>
+ .byte 15,133,160,1,0,0 // jne 5125 <_sk_load_f16_sse2+0x1d0>
.byte 102,15,16,4,254 // movupd (%esi,%edi,8),%xmm0
.byte 243,15,111,76,254,16 // movdqu 0x10(%esi,%edi,8),%xmm1
.byte 102,15,40,216 // movapd %xmm0,%xmm3
@@ -62316,7 +62316,7 @@ _sk_load_f16_sse2:
.byte 102,15,126,69,232 // movd %xmm0,-0x18(%ebp)
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,111,154,103,133,0,0 // movdqa 0x8567(%edx),%xmm3
+ .byte 102,15,111,154,109,133,0,0 // movdqa 0x856d(%edx),%xmm3
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,219,227 // pand %xmm3,%xmm4
.byte 102,15,239,204 // pxor %xmm4,%xmm1
@@ -62349,15 +62349,15 @@ _sk_load_f16_sse2:
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
.byte 102,15,235,195 // por %xmm3,%xmm0
- .byte 102,15,111,154,119,133,0,0 // movdqa 0x8577(%edx),%xmm3
+ .byte 102,15,111,154,125,133,0,0 // movdqa 0x857d(%edx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
.byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,154,135,133,0,0 // movdqa 0x8587(%edx),%xmm3
+ .byte 102,15,111,154,141,133,0,0 // movdqa 0x858d(%edx),%xmm3
.byte 102,15,127,93,184 // movdqa %xmm3,-0x48(%ebp)
.byte 102,15,239,203 // pxor %xmm3,%xmm1
- .byte 102,15,111,154,151,133,0,0 // movdqa 0x8597(%edx),%xmm3
+ .byte 102,15,111,154,157,133,0,0 // movdqa 0x859d(%edx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,223,226 // pandn %xmm2,%xmm4
@@ -62389,12 +62389,12 @@ _sk_load_f16_sse2:
.byte 242,15,16,4,254 // movsd (%esi,%edi,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,89,254,255,255 // je 4f96 <_sk_load_f16_sse2+0x3b>
+ .byte 15,132,89,254,255,255 // je 4f90 <_sk_load_f16_sse2+0x3b>
.byte 102,15,22,68,254,8 // movhpd 0x8(%esi,%edi,8),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,74,254,255,255 // jb 4f96 <_sk_load_f16_sse2+0x3b>
+ .byte 15,130,74,254,255,255 // jb 4f90 <_sk_load_f16_sse2+0x3b>
.byte 243,15,126,76,254,16 // movq 0x10(%esi,%edi,8),%xmm1
- .byte 233,63,254,255,255 // jmp 4f96 <_sk_load_f16_sse2+0x3b>
+ .byte 233,63,254,255,255 // jmp 4f90 <_sk_load_f16_sse2+0x3b>
HIDDEN _sk_load_f16_dst_sse2
.globl _sk_load_f16_dst_sse2
@@ -62410,7 +62410,7 @@ _sk_load_f16_dst_sse2:
.byte 15,41,149,120,255,255,255 // movaps %xmm2,-0x88(%ebp)
.byte 102,15,127,77,136 // movdqa %xmm1,-0x78(%ebp)
.byte 15,41,69,152 // movaps %xmm0,-0x68(%ebp)
- .byte 232,0,0,0,0 // call 517f <_sk_load_f16_dst_sse2+0x28>
+ .byte 232,0,0,0,0 // call 5179 <_sk_load_f16_dst_sse2+0x28>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -62422,7 +62422,7 @@ _sk_load_f16_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,206,1,0,0 // jne 536f <_sk_load_f16_dst_sse2+0x218>
+ .byte 15,133,206,1,0,0 // jne 5369 <_sk_load_f16_dst_sse2+0x218>
.byte 102,15,16,4,254 // movupd (%esi,%edi,8),%xmm0
.byte 243,15,111,76,254,16 // movdqu 0x10(%esi,%edi,8),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -62450,7 +62450,7 @@ _sk_load_f16_dst_sse2:
.byte 102,15,126,85,232 // movd %xmm2,-0x18(%ebp)
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
- .byte 102,15,111,154,81,131,0,0 // movdqa 0x8351(%edx),%xmm3
+ .byte 102,15,111,154,87,131,0,0 // movdqa 0x8357(%edx),%xmm3
.byte 102,15,111,212 // movdqa %xmm4,%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 102,15,239,226 // pxor %xmm2,%xmm4
@@ -62458,13 +62458,13 @@ _sk_load_f16_dst_sse2:
.byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,15,111,146,113,131,0,0 // movdqa 0x8371(%edx),%xmm2
+ .byte 102,15,111,146,119,131,0,0 // movdqa 0x8377(%edx),%xmm2
.byte 102,15,127,85,168 // movdqa %xmm2,-0x58(%ebp)
.byte 102,15,239,226 // pxor %xmm2,%xmm4
- .byte 102,15,111,178,129,131,0,0 // movdqa 0x8381(%edx),%xmm6
+ .byte 102,15,111,178,135,131,0,0 // movdqa 0x8387(%edx),%xmm6
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
.byte 102,15,102,252 // pcmpgtd %xmm4,%xmm7
- .byte 102,15,111,146,97,131,0,0 // movdqa 0x8361(%edx),%xmm2
+ .byte 102,15,111,146,103,131,0,0 // movdqa 0x8367(%edx),%xmm2
.byte 102,15,127,85,184 // movdqa %xmm2,-0x48(%ebp)
.byte 102,15,254,202 // paddd %xmm2,%xmm1
.byte 102,15,223,249 // pandn %xmm1,%xmm7
@@ -62532,12 +62532,12 @@ _sk_load_f16_dst_sse2:
.byte 242,15,16,4,254 // movsd (%esi,%edi,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,43,254,255,255 // je 51ac <_sk_load_f16_dst_sse2+0x55>
+ .byte 15,132,43,254,255,255 // je 51a6 <_sk_load_f16_dst_sse2+0x55>
.byte 102,15,22,68,254,8 // movhpd 0x8(%esi,%edi,8),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,28,254,255,255 // jb 51ac <_sk_load_f16_dst_sse2+0x55>
+ .byte 15,130,28,254,255,255 // jb 51a6 <_sk_load_f16_dst_sse2+0x55>
.byte 243,15,126,76,254,16 // movq 0x10(%esi,%edi,8),%xmm1
- .byte 233,17,254,255,255 // jmp 51ac <_sk_load_f16_dst_sse2+0x55>
+ .byte 233,17,254,255,255 // jmp 51a6 <_sk_load_f16_dst_sse2+0x55>
HIDDEN _sk_gather_f16_sse2
.globl _sk_gather_f16_sse2
@@ -62575,7 +62575,7 @@ _sk_gather_f16_sse2:
.byte 102,15,126,194 // movd %xmm0,%edx
.byte 102,15,110,68,209,4 // movd 0x4(%ecx,%edx,8),%xmm0
.byte 102,15,110,60,209 // movd (%ecx,%edx,8),%xmm7
- .byte 232,0,0,0,0 // call 5429 <_sk_gather_f16_sse2+0x8e>
+ .byte 232,0,0,0,0 // call 5423 <_sk_gather_f16_sse2+0x8e>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,227 // punpckldq %xmm3,%xmm4
@@ -62608,7 +62608,7 @@ _sk_gather_f16_sse2:
.byte 102,15,126,69,248 // movd %xmm0,-0x8(%ebp)
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,111,153,167,128,0,0 // movdqa 0x80a7(%ecx),%xmm3
+ .byte 102,15,111,153,173,128,0,0 // movdqa 0x80ad(%ecx),%xmm3
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,219,227 // pand %xmm3,%xmm4
.byte 102,15,239,204 // pxor %xmm4,%xmm1
@@ -62641,15 +62641,15 @@ _sk_gather_f16_sse2:
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
.byte 102,15,235,195 // por %xmm3,%xmm0
- .byte 102,15,111,153,183,128,0,0 // movdqa 0x80b7(%ecx),%xmm3
+ .byte 102,15,111,153,189,128,0,0 // movdqa 0x80bd(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
.byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,153,199,128,0,0 // movdqa 0x80c7(%ecx),%xmm3
+ .byte 102,15,111,153,205,128,0,0 // movdqa 0x80cd(%ecx),%xmm3
.byte 102,15,127,93,200 // movdqa %xmm3,-0x38(%ebp)
.byte 102,15,239,203 // pxor %xmm3,%xmm1
- .byte 102,15,111,153,215,128,0,0 // movdqa 0x80d7(%ecx),%xmm3
+ .byte 102,15,111,153,221,128,0,0 // movdqa 0x80dd(%ecx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,223,226 // pandn %xmm2,%xmm4
@@ -62688,20 +62688,20 @@ _sk_store_f16_sse2:
.byte 131,236,80 // sub $0x50,%esp
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 55ec <_sk_store_f16_sse2+0x15>
+ .byte 232,0,0,0,0 // call 55e6 <_sk_store_f16_sse2+0x15>
.byte 88 // pop %eax
- .byte 102,15,111,176,4,127,0,0 // movdqa 0x7f04(%eax),%xmm6
+ .byte 102,15,111,176,10,127,0,0 // movdqa 0x7f0a(%eax),%xmm6
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,15,219,214 // pand %xmm6,%xmm2
.byte 102,15,127,69,200 // movdqa %xmm0,-0x38(%ebp)
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 102,15,239,234 // pxor %xmm2,%xmm5
- .byte 102,15,111,160,36,127,0,0 // movdqa 0x7f24(%eax),%xmm4
+ .byte 102,15,111,160,42,127,0,0 // movdqa 0x7f2a(%eax),%xmm4
.byte 102,15,114,210,16 // psrld $0x10,%xmm2
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,15,102,197 // pcmpgtd %xmm5,%xmm0
.byte 102,15,114,213,13 // psrld $0xd,%xmm5
- .byte 102,15,111,184,52,127,0,0 // movdqa 0x7f34(%eax),%xmm7
+ .byte 102,15,111,184,58,127,0,0 // movdqa 0x7f3a(%eax),%xmm7
.byte 102,15,254,215 // paddd %xmm7,%xmm2
.byte 102,15,127,125,232 // movdqa %xmm7,-0x18(%ebp)
.byte 102,15,254,213 // paddd %xmm5,%xmm2
@@ -62763,7 +62763,7 @@ _sk_store_f16_sse2:
.byte 3,55 // add (%edi),%esi
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,53 // jne 575e <_sk_store_f16_sse2+0x187>
+ .byte 117,53 // jne 5758 <_sk_store_f16_sse2+0x187>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,98,197 // punpckldq %xmm5,%xmm0
.byte 243,15,127,4,214 // movdqu %xmm0,(%esi,%edx,8)
@@ -62786,13 +62786,13 @@ _sk_store_f16_sse2:
.byte 102,15,98,213 // punpckldq %xmm5,%xmm2
.byte 102,15,214,20,214 // movq %xmm2,(%esi,%edx,8)
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,208 // je 5740 <_sk_store_f16_sse2+0x169>
+ .byte 116,208 // je 573a <_sk_store_f16_sse2+0x169>
.byte 102,15,23,84,214,8 // movhpd %xmm2,0x8(%esi,%edx,8)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,197 // jb 5740 <_sk_store_f16_sse2+0x169>
+ .byte 114,197 // jb 573a <_sk_store_f16_sse2+0x169>
.byte 102,15,106,205 // punpckhdq %xmm5,%xmm1
.byte 102,15,214,76,214,16 // movq %xmm1,0x10(%esi,%edx,8)
- .byte 235,185 // jmp 5740 <_sk_store_f16_sse2+0x169>
+ .byte 235,185 // jmp 573a <_sk_store_f16_sse2+0x169>
HIDDEN _sk_load_u16_be_sse2
.globl _sk_load_u16_be_sse2
@@ -62815,9 +62815,9 @@ _sk_load_u16_be_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 193,230,2 // shl $0x2,%esi
.byte 133,219 // test %ebx,%ebx
- .byte 232,0,0,0,0 // call 57b2 <_sk_load_u16_be_sse2+0x2b>
+ .byte 232,0,0,0,0 // call 57ac <_sk_load_u16_be_sse2+0x2b>
.byte 90 // pop %edx
- .byte 15,133,11,1,0,0 // jne 58c4 <_sk_load_u16_be_sse2+0x13d>
+ .byte 15,133,11,1,0,0 // jne 58be <_sk_load_u16_be_sse2+0x13d>
.byte 102,15,16,4,119 // movupd (%edi,%esi,2),%xmm0
.byte 243,15,111,76,119,16 // movdqu 0x10(%edi,%esi,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -62838,7 +62838,7 @@ _sk_load_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,162,238,122,0,0 // movaps 0x7aee(%edx),%xmm4
+ .byte 15,40,162,244,122,0,0 // movaps 0x7af4(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,205 // movdqa %xmm5,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -62888,12 +62888,12 @@ _sk_load_u16_be_sse2:
.byte 242,15,16,4,119 // movsd (%edi,%esi,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,238,254,255,255 // je 57c4 <_sk_load_u16_be_sse2+0x3d>
+ .byte 15,132,238,254,255,255 // je 57be <_sk_load_u16_be_sse2+0x3d>
.byte 102,15,22,68,119,8 // movhpd 0x8(%edi,%esi,2),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,223,254,255,255 // jb 57c4 <_sk_load_u16_be_sse2+0x3d>
+ .byte 15,130,223,254,255,255 // jb 57be <_sk_load_u16_be_sse2+0x3d>
.byte 243,15,126,76,119,16 // movq 0x10(%edi,%esi,2),%xmm1
- .byte 233,212,254,255,255 // jmp 57c4 <_sk_load_u16_be_sse2+0x3d>
+ .byte 233,212,254,255,255 // jmp 57be <_sk_load_u16_be_sse2+0x3d>
HIDDEN _sk_load_rgb_u16_be_sse2
.globl _sk_load_rgb_u16_be_sse2
@@ -62915,9 +62915,9 @@ _sk_load_rgb_u16_be_sse2:
.byte 3,50 // add (%edx),%esi
.byte 107,25,3 // imul $0x3,(%ecx),%ebx
.byte 133,255 // test %edi,%edi
- .byte 232,0,0,0,0 // call 5919 <_sk_load_rgb_u16_be_sse2+0x29>
+ .byte 232,0,0,0,0 // call 5913 <_sk_load_rgb_u16_be_sse2+0x29>
.byte 90 // pop %edx
- .byte 15,133,240,0,0,0 // jne 5a10 <_sk_load_rgb_u16_be_sse2+0x120>
+ .byte 15,133,240,0,0,0 // jne 5a0a <_sk_load_rgb_u16_be_sse2+0x120>
.byte 243,15,111,20,94 // movdqu (%esi,%ebx,2),%xmm2
.byte 243,15,111,92,94,8 // movdqu 0x8(%esi,%ebx,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -62942,7 +62942,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,170,135,121,0,0 // movaps 0x7987(%edx),%xmm5
+ .byte 15,40,170,141,121,0,0 // movaps 0x798d(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -62968,7 +62968,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,39,119,0,0 // movaps 0x7727(%edx),%xmm3
+ .byte 15,40,154,45,119,0,0 // movaps 0x772d(%edx),%xmm3
.byte 86 // push %esi
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
@@ -62982,20 +62982,20 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,15,196,84,94,4,2 // pinsrw $0x2,0x4(%esi,%ebx,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,13 // jne 5a32 <_sk_load_rgb_u16_be_sse2+0x142>
+ .byte 117,13 // jne 5a2c <_sk_load_rgb_u16_be_sse2+0x142>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,16,255,255,255 // jmp 5942 <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,16,255,255,255 // jmp 593c <_sk_load_rgb_u16_be_sse2+0x52>
.byte 102,15,110,68,94,6 // movd 0x6(%esi,%ebx,2),%xmm0
.byte 102,15,196,68,94,10,2 // pinsrw $0x2,0xa(%esi,%ebx,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,18 // jb 5a5a <_sk_load_rgb_u16_be_sse2+0x16a>
+ .byte 114,18 // jb 5a54 <_sk_load_rgb_u16_be_sse2+0x16a>
.byte 102,15,110,92,94,12 // movd 0xc(%esi,%ebx,2),%xmm3
.byte 102,15,196,92,94,16,2 // pinsrw $0x2,0x10(%esi,%ebx,2),%xmm3
- .byte 233,232,254,255,255 // jmp 5942 <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,232,254,255,255 // jmp 593c <_sk_load_rgb_u16_be_sse2+0x52>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,223,254,255,255 // jmp 5942 <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,223,254,255,255 // jmp 593c <_sk_load_rgb_u16_be_sse2+0x52>
HIDDEN _sk_store_u16_be_sse2
.globl _sk_store_u16_be_sse2
@@ -63007,9 +63007,9 @@ _sk_store_u16_be_sse2:
.byte 86 // push %esi
.byte 131,236,16 // sub $0x10,%esp
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
- .byte 232,0,0,0,0 // call 5a74 <_sk_store_u16_be_sse2+0x11>
+ .byte 232,0,0,0,0 // call 5a6e <_sk_store_u16_be_sse2+0x11>
.byte 88 // pop %eax
- .byte 15,40,176,188,122,0,0 // movaps 0x7abc(%eax),%xmm6
+ .byte 15,40,176,194,122,0,0 // movaps 0x7ac2(%eax),%xmm6
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,89,230 // mulps %xmm6,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
@@ -63062,7 +63062,7 @@ _sk_store_u16_be_sse2:
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 193,226,2 // shl $0x2,%edx
.byte 133,255 // test %edi,%edi
- .byte 117,45 // jne 5b76 <_sk_store_u16_be_sse2+0x113>
+ .byte 117,45 // jne 5b70 <_sk_store_u16_be_sse2+0x113>
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
.byte 102,15,98,221 // punpckldq %xmm5,%xmm3
.byte 243,15,127,28,86 // movdqu %xmm3,(%esi,%edx,2)
@@ -63083,13 +63083,13 @@ _sk_store_u16_be_sse2:
.byte 102,15,98,245 // punpckldq %xmm5,%xmm6
.byte 102,15,214,52,86 // movq %xmm6,(%esi,%edx,2)
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,216 // je 5b60 <_sk_store_u16_be_sse2+0xfd>
+ .byte 116,216 // je 5b5a <_sk_store_u16_be_sse2+0xfd>
.byte 102,15,23,116,86,8 // movhpd %xmm6,0x8(%esi,%edx,2)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,205 // jb 5b60 <_sk_store_u16_be_sse2+0xfd>
+ .byte 114,205 // jb 5b5a <_sk_store_u16_be_sse2+0xfd>
.byte 102,15,106,229 // punpckhdq %xmm5,%xmm4
.byte 102,15,214,100,86,16 // movq %xmm4,0x10(%esi,%edx,2)
- .byte 235,193 // jmp 5b60 <_sk_store_u16_be_sse2+0xfd>
+ .byte 235,193 // jmp 5b5a <_sk_store_u16_be_sse2+0xfd>
HIDDEN _sk_load_f32_sse2
.globl _sk_load_f32_sse2
@@ -63112,7 +63112,7 @@ _sk_load_f32_sse2:
.byte 15,16,36,23 // movups (%edi,%edx,1),%xmm4
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,71 // jne 5c16 <_sk_load_f32_sse2+0x77>
+ .byte 117,71 // jne 5c10 <_sk_load_f32_sse2+0x77>
.byte 15,16,84,178,16 // movups 0x10(%edx,%esi,4),%xmm2
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
.byte 15,16,68,178,48 // movups 0x30(%edx,%esi,4),%xmm0
@@ -63140,17 +63140,17 @@ _sk_load_f32_sse2:
.byte 195 // ret
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,8 // jne 5c26 <_sk_load_f32_sse2+0x87>
+ .byte 117,8 // jne 5c20 <_sk_load_f32_sse2+0x87>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,210 // xorps %xmm2,%xmm2
- .byte 235,184 // jmp 5bde <_sk_load_f32_sse2+0x3f>
+ .byte 235,184 // jmp 5bd8 <_sk_load_f32_sse2+0x3f>
.byte 15,16,84,178,16 // movups 0x10(%edx,%esi,4),%xmm2
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,7 // jb 5c37 <_sk_load_f32_sse2+0x98>
+ .byte 114,7 // jb 5c31 <_sk_load_f32_sse2+0x98>
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
- .byte 235,167 // jmp 5bde <_sk_load_f32_sse2+0x3f>
+ .byte 235,167 // jmp 5bd8 <_sk_load_f32_sse2+0x3f>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,162 // jmp 5bde <_sk_load_f32_sse2+0x3f>
+ .byte 235,162 // jmp 5bd8 <_sk_load_f32_sse2+0x3f>
HIDDEN _sk_load_f32_dst_sse2
.globl _sk_load_f32_dst_sse2
@@ -63176,7 +63176,7 @@ _sk_load_f32_dst_sse2:
.byte 15,16,52,23 // movups (%edi,%edx,1),%xmm6
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,97 // jne 5cd8 <_sk_load_f32_dst_sse2+0x9c>
+ .byte 117,97 // jne 5cd2 <_sk_load_f32_dst_sse2+0x9c>
.byte 15,16,124,178,16 // movups 0x10(%edx,%esi,4),%xmm7
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
.byte 15,16,84,178,48 // movups 0x30(%edx,%esi,4),%xmm2
@@ -63210,17 +63210,17 @@ _sk_load_f32_dst_sse2:
.byte 195 // ret
.byte 15,87,210 // xorps %xmm2,%xmm2
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,8 // jne 5ce8 <_sk_load_f32_dst_sse2+0xac>
+ .byte 117,8 // jne 5ce2 <_sk_load_f32_dst_sse2+0xac>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,158 // jmp 5c86 <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,158 // jmp 5c80 <_sk_load_f32_dst_sse2+0x4a>
.byte 15,16,124,178,16 // movups 0x10(%edx,%esi,4),%xmm7
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,7 // jb 5cf9 <_sk_load_f32_dst_sse2+0xbd>
+ .byte 114,7 // jb 5cf3 <_sk_load_f32_dst_sse2+0xbd>
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
- .byte 235,141 // jmp 5c86 <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,141 // jmp 5c80 <_sk_load_f32_dst_sse2+0x4a>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,136 // jmp 5c86 <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,136 // jmp 5c80 <_sk_load_f32_dst_sse2+0x4a>
HIDDEN _sk_store_f32_sse2
.globl _sk_store_f32_sse2
@@ -63258,7 +63258,7 @@ _sk_store_f32_sse2:
.byte 15,40,238 // movaps %xmm6,%xmm5
.byte 102,15,20,239 // unpcklpd %xmm7,%xmm5
.byte 133,255 // test %edi,%edi
- .byte 117,40 // jne 5d84 <_sk_store_f32_sse2+0x86>
+ .byte 117,40 // jne 5d7e <_sk_store_f32_sse2+0x86>
.byte 102,15,21,247 // unpckhpd %xmm7,%xmm6
.byte 15,17,100,178,16 // movups %xmm4,0x10(%edx,%esi,4)
.byte 102,15,17,108,178,32 // movupd %xmm5,0x20(%edx,%esi,4)
@@ -63275,12 +63275,12 @@ _sk_store_f32_sse2:
.byte 93 // pop %ebp
.byte 195 // ret
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,232 // je 5d71 <_sk_store_f32_sse2+0x73>
+ .byte 116,232 // je 5d6b <_sk_store_f32_sse2+0x73>
.byte 15,17,100,178,16 // movups %xmm4,0x10(%edx,%esi,4)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,222 // jb 5d71 <_sk_store_f32_sse2+0x73>
+ .byte 114,222 // jb 5d6b <_sk_store_f32_sse2+0x73>
.byte 102,15,17,108,178,32 // movupd %xmm5,0x20(%edx,%esi,4)
- .byte 235,214 // jmp 5d71 <_sk_store_f32_sse2+0x73>
+ .byte 235,214 // jmp 5d6b <_sk_store_f32_sse2+0x73>
HIDDEN _sk_clamp_x_sse2
.globl _sk_clamp_x_sse2
@@ -63341,7 +63341,7 @@ _sk_repeat_x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5e18 <_sk_repeat_x_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5e12 <_sk_repeat_x_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -63352,7 +63352,7 @@ _sk_repeat_x_sse2:
.byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,40,114,0,0 // andps 0x7228(%ecx),%xmm6
+ .byte 15,84,177,46,114,0,0 // andps 0x722e(%ecx),%xmm6
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -63379,7 +63379,7 @@ _sk_repeat_y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5e7e <_sk_repeat_y_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5e78 <_sk_repeat_y_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -63390,7 +63390,7 @@ _sk_repeat_y_sse2:
.byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,194,113,0,0 // andps 0x71c2(%ecx),%xmm6
+ .byte 15,84,177,200,113,0,0 // andps 0x71c8(%ecx),%xmm6
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -63417,7 +63417,7 @@ _sk_mirror_x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5ee4 <_sk_mirror_x_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5ede <_sk_mirror_x_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -63426,13 +63426,13 @@ _sk_mirror_x_sse2:
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 243,15,89,177,172,120,0,0 // mulss 0x78ac(%ecx),%xmm6
+ .byte 243,15,89,177,178,120,0,0 // mulss 0x78b2(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,92,113,0,0 // andps 0x715c(%ecx),%xmm6
+ .byte 15,84,177,98,113,0,0 // andps 0x7162(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -63463,7 +63463,7 @@ _sk_mirror_y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5f69 <_sk_mirror_y_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5f63 <_sk_mirror_y_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -63472,13 +63472,13 @@ _sk_mirror_y_sse2:
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,204 // subps %xmm4,%xmm1
- .byte 243,15,89,177,39,120,0,0 // mulss 0x7827(%ecx),%xmm6
+ .byte 243,15,89,177,45,120,0,0 // mulss 0x782d(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,215,112,0,0 // andps 0x70d7(%ecx),%xmm6
+ .byte 15,84,177,221,112,0,0 // andps 0x70dd(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -63509,12 +63509,12 @@ _sk_clamp_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5fee <_sk_clamp_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5fe8 <_sk_clamp_x_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,95,224 // maxps %xmm0,%xmm4
- .byte 15,93,160,82,112,0,0 // minps 0x7052(%eax),%xmm4
+ .byte 15,93,160,88,112,0,0 // minps 0x7058(%eax),%xmm4
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
@@ -63532,14 +63532,14 @@ _sk_repeat_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 601e <_sk_repeat_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 6018 <_sk_repeat_x_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 243,15,91,224 // cvttps2dq %xmm0,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,84,168,34,112,0,0 // andps 0x7022(%eax),%xmm5
+ .byte 15,84,168,40,112,0,0 // andps 0x7028(%eax),%xmm5
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 141,65,4 // lea 0x4(%ecx),%eax
@@ -63558,17 +63558,17 @@ _sk_mirror_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 6059 <_sk_mirror_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 6053 <_sk_mirror_x_1_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 15,40,161,87,112,0,0 // movaps 0x7057(%ecx),%xmm4
+ .byte 15,40,161,93,112,0,0 // movaps 0x705d(%ecx),%xmm4
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,169,199,111,0,0 // movaps 0x6fc7(%ecx),%xmm5
+ .byte 15,40,169,221,111,0,0 // movaps 0x6fdd(%ecx),%xmm5
.byte 15,89,232 // mulps %xmm0,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,194,238,1 // cmpltps %xmm6,%xmm5
- .byte 15,84,169,231,111,0,0 // andps 0x6fe7(%ecx),%xmm5
+ .byte 15,84,169,237,111,0,0 // andps 0x6fed(%ecx),%xmm5
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 15,88,246 // addps %xmm6,%xmm6
@@ -63593,13 +63593,13 @@ _sk_luminance_to_alpha_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 60b7 <_sk_luminance_to_alpha_sse2+0xe>
+ .byte 232,0,0,0,0 // call 60b1 <_sk_luminance_to_alpha_sse2+0xe>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,89,128,137,116,0,0 // mulps 0x7489(%eax),%xmm0
- .byte 15,89,136,153,116,0,0 // mulps 0x7499(%eax),%xmm1
+ .byte 15,89,128,143,116,0,0 // mulps 0x748f(%eax),%xmm0
+ .byte 15,89,136,159,116,0,0 // mulps 0x749f(%eax),%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,152,169,116,0,0 // mulps 0x74a9(%eax),%xmm3
+ .byte 15,89,152,175,116,0,0 // mulps 0x74af(%eax),%xmm3
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -63989,7 +63989,7 @@ _sk_evenly_spaced_gradient_sse2:
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
- .byte 232,0,0,0,0 // call 6554 <_sk_evenly_spaced_gradient_sse2+0x12>
+ .byte 232,0,0,0,0 // call 654e <_sk_evenly_spaced_gradient_sse2+0x12>
.byte 90 // pop %edx
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,65,4 // lea 0x4(%ecx),%eax
@@ -64000,12 +64000,12 @@ _sk_evenly_spaced_gradient_sse2:
.byte 78 // dec %esi
.byte 102,15,110,206 // movd %esi,%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
- .byte 102,15,111,146,28,112,0,0 // movdqa 0x701c(%edx),%xmm2
+ .byte 102,15,111,146,34,112,0,0 // movdqa 0x7022(%edx),%xmm2
.byte 102,15,219,209 // pand %xmm1,%xmm2
- .byte 102,15,235,146,252,109,0,0 // por 0x6dfc(%edx),%xmm2
+ .byte 102,15,235,146,2,110,0,0 // por 0x6e02(%edx),%xmm2
.byte 102,15,114,209,16 // psrld $0x10,%xmm1
- .byte 102,15,235,138,44,112,0,0 // por 0x702c(%edx),%xmm1
- .byte 15,88,138,60,112,0,0 // addps 0x703c(%edx),%xmm1
+ .byte 102,15,235,138,50,112,0,0 // por 0x7032(%edx),%xmm1
+ .byte 15,88,138,66,112,0,0 // addps 0x7042(%edx),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
@@ -64112,18 +64112,18 @@ _sk_gauss_a_to_rgba_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 670a <_sk_gauss_a_to_rgba_sse2+0xb>
+ .byte 232,0,0,0,0 // call 6704 <_sk_gauss_a_to_rgba_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,128,150,110,0,0 // movaps 0x6e96(%eax),%xmm0
+ .byte 15,40,128,156,110,0,0 // movaps 0x6e9c(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,166,110,0,0 // addps 0x6ea6(%eax),%xmm0
+ .byte 15,88,128,172,110,0,0 // addps 0x6eac(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,182,110,0,0 // addps 0x6eb6(%eax),%xmm0
+ .byte 15,88,128,188,110,0,0 // addps 0x6ebc(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,198,110,0,0 // addps 0x6ec6(%eax),%xmm0
+ .byte 15,88,128,204,110,0,0 // addps 0x6ecc(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,214,110,0,0 // addps 0x6ed6(%eax),%xmm0
+ .byte 15,88,128,220,110,0,0 // addps 0x6edc(%eax),%xmm0
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,200 // movaps %xmm0,%xmm1
@@ -64146,7 +64146,7 @@ _sk_gradient_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
- .byte 232,0,0,0,0 // call 6765 <_sk_gradient_sse2+0xe>
+ .byte 232,0,0,0,0 // call 675f <_sk_gradient_sse2+0xe>
.byte 95 // pop %edi
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
@@ -64155,12 +64155,12 @@ _sk_gradient_sse2:
.byte 139,17 // mov (%ecx),%edx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,250,2 // cmp $0x2,%edx
- .byte 114,43 // jb 67a7 <_sk_gradient_sse2+0x50>
+ .byte 114,43 // jb 67a1 <_sk_gradient_sse2+0x50>
.byte 139,113,36 // mov 0x24(%ecx),%esi
.byte 74 // dec %edx
.byte 131,198,4 // add $0x4,%esi
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,151,251,104,0,0 // movaps 0x68fb(%edi),%xmm2
+ .byte 15,40,151,1,105,0,0 // movaps 0x6901(%edi),%xmm2
.byte 243,15,16,30 // movss (%esi),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -64168,7 +64168,7 @@ _sk_gradient_sse2:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 131,198,4 // add $0x4,%esi
.byte 74 // dec %edx
- .byte 117,231 // jne 678e <_sk_gradient_sse2+0x37>
+ .byte 117,231 // jne 6788 <_sk_gradient_sse2+0x37>
.byte 102,15,126,202 // movd %xmm1,%edx
.byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
.byte 102,15,126,214 // movd %xmm2,%esi
@@ -64320,7 +64320,7 @@ _sk_xy_to_unit_angle_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 69a1 <_sk_xy_to_unit_angle_sse2+0x18>
+ .byte 232,0,0,0,0 // call 699b <_sk_xy_to_unit_angle_sse2+0x18>
.byte 88 // pop %eax
.byte 15,87,237 // xorps %xmm5,%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
@@ -64335,30 +64335,30 @@ _sk_xy_to_unit_angle_sse2:
.byte 15,94,247 // divps %xmm7,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,255 // mulps %xmm7,%xmm7
- .byte 15,40,128,79,108,0,0 // movaps 0x6c4f(%eax),%xmm0
+ .byte 15,40,128,85,108,0,0 // movaps 0x6c55(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,95,108,0,0 // addps 0x6c5f(%eax),%xmm0
+ .byte 15,88,128,101,108,0,0 // addps 0x6c65(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,111,108,0,0 // addps 0x6c6f(%eax),%xmm0
+ .byte 15,88,128,117,108,0,0 // addps 0x6c75(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,127,108,0,0 // addps 0x6c7f(%eax),%xmm0
+ .byte 15,88,128,133,108,0,0 // addps 0x6c85(%eax),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,40,176,143,108,0,0 // movaps 0x6c8f(%eax),%xmm6
+ .byte 15,40,176,149,108,0,0 // movaps 0x6c95(%eax),%xmm6
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,84,245 // andps %xmm5,%xmm6
.byte 15,85,232 // andnps %xmm0,%xmm5
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,86,238 // orps %xmm6,%xmm5
.byte 15,194,204,1 // cmpltps %xmm4,%xmm1
- .byte 15,40,128,127,102,0,0 // movaps 0x667f(%eax),%xmm0
+ .byte 15,40,128,149,102,0,0 // movaps 0x6695(%eax),%xmm0
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,84,193 // andps %xmm1,%xmm0
.byte 15,85,205 // andnps %xmm5,%xmm1
.byte 15,86,200 // orps %xmm0,%xmm1
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,194,196,1 // cmpltps %xmm4,%xmm0
- .byte 15,40,168,159,102,0,0 // movaps 0x669f(%eax),%xmm5
+ .byte 15,40,168,165,102,0,0 // movaps 0x66a5(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,84,232 // andps %xmm0,%xmm5
.byte 15,85,193 // andnps %xmm1,%xmm0
@@ -64419,15 +64419,15 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 232,0,0,0,0 // call 6abe <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
+ .byte 232,0,0,0,0 // call 6ab8 <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
.byte 90 // pop %edx
.byte 243,15,89,237 // mulss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,162,130,107,0,0 // mulps 0x6b82(%edx),%xmm4
- .byte 15,89,130,146,107,0,0 // mulps 0x6b92(%edx),%xmm0
+ .byte 15,89,162,136,107,0,0 // mulps 0x6b88(%edx),%xmm4
+ .byte 15,89,130,152,107,0,0 // mulps 0x6b98(%edx),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
@@ -64435,11 +64435,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,162,50,106,0,0 // xorps 0x6a32(%edx),%xmm4
+ .byte 15,87,162,56,106,0,0 // xorps 0x6a38(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,170,98,101,0,0 // mulps 0x6562(%edx),%xmm5
+ .byte 15,89,170,120,101,0,0 // mulps 0x6578(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,95,196 // maxps %xmm4,%xmm0
@@ -64470,15 +64470,15 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 232,0,0,0,0 // call 6b5c <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
+ .byte 232,0,0,0,0 // call 6b56 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
.byte 90 // pop %edx
.byte 243,15,89,237 // mulss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,162,228,106,0,0 // mulps 0x6ae4(%edx),%xmm4
- .byte 15,89,130,244,106,0,0 // mulps 0x6af4(%edx),%xmm0
+ .byte 15,89,162,234,106,0,0 // mulps 0x6aea(%edx),%xmm4
+ .byte 15,89,130,250,106,0,0 // mulps 0x6afa(%edx),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
@@ -64486,11 +64486,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,162,148,105,0,0 // xorps 0x6994(%edx),%xmm4
+ .byte 15,87,162,154,105,0,0 // xorps 0x699a(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,170,196,100,0,0 // mulps 0x64c4(%edx),%xmm5
+ .byte 15,89,170,218,100,0,0 // mulps 0x64da(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
@@ -64510,7 +64510,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 6bd4 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
+ .byte 232,0,0,0,0 // call 6bce <_sk_xy_to_2pt_conical_linear_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -64519,7 +64519,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,89,169,108,106,0,0 // mulps 0x6a6c(%ecx),%xmm5
+ .byte 15,89,169,114,106,0,0 // mulps 0x6a72(%ecx),%xmm5
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
@@ -64527,7 +64527,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,228 // mulss %xmm4,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,129,28,105,0,0 // xorps 0x691c(%ecx),%xmm0
+ .byte 15,87,129,34,105,0,0 // xorps 0x6922(%ecx),%xmm0
.byte 15,94,197 // divps %xmm5,%xmm0
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
@@ -64601,16 +64601,16 @@ _sk_save_xy_sse2:
.byte 131,236,24 // sub $0x18,%esp
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 6cb1 <_sk_save_xy_sse2+0x12>
+ .byte 232,0,0,0,0 // call 6cab <_sk_save_xy_sse2+0x12>
.byte 88 // pop %eax
- .byte 15,40,160,111,99,0,0 // movaps 0x636f(%eax),%xmm4
+ .byte 15,40,160,133,99,0,0 // movaps 0x6385(%eax),%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,88,236 // addps %xmm4,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,194,254,1 // cmpltps %xmm6,%xmm7
- .byte 15,40,144,143,99,0,0 // movaps 0x638f(%eax),%xmm2
+ .byte 15,40,144,149,99,0,0 // movaps 0x6395(%eax),%xmm2
.byte 15,84,250 // andps %xmm2,%xmm7
.byte 15,92,247 // subps %xmm7,%xmm6
.byte 15,92,238 // subps %xmm6,%xmm5
@@ -64685,15 +64685,15 @@ _sk_bilinear_nx_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6d93 <_sk_bilinear_nx_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6d8d <_sk_bilinear_nx_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,205,104,0,0 // addps 0x68cd(%eax),%xmm0
- .byte 15,40,168,173,98,0,0 // movaps 0x62ad(%eax),%xmm5
+ .byte 15,88,128,211,104,0,0 // addps 0x68d3(%eax),%xmm0
+ .byte 15,40,168,179,98,0,0 // movaps 0x62b3(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -64714,14 +64714,14 @@ _sk_bilinear_px_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6dd6 <_sk_bilinear_px_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6dd0 <_sk_bilinear_px_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,74,98,0,0 // addps 0x624a(%eax),%xmm0
+ .byte 15,88,128,96,98,0,0 // addps 0x6260(%eax),%xmm0
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -64741,15 +64741,15 @@ _sk_bilinear_ny_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6e0f <_sk_bilinear_ny_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6e09 <_sk_bilinear_ny_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,81,104,0,0 // addps 0x6851(%eax),%xmm1
- .byte 15,40,168,49,98,0,0 // movaps 0x6231(%eax),%xmm5
+ .byte 15,88,136,87,104,0,0 // addps 0x6857(%eax),%xmm1
+ .byte 15,40,168,55,98,0,0 // movaps 0x6237(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -64770,14 +64770,14 @@ _sk_bilinear_py_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6e53 <_sk_bilinear_py_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6e4d <_sk_bilinear_py_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,205,97,0,0 // addps 0x61cd(%eax),%xmm1
+ .byte 15,88,136,227,97,0,0 // addps 0x61e3(%eax),%xmm1
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -64797,20 +64797,20 @@ _sk_bicubic_n3x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6e8d <_sk_bicubic_n3x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6e87 <_sk_bicubic_n3x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,227,103,0,0 // addps 0x67e3(%eax),%xmm0
- .byte 15,40,168,179,97,0,0 // movaps 0x61b3(%eax),%xmm5
+ .byte 15,88,128,233,103,0,0 // addps 0x67e9(%eax),%xmm0
+ .byte 15,40,168,185,97,0,0 // movaps 0x61b9(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,89,168,243,103,0,0 // mulps 0x67f3(%eax),%xmm5
- .byte 15,88,168,147,99,0,0 // addps 0x6393(%eax),%xmm5
+ .byte 15,89,168,249,103,0,0 // mulps 0x67f9(%eax),%xmm5
+ .byte 15,88,168,153,99,0,0 // addps 0x6399(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -64831,23 +64831,23 @@ _sk_bicubic_n1x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6ee7 <_sk_bicubic_n1x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6ee1 <_sk_bicubic_n1x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,121,103,0,0 // addps 0x6779(%eax),%xmm0
- .byte 15,40,168,89,97,0,0 // movaps 0x6159(%eax),%xmm5
+ .byte 15,88,128,127,103,0,0 // addps 0x677f(%eax),%xmm0
+ .byte 15,40,168,95,97,0,0 // movaps 0x615f(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,160,169,103,0,0 // movaps 0x67a9(%eax),%xmm4
+ .byte 15,40,160,175,103,0,0 // movaps 0x67af(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,185,103,0,0 // addps 0x67b9(%eax),%xmm4
+ .byte 15,88,160,191,103,0,0 // addps 0x67bf(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,57,97,0,0 // addps 0x6139(%eax),%xmm4
+ .byte 15,88,160,79,97,0,0 // addps 0x614f(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,201,103,0,0 // addps 0x67c9(%eax),%xmm4
+ .byte 15,88,160,207,103,0,0 // addps 0x67cf(%eax),%xmm4
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -64867,22 +64867,22 @@ _sk_bicubic_p1x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6f4f <_sk_bicubic_p1x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6f49 <_sk_bicubic_p1x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
- .byte 15,40,160,209,96,0,0 // movaps 0x60d1(%eax),%xmm4
+ .byte 15,40,160,231,96,0,0 // movaps 0x60e7(%eax),%xmm4
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,110,64 // movups 0x40(%esi),%xmm5
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,176,65,103,0,0 // movaps 0x6741(%eax),%xmm6
+ .byte 15,40,176,71,103,0,0 // movaps 0x6747(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,81,103,0,0 // addps 0x6751(%eax),%xmm6
+ .byte 15,88,176,87,103,0,0 // addps 0x6757(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,97,103,0,0 // addps 0x6761(%eax),%xmm6
+ .byte 15,88,176,103,103,0,0 // addps 0x6767(%eax),%xmm6
.byte 15,17,182,128,0,0,0 // movups %xmm6,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -64902,18 +64902,18 @@ _sk_bicubic_p3x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6fac <_sk_bicubic_p3x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6fa6 <_sk_bicubic_p3x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,244,102,0,0 // addps 0x66f4(%eax),%xmm0
+ .byte 15,88,128,250,102,0,0 // addps 0x66fa(%eax),%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,89,160,212,102,0,0 // mulps 0x66d4(%eax),%xmm4
- .byte 15,88,160,116,98,0,0 // addps 0x6274(%eax),%xmm4
+ .byte 15,89,160,218,102,0,0 // mulps 0x66da(%eax),%xmm4
+ .byte 15,88,160,122,98,0,0 // addps 0x627a(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -64934,20 +64934,20 @@ _sk_bicubic_n3y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6ffc <_sk_bicubic_n3y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6ff6 <_sk_bicubic_n3y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,116,102,0,0 // addps 0x6674(%eax),%xmm1
- .byte 15,40,168,68,96,0,0 // movaps 0x6044(%eax),%xmm5
+ .byte 15,88,136,122,102,0,0 // addps 0x667a(%eax),%xmm1
+ .byte 15,40,168,74,96,0,0 // movaps 0x604a(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,89,168,132,102,0,0 // mulps 0x6684(%eax),%xmm5
- .byte 15,88,168,36,98,0,0 // addps 0x6224(%eax),%xmm5
+ .byte 15,89,168,138,102,0,0 // mulps 0x668a(%eax),%xmm5
+ .byte 15,88,168,42,98,0,0 // addps 0x622a(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -64968,23 +64968,23 @@ _sk_bicubic_n1y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 7057 <_sk_bicubic_n1y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 7051 <_sk_bicubic_n1y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,9,102,0,0 // addps 0x6609(%eax),%xmm1
- .byte 15,40,168,233,95,0,0 // movaps 0x5fe9(%eax),%xmm5
+ .byte 15,88,136,15,102,0,0 // addps 0x660f(%eax),%xmm1
+ .byte 15,40,168,239,95,0,0 // movaps 0x5fef(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,160,57,102,0,0 // movaps 0x6639(%eax),%xmm4
+ .byte 15,40,160,63,102,0,0 // movaps 0x663f(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,73,102,0,0 // addps 0x6649(%eax),%xmm4
+ .byte 15,88,160,79,102,0,0 // addps 0x664f(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,201,95,0,0 // addps 0x5fc9(%eax),%xmm4
+ .byte 15,88,160,223,95,0,0 // addps 0x5fdf(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,89,102,0,0 // addps 0x6659(%eax),%xmm4
+ .byte 15,88,160,95,102,0,0 // addps 0x665f(%eax),%xmm4
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -65004,22 +65004,22 @@ _sk_bicubic_p1y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 70c0 <_sk_bicubic_p1y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 70ba <_sk_bicubic_p1y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
- .byte 15,40,160,96,95,0,0 // movaps 0x5f60(%eax),%xmm4
+ .byte 15,40,160,118,95,0,0 // movaps 0x5f76(%eax),%xmm4
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,110,96 // movups 0x60(%esi),%xmm5
.byte 15,88,204 // addps %xmm4,%xmm1
- .byte 15,40,176,208,101,0,0 // movaps 0x65d0(%eax),%xmm6
+ .byte 15,40,176,214,101,0,0 // movaps 0x65d6(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,224,101,0,0 // addps 0x65e0(%eax),%xmm6
+ .byte 15,88,176,230,101,0,0 // addps 0x65e6(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,240,101,0,0 // addps 0x65f0(%eax),%xmm6
+ .byte 15,88,176,246,101,0,0 // addps 0x65f6(%eax),%xmm6
.byte 15,17,182,160,0,0,0 // movups %xmm6,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -65039,18 +65039,18 @@ _sk_bicubic_p3y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 711e <_sk_bicubic_p3y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 7118 <_sk_bicubic_p3y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,130,101,0,0 // addps 0x6582(%eax),%xmm1
+ .byte 15,88,136,136,101,0,0 // addps 0x6588(%eax),%xmm1
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,89,160,98,101,0,0 // mulps 0x6562(%eax),%xmm4
- .byte 15,88,160,2,97,0,0 // addps 0x6102(%eax),%xmm4
+ .byte 15,89,160,104,101,0,0 // mulps 0x6568(%eax),%xmm4
+ .byte 15,88,160,8,97,0,0 // addps 0x6108(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -65195,7 +65195,7 @@ _sk_clut_3D_sse2:
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,98,233 // punpckldq %xmm1,%xmm5
.byte 102,15,127,173,104,255,255,255 // movdqa %xmm5,-0x98(%ebp)
- .byte 232,0,0,0,0 // call 7312 <_sk_clut_3D_sse2+0xff>
+ .byte 232,0,0,0,0 // call 730c <_sk_clut_3D_sse2+0xff>
.byte 90 // pop %edx
.byte 243,15,91,196 // cvttps2dq %xmm4,%xmm0
.byte 102,15,127,133,232,254,255,255 // movdqa %xmm0,-0x118(%ebp)
@@ -65204,7 +65204,7 @@ _sk_clut_3D_sse2:
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,111,205 // movdqa %xmm5,%xmm1
.byte 102,15,254,202 // paddd %xmm2,%xmm1
- .byte 102,15,111,130,190,99,0,0 // movdqa 0x63be(%edx),%xmm0
+ .byte 102,15,111,130,196,99,0,0 // movdqa 0x63c4(%edx),%xmm0
.byte 102,15,127,133,88,255,255,255 // movdqa %xmm0,-0xa8(%ebp)
.byte 102,15,112,225,245 // pshufd $0xf5,%xmm1,%xmm4
.byte 102,15,244,200 // pmuludq %xmm0,%xmm1
@@ -65228,7 +65228,7 @@ _sk_clut_3D_sse2:
.byte 15,20,196 // unpcklps %xmm4,%xmm0
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
- .byte 102,15,111,130,78,93,0,0 // movdqa 0x5d4e(%edx),%xmm0
+ .byte 102,15,111,130,84,93,0,0 // movdqa 0x5d54(%edx),%xmm0
.byte 102,15,127,133,72,255,255,255 // movdqa %xmm0,-0xb8(%ebp)
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,254,224 // paddd %xmm0,%xmm4
@@ -65246,7 +65246,7 @@ _sk_clut_3D_sse2:
.byte 243,15,16,36,185 // movss (%ecx,%edi,4),%xmm4
.byte 15,20,252 // unpcklps %xmm4,%xmm7
.byte 15,20,248 // unpcklps %xmm0,%xmm7
- .byte 102,15,111,130,110,93,0,0 // movdqa 0x5d6e(%edx),%xmm0
+ .byte 102,15,111,130,116,93,0,0 // movdqa 0x5d74(%edx),%xmm0
.byte 102,15,127,69,216 // movdqa %xmm0,-0x28(%ebp)
.byte 102,15,254,200 // paddd %xmm0,%xmm1
.byte 102,15,112,193,229 // pshufd $0xe5,%xmm1,%xmm0
@@ -65263,7 +65263,7 @@ _sk_clut_3D_sse2:
.byte 243,15,16,4,177 // movss (%ecx,%esi,4),%xmm0
.byte 15,20,232 // unpcklps %xmm0,%xmm5
.byte 15,20,236 // unpcklps %xmm4,%xmm5
- .byte 15,40,130,174,99,0,0 // movaps 0x63ae(%edx),%xmm0
+ .byte 15,40,130,180,99,0,0 // movaps 0x63b4(%edx),%xmm0
.byte 15,88,240 // addps %xmm0,%xmm6
.byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp)
.byte 15,40,141,56,255,255,255 // movaps -0xc8(%ebp),%xmm1
@@ -65876,7 +65876,7 @@ _sk_clut_4D_sse2:
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,98,209 // punpckldq %xmm1,%xmm2
.byte 102,15,127,85,168 // movdqa %xmm2,-0x58(%ebp)
- .byte 232,0,0,0,0 // call 7e88 <_sk_clut_4D_sse2+0x179>
+ .byte 232,0,0,0,0 // call 7e82 <_sk_clut_4D_sse2+0x179>
.byte 89 // pop %ecx
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,41,165,120,254,255,255 // movaps %xmm4,-0x188(%ebp)
@@ -65889,7 +65889,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,245 // paddd %xmm5,%xmm6
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,15,254,206 // paddd %xmm6,%xmm1
- .byte 102,15,111,153,72,88,0,0 // movdqa 0x5848(%ecx),%xmm3
+ .byte 102,15,111,153,78,88,0,0 // movdqa 0x584e(%ecx),%xmm3
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
@@ -65912,7 +65912,7 @@ _sk_clut_4D_sse2:
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
- .byte 102,15,111,153,216,81,0,0 // movdqa 0x51d8(%ecx),%xmm3
+ .byte 102,15,111,153,222,81,0,0 // movdqa 0x51de(%ecx),%xmm3
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,234,229 // pshufd $0xe5,%xmm2,%xmm5
@@ -65930,7 +65930,7 @@ _sk_clut_4D_sse2:
.byte 15,20,215 // unpcklps %xmm7,%xmm2
.byte 15,20,213 // unpcklps %xmm5,%xmm2
.byte 15,41,149,136,254,255,255 // movaps %xmm2,-0x178(%ebp)
- .byte 102,15,254,137,248,81,0,0 // paddd 0x51f8(%ecx),%xmm1
+ .byte 102,15,254,137,254,81,0,0 // paddd 0x51fe(%ecx),%xmm1
.byte 102,15,112,233,229 // pshufd $0xe5,%xmm1,%xmm5
.byte 102,15,126,232 // movd %xmm5,%eax
.byte 102,15,112,233,78 // pshufd $0x4e,%xmm1,%xmm5
@@ -65946,7 +65946,7 @@ _sk_clut_4D_sse2:
.byte 15,20,207 // unpcklps %xmm7,%xmm1
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,41,141,152,254,255,255 // movaps %xmm1,-0x168(%ebp)
- .byte 15,40,185,56,88,0,0 // movaps 0x5838(%ecx),%xmm7
+ .byte 15,40,185,62,88,0,0 // movaps 0x583e(%ecx),%xmm7
.byte 15,88,231 // addps %xmm7,%xmm4
.byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp)
.byte 15,40,141,232,254,255,255 // movaps -0x118(%ebp),%xmm1
@@ -65967,7 +65967,7 @@ _sk_clut_4D_sse2:
.byte 102,15,127,77,184 // movdqa %xmm1,-0x48(%ebp)
.byte 102,15,254,241 // paddd %xmm1,%xmm6
.byte 102,15,112,254,245 // pshufd $0xf5,%xmm6,%xmm7
- .byte 102,15,111,137,72,88,0,0 // movdqa 0x5848(%ecx),%xmm1
+ .byte 102,15,111,137,78,88,0,0 // movdqa 0x584e(%ecx),%xmm1
.byte 102,15,244,241 // pmuludq %xmm1,%xmm6
.byte 102,15,112,198,232 // pshufd $0xe8,%xmm6,%xmm0
.byte 102,15,244,249 // pmuludq %xmm1,%xmm7
@@ -66004,7 +66004,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,44,178 // movss (%edx,%esi,4),%xmm5
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 15,20,217 // unpcklps %xmm1,%xmm3
- .byte 102,15,111,177,248,81,0,0 // movdqa 0x51f8(%ecx),%xmm6
+ .byte 102,15,111,177,254,81,0,0 // movdqa 0x51fe(%ecx),%xmm6
.byte 102,15,254,198 // paddd %xmm6,%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
.byte 102,15,126,200 // movd %xmm1,%eax
@@ -66052,7 +66052,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
.byte 102,15,254,77,168 // paddd -0x58(%ebp),%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,129,72,88,0,0 // movdqa 0x5848(%ecx),%xmm0
+ .byte 102,15,111,129,78,88,0,0 // movdqa 0x584e(%ecx),%xmm0
.byte 102,15,244,200 // pmuludq %xmm0,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,208 // pmuludq %xmm0,%xmm2
@@ -66074,7 +66074,7 @@ _sk_clut_4D_sse2:
.byte 15,20,195 // unpcklps %xmm3,%xmm0
.byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,111,129,216,81,0,0 // movdqa 0x51d8(%ecx),%xmm0
+ .byte 102,15,111,129,222,81,0,0 // movdqa 0x51de(%ecx),%xmm0
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3
@@ -66110,7 +66110,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,197 // movdqa %xmm5,%xmm0
.byte 102,15,254,69,184 // paddd -0x48(%ebp),%xmm0
.byte 102,15,112,216,245 // pshufd $0xf5,%xmm0,%xmm3
- .byte 102,15,111,137,72,88,0,0 // movdqa 0x5848(%ecx),%xmm1
+ .byte 102,15,111,137,78,88,0,0 // movdqa 0x584e(%ecx),%xmm1
.byte 102,15,244,193 // pmuludq %xmm1,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,217 // pmuludq %xmm1,%xmm3
@@ -66146,7 +66146,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
.byte 15,20,224 // unpcklps %xmm0,%xmm4
.byte 15,20,227 // unpcklps %xmm3,%xmm4
- .byte 102,15,111,153,248,81,0,0 // movdqa 0x51f8(%ecx),%xmm3
+ .byte 102,15,111,153,254,81,0,0 // movdqa 0x51fe(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
.byte 102,15,126,192 // movd %xmm0,%eax
@@ -66210,7 +66210,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,197 // movdqa %xmm5,%xmm0
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,145,72,88,0,0 // movdqa 0x5848(%ecx),%xmm2
+ .byte 102,15,111,145,78,88,0,0 // movdqa 0x584e(%ecx),%xmm2
.byte 102,15,244,194 // pmuludq %xmm2,%xmm0
.byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
.byte 102,15,244,202 // pmuludq %xmm2,%xmm1
@@ -66232,7 +66232,7 @@ _sk_clut_4D_sse2:
.byte 15,20,214 // unpcklps %xmm6,%xmm2
.byte 15,41,85,136 // movaps %xmm2,-0x78(%ebp)
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,111,145,216,81,0,0 // movdqa 0x51d8(%ecx),%xmm2
+ .byte 102,15,111,145,222,81,0,0 // movdqa 0x51de(%ecx),%xmm2
.byte 102,15,254,202 // paddd %xmm2,%xmm1
.byte 102,15,112,241,229 // pshufd $0xe5,%xmm1,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
@@ -66265,7 +66265,7 @@ _sk_clut_4D_sse2:
.byte 15,20,206 // unpcklps %xmm6,%xmm1
.byte 102,15,254,109,184 // paddd -0x48(%ebp),%xmm5
.byte 102,15,112,245,245 // pshufd $0xf5,%xmm5,%xmm6
- .byte 102,15,111,129,72,88,0,0 // movdqa 0x5848(%ecx),%xmm0
+ .byte 102,15,111,129,78,88,0,0 // movdqa 0x584e(%ecx),%xmm0
.byte 102,15,244,232 // pmuludq %xmm0,%xmm5
.byte 102,15,112,253,232 // pshufd $0xe8,%xmm5,%xmm7
.byte 102,15,244,240 // pmuludq %xmm0,%xmm6
@@ -66301,7 +66301,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
.byte 15,20,234 // unpcklps %xmm2,%xmm5
.byte 15,20,238 // unpcklps %xmm6,%xmm5
- .byte 102,15,111,153,248,81,0,0 // movdqa 0x51f8(%ecx),%xmm3
+ .byte 102,15,111,153,254,81,0,0 // movdqa 0x51fe(%ecx),%xmm3
.byte 102,15,254,251 // paddd %xmm3,%xmm7
.byte 102,15,112,215,229 // pshufd $0xe5,%xmm7,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
@@ -66335,7 +66335,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,177,72,88,0,0 // movdqa 0x5848(%ecx),%xmm6
+ .byte 102,15,111,177,78,88,0,0 // movdqa 0x584e(%ecx),%xmm6
.byte 102,15,244,198 // pmuludq %xmm6,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,206 // pmuludq %xmm6,%xmm1
@@ -66357,7 +66357,7 @@ _sk_clut_4D_sse2:
.byte 15,20,193 // unpcklps %xmm1,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
- .byte 102,15,254,137,216,81,0,0 // paddd 0x51d8(%ecx),%xmm1
+ .byte 102,15,254,137,222,81,0,0 // paddd 0x51de(%ecx),%xmm1
.byte 102,15,112,241,229 // pshufd $0xe5,%xmm1,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -66391,7 +66391,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,212 // movdqa %xmm4,%xmm2
.byte 102,15,254,85,184 // paddd -0x48(%ebp),%xmm2
.byte 102,15,112,194,245 // pshufd $0xf5,%xmm2,%xmm0
- .byte 102,15,111,137,72,88,0,0 // movdqa 0x5848(%ecx),%xmm1
+ .byte 102,15,111,137,78,88,0,0 // movdqa 0x584e(%ecx),%xmm1
.byte 102,15,244,209 // pmuludq %xmm1,%xmm2
.byte 102,15,112,226,232 // pshufd $0xe8,%xmm2,%xmm4
.byte 102,15,244,193 // pmuludq %xmm1,%xmm0
@@ -66412,7 +66412,7 @@ _sk_clut_4D_sse2:
.byte 15,20,200 // unpcklps %xmm0,%xmm1
.byte 15,20,206 // unpcklps %xmm6,%xmm1
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
- .byte 102,15,254,129,216,81,0,0 // paddd 0x51d8(%ecx),%xmm0
+ .byte 102,15,254,129,222,81,0,0 // paddd 0x51de(%ecx),%xmm0
.byte 102,15,112,240,229 // pshufd $0xe5,%xmm0,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
.byte 102,15,112,240,78 // pshufd $0x4e,%xmm0,%xmm6
@@ -66427,7 +66427,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
.byte 15,20,208 // unpcklps %xmm0,%xmm2
.byte 15,20,214 // unpcklps %xmm6,%xmm2
- .byte 102,15,254,161,248,81,0,0 // paddd 0x51f8(%ecx),%xmm4
+ .byte 102,15,254,161,254,81,0,0 // paddd 0x51fe(%ecx),%xmm4
.byte 102,15,112,196,229 // pshufd $0xe5,%xmm4,%xmm0
.byte 102,15,126,192 // movd %xmm0,%eax
.byte 102,15,112,196,78 // pshufd $0x4e,%xmm4,%xmm0
@@ -66495,7 +66495,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,69,168 // movdqa -0x58(%ebp),%xmm0
.byte 102,15,254,193 // paddd %xmm1,%xmm0
.byte 102,15,112,224,245 // pshufd $0xf5,%xmm0,%xmm4
- .byte 102,15,111,145,72,88,0,0 // movdqa 0x5848(%ecx),%xmm2
+ .byte 102,15,111,145,78,88,0,0 // movdqa 0x584e(%ecx),%xmm2
.byte 102,15,244,194 // pmuludq %xmm2,%xmm0
.byte 102,15,112,216,232 // pshufd $0xe8,%xmm0,%xmm3
.byte 102,15,244,226 // pmuludq %xmm2,%xmm4
@@ -66518,7 +66518,7 @@ _sk_clut_4D_sse2:
.byte 15,20,196 // unpcklps %xmm4,%xmm0
.byte 15,41,133,120,255,255,255 // movaps %xmm0,-0x88(%ebp)
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
- .byte 102,15,111,145,216,81,0,0 // movdqa 0x51d8(%ecx),%xmm2
+ .byte 102,15,111,145,222,81,0,0 // movdqa 0x51de(%ecx),%xmm2
.byte 102,15,254,226 // paddd %xmm2,%xmm4
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,232 // movd %xmm5,%eax
@@ -66534,7 +66534,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4
.byte 15,20,236 // unpcklps %xmm4,%xmm5
.byte 15,20,238 // unpcklps %xmm6,%xmm5
- .byte 102,15,254,153,248,81,0,0 // paddd 0x51f8(%ecx),%xmm3
+ .byte 102,15,254,153,254,81,0,0 // paddd 0x51fe(%ecx),%xmm3
.byte 102,15,112,227,229 // pshufd $0xe5,%xmm3,%xmm4
.byte 102,15,126,224 // movd %xmm4,%eax
.byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
@@ -66586,7 +66586,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,20,223 // unpcklps %xmm7,%xmm3
- .byte 102,15,254,161,248,81,0,0 // paddd 0x51f8(%ecx),%xmm4
+ .byte 102,15,254,161,254,81,0,0 // paddd 0x51fe(%ecx),%xmm4
.byte 102,15,112,212,229 // pshufd $0xe5,%xmm4,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,15,112,212,78 // pshufd $0x4e,%xmm4,%xmm2
@@ -66619,7 +66619,7 @@ _sk_clut_4D_sse2:
.byte 102,15,127,133,56,255,255,255 // movdqa %xmm0,-0xc8(%ebp)
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,208,245 // pshufd $0xf5,%xmm0,%xmm2
- .byte 102,15,111,137,72,88,0,0 // movdqa 0x5848(%ecx),%xmm1
+ .byte 102,15,111,137,78,88,0,0 // movdqa 0x584e(%ecx),%xmm1
.byte 102,15,244,193 // pmuludq %xmm1,%xmm0
.byte 102,15,112,240,232 // pshufd $0xe8,%xmm0,%xmm6
.byte 102,15,244,209 // pmuludq %xmm1,%xmm2
@@ -66641,7 +66641,7 @@ _sk_clut_4D_sse2:
.byte 15,20,194 // unpcklps %xmm2,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 102,15,111,214 // movdqa %xmm6,%xmm2
- .byte 102,15,111,153,216,81,0,0 // movdqa 0x51d8(%ecx),%xmm3
+ .byte 102,15,111,153,222,81,0,0 // movdqa 0x51de(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,234,229 // pshufd $0xe5,%xmm2,%xmm5
.byte 102,15,126,232 // movd %xmm5,%eax
@@ -66657,7 +66657,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
.byte 15,20,234 // unpcklps %xmm2,%xmm5
.byte 15,20,239 // unpcklps %xmm7,%xmm5
- .byte 102,15,254,177,248,81,0,0 // paddd 0x51f8(%ecx),%xmm6
+ .byte 102,15,254,177,254,81,0,0 // paddd 0x51fe(%ecx),%xmm6
.byte 102,15,112,214,229 // pshufd $0xe5,%xmm6,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,15,112,214,78 // pshufd $0x4e,%xmm6,%xmm2
@@ -66710,7 +66710,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
.byte 15,20,216 // unpcklps %xmm0,%xmm3
.byte 15,20,218 // unpcklps %xmm2,%xmm3
- .byte 102,15,254,185,248,81,0,0 // paddd 0x51f8(%ecx),%xmm7
+ .byte 102,15,254,185,254,81,0,0 // paddd 0x51fe(%ecx),%xmm7
.byte 102,15,112,199,229 // pshufd $0xe5,%xmm7,%xmm0
.byte 102,15,126,192 // movd %xmm0,%eax
.byte 102,15,112,199,78 // pshufd $0x4e,%xmm7,%xmm0
@@ -66760,7 +66760,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,153,72,88,0,0 // movdqa 0x5848(%ecx),%xmm3
+ .byte 102,15,111,153,78,88,0,0 // movdqa 0x584e(%ecx),%xmm3
.byte 102,15,244,195 // pmuludq %xmm3,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
@@ -66782,7 +66782,7 @@ _sk_clut_4D_sse2:
.byte 15,20,193 // unpcklps %xmm1,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
- .byte 102,15,111,177,216,81,0,0 // movdqa 0x51d8(%ecx),%xmm6
+ .byte 102,15,111,177,222,81,0,0 // movdqa 0x51de(%ecx),%xmm6
.byte 102,15,254,206 // paddd %xmm6,%xmm1
.byte 102,15,112,217,229 // pshufd $0xe5,%xmm1,%xmm3
.byte 102,15,126,216 // movd %xmm3,%eax
@@ -66798,7 +66798,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,203 // unpcklps %xmm3,%xmm1
- .byte 102,15,111,185,248,81,0,0 // movdqa 0x51f8(%ecx),%xmm7
+ .byte 102,15,111,185,254,81,0,0 // movdqa 0x51fe(%ecx),%xmm7
.byte 102,15,254,215 // paddd %xmm7,%xmm2
.byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3
.byte 102,15,126,216 // movd %xmm3,%eax
@@ -66817,7 +66817,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,221 // movdqa %xmm5,%xmm3
.byte 102,15,254,93,184 // paddd -0x48(%ebp),%xmm3
.byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
- .byte 102,15,111,129,72,88,0,0 // movdqa 0x5848(%ecx),%xmm0
+ .byte 102,15,111,129,78,88,0,0 // movdqa 0x584e(%ecx),%xmm0
.byte 102,15,244,216 // pmuludq %xmm0,%xmm3
.byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
.byte 102,15,244,224 // pmuludq %xmm0,%xmm4
@@ -66886,7 +66886,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,193 // paddd %xmm1,%xmm0
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,145,72,88,0,0 // movdqa 0x5848(%ecx),%xmm2
+ .byte 102,15,111,145,78,88,0,0 // movdqa 0x584e(%ecx),%xmm2
.byte 102,15,244,194 // pmuludq %xmm2,%xmm0
.byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
.byte 102,15,244,202 // pmuludq %xmm2,%xmm1
@@ -66909,7 +66909,7 @@ _sk_clut_4D_sse2:
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,41,93,168 // movaps %xmm3,-0x58(%ebp)
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,137,216,81,0,0 // paddd 0x51d8(%ecx),%xmm1
+ .byte 102,15,254,137,222,81,0,0 // paddd 0x51de(%ecx),%xmm1
.byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
@@ -66925,7 +66925,7 @@ _sk_clut_4D_sse2:
.byte 15,20,217 // unpcklps %xmm1,%xmm3
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
- .byte 102,15,254,129,248,81,0,0 // paddd 0x51f8(%ecx),%xmm0
+ .byte 102,15,254,129,254,81,0,0 // paddd 0x51fe(%ecx),%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
.byte 102,15,126,200 // movd %xmm1,%eax
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
@@ -66962,7 +66962,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,60,178 // movss (%edx,%esi,4),%xmm7
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
- .byte 102,15,111,177,216,81,0,0 // movdqa 0x51d8(%ecx),%xmm6
+ .byte 102,15,111,177,222,81,0,0 // movdqa 0x51de(%ecx),%xmm6
.byte 102,15,254,242 // paddd %xmm2,%xmm6
.byte 102,15,112,206,229 // pshufd $0xe5,%xmm6,%xmm1
.byte 102,15,126,200 // movd %xmm1,%eax
@@ -66978,7 +66978,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,52,178 // movss (%edx,%esi,4),%xmm6
.byte 15,20,206 // unpcklps %xmm6,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,254,145,248,81,0,0 // paddd 0x51f8(%ecx),%xmm2
+ .byte 102,15,254,145,254,81,0,0 // paddd 0x51fe(%ecx),%xmm2
.byte 102,15,112,242,229 // pshufd $0xe5,%xmm2,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
.byte 102,15,112,242,78 // pshufd $0x4e,%xmm2,%xmm6
@@ -67048,7 +67048,7 @@ _sk_clut_4D_sse2:
.byte 139,117,12 // mov 0xc(%ebp),%esi
.byte 141,86,8 // lea 0x8(%esi),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,153,184,81,0,0 // movaps 0x51b8(%ecx),%xmm3
+ .byte 15,40,153,190,81,0,0 // movaps 0x51be(%ecx),%xmm3
.byte 82 // push %edx
.byte 80 // push %eax
.byte 255,86,4 // call *0x4(%esi)
@@ -67059,8 +67059,6 @@ _sk_clut_4D_sse2:
.byte 93 // pop %ebp
.byte 195 // ret
.byte 144 // nop
- .byte 144 // nop
- .byte 144 // nop
HIDDEN _sk_start_pipeline_sse2_8bit
.globl _sk_start_pipeline_sse2_8bit
@@ -67074,7 +67072,7 @@ _sk_start_pipeline_sse2_8bit:
.byte 131,236,12 // sub $0xc,%esp
.byte 139,93,12 // mov 0xc(%ebp),%ebx
.byte 59,93,20 // cmp 0x14(%ebp),%ebx
- .byte 115,92 // jae 9359 <_sk_start_pipeline_sse2_8bit+0x6d>
+ .byte 115,92 // jae 9351 <_sk_start_pipeline_sse2_8bit+0x6d>
.byte 139,85,16 // mov 0x10(%ebp),%edx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 139,117,24 // mov 0x18(%ebp),%esi
@@ -67086,7 +67084,7 @@ _sk_start_pipeline_sse2_8bit:
.byte 57,85,236 // cmp %edx,-0x14(%ebp)
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 137,243 // mov %esi,%ebx
- .byte 119,30 // ja 933c <_sk_start_pipeline_sse2_8bit+0x50>
+ .byte 119,30 // ja 9334 <_sk_start_pipeline_sse2_8bit+0x50>
.byte 139,117,8 // mov 0x8(%ebp),%esi
.byte 255,117,240 // pushl -0x10(%ebp)
.byte 86 // push %esi
@@ -67099,12 +67097,12 @@ _sk_start_pipeline_sse2_8bit:
.byte 131,198,16 // add $0x10,%esi
.byte 57,214 // cmp %edx,%esi
.byte 137,198 // mov %eax,%esi
- .byte 118,229 // jbe 9321 <_sk_start_pipeline_sse2_8bit+0x35>
+ .byte 118,229 // jbe 9319 <_sk_start_pipeline_sse2_8bit+0x35>
.byte 137,209 // mov %edx,%ecx
.byte 41,193 // sub %eax,%ecx
.byte 137,222 // mov %ebx,%esi
.byte 139,93,240 // mov -0x10(%ebp),%ebx
- .byte 116,12 // je 9353 <_sk_start_pipeline_sse2_8bit+0x67>
+ .byte 116,12 // je 934b <_sk_start_pipeline_sse2_8bit+0x67>
.byte 83 // push %ebx
.byte 80 // push %eax
.byte 86 // push %esi
@@ -67114,7 +67112,7 @@ _sk_start_pipeline_sse2_8bit:
.byte 131,196,16 // add $0x10,%esp
.byte 67 // inc %ebx
.byte 59,93,20 // cmp 0x14(%ebp),%ebx
- .byte 117,184 // jne 9311 <_sk_start_pipeline_sse2_8bit+0x25>
+ .byte 117,184 // jne 9309 <_sk_start_pipeline_sse2_8bit+0x25>
.byte 131,196,12 // add $0xc,%esp
.byte 94 // pop %esi
.byte 95 // pop %edi
@@ -67160,15 +67158,15 @@ _sk_set_rgb_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 939e <_sk_set_rgb_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call 9396 <_sk_set_rgb_sse2_8bit+0xe>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
- .byte 243,15,16,161,246,67,0,0 // movss 0x43f6(%ecx),%xmm4
+ .byte 243,15,16,161,254,67,0,0 // movss 0x43fe(%ecx),%xmm4
.byte 243,15,16,50 // movss (%edx),%xmm6
.byte 243,15,89,244 // mulss %xmm4,%xmm6
.byte 243,15,44,246 // cvttss2si %xmm6,%esi
- .byte 243,15,16,169,250,67,0,0 // movss 0x43fa(%ecx),%xmm5
+ .byte 243,15,16,169,2,68,0,0 // movss 0x4402(%ecx),%xmm5
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 243,15,92,253 // subss %xmm5,%xmm7
.byte 243,15,44,255 // cvttss2si %xmm7,%edi
@@ -67198,7 +67196,7 @@ _sk_set_rgb_sse2_8bit:
.byte 9,247 // or %esi,%edi
.byte 102,15,110,231 // movd %edi,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
- .byte 102,15,111,169,66,67,0,0 // movdqa 0x4342(%ecx),%xmm5
+ .byte 102,15,111,169,74,67,0,0 // movdqa 0x434a(%ecx),%xmm5
.byte 102,15,219,205 // pand %xmm5,%xmm1
.byte 102,15,219,197 // pand %xmm5,%xmm0
.byte 102,15,235,196 // por %xmm4,%xmm0
@@ -67226,7 +67224,7 @@ _sk_premul_sse2_8bit:
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 102,15,127,85,216 // movdqa %xmm2,-0x28(%ebp)
.byte 102,15,111,216 // movdqa %xmm0,%xmm3
- .byte 232,0,0,0,0 // call 9476 <_sk_premul_sse2_8bit+0x18>
+ .byte 232,0,0,0,0 // call 946e <_sk_premul_sse2_8bit+0x18>
.byte 88 // pop %eax
.byte 242,15,112,227,231 // pshuflw $0xe7,%xmm3,%xmm4
.byte 243,15,112,228,231 // pshufhw $0xe7,%xmm4,%xmm4
@@ -67240,7 +67238,7 @@ _sk_premul_sse2_8bit:
.byte 102,15,96,228 // punpcklbw %xmm4,%xmm4
.byte 242,15,112,228,95 // pshuflw $0x5f,%xmm4,%xmm4
.byte 243,15,112,252,95 // pshufhw $0x5f,%xmm4,%xmm7
- .byte 102,15,111,160,106,66,0,0 // movdqa 0x426a(%eax),%xmm4
+ .byte 102,15,111,160,114,66,0,0 // movdqa 0x4272(%eax),%xmm4
.byte 102,15,235,252 // por %xmm4,%xmm7
.byte 102,15,235,244 // por %xmm4,%xmm6
.byte 102,15,239,210 // pxor %xmm2,%xmm2
@@ -67353,7 +67351,7 @@ _sk_load_8888_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 9602 <_sk_load_8888_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call 95fa <_sk_load_8888_sse2_8bit+0xe>
.byte 91 // pop %ebx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -67364,7 +67362,7 @@ _sk_load_8888_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 117,30 // jne 963c <_sk_load_8888_sse2_8bit+0x48>
+ .byte 117,30 // jne 9634 <_sk_load_8888_sse2_8bit+0x48>
.byte 15,16,76,183,16 // movups 0x10(%edi,%esi,4),%xmm1
.byte 102,15,16,4,183 // movupd (%edi,%esi,4),%xmm0
.byte 141,72,8 // lea 0x8(%eax),%ecx
@@ -67385,16 +67383,16 @@ _sk_load_8888_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 119,216 // ja 9628 <_sk_load_8888_sse2_8bit+0x34>
+ .byte 119,216 // ja 9620 <_sk_load_8888_sse2_8bit+0x34>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 3,156,139,158,0,0,0 // add 0x9e(%ebx,%ecx,4),%ebx
.byte 255,227 // jmp *%ebx
.byte 243,15,16,4,183 // movss (%edi,%esi,4),%xmm0
- .byte 235,197 // jmp 9628 <_sk_load_8888_sse2_8bit+0x34>
+ .byte 235,197 // jmp 9620 <_sk_load_8888_sse2_8bit+0x34>
.byte 102,15,110,68,183,8 // movd 0x8(%edi,%esi,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 102,15,18,4,183 // movlpd (%edi,%esi,4),%xmm0
- .byte 235,179 // jmp 9628 <_sk_load_8888_sse2_8bit+0x34>
+ .byte 235,179 // jmp 9620 <_sk_load_8888_sse2_8bit+0x34>
.byte 102,15,110,68,183,24 // movd 0x18(%edi,%esi,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 243,15,16,68,183,20 // movss 0x14(%edi,%esi,4),%xmm0
@@ -67403,7 +67401,7 @@ _sk_load_8888_sse2_8bit:
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 243,15,16,68,183,16 // movss 0x10(%edi,%esi,4),%xmm0
.byte 243,15,16,200 // movss %xmm0,%xmm1
- .byte 235,134 // jmp 9623 <_sk_load_8888_sse2_8bit+0x2f>
+ .byte 235,134 // jmp 961b <_sk_load_8888_sse2_8bit+0x2f>
.byte 15,31,0 // nopl (%eax)
.byte 90 // pop %edx
.byte 0,0 // add %al,(%eax)
@@ -67414,9 +67412,9 @@ _sk_load_8888_sse2_8bit:
.byte 0,0 // add %al,(%eax)
.byte 143,0 // popl (%eax)
.byte 0,0 // add %al,(%eax)
- .byte 126,0 // jle 96b6 <_sk_load_8888_sse2_8bit+0xc2>
+ .byte 126,0 // jle 96ae <_sk_load_8888_sse2_8bit+0xc2>
.byte 0,0 // add %al,(%eax)
- .byte 115,0 // jae 96ba <_sk_load_8888_sse2_8bit+0xc6>
+ .byte 115,0 // jae 96b2 <_sk_load_8888_sse2_8bit+0xc6>
.byte 0,0 // add %al,(%eax)
HIDDEN _sk_load_8888_dst_sse2_8bit
@@ -67429,7 +67427,7 @@ _sk_load_8888_dst_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 96ca <_sk_load_8888_dst_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call 96c2 <_sk_load_8888_dst_sse2_8bit+0xe>
.byte 91 // pop %ebx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -67440,7 +67438,7 @@ _sk_load_8888_dst_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 117,30 // jne 9704 <_sk_load_8888_dst_sse2_8bit+0x48>
+ .byte 117,30 // jne 96fc <_sk_load_8888_dst_sse2_8bit+0x48>
.byte 15,16,92,183,16 // movups 0x10(%edi,%esi,4),%xmm3
.byte 102,15,16,20,183 // movupd (%edi,%esi,4),%xmm2
.byte 141,72,8 // lea 0x8(%eax),%ecx
@@ -67461,16 +67459,16 @@ _sk_load_8888_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 119,216 // ja 96f0 <_sk_load_8888_dst_sse2_8bit+0x34>
+ .byte 119,216 // ja 96e8 <_sk_load_8888_dst_sse2_8bit+0x34>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 3,156,139,158,0,0,0 // add 0x9e(%ebx,%ecx,4),%ebx
.byte 255,227 // jmp *%ebx
.byte 243,15,16,20,183 // movss (%edi,%esi,4),%xmm2
- .byte 235,197 // jmp 96f0 <_sk_load_8888_dst_sse2_8bit+0x34>
+ .byte 235,197 // jmp 96e8 <_sk_load_8888_dst_sse2_8bit+0x34>
.byte 102,15,110,84,183,8 // movd 0x8(%edi,%esi,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,15,18,20,183 // movlpd (%edi,%esi,4),%xmm2
- .byte 235,179 // jmp 96f0 <_sk_load_8888_dst_sse2_8bit+0x34>
+ .byte 235,179 // jmp 96e8 <_sk_load_8888_dst_sse2_8bit+0x34>
.byte 102,15,110,84,183,24 // movd 0x18(%edi,%esi,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 243,15,16,84,183,20 // movss 0x14(%edi,%esi,4),%xmm2
@@ -67479,7 +67477,7 @@ _sk_load_8888_dst_sse2_8bit:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 243,15,16,84,183,16 // movss 0x10(%edi,%esi,4),%xmm2
.byte 243,15,16,218 // movss %xmm2,%xmm3
- .byte 235,134 // jmp 96eb <_sk_load_8888_dst_sse2_8bit+0x2f>
+ .byte 235,134 // jmp 96e3 <_sk_load_8888_dst_sse2_8bit+0x2f>
.byte 15,31,0 // nopl (%eax)
.byte 90 // pop %edx
.byte 0,0 // add %al,(%eax)
@@ -67490,9 +67488,9 @@ _sk_load_8888_dst_sse2_8bit:
.byte 0,0 // add %al,(%eax)
.byte 143,0 // popl (%eax)
.byte 0,0 // add %al,(%eax)
- .byte 126,0 // jle 977e <_sk_load_8888_dst_sse2_8bit+0xc2>
+ .byte 126,0 // jle 9776 <_sk_load_8888_dst_sse2_8bit+0xc2>
.byte 0,0 // add %al,(%eax)
- .byte 115,0 // jae 9782 <_sk_load_8888_dst_sse2_8bit+0xc6>
+ .byte 115,0 // jae 977a <_sk_load_8888_dst_sse2_8bit+0xc6>
.byte 0,0 // add %al,(%eax)
HIDDEN _sk_store_8888_sse2_8bit
@@ -67505,7 +67503,7 @@ _sk_store_8888_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 9792 <_sk_store_8888_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call 978a <_sk_store_8888_sse2_8bit+0xe>
.byte 91 // pop %ebx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -67516,7 +67514,7 @@ _sk_store_8888_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 117,31 // jne 97cd <_sk_store_8888_sse2_8bit+0x49>
+ .byte 117,31 // jne 97c5 <_sk_store_8888_sse2_8bit+0x49>
.byte 243,15,127,4,183 // movdqu %xmm0,(%edi,%esi,4)
.byte 243,15,127,76,183,16 // movdqu %xmm1,0x10(%edi,%esi,4)
.byte 141,72,8 // lea 0x8(%eax),%ecx
@@ -67535,23 +67533,23 @@ _sk_store_8888_sse2_8bit:
.byte 128,225,7 // and $0x7,%cl
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 119,224 // ja 97b9 <_sk_store_8888_sse2_8bit+0x35>
+ .byte 119,224 // ja 97b1 <_sk_store_8888_sse2_8bit+0x35>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 3,156,139,146,0,0,0 // add 0x92(%ebx,%ecx,4),%ebx
.byte 255,227 // jmp *%ebx
.byte 102,15,126,4,183 // movd %xmm0,(%edi,%esi,4)
- .byte 235,205 // jmp 97b9 <_sk_store_8888_sse2_8bit+0x35>
+ .byte 235,205 // jmp 97b1 <_sk_store_8888_sse2_8bit+0x35>
.byte 102,15,112,224,78 // pshufd $0x4e,%xmm0,%xmm4
.byte 102,15,126,100,183,8 // movd %xmm4,0x8(%edi,%esi,4)
.byte 102,15,214,4,183 // movq %xmm0,(%edi,%esi,4)
- .byte 235,187 // jmp 97b9 <_sk_store_8888_sse2_8bit+0x35>
+ .byte 235,187 // jmp 97b1 <_sk_store_8888_sse2_8bit+0x35>
.byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
.byte 102,15,126,100,183,24 // movd %xmm4,0x18(%edi,%esi,4)
.byte 102,15,112,225,229 // pshufd $0xe5,%xmm1,%xmm4
.byte 102,15,126,100,183,20 // movd %xmm4,0x14(%edi,%esi,4)
.byte 102,15,126,76,183,16 // movd %xmm1,0x10(%edi,%esi,4)
.byte 243,15,127,4,183 // movdqu %xmm0,(%edi,%esi,4)
- .byte 235,152 // jmp 97b9 <_sk_store_8888_sse2_8bit+0x35>
+ .byte 235,152 // jmp 97b1 <_sk_store_8888_sse2_8bit+0x35>
.byte 15,31,0 // nopl (%eax)
.byte 83 // push %ebx
.byte 0,0 // add %al,(%eax)
@@ -67577,7 +67575,7 @@ _sk_load_bgra_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 984e <_sk_load_bgra_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call 9846 <_sk_load_bgra_sse2_8bit+0xe>
.byte 91 // pop %ebx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -67588,7 +67586,7 @@ _sk_load_bgra_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 117,106 // jne 98d4 <_sk_load_bgra_sse2_8bit+0x94>
+ .byte 117,106 // jne 98cc <_sk_load_bgra_sse2_8bit+0x94>
.byte 15,16,76,183,16 // movups 0x10(%edi,%esi,4),%xmm1
.byte 102,15,16,4,183 // movupd (%edi,%esi,4),%xmm0
.byte 102,15,239,228 // pxor %xmm4,%xmm4
@@ -67626,16 +67624,16 @@ _sk_load_bgra_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 119,140 // ja 9874 <_sk_load_bgra_sse2_8bit+0x34>
+ .byte 119,140 // ja 986c <_sk_load_bgra_sse2_8bit+0x34>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 3,156,139,242,0,0,0 // add 0xf2(%ebx,%ecx,4),%ebx
.byte 255,227 // jmp *%ebx
.byte 243,15,16,4,183 // movss (%edi,%esi,4),%xmm0
- .byte 233,118,255,255,255 // jmp 9874 <_sk_load_bgra_sse2_8bit+0x34>
+ .byte 233,118,255,255,255 // jmp 986c <_sk_load_bgra_sse2_8bit+0x34>
.byte 102,15,110,68,183,8 // movd 0x8(%edi,%esi,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 102,15,18,4,183 // movlpd (%edi,%esi,4),%xmm0
- .byte 233,97,255,255,255 // jmp 9874 <_sk_load_bgra_sse2_8bit+0x34>
+ .byte 233,97,255,255,255 // jmp 986c <_sk_load_bgra_sse2_8bit+0x34>
.byte 102,15,110,68,183,24 // movd 0x18(%edi,%esi,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 243,15,16,68,183,20 // movss 0x14(%edi,%esi,4),%xmm0
@@ -67644,7 +67642,7 @@ _sk_load_bgra_sse2_8bit:
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 243,15,16,68,183,16 // movss 0x10(%edi,%esi,4),%xmm0
.byte 243,15,16,200 // movss %xmm0,%xmm1
- .byte 233,49,255,255,255 // jmp 986f <_sk_load_bgra_sse2_8bit+0x2f>
+ .byte 233,49,255,255,255 // jmp 9867 <_sk_load_bgra_sse2_8bit+0x2f>
.byte 102,144 // xchg %ax,%ax
.byte 166 // cmpsb %es:(%edi),%ds:(%esi)
.byte 0,0 // add %al,(%eax)
@@ -67670,7 +67668,7 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 996a <_sk_load_bgra_dst_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call 9962 <_sk_load_bgra_dst_sse2_8bit+0xe>
.byte 91 // pop %ebx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -67681,7 +67679,7 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 117,106 // jne 99f0 <_sk_load_bgra_dst_sse2_8bit+0x94>
+ .byte 117,106 // jne 99e8 <_sk_load_bgra_dst_sse2_8bit+0x94>
.byte 15,16,92,183,16 // movups 0x10(%edi,%esi,4),%xmm3
.byte 102,15,16,20,183 // movupd (%edi,%esi,4),%xmm2
.byte 102,15,239,228 // pxor %xmm4,%xmm4
@@ -67719,16 +67717,16 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 119,140 // ja 9990 <_sk_load_bgra_dst_sse2_8bit+0x34>
+ .byte 119,140 // ja 9988 <_sk_load_bgra_dst_sse2_8bit+0x34>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 3,156,139,242,0,0,0 // add 0xf2(%ebx,%ecx,4),%ebx
.byte 255,227 // jmp *%ebx
.byte 243,15,16,20,183 // movss (%edi,%esi,4),%xmm2
- .byte 233,118,255,255,255 // jmp 9990 <_sk_load_bgra_dst_sse2_8bit+0x34>
+ .byte 233,118,255,255,255 // jmp 9988 <_sk_load_bgra_dst_sse2_8bit+0x34>
.byte 102,15,110,84,183,8 // movd 0x8(%edi,%esi,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,15,18,20,183 // movlpd (%edi,%esi,4),%xmm2
- .byte 233,97,255,255,255 // jmp 9990 <_sk_load_bgra_dst_sse2_8bit+0x34>
+ .byte 233,97,255,255,255 // jmp 9988 <_sk_load_bgra_dst_sse2_8bit+0x34>
.byte 102,15,110,84,183,24 // movd 0x18(%edi,%esi,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 243,15,16,84,183,20 // movss 0x14(%edi,%esi,4),%xmm2
@@ -67737,7 +67735,7 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 243,15,16,84,183,16 // movss 0x10(%edi,%esi,4),%xmm2
.byte 243,15,16,218 // movss %xmm2,%xmm3
- .byte 233,49,255,255,255 // jmp 998b <_sk_load_bgra_dst_sse2_8bit+0x2f>
+ .byte 233,49,255,255,255 // jmp 9983 <_sk_load_bgra_dst_sse2_8bit+0x2f>
.byte 102,144 // xchg %ax,%ax
.byte 166 // cmpsb %es:(%edi),%ds:(%esi)
.byte 0,0 // add %al,(%eax)
@@ -67763,7 +67761,7 @@ _sk_store_bgra_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 9a86 <_sk_store_bgra_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call 9a7e <_sk_store_bgra_sse2_8bit+0xe>
.byte 95 // pop %edi
.byte 139,77,20 // mov 0x14(%ebp),%ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
@@ -67794,7 +67792,7 @@ _sk_store_bgra_sse2_8bit:
.byte 102,15,103,238 // packuswb %xmm6,%xmm5
.byte 133,210 // test %edx,%edx
.byte 139,93,16 // mov 0x10(%ebp),%ebx
- .byte 117,29 // jne 9b15 <_sk_store_bgra_sse2_8bit+0x9d>
+ .byte 117,29 // jne 9b0d <_sk_store_bgra_sse2_8bit+0x9d>
.byte 243,15,127,44,158 // movdqu %xmm5,(%esi,%ebx,4)
.byte 243,15,127,100,158,16 // movdqu %xmm4,0x10(%esi,%ebx,4)
.byte 141,112,8 // lea 0x8(%eax),%esi
@@ -67816,19 +67814,19 @@ _sk_store_bgra_sse2_8bit:
.byte 128,101,243,7 // andb $0x7,-0xd(%ebp)
.byte 254,77,243 // decb -0xd(%ebp)
.byte 128,125,243,6 // cmpb $0x6,-0xd(%ebp)
- .byte 119,213 // ja 9b03 <_sk_store_bgra_sse2_8bit+0x8b>
+ .byte 119,213 // ja 9afb <_sk_store_bgra_sse2_8bit+0x8b>
.byte 15,182,125,243 // movzbl -0xd(%ebp),%edi
.byte 139,77,236 // mov -0x14(%ebp),%ecx
.byte 3,140,185,254,0,0,0 // add 0xfe(%ecx,%edi,4),%ecx
.byte 255,225 // jmp *%ecx
.byte 102,15,126,44,158 // movd %xmm5,(%esi,%ebx,4)
.byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 235,187 // jmp 9b03 <_sk_store_bgra_sse2_8bit+0x8b>
+ .byte 235,187 // jmp 9afb <_sk_store_bgra_sse2_8bit+0x8b>
.byte 102,15,112,229,78 // pshufd $0x4e,%xmm5,%xmm4
.byte 102,15,126,100,158,8 // movd %xmm4,0x8(%esi,%ebx,4)
.byte 102,15,214,44,158 // movq %xmm5,(%esi,%ebx,4)
.byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 235,166 // jmp 9b03 <_sk_store_bgra_sse2_8bit+0x8b>
+ .byte 235,166 // jmp 9afb <_sk_store_bgra_sse2_8bit+0x8b>
.byte 102,15,112,244,78 // pshufd $0x4e,%xmm4,%xmm6
.byte 102,15,126,116,158,24 // movd %xmm6,0x18(%esi,%ebx,4)
.byte 102,15,112,244,229 // pshufd $0xe5,%xmm4,%xmm6
@@ -67836,7 +67834,7 @@ _sk_store_bgra_sse2_8bit:
.byte 102,15,126,100,158,16 // movd %xmm4,0x10(%esi,%ebx,4)
.byte 243,15,127,44,158 // movdqu %xmm5,(%esi,%ebx,4)
.byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 235,128 // jmp 9b03 <_sk_store_bgra_sse2_8bit+0x8b>
+ .byte 235,128 // jmp 9afb <_sk_store_bgra_sse2_8bit+0x8b>
.byte 144 // nop
.byte 184,0,0,0,205 // mov $0xcd000000,%eax
.byte 0,0 // add %al,(%eax)
@@ -67862,22 +67860,22 @@ _sk_store_565_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 9bae <_sk_store_565_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call 9ba6 <_sk_store_565_sse2_8bit+0xe>
.byte 88 // pop %eax
- .byte 102,15,111,176,66,59,0,0 // movdqa 0x3b42(%eax),%xmm6
+ .byte 102,15,111,176,74,59,0,0 // movdqa 0x3b4a(%eax),%xmm6
.byte 102,15,111,249 // movdqa %xmm1,%xmm7
.byte 102,15,219,254 // pand %xmm6,%xmm7
.byte 102,15,219,240 // pand %xmm0,%xmm6
.byte 102,15,114,246,8 // pslld $0x8,%xmm6
.byte 102,15,114,247,8 // pslld $0x8,%xmm7
- .byte 102,15,111,160,82,59,0,0 // movdqa 0x3b52(%eax),%xmm4
+ .byte 102,15,111,160,90,59,0,0 // movdqa 0x3b5a(%eax),%xmm4
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,219,224 // pand %xmm0,%xmm4
.byte 102,15,114,212,5 // psrld $0x5,%xmm4
.byte 102,15,114,213,5 // psrld $0x5,%xmm5
.byte 102,15,235,239 // por %xmm7,%xmm5
- .byte 102,15,111,184,98,59,0,0 // movdqa 0x3b62(%eax),%xmm7
+ .byte 102,15,111,184,106,59,0,0 // movdqa 0x3b6a(%eax),%xmm7
.byte 102,15,235,230 // por %xmm6,%xmm4
.byte 102,15,111,240 // movdqa %xmm0,%xmm6
.byte 102,15,219,247 // pand %xmm7,%xmm6
@@ -67901,7 +67899,7 @@ _sk_store_565_sse2_8bit:
.byte 139,93,8 // mov 0x8(%ebp),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 117,23 // jne 9c64 <_sk_store_565_sse2_8bit+0xc4>
+ .byte 117,23 // jne 9c5c <_sk_store_565_sse2_8bit+0xc4>
.byte 243,15,127,36,119 // movdqu %xmm4,(%edi,%esi,2)
.byte 141,65,8 // lea 0x8(%ecx),%eax
.byte 82 // push %edx
@@ -67921,19 +67919,19 @@ _sk_store_565_sse2_8bit:
.byte 128,101,243,7 // andb $0x7,-0xd(%ebp)
.byte 254,77,243 // decb -0xd(%ebp)
.byte 128,125,243,6 // cmpb $0x6,-0xd(%ebp)
- .byte 119,216 // ja 9c52 <_sk_store_565_sse2_8bit+0xb2>
+ .byte 119,216 // ja 9c4a <_sk_store_565_sse2_8bit+0xb2>
.byte 15,182,85,243 // movzbl -0xd(%ebp),%edx
.byte 3,132,144,34,1,0,0 // add 0x122(%eax,%edx,4),%eax
.byte 255,224 // jmp *%eax
.byte 102,15,126,224 // movd %xmm4,%eax
.byte 102,137,4,119 // mov %ax,(%edi,%esi,2)
.byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 235,190 // jmp 9c52 <_sk_store_565_sse2_8bit+0xb2>
+ .byte 235,190 // jmp 9c4a <_sk_store_565_sse2_8bit+0xb2>
.byte 102,15,197,196,2 // pextrw $0x2,%xmm4,%eax
.byte 102,137,68,119,4 // mov %ax,0x4(%edi,%esi,2)
.byte 102,15,126,36,119 // movd %xmm4,(%edi,%esi,2)
.byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 235,170 // jmp 9c52 <_sk_store_565_sse2_8bit+0xb2>
+ .byte 235,170 // jmp 9c4a <_sk_store_565_sse2_8bit+0xb2>
.byte 102,15,197,196,6 // pextrw $0x6,%xmm4,%eax
.byte 102,137,68,119,12 // mov %ax,0xc(%edi,%esi,2)
.byte 102,15,197,196,5 // pextrw $0x5,%xmm4,%eax
@@ -67942,7 +67940,7 @@ _sk_store_565_sse2_8bit:
.byte 102,137,68,119,8 // mov %ax,0x8(%edi,%esi,2)
.byte 102,15,214,36,119 // movq %xmm4,(%edi,%esi,2)
.byte 139,85,20 // mov 0x14(%ebp),%edx
- .byte 235,130 // jmp 9c52 <_sk_store_565_sse2_8bit+0xb2>
+ .byte 235,130 // jmp 9c4a <_sk_store_565_sse2_8bit+0xb2>
.byte 217,0 // flds (%eax)
.byte 0,0 // add %al,(%eax)
.byte 240,0,0 // lock add %al,(%eax)
@@ -67969,7 +67967,7 @@ _sk_load_565_dst_sse2_8bit:
.byte 86 // push %esi
.byte 131,236,28 // sub $0x1c,%esp
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
- .byte 232,0,0,0,0 // call 9cfe <_sk_load_565_dst_sse2_8bit+0x12>
+ .byte 232,0,0,0,0 // call 9cf6 <_sk_load_565_dst_sse2_8bit+0x12>
.byte 94 // pop %esi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -67980,19 +67978,19 @@ _sk_load_565_dst_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 15,133,235,0,0,0 // jne 9e08 <_sk_load_565_dst_sse2_8bit+0x11c>
+ .byte 15,133,235,0,0,0 // jne 9e00 <_sk_load_565_dst_sse2_8bit+0x11c>
.byte 243,15,111,20,123 // movdqu (%ebx,%edi,2),%xmm2
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
.byte 102,15,97,212 // punpcklwd %xmm4,%xmm2
- .byte 102,15,111,182,66,53,0,0 // movdqa 0x3542(%esi),%xmm6
+ .byte 102,15,111,182,74,53,0,0 // movdqa 0x354a(%esi),%xmm6
.byte 102,15,111,250 // movdqa %xmm2,%xmm7
.byte 102,15,219,254 // pand %xmm6,%xmm7
.byte 102,15,219,243 // pand %xmm3,%xmm6
.byte 102,15,114,214,8 // psrld $0x8,%xmm6
.byte 102,15,114,215,8 // psrld $0x8,%xmm7
- .byte 102,15,111,174,130,53,0,0 // movdqa 0x3582(%esi),%xmm5
+ .byte 102,15,111,174,138,53,0,0 // movdqa 0x358a(%esi),%xmm5
.byte 102,15,111,226 // movdqa %xmm2,%xmm4
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,15,219,235 // pand %xmm3,%xmm5
@@ -68000,11 +67998,11 @@ _sk_load_565_dst_sse2_8bit:
.byte 102,15,114,244,19 // pslld $0x13,%xmm4
.byte 102,15,235,231 // por %xmm7,%xmm4
.byte 102,15,235,238 // por %xmm6,%xmm5
- .byte 102,15,111,182,98,53,0,0 // movdqa 0x3562(%esi),%xmm6
+ .byte 102,15,111,182,106,53,0,0 // movdqa 0x356a(%esi),%xmm6
.byte 102,15,111,251 // movdqa %xmm3,%xmm7
.byte 102,15,219,254 // pand %xmm6,%xmm7
.byte 102,15,219,242 // pand %xmm2,%xmm6
- .byte 102,15,111,142,50,58,0,0 // movdqa 0x3a32(%esi),%xmm1
+ .byte 102,15,111,142,58,58,0,0 // movdqa 0x3a3a(%esi),%xmm1
.byte 102,15,219,217 // pand %xmm1,%xmm3
.byte 102,15,219,209 // pand %xmm1,%xmm2
.byte 102,15,114,247,5 // pslld $0x5,%xmm7
@@ -68017,10 +68015,10 @@ _sk_load_565_dst_sse2_8bit:
.byte 102,15,235,214 // por %xmm6,%xmm2
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,114,212,5 // psrld $0x5,%xmm4
- .byte 102,15,111,142,34,58,0,0 // movdqa 0x3a22(%esi),%xmm1
+ .byte 102,15,111,142,42,58,0,0 // movdqa 0x3a2a(%esi),%xmm1
.byte 102,15,219,225 // pand %xmm1,%xmm4
.byte 102,15,219,233 // pand %xmm1,%xmm5
- .byte 102,15,111,142,226,57,0,0 // movdqa 0x39e2(%esi),%xmm1
+ .byte 102,15,111,142,234,57,0,0 // movdqa 0x39ea(%esi),%xmm1
.byte 102,15,235,209 // por %xmm1,%xmm2
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,235,217 // por %xmm1,%xmm3
@@ -68043,25 +68041,25 @@ _sk_load_565_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 15,135,6,255,255,255 // ja 9d22 <_sk_load_565_dst_sse2_8bit+0x36>
+ .byte 15,135,6,255,255,255 // ja 9d1a <_sk_load_565_dst_sse2_8bit+0x36>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,142,118,1,0,0 // mov 0x176(%esi,%ecx,4),%ecx
.byte 1,241 // add %esi,%ecx
.byte 255,225 // jmp *%ecx
.byte 15,183,12,123 // movzwl (%ebx,%edi,2),%ecx
.byte 102,15,110,209 // movd %ecx,%xmm2
- .byte 233,235,254,255,255 // jmp 9d22 <_sk_load_565_dst_sse2_8bit+0x36>
+ .byte 233,235,254,255,255 // jmp 9d1a <_sk_load_565_dst_sse2_8bit+0x36>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,84,123,4,2 // pinsrw $0x2,0x4(%ebx,%edi,2),%xmm2
.byte 243,15,16,28,123 // movss (%ebx,%edi,2),%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 233,210,254,255,255 // jmp 9d22 <_sk_load_565_dst_sse2_8bit+0x36>
+ .byte 233,210,254,255,255 // jmp 9d1a <_sk_load_565_dst_sse2_8bit+0x36>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,84,123,12,6 // pinsrw $0x6,0xc(%ebx,%edi,2),%xmm2
.byte 102,15,196,84,123,10,5 // pinsrw $0x5,0xa(%ebx,%edi,2),%xmm2
.byte 102,15,196,84,123,8,4 // pinsrw $0x4,0x8(%ebx,%edi,2),%xmm2
.byte 102,15,18,20,123 // movlpd (%ebx,%edi,2),%xmm2
- .byte 233,175,254,255,255 // jmp 9d22 <_sk_load_565_dst_sse2_8bit+0x36>
+ .byte 233,175,254,255,255 // jmp 9d1a <_sk_load_565_dst_sse2_8bit+0x36>
.byte 144 // nop
.byte 44,1 // sub $0x1,%al
.byte 0,0 // add %al,(%eax)
@@ -68088,7 +68086,7 @@ _sk_load_a8_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 9e9e <_sk_load_a8_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call 9e96 <_sk_load_a8_sse2_8bit+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -68098,10 +68096,10 @@ _sk_load_a8_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 117,63 // jne 9ef6 <_sk_load_a8_sse2_8bit+0x66>
+ .byte 117,63 // jne 9eee <_sk_load_a8_sse2_8bit+0x66>
.byte 243,15,126,4,51 // movq (%ebx,%esi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
- .byte 102,15,219,135,162,56,0,0 // pand 0x38a2(%edi),%xmm0
+ .byte 102,15,219,135,170,56,0,0 // pand 0x38aa(%edi),%xmm0
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
@@ -68125,14 +68123,14 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 119,186 // ja 9ec0 <_sk_load_a8_sse2_8bit+0x30>
+ .byte 119,186 // ja 9eb8 <_sk_load_a8_sse2_8bit+0x30>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,143,214,0,0,0 // mov 0xd6(%edi,%ecx,4),%ecx
.byte 1,249 // add %edi,%ecx
.byte 255,225 // jmp *%ecx
.byte 15,182,12,51 // movzbl (%ebx,%esi,1),%ecx
.byte 102,15,110,193 // movd %ecx,%xmm0
- .byte 235,162 // jmp 9ec0 <_sk_load_a8_sse2_8bit+0x30>
+ .byte 235,162 // jmp 9eb8 <_sk_load_a8_sse2_8bit+0x30>
.byte 15,182,76,51,2 // movzbl 0x2(%ebx,%esi,1),%ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,193,2 // pinsrw $0x2,%ecx,%xmm0
@@ -68140,7 +68138,7 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,110,201 // movd %ecx,%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 235,130 // jmp 9ec0 <_sk_load_a8_sse2_8bit+0x30>
+ .byte 235,130 // jmp 9eb8 <_sk_load_a8_sse2_8bit+0x30>
.byte 15,182,76,51,6 // movzbl 0x6(%ebx,%esi,1),%ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,193,6 // pinsrw $0x6,%ecx,%xmm0
@@ -68151,9 +68149,9 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,110,12,51 // movd (%ebx,%esi,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 233,78,255,255,255 // jmp 9ec0 <_sk_load_a8_sse2_8bit+0x30>
+ .byte 233,78,255,255,255 // jmp 9eb8 <_sk_load_a8_sse2_8bit+0x30>
.byte 102,144 // xchg %ax,%ax
- .byte 118,0 // jbe 9f76 <_sk_load_a8_sse2_8bit+0xe6>
+ .byte 118,0 // jbe 9f6e <_sk_load_a8_sse2_8bit+0xe6>
.byte 0,0 // add %al,(%eax)
.byte 142,0 // mov (%eax),%es
.byte 0,0 // add %al,(%eax)
@@ -68177,7 +68175,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 9f9e <_sk_load_a8_dst_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call 9f96 <_sk_load_a8_dst_sse2_8bit+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -68187,10 +68185,10 @@ _sk_load_a8_dst_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 117,63 // jne 9ff6 <_sk_load_a8_dst_sse2_8bit+0x66>
+ .byte 117,63 // jne 9fee <_sk_load_a8_dst_sse2_8bit+0x66>
.byte 243,15,126,20,51 // movq (%ebx,%esi,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
- .byte 102,15,219,151,162,55,0,0 // pand 0x37a2(%edi),%xmm2
+ .byte 102,15,219,151,170,55,0,0 // pand 0x37aa(%edi),%xmm2
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
@@ -68214,14 +68212,14 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 119,186 // ja 9fc0 <_sk_load_a8_dst_sse2_8bit+0x30>
+ .byte 119,186 // ja 9fb8 <_sk_load_a8_dst_sse2_8bit+0x30>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,143,214,0,0,0 // mov 0xd6(%edi,%ecx,4),%ecx
.byte 1,249 // add %edi,%ecx
.byte 255,225 // jmp *%ecx
.byte 15,182,12,51 // movzbl (%ebx,%esi,1),%ecx
.byte 102,15,110,209 // movd %ecx,%xmm2
- .byte 235,162 // jmp 9fc0 <_sk_load_a8_dst_sse2_8bit+0x30>
+ .byte 235,162 // jmp 9fb8 <_sk_load_a8_dst_sse2_8bit+0x30>
.byte 15,182,76,51,2 // movzbl 0x2(%ebx,%esi,1),%ecx
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,209,2 // pinsrw $0x2,%ecx,%xmm2
@@ -68229,7 +68227,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,110,217 // movd %ecx,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 235,130 // jmp 9fc0 <_sk_load_a8_dst_sse2_8bit+0x30>
+ .byte 235,130 // jmp 9fb8 <_sk_load_a8_dst_sse2_8bit+0x30>
.byte 15,182,76,51,6 // movzbl 0x6(%ebx,%esi,1),%ecx
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,209,6 // pinsrw $0x6,%ecx,%xmm2
@@ -68240,9 +68238,9 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,110,28,51 // movd (%ebx,%esi,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,78,255,255,255 // jmp 9fc0 <_sk_load_a8_dst_sse2_8bit+0x30>
+ .byte 233,78,255,255,255 // jmp 9fb8 <_sk_load_a8_dst_sse2_8bit+0x30>
.byte 102,144 // xchg %ax,%ax
- .byte 118,0 // jbe a076 <_sk_load_a8_dst_sse2_8bit+0xe6>
+ .byte 118,0 // jbe a06e <_sk_load_a8_dst_sse2_8bit+0xe6>
.byte 0,0 // add %al,(%eax)
.byte 142,0 // mov (%eax),%es
.byte 0,0 // add %al,(%eax)
@@ -68266,7 +68264,7 @@ _sk_store_a8_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,92 // sub $0x5c,%esp
- .byte 232,0,0,0,0 // call a09e <_sk_store_a8_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call a096 <_sk_store_a8_sse2_8bit+0xe>
.byte 91 // pop %ebx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -68285,8 +68283,8 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,107,229 // packssdw %xmm5,%xmm4
.byte 133,210 // test %edx,%edx
.byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 117,37 // jne a106 <_sk_store_a8_sse2_8bit+0x76>
- .byte 102,15,219,163,162,54,0,0 // pand 0x36a2(%ebx),%xmm4
+ .byte 117,37 // jne a0fe <_sk_store_a8_sse2_8bit+0x76>
+ .byte 102,15,219,163,170,54,0,0 // pand 0x36aa(%ebx),%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,214,36,62 // movq %xmm4,(%esi,%edi,1)
.byte 141,72,8 // lea 0x8(%eax),%ecx
@@ -68305,7 +68303,7 @@ _sk_store_a8_sse2_8bit:
.byte 128,225,7 // and $0x7,%cl
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 119,224 // ja a0f2 <_sk_store_a8_sse2_8bit+0x62>
+ .byte 119,224 // ja a0ea <_sk_store_a8_sse2_8bit+0x62>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,139,238,0,0,0 // mov 0xee(%ebx,%ecx,4),%ecx
.byte 1,217 // add %ebx,%ecx
@@ -68313,15 +68311,15 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,127,101,152 // movdqa %xmm4,-0x68(%ebp)
.byte 138,77,152 // mov -0x68(%ebp),%cl
.byte 136,12,62 // mov %cl,(%esi,%edi,1)
- .byte 235,197 // jmp a0f2 <_sk_store_a8_sse2_8bit+0x62>
+ .byte 235,197 // jmp a0ea <_sk_store_a8_sse2_8bit+0x62>
.byte 102,15,127,101,168 // movdqa %xmm4,-0x58(%ebp)
.byte 138,77,172 // mov -0x54(%ebp),%cl
.byte 136,76,62,2 // mov %cl,0x2(%esi,%edi,1)
- .byte 102,15,219,163,162,54,0,0 // pand 0x36a2(%ebx),%xmm4
+ .byte 102,15,219,163,170,54,0,0 // pand 0x36aa(%ebx),%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,126,225 // movd %xmm4,%ecx
.byte 102,137,12,62 // mov %cx,(%esi,%edi,1)
- .byte 235,163 // jmp a0f2 <_sk_store_a8_sse2_8bit+0x62>
+ .byte 235,163 // jmp a0ea <_sk_store_a8_sse2_8bit+0x62>
.byte 102,15,127,101,184 // movdqa %xmm4,-0x48(%ebp)
.byte 138,77,196 // mov -0x3c(%ebp),%cl
.byte 136,76,62,6 // mov %cl,0x6(%esi,%edi,1)
@@ -68331,10 +68329,10 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,127,101,216 // movdqa %xmm4,-0x28(%ebp)
.byte 138,77,224 // mov -0x20(%ebp),%cl
.byte 136,76,62,4 // mov %cl,0x4(%esi,%edi,1)
- .byte 102,15,219,163,162,54,0,0 // pand 0x36a2(%ebx),%xmm4
+ .byte 102,15,219,163,170,54,0,0 // pand 0x36aa(%ebx),%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,126,36,62 // movd %xmm4,(%esi,%edi,1)
- .byte 233,105,255,255,255 // jmp a0f2 <_sk_store_a8_sse2_8bit+0x62>
+ .byte 233,105,255,255,255 // jmp a0ea <_sk_store_a8_sse2_8bit+0x62>
.byte 15,31,0 // nopl (%eax)
.byte 130,0,0 // addb $0x0,(%eax)
.byte 0,155,0,0,0,143 // add %bl,-0x71000000(%ebx)
@@ -68357,7 +68355,7 @@ _sk_load_g8_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call a1b6 <_sk_load_g8_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call a1ae <_sk_load_g8_sse2_8bit+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -68367,15 +68365,15 @@ _sk_load_g8_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,131,0,0,0 // jne a256 <_sk_load_g8_sse2_8bit+0xae>
+ .byte 15,133,131,0,0,0 // jne a24e <_sk_load_g8_sse2_8bit+0xae>
.byte 243,15,126,4,51 // movq (%ebx,%esi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
- .byte 102,15,219,135,138,53,0,0 // pand 0x358a(%edi),%xmm0
+ .byte 102,15,219,135,146,53,0,0 // pand 0x3592(%edi),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
.byte 102,15,105,193 // punpckhwd %xmm1,%xmm0
- .byte 102,15,111,175,154,53,0,0 // movdqa 0x359a(%edi),%xmm5
+ .byte 102,15,111,175,162,53,0,0 // movdqa 0x35a2(%edi),%xmm5
.byte 102,15,112,240,245 // pshufd $0xf5,%xmm0,%xmm6
.byte 102,15,244,197 // pmuludq %xmm5,%xmm0
.byte 102,15,112,200,232 // pshufd $0xe8,%xmm0,%xmm1
@@ -68388,7 +68386,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,244,245 // pmuludq %xmm5,%xmm6
.byte 102,15,112,230,232 // pshufd $0xe8,%xmm6,%xmm4
.byte 102,15,98,196 // punpckldq %xmm4,%xmm0
- .byte 102,15,111,167,42,53,0,0 // movdqa 0x352a(%edi),%xmm4
+ .byte 102,15,111,167,50,53,0,0 // movdqa 0x3532(%edi),%xmm4
.byte 102,15,235,196 // por %xmm4,%xmm0
.byte 102,15,235,204 // por %xmm4,%xmm1
.byte 141,72,8 // lea 0x8(%eax),%ecx
@@ -68408,14 +68406,14 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 15,135,114,255,255,255 // ja a1dc <_sk_load_g8_sse2_8bit+0x34>
+ .byte 15,135,114,255,255,255 // ja a1d4 <_sk_load_g8_sse2_8bit+0x34>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,143,38,1,0,0 // mov 0x126(%edi,%ecx,4),%ecx
.byte 1,249 // add %edi,%ecx
.byte 255,225 // jmp *%ecx
.byte 15,182,12,51 // movzbl (%ebx,%esi,1),%ecx
.byte 102,15,110,193 // movd %ecx,%xmm0
- .byte 233,87,255,255,255 // jmp a1dc <_sk_load_g8_sse2_8bit+0x34>
+ .byte 233,87,255,255,255 // jmp a1d4 <_sk_load_g8_sse2_8bit+0x34>
.byte 15,182,76,51,2 // movzbl 0x2(%ebx,%esi,1),%ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,193,2 // pinsrw $0x2,%ecx,%xmm0
@@ -68423,7 +68421,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,110,201 // movd %ecx,%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 233,52,255,255,255 // jmp a1dc <_sk_load_g8_sse2_8bit+0x34>
+ .byte 233,52,255,255,255 // jmp a1d4 <_sk_load_g8_sse2_8bit+0x34>
.byte 15,182,76,51,6 // movzbl 0x6(%ebx,%esi,1),%ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,193,6 // pinsrw $0x6,%ecx,%xmm0
@@ -68434,7 +68432,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,110,12,51 // movd (%ebx,%esi,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 233,0,255,255,255 // jmp a1dc <_sk_load_g8_sse2_8bit+0x34>
+ .byte 233,0,255,255,255 // jmp a1d4 <_sk_load_g8_sse2_8bit+0x34>
.byte 194,0,0 // ret $0x0
.byte 0,221 // add %bl,%ch
.byte 0,0 // add %al,(%eax)
@@ -68459,7 +68457,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call a306 <_sk_load_g8_dst_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call a2fe <_sk_load_g8_dst_sse2_8bit+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -68469,15 +68467,15 @@ _sk_load_g8_dst_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,131,0,0,0 // jne a3a6 <_sk_load_g8_dst_sse2_8bit+0xae>
+ .byte 15,133,131,0,0,0 // jne a39e <_sk_load_g8_dst_sse2_8bit+0xae>
.byte 243,15,126,20,51 // movq (%ebx,%esi,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
- .byte 102,15,219,151,58,52,0,0 // pand 0x343a(%edi),%xmm2
+ .byte 102,15,219,151,66,52,0,0 // pand 0x3442(%edi),%xmm2
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,111,226 // movdqa %xmm2,%xmm4
.byte 102,15,97,227 // punpcklwd %xmm3,%xmm4
.byte 102,15,105,211 // punpckhwd %xmm3,%xmm2
- .byte 102,15,111,175,74,52,0,0 // movdqa 0x344a(%edi),%xmm5
+ .byte 102,15,111,175,82,52,0,0 // movdqa 0x3452(%edi),%xmm5
.byte 102,15,112,242,245 // pshufd $0xf5,%xmm2,%xmm6
.byte 102,15,244,213 // pmuludq %xmm5,%xmm2
.byte 102,15,112,218,232 // pshufd $0xe8,%xmm2,%xmm3
@@ -68490,7 +68488,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,244,245 // pmuludq %xmm5,%xmm6
.byte 102,15,112,230,232 // pshufd $0xe8,%xmm6,%xmm4
.byte 102,15,98,212 // punpckldq %xmm4,%xmm2
- .byte 102,15,111,167,218,51,0,0 // movdqa 0x33da(%edi),%xmm4
+ .byte 102,15,111,167,226,51,0,0 // movdqa 0x33e2(%edi),%xmm4
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,235,220 // por %xmm4,%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
@@ -68510,14 +68508,14 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 15,135,114,255,255,255 // ja a32c <_sk_load_g8_dst_sse2_8bit+0x34>
+ .byte 15,135,114,255,255,255 // ja a324 <_sk_load_g8_dst_sse2_8bit+0x34>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,143,38,1,0,0 // mov 0x126(%edi,%ecx,4),%ecx
.byte 1,249 // add %edi,%ecx
.byte 255,225 // jmp *%ecx
.byte 15,182,12,51 // movzbl (%ebx,%esi,1),%ecx
.byte 102,15,110,209 // movd %ecx,%xmm2
- .byte 233,87,255,255,255 // jmp a32c <_sk_load_g8_dst_sse2_8bit+0x34>
+ .byte 233,87,255,255,255 // jmp a324 <_sk_load_g8_dst_sse2_8bit+0x34>
.byte 15,182,76,51,2 // movzbl 0x2(%ebx,%esi,1),%ecx
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,209,2 // pinsrw $0x2,%ecx,%xmm2
@@ -68525,7 +68523,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,110,217 // movd %ecx,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 233,52,255,255,255 // jmp a32c <_sk_load_g8_dst_sse2_8bit+0x34>
+ .byte 233,52,255,255,255 // jmp a324 <_sk_load_g8_dst_sse2_8bit+0x34>
.byte 15,182,76,51,6 // movzbl 0x6(%ebx,%esi,1),%ecx
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,209,6 // pinsrw $0x6,%ecx,%xmm2
@@ -68536,7 +68534,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,110,28,51 // movd (%ebx,%esi,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,0,255,255,255 // jmp a32c <_sk_load_g8_dst_sse2_8bit+0x34>
+ .byte 233,0,255,255,255 // jmp a324 <_sk_load_g8_dst_sse2_8bit+0x34>
.byte 194,0,0 // ret $0x0
.byte 0,221 // add %bl,%ch
.byte 0,0 // add %al,(%eax)
@@ -68563,7 +68561,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 131,236,124 // sub $0x7c,%esp
.byte 15,41,157,120,255,255,255 // movaps %xmm3,-0x88(%ebp)
.byte 102,15,127,85,136 // movdqa %xmm2,-0x78(%ebp)
- .byte 232,0,0,0,0 // call a462 <_sk_srcover_rgba_8888_sse2_8bit+0x1a>
+ .byte 232,0,0,0,0 // call a45a <_sk_srcover_rgba_8888_sse2_8bit+0x1a>
.byte 91 // pop %ebx
.byte 139,77,20 // mov 0x14(%ebp),%ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
@@ -68575,7 +68573,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,51,1,0,0 // jne a5b7 <_sk_srcover_rgba_8888_sse2_8bit+0x16f>
+ .byte 15,133,51,1,0,0 // jne a5af <_sk_srcover_rgba_8888_sse2_8bit+0x16f>
.byte 15,16,116,183,16 // movups 0x10(%edi,%esi,4),%xmm6
.byte 102,15,16,20,183 // movupd (%edi,%esi,4),%xmm2
.byte 102,15,41,85,200 // movapd %xmm2,-0x38(%ebp)
@@ -68635,7 +68633,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 133,210 // test %edx,%edx
.byte 102,15,252,232 // paddb %xmm0,%xmm5
.byte 102,15,252,217 // paddb %xmm1,%xmm3
- .byte 117,98 // jne a5ee <_sk_srcover_rgba_8888_sse2_8bit+0x1a6>
+ .byte 117,98 // jne a5e6 <_sk_srcover_rgba_8888_sse2_8bit+0x1a6>
.byte 243,15,127,44,183 // movdqu %xmm5,(%edi,%esi,4)
.byte 243,15,127,92,183,16 // movdqu %xmm3,0x10(%edi,%esi,4)
.byte 141,120,8 // lea 0x8(%eax),%edi
@@ -68660,33 +68658,33 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 254,77,200 // decb -0x38(%ebp)
.byte 128,125,200,6 // cmpb $0x6,-0x38(%ebp)
- .byte 119,66 // ja a616 <_sk_srcover_rgba_8888_sse2_8bit+0x1ce>
+ .byte 119,66 // ja a60e <_sk_srcover_rgba_8888_sse2_8bit+0x1ce>
.byte 15,182,93,200 // movzbl -0x38(%ebp),%ebx
.byte 139,69,216 // mov -0x28(%ebp),%eax
.byte 139,156,152,70,2,0,0 // mov 0x246(%eax,%ebx,4),%ebx
.byte 3,93,216 // add -0x28(%ebp),%ebx
.byte 255,227 // jmp *%ebx
.byte 243,15,16,20,183 // movss (%edi,%esi,4),%xmm2
- .byte 235,109 // jmp a65b <_sk_srcover_rgba_8888_sse2_8bit+0x213>
+ .byte 235,109 // jmp a653 <_sk_srcover_rgba_8888_sse2_8bit+0x213>
.byte 137,93,216 // mov %ebx,-0x28(%ebp)
.byte 137,211 // mov %edx,%ebx
.byte 128,227,7 // and $0x7,%bl
.byte 254,203 // dec %bl
.byte 128,251,6 // cmp $0x6,%bl
- .byte 119,154 // ja a597 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ .byte 119,154 // ja a58f <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
.byte 15,182,219 // movzbl %bl,%ebx
.byte 139,77,216 // mov -0x28(%ebp),%ecx
.byte 3,140,153,98,2,0,0 // add 0x262(%ecx,%ebx,4),%ecx
.byte 255,225 // jmp *%ecx
.byte 102,15,126,44,183 // movd %xmm5,(%edi,%esi,4)
.byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 235,129 // jmp a597 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ .byte 235,129 // jmp a58f <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
.byte 139,93,216 // mov -0x28(%ebp),%ebx
- .byte 233,112,254,255,255 // jmp a48e <_sk_srcover_rgba_8888_sse2_8bit+0x46>
+ .byte 233,112,254,255,255 // jmp a486 <_sk_srcover_rgba_8888_sse2_8bit+0x46>
.byte 102,15,110,92,183,8 // movd 0x8(%edi,%esi,4),%xmm3
.byte 102,15,112,211,69 // pshufd $0x45,%xmm3,%xmm2
.byte 102,15,18,20,183 // movlpd (%edi,%esi,4),%xmm2
- .byte 235,43 // jmp a65b <_sk_srcover_rgba_8888_sse2_8bit+0x213>
+ .byte 235,43 // jmp a653 <_sk_srcover_rgba_8888_sse2_8bit+0x213>
.byte 102,15,110,84,183,24 // movd 0x18(%edi,%esi,4),%xmm2
.byte 102,15,112,242,69 // pshufd $0x45,%xmm2,%xmm6
.byte 243,15,16,92,183,20 // movss 0x14(%edi,%esi,4),%xmm3
@@ -68698,12 +68696,12 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,15,16,20,183 // movupd (%edi,%esi,4),%xmm2
.byte 139,93,216 // mov -0x28(%ebp),%ebx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 233,40,254,255,255 // jmp a48e <_sk_srcover_rgba_8888_sse2_8bit+0x46>
+ .byte 233,40,254,255,255 // jmp a486 <_sk_srcover_rgba_8888_sse2_8bit+0x46>
.byte 102,15,112,213,78 // pshufd $0x4e,%xmm5,%xmm2
.byte 102,15,126,84,183,8 // movd %xmm2,0x8(%edi,%esi,4)
.byte 102,15,214,44,183 // movq %xmm5,(%edi,%esi,4)
.byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 233,25,255,255,255 // jmp a597 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ .byte 233,25,255,255,255 // jmp a58f <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
.byte 102,15,112,211,78 // pshufd $0x4e,%xmm3,%xmm2
.byte 102,15,126,84,183,24 // movd %xmm2,0x18(%edi,%esi,4)
.byte 102,15,112,211,229 // pshufd $0xe5,%xmm3,%xmm2
@@ -68711,7 +68709,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,15,126,92,183,16 // movd %xmm3,0x10(%edi,%esi,4)
.byte 243,15,127,44,183 // movdqu %xmm5,(%edi,%esi,4)
.byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 233,240,254,255,255 // jmp a597 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ .byte 233,240,254,255,255 // jmp a58f <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
.byte 144 // nop
.byte 133,1 // test %eax,(%ecx)
.byte 0,0 // add %al,(%eax)
@@ -68749,12 +68747,12 @@ _sk_scale_1_float_sse2_8bit:
.byte 15,41,85,232 // movaps %xmm2,-0x18(%ebp)
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 232,0,0,0,0 // call a6fb <_sk_scale_1_float_sse2_8bit+0x1b>
+ .byte 232,0,0,0,0 // call a6f3 <_sk_scale_1_float_sse2_8bit+0x1b>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
.byte 243,15,16,2 // movss (%edx),%xmm0
- .byte 243,15,89,129,153,48,0,0 // mulss 0x3099(%ecx),%xmm0
+ .byte 243,15,89,129,161,48,0,0 // mulss 0x30a1(%ecx),%xmm0
.byte 243,15,44,208 // cvttss2si %xmm0,%edx
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,15,111,213 // movdqa %xmm5,%xmm2
@@ -68766,7 +68764,7 @@ _sk_scale_1_float_sse2_8bit:
.byte 102,15,96,246 // punpcklbw %xmm6,%xmm6
.byte 242,15,112,246,0 // pshuflw $0x0,%xmm6,%xmm6
.byte 102,15,112,246,80 // pshufd $0x50,%xmm6,%xmm6
- .byte 102,15,219,177,69,48,0,0 // pand 0x3045(%ecx),%xmm6
+ .byte 102,15,219,177,77,48,0,0 // pand 0x304d(%ecx),%xmm6
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
.byte 102,15,111,222 // movdqa %xmm6,%xmm3
.byte 102,15,111,198 // movdqa %xmm6,%xmm0
@@ -68809,7 +68807,7 @@ _sk_scale_u8_sse2_8bit:
.byte 131,236,60 // sub $0x3c,%esp
.byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
.byte 102,15,127,85,200 // movdqa %xmm2,-0x38(%ebp)
- .byte 232,0,0,0,0 // call a7c3 <_sk_scale_u8_sse2_8bit+0x17>
+ .byte 232,0,0,0,0 // call a7bb <_sk_scale_u8_sse2_8bit+0x17>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -68819,10 +68817,10 @@ _sk_scale_u8_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,11,1,0,0 // jne a8eb <_sk_scale_u8_sse2_8bit+0x13f>
+ .byte 15,133,11,1,0,0 // jne a8e3 <_sk_scale_u8_sse2_8bit+0x13f>
.byte 243,15,126,36,51 // movq (%ebx,%esi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
- .byte 102,15,219,167,125,47,0,0 // pand 0x2f7d(%edi),%xmm4
+ .byte 102,15,219,167,133,47,0,0 // pand 0x2f85(%edi),%xmm4
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,111,236 // movdqa %xmm4,%xmm5
.byte 102,15,105,234 // punpckhwd %xmm2,%xmm5
@@ -68893,14 +68891,14 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 15,135,234,254,255,255 // ja a7e9 <_sk_scale_u8_sse2_8bit+0x3d>
+ .byte 15,135,234,254,255,255 // ja a7e1 <_sk_scale_u8_sse2_8bit+0x3d>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,143,177,1,0,0 // mov 0x1b1(%edi,%ecx,4),%ecx
.byte 1,249 // add %edi,%ecx
.byte 255,225 // jmp *%ecx
.byte 15,182,12,51 // movzbl (%ebx,%esi,1),%ecx
.byte 102,15,110,225 // movd %ecx,%xmm4
- .byte 233,207,254,255,255 // jmp a7e9 <_sk_scale_u8_sse2_8bit+0x3d>
+ .byte 233,207,254,255,255 // jmp a7e1 <_sk_scale_u8_sse2_8bit+0x3d>
.byte 15,182,76,51,2 // movzbl 0x2(%ebx,%esi,1),%ecx
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,196,225,2 // pinsrw $0x2,%ecx,%xmm4
@@ -68908,7 +68906,7 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,110,217 // movd %ecx,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,227 // movss %xmm3,%xmm4
- .byte 233,172,254,255,255 // jmp a7e9 <_sk_scale_u8_sse2_8bit+0x3d>
+ .byte 233,172,254,255,255 // jmp a7e1 <_sk_scale_u8_sse2_8bit+0x3d>
.byte 15,182,76,51,6 // movzbl 0x6(%ebx,%esi,1),%ecx
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,196,225,6 // pinsrw $0x6,%ecx,%xmm4
@@ -68919,7 +68917,7 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,110,28,51 // movd (%ebx,%esi,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,227 // movsd %xmm3,%xmm4
- .byte 233,120,254,255,255 // jmp a7e9 <_sk_scale_u8_sse2_8bit+0x3d>
+ .byte 233,120,254,255,255 // jmp a7e1 <_sk_scale_u8_sse2_8bit+0x3d>
.byte 15,31,0 // nopl (%eax)
.byte 74 // dec %edx
.byte 1,0 // add %eax,(%eax)
@@ -68931,7 +68929,7 @@ _sk_scale_u8_sse2_8bit:
.byte 0,0 // add %al,(%eax)
.byte 136,1 // mov %al,(%ecx)
.byte 0,0 // add %al,(%eax)
- .byte 122,1 // jp a98f <_sk_scale_u8_sse2_8bit+0x1e3>
+ .byte 122,1 // jp a987 <_sk_scale_u8_sse2_8bit+0x1e3>
.byte 0,0 // add %al,(%eax)
HIDDEN _sk_lerp_1_float_sse2_8bit
@@ -68945,12 +68943,12 @@ _sk_lerp_1_float_sse2_8bit:
.byte 15,41,85,232 // movaps %xmm2,-0x18(%ebp)
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 232,0,0,0,0 // call a9ab <_sk_lerp_1_float_sse2_8bit+0x1b>
+ .byte 232,0,0,0,0 // call a9a3 <_sk_lerp_1_float_sse2_8bit+0x1b>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
.byte 243,15,16,34 // movss (%edx),%xmm4
- .byte 243,15,89,161,233,45,0,0 // mulss 0x2de9(%ecx),%xmm4
+ .byte 243,15,89,161,241,45,0,0 // mulss 0x2df1(%ecx),%xmm4
.byte 243,15,44,212 // cvttss2si %xmm4,%edx
.byte 102,15,110,226 // movd %edx,%xmm4
.byte 102,15,96,228 // punpcklbw %xmm4,%xmm4
@@ -68959,7 +68957,7 @@ _sk_lerp_1_float_sse2_8bit:
.byte 102,15,127,85,200 // movdqa %xmm2,-0x38(%ebp)
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,96,197 // punpcklbw %xmm5,%xmm0
- .byte 102,15,111,153,149,45,0,0 // movdqa 0x2d95(%ecx),%xmm3
+ .byte 102,15,111,153,157,45,0,0 // movdqa 0x2d9d(%ecx),%xmm3
.byte 102,15,219,218 // pand %xmm2,%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
@@ -69042,7 +69040,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 131,236,92 // sub $0x5c,%esp
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 102,15,127,85,216 // movdqa %xmm2,-0x28(%ebp)
- .byte 232,0,0,0,0 // call ab11 <_sk_lerp_u8_sse2_8bit+0x17>
+ .byte 232,0,0,0,0 // call ab09 <_sk_lerp_u8_sse2_8bit+0x17>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -69052,10 +69050,10 @@ _sk_lerp_u8_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,181,1,0,0 // jne ace3 <_sk_lerp_u8_sse2_8bit+0x1e9>
+ .byte 15,133,181,1,0,0 // jne acdb <_sk_lerp_u8_sse2_8bit+0x1e9>
.byte 243,15,126,44,51 // movq (%ebx,%esi,1),%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
- .byte 102,15,219,175,47,44,0,0 // pand 0x2c2f(%edi),%xmm5
+ .byte 102,15,219,175,55,44,0,0 // pand 0x2c37(%edi),%xmm5
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,111,221 // movdqa %xmm5,%xmm3
.byte 102,15,105,218 // punpckhwd %xmm2,%xmm3
@@ -69166,14 +69164,14 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 15,135,64,254,255,255 // ja ab37 <_sk_lerp_u8_sse2_8bit+0x3d>
+ .byte 15,135,64,254,255,255 // ja ab2f <_sk_lerp_u8_sse2_8bit+0x3d>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,143,91,2,0,0 // mov 0x25b(%edi,%ecx,4),%ecx
.byte 1,249 // add %edi,%ecx
.byte 255,225 // jmp *%ecx
.byte 15,182,12,51 // movzbl (%ebx,%esi,1),%ecx
.byte 102,15,110,233 // movd %ecx,%xmm5
- .byte 233,37,254,255,255 // jmp ab37 <_sk_lerp_u8_sse2_8bit+0x3d>
+ .byte 233,37,254,255,255 // jmp ab2f <_sk_lerp_u8_sse2_8bit+0x3d>
.byte 15,182,76,51,2 // movzbl 0x2(%ebx,%esi,1),%ecx
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,196,233,2 // pinsrw $0x2,%ecx,%xmm5
@@ -69181,7 +69179,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,110,217 // movd %ecx,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,235 // movss %xmm3,%xmm5
- .byte 233,2,254,255,255 // jmp ab37 <_sk_lerp_u8_sse2_8bit+0x3d>
+ .byte 233,2,254,255,255 // jmp ab2f <_sk_lerp_u8_sse2_8bit+0x3d>
.byte 15,182,76,51,6 // movzbl 0x6(%ebx,%esi,1),%ecx
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,196,233,6 // pinsrw $0x6,%ecx,%xmm5
@@ -69192,7 +69190,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,110,28,51 // movd (%ebx,%esi,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,235 // movsd %xmm3,%xmm5
- .byte 233,206,253,255,255 // jmp ab37 <_sk_lerp_u8_sse2_8bit+0x3d>
+ .byte 233,206,253,255,255 // jmp ab2f <_sk_lerp_u8_sse2_8bit+0x3d>
.byte 15,31,0 // nopl (%eax)
.byte 244 // hlt
.byte 1,0 // add %eax,(%eax)
@@ -69256,11 +69254,11 @@ _sk_black_color_sse2_8bit:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call add9 <_sk_black_color_sse2_8bit+0xb>
+ .byte 232,0,0,0,0 // call add1 <_sk_black_color_sse2_8bit+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
- .byte 15,40,128,7,41,0,0 // movaps 0x2907(%eax),%xmm0
+ .byte 15,40,128,15,41,0,0 // movaps 0x290f(%eax),%xmm0
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 255,117,20 // pushl 0x14(%ebp)
.byte 255,117,16 // pushl 0x10(%ebp)
@@ -70497,12 +70495,12 @@ _sk_darken_sse2_8bit:
.byte 102,15,252,218 // paddb %xmm2,%xmm3
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
.byte 102,15,248,238 // psubb %xmm6,%xmm5
- .byte 232,0,0,0,0 // call bffc <_sk_darken_sse2_8bit+0x1f7>
+ .byte 232,0,0,0,0 // call bff4 <_sk_darken_sse2_8bit+0x1f7>
.byte 88 // pop %eax
.byte 102,15,248,207 // psubb %xmm7,%xmm1
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,248,216 // psubb %xmm0,%xmm3
- .byte 102,15,111,128,100,23,0,0 // movdqa 0x1764(%eax),%xmm0
+ .byte 102,15,111,128,108,23,0,0 // movdqa 0x176c(%eax),%xmm0
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,15,223,203 // pandn %xmm3,%xmm1
.byte 102,15,219,232 // pand %xmm0,%xmm5
@@ -70643,12 +70641,12 @@ _sk_lighten_sse2_8bit:
.byte 102,15,252,218 // paddb %xmm2,%xmm3
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
.byte 102,15,248,238 // psubb %xmm6,%xmm5
- .byte 232,0,0,0,0 // call c24a <_sk_lighten_sse2_8bit+0x1f7>
+ .byte 232,0,0,0,0 // call c242 <_sk_lighten_sse2_8bit+0x1f7>
.byte 88 // pop %eax
.byte 102,15,248,207 // psubb %xmm7,%xmm1
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,248,216 // psubb %xmm0,%xmm3
- .byte 102,15,111,128,22,21,0,0 // movdqa 0x1516(%eax),%xmm0
+ .byte 102,15,111,128,30,21,0,0 // movdqa 0x151e(%eax),%xmm0
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,15,223,203 // pandn %xmm3,%xmm1
.byte 102,15,219,232 // pand %xmm0,%xmm5
@@ -70716,12 +70714,12 @@ _sk_exclusion_sse2_8bit:
.byte 102,15,113,209,8 // psrlw $0x8,%xmm1
.byte 102,15,113,212,8 // psrlw $0x8,%xmm4
.byte 102,15,103,225 // packuswb %xmm1,%xmm4
- .byte 232,0,0,0,0 // call c353 <_sk_exclusion_sse2_8bit+0xb2>
+ .byte 232,0,0,0,0 // call c34b <_sk_exclusion_sse2_8bit+0xb2>
.byte 88 // pop %eax
.byte 102,15,113,208,8 // psrlw $0x8,%xmm0
.byte 102,15,113,213,8 // psrlw $0x8,%xmm5
.byte 102,15,103,232 // packuswb %xmm0,%xmm5
- .byte 102,15,111,128,13,20,0,0 // movdqa 0x140d(%eax),%xmm0
+ .byte 102,15,111,128,21,20,0,0 // movdqa 0x1415(%eax),%xmm0
.byte 102,15,111,242 // movdqa %xmm2,%xmm6
.byte 102,15,252,254 // paddb %xmm6,%xmm7
.byte 102,15,248,253 // psubb %xmm5,%xmm7
@@ -70850,10 +70848,10 @@ _sk_difference_sse2_8bit:
.byte 102,15,113,208,8 // psrlw $0x8,%xmm0
.byte 102,15,103,194 // packuswb %xmm2,%xmm0
.byte 102,15,218,125,152 // pminub -0x68(%ebp),%xmm7
- .byte 232,0,0,0,0 // call c56e <_sk_difference_sse2_8bit+0x1b8>
+ .byte 232,0,0,0,0 // call c566 <_sk_difference_sse2_8bit+0x1b8>
.byte 88 // pop %eax
.byte 102,15,218,198 // pminub %xmm6,%xmm0
- .byte 102,15,111,136,242,17,0,0 // movdqa 0x11f2(%eax),%xmm1
+ .byte 102,15,111,136,250,17,0,0 // movdqa 0x11fa(%eax),%xmm1
.byte 102,15,111,101,136 // movdqa -0x78(%ebp),%xmm4
.byte 102,15,111,93,232 // movdqa -0x18(%ebp),%xmm3
.byte 102,15,252,227 // paddb %xmm3,%xmm4
@@ -70975,9 +70973,9 @@ _sk_hardlight_sse2_8bit:
.byte 102,15,217,229 // psubusw %xmm5,%xmm4
.byte 102,15,117,231 // pcmpeqw %xmm7,%xmm4
.byte 102,15,127,165,72,255,255,255 // movdqa %xmm4,-0xb8(%ebp)
- .byte 232,0,0,0,0 // call c79f <_sk_hardlight_sse2_8bit+0x1ce>
+ .byte 232,0,0,0,0 // call c797 <_sk_hardlight_sse2_8bit+0x1ce>
.byte 88 // pop %eax
- .byte 102,15,111,176,161,15,0,0 // movdqa 0xfa1(%eax),%xmm6
+ .byte 102,15,111,176,169,15,0,0 // movdqa 0xfa9(%eax),%xmm6
.byte 102,15,111,157,88,255,255,255 // movdqa -0xa8(%ebp),%xmm3
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,239,206 // pxor %xmm6,%xmm1
@@ -71112,7 +71110,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,15,111,69,216 // movdqa -0x28(%ebp),%xmm0
.byte 102,15,253,133,104,255,255,255 // paddw -0x98(%ebp),%xmm0
.byte 102,15,253,117,136 // paddw -0x78(%ebp),%xmm6
- .byte 102,15,111,152,209,15,0,0 // movdqa 0xfd1(%eax),%xmm3
+ .byte 102,15,111,152,217,15,0,0 // movdqa 0xfd9(%eax),%xmm3
.byte 102,15,253,227 // paddw %xmm3,%xmm4
.byte 102,15,111,149,72,255,255,255 // movdqa -0xb8(%ebp),%xmm2
.byte 102,15,253,212 // paddw %xmm4,%xmm2
@@ -71122,7 +71120,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,15,253,200 // paddw %xmm0,%xmm1
.byte 102,15,253,243 // paddw %xmm3,%xmm6
.byte 102,15,253,245 // paddw %xmm5,%xmm6
- .byte 102,15,111,152,225,15,0,0 // movdqa 0xfe1(%eax),%xmm3
+ .byte 102,15,111,152,233,15,0,0 // movdqa 0xfe9(%eax),%xmm3
.byte 102,15,228,243 // pmulhuw %xmm3,%xmm6
.byte 102,15,228,203 // pmulhuw %xmm3,%xmm1
.byte 102,15,228,251 // pmulhuw %xmm3,%xmm7
@@ -71242,9 +71240,9 @@ _sk_overlay_sse2_8bit:
.byte 102,15,217,236 // psubusw %xmm4,%xmm5
.byte 102,15,117,238 // pcmpeqw %xmm6,%xmm5
.byte 102,15,127,173,72,255,255,255 // movdqa %xmm5,-0xb8(%ebp)
- .byte 232,0,0,0,0 // call ccc5 <_sk_overlay_sse2_8bit+0x1c5>
+ .byte 232,0,0,0,0 // call ccbd <_sk_overlay_sse2_8bit+0x1c5>
.byte 88 // pop %eax
- .byte 102,15,111,152,123,10,0,0 // movdqa 0xa7b(%eax),%xmm3
+ .byte 102,15,111,152,131,10,0,0 // movdqa 0xa83(%eax),%xmm3
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,15,239,195 // pxor %xmm3,%xmm0
.byte 102,15,111,181,120,255,255,255 // movdqa -0x88(%ebp),%xmm6
@@ -71377,7 +71375,7 @@ _sk_overlay_sse2_8bit:
.byte 102,15,253,189,120,255,255,255 // paddw -0x88(%ebp),%xmm7
.byte 102,15,253,173,104,255,255,255 // paddw -0x98(%ebp),%xmm5
.byte 102,15,253,157,216,254,255,255 // paddw -0x128(%ebp),%xmm3
- .byte 102,15,111,144,171,10,0,0 // movdqa 0xaab(%eax),%xmm2
+ .byte 102,15,111,144,179,10,0,0 // movdqa 0xab3(%eax),%xmm2
.byte 102,15,253,194 // paddw %xmm2,%xmm0
.byte 102,15,253,133,72,255,255,255 // paddw -0xb8(%ebp),%xmm0
.byte 102,15,253,250 // paddw %xmm2,%xmm7
@@ -71386,7 +71384,7 @@ _sk_overlay_sse2_8bit:
.byte 102,15,253,233 // paddw %xmm1,%xmm5
.byte 102,15,253,218 // paddw %xmm2,%xmm3
.byte 102,15,253,220 // paddw %xmm4,%xmm3
- .byte 102,15,111,144,187,10,0,0 // movdqa 0xabb(%eax),%xmm2
+ .byte 102,15,111,144,195,10,0,0 // movdqa 0xac3(%eax),%xmm2
.byte 102,15,228,218 // pmulhuw %xmm2,%xmm3
.byte 102,15,228,234 // pmulhuw %xmm2,%xmm5
.byte 102,15,228,250 // pmulhuw %xmm2,%xmm7
@@ -71415,20 +71413,20 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 0,63 // add %bh,(%edi)
+ .byte 192,63,0 // sarb $0x0,(%edi)
+ .byte 0,32 // add %ah,(%eax)
+ .byte 64 // inc %eax
.byte 0,0 // add %al,(%eax)
- .byte 0,63 // add %bh,(%edi)
+ .byte 96 // pusha
+ .byte 64 // inc %eax
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
+ .byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
+ .byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 128,63,0 // cmpb $0x0,(%edi)
- .byte 0,0 // add %al,(%eax)
- .byte 64 // inc %eax
- .byte 0,0 // add %al,(%eax)
- .byte 64 // inc %eax
- .byte 64 // inc %eax
+ .byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -71756,7 +71754,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a412e6 <_sk_overlay_sse2_8bit+0xe9a347e6>
+ .byte 233,220,63,163,233 // jmp e9a412e6 <_sk_overlay_sse2_8bit+0xe9a347ee>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,81 // mov %eax,0x513fdce9
.byte 140,242 // mov %?,%edx
@@ -72251,7 +72249,7 @@ BALIGN4
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg d7db <_sk_overlay_sse2_8bit+0xcdb>
+ .byte 127,67 // jg d7db <_sk_overlay_sse2_8bit+0xce3>
.byte 0,0 // add %al,(%eax)
.byte 0 // .byte 0x0
.byte 79 // dec %edi
diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S
index d0bad7d382..b230d46b3a 100644
--- a/src/jumper/SkJumper_generated_win.S
+++ b/src/jumper/SkJumper_generated_win.S
@@ -99,15 +99,14 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,249,110,194 ; vmovd %edx,%xmm0
DB 196,226,125,88,192 ; vpbroadcastd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,130,200,2,0 ; vbroadcastss 0x2c882(%rip),%ymm1 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
- DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
- DB 197,252,88,5,30,202,2,0 ; vaddps 0x2ca1e(%rip),%ymm0,%ymm0 # 2cb80 <_sk_overlay_sse2_8bit+0x614>
- DB 197,249,110,209 ; vmovd %ecx,%xmm2
- DB 196,226,125,88,210 ; vpbroadcastd %xmm2,%ymm2
- DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
+ DB 197,252,88,5,139,200,2,0 ; vaddps 0x2c88b(%rip),%ymm0,%ymm0 # 2c9e0 <_sk_overlay_sse2_8bit+0x488>
+ DB 197,249,110,201 ; vmovd %ecx,%xmm1
+ DB 196,226,125,88,201 ; vpbroadcastd %xmm1,%ymm1
+ DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
+ DB 196,226,125,24,21,61,209,2,0 ; vbroadcastss 0x2d13d(%rip),%ymm2 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
+ DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,94,200,2,0 ; vbroadcastss 0x2c85e(%rip),%ymm2 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,21,50,209,2,0 ; vbroadcastss 0x2d132(%rip),%ymm2 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -120,17 +119,17 @@ _sk_dither_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,121,110,194 ; vmovd %edx,%xmm8
DB 196,66,125,88,192 ; vpbroadcastd %xmm8,%ymm8
- DB 197,61,254,5,249,201,2,0 ; vpaddd 0x2c9f9(%rip),%ymm8,%ymm8 # 2cba0 <_sk_overlay_sse2_8bit+0x634>
+ DB 197,61,254,5,93,200,2,0 ; vpaddd 0x2c85d(%rip),%ymm8,%ymm8 # 2ca00 <_sk_overlay_sse2_8bit+0x4a8>
DB 197,121,110,201 ; vmovd %ecx,%xmm9
DB 196,66,125,88,201 ; vpbroadcastd %xmm9,%ymm9
DB 196,65,53,239,200 ; vpxor %ymm8,%ymm9,%ymm9
- DB 196,98,125,88,21,34,200,2,0 ; vpbroadcastd 0x2c822(%rip),%ymm10 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,98,125,88,21,246,208,2,0 ; vpbroadcastd 0x2d0f6(%rip),%ymm10 # 2d2b0 <_sk_overlay_sse2_8bit+0xd58>
DB 196,65,53,219,218 ; vpand %ymm10,%ymm9,%ymm11
DB 196,193,37,114,243,5 ; vpslld $0x5,%ymm11,%ymm11
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,193,45,114,242,4 ; vpslld $0x4,%ymm10,%ymm10
- DB 196,98,125,88,37,7,200,2,0 ; vpbroadcastd 0x2c807(%rip),%ymm12 # 2c9e4 <_sk_overlay_sse2_8bit+0x478>
- DB 196,98,125,88,45,2,200,2,0 ; vpbroadcastd 0x2c802(%rip),%ymm13 # 2c9e8 <_sk_overlay_sse2_8bit+0x47c>
+ DB 196,98,125,88,37,219,208,2,0 ; vpbroadcastd 0x2d0db(%rip),%ymm12 # 2d2b4 <_sk_overlay_sse2_8bit+0xd5c>
+ DB 196,98,125,88,45,214,208,2,0 ; vpbroadcastd 0x2d0d6(%rip),%ymm13 # 2d2b8 <_sk_overlay_sse2_8bit+0xd60>
DB 196,65,53,219,245 ; vpand %ymm13,%ymm9,%ymm14
DB 196,193,13,114,246,2 ; vpslld $0x2,%ymm14,%ymm14
DB 196,65,61,219,237 ; vpand %ymm13,%ymm8,%ymm13
@@ -145,8 +144,8 @@ _sk_dither_hsw LABEL PROC
DB 196,65,61,235,194 ; vpor %ymm10,%ymm8,%ymm8
DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,180,199,2,0 ; vbroadcastss 0x2c7b4(%rip),%ymm9 # 2c9ec <_sk_overlay_sse2_8bit+0x480>
- DB 196,98,125,24,21,175,199,2,0 ; vbroadcastss 0x2c7af(%rip),%ymm10 # 2c9f0 <_sk_overlay_sse2_8bit+0x484>
+ DB 196,98,125,24,13,136,208,2,0 ; vbroadcastss 0x2d088(%rip),%ymm9 # 2d2bc <_sk_overlay_sse2_8bit+0xd64>
+ DB 196,98,125,24,21,131,208,2,0 ; vbroadcastss 0x2d083(%rip),%ymm10 # 2d2c0 <_sk_overlay_sse2_8bit+0xd68>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 196,98,125,24,0 ; vbroadcastss (%rax),%ymm8
DB 196,65,44,89,192 ; vmulps %ymm8,%ymm10,%ymm8
@@ -176,7 +175,7 @@ _sk_uniform_color_hsw LABEL PROC
PUBLIC _sk_black_color_hsw
_sk_black_color_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,55,199,2,0 ; vbroadcastss 0x2c737(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,11,208,2,0 ; vbroadcastss 0x2d00b(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
@@ -185,7 +184,7 @@ _sk_black_color_hsw LABEL PROC
PUBLIC _sk_white_color_hsw
_sk_white_color_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,30,199,2,0 ; vbroadcastss 0x2c71e(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,242,207,2,0 ; vbroadcastss 0x2cff2(%rip),%ymm0 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
@@ -223,7 +222,7 @@ _sk_clear_hsw LABEL PROC
PUBLIC _sk_srcatop_hsw
_sk_srcatop_hsw LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,189,198,2,0 ; vbroadcastss 0x2c6bd(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,145,207,2,0 ; vbroadcastss 0x2cf91(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,226,61,184,196 ; vfmadd231ps %ymm4,%ymm8,%ymm0
DB 197,244,89,207 ; vmulps %ymm7,%ymm1,%ymm1
@@ -237,7 +236,7 @@ _sk_srcatop_hsw LABEL PROC
PUBLIC _sk_dstatop_hsw
_sk_dstatop_hsw LABEL PROC
- DB 196,98,125,24,5,140,198,2,0 ; vbroadcastss 0x2c68c(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,96,207,2,0 ; vbroadcastss 0x2cf60(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,226,101,184,196 ; vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -270,7 +269,7 @@ _sk_dstin_hsw LABEL PROC
PUBLIC _sk_srcout_hsw
_sk_srcout_hsw LABEL PROC
- DB 196,98,125,24,5,47,198,2,0 ; vbroadcastss 0x2c62f(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,3,207,2,0 ; vbroadcastss 0x2cf03(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -281,7 +280,7 @@ _sk_srcout_hsw LABEL PROC
PUBLIC _sk_dstout_hsw
_sk_dstout_hsw LABEL PROC
- DB 196,226,125,24,5,14,198,2,0 ; vbroadcastss 0x2c60e(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,226,206,2,0 ; vbroadcastss 0x2cee2(%rip),%ymm0 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -292,7 +291,7 @@ _sk_dstout_hsw LABEL PROC
PUBLIC _sk_srcover_hsw
_sk_srcover_hsw LABEL PROC
- DB 196,98,125,24,5,237,197,2,0 ; vbroadcastss 0x2c5ed(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,193,206,2,0 ; vbroadcastss 0x2cec1(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,194,85,184,200 ; vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -303,7 +302,7 @@ _sk_srcover_hsw LABEL PROC
PUBLIC _sk_dstover_hsw
_sk_dstover_hsw LABEL PROC
- DB 196,98,125,24,5,200,197,2,0 ; vbroadcastss 0x2c5c8(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,156,206,2,0 ; vbroadcastss 0x2ce9c(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
DB 196,226,61,168,205 ; vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -323,7 +322,7 @@ _sk_modulate_hsw LABEL PROC
PUBLIC _sk_multiply_hsw
_sk_multiply_hsw LABEL PROC
- DB 196,98,125,24,5,143,197,2,0 ; vbroadcastss 0x2c58f(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,99,206,2,0 ; vbroadcastss 0x2ce63(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -344,7 +343,7 @@ _sk_multiply_hsw LABEL PROC
PUBLIC _sk_plus__hsw
_sk_plus__hsw LABEL PROC
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
- DB 196,98,125,24,5,62,197,2,0 ; vbroadcastss 0x2c53e(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,18,206,2,0 ; vbroadcastss 0x2ce12(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 197,244,88,205 ; vaddps %ymm5,%ymm1,%ymm1
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
@@ -370,7 +369,7 @@ _sk_screen_hsw LABEL PROC
PUBLIC _sk_xor__hsw
_sk_xor__hsw LABEL PROC
- DB 196,98,125,24,5,233,196,2,0 ; vbroadcastss 0x2c4e9(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,189,205,2,0 ; vbroadcastss 0x2cdbd(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -402,7 +401,7 @@ _sk_darken_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,109,196,2,0 ; vbroadcastss 0x2c46d(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,65,205,2,0 ; vbroadcastss 0x2cd41(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -425,7 +424,7 @@ _sk_lighten_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,24,196,2,0 ; vbroadcastss 0x2c418(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,236,204,2,0 ; vbroadcastss 0x2ccec(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -451,7 +450,7 @@ _sk_difference_hsw LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,183,195,2,0 ; vbroadcastss 0x2c3b7(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,139,204,2,0 ; vbroadcastss 0x2cc8b(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -471,7 +470,7 @@ _sk_exclusion_hsw LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,113,195,2,0 ; vbroadcastss 0x2c371(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,69,204,2,0 ; vbroadcastss 0x2cc45(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -479,7 +478,7 @@ _sk_exclusion_hsw LABEL PROC
PUBLIC _sk_colorburn_hsw
_sk_colorburn_hsw LABEL PROC
- DB 196,98,125,24,5,91,195,2,0 ; vbroadcastss 0x2c35b(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,47,204,2,0 ; vbroadcastss 0x2cc2f(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -535,7 +534,7 @@ _sk_colorburn_hsw LABEL PROC
PUBLIC _sk_colordodge_hsw
_sk_colordodge_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,107,194,2,0 ; vbroadcastss 0x2c26b(%rip),%ymm9 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,13,63,203,2,0 ; vbroadcastss 0x2cb3f(%rip),%ymm9 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -586,7 +585,7 @@ _sk_colordodge_hsw LABEL PROC
PUBLIC _sk_hardlight_hsw
_sk_hardlight_hsw LABEL PROC
- DB 196,98,125,24,5,133,193,2,0 ; vbroadcastss 0x2c185(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,89,202,2,0 ; vbroadcastss 0x2ca59(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -635,7 +634,7 @@ _sk_hardlight_hsw LABEL PROC
PUBLIC _sk_overlay_hsw
_sk_overlay_hsw LABEL PROC
- DB 196,98,125,24,5,185,192,2,0 ; vbroadcastss 0x2c0b9(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,141,201,2,0 ; vbroadcastss 0x2c98d(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -695,10 +694,10 @@ _sk_softlight_hsw LABEL PROC
DB 196,65,20,88,197 ; vaddps %ymm13,%ymm13,%ymm8
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,66,61,168,192 ; vfmadd213ps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,29,208,191,2,0 ; vbroadcastss 0x2bfd0(%rip),%ymm11 # 2c9f4 <_sk_overlay_sse2_8bit+0x488>
+ DB 196,98,125,24,29,164,200,2,0 ; vbroadcastss 0x2c8a4(%rip),%ymm11 # 2d2c4 <_sk_overlay_sse2_8bit+0xd6c>
DB 196,65,20,88,227 ; vaddps %ymm11,%ymm13,%ymm12
DB 196,65,28,89,192 ; vmulps %ymm8,%ymm12,%ymm8
- DB 196,98,125,24,37,193,191,2,0 ; vbroadcastss 0x2bfc1(%rip),%ymm12 # 2c9f8 <_sk_overlay_sse2_8bit+0x48c>
+ DB 196,98,125,24,37,149,200,2,0 ; vbroadcastss 0x2c895(%rip),%ymm12 # 2d2c8 <_sk_overlay_sse2_8bit+0xd70>
DB 196,66,21,184,196 ; vfmadd231ps %ymm12,%ymm13,%ymm8
DB 196,65,124,82,245 ; vrsqrtps %ymm13,%ymm14
DB 196,65,124,83,246 ; vrcpps %ymm14,%ymm14
@@ -708,7 +707,7 @@ _sk_softlight_hsw LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,112,191,2,0 ; vbroadcastss 0x2bf70(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,68,200,2,0 ; vbroadcastss 0x2c844(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,65,60,92,237 ; vsubps %ymm13,%ymm8,%ymm13
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,98,125,168,235 ; vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -821,11 +820,11 @@ _sk_hue_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,131,189,2,0 ; vbroadcastss 0x2bd83(%rip),%ymm14 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
- DB 196,98,125,24,61,126,189,2,0 ; vbroadcastss 0x2bd7e(%rip),%ymm15 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,53,87,198,2,0 ; vbroadcastss 0x2c657(%rip),%ymm14 # 2d2cc <_sk_overlay_sse2_8bit+0xd74>
+ DB 196,98,125,24,61,82,198,2,0 ; vbroadcastss 0x2c652(%rip),%ymm15 # 2d2d0 <_sk_overlay_sse2_8bit+0xd78>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,111,189,2,0 ; vbroadcastss 0x2bd6f(%rip),%ymm0 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,226,125,24,5,67,198,2,0 ; vbroadcastss 0x2c643(%rip),%ymm0 # 2d2d4 <_sk_overlay_sse2_8bit+0xd7c>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -880,7 +879,7 @@ _sk_hue_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,48,188,2,0 ; vbroadcastss 0x2bc30(%rip),%ymm1 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,13,4,197,2,0 ; vbroadcastss 0x2c504(%rip),%ymm1 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -934,11 +933,11 @@ _sk_saturation_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,93,187,2,0 ; vbroadcastss 0x2bb5d(%rip),%ymm14 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
- DB 196,98,125,24,61,88,187,2,0 ; vbroadcastss 0x2bb58(%rip),%ymm15 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,53,49,196,2,0 ; vbroadcastss 0x2c431(%rip),%ymm14 # 2d2cc <_sk_overlay_sse2_8bit+0xd74>
+ DB 196,98,125,24,61,44,196,2,0 ; vbroadcastss 0x2c42c(%rip),%ymm15 # 2d2d0 <_sk_overlay_sse2_8bit+0xd78>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,73,187,2,0 ; vbroadcastss 0x2bb49(%rip),%ymm0 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,226,125,24,5,29,196,2,0 ; vbroadcastss 0x2c41d(%rip),%ymm0 # 2d2d4 <_sk_overlay_sse2_8bit+0xd7c>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -993,7 +992,7 @@ _sk_saturation_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,10,186,2,0 ; vbroadcastss 0x2ba0a(%rip),%ymm1 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,13,222,194,2,0 ; vbroadcastss 0x2c2de(%rip),%ymm1 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -1021,11 +1020,11 @@ _sk_color_hsw LABEL PROC
DB 197,108,89,199 ; vmulps %ymm7,%ymm2,%ymm8
DB 197,116,89,215 ; vmulps %ymm7,%ymm1,%ymm10
DB 197,52,89,223 ; vmulps %ymm7,%ymm9,%ymm11
- DB 196,98,125,24,45,185,185,2,0 ; vbroadcastss 0x2b9b9(%rip),%ymm13 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
- DB 196,98,125,24,53,180,185,2,0 ; vbroadcastss 0x2b9b4(%rip),%ymm14 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,45,141,194,2,0 ; vbroadcastss 0x2c28d(%rip),%ymm13 # 2d2cc <_sk_overlay_sse2_8bit+0xd74>
+ DB 196,98,125,24,53,136,194,2,0 ; vbroadcastss 0x2c288(%rip),%ymm14 # 2d2d0 <_sk_overlay_sse2_8bit+0xd78>
DB 196,65,84,89,230 ; vmulps %ymm14,%ymm5,%ymm12
DB 196,66,93,184,229 ; vfmadd231ps %ymm13,%ymm4,%ymm12
- DB 196,98,125,24,61,165,185,2,0 ; vbroadcastss 0x2b9a5(%rip),%ymm15 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,98,125,24,61,121,194,2,0 ; vbroadcastss 0x2c279(%rip),%ymm15 # 2d2d4 <_sk_overlay_sse2_8bit+0xd7c>
DB 196,66,77,184,231 ; vfmadd231ps %ymm15,%ymm6,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1081,7 +1080,7 @@ _sk_color_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,91,184,2,0 ; vbroadcastss 0x2b85b(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,47,193,2,0 ; vbroadcastss 0x2c12f(%rip),%ymm0 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1109,11 +1108,11 @@ _sk_luminosity_hsw LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,213 ; vmulps %ymm5,%ymm3,%ymm10
DB 197,100,89,222 ; vmulps %ymm6,%ymm3,%ymm11
- DB 196,98,125,24,45,10,184,2,0 ; vbroadcastss 0x2b80a(%rip),%ymm13 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
- DB 196,98,125,24,53,5,184,2,0 ; vbroadcastss 0x2b805(%rip),%ymm14 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,45,222,192,2,0 ; vbroadcastss 0x2c0de(%rip),%ymm13 # 2d2cc <_sk_overlay_sse2_8bit+0xd74>
+ DB 196,98,125,24,53,217,192,2,0 ; vbroadcastss 0x2c0d9(%rip),%ymm14 # 2d2d0 <_sk_overlay_sse2_8bit+0xd78>
DB 196,65,116,89,230 ; vmulps %ymm14,%ymm1,%ymm12
DB 196,66,109,184,229 ; vfmadd231ps %ymm13,%ymm2,%ymm12
- DB 196,98,125,24,61,246,183,2,0 ; vbroadcastss 0x2b7f6(%rip),%ymm15 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,98,125,24,61,202,192,2,0 ; vbroadcastss 0x2c0ca(%rip),%ymm15 # 2d2d4 <_sk_overlay_sse2_8bit+0xd7c>
DB 196,66,53,184,231 ; vfmadd231ps %ymm15,%ymm9,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1169,7 +1168,7 @@ _sk_luminosity_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,172,182,2,0 ; vbroadcastss 0x2b6ac(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,128,191,2,0 ; vbroadcastss 0x2bf80(%rip),%ymm0 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1197,19 +1196,19 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,179,0,0,0 ; jne 1448 <_sk_srcover_rgba_8888_hsw+0xd3>
+ DB 15,133,179,0,0,0 ; jne 1444 <_sk_srcover_rgba_8888_hsw+0xd3>
DB 196,129,126,111,60,152 ; vmovdqu (%r8,%r11,4),%ymm7
- DB 197,197,219,37,29,184,2,0 ; vpand 0x2b81d(%rip),%ymm7,%ymm4 # 2cbc0 <_sk_overlay_sse2_8bit+0x654>
+ DB 197,197,219,37,129,182,2,0 ; vpand 0x2b681(%rip),%ymm7,%ymm4 # 2ca20 <_sk_overlay_sse2_8bit+0x4c8>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,69,0,45,48,184,2,0 ; vpshufb 0x2b830(%rip),%ymm7,%ymm5 # 2cbe0 <_sk_overlay_sse2_8bit+0x674>
+ DB 196,226,69,0,45,148,182,2,0 ; vpshufb 0x2b694(%rip),%ymm7,%ymm5 # 2ca40 <_sk_overlay_sse2_8bit+0x4e8>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,69,0,53,67,184,2,0 ; vpshufb 0x2b843(%rip),%ymm7,%ymm6 # 2cc00 <_sk_overlay_sse2_8bit+0x694>
+ DB 196,226,69,0,53,167,182,2,0 ; vpshufb 0x2b6a7(%rip),%ymm7,%ymm6 # 2ca60 <_sk_overlay_sse2_8bit+0x508>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,9,182,2,0 ; vbroadcastss 0x2b609(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,221,190,2,0 ; vbroadcastss 0x2bedd(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,40,182,2,0 ; vbroadcastss 0x2b628(%rip),%ymm9 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,13,252,190,2,0 ; vbroadcastss 0x2befc(%rip),%ymm9 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -1229,7 +1228,7 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 196,65,53,235,202 ; vpor %ymm10,%ymm9,%ymm9
DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,65 ; jne 147f <_sk_srcover_rgba_8888_hsw+0x10a>
+ DB 117,65 ; jne 147b <_sk_srcover_rgba_8888_hsw+0x10a>
DB 196,1,126,127,4,152 ; vmovdqu %ymm8,(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -1238,33 +1237,33 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,59,255,255,255 ; ja 139b <_sk_srcover_rgba_8888_hsw+0x26>
+ DB 15,135,59,255,255,255 ; ja 1397 <_sk_srcover_rgba_8888_hsw+0x26>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,253,0,0,0 ; lea 0xfd(%rip),%r10 # 1568 <_sk_srcover_rgba_8888_hsw+0x1f3>
+ DB 76,141,21,253,0,0,0 ; lea 0xfd(%rip),%r10 # 1564 <_sk_srcover_rgba_8888_hsw+0x1f3>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,60,152 ; vmovd (%r8,%r11,4),%xmm7
- DB 233,28,255,255,255 ; jmpq 139b <_sk_srcover_rgba_8888_hsw+0x26>
+ DB 233,28,255,255,255 ; jmpq 1397 <_sk_srcover_rgba_8888_hsw+0x26>
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,181 ; ja 1444 <_sk_srcover_rgba_8888_hsw+0xcf>
+ DB 119,181 ; ja 1440 <_sk_srcover_rgba_8888_hsw+0xcf>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 76,141,13,234,0,0,0 ; lea 0xea(%rip),%r9 # 1584 <_sk_srcover_rgba_8888_hsw+0x20f>
+ DB 76,141,13,234,0,0,0 ; lea 0xea(%rip),%r9 # 1580 <_sk_srcover_rgba_8888_hsw+0x20f>
DB 73,99,4,129 ; movslq (%r9,%rax,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
DB 196,1,121,126,4,152 ; vmovd %xmm8,(%r8,%r11,4)
- DB 235,153 ; jmp 1444 <_sk_srcover_rgba_8888_hsw+0xcf>
+ DB 235,153 ; jmp 1440 <_sk_srcover_rgba_8888_hsw+0xcf>
DB 196,129,121,110,100,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
DB 196,227,85,2,252,4 ; vpblendd $0x4,%ymm4,%ymm5,%ymm7
DB 196,129,122,126,36,152 ; vmovq (%r8,%r11,4),%xmm4
DB 196,227,69,2,252,3 ; vpblendd $0x3,%ymm4,%ymm7,%ymm7
- DB 233,201,254,255,255 ; jmpq 139b <_sk_srcover_rgba_8888_hsw+0x26>
+ DB 233,201,254,255,255 ; jmpq 1397 <_sk_srcover_rgba_8888_hsw+0x26>
DB 196,129,121,110,100,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -1277,10 +1276,10 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 196,227,69,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm7,%ymm7
DB 196,129,122,111,36,152 ; vmovdqu (%r8,%r11,4),%xmm4
DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- DB 233,122,254,255,255 ; jmpq 139b <_sk_srcover_rgba_8888_hsw+0x26>
+ DB 233,122,254,255,255 ; jmpq 1397 <_sk_srcover_rgba_8888_hsw+0x26>
DB 196,3,121,22,68,152,8,2 ; vpextrd $0x2,%xmm8,0x8(%r8,%r11,4)
DB 196,1,121,214,4,152 ; vmovq %xmm8,(%r8,%r11,4)
- DB 233,16,255,255,255 ; jmpq 1444 <_sk_srcover_rgba_8888_hsw+0xcf>
+ DB 233,16,255,255,255 ; jmpq 1440 <_sk_srcover_rgba_8888_hsw+0xcf>
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,3,121,22,76,152,24,2 ; vpextrd $0x2,%xmm9,0x18(%r8,%r11,4)
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
@@ -1288,7 +1287,7 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,1,121,126,76,152,16 ; vmovd %xmm9,0x10(%r8,%r11,4)
DB 196,1,122,127,4,152 ; vmovdqu %xmm8,(%r8,%r11,4)
- DB 233,220,254,255,255 ; jmpq 1444 <_sk_srcover_rgba_8888_hsw+0xcf>
+ DB 233,220,254,255,255 ; jmpq 1440 <_sk_srcover_rgba_8888_hsw+0xcf>
DB 12,255 ; or $0xff,%al
DB 255 ; (bad)
DB 255,89,255 ; lcall *-0x1(%rcx)
@@ -1331,7 +1330,7 @@ _sk_clamp_0_hsw LABEL PROC
PUBLIC _sk_clamp_1_hsw
_sk_clamp_1_hsw LABEL PROC
- DB 196,98,125,24,5,22,180,2,0 ; vbroadcastss 0x2b416(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,234,188,2,0 ; vbroadcastss 0x2bcea(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -1341,7 +1340,7 @@ _sk_clamp_1_hsw LABEL PROC
PUBLIC _sk_clamp_a_hsw
_sk_clamp_a_hsw LABEL PROC
- DB 196,98,125,24,5,245,179,2,0 ; vbroadcastss 0x2b3f5(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,201,188,2,0 ; vbroadcastss 0x2bcc9(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -1351,7 +1350,7 @@ _sk_clamp_a_hsw LABEL PROC
PUBLIC _sk_clamp_a_dst_hsw
_sk_clamp_a_dst_hsw LABEL PROC
- DB 196,98,125,24,5,215,179,2,0 ; vbroadcastss 0x2b3d7(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,171,188,2,0 ; vbroadcastss 0x2bcab(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7
DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4
DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5
@@ -1378,7 +1377,7 @@ _sk_swap_rb_hsw LABEL PROC
PUBLIC _sk_invert_hsw
_sk_invert_hsw LABEL PROC
- DB 196,98,125,24,5,146,179,2,0 ; vbroadcastss 0x2b392(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,102,188,2,0 ; vbroadcastss 0x2bc66(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0
DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
@@ -1424,7 +1423,7 @@ PUBLIC _sk_unpremul_hsw
_sk_unpremul_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,34,179,2,0 ; vbroadcastss 0x2b322(%rip),%ymm10 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,21,246,187,2,0 ; vbroadcastss 0x2bbf6(%rip),%ymm10 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -1435,16 +1434,16 @@ _sk_unpremul_hsw LABEL PROC
PUBLIC _sk_from_srgb_hsw
_sk_from_srgb_hsw LABEL PROC
- DB 196,98,125,24,5,47,179,2,0 ; vbroadcastss 0x2b32f(%rip),%ymm8 # 2ca0c <_sk_overlay_sse2_8bit+0x4a0>
+ DB 196,98,125,24,5,3,188,2,0 ; vbroadcastss 0x2bc03(%rip),%ymm8 # 2d2dc <_sk_overlay_sse2_8bit+0xd84>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,33,179,2,0 ; vbroadcastss 0x2b321(%rip),%ymm11 # 2ca10 <_sk_overlay_sse2_8bit+0x4a4>
- DB 196,98,125,24,37,4,179,2,0 ; vbroadcastss 0x2b304(%rip),%ymm12 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,29,245,187,2,0 ; vbroadcastss 0x2bbf5(%rip),%ymm11 # 2d2e0 <_sk_overlay_sse2_8bit+0xd88>
+ DB 196,98,125,24,37,216,187,2,0 ; vbroadcastss 0x2bbd8(%rip),%ymm12 # 2d2cc <_sk_overlay_sse2_8bit+0xd74>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,125,168,235 ; vfmadd213ps %ymm11,%ymm0,%ymm13
- DB 196,98,125,24,53,9,179,2,0 ; vbroadcastss 0x2b309(%rip),%ymm14 # 2ca14 <_sk_overlay_sse2_8bit+0x4a8>
+ DB 196,98,125,24,53,221,187,2,0 ; vbroadcastss 0x2bbdd(%rip),%ymm14 # 2d2e4 <_sk_overlay_sse2_8bit+0xd8c>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,255,178,2,0 ; vbroadcastss 0x2b2ff(%rip),%ymm10 # 2ca18 <_sk_overlay_sse2_8bit+0x4ac>
+ DB 196,98,125,24,21,211,187,2,0 ; vbroadcastss 0x2bbd3(%rip),%ymm10 # 2d2e8 <_sk_overlay_sse2_8bit+0xd90>
DB 196,193,124,194,194,1 ; vcmpltps %ymm10,%ymm0,%ymm0
DB 196,195,21,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm13,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -1465,16 +1464,16 @@ _sk_from_srgb_hsw LABEL PROC
PUBLIC _sk_from_srgb_dst_hsw
_sk_from_srgb_dst_hsw LABEL PROC
- DB 196,98,125,24,5,151,178,2,0 ; vbroadcastss 0x2b297(%rip),%ymm8 # 2ca0c <_sk_overlay_sse2_8bit+0x4a0>
+ DB 196,98,125,24,5,107,187,2,0 ; vbroadcastss 0x2bb6b(%rip),%ymm8 # 2d2dc <_sk_overlay_sse2_8bit+0xd84>
DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9
DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10
- DB 196,98,125,24,29,137,178,2,0 ; vbroadcastss 0x2b289(%rip),%ymm11 # 2ca10 <_sk_overlay_sse2_8bit+0x4a4>
- DB 196,98,125,24,37,108,178,2,0 ; vbroadcastss 0x2b26c(%rip),%ymm12 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,29,93,187,2,0 ; vbroadcastss 0x2bb5d(%rip),%ymm11 # 2d2e0 <_sk_overlay_sse2_8bit+0xd88>
+ DB 196,98,125,24,37,64,187,2,0 ; vbroadcastss 0x2bb40(%rip),%ymm12 # 2d2cc <_sk_overlay_sse2_8bit+0xd74>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,93,168,235 ; vfmadd213ps %ymm11,%ymm4,%ymm13
- DB 196,98,125,24,53,113,178,2,0 ; vbroadcastss 0x2b271(%rip),%ymm14 # 2ca14 <_sk_overlay_sse2_8bit+0x4a8>
+ DB 196,98,125,24,53,69,187,2,0 ; vbroadcastss 0x2bb45(%rip),%ymm14 # 2d2e4 <_sk_overlay_sse2_8bit+0xd8c>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,103,178,2,0 ; vbroadcastss 0x2b267(%rip),%ymm10 # 2ca18 <_sk_overlay_sse2_8bit+0x4ac>
+ DB 196,98,125,24,21,59,187,2,0 ; vbroadcastss 0x2bb3b(%rip),%ymm10 # 2d2e8 <_sk_overlay_sse2_8bit+0xd90>
DB 196,193,92,194,226,1 ; vcmpltps %ymm10,%ymm4,%ymm4
DB 196,195,21,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm13,%ymm4
DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9
@@ -1496,19 +1495,19 @@ _sk_from_srgb_dst_hsw LABEL PROC
PUBLIC _sk_to_srgb_hsw
_sk_to_srgb_hsw LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,11,178,2,0 ; vbroadcastss 0x2b20b(%rip),%ymm8 # 2ca1c <_sk_overlay_sse2_8bit+0x4b0>
+ DB 196,98,125,24,5,223,186,2,0 ; vbroadcastss 0x2badf(%rip),%ymm8 # 2d2ec <_sk_overlay_sse2_8bit+0xd94>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,1,178,2,0 ; vbroadcastss 0x2b201(%rip),%ymm11 # 2ca20 <_sk_overlay_sse2_8bit+0x4b4>
- DB 196,98,125,24,37,252,177,2,0 ; vbroadcastss 0x2b1fc(%rip),%ymm12 # 2ca24 <_sk_overlay_sse2_8bit+0x4b8>
+ DB 196,98,125,24,29,213,186,2,0 ; vbroadcastss 0x2bad5(%rip),%ymm11 # 2d2f0 <_sk_overlay_sse2_8bit+0xd98>
+ DB 196,98,125,24,37,208,186,2,0 ; vbroadcastss 0x2bad0(%rip),%ymm12 # 2d2f4 <_sk_overlay_sse2_8bit+0xd9c>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,53,168,235 ; vfmadd213ps %ymm11,%ymm9,%ymm13
- DB 196,98,125,24,53,237,177,2,0 ; vbroadcastss 0x2b1ed(%rip),%ymm14 # 2ca28 <_sk_overlay_sse2_8bit+0x4bc>
+ DB 196,98,125,24,53,193,186,2,0 ; vbroadcastss 0x2bac1(%rip),%ymm14 # 2d2f8 <_sk_overlay_sse2_8bit+0xda0>
DB 196,66,53,168,238 ; vfmadd213ps %ymm14,%ymm9,%ymm13
- DB 196,98,125,24,61,227,177,2,0 ; vbroadcastss 0x2b1e3(%rip),%ymm15 # 2ca2c <_sk_overlay_sse2_8bit+0x4c0>
+ DB 196,98,125,24,61,183,186,2,0 ; vbroadcastss 0x2bab7(%rip),%ymm15 # 2d2fc <_sk_overlay_sse2_8bit+0xda4>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,20,89,201 ; vmulps %ymm9,%ymm13,%ymm9
- DB 196,98,125,24,45,207,177,2,0 ; vbroadcastss 0x2b1cf(%rip),%ymm13 # 2ca30 <_sk_overlay_sse2_8bit+0x4c4>
+ DB 196,98,125,24,45,163,186,2,0 ; vbroadcastss 0x2baa3(%rip),%ymm13 # 2d300 <_sk_overlay_sse2_8bit+0xda8>
DB 196,193,124,194,197,1 ; vcmpltps %ymm13,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -1540,26 +1539,26 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,116,93,202 ; vminps %ymm2,%ymm1,%ymm9
DB 196,65,124,93,201 ; vminps %ymm9,%ymm0,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,234,176,2,0 ; vbroadcastss 0x2b0ea(%rip),%ymm11 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,29,190,185,2,0 ; vbroadcastss 0x2b9be(%rip),%ymm11 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 197,116,194,234,1 ; vcmpltps %ymm2,%ymm1,%ymm13
- DB 196,98,125,24,53,43,177,2,0 ; vbroadcastss 0x2b12b(%rip),%ymm14 # 2ca34 <_sk_overlay_sse2_8bit+0x4c8>
+ DB 196,98,125,24,53,255,185,2,0 ; vbroadcastss 0x2b9ff(%rip),%ymm14 # 2d304 <_sk_overlay_sse2_8bit+0xdac>
DB 196,65,4,87,255 ; vxorps %ymm15,%ymm15,%ymm15
DB 196,67,5,74,238,208 ; vblendvps %ymm13,%ymm14,%ymm15,%ymm13
DB 196,66,37,168,229 ; vfmadd213ps %ymm13,%ymm11,%ymm12
DB 197,236,92,208 ; vsubps %ymm0,%ymm2,%ymm2
DB 197,124,92,233 ; vsubps %ymm1,%ymm0,%ymm13
- DB 196,98,125,24,53,18,177,2,0 ; vbroadcastss 0x2b112(%rip),%ymm14 # 2ca3c <_sk_overlay_sse2_8bit+0x4d0>
+ DB 196,98,125,24,53,230,185,2,0 ; vbroadcastss 0x2b9e6(%rip),%ymm14 # 2d30c <_sk_overlay_sse2_8bit+0xdb4>
DB 196,66,37,168,238 ; vfmadd213ps %ymm14,%ymm11,%ymm13
- DB 196,98,125,24,53,0,177,2,0 ; vbroadcastss 0x2b100(%rip),%ymm14 # 2ca38 <_sk_overlay_sse2_8bit+0x4cc>
+ DB 196,98,125,24,53,212,185,2,0 ; vbroadcastss 0x2b9d4(%rip),%ymm14 # 2d308 <_sk_overlay_sse2_8bit+0xdb0>
DB 196,194,37,168,214 ; vfmadd213ps %ymm14,%ymm11,%ymm2
DB 197,188,194,201,0 ; vcmpeqps %ymm1,%ymm8,%ymm1
DB 196,227,21,74,202,16 ; vblendvps %ymm1,%ymm2,%ymm13,%ymm1
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,195,117,74,196,0 ; vblendvps %ymm0,%ymm12,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,29,119,176,2,0 ; vbroadcastss 0x2b077(%rip),%ymm11 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,29,75,185,2,0 ; vbroadcastss 0x2b94b(%rip),%ymm11 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,193,116,89,211 ; vmulps %ymm11,%ymm1,%ymm2
DB 197,36,194,218,1 ; vcmpltps %ymm2,%ymm11,%ymm11
DB 196,65,12,92,224 ; vsubps %ymm8,%ymm14,%ymm12
@@ -1569,7 +1568,7 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,199,128 ; vblendvps %ymm8,%ymm15,%ymm0,%ymm0
DB 196,195,117,74,207,128 ; vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- DB 196,98,125,24,5,166,176,2,0 ; vbroadcastss 0x2b0a6(%rip),%ymm8 # 2ca40 <_sk_overlay_sse2_8bit+0x4d4>
+ DB 196,98,125,24,5,122,185,2,0 ; vbroadcastss 0x2b97a(%rip),%ymm8 # 2d310 <_sk_overlay_sse2_8bit+0xdb8>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -1584,30 +1583,30 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 197,252,40,224 ; vmovaps %ymm0,%ymm4
- DB 196,98,125,24,5,253,175,2,0 ; vbroadcastss 0x2affd(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,209,184,2,0 ; vbroadcastss 0x2b8d1(%rip),%ymm8 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,84,89,210 ; vmulps %ymm2,%ymm5,%ymm10
DB 196,65,84,92,218 ; vsubps %ymm10,%ymm5,%ymm11
DB 196,67,45,74,203,144 ; vblendvps %ymm9,%ymm11,%ymm10,%ymm9
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
- DB 196,98,125,24,13,60,176,2,0 ; vbroadcastss 0x2b03c(%rip),%ymm9 # 2ca38 <_sk_overlay_sse2_8bit+0x4cc>
+ DB 196,98,125,24,13,16,185,2,0 ; vbroadcastss 0x2b910(%rip),%ymm9 # 2d308 <_sk_overlay_sse2_8bit+0xdb0>
DB 196,66,109,170,202 ; vfmsub213ps %ymm10,%ymm2,%ymm9
- DB 196,98,125,24,29,58,176,2,0 ; vbroadcastss 0x2b03a(%rip),%ymm11 # 2ca44 <_sk_overlay_sse2_8bit+0x4d8>
+ DB 196,98,125,24,29,14,185,2,0 ; vbroadcastss 0x2b90e(%rip),%ymm11 # 2d314 <_sk_overlay_sse2_8bit+0xdbc>
DB 196,65,92,88,219 ; vaddps %ymm11,%ymm4,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,45,12,176,2,0 ; vbroadcastss 0x2b00c(%rip),%ymm13 # 2ca34 <_sk_overlay_sse2_8bit+0x4c8>
+ DB 196,98,125,24,45,224,184,2,0 ; vbroadcastss 0x2b8e0(%rip),%ymm13 # 2d304 <_sk_overlay_sse2_8bit+0xdac>
DB 196,193,4,89,197 ; vmulps %ymm13,%ymm15,%ymm0
- DB 196,98,125,24,53,6,176,2,0 ; vbroadcastss 0x2b006(%rip),%ymm14 # 2ca3c <_sk_overlay_sse2_8bit+0x4d0>
+ DB 196,98,125,24,53,218,184,2,0 ; vbroadcastss 0x2b8da(%rip),%ymm14 # 2d30c <_sk_overlay_sse2_8bit+0xdb4>
DB 197,12,92,224 ; vsubps %ymm0,%ymm14,%ymm12
DB 196,66,37,168,225 ; vfmadd213ps %ymm9,%ymm11,%ymm12
- DB 196,226,125,24,29,0,176,2,0 ; vbroadcastss 0x2b000(%rip),%ymm3 # 2ca48 <_sk_overlay_sse2_8bit+0x4dc>
+ DB 196,226,125,24,29,212,184,2,0 ; vbroadcastss 0x2b8d4(%rip),%ymm3 # 2d318 <_sk_overlay_sse2_8bit+0xdc0>
DB 196,193,100,194,255,2 ; vcmpleps %ymm15,%ymm3,%ymm7
DB 196,195,29,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm12,%ymm7
DB 196,65,60,194,231,2 ; vcmpleps %ymm15,%ymm8,%ymm12
DB 196,227,45,74,255,192 ; vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,37,215,175,2,0 ; vbroadcastss 0x2afd7(%rip),%ymm12 # 2ca40 <_sk_overlay_sse2_8bit+0x4d4>
+ DB 196,98,125,24,37,171,184,2,0 ; vbroadcastss 0x2b8ab(%rip),%ymm12 # 2d310 <_sk_overlay_sse2_8bit+0xdb8>
DB 196,65,28,194,255,2 ; vcmpleps %ymm15,%ymm12,%ymm15
DB 196,194,37,168,193 ; vfmadd213ps %ymm9,%ymm11,%ymm0
DB 196,99,125,74,255,240 ; vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -1623,7 +1622,7 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,156,194,192,2 ; vcmpleps %ymm0,%ymm12,%ymm0
DB 196,194,37,168,249 ; vfmadd213ps %ymm9,%ymm11,%ymm7
DB 196,227,69,74,201,0 ; vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- DB 196,226,125,24,5,139,175,2,0 ; vbroadcastss 0x2af8b(%rip),%ymm0 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,226,125,24,5,95,184,2,0 ; vbroadcastss 0x2b85f(%rip),%ymm0 # 2d31c <_sk_overlay_sse2_8bit+0xdc4>
DB 197,220,88,192 ; vaddps %ymm0,%ymm4,%ymm0
DB 196,227,125,8,224,1 ; vroundps $0x1,%ymm0,%ymm4
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
@@ -1671,12 +1670,12 @@ _sk_scale_u8_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,58 ; jne 1bb6 <_sk_scale_u8_hsw+0x52>
+ DB 117,58 ; jne 1bb2 <_sk_scale_u8_hsw+0x52>
DB 196,2,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm8
- DB 197,57,219,5,198,184,2,0 ; vpand 0x2b8c6(%rip),%xmm8,%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,57,219,5,202,184,2,0 ; vpand 0x2b8ca(%rip),%xmm8,%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,179,174,2,0 ; vbroadcastss 0x2aeb3(%rip),%ymm9 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,13,135,183,2,0 ; vbroadcastss 0x2b787(%rip),%ymm9 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -1689,15 +1688,15 @@ _sk_scale_u8_hsw LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,183 ; ja 1b82 <_sk_scale_u8_hsw+0x1e>
+ DB 119,183 ; ja 1b7e <_sk_scale_u8_hsw+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,122,0,0,0 ; lea 0x7a(%rip),%r10 # 1c50 <_sk_scale_u8_hsw+0xec>
+ DB 76,141,21,122,0,0,0 ; lea 0x7a(%rip),%r10 # 1c4c <_sk_scale_u8_hsw+0xec>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 235,152 ; jmp 1b82 <_sk_scale_u8_hsw+0x1e>
+ DB 235,152 ; jmp 1b7e <_sk_scale_u8_hsw+0x1e>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -1705,7 +1704,7 @@ _sk_scale_u8_hsw LABEL PROC
DB 197,121,110,200 ; vmovd %eax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
- DB 233,111,255,255,255 ; jmpq 1b82 <_sk_scale_u8_hsw+0x1e>
+ DB 233,111,255,255,255 ; jmpq 1b7e <_sk_scale_u8_hsw+0x1e>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -1716,7 +1715,7 @@ _sk_scale_u8_hsw LABEL PROC
DB 196,1,121,110,12,24 ; vmovd (%r8,%r11,1),%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
- DB 233,51,255,255,255 ; jmpq 1b82 <_sk_scale_u8_hsw+0x1e>
+ DB 233,51,255,255,255 ; jmpq 1b7e <_sk_scale_u8_hsw+0x1e>
DB 144 ; nop
DB 143 ; (bad)
DB 255 ; (bad)
@@ -1725,7 +1724,7 @@ _sk_scale_u8_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf001c60 <_sk_overlay_sse2_8bit+0xffffffffdefd56f4>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf001c5c <_sk_overlay_sse2_8bit+0xffffffffdefd5704>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -1746,23 +1745,23 @@ _sk_scale_565_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,161,0,0,0 ; jne 1d2c <_sk_scale_565_hsw+0xc0>
+ DB 15,133,161,0,0,0 ; jne 1d28 <_sk_scale_565_hsw+0xc0>
DB 196,1,122,111,4,88 ; vmovdqu (%r8,%r11,2),%xmm8
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
- DB 196,98,125,88,13,181,173,2,0 ; vpbroadcastd 0x2adb5(%rip),%ymm9 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,98,125,88,13,137,182,2,0 ; vpbroadcastd 0x2b689(%rip),%ymm9 # 2d324 <_sk_overlay_sse2_8bit+0xdcc>
DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,166,173,2,0 ; vbroadcastss 0x2ada6(%rip),%ymm10 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,98,125,24,21,122,182,2,0 ; vbroadcastss 0x2b67a(%rip),%ymm10 # 2d328 <_sk_overlay_sse2_8bit+0xdd0>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,88,21,156,173,2,0 ; vpbroadcastd 0x2ad9c(%rip),%ymm10 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,98,125,88,21,112,182,2,0 ; vpbroadcastd 0x2b670(%rip),%ymm10 # 2d32c <_sk_overlay_sse2_8bit+0xdd4>
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,141,173,2,0 ; vbroadcastss 0x2ad8d(%rip),%ymm11 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,98,125,24,29,97,182,2,0 ; vbroadcastss 0x2b661(%rip),%ymm11 # 2d330 <_sk_overlay_sse2_8bit+0xdd8>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,88,29,131,173,2,0 ; vpbroadcastd 0x2ad83(%rip),%ymm11 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,98,125,88,29,87,182,2,0 ; vpbroadcastd 0x2b657(%rip),%ymm11 # 2d334 <_sk_overlay_sse2_8bit+0xddc>
DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,116,173,2,0 ; vbroadcastss 0x2ad74(%rip),%ymm11 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,98,125,24,29,72,182,2,0 ; vbroadcastss 0x2b648(%rip),%ymm11 # 2d338 <_sk_overlay_sse2_8bit+0xde0>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
@@ -1781,27 +1780,27 @@ _sk_scale_565_hsw LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,76,255,255,255 ; ja 1c91 <_sk_scale_565_hsw+0x25>
+ DB 15,135,76,255,255,255 ; ja 1c8d <_sk_scale_565_hsw+0x25>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,100,0,0,0 ; lea 0x64(%rip),%r10 # 1db4 <_sk_scale_565_hsw+0x148>
+ DB 76,141,21,100,0,0,0 ; lea 0x64(%rip),%r10 # 1db0 <_sk_scale_565_hsw+0x148>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 233,42,255,255,255 ; jmpq 1c91 <_sk_scale_565_hsw+0x25>
+ DB 233,42,255,255,255 ; jmpq 1c8d <_sk_scale_565_hsw+0x25>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,1,57,196,68,88,4,2 ; vpinsrw $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,121,110,12,88 ; vmovd (%r8,%r11,2),%xmm9
DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
- DB 233,12,255,255,255 ; jmpq 1c91 <_sk_scale_565_hsw+0x25>
+ DB 233,12,255,255,255 ; jmpq 1c8d <_sk_scale_565_hsw+0x25>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,1,57,196,68,88,12,6 ; vpinsrw $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,57,196,68,88,10,5 ; vpinsrw $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,57,196,68,88,8,4 ; vpinsrw $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,122,126,12,88 ; vmovq (%r8,%r11,2),%xmm9
DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
- DB 233,222,254,255,255 ; jmpq 1c91 <_sk_scale_565_hsw+0x25>
+ DB 233,222,254,255,255 ; jmpq 1c8d <_sk_scale_565_hsw+0x25>
DB 144 ; nop
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -1847,12 +1846,12 @@ _sk_lerp_u8_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,78 ; jne 1e65 <_sk_lerp_u8_hsw+0x66>
+ DB 117,78 ; jne 1e61 <_sk_lerp_u8_hsw+0x66>
DB 196,2,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm8
- DB 197,57,219,5,43,182,2,0 ; vpand 0x2b62b(%rip),%xmm8,%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,57,219,5,47,182,2,0 ; vpand 0x2b62f(%rip),%xmm8,%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,24,172,2,0 ; vbroadcastss 0x2ac18(%rip),%ymm9 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,13,236,180,2,0 ; vbroadcastss 0x2b4ec(%rip),%ymm9 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -1869,15 +1868,15 @@ _sk_lerp_u8_hsw LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,163 ; ja 1e1d <_sk_lerp_u8_hsw+0x1e>
+ DB 119,163 ; ja 1e19 <_sk_lerp_u8_hsw+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,123,0,0,0 ; lea 0x7b(%rip),%r10 # 1f00 <_sk_lerp_u8_hsw+0x101>
+ DB 76,141,21,123,0,0,0 ; lea 0x7b(%rip),%r10 # 1efc <_sk_lerp_u8_hsw+0x101>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 235,132 ; jmp 1e1d <_sk_lerp_u8_hsw+0x1e>
+ DB 235,132 ; jmp 1e19 <_sk_lerp_u8_hsw+0x1e>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -1885,7 +1884,7 @@ _sk_lerp_u8_hsw LABEL PROC
DB 197,121,110,200 ; vmovd %eax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
- DB 233,91,255,255,255 ; jmpq 1e1d <_sk_lerp_u8_hsw+0x1e>
+ DB 233,91,255,255,255 ; jmpq 1e19 <_sk_lerp_u8_hsw+0x1e>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -1896,7 +1895,7 @@ _sk_lerp_u8_hsw LABEL PROC
DB 196,1,121,110,12,24 ; vmovd (%r8,%r11,1),%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
- DB 233,31,255,255,255 ; jmpq 1e1d <_sk_lerp_u8_hsw+0x1e>
+ DB 233,31,255,255,255 ; jmpq 1e19 <_sk_lerp_u8_hsw+0x1e>
DB 102,144 ; xchg %ax,%ax
DB 142,255 ; mov %edi,%?
DB 255 ; (bad)
@@ -1904,7 +1903,7 @@ _sk_lerp_u8_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde001f10 <_sk_overlay_sse2_8bit+0xffffffffddfd59a4>
+ DB 232,255,255,255,221 ; callq ffffffffde001f0c <_sk_overlay_sse2_8bit+0xffffffffddfd59b4>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -1925,23 +1924,23 @@ _sk_lerp_565_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,181,0,0,0 ; jne 1ff0 <_sk_lerp_565_hsw+0xd4>
+ DB 15,133,181,0,0,0 ; jne 1fec <_sk_lerp_565_hsw+0xd4>
DB 196,1,122,111,4,88 ; vmovdqu (%r8,%r11,2),%xmm8
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
- DB 196,98,125,88,13,5,171,2,0 ; vpbroadcastd 0x2ab05(%rip),%ymm9 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,98,125,88,13,217,179,2,0 ; vpbroadcastd 0x2b3d9(%rip),%ymm9 # 2d324 <_sk_overlay_sse2_8bit+0xdcc>
DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,246,170,2,0 ; vbroadcastss 0x2aaf6(%rip),%ymm10 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,98,125,24,21,202,179,2,0 ; vbroadcastss 0x2b3ca(%rip),%ymm10 # 2d328 <_sk_overlay_sse2_8bit+0xdd0>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,88,21,236,170,2,0 ; vpbroadcastd 0x2aaec(%rip),%ymm10 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,98,125,88,21,192,179,2,0 ; vpbroadcastd 0x2b3c0(%rip),%ymm10 # 2d32c <_sk_overlay_sse2_8bit+0xdd4>
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,221,170,2,0 ; vbroadcastss 0x2aadd(%rip),%ymm11 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,98,125,24,29,177,179,2,0 ; vbroadcastss 0x2b3b1(%rip),%ymm11 # 2d330 <_sk_overlay_sse2_8bit+0xdd8>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,88,29,211,170,2,0 ; vpbroadcastd 0x2aad3(%rip),%ymm11 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,98,125,88,29,167,179,2,0 ; vpbroadcastd 0x2b3a7(%rip),%ymm11 # 2d334 <_sk_overlay_sse2_8bit+0xddc>
DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,196,170,2,0 ; vbroadcastss 0x2aac4(%rip),%ymm11 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,98,125,24,29,152,179,2,0 ; vbroadcastss 0x2b398(%rip),%ymm11 # 2d338 <_sk_overlay_sse2_8bit+0xde0>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
@@ -1964,27 +1963,27 @@ _sk_lerp_565_hsw LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,56,255,255,255 ; ja 1f41 <_sk_lerp_565_hsw+0x25>
+ DB 15,135,56,255,255,255 ; ja 1f3d <_sk_lerp_565_hsw+0x25>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,100,0,0,0 ; lea 0x64(%rip),%r10 # 2078 <_sk_lerp_565_hsw+0x15c>
+ DB 76,141,21,100,0,0,0 ; lea 0x64(%rip),%r10 # 2074 <_sk_lerp_565_hsw+0x15c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 233,22,255,255,255 ; jmpq 1f41 <_sk_lerp_565_hsw+0x25>
+ DB 233,22,255,255,255 ; jmpq 1f3d <_sk_lerp_565_hsw+0x25>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,1,57,196,68,88,4,2 ; vpinsrw $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,121,110,12,88 ; vmovd (%r8,%r11,2),%xmm9
DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
- DB 233,248,254,255,255 ; jmpq 1f41 <_sk_lerp_565_hsw+0x25>
+ DB 233,248,254,255,255 ; jmpq 1f3d <_sk_lerp_565_hsw+0x25>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,1,57,196,68,88,12,6 ; vpinsrw $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,57,196,68,88,10,5 ; vpinsrw $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,57,196,68,88,8,4 ; vpinsrw $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,122,126,12,88 ; vmovq (%r8,%r11,2),%xmm9
DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
- DB 233,202,254,255,255 ; jmpq 1f41 <_sk_lerp_565_hsw+0x25>
+ DB 233,202,254,255,255 ; jmpq 1f3d <_sk_lerp_565_hsw+0x25>
DB 144 ; nop
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -2011,23 +2010,23 @@ _sk_load_tables_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,0 ; mov (%rax),%r8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,103 ; jne 2105 <_sk_load_tables_hsw+0x71>
+ DB 117,103 ; jne 2101 <_sk_load_tables_hsw+0x71>
DB 196,193,126,111,28,144 ; vmovdqu (%r8,%rdx,4),%ymm3
- DB 197,229,219,13,116,171,2,0 ; vpand 0x2ab74(%rip),%ymm3,%ymm1 # 2cc20 <_sk_overlay_sse2_8bit+0x6b4>
+ DB 197,229,219,13,216,169,2,0 ; vpand 0x2a9d8(%rip),%ymm3,%ymm1 # 2ca80 <_sk_overlay_sse2_8bit+0x528>
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 76,139,64,8 ; mov 0x8(%rax),%r8
DB 76,139,72,16 ; mov 0x10(%rax),%r9
DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
DB 196,194,109,146,4,136 ; vgatherdps %ymm2,(%r8,%ymm1,4),%ymm0
- DB 196,226,101,0,21,116,171,2,0 ; vpshufb 0x2ab74(%rip),%ymm3,%ymm2 # 2cc40 <_sk_overlay_sse2_8bit+0x6d4>
+ DB 196,226,101,0,21,216,169,2,0 ; vpshufb 0x2a9d8(%rip),%ymm3,%ymm2 # 2caa0 <_sk_overlay_sse2_8bit+0x548>
DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
DB 196,194,53,146,12,145 ; vgatherdps %ymm9,(%r9,%ymm2,4),%ymm1
DB 72,139,64,24 ; mov 0x18(%rax),%rax
- DB 196,98,101,0,13,124,171,2,0 ; vpshufb 0x2ab7c(%rip),%ymm3,%ymm9 # 2cc60 <_sk_overlay_sse2_8bit+0x6f4>
+ DB 196,98,101,0,13,224,169,2,0 ; vpshufb 0x2a9e0(%rip),%ymm3,%ymm9 # 2cac0 <_sk_overlay_sse2_8bit+0x568>
DB 196,162,61,146,20,136 ; vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,84,169,2,0 ; vbroadcastss 0x2a954(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,40,178,2,0 ; vbroadcastss 0x2b228(%rip),%ymm8 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2036,21 +2035,21 @@ _sk_load_tables_hsw LABEL PROC
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,139 ; ja 20a4 <_sk_load_tables_hsw+0x10>
+ DB 119,139 ; ja 20a0 <_sk_load_tables_hsw+0x10>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,140,0,0,0 ; lea 0x8c(%rip),%r10 # 21b0 <_sk_load_tables_hsw+0x11c>
+ DB 76,141,21,140,0,0,0 ; lea 0x8c(%rip),%r10 # 21ac <_sk_load_tables_hsw+0x11c>
DB 79,99,12,138 ; movslq (%r10,%r9,4),%r9
DB 77,1,209 ; add %r10,%r9
DB 65,255,225 ; jmpq *%r9
DB 196,193,121,110,28,144 ; vmovd (%r8,%rdx,4),%xmm3
- DB 233,107,255,255,255 ; jmpq 20a4 <_sk_load_tables_hsw+0x10>
+ DB 233,107,255,255,255 ; jmpq 20a0 <_sk_load_tables_hsw+0x10>
DB 196,193,121,110,68,144,8 ; vmovd 0x8(%r8,%rdx,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
DB 196,227,117,2,216,4 ; vpblendd $0x4,%ymm0,%ymm1,%ymm3
DB 196,193,122,126,4,144 ; vmovq (%r8,%rdx,4),%xmm0
DB 196,227,101,2,216,3 ; vpblendd $0x3,%ymm0,%ymm3,%ymm3
- DB 233,68,255,255,255 ; jmpq 20a4 <_sk_load_tables_hsw+0x10>
+ DB 233,68,255,255,255 ; jmpq 20a0 <_sk_load_tables_hsw+0x10>
DB 196,193,121,110,68,144,24 ; vmovd 0x18(%r8,%rdx,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -2063,9 +2062,9 @@ _sk_load_tables_hsw LABEL PROC
DB 196,227,101,56,216,1 ; vinserti128 $0x1,%xmm0,%ymm3,%ymm3
DB 196,193,122,111,4,144 ; vmovdqu (%r8,%rdx,4),%xmm0
DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- DB 233,245,254,255,255 ; jmpq 20a4 <_sk_load_tables_hsw+0x10>
+ DB 233,245,254,255,255 ; jmpq 20a0 <_sk_load_tables_hsw+0x10>
DB 144 ; nop
- DB 126,255 ; jle 21b1 <_sk_load_tables_hsw+0x11d>
+ DB 126,255 ; jle 21ad <_sk_load_tables_hsw+0x11d>
DB 255 ; (bad)
DB 255,159,255,255,255,137 ; lcall *-0x76000001(%rdi)
DB 255 ; (bad)
@@ -2091,7 +2090,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 76,141,12,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r9
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,201,0,0,0 ; jne 22ab <_sk_load_tables_u16_be_hsw+0xdf>
+ DB 15,133,201,0,0,0 ; jne 22a7 <_sk_load_tables_u16_be_hsw+0xdf>
DB 196,1,121,16,4,72 ; vmovupd (%r8,%r9,2),%xmm8
DB 196,129,121,16,84,72,16 ; vmovupd 0x10(%r8,%r9,2),%xmm2
DB 196,129,121,16,92,72,32 ; vmovupd 0x20(%r8,%r9,2),%xmm3
@@ -2107,7 +2106,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,108,200 ; vpunpcklqdq %xmm0,%xmm8,%xmm1
DB 197,185,109,208 ; vpunpckhqdq %xmm0,%xmm8,%xmm2
DB 197,49,108,195 ; vpunpcklqdq %xmm3,%xmm9,%xmm8
- DB 197,121,111,21,29,178,2,0 ; vmovdqa 0x2b21d(%rip),%xmm10 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,121,111,21,33,178,2,0 ; vmovdqa 0x2b221(%rip),%xmm10 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 196,193,113,219,194 ; vpand %xmm10,%xmm1,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -2129,36 +2128,36 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,235,219 ; vpor %xmm3,%xmm8,%xmm3
DB 196,226,125,51,219 ; vpmovzxwd %xmm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,202,167,2,0 ; vbroadcastss 0x2a7ca(%rip),%ymm8 # 2ca6c <_sk_overlay_sse2_8bit+0x500>
+ DB 196,98,125,24,5,158,176,2,0 ; vbroadcastss 0x2b09e(%rip),%ymm8 # 2d33c <_sk_overlay_sse2_8bit+0xde4>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 196,1,123,16,4,72 ; vmovsd (%r8,%r9,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,85 ; je 2311 <_sk_load_tables_u16_be_hsw+0x145>
+ DB 116,85 ; je 230d <_sk_load_tables_u16_be_hsw+0x145>
DB 196,1,57,22,68,72,8 ; vmovhpd 0x8(%r8,%r9,2),%xmm8,%xmm8
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,72 ; jb 2311 <_sk_load_tables_u16_be_hsw+0x145>
+ DB 114,72 ; jb 230d <_sk_load_tables_u16_be_hsw+0x145>
DB 196,129,123,16,84,72,16 ; vmovsd 0x10(%r8,%r9,2),%xmm2
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 116,72 ; je 231e <_sk_load_tables_u16_be_hsw+0x152>
+ DB 116,72 ; je 231a <_sk_load_tables_u16_be_hsw+0x152>
DB 196,129,105,22,84,72,24 ; vmovhpd 0x18(%r8,%r9,2),%xmm2,%xmm2
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,59 ; jb 231e <_sk_load_tables_u16_be_hsw+0x152>
+ DB 114,59 ; jb 231a <_sk_load_tables_u16_be_hsw+0x152>
DB 196,129,123,16,92,72,32 ; vmovsd 0x20(%r8,%r9,2),%xmm3
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 15,132,9,255,255,255 ; je 21fd <_sk_load_tables_u16_be_hsw+0x31>
+ DB 15,132,9,255,255,255 ; je 21f9 <_sk_load_tables_u16_be_hsw+0x31>
DB 196,129,97,22,92,72,40 ; vmovhpd 0x28(%r8,%r9,2),%xmm3,%xmm3
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 15,130,248,254,255,255 ; jb 21fd <_sk_load_tables_u16_be_hsw+0x31>
+ DB 15,130,248,254,255,255 ; jb 21f9 <_sk_load_tables_u16_be_hsw+0x31>
DB 196,1,122,126,76,72,48 ; vmovq 0x30(%r8,%r9,2),%xmm9
- DB 233,236,254,255,255 ; jmpq 21fd <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,236,254,255,255 ; jmpq 21f9 <_sk_load_tables_u16_be_hsw+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,223,254,255,255 ; jmpq 21fd <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,223,254,255,255 ; jmpq 21f9 <_sk_load_tables_u16_be_hsw+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,214,254,255,255 ; jmpq 21fd <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,214,254,255,255 ; jmpq 21f9 <_sk_load_tables_u16_be_hsw+0x31>
PUBLIC _sk_load_tables_rgb_u16_be_hsw
_sk_load_tables_rgb_u16_be_hsw LABEL PROC
@@ -2166,7 +2165,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 76,141,12,82 ; lea (%rdx,%rdx,2),%r9
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,193,0,0,0 ; jne 23fa <_sk_load_tables_rgb_u16_be_hsw+0xd3>
+ DB 15,133,193,0,0,0 ; jne 23f6 <_sk_load_tables_rgb_u16_be_hsw+0xd3>
DB 196,1,122,111,28,72 ; vmovdqu (%r8,%r9,2),%xmm11
DB 196,129,122,111,92,72,12 ; vmovdqu 0xc(%r8,%r9,2),%xmm3
DB 196,129,122,111,84,72,24 ; vmovdqu 0x18(%r8,%r9,2),%xmm2
@@ -2187,7 +2186,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 197,185,108,211 ; vpunpcklqdq %xmm3,%xmm8,%xmm2
DB 197,185,109,219 ; vpunpckhqdq %xmm3,%xmm8,%xmm3
DB 197,113,108,192 ; vpunpcklqdq %xmm0,%xmm1,%xmm8
- DB 197,121,111,13,172,176,2,0 ; vmovdqa 0x2b0ac(%rip),%xmm9 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,121,111,13,176,176,2,0 ; vmovdqa 0x2b0b0(%rip),%xmm9 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 196,193,105,219,193 ; vpand %xmm9,%xmm2,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 196,65,45,118,210 ; vpcmpeqd %ymm10,%ymm10,%ymm10
@@ -2204,74 +2203,74 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 196,226,125,51,218 ; vpmovzxwd %xmm2,%ymm3
DB 196,226,45,146,20,152 ; vgatherdps %ymm10,(%rax,%ymm3,4),%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,228,165,2,0 ; vbroadcastss 0x2a5e4(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,184,174,2,0 ; vbroadcastss 0x2aeb8(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,4,72 ; vmovd (%r8,%r9,2),%xmm0
DB 196,1,121,196,92,72,4,2 ; vpinsrw $0x2,0x4(%r8,%r9,2),%xmm0,%xmm11
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,32 ; jne 2433 <_sk_load_tables_rgb_u16_be_hsw+0x10c>
+ DB 117,32 ; jne 242f <_sk_load_tables_rgb_u16_be_hsw+0x10c>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
- DB 233,59,255,255,255 ; jmpq 236e <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ DB 233,59,255,255,255 ; jmpq 236a <_sk_load_tables_rgb_u16_be_hsw+0x47>
DB 196,129,121,110,68,72,6 ; vmovd 0x6(%r8,%r9,2),%xmm0
DB 196,1,121,196,68,72,10,2 ; vpinsrw $0x2,0xa(%r8,%r9,2),%xmm0,%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,49 ; jb 247e <_sk_load_tables_rgb_u16_be_hsw+0x157>
+ DB 114,49 ; jb 247a <_sk_load_tables_rgb_u16_be_hsw+0x157>
DB 196,129,121,110,68,72,12 ; vmovd 0xc(%r8,%r9,2),%xmm0
DB 196,129,121,196,92,72,16,2 ; vpinsrw $0x2,0x10(%r8,%r9,2),%xmm0,%xmm3
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 117,50 ; jne 2499 <_sk_load_tables_rgb_u16_be_hsw+0x172>
+ DB 117,50 ; jne 2495 <_sk_load_tables_rgb_u16_be_hsw+0x172>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
- DB 233,240,254,255,255 ; jmpq 236e <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ DB 233,240,254,255,255 ; jmpq 236a <_sk_load_tables_rgb_u16_be_hsw+0x47>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
- DB 233,213,254,255,255 ; jmpq 236e <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ DB 233,213,254,255,255 ; jmpq 236a <_sk_load_tables_rgb_u16_be_hsw+0x47>
DB 196,129,121,110,68,72,18 ; vmovd 0x12(%r8,%r9,2),%xmm0
DB 196,1,121,196,84,72,22,2 ; vpinsrw $0x2,0x16(%r8,%r9,2),%xmm0,%xmm10
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,40 ; jb 24db <_sk_load_tables_rgb_u16_be_hsw+0x1b4>
+ DB 114,40 ; jb 24d7 <_sk_load_tables_rgb_u16_be_hsw+0x1b4>
DB 196,129,121,110,68,72,24 ; vmovd 0x18(%r8,%r9,2),%xmm0
DB 196,129,121,196,84,72,28,2 ; vpinsrw $0x2,0x1c(%r8,%r9,2),%xmm0,%xmm2
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 117,32 ; jne 24ed <_sk_load_tables_rgb_u16_be_hsw+0x1c6>
+ DB 117,32 ; jne 24e9 <_sk_load_tables_rgb_u16_be_hsw+0x1c6>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
- DB 233,147,254,255,255 ; jmpq 236e <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ DB 233,147,254,255,255 ; jmpq 236a <_sk_load_tables_rgb_u16_be_hsw+0x47>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
- DB 233,129,254,255,255 ; jmpq 236e <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ DB 233,129,254,255,255 ; jmpq 236a <_sk_load_tables_rgb_u16_be_hsw+0x47>
DB 196,129,121,110,68,72,30 ; vmovd 0x1e(%r8,%r9,2),%xmm0
DB 196,1,121,196,100,72,34,2 ; vpinsrw $0x2,0x22(%r8,%r9,2),%xmm0,%xmm12
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 114,25 ; jb 2520 <_sk_load_tables_rgb_u16_be_hsw+0x1f9>
+ DB 114,25 ; jb 251c <_sk_load_tables_rgb_u16_be_hsw+0x1f9>
DB 196,129,121,110,68,72,36 ; vmovd 0x24(%r8,%r9,2),%xmm0
DB 196,129,121,196,68,72,40,2 ; vpinsrw $0x2,0x28(%r8,%r9,2),%xmm0,%xmm0
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
- DB 233,78,254,255,255 ; jmpq 236e <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ DB 233,78,254,255,255 ; jmpq 236a <_sk_load_tables_rgb_u16_be_hsw+0x47>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
- DB 233,69,254,255,255 ; jmpq 236e <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ DB 233,69,254,255,255 ; jmpq 236a <_sk_load_tables_rgb_u16_be_hsw+0x47>
PUBLIC _sk_byte_tables_hsw
_sk_byte_tables_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,212,164,2,0 ; vbroadcastss 0x2a4d4(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,168,173,2,0 ; vbroadcastss 0x2ada8(%rip),%ymm8 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,200 ; vmovq %xmm9,%r8
@@ -2393,7 +2392,7 @@ _sk_byte_tables_hsw LABEL PROC
DB 67,15,182,4,17 ; movzbl (%r9,%r10,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,189,162,2,0 ; vbroadcastss 0x2a2bd(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,145,171,2,0 ; vbroadcastss 0x2ab91(%rip),%ymm8 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2507,7 +2506,7 @@ _sk_byte_tables_rgb_hsw LABEL PROC
DB 67,15,182,4,17 ; movzbl (%r9,%r10,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,165,160,2,0 ; vbroadcastss 0x2a0a5(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,121,169,2,0 ; vbroadcastss 0x2a979(%rip),%ymm8 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2596,33 +2595,33 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,66,125,168,211 ; vfmadd213ps %ymm11,%ymm0,%ymm10
DB 196,226,125,24,0 ; vbroadcastss (%rax),%ymm0
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,155,159,2,0 ; vbroadcastss 0x29f9b(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
- DB 196,98,125,24,45,150,159,2,0 ; vbroadcastss 0x29f96(%rip),%ymm13 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,111,168,2,0 ; vbroadcastss 0x2a86f(%rip),%ymm12 # 2d340 <_sk_overlay_sse2_8bit+0xde8>
+ DB 196,98,125,24,45,106,168,2,0 ; vbroadcastss 0x2a86a(%rip),%ymm13 # 2d344 <_sk_overlay_sse2_8bit+0xdec>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,236,158,2,0 ; vbroadcastss 0x29eec(%rip),%ymm13 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,45,192,167,2,0 ; vbroadcastss 0x2a7c0(%rip),%ymm13 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,126,159,2,0 ; vbroadcastss 0x29f7e(%rip),%ymm13 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,45,82,168,2,0 ; vbroadcastss 0x2a852(%rip),%ymm13 # 2d348 <_sk_overlay_sse2_8bit+0xdf0>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,116,159,2,0 ; vbroadcastss 0x29f74(%rip),%ymm11 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,29,72,168,2,0 ; vbroadcastss 0x2a848(%rip),%ymm11 # 2d34c <_sk_overlay_sse2_8bit+0xdf4>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,106,159,2,0 ; vbroadcastss 0x29f6a(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,62,168,2,0 ; vbroadcastss 0x2a83e(%rip),%ymm12 # 2d350 <_sk_overlay_sse2_8bit+0xdf8>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,96,159,2,0 ; vbroadcastss 0x29f60(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,52,168,2,0 ; vbroadcastss 0x2a834(%rip),%ymm12 # 2d354 <_sk_overlay_sse2_8bit+0xdfc>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,65,159,2,0 ; vbroadcastss 0x29f41(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,21,168,2,0 ; vbroadcastss 0x2a815(%rip),%ymm11 # 2d358 <_sk_overlay_sse2_8bit+0xe00>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,55,159,2,0 ; vbroadcastss 0x29f37(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,11,168,2,0 ; vbroadcastss 0x2a80b(%rip),%ymm11 # 2d35c <_sk_overlay_sse2_8bit+0xe04>
DB 196,98,45,172,216 ; vfnmadd213ps %ymm0,%ymm10,%ymm11
- DB 196,226,125,24,5,45,159,2,0 ; vbroadcastss 0x29f2d(%rip),%ymm0 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,226,125,24,5,1,168,2,0 ; vbroadcastss 0x2a801(%rip),%ymm0 # 2d360 <_sk_overlay_sse2_8bit+0xe08>
DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,35,159,2,0 ; vbroadcastss 0x29f23(%rip),%ymm10 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,21,247,167,2,0 ; vbroadcastss 0x2a7f7(%rip),%ymm10 # 2d364 <_sk_overlay_sse2_8bit+0xe0c>
DB 197,172,94,192 ; vdivps %ymm0,%ymm10,%ymm0
DB 197,164,88,192 ; vaddps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,21,22,159,2,0 ; vbroadcastss 0x29f16(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,234,167,2,0 ; vbroadcastss 0x2a7ea(%rip),%ymm10 # 2d368 <_sk_overlay_sse2_8bit+0xe10>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2630,7 +2629,7 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,45,158,2,0 ; vbroadcastss 0x29e2d(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,1,167,2,0 ; vbroadcastss 0x2a701(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2648,33 +2647,33 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,66,117,168,211 ; vfmadd213ps %ymm11,%ymm1,%ymm10
DB 196,226,125,24,8 ; vbroadcastss (%rax),%ymm1
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,117,158,2,0 ; vbroadcastss 0x29e75(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
- DB 196,98,125,24,45,112,158,2,0 ; vbroadcastss 0x29e70(%rip),%ymm13 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,73,167,2,0 ; vbroadcastss 0x2a749(%rip),%ymm12 # 2d340 <_sk_overlay_sse2_8bit+0xde8>
+ DB 196,98,125,24,45,68,167,2,0 ; vbroadcastss 0x2a744(%rip),%ymm13 # 2d344 <_sk_overlay_sse2_8bit+0xdec>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,198,157,2,0 ; vbroadcastss 0x29dc6(%rip),%ymm13 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,45,154,166,2,0 ; vbroadcastss 0x2a69a(%rip),%ymm13 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,88,158,2,0 ; vbroadcastss 0x29e58(%rip),%ymm13 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,45,44,167,2,0 ; vbroadcastss 0x2a72c(%rip),%ymm13 # 2d348 <_sk_overlay_sse2_8bit+0xdf0>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,78,158,2,0 ; vbroadcastss 0x29e4e(%rip),%ymm11 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,29,34,167,2,0 ; vbroadcastss 0x2a722(%rip),%ymm11 # 2d34c <_sk_overlay_sse2_8bit+0xdf4>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,68,158,2,0 ; vbroadcastss 0x29e44(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,24,167,2,0 ; vbroadcastss 0x2a718(%rip),%ymm12 # 2d350 <_sk_overlay_sse2_8bit+0xdf8>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,58,158,2,0 ; vbroadcastss 0x29e3a(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,14,167,2,0 ; vbroadcastss 0x2a70e(%rip),%ymm12 # 2d354 <_sk_overlay_sse2_8bit+0xdfc>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,27,158,2,0 ; vbroadcastss 0x29e1b(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,239,166,2,0 ; vbroadcastss 0x2a6ef(%rip),%ymm11 # 2d358 <_sk_overlay_sse2_8bit+0xe00>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,17,158,2,0 ; vbroadcastss 0x29e11(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,229,166,2,0 ; vbroadcastss 0x2a6e5(%rip),%ymm11 # 2d35c <_sk_overlay_sse2_8bit+0xe04>
DB 196,98,45,172,217 ; vfnmadd213ps %ymm1,%ymm10,%ymm11
- DB 196,226,125,24,13,7,158,2,0 ; vbroadcastss 0x29e07(%rip),%ymm1 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,226,125,24,13,219,166,2,0 ; vbroadcastss 0x2a6db(%rip),%ymm1 # 2d360 <_sk_overlay_sse2_8bit+0xe08>
DB 196,193,116,92,202 ; vsubps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,253,157,2,0 ; vbroadcastss 0x29dfd(%rip),%ymm10 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,21,209,166,2,0 ; vbroadcastss 0x2a6d1(%rip),%ymm10 # 2d364 <_sk_overlay_sse2_8bit+0xe0c>
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1
- DB 196,98,125,24,21,240,157,2,0 ; vbroadcastss 0x29df0(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,196,166,2,0 ; vbroadcastss 0x2a6c4(%rip),%ymm10 # 2d368 <_sk_overlay_sse2_8bit+0xe10>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2682,7 +2681,7 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,7,157,2,0 ; vbroadcastss 0x29d07(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,219,165,2,0 ; vbroadcastss 0x2a5db(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2700,33 +2699,33 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,66,109,168,211 ; vfmadd213ps %ymm11,%ymm2,%ymm10
DB 196,226,125,24,16 ; vbroadcastss (%rax),%ymm2
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,79,157,2,0 ; vbroadcastss 0x29d4f(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
- DB 196,98,125,24,45,74,157,2,0 ; vbroadcastss 0x29d4a(%rip),%ymm13 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,35,166,2,0 ; vbroadcastss 0x2a623(%rip),%ymm12 # 2d340 <_sk_overlay_sse2_8bit+0xde8>
+ DB 196,98,125,24,45,30,166,2,0 ; vbroadcastss 0x2a61e(%rip),%ymm13 # 2d344 <_sk_overlay_sse2_8bit+0xdec>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,160,156,2,0 ; vbroadcastss 0x29ca0(%rip),%ymm13 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,45,116,165,2,0 ; vbroadcastss 0x2a574(%rip),%ymm13 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,50,157,2,0 ; vbroadcastss 0x29d32(%rip),%ymm13 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,45,6,166,2,0 ; vbroadcastss 0x2a606(%rip),%ymm13 # 2d348 <_sk_overlay_sse2_8bit+0xdf0>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,40,157,2,0 ; vbroadcastss 0x29d28(%rip),%ymm11 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,29,252,165,2,0 ; vbroadcastss 0x2a5fc(%rip),%ymm11 # 2d34c <_sk_overlay_sse2_8bit+0xdf4>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,30,157,2,0 ; vbroadcastss 0x29d1e(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,242,165,2,0 ; vbroadcastss 0x2a5f2(%rip),%ymm12 # 2d350 <_sk_overlay_sse2_8bit+0xdf8>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,20,157,2,0 ; vbroadcastss 0x29d14(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,232,165,2,0 ; vbroadcastss 0x2a5e8(%rip),%ymm12 # 2d354 <_sk_overlay_sse2_8bit+0xdfc>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,245,156,2,0 ; vbroadcastss 0x29cf5(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,201,165,2,0 ; vbroadcastss 0x2a5c9(%rip),%ymm11 # 2d358 <_sk_overlay_sse2_8bit+0xe00>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,235,156,2,0 ; vbroadcastss 0x29ceb(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,191,165,2,0 ; vbroadcastss 0x2a5bf(%rip),%ymm11 # 2d35c <_sk_overlay_sse2_8bit+0xe04>
DB 196,98,45,172,218 ; vfnmadd213ps %ymm2,%ymm10,%ymm11
- DB 196,226,125,24,21,225,156,2,0 ; vbroadcastss 0x29ce1(%rip),%ymm2 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,226,125,24,21,181,165,2,0 ; vbroadcastss 0x2a5b5(%rip),%ymm2 # 2d360 <_sk_overlay_sse2_8bit+0xe08>
DB 196,193,108,92,210 ; vsubps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,215,156,2,0 ; vbroadcastss 0x29cd7(%rip),%ymm10 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,21,171,165,2,0 ; vbroadcastss 0x2a5ab(%rip),%ymm10 # 2d364 <_sk_overlay_sse2_8bit+0xe0c>
DB 197,172,94,210 ; vdivps %ymm2,%ymm10,%ymm2
DB 197,164,88,210 ; vaddps %ymm2,%ymm11,%ymm2
- DB 196,98,125,24,21,202,156,2,0 ; vbroadcastss 0x29cca(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,158,165,2,0 ; vbroadcastss 0x2a59e(%rip),%ymm10 # 2d368 <_sk_overlay_sse2_8bit+0xe10>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2734,7 +2733,7 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,225,155,2,0 ; vbroadcastss 0x29be1(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,181,164,2,0 ; vbroadcastss 0x2a4b5(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2752,33 +2751,33 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,66,101,168,211 ; vfmadd213ps %ymm11,%ymm3,%ymm10
DB 196,226,125,24,24 ; vbroadcastss (%rax),%ymm3
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,41,156,2,0 ; vbroadcastss 0x29c29(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
- DB 196,98,125,24,45,36,156,2,0 ; vbroadcastss 0x29c24(%rip),%ymm13 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,253,164,2,0 ; vbroadcastss 0x2a4fd(%rip),%ymm12 # 2d340 <_sk_overlay_sse2_8bit+0xde8>
+ DB 196,98,125,24,45,248,164,2,0 ; vbroadcastss 0x2a4f8(%rip),%ymm13 # 2d344 <_sk_overlay_sse2_8bit+0xdec>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,122,155,2,0 ; vbroadcastss 0x29b7a(%rip),%ymm13 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,45,78,164,2,0 ; vbroadcastss 0x2a44e(%rip),%ymm13 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,12,156,2,0 ; vbroadcastss 0x29c0c(%rip),%ymm13 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,45,224,164,2,0 ; vbroadcastss 0x2a4e0(%rip),%ymm13 # 2d348 <_sk_overlay_sse2_8bit+0xdf0>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,2,156,2,0 ; vbroadcastss 0x29c02(%rip),%ymm11 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,29,214,164,2,0 ; vbroadcastss 0x2a4d6(%rip),%ymm11 # 2d34c <_sk_overlay_sse2_8bit+0xdf4>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,248,155,2,0 ; vbroadcastss 0x29bf8(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,204,164,2,0 ; vbroadcastss 0x2a4cc(%rip),%ymm12 # 2d350 <_sk_overlay_sse2_8bit+0xdf8>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,238,155,2,0 ; vbroadcastss 0x29bee(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,194,164,2,0 ; vbroadcastss 0x2a4c2(%rip),%ymm12 # 2d354 <_sk_overlay_sse2_8bit+0xdfc>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,207,155,2,0 ; vbroadcastss 0x29bcf(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,163,164,2,0 ; vbroadcastss 0x2a4a3(%rip),%ymm11 # 2d358 <_sk_overlay_sse2_8bit+0xe00>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,197,155,2,0 ; vbroadcastss 0x29bc5(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,153,164,2,0 ; vbroadcastss 0x2a499(%rip),%ymm11 # 2d35c <_sk_overlay_sse2_8bit+0xe04>
DB 196,98,45,172,219 ; vfnmadd213ps %ymm3,%ymm10,%ymm11
- DB 196,226,125,24,29,187,155,2,0 ; vbroadcastss 0x29bbb(%rip),%ymm3 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,226,125,24,29,143,164,2,0 ; vbroadcastss 0x2a48f(%rip),%ymm3 # 2d360 <_sk_overlay_sse2_8bit+0xe08>
DB 196,193,100,92,218 ; vsubps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,177,155,2,0 ; vbroadcastss 0x29bb1(%rip),%ymm10 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,21,133,164,2,0 ; vbroadcastss 0x2a485(%rip),%ymm10 # 2d364 <_sk_overlay_sse2_8bit+0xe0c>
DB 197,172,94,219 ; vdivps %ymm3,%ymm10,%ymm3
DB 197,164,88,219 ; vaddps %ymm3,%ymm11,%ymm3
- DB 196,98,125,24,21,164,155,2,0 ; vbroadcastss 0x29ba4(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,120,164,2,0 ; vbroadcastss 0x2a478(%rip),%ymm10 # 2d368 <_sk_overlay_sse2_8bit+0xe10>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2786,7 +2785,7 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,187,154,2,0 ; vbroadcastss 0x29abb(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,143,163,2,0 ; vbroadcastss 0x2a38f(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2803,35 +2802,35 @@ _sk_gamma_hsw LABEL PROC
DB 197,252,40,241 ; vmovaps %ymm1,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,124,91,208 ; vcvtdq2ps %ymm0,%ymm10
- DB 196,98,125,24,29,8,155,2,0 ; vbroadcastss 0x29b08(%rip),%ymm11 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
- DB 196,226,125,24,45,3,155,2,0 ; vbroadcastss 0x29b03(%rip),%ymm5 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,29,220,163,2,0 ; vbroadcastss 0x2a3dc(%rip),%ymm11 # 2d340 <_sk_overlay_sse2_8bit+0xde8>
+ DB 196,226,125,24,45,215,163,2,0 ; vbroadcastss 0x2a3d7(%rip),%ymm5 # 2d344 <_sk_overlay_sse2_8bit+0xdec>
DB 197,124,84,205 ; vandps %ymm5,%ymm0,%ymm9
- DB 196,226,125,24,37,90,154,2,0 ; vbroadcastss 0x29a5a(%rip),%ymm4 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,226,125,24,37,46,163,2,0 ; vbroadcastss 0x2a32e(%rip),%ymm4 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 197,52,86,228 ; vorps %ymm4,%ymm9,%ymm12
- DB 196,98,125,24,45,237,154,2,0 ; vbroadcastss 0x29aed(%rip),%ymm13 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,45,193,163,2,0 ; vbroadcastss 0x2a3c1(%rip),%ymm13 # 2d348 <_sk_overlay_sse2_8bit+0xdf0>
DB 196,66,37,168,213 ; vfmadd213ps %ymm13,%ymm11,%ymm10
- DB 196,98,125,24,13,227,154,2,0 ; vbroadcastss 0x29ae3(%rip),%ymm9 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,13,183,163,2,0 ; vbroadcastss 0x2a3b7(%rip),%ymm9 # 2d34c <_sk_overlay_sse2_8bit+0xdf4>
DB 196,66,29,188,209 ; vfnmadd231ps %ymm9,%ymm12,%ymm10
DB 197,124,91,246 ; vcvtdq2ps %ymm6,%ymm14
DB 196,66,37,168,245 ; vfmadd213ps %ymm13,%ymm11,%ymm14
DB 197,124,91,255 ; vcvtdq2ps %ymm7,%ymm15
DB 196,66,37,168,253 ; vfmadd213ps %ymm13,%ymm11,%ymm15
- DB 196,98,125,24,29,199,154,2,0 ; vbroadcastss 0x29ac7(%rip),%ymm11 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,29,155,163,2,0 ; vbroadcastss 0x2a39b(%rip),%ymm11 # 2d350 <_sk_overlay_sse2_8bit+0xdf8>
DB 196,65,28,88,227 ; vaddps %ymm11,%ymm12,%ymm12
- DB 196,98,125,24,45,189,154,2,0 ; vbroadcastss 0x29abd(%rip),%ymm13 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,45,145,163,2,0 ; vbroadcastss 0x2a391(%rip),%ymm13 # 2d354 <_sk_overlay_sse2_8bit+0xdfc>
DB 196,65,20,94,228 ; vdivps %ymm12,%ymm13,%ymm12
DB 196,65,44,92,212 ; vsubps %ymm12,%ymm10,%ymm10
DB 196,98,125,24,32 ; vbroadcastss (%rax),%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
DB 196,67,125,8,194,1 ; vroundps $0x1,%ymm10,%ymm8
DB 196,65,44,92,192 ; vsubps %ymm8,%ymm10,%ymm8
- DB 196,226,125,24,21,153,154,2,0 ; vbroadcastss 0x29a99(%rip),%ymm2 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,226,125,24,21,109,163,2,0 ; vbroadcastss 0x2a36d(%rip),%ymm2 # 2d358 <_sk_overlay_sse2_8bit+0xe00>
DB 197,44,88,210 ; vaddps %ymm2,%ymm10,%ymm10
- DB 196,226,125,24,29,144,154,2,0 ; vbroadcastss 0x29a90(%rip),%ymm3 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
+ DB 196,226,125,24,29,100,163,2,0 ; vbroadcastss 0x2a364(%rip),%ymm3 # 2d35c <_sk_overlay_sse2_8bit+0xe04>
DB 196,98,61,188,211 ; vfnmadd231ps %ymm3,%ymm8,%ymm10
- DB 196,226,125,24,13,134,154,2,0 ; vbroadcastss 0x29a86(%rip),%ymm1 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,226,125,24,13,90,163,2,0 ; vbroadcastss 0x2a35a(%rip),%ymm1 # 2d360 <_sk_overlay_sse2_8bit+0xe08>
DB 196,65,116,92,192 ; vsubps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,5,124,154,2,0 ; vbroadcastss 0x29a7c(%rip),%ymm0 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,226,125,24,5,80,163,2,0 ; vbroadcastss 0x2a350(%rip),%ymm0 # 2d364 <_sk_overlay_sse2_8bit+0xe0c>
DB 196,65,124,94,192 ; vdivps %ymm8,%ymm0,%ymm8
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 197,204,84,245 ; vandps %ymm5,%ymm6,%ymm6
@@ -2862,7 +2861,7 @@ _sk_gamma_hsw LABEL PROC
DB 197,244,92,205 ; vsubps %ymm5,%ymm1,%ymm1
DB 197,252,94,193 ; vdivps %ymm1,%ymm0,%ymm0
DB 197,236,88,192 ; vaddps %ymm0,%ymm2,%ymm0
- DB 196,226,125,24,13,237,153,2,0 ; vbroadcastss 0x299ed(%rip),%ymm1 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,226,125,24,13,193,162,2,0 ; vbroadcastss 0x2a2c1(%rip),%ymm1 # 2d368 <_sk_overlay_sse2_8bit+0xe10>
DB 197,188,89,209 ; vmulps %ymm1,%ymm8,%ymm2
DB 197,204,89,217 ; vmulps %ymm1,%ymm6,%ymm3
DB 197,252,89,225 ; vmulps %ymm1,%ymm0,%ymm4
@@ -2880,26 +2879,26 @@ _sk_gamma_hsw LABEL PROC
PUBLIC _sk_lab_to_xyz_hsw
_sk_lab_to_xyz_hsw LABEL PROC
- DB 196,98,125,24,5,165,153,2,0 ; vbroadcastss 0x299a5(%rip),%ymm8 # 2ca9c <_sk_overlay_sse2_8bit+0x530>
- DB 196,98,125,24,13,8,153,2,0 ; vbroadcastss 0x29908(%rip),%ymm9 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
- DB 196,98,125,24,21,151,153,2,0 ; vbroadcastss 0x29997(%rip),%ymm10 # 2caa0 <_sk_overlay_sse2_8bit+0x534>
+ DB 196,98,125,24,5,121,162,2,0 ; vbroadcastss 0x2a279(%rip),%ymm8 # 2d36c <_sk_overlay_sse2_8bit+0xe14>
+ DB 196,98,125,24,13,220,161,2,0 ; vbroadcastss 0x2a1dc(%rip),%ymm9 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
+ DB 196,98,125,24,21,107,162,2,0 ; vbroadcastss 0x2a26b(%rip),%ymm10 # 2d370 <_sk_overlay_sse2_8bit+0xe18>
DB 196,194,53,168,202 ; vfmadd213ps %ymm10,%ymm9,%ymm1
DB 196,194,53,168,210 ; vfmadd213ps %ymm10,%ymm9,%ymm2
- DB 196,98,125,24,13,136,153,2,0 ; vbroadcastss 0x29988(%rip),%ymm9 # 2caa4 <_sk_overlay_sse2_8bit+0x538>
+ DB 196,98,125,24,13,92,162,2,0 ; vbroadcastss 0x2a25c(%rip),%ymm9 # 2d374 <_sk_overlay_sse2_8bit+0xe1c>
DB 196,66,125,184,200 ; vfmadd231ps %ymm8,%ymm0,%ymm9
- DB 196,226,125,24,5,126,153,2,0 ; vbroadcastss 0x2997e(%rip),%ymm0 # 2caa8 <_sk_overlay_sse2_8bit+0x53c>
+ DB 196,226,125,24,5,82,162,2,0 ; vbroadcastss 0x2a252(%rip),%ymm0 # 2d378 <_sk_overlay_sse2_8bit+0xe20>
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
- DB 196,98,125,24,5,117,153,2,0 ; vbroadcastss 0x29975(%rip),%ymm8 # 2caac <_sk_overlay_sse2_8bit+0x540>
+ DB 196,98,125,24,5,73,162,2,0 ; vbroadcastss 0x2a249(%rip),%ymm8 # 2d37c <_sk_overlay_sse2_8bit+0xe24>
DB 196,98,117,168,192 ; vfmadd213ps %ymm0,%ymm1,%ymm8
- DB 196,98,125,24,13,107,153,2,0 ; vbroadcastss 0x2996b(%rip),%ymm9 # 2cab0 <_sk_overlay_sse2_8bit+0x544>
+ DB 196,98,125,24,13,63,162,2,0 ; vbroadcastss 0x2a23f(%rip),%ymm9 # 2d380 <_sk_overlay_sse2_8bit+0xe28>
DB 196,98,109,172,200 ; vfnmadd213ps %ymm0,%ymm2,%ymm9
DB 196,193,60,89,200 ; vmulps %ymm8,%ymm8,%ymm1
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
- DB 196,226,125,24,21,88,153,2,0 ; vbroadcastss 0x29958(%rip),%ymm2 # 2cab4 <_sk_overlay_sse2_8bit+0x548>
+ DB 196,226,125,24,21,44,162,2,0 ; vbroadcastss 0x2a22c(%rip),%ymm2 # 2d384 <_sk_overlay_sse2_8bit+0xe2c>
DB 197,108,194,209,1 ; vcmpltps %ymm1,%ymm2,%ymm10
- DB 196,98,125,24,29,78,153,2,0 ; vbroadcastss 0x2994e(%rip),%ymm11 # 2cab8 <_sk_overlay_sse2_8bit+0x54c>
+ DB 196,98,125,24,29,34,162,2,0 ; vbroadcastss 0x2a222(%rip),%ymm11 # 2d388 <_sk_overlay_sse2_8bit+0xe30>
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,37,68,153,2,0 ; vbroadcastss 0x29944(%rip),%ymm12 # 2cabc <_sk_overlay_sse2_8bit+0x550>
+ DB 196,98,125,24,37,24,162,2,0 ; vbroadcastss 0x2a218(%rip),%ymm12 # 2d38c <_sk_overlay_sse2_8bit+0xe34>
DB 196,65,60,89,196 ; vmulps %ymm12,%ymm8,%ymm8
DB 196,99,61,74,193,160 ; vblendvps %ymm10,%ymm1,%ymm8,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -2914,9 +2913,9 @@ _sk_lab_to_xyz_hsw LABEL PROC
DB 196,65,52,88,203 ; vaddps %ymm11,%ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
DB 196,227,53,74,208,32 ; vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- DB 196,226,125,24,5,249,152,2,0 ; vbroadcastss 0x298f9(%rip),%ymm0 # 2cac0 <_sk_overlay_sse2_8bit+0x554>
+ DB 196,226,125,24,5,205,161,2,0 ; vbroadcastss 0x2a1cd(%rip),%ymm0 # 2d390 <_sk_overlay_sse2_8bit+0xe38>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,240,152,2,0 ; vbroadcastss 0x298f0(%rip),%ymm8 # 2cac4 <_sk_overlay_sse2_8bit+0x558>
+ DB 196,98,125,24,5,196,161,2,0 ; vbroadcastss 0x2a1c4(%rip),%ymm8 # 2d394 <_sk_overlay_sse2_8bit+0xe3c>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2930,12 +2929,12 @@ _sk_load_a8_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,52 ; jne 3229 <_sk_load_a8_hsw+0x4c>
+ DB 117,52 ; jne 3225 <_sk_load_a8_hsw+0x4c>
DB 196,130,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm0
- DB 197,249,219,5,77,162,2,0 ; vpand 0x2a24d(%rip),%xmm0,%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,249,219,5,81,162,2,0 ; vpand 0x2a251(%rip),%xmm0,%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,59,152,2,0 ; vbroadcastss 0x2983b(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,15,161,2,0 ; vbroadcastss 0x2a10f(%rip),%ymm1 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -2947,15 +2946,15 @@ _sk_load_a8_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,190 ; ja 31fb <_sk_load_a8_hsw+0x1e>
+ DB 119,190 ; ja 31f7 <_sk_load_a8_hsw+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,120,0,0,0 ; lea 0x78(%rip),%r10 # 32c0 <_sk_load_a8_hsw+0xe3>
+ DB 76,141,21,120,0,0,0 ; lea 0x78(%rip),%r10 # 32bc <_sk_load_a8_hsw+0xe3>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,159 ; jmp 31fb <_sk_load_a8_hsw+0x1e>
+ DB 235,159 ; jmp 31f7 <_sk_load_a8_hsw+0x1e>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -2963,7 +2962,7 @@ _sk_load_a8_hsw LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,119,255,255,255 ; jmpq 31fb <_sk_load_a8_hsw+0x1e>
+ DB 233,119,255,255,255 ; jmpq 31f7 <_sk_load_a8_hsw+0x1e>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -2974,7 +2973,7 @@ _sk_load_a8_hsw LABEL PROC
DB 196,129,121,110,12,24 ; vmovd (%r8,%r11,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,60,255,255,255 ; jmpq 31fb <_sk_load_a8_hsw+0x1e>
+ DB 233,60,255,255,255 ; jmpq 31f7 <_sk_load_a8_hsw+0x1e>
DB 144 ; nop
DB 145 ; xchg %eax,%ecx
DB 255 ; (bad)
@@ -2983,7 +2982,7 @@ _sk_load_a8_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf0032d0 <_sk_overlay_sse2_8bit+0xffffffffdefd6d64>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf0032cc <_sk_overlay_sse2_8bit+0xffffffffdefd6d74>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -3003,12 +3002,12 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,52 ; jne 3328 <_sk_load_a8_dst_hsw+0x4c>
+ DB 117,52 ; jne 3324 <_sk_load_a8_dst_hsw+0x4c>
DB 196,130,121,48,36,24 ; vpmovzxbw (%r8,%r11,1),%xmm4
- DB 197,217,219,37,78,161,2,0 ; vpand 0x2a14e(%rip),%xmm4,%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,217,219,37,82,161,2,0 ; vpand 0x2a152(%rip),%xmm4,%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,60,151,2,0 ; vbroadcastss 0x2973c(%rip),%ymm5 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,45,16,160,2,0 ; vbroadcastss 0x2a010(%rip),%ymm5 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
@@ -3020,15 +3019,15 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,190 ; ja 32fa <_sk_load_a8_dst_hsw+0x1e>
+ DB 119,190 ; ja 32f6 <_sk_load_a8_dst_hsw+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,121,0,0,0 ; lea 0x79(%rip),%r10 # 33c0 <_sk_load_a8_dst_hsw+0xe4>
+ DB 76,141,21,121,0,0,0 ; lea 0x79(%rip),%r10 # 33bc <_sk_load_a8_dst_hsw+0xe4>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,159 ; jmp 32fa <_sk_load_a8_dst_hsw+0x1e>
+ DB 235,159 ; jmp 32f6 <_sk_load_a8_dst_hsw+0x1e>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -3036,7 +3035,7 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,119,255,255,255 ; jmpq 32fa <_sk_load_a8_dst_hsw+0x1e>
+ DB 233,119,255,255,255 ; jmpq 32f6 <_sk_load_a8_dst_hsw+0x1e>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -3047,7 +3046,7 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 196,129,121,110,44,24 ; vmovd (%r8,%r11,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,60,255,255,255 ; jmpq 32fa <_sk_load_a8_dst_hsw+0x1e>
+ DB 233,60,255,255,255 ; jmpq 32f6 <_sk_load_a8_dst_hsw+0x1e>
DB 102,144 ; xchg %ax,%ax
DB 144 ; nop
DB 255 ; (bad)
@@ -3056,7 +3055,7 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde0033d0 <_sk_overlay_sse2_8bit+0xffffffffddfd6e64>
+ DB 232,255,255,255,221 ; callq ffffffffde0033cc <_sk_overlay_sse2_8bit+0xffffffffddfd6e74>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -3109,7 +3108,7 @@ _sk_gather_a8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,183,149,2,0 ; vbroadcastss 0x295b7(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,139,158,2,0 ; vbroadcastss 0x29e8b(%rip),%ymm1 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -3129,14 +3128,14 @@ _sk_store_a8_hsw LABEL PROC
DB 77,15,175,193 ; imul %r9,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,56,149,2,0 ; vbroadcastss 0x29538(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,12,158,2,0 ; vbroadcastss 0x29e0c(%rip),%ymm8 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 34f9 <_sk_store_a8_hsw+0x45>
+ DB 117,10 ; jne 34f5 <_sk_store_a8_hsw+0x45>
DB 196,1,123,17,4,24 ; vmovsd %xmm8,(%r8,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3144,25 +3143,25 @@ _sk_store_a8_hsw LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 34f5 <_sk_store_a8_hsw+0x41>
+ DB 119,236 ; ja 34f1 <_sk_store_a8_hsw+0x41>
DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,87,0,0,0 ; lea 0x57(%rip),%r10 # 3570 <_sk_store_a8_hsw+0xbc>
+ DB 76,141,21,87,0,0,0 ; lea 0x57(%rip),%r10 # 356c <_sk_store_a8_hsw+0xbc>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,3,121,20,4,24,0 ; vpextrb $0x0,%xmm8,(%r8,%r11,1)
- DB 235,202 ; jmp 34f5 <_sk_store_a8_hsw+0x41>
+ DB 235,202 ; jmp 34f1 <_sk_store_a8_hsw+0x41>
DB 196,3,121,20,68,24,2,4 ; vpextrb $0x4,%xmm8,0x2(%r8,%r11,1)
- DB 196,98,57,0,5,36,159,2,0 ; vpshufb 0x29f24(%rip),%xmm8,%xmm8 # 2d460 <_sk_overlay_sse2_8bit+0xef4>
+ DB 196,98,57,0,5,40,159,2,0 ; vpshufb 0x29f28(%rip),%xmm8,%xmm8 # 2d460 <_sk_overlay_sse2_8bit+0xf08>
DB 196,3,121,21,4,24,0 ; vpextrw $0x0,%xmm8,(%r8,%r11,1)
- DB 235,176 ; jmp 34f5 <_sk_store_a8_hsw+0x41>
+ DB 235,176 ; jmp 34f1 <_sk_store_a8_hsw+0x41>
DB 196,3,121,20,68,24,6,12 ; vpextrb $0xc,%xmm8,0x6(%r8,%r11,1)
DB 196,3,121,20,68,24,5,10 ; vpextrb $0xa,%xmm8,0x5(%r8,%r11,1)
DB 196,3,121,20,68,24,4,8 ; vpextrb $0x8,%xmm8,0x4(%r8,%r11,1)
- DB 196,98,57,0,5,10,159,2,0 ; vpshufb 0x29f0a(%rip),%xmm8,%xmm8 # 2d470 <_sk_overlay_sse2_8bit+0xf04>
+ DB 196,98,57,0,5,14,159,2,0 ; vpshufb 0x29f0e(%rip),%xmm8,%xmm8 # 2d470 <_sk_overlay_sse2_8bit+0xf18>
DB 196,1,121,126,4,24 ; vmovd %xmm8,(%r8,%r11,1)
- DB 235,135 ; jmp 34f5 <_sk_store_a8_hsw+0x41>
+ DB 235,135 ; jmp 34f1 <_sk_store_a8_hsw+0x41>
DB 102,144 ; xchg %ax,%ax
DB 178,255 ; mov $0xff,%dl
DB 255 ; (bad)
@@ -3193,15 +3192,15 @@ _sk_load_g8_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,57 ; jne 35dd <_sk_load_g8_hsw+0x51>
+ DB 117,57 ; jne 35d9 <_sk_load_g8_hsw+0x51>
DB 196,130,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm0
- DB 197,249,219,5,158,158,2,0 ; vpand 0x29e9e(%rip),%xmm0,%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,249,219,5,162,158,2,0 ; vpand 0x29ea2(%rip),%xmm0,%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,140,148,2,0 ; vbroadcastss 0x2948c(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,96,157,2,0 ; vbroadcastss 0x29d60(%rip),%ymm1 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,9,148,2,0 ; vbroadcastss 0x29409(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,221,156,2,0 ; vbroadcastss 0x29cdd(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -3210,15 +3209,15 @@ _sk_load_g8_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,185 ; ja 35aa <_sk_load_g8_hsw+0x1e>
+ DB 119,185 ; ja 35a6 <_sk_load_g8_hsw+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,120,0,0,0 ; lea 0x78(%rip),%r10 # 3674 <_sk_load_g8_hsw+0xe8>
+ DB 76,141,21,120,0,0,0 ; lea 0x78(%rip),%r10 # 3670 <_sk_load_g8_hsw+0xe8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,154 ; jmp 35aa <_sk_load_g8_hsw+0x1e>
+ DB 235,154 ; jmp 35a6 <_sk_load_g8_hsw+0x1e>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -3226,7 +3225,7 @@ _sk_load_g8_hsw LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,114,255,255,255 ; jmpq 35aa <_sk_load_g8_hsw+0x1e>
+ DB 233,114,255,255,255 ; jmpq 35a6 <_sk_load_g8_hsw+0x1e>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -3237,7 +3236,7 @@ _sk_load_g8_hsw LABEL PROC
DB 196,129,121,110,12,24 ; vmovd (%r8,%r11,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,55,255,255,255 ; jmpq 35aa <_sk_load_g8_hsw+0x1e>
+ DB 233,55,255,255,255 ; jmpq 35a6 <_sk_load_g8_hsw+0x1e>
DB 144 ; nop
DB 145 ; xchg %eax,%ecx
DB 255 ; (bad)
@@ -3246,7 +3245,7 @@ _sk_load_g8_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf003684 <_sk_overlay_sse2_8bit+0xffffffffdefd7118>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf003680 <_sk_overlay_sse2_8bit+0xffffffffdefd7128>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -3266,15 +3265,15 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,57 ; jne 36e1 <_sk_load_g8_dst_hsw+0x51>
+ DB 117,57 ; jne 36dd <_sk_load_g8_dst_hsw+0x51>
DB 196,130,121,48,36,24 ; vpmovzxbw (%r8,%r11,1),%xmm4
- DB 197,217,219,37,154,157,2,0 ; vpand 0x29d9a(%rip),%xmm4,%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,217,219,37,158,157,2,0 ; vpand 0x29d9e(%rip),%xmm4,%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,136,147,2,0 ; vbroadcastss 0x29388(%rip),%ymm5 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,45,92,156,2,0 ; vbroadcastss 0x29c5c(%rip),%ymm5 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,5,147,2,0 ; vbroadcastss 0x29305(%rip),%ymm7 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,61,217,155,2,0 ; vbroadcastss 0x29bd9(%rip),%ymm7 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,40,236 ; vmovaps %ymm4,%ymm5
DB 197,252,40,244 ; vmovaps %ymm4,%ymm6
DB 255,224 ; jmpq *%rax
@@ -3283,15 +3282,15 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,185 ; ja 36ae <_sk_load_g8_dst_hsw+0x1e>
+ DB 119,185 ; ja 36aa <_sk_load_g8_dst_hsw+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,120,0,0,0 ; lea 0x78(%rip),%r10 # 3778 <_sk_load_g8_dst_hsw+0xe8>
+ DB 76,141,21,120,0,0,0 ; lea 0x78(%rip),%r10 # 3774 <_sk_load_g8_dst_hsw+0xe8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,154 ; jmp 36ae <_sk_load_g8_dst_hsw+0x1e>
+ DB 235,154 ; jmp 36aa <_sk_load_g8_dst_hsw+0x1e>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -3299,7 +3298,7 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,114,255,255,255 ; jmpq 36ae <_sk_load_g8_dst_hsw+0x1e>
+ DB 233,114,255,255,255 ; jmpq 36aa <_sk_load_g8_dst_hsw+0x1e>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -3310,7 +3309,7 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 196,129,121,110,44,24 ; vmovd (%r8,%r11,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,55,255,255,255 ; jmpq 36ae <_sk_load_g8_dst_hsw+0x1e>
+ DB 233,55,255,255,255 ; jmpq 36aa <_sk_load_g8_dst_hsw+0x1e>
DB 144 ; nop
DB 145 ; xchg %eax,%ecx
DB 255 ; (bad)
@@ -3319,7 +3318,7 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf003788 <_sk_overlay_sse2_8bit+0xffffffffdefd721c>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf003784 <_sk_overlay_sse2_8bit+0xffffffffdefd722c>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -3372,10 +3371,10 @@ _sk_gather_g8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,255,145,2,0 ; vbroadcastss 0x291ff(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,211,154,2,0 ; vbroadcastss 0x29ad3(%rip),%ymm1 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,124,145,2,0 ; vbroadcastss 0x2917c(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,80,154,2,0 ; vbroadcastss 0x29a50(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -3394,53 +3393,53 @@ _sk_load_565_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,114 ; jne 38fe <_sk_load_565_hsw+0x8d>
+ DB 117,114 ; jne 38fa <_sk_load_565_hsw+0x8d>
DB 196,129,122,111,4,88 ; vmovdqu (%r8,%r11,2),%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,180,145,2,0 ; vpbroadcastd 0x291b4(%rip),%ymm0 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,226,125,88,5,136,154,2,0 ; vpbroadcastd 0x29a88(%rip),%ymm0 # 2d324 <_sk_overlay_sse2_8bit+0xdcc>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,167,145,2,0 ; vbroadcastss 0x291a7(%rip),%ymm1 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,226,125,24,13,123,154,2,0 ; vbroadcastss 0x29a7b(%rip),%ymm1 # 2d328 <_sk_overlay_sse2_8bit+0xdd0>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,158,145,2,0 ; vpbroadcastd 0x2919e(%rip),%ymm1 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,226,125,88,13,114,154,2,0 ; vpbroadcastd 0x29a72(%rip),%ymm1 # 2d32c <_sk_overlay_sse2_8bit+0xdd4>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,145,145,2,0 ; vbroadcastss 0x29191(%rip),%ymm3 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,226,125,24,29,101,154,2,0 ; vbroadcastss 0x29a65(%rip),%ymm3 # 2d330 <_sk_overlay_sse2_8bit+0xdd8>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,136,145,2,0 ; vpbroadcastd 0x29188(%rip),%ymm3 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,226,125,88,29,92,154,2,0 ; vpbroadcastd 0x29a5c(%rip),%ymm3 # 2d334 <_sk_overlay_sse2_8bit+0xddc>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,123,145,2,0 ; vbroadcastss 0x2917b(%rip),%ymm3 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,226,125,24,29,79,154,2,0 ; vbroadcastss 0x29a4f(%rip),%ymm3 # 2d338 <_sk_overlay_sse2_8bit+0xde0>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,224,144,2,0 ; vbroadcastss 0x290e0(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,180,153,2,0 ; vbroadcastss 0x299b4(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,128 ; ja 3892 <_sk_load_565_hsw+0x21>
+ DB 119,128 ; ja 388e <_sk_load_565_hsw+0x21>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,99,0,0,0 ; lea 0x63(%rip),%r10 # 3980 <_sk_load_565_hsw+0x10f>
+ DB 76,141,21,99,0,0,0 ; lea 0x63(%rip),%r10 # 397c <_sk_load_565_hsw+0x10f>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,94,255,255,255 ; jmpq 3892 <_sk_load_565_hsw+0x21>
+ DB 233,94,255,255,255 ; jmpq 388e <_sk_load_565_hsw+0x21>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,129,121,196,68,88,4,2 ; vpinsrw $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,121,110,12,88 ; vmovd (%r8,%r11,2),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,65,255,255,255 ; jmpq 3892 <_sk_load_565_hsw+0x21>
+ DB 233,65,255,255,255 ; jmpq 388e <_sk_load_565_hsw+0x21>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,129,121,196,68,88,12,6 ; vpinsrw $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,121,196,68,88,10,5 ; vpinsrw $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,121,196,68,88,8,4 ; vpinsrw $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,122,126,12,88 ; vmovq (%r8,%r11,2),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,20,255,255,255 ; jmpq 3892 <_sk_load_565_hsw+0x21>
+ DB 233,20,255,255,255 ; jmpq 388e <_sk_load_565_hsw+0x21>
DB 102,144 ; xchg %ax,%ax
DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3471,53 +3470,53 @@ _sk_load_565_dst_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,114 ; jne 3a29 <_sk_load_565_dst_hsw+0x8d>
+ DB 117,114 ; jne 3a25 <_sk_load_565_dst_hsw+0x8d>
DB 196,129,122,111,36,88 ; vmovdqu (%r8,%r11,2),%xmm4
DB 196,226,125,51,244 ; vpmovzxwd %xmm4,%ymm6
- DB 196,226,125,88,37,137,144,2,0 ; vpbroadcastd 0x29089(%rip),%ymm4 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,226,125,88,37,93,153,2,0 ; vpbroadcastd 0x2995d(%rip),%ymm4 # 2d324 <_sk_overlay_sse2_8bit+0xdcc>
DB 197,205,219,228 ; vpand %ymm4,%ymm6,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,124,144,2,0 ; vbroadcastss 0x2907c(%rip),%ymm5 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,226,125,24,45,80,153,2,0 ; vbroadcastss 0x29950(%rip),%ymm5 # 2d328 <_sk_overlay_sse2_8bit+0xdd0>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,88,45,115,144,2,0 ; vpbroadcastd 0x29073(%rip),%ymm5 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,226,125,88,45,71,153,2,0 ; vpbroadcastd 0x29947(%rip),%ymm5 # 2d32c <_sk_overlay_sse2_8bit+0xdd4>
DB 197,205,219,237 ; vpand %ymm5,%ymm6,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,61,102,144,2,0 ; vbroadcastss 0x29066(%rip),%ymm7 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,226,125,24,61,58,153,2,0 ; vbroadcastss 0x2993a(%rip),%ymm7 # 2d330 <_sk_overlay_sse2_8bit+0xdd8>
DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5
- DB 196,226,125,88,61,93,144,2,0 ; vpbroadcastd 0x2905d(%rip),%ymm7 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,226,125,88,61,49,153,2,0 ; vpbroadcastd 0x29931(%rip),%ymm7 # 2d334 <_sk_overlay_sse2_8bit+0xddc>
DB 197,205,219,247 ; vpand %ymm7,%ymm6,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,226,125,24,61,80,144,2,0 ; vbroadcastss 0x29050(%rip),%ymm7 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,226,125,24,61,36,153,2,0 ; vbroadcastss 0x29924(%rip),%ymm7 # 2d338 <_sk_overlay_sse2_8bit+0xde0>
DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,181,143,2,0 ; vbroadcastss 0x28fb5(%rip),%ymm7 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,61,137,152,2,0 ; vbroadcastss 0x29889(%rip),%ymm7 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,128 ; ja 39bd <_sk_load_565_dst_hsw+0x21>
+ DB 119,128 ; ja 39b9 <_sk_load_565_dst_hsw+0x21>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,100,0,0,0 ; lea 0x64(%rip),%r10 # 3aac <_sk_load_565_dst_hsw+0x110>
+ DB 76,141,21,100,0,0,0 ; lea 0x64(%rip),%r10 # 3aa8 <_sk_load_565_dst_hsw+0x110>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,94,255,255,255 ; jmpq 39bd <_sk_load_565_dst_hsw+0x21>
+ DB 233,94,255,255,255 ; jmpq 39b9 <_sk_load_565_dst_hsw+0x21>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,129,89,196,100,88,4,2 ; vpinsrw $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,121,110,44,88 ; vmovd (%r8,%r11,2),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,65,255,255,255 ; jmpq 39bd <_sk_load_565_dst_hsw+0x21>
+ DB 233,65,255,255,255 ; jmpq 39b9 <_sk_load_565_dst_hsw+0x21>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,129,89,196,100,88,12,6 ; vpinsrw $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,89,196,100,88,10,5 ; vpinsrw $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,89,196,100,88,8,4 ; vpinsrw $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,122,126,44,88 ; vmovq (%r8,%r11,2),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,20,255,255,255 ; jmpq 39bd <_sk_load_565_dst_hsw+0x21>
+ DB 233,20,255,255,255 ; jmpq 39b9 <_sk_load_565_dst_hsw+0x21>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -3584,23 +3583,23 @@ _sk_gather_565_hsw LABEL PROC
DB 65,15,183,4,88 ; movzwl (%r8,%rbx,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,209,142,2,0 ; vpbroadcastd 0x28ed1(%rip),%ymm0 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,226,125,88,5,165,151,2,0 ; vpbroadcastd 0x297a5(%rip),%ymm0 # 2d324 <_sk_overlay_sse2_8bit+0xdcc>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,196,142,2,0 ; vbroadcastss 0x28ec4(%rip),%ymm1 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,226,125,24,13,152,151,2,0 ; vbroadcastss 0x29798(%rip),%ymm1 # 2d328 <_sk_overlay_sse2_8bit+0xdd0>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,187,142,2,0 ; vpbroadcastd 0x28ebb(%rip),%ymm1 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,226,125,88,13,143,151,2,0 ; vpbroadcastd 0x2978f(%rip),%ymm1 # 2d32c <_sk_overlay_sse2_8bit+0xdd4>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,174,142,2,0 ; vbroadcastss 0x28eae(%rip),%ymm3 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,226,125,24,29,130,151,2,0 ; vbroadcastss 0x29782(%rip),%ymm3 # 2d330 <_sk_overlay_sse2_8bit+0xdd8>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,165,142,2,0 ; vpbroadcastd 0x28ea5(%rip),%ymm3 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,226,125,88,29,121,151,2,0 ; vpbroadcastd 0x29779(%rip),%ymm3 # 2d334 <_sk_overlay_sse2_8bit+0xddc>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,152,142,2,0 ; vbroadcastss 0x28e98(%rip),%ymm3 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,226,125,24,29,108,151,2,0 ; vbroadcastss 0x2976c(%rip),%ymm3 # 2d338 <_sk_overlay_sse2_8bit+0xde0>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,253,141,2,0 ; vbroadcastss 0x28dfd(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,209,150,2,0 ; vbroadcastss 0x296d1(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 91 ; pop %rbx
DB 65,92 ; pop %r12
DB 65,94 ; pop %r14
@@ -3616,11 +3615,11 @@ _sk_store_565_hsw LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,193,142,2,0 ; vbroadcastss 0x28ec1(%rip),%ymm8 # 2cac8 <_sk_overlay_sse2_8bit+0x55c>
+ DB 196,98,125,24,5,149,151,2,0 ; vbroadcastss 0x29795(%rip),%ymm8 # 2d398 <_sk_overlay_sse2_8bit+0xe40>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,11 ; vpslld $0xb,%ymm9,%ymm9
- DB 196,98,125,24,21,172,142,2,0 ; vbroadcastss 0x28eac(%rip),%ymm10 # 2cacc <_sk_overlay_sse2_8bit+0x560>
+ DB 196,98,125,24,21,128,151,2,0 ; vbroadcastss 0x29780(%rip),%ymm10 # 2d39c <_sk_overlay_sse2_8bit+0xe44>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,45,114,242,5 ; vpslld $0x5,%ymm10,%ymm10
@@ -3631,7 +3630,7 @@ _sk_store_565_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 3c5e <_sk_store_565_hsw+0x76>
+ DB 117,10 ; jne 3c5a <_sk_store_565_hsw+0x76>
DB 196,1,122,127,4,88 ; vmovdqu %xmm8,(%r8,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3639,22 +3638,22 @@ _sk_store_565_hsw LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 3c5a <_sk_store_565_hsw+0x72>
+ DB 119,236 ; ja 3c56 <_sk_store_565_hsw+0x72>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,67,0,0,0 ; lea 0x43(%rip),%r10 # 3cbc <_sk_store_565_hsw+0xd4>
+ DB 76,141,21,67,0,0,0 ; lea 0x43(%rip),%r10 # 3cb8 <_sk_store_565_hsw+0xd4>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,3,121,21,4,88,0 ; vpextrw $0x0,%xmm8,(%r8,%r11,2)
- DB 235,207 ; jmp 3c5a <_sk_store_565_hsw+0x72>
+ DB 235,207 ; jmp 3c56 <_sk_store_565_hsw+0x72>
DB 196,3,121,21,68,88,4,2 ; vpextrw $0x2,%xmm8,0x4(%r8,%r11,2)
DB 196,1,121,126,4,88 ; vmovd %xmm8,(%r8,%r11,2)
- DB 235,191 ; jmp 3c5a <_sk_store_565_hsw+0x72>
+ DB 235,191 ; jmp 3c56 <_sk_store_565_hsw+0x72>
DB 196,3,121,21,68,88,12,6 ; vpextrw $0x6,%xmm8,0xc(%r8,%r11,2)
DB 196,3,121,21,68,88,10,5 ; vpextrw $0x5,%xmm8,0xa(%r8,%r11,2)
DB 196,3,121,21,68,88,8,4 ; vpextrw $0x4,%xmm8,0x8(%r8,%r11,2)
DB 196,1,121,214,4,88 ; vmovq %xmm8,(%r8,%r11,2)
- DB 235,159 ; jmp 3c5a <_sk_store_565_hsw+0x72>
+ DB 235,159 ; jmp 3c56 <_sk_store_565_hsw+0x72>
DB 144 ; nop
DB 198 ; (bad)
DB 255 ; (bad)
@@ -3690,28 +3689,28 @@ _sk_load_4444_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,138,0,0,0 ; jne 3d81 <_sk_load_4444_hsw+0xa9>
+ DB 15,133,138,0,0,0 ; jne 3d7d <_sk_load_4444_hsw+0xa9>
DB 196,129,122,111,4,88 ; vmovdqu (%r8,%r11,2),%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,197,141,2,0 ; vpbroadcastd 0x28dc5(%rip),%ymm0 # 2cad0 <_sk_overlay_sse2_8bit+0x564>
+ DB 196,226,125,88,5,153,150,2,0 ; vpbroadcastd 0x29699(%rip),%ymm0 # 2d3a0 <_sk_overlay_sse2_8bit+0xe48>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,184,141,2,0 ; vbroadcastss 0x28db8(%rip),%ymm1 # 2cad4 <_sk_overlay_sse2_8bit+0x568>
+ DB 196,226,125,24,13,140,150,2,0 ; vbroadcastss 0x2968c(%rip),%ymm1 # 2d3a4 <_sk_overlay_sse2_8bit+0xe4c>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,175,141,2,0 ; vpbroadcastd 0x28daf(%rip),%ymm1 # 2cad8 <_sk_overlay_sse2_8bit+0x56c>
+ DB 196,226,125,88,13,131,150,2,0 ; vpbroadcastd 0x29683(%rip),%ymm1 # 2d3a8 <_sk_overlay_sse2_8bit+0xe50>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,162,141,2,0 ; vbroadcastss 0x28da2(%rip),%ymm2 # 2cadc <_sk_overlay_sse2_8bit+0x570>
+ DB 196,226,125,24,21,118,150,2,0 ; vbroadcastss 0x29676(%rip),%ymm2 # 2d3ac <_sk_overlay_sse2_8bit+0xe54>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,153,141,2,0 ; vpbroadcastd 0x28d99(%rip),%ymm2 # 2cae0 <_sk_overlay_sse2_8bit+0x574>
+ DB 196,226,125,88,21,109,150,2,0 ; vpbroadcastd 0x2966d(%rip),%ymm2 # 2d3b0 <_sk_overlay_sse2_8bit+0xe58>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,140,141,2,0 ; vbroadcastss 0x28d8c(%rip),%ymm8 # 2cae4 <_sk_overlay_sse2_8bit+0x578>
+ DB 196,98,125,24,5,96,150,2,0 ; vbroadcastss 0x29660(%rip),%ymm8 # 2d3b4 <_sk_overlay_sse2_8bit+0xe5c>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,130,141,2,0 ; vpbroadcastd 0x28d82(%rip),%ymm8 # 2cae8 <_sk_overlay_sse2_8bit+0x57c>
+ DB 196,98,125,88,5,86,150,2,0 ; vpbroadcastd 0x29656(%rip),%ymm8 # 2d3b8 <_sk_overlay_sse2_8bit+0xe60>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,116,141,2,0 ; vbroadcastss 0x28d74(%rip),%ymm8 # 2caec <_sk_overlay_sse2_8bit+0x580>
+ DB 196,98,125,24,5,72,150,2,0 ; vbroadcastss 0x29648(%rip),%ymm8 # 2d3bc <_sk_overlay_sse2_8bit+0xe64>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3720,27 +3719,27 @@ _sk_load_4444_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,100,255,255,255 ; ja 3cfd <_sk_load_4444_hsw+0x25>
+ DB 15,135,100,255,255,255 ; ja 3cf9 <_sk_load_4444_hsw+0x25>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,100,0,0,0 ; lea 0x64(%rip),%r10 # 3e08 <_sk_load_4444_hsw+0x130>
+ DB 76,141,21,100,0,0,0 ; lea 0x64(%rip),%r10 # 3e04 <_sk_load_4444_hsw+0x130>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,66,255,255,255 ; jmpq 3cfd <_sk_load_4444_hsw+0x25>
+ DB 233,66,255,255,255 ; jmpq 3cf9 <_sk_load_4444_hsw+0x25>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,129,121,196,68,88,4,2 ; vpinsrw $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,121,110,12,88 ; vmovd (%r8,%r11,2),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,37,255,255,255 ; jmpq 3cfd <_sk_load_4444_hsw+0x25>
+ DB 233,37,255,255,255 ; jmpq 3cf9 <_sk_load_4444_hsw+0x25>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,129,121,196,68,88,12,6 ; vpinsrw $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,121,196,68,88,10,5 ; vpinsrw $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,121,196,68,88,8,4 ; vpinsrw $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,122,126,12,88 ; vmovq (%r8,%r11,2),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,248,254,255,255 ; jmpq 3cfd <_sk_load_4444_hsw+0x25>
+ DB 233,248,254,255,255 ; jmpq 3cf9 <_sk_load_4444_hsw+0x25>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -3774,28 +3773,28 @@ _sk_load_4444_dst_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,138,0,0,0 ; jne 3ecd <_sk_load_4444_dst_hsw+0xa9>
+ DB 15,133,138,0,0,0 ; jne 3ec9 <_sk_load_4444_dst_hsw+0xa9>
DB 196,129,122,111,36,88 ; vmovdqu (%r8,%r11,2),%xmm4
DB 196,226,125,51,252 ; vpmovzxwd %xmm4,%ymm7
- DB 196,226,125,88,37,121,140,2,0 ; vpbroadcastd 0x28c79(%rip),%ymm4 # 2cad0 <_sk_overlay_sse2_8bit+0x564>
+ DB 196,226,125,88,37,77,149,2,0 ; vpbroadcastd 0x2954d(%rip),%ymm4 # 2d3a0 <_sk_overlay_sse2_8bit+0xe48>
DB 197,197,219,228 ; vpand %ymm4,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,108,140,2,0 ; vbroadcastss 0x28c6c(%rip),%ymm5 # 2cad4 <_sk_overlay_sse2_8bit+0x568>
+ DB 196,226,125,24,45,64,149,2,0 ; vbroadcastss 0x29540(%rip),%ymm5 # 2d3a4 <_sk_overlay_sse2_8bit+0xe4c>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,88,45,99,140,2,0 ; vpbroadcastd 0x28c63(%rip),%ymm5 # 2cad8 <_sk_overlay_sse2_8bit+0x56c>
+ DB 196,226,125,88,45,55,149,2,0 ; vpbroadcastd 0x29537(%rip),%ymm5 # 2d3a8 <_sk_overlay_sse2_8bit+0xe50>
DB 197,197,219,237 ; vpand %ymm5,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,53,86,140,2,0 ; vbroadcastss 0x28c56(%rip),%ymm6 # 2cadc <_sk_overlay_sse2_8bit+0x570>
+ DB 196,226,125,24,53,42,149,2,0 ; vbroadcastss 0x2952a(%rip),%ymm6 # 2d3ac <_sk_overlay_sse2_8bit+0xe54>
DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5
- DB 196,226,125,88,53,77,140,2,0 ; vpbroadcastd 0x28c4d(%rip),%ymm6 # 2cae0 <_sk_overlay_sse2_8bit+0x574>
+ DB 196,226,125,88,53,33,149,2,0 ; vpbroadcastd 0x29521(%rip),%ymm6 # 2d3b0 <_sk_overlay_sse2_8bit+0xe58>
DB 197,197,219,246 ; vpand %ymm6,%ymm7,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,98,125,24,5,64,140,2,0 ; vbroadcastss 0x28c40(%rip),%ymm8 # 2cae4 <_sk_overlay_sse2_8bit+0x578>
+ DB 196,98,125,24,5,20,149,2,0 ; vbroadcastss 0x29514(%rip),%ymm8 # 2d3b4 <_sk_overlay_sse2_8bit+0xe5c>
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
- DB 196,98,125,88,5,54,140,2,0 ; vpbroadcastd 0x28c36(%rip),%ymm8 # 2cae8 <_sk_overlay_sse2_8bit+0x57c>
+ DB 196,98,125,88,5,10,149,2,0 ; vpbroadcastd 0x2950a(%rip),%ymm8 # 2d3b8 <_sk_overlay_sse2_8bit+0xe60>
DB 196,193,69,219,248 ; vpand %ymm8,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,40,140,2,0 ; vbroadcastss 0x28c28(%rip),%ymm8 # 2caec <_sk_overlay_sse2_8bit+0x580>
+ DB 196,98,125,24,5,252,148,2,0 ; vbroadcastss 0x294fc(%rip),%ymm8 # 2d3bc <_sk_overlay_sse2_8bit+0xe64>
DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3804,27 +3803,27 @@ _sk_load_4444_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,100,255,255,255 ; ja 3e49 <_sk_load_4444_dst_hsw+0x25>
+ DB 15,135,100,255,255,255 ; ja 3e45 <_sk_load_4444_dst_hsw+0x25>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,100,0,0,0 ; lea 0x64(%rip),%r10 # 3f54 <_sk_load_4444_dst_hsw+0x130>
+ DB 76,141,21,100,0,0,0 ; lea 0x64(%rip),%r10 # 3f50 <_sk_load_4444_dst_hsw+0x130>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,66,255,255,255 ; jmpq 3e49 <_sk_load_4444_dst_hsw+0x25>
+ DB 233,66,255,255,255 ; jmpq 3e45 <_sk_load_4444_dst_hsw+0x25>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,129,89,196,100,88,4,2 ; vpinsrw $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,121,110,44,88 ; vmovd (%r8,%r11,2),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,37,255,255,255 ; jmpq 3e49 <_sk_load_4444_dst_hsw+0x25>
+ DB 233,37,255,255,255 ; jmpq 3e45 <_sk_load_4444_dst_hsw+0x25>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,129,89,196,100,88,12,6 ; vpinsrw $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,89,196,100,88,10,5 ; vpinsrw $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,89,196,100,88,8,4 ; vpinsrw $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,122,126,44,88 ; vmovq (%r8,%r11,2),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,248,254,255,255 ; jmpq 3e49 <_sk_load_4444_dst_hsw+0x25>
+ DB 233,248,254,255,255 ; jmpq 3e45 <_sk_load_4444_dst_hsw+0x25>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -3891,25 +3890,25 @@ _sk_gather_4444_hsw LABEL PROC
DB 65,15,183,4,88 ; movzwl (%r8,%rbx,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,165,138,2,0 ; vpbroadcastd 0x28aa5(%rip),%ymm0 # 2cad0 <_sk_overlay_sse2_8bit+0x564>
+ DB 196,226,125,88,5,121,147,2,0 ; vpbroadcastd 0x29379(%rip),%ymm0 # 2d3a0 <_sk_overlay_sse2_8bit+0xe48>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,152,138,2,0 ; vbroadcastss 0x28a98(%rip),%ymm1 # 2cad4 <_sk_overlay_sse2_8bit+0x568>
+ DB 196,226,125,24,13,108,147,2,0 ; vbroadcastss 0x2936c(%rip),%ymm1 # 2d3a4 <_sk_overlay_sse2_8bit+0xe4c>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,143,138,2,0 ; vpbroadcastd 0x28a8f(%rip),%ymm1 # 2cad8 <_sk_overlay_sse2_8bit+0x56c>
+ DB 196,226,125,88,13,99,147,2,0 ; vpbroadcastd 0x29363(%rip),%ymm1 # 2d3a8 <_sk_overlay_sse2_8bit+0xe50>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,130,138,2,0 ; vbroadcastss 0x28a82(%rip),%ymm2 # 2cadc <_sk_overlay_sse2_8bit+0x570>
+ DB 196,226,125,24,21,86,147,2,0 ; vbroadcastss 0x29356(%rip),%ymm2 # 2d3ac <_sk_overlay_sse2_8bit+0xe54>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,121,138,2,0 ; vpbroadcastd 0x28a79(%rip),%ymm2 # 2cae0 <_sk_overlay_sse2_8bit+0x574>
+ DB 196,226,125,88,21,77,147,2,0 ; vpbroadcastd 0x2934d(%rip),%ymm2 # 2d3b0 <_sk_overlay_sse2_8bit+0xe58>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,108,138,2,0 ; vbroadcastss 0x28a6c(%rip),%ymm8 # 2cae4 <_sk_overlay_sse2_8bit+0x578>
+ DB 196,98,125,24,5,64,147,2,0 ; vbroadcastss 0x29340(%rip),%ymm8 # 2d3b4 <_sk_overlay_sse2_8bit+0xe5c>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,98,138,2,0 ; vpbroadcastd 0x28a62(%rip),%ymm8 # 2cae8 <_sk_overlay_sse2_8bit+0x57c>
+ DB 196,98,125,88,5,54,147,2,0 ; vpbroadcastd 0x29336(%rip),%ymm8 # 2d3b8 <_sk_overlay_sse2_8bit+0xe60>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,84,138,2,0 ; vbroadcastss 0x28a54(%rip),%ymm8 # 2caec <_sk_overlay_sse2_8bit+0x580>
+ DB 196,98,125,24,5,40,147,2,0 ; vbroadcastss 0x29328(%rip),%ymm8 # 2d3bc <_sk_overlay_sse2_8bit+0xe64>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3927,7 +3926,7 @@ _sk_store_4444_hsw LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,41,138,2,0 ; vbroadcastss 0x28a29(%rip),%ymm8 # 2caf0 <_sk_overlay_sse2_8bit+0x584>
+ DB 196,98,125,24,5,253,146,2,0 ; vbroadcastss 0x292fd(%rip),%ymm8 # 2d3c0 <_sk_overlay_sse2_8bit+0xe68>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,12 ; vpslld $0xc,%ymm9,%ymm9
@@ -3945,7 +3944,7 @@ _sk_store_4444_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 412a <_sk_store_4444_hsw+0x82>
+ DB 117,10 ; jne 4126 <_sk_store_4444_hsw+0x82>
DB 196,1,122,127,4,88 ; vmovdqu %xmm8,(%r8,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3953,22 +3952,22 @@ _sk_store_4444_hsw LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 4126 <_sk_store_4444_hsw+0x7e>
+ DB 119,236 ; ja 4122 <_sk_store_4444_hsw+0x7e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,67,0,0,0 ; lea 0x43(%rip),%r10 # 4188 <_sk_store_4444_hsw+0xe0>
+ DB 76,141,21,67,0,0,0 ; lea 0x43(%rip),%r10 # 4184 <_sk_store_4444_hsw+0xe0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,3,121,21,4,88,0 ; vpextrw $0x0,%xmm8,(%r8,%r11,2)
- DB 235,207 ; jmp 4126 <_sk_store_4444_hsw+0x7e>
+ DB 235,207 ; jmp 4122 <_sk_store_4444_hsw+0x7e>
DB 196,3,121,21,68,88,4,2 ; vpextrw $0x2,%xmm8,0x4(%r8,%r11,2)
DB 196,1,121,126,4,88 ; vmovd %xmm8,(%r8,%r11,2)
- DB 235,191 ; jmp 4126 <_sk_store_4444_hsw+0x7e>
+ DB 235,191 ; jmp 4122 <_sk_store_4444_hsw+0x7e>
DB 196,3,121,21,68,88,12,6 ; vpextrw $0x6,%xmm8,0xc(%r8,%r11,2)
DB 196,3,121,21,68,88,10,5 ; vpextrw $0x5,%xmm8,0xa(%r8,%r11,2)
DB 196,3,121,21,68,88,8,4 ; vpextrw $0x4,%xmm8,0x8(%r8,%r11,2)
DB 196,1,121,214,4,88 ; vmovq %xmm8,(%r8,%r11,2)
- DB 235,159 ; jmp 4126 <_sk_store_4444_hsw+0x7e>
+ DB 235,159 ; jmp 4122 <_sk_store_4444_hsw+0x7e>
DB 144 ; nop
DB 198 ; (bad)
DB 255 ; (bad)
@@ -4004,16 +4003,16 @@ _sk_load_8888_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,86 ; jne 4216 <_sk_load_8888_hsw+0x72>
+ DB 117,86 ; jne 4212 <_sk_load_8888_hsw+0x72>
DB 196,129,126,111,28,152 ; vmovdqu (%r8,%r11,4),%ymm3
- DB 197,229,219,5,178,138,2,0 ; vpand 0x28ab2(%rip),%ymm3,%ymm0 # 2cc80 <_sk_overlay_sse2_8bit+0x714>
+ DB 197,229,219,5,22,137,2,0 ; vpand 0x28916(%rip),%ymm3,%ymm0 # 2cae0 <_sk_overlay_sse2_8bit+0x588>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,117,136,2,0 ; vbroadcastss 0x28875(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,73,145,2,0 ; vbroadcastss 0x29149(%rip),%ymm8 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,183,138,2,0 ; vpshufb 0x28ab7(%rip),%ymm3,%ymm1 # 2cca0 <_sk_overlay_sse2_8bit+0x734>
+ DB 196,226,101,0,13,27,137,2,0 ; vpshufb 0x2891b(%rip),%ymm3,%ymm1 # 2cb00 <_sk_overlay_sse2_8bit+0x5a8>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,197,138,2,0 ; vpshufb 0x28ac5(%rip),%ymm3,%ymm2 # 2ccc0 <_sk_overlay_sse2_8bit+0x754>
+ DB 196,226,101,0,21,41,137,2,0 ; vpshufb 0x28929(%rip),%ymm3,%ymm2 # 2cb20 <_sk_overlay_sse2_8bit+0x5c8>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4026,21 +4025,21 @@ _sk_load_8888_hsw LABEL PROC
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,156 ; ja 41c6 <_sk_load_8888_hsw+0x22>
+ DB 119,156 ; ja 41c2 <_sk_load_8888_hsw+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,135,0,0,0 ; lea 0x87(%rip),%r10 # 42bc <_sk_load_8888_hsw+0x118>
+ DB 76,141,21,135,0,0,0 ; lea 0x87(%rip),%r10 # 42b8 <_sk_load_8888_hsw+0x118>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,28,152 ; vmovd (%r8,%r11,4),%xmm3
- DB 235,128 ; jmp 41c6 <_sk_load_8888_hsw+0x22>
+ DB 235,128 ; jmp 41c2 <_sk_load_8888_hsw+0x22>
DB 196,129,121,110,68,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
DB 196,227,117,2,216,4 ; vpblendd $0x4,%ymm0,%ymm1,%ymm3
DB 196,129,122,126,4,152 ; vmovq (%r8,%r11,4),%xmm0
DB 196,227,101,2,216,3 ; vpblendd $0x3,%ymm0,%ymm3,%ymm3
- DB 233,89,255,255,255 ; jmpq 41c6 <_sk_load_8888_hsw+0x22>
+ DB 233,89,255,255,255 ; jmpq 41c2 <_sk_load_8888_hsw+0x22>
DB 196,129,121,110,68,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -4053,7 +4052,7 @@ _sk_load_8888_hsw LABEL PROC
DB 196,227,101,56,216,1 ; vinserti128 $0x1,%xmm0,%ymm3,%ymm3
DB 196,129,122,111,4,152 ; vmovdqu (%r8,%r11,4),%xmm0
DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- DB 233,10,255,255,255 ; jmpq 41c6 <_sk_load_8888_hsw+0x22>
+ DB 233,10,255,255,255 ; jmpq 41c2 <_sk_load_8888_hsw+0x22>
DB 130 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
@@ -4085,16 +4084,16 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,86 ; jne 434a <_sk_load_8888_dst_hsw+0x72>
+ DB 117,86 ; jne 4346 <_sk_load_8888_dst_hsw+0x72>
DB 196,129,126,111,60,152 ; vmovdqu (%r8,%r11,4),%ymm7
- DB 197,197,219,37,222,137,2,0 ; vpand 0x289de(%rip),%ymm7,%ymm4 # 2cce0 <_sk_overlay_sse2_8bit+0x774>
+ DB 197,197,219,37,66,136,2,0 ; vpand 0x28842(%rip),%ymm7,%ymm4 # 2cb40 <_sk_overlay_sse2_8bit+0x5e8>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,65,135,2,0 ; vbroadcastss 0x28741(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,21,144,2,0 ; vbroadcastss 0x29015(%rip),%ymm8 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
- DB 196,226,69,0,45,227,137,2,0 ; vpshufb 0x289e3(%rip),%ymm7,%ymm5 # 2cd00 <_sk_overlay_sse2_8bit+0x794>
+ DB 196,226,69,0,45,71,136,2,0 ; vpshufb 0x28847(%rip),%ymm7,%ymm5 # 2cb60 <_sk_overlay_sse2_8bit+0x608>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
DB 196,193,84,89,232 ; vmulps %ymm8,%ymm5,%ymm5
- DB 196,226,69,0,53,241,137,2,0 ; vpshufb 0x289f1(%rip),%ymm7,%ymm6 # 2cd20 <_sk_overlay_sse2_8bit+0x7b4>
+ DB 196,226,69,0,53,85,136,2,0 ; vpshufb 0x28855(%rip),%ymm7,%ymm6 # 2cb80 <_sk_overlay_sse2_8bit+0x628>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
@@ -4107,21 +4106,21 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,156 ; ja 42fa <_sk_load_8888_dst_hsw+0x22>
+ DB 119,156 ; ja 42f6 <_sk_load_8888_dst_hsw+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,135,0,0,0 ; lea 0x87(%rip),%r10 # 43f0 <_sk_load_8888_dst_hsw+0x118>
+ DB 76,141,21,135,0,0,0 ; lea 0x87(%rip),%r10 # 43ec <_sk_load_8888_dst_hsw+0x118>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,60,152 ; vmovd (%r8,%r11,4),%xmm7
- DB 235,128 ; jmp 42fa <_sk_load_8888_dst_hsw+0x22>
+ DB 235,128 ; jmp 42f6 <_sk_load_8888_dst_hsw+0x22>
DB 196,129,121,110,100,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
DB 196,227,85,2,252,4 ; vpblendd $0x4,%ymm4,%ymm5,%ymm7
DB 196,129,122,126,36,152 ; vmovq (%r8,%r11,4),%xmm4
DB 196,227,69,2,252,3 ; vpblendd $0x3,%ymm4,%ymm7,%ymm7
- DB 233,89,255,255,255 ; jmpq 42fa <_sk_load_8888_dst_hsw+0x22>
+ DB 233,89,255,255,255 ; jmpq 42f6 <_sk_load_8888_dst_hsw+0x22>
DB 196,129,121,110,100,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -4134,7 +4133,7 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 196,227,69,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm7,%ymm7
DB 196,129,122,111,36,152 ; vmovdqu (%r8,%r11,4),%xmm4
DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- DB 233,10,255,255,255 ; jmpq 42fa <_sk_load_8888_dst_hsw+0x22>
+ DB 233,10,255,255,255 ; jmpq 42f6 <_sk_load_8888_dst_hsw+0x22>
DB 130 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
@@ -4167,14 +4166,14 @@ _sk_gather_8888_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,128 ; vpgatherdd %ymm1,(%r8,%ymm0,4),%ymm3
- DB 197,229,219,5,6,137,2,0 ; vpand 0x28906(%rip),%ymm3,%ymm0 # 2cd40 <_sk_overlay_sse2_8bit+0x7d4>
+ DB 197,229,219,5,106,135,2,0 ; vpand 0x2876a(%rip),%ymm3,%ymm0 # 2cba0 <_sk_overlay_sse2_8bit+0x648>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,9,134,2,0 ; vbroadcastss 0x28609(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,221,142,2,0 ; vbroadcastss 0x28edd(%rip),%ymm8 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,11,137,2,0 ; vpshufb 0x2890b(%rip),%ymm3,%ymm1 # 2cd60 <_sk_overlay_sse2_8bit+0x7f4>
+ DB 196,226,101,0,13,111,135,2,0 ; vpshufb 0x2876f(%rip),%ymm3,%ymm1 # 2cbc0 <_sk_overlay_sse2_8bit+0x668>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,25,137,2,0 ; vpshufb 0x28919(%rip),%ymm3,%ymm2 # 2cd80 <_sk_overlay_sse2_8bit+0x814>
+ DB 196,226,101,0,21,125,135,2,0 ; vpshufb 0x2877d(%rip),%ymm3,%ymm2 # 2cbe0 <_sk_overlay_sse2_8bit+0x688>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4192,7 +4191,7 @@ _sk_store_8888_hsw LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,102,133,2,0 ; vbroadcastss 0x28566(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,58,142,2,0 ; vbroadcastss 0x28e3a(%rip),%ymm8 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -4208,7 +4207,7 @@ _sk_store_8888_hsw LABEL PROC
DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8
DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 44fa <_sk_store_8888_hsw+0x78>
+ DB 117,10 ; jne 44f6 <_sk_store_8888_hsw+0x78>
DB 196,1,126,127,4,152 ; vmovdqu %ymm8,(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -4216,17 +4215,17 @@ _sk_store_8888_hsw LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 44f6 <_sk_store_8888_hsw+0x74>
+ DB 119,236 ; ja 44f2 <_sk_store_8888_hsw+0x74>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,83,0,0,0 ; lea 0x53(%rip),%r10 # 4568 <_sk_store_8888_hsw+0xe6>
+ DB 76,141,21,83,0,0,0 ; lea 0x53(%rip),%r10 # 4564 <_sk_store_8888_hsw+0xe6>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,1,121,126,4,152 ; vmovd %xmm8,(%r8,%r11,4)
- DB 235,208 ; jmp 44f6 <_sk_store_8888_hsw+0x74>
+ DB 235,208 ; jmp 44f2 <_sk_store_8888_hsw+0x74>
DB 196,3,121,22,68,152,8,2 ; vpextrd $0x2,%xmm8,0x8(%r8,%r11,4)
DB 196,1,121,214,4,152 ; vmovq %xmm8,(%r8,%r11,4)
- DB 235,192 ; jmp 44f6 <_sk_store_8888_hsw+0x74>
+ DB 235,192 ; jmp 44f2 <_sk_store_8888_hsw+0x74>
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,3,121,22,76,152,24,2 ; vpextrd $0x2,%xmm9,0x18(%r8,%r11,4)
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
@@ -4234,7 +4233,7 @@ _sk_store_8888_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,1,121,126,76,152,16 ; vmovd %xmm9,0x10(%r8,%r11,4)
DB 196,1,122,127,4,152 ; vmovdqu %xmm8,(%r8,%r11,4)
- DB 235,143 ; jmp 44f6 <_sk_store_8888_hsw+0x74>
+ DB 235,143 ; jmp 44f2 <_sk_store_8888_hsw+0x74>
DB 144 ; nop
DB 182,255 ; mov $0xff,%dh
DB 255 ; (bad)
@@ -4267,16 +4266,16 @@ _sk_load_bgra_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,86 ; jne 45f6 <_sk_load_bgra_hsw+0x72>
+ DB 117,86 ; jne 45f2 <_sk_load_bgra_hsw+0x72>
DB 196,129,126,111,28,152 ; vmovdqu (%r8,%r11,4),%ymm3
- DB 197,229,219,5,242,135,2,0 ; vpand 0x287f2(%rip),%ymm3,%ymm0 # 2cda0 <_sk_overlay_sse2_8bit+0x834>
+ DB 197,229,219,5,86,134,2,0 ; vpand 0x28656(%rip),%ymm3,%ymm0 # 2cc00 <_sk_overlay_sse2_8bit+0x6a8>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,149,132,2,0 ; vbroadcastss 0x28495(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,105,141,2,0 ; vbroadcastss 0x28d69(%rip),%ymm8 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2
- DB 196,226,101,0,5,247,135,2,0 ; vpshufb 0x287f7(%rip),%ymm3,%ymm0 # 2cdc0 <_sk_overlay_sse2_8bit+0x854>
+ DB 196,226,101,0,5,91,134,2,0 ; vpshufb 0x2865b(%rip),%ymm3,%ymm0 # 2cc20 <_sk_overlay_sse2_8bit+0x6c8>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1
- DB 196,226,101,0,5,5,136,2,0 ; vpshufb 0x28805(%rip),%ymm3,%ymm0 # 2cde0 <_sk_overlay_sse2_8bit+0x874>
+ DB 196,226,101,0,5,105,134,2,0 ; vpshufb 0x28669(%rip),%ymm3,%ymm0 # 2cc40 <_sk_overlay_sse2_8bit+0x6e8>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4289,21 +4288,21 @@ _sk_load_bgra_hsw LABEL PROC
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,156 ; ja 45a6 <_sk_load_bgra_hsw+0x22>
+ DB 119,156 ; ja 45a2 <_sk_load_bgra_hsw+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,135,0,0,0 ; lea 0x87(%rip),%r10 # 469c <_sk_load_bgra_hsw+0x118>
+ DB 76,141,21,135,0,0,0 ; lea 0x87(%rip),%r10 # 4698 <_sk_load_bgra_hsw+0x118>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,28,152 ; vmovd (%r8,%r11,4),%xmm3
- DB 235,128 ; jmp 45a6 <_sk_load_bgra_hsw+0x22>
+ DB 235,128 ; jmp 45a2 <_sk_load_bgra_hsw+0x22>
DB 196,129,121,110,68,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
DB 196,227,117,2,216,4 ; vpblendd $0x4,%ymm0,%ymm1,%ymm3
DB 196,129,122,126,4,152 ; vmovq (%r8,%r11,4),%xmm0
DB 196,227,101,2,216,3 ; vpblendd $0x3,%ymm0,%ymm3,%ymm3
- DB 233,89,255,255,255 ; jmpq 45a6 <_sk_load_bgra_hsw+0x22>
+ DB 233,89,255,255,255 ; jmpq 45a2 <_sk_load_bgra_hsw+0x22>
DB 196,129,121,110,68,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -4316,7 +4315,7 @@ _sk_load_bgra_hsw LABEL PROC
DB 196,227,101,56,216,1 ; vinserti128 $0x1,%xmm0,%ymm3,%ymm3
DB 196,129,122,111,4,152 ; vmovdqu (%r8,%r11,4),%xmm0
DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- DB 233,10,255,255,255 ; jmpq 45a6 <_sk_load_bgra_hsw+0x22>
+ DB 233,10,255,255,255 ; jmpq 45a2 <_sk_load_bgra_hsw+0x22>
DB 130 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
@@ -4348,16 +4347,16 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,86 ; jne 472a <_sk_load_bgra_dst_hsw+0x72>
+ DB 117,86 ; jne 4726 <_sk_load_bgra_dst_hsw+0x72>
DB 196,129,126,111,60,152 ; vmovdqu (%r8,%r11,4),%ymm7
- DB 197,197,219,37,30,135,2,0 ; vpand 0x2871e(%rip),%ymm7,%ymm4 # 2ce00 <_sk_overlay_sse2_8bit+0x894>
+ DB 197,197,219,37,130,133,2,0 ; vpand 0x28582(%rip),%ymm7,%ymm4 # 2cc60 <_sk_overlay_sse2_8bit+0x708>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,97,131,2,0 ; vbroadcastss 0x28361(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,53,140,2,0 ; vbroadcastss 0x28c35(%rip),%ymm8 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,92,89,240 ; vmulps %ymm8,%ymm4,%ymm6
- DB 196,226,69,0,37,35,135,2,0 ; vpshufb 0x28723(%rip),%ymm7,%ymm4 # 2ce20 <_sk_overlay_sse2_8bit+0x8b4>
+ DB 196,226,69,0,37,135,133,2,0 ; vpshufb 0x28587(%rip),%ymm7,%ymm4 # 2cc80 <_sk_overlay_sse2_8bit+0x728>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,92,89,232 ; vmulps %ymm8,%ymm4,%ymm5
- DB 196,226,69,0,37,49,135,2,0 ; vpshufb 0x28731(%rip),%ymm7,%ymm4 # 2ce40 <_sk_overlay_sse2_8bit+0x8d4>
+ DB 196,226,69,0,37,149,133,2,0 ; vpshufb 0x28595(%rip),%ymm7,%ymm4 # 2cca0 <_sk_overlay_sse2_8bit+0x748>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
@@ -4370,21 +4369,21 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,156 ; ja 46da <_sk_load_bgra_dst_hsw+0x22>
+ DB 119,156 ; ja 46d6 <_sk_load_bgra_dst_hsw+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,135,0,0,0 ; lea 0x87(%rip),%r10 # 47d0 <_sk_load_bgra_dst_hsw+0x118>
+ DB 76,141,21,135,0,0,0 ; lea 0x87(%rip),%r10 # 47cc <_sk_load_bgra_dst_hsw+0x118>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,60,152 ; vmovd (%r8,%r11,4),%xmm7
- DB 235,128 ; jmp 46da <_sk_load_bgra_dst_hsw+0x22>
+ DB 235,128 ; jmp 46d6 <_sk_load_bgra_dst_hsw+0x22>
DB 196,129,121,110,100,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
DB 196,227,85,2,252,4 ; vpblendd $0x4,%ymm4,%ymm5,%ymm7
DB 196,129,122,126,36,152 ; vmovq (%r8,%r11,4),%xmm4
DB 196,227,69,2,252,3 ; vpblendd $0x3,%ymm4,%ymm7,%ymm7
- DB 233,89,255,255,255 ; jmpq 46da <_sk_load_bgra_dst_hsw+0x22>
+ DB 233,89,255,255,255 ; jmpq 46d6 <_sk_load_bgra_dst_hsw+0x22>
DB 196,129,121,110,100,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -4397,7 +4396,7 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 196,227,69,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm7,%ymm7
DB 196,129,122,111,36,152 ; vmovdqu (%r8,%r11,4),%xmm4
DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- DB 233,10,255,255,255 ; jmpq 46da <_sk_load_bgra_dst_hsw+0x22>
+ DB 233,10,255,255,255 ; jmpq 46d6 <_sk_load_bgra_dst_hsw+0x22>
DB 130 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
@@ -4430,14 +4429,14 @@ _sk_gather_bgra_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,128 ; vpgatherdd %ymm1,(%r8,%ymm0,4),%ymm3
- DB 197,229,219,5,70,134,2,0 ; vpand 0x28646(%rip),%ymm3,%ymm0 # 2ce60 <_sk_overlay_sse2_8bit+0x8f4>
+ DB 197,229,219,5,170,132,2,0 ; vpand 0x284aa(%rip),%ymm3,%ymm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x768>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,41,130,2,0 ; vbroadcastss 0x28229(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,253,138,2,0 ; vbroadcastss 0x28afd(%rip),%ymm8 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2
- DB 196,226,101,0,5,75,134,2,0 ; vpshufb 0x2864b(%rip),%ymm3,%ymm0 # 2ce80 <_sk_overlay_sse2_8bit+0x914>
+ DB 196,226,101,0,5,175,132,2,0 ; vpshufb 0x284af(%rip),%ymm3,%ymm0 # 2cce0 <_sk_overlay_sse2_8bit+0x788>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1
- DB 196,226,101,0,5,89,134,2,0 ; vpshufb 0x28659(%rip),%ymm3,%ymm0 # 2cea0 <_sk_overlay_sse2_8bit+0x934>
+ DB 196,226,101,0,5,189,132,2,0 ; vpshufb 0x284bd(%rip),%ymm3,%ymm0 # 2cd00 <_sk_overlay_sse2_8bit+0x7a8>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4455,7 +4454,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,134,129,2,0 ; vbroadcastss 0x28186(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,90,138,2,0 ; vbroadcastss 0x28a5a(%rip),%ymm8 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -4471,7 +4470,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8
DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 48da <_sk_store_bgra_hsw+0x78>
+ DB 117,10 ; jne 48d6 <_sk_store_bgra_hsw+0x78>
DB 196,1,126,127,4,152 ; vmovdqu %ymm8,(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -4479,17 +4478,17 @@ _sk_store_bgra_hsw LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 48d6 <_sk_store_bgra_hsw+0x74>
+ DB 119,236 ; ja 48d2 <_sk_store_bgra_hsw+0x74>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,83,0,0,0 ; lea 0x53(%rip),%r10 # 4948 <_sk_store_bgra_hsw+0xe6>
+ DB 76,141,21,83,0,0,0 ; lea 0x53(%rip),%r10 # 4944 <_sk_store_bgra_hsw+0xe6>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,1,121,126,4,152 ; vmovd %xmm8,(%r8,%r11,4)
- DB 235,208 ; jmp 48d6 <_sk_store_bgra_hsw+0x74>
+ DB 235,208 ; jmp 48d2 <_sk_store_bgra_hsw+0x74>
DB 196,3,121,22,68,152,8,2 ; vpextrd $0x2,%xmm8,0x8(%r8,%r11,4)
DB 196,1,121,214,4,152 ; vmovq %xmm8,(%r8,%r11,4)
- DB 235,192 ; jmp 48d6 <_sk_store_bgra_hsw+0x74>
+ DB 235,192 ; jmp 48d2 <_sk_store_bgra_hsw+0x74>
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,3,121,22,76,152,24,2 ; vpextrd $0x2,%xmm9,0x18(%r8,%r11,4)
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
@@ -4497,7 +4496,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,1,121,126,76,152,16 ; vmovd %xmm9,0x10(%r8,%r11,4)
DB 196,1,122,127,4,152 ; vmovdqu %xmm8,(%r8,%r11,4)
- DB 235,143 ; jmp 48d6 <_sk_store_bgra_hsw+0x74>
+ DB 235,143 ; jmp 48d2 <_sk_store_bgra_hsw+0x74>
DB 144 ; nop
DB 182,255 ; mov $0xff,%dh
DB 255 ; (bad)
@@ -4530,7 +4529,7 @@ _sk_load_f16_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 117,101 ; jne 49e5 <_sk_load_f16_hsw+0x81>
+ DB 117,101 ; jne 49e1 <_sk_load_f16_hsw+0x81>
DB 196,65,121,16,4,192 ; vmovupd (%r8,%rax,8),%xmm8
DB 196,193,121,16,84,192,16 ; vmovupd 0x10(%r8,%rax,8),%xmm2
DB 196,193,121,16,92,192,32 ; vmovupd 0x20(%r8,%rax,8),%xmm3
@@ -4556,29 +4555,29 @@ _sk_load_f16_hsw LABEL PROC
DB 196,65,123,16,4,192 ; vmovsd (%r8,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,85 ; je 4a4b <_sk_load_f16_hsw+0xe7>
+ DB 116,85 ; je 4a47 <_sk_load_f16_hsw+0xe7>
DB 196,65,57,22,68,192,8 ; vmovhpd 0x8(%r8,%rax,8),%xmm8,%xmm8
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,72 ; jb 4a4b <_sk_load_f16_hsw+0xe7>
+ DB 114,72 ; jb 4a47 <_sk_load_f16_hsw+0xe7>
DB 196,193,123,16,84,192,16 ; vmovsd 0x10(%r8,%rax,8),%xmm2
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 116,72 ; je 4a58 <_sk_load_f16_hsw+0xf4>
+ DB 116,72 ; je 4a54 <_sk_load_f16_hsw+0xf4>
DB 196,193,105,22,84,192,24 ; vmovhpd 0x18(%r8,%rax,8),%xmm2,%xmm2
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,59 ; jb 4a58 <_sk_load_f16_hsw+0xf4>
+ DB 114,59 ; jb 4a54 <_sk_load_f16_hsw+0xf4>
DB 196,193,123,16,92,192,32 ; vmovsd 0x20(%r8,%rax,8),%xmm3
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 15,132,109,255,255,255 ; je 499b <_sk_load_f16_hsw+0x37>
+ DB 15,132,109,255,255,255 ; je 4997 <_sk_load_f16_hsw+0x37>
DB 196,193,97,22,92,192,40 ; vmovhpd 0x28(%r8,%rax,8),%xmm3,%xmm3
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 15,130,92,255,255,255 ; jb 499b <_sk_load_f16_hsw+0x37>
+ DB 15,130,92,255,255,255 ; jb 4997 <_sk_load_f16_hsw+0x37>
DB 196,65,122,126,76,192,48 ; vmovq 0x30(%r8,%rax,8),%xmm9
- DB 233,80,255,255,255 ; jmpq 499b <_sk_load_f16_hsw+0x37>
+ DB 233,80,255,255,255 ; jmpq 4997 <_sk_load_f16_hsw+0x37>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,67,255,255,255 ; jmpq 499b <_sk_load_f16_hsw+0x37>
+ DB 233,67,255,255,255 ; jmpq 4997 <_sk_load_f16_hsw+0x37>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,58,255,255,255 ; jmpq 499b <_sk_load_f16_hsw+0x37>
+ DB 233,58,255,255,255 ; jmpq 4997 <_sk_load_f16_hsw+0x37>
PUBLIC _sk_load_f16_dst_hsw
_sk_load_f16_dst_hsw LABEL PROC
@@ -4590,7 +4589,7 @@ _sk_load_f16_dst_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 117,101 ; jne 4ae2 <_sk_load_f16_dst_hsw+0x81>
+ DB 117,101 ; jne 4ade <_sk_load_f16_dst_hsw+0x81>
DB 196,65,121,16,4,192 ; vmovupd (%r8,%rax,8),%xmm8
DB 196,193,121,16,116,192,16 ; vmovupd 0x10(%r8,%rax,8),%xmm6
DB 196,193,121,16,124,192,32 ; vmovupd 0x20(%r8,%rax,8),%xmm7
@@ -4616,29 +4615,29 @@ _sk_load_f16_dst_hsw LABEL PROC
DB 196,65,123,16,4,192 ; vmovsd (%r8,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,85 ; je 4b48 <_sk_load_f16_dst_hsw+0xe7>
+ DB 116,85 ; je 4b44 <_sk_load_f16_dst_hsw+0xe7>
DB 196,65,57,22,68,192,8 ; vmovhpd 0x8(%r8,%rax,8),%xmm8,%xmm8
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,72 ; jb 4b48 <_sk_load_f16_dst_hsw+0xe7>
+ DB 114,72 ; jb 4b44 <_sk_load_f16_dst_hsw+0xe7>
DB 196,193,123,16,116,192,16 ; vmovsd 0x10(%r8,%rax,8),%xmm6
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 116,72 ; je 4b55 <_sk_load_f16_dst_hsw+0xf4>
+ DB 116,72 ; je 4b51 <_sk_load_f16_dst_hsw+0xf4>
DB 196,193,73,22,116,192,24 ; vmovhpd 0x18(%r8,%rax,8),%xmm6,%xmm6
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,59 ; jb 4b55 <_sk_load_f16_dst_hsw+0xf4>
+ DB 114,59 ; jb 4b51 <_sk_load_f16_dst_hsw+0xf4>
DB 196,193,123,16,124,192,32 ; vmovsd 0x20(%r8,%rax,8),%xmm7
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 15,132,109,255,255,255 ; je 4a98 <_sk_load_f16_dst_hsw+0x37>
+ DB 15,132,109,255,255,255 ; je 4a94 <_sk_load_f16_dst_hsw+0x37>
DB 196,193,65,22,124,192,40 ; vmovhpd 0x28(%r8,%rax,8),%xmm7,%xmm7
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 15,130,92,255,255,255 ; jb 4a98 <_sk_load_f16_dst_hsw+0x37>
+ DB 15,130,92,255,255,255 ; jb 4a94 <_sk_load_f16_dst_hsw+0x37>
DB 196,65,122,126,76,192,48 ; vmovq 0x30(%r8,%rax,8),%xmm9
- DB 233,80,255,255,255 ; jmpq 4a98 <_sk_load_f16_dst_hsw+0x37>
+ DB 233,80,255,255,255 ; jmpq 4a94 <_sk_load_f16_dst_hsw+0x37>
DB 197,193,87,255 ; vxorpd %xmm7,%xmm7,%xmm7
DB 197,201,87,246 ; vxorpd %xmm6,%xmm6,%xmm6
- DB 233,67,255,255,255 ; jmpq 4a98 <_sk_load_f16_dst_hsw+0x37>
+ DB 233,67,255,255,255 ; jmpq 4a94 <_sk_load_f16_dst_hsw+0x37>
DB 197,193,87,255 ; vxorpd %xmm7,%xmm7,%xmm7
- DB 233,58,255,255,255 ; jmpq 4a98 <_sk_load_f16_dst_hsw+0x37>
+ DB 233,58,255,255,255 ; jmpq 4a94 <_sk_load_f16_dst_hsw+0x37>
PUBLIC _sk_gather_f16_hsw
_sk_gather_f16_hsw LABEL PROC
@@ -4697,7 +4696,7 @@ _sk_store_f16_hsw LABEL PROC
DB 196,65,57,98,205 ; vpunpckldq %xmm13,%xmm8,%xmm9
DB 196,65,57,106,197 ; vpunpckhdq %xmm13,%xmm8,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,31 ; jne 4c63 <_sk_store_f16_hsw+0x7b>
+ DB 117,31 ; jne 4c5f <_sk_store_f16_hsw+0x7b>
DB 196,65,120,17,28,192 ; vmovups %xmm11,(%r8,%rax,8)
DB 196,65,120,17,84,192,16 ; vmovups %xmm10,0x10(%r8,%rax,8)
DB 196,65,120,17,76,192,32 ; vmovups %xmm9,0x20(%r8,%rax,8)
@@ -4706,22 +4705,22 @@ _sk_store_f16_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,192 ; vmovq %xmm11,(%r8,%rax,8)
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,240 ; je 4c5f <_sk_store_f16_hsw+0x77>
+ DB 116,240 ; je 4c5b <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,92,192,8 ; vmovhpd %xmm11,0x8(%r8,%rax,8)
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,227 ; jb 4c5f <_sk_store_f16_hsw+0x77>
+ DB 114,227 ; jb 4c5b <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,84,192,16 ; vmovq %xmm10,0x10(%r8,%rax,8)
- DB 116,218 ; je 4c5f <_sk_store_f16_hsw+0x77>
+ DB 116,218 ; je 4c5b <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,84,192,24 ; vmovhpd %xmm10,0x18(%r8,%rax,8)
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,205 ; jb 4c5f <_sk_store_f16_hsw+0x77>
+ DB 114,205 ; jb 4c5b <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,76,192,32 ; vmovq %xmm9,0x20(%r8,%rax,8)
- DB 116,196 ; je 4c5f <_sk_store_f16_hsw+0x77>
+ DB 116,196 ; je 4c5b <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,76,192,40 ; vmovhpd %xmm9,0x28(%r8,%rax,8)
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 114,183 ; jb 4c5f <_sk_store_f16_hsw+0x77>
+ DB 114,183 ; jb 4c5b <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,68,192,48 ; vmovq %xmm8,0x30(%r8,%rax,8)
- DB 235,174 ; jmp 4c5f <_sk_store_f16_hsw+0x77>
+ DB 235,174 ; jmp 4c5b <_sk_store_f16_hsw+0x77>
PUBLIC _sk_load_u16_be_hsw
_sk_load_u16_be_hsw LABEL PROC
@@ -4734,7 +4733,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 73,99,193 ; movslq %r9d,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,204,0,0,0 ; jne 4da4 <_sk_load_u16_be_hsw+0xf3>
+ DB 15,133,204,0,0,0 ; jne 4da0 <_sk_load_u16_be_hsw+0xf3>
DB 196,65,121,16,4,64 ; vmovupd (%r8,%rax,2),%xmm8
DB 196,193,121,16,84,64,16 ; vmovupd 0x10(%r8,%rax,2),%xmm2
DB 196,193,121,16,92,64,32 ; vmovupd 0x20(%r8,%rax,2),%xmm3
@@ -4753,7 +4752,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,51,125,2,0 ; vbroadcastss 0x27d33(%rip),%ymm10 # 2ca6c <_sk_overlay_sse2_8bit+0x500>
+ DB 196,98,125,24,21,7,134,2,0 ; vbroadcastss 0x28607(%rip),%ymm10 # 2d33c <_sk_overlay_sse2_8bit+0xde4>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -4781,29 +4780,29 @@ _sk_load_u16_be_hsw LABEL PROC
DB 196,65,123,16,4,64 ; vmovsd (%r8,%rax,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,85 ; je 4e0a <_sk_load_u16_be_hsw+0x159>
+ DB 116,85 ; je 4e06 <_sk_load_u16_be_hsw+0x159>
DB 196,65,57,22,68,64,8 ; vmovhpd 0x8(%r8,%rax,2),%xmm8,%xmm8
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,72 ; jb 4e0a <_sk_load_u16_be_hsw+0x159>
+ DB 114,72 ; jb 4e06 <_sk_load_u16_be_hsw+0x159>
DB 196,193,123,16,84,64,16 ; vmovsd 0x10(%r8,%rax,2),%xmm2
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 116,72 ; je 4e17 <_sk_load_u16_be_hsw+0x166>
+ DB 116,72 ; je 4e13 <_sk_load_u16_be_hsw+0x166>
DB 196,193,105,22,84,64,24 ; vmovhpd 0x18(%r8,%rax,2),%xmm2,%xmm2
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,59 ; jb 4e17 <_sk_load_u16_be_hsw+0x166>
+ DB 114,59 ; jb 4e13 <_sk_load_u16_be_hsw+0x166>
DB 196,193,123,16,92,64,32 ; vmovsd 0x20(%r8,%rax,2),%xmm3
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 15,132,6,255,255,255 ; je 4cf3 <_sk_load_u16_be_hsw+0x42>
+ DB 15,132,6,255,255,255 ; je 4cef <_sk_load_u16_be_hsw+0x42>
DB 196,193,97,22,92,64,40 ; vmovhpd 0x28(%r8,%rax,2),%xmm3,%xmm3
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 15,130,245,254,255,255 ; jb 4cf3 <_sk_load_u16_be_hsw+0x42>
+ DB 15,130,245,254,255,255 ; jb 4cef <_sk_load_u16_be_hsw+0x42>
DB 196,65,122,126,76,64,48 ; vmovq 0x30(%r8,%rax,2),%xmm9
- DB 233,233,254,255,255 ; jmpq 4cf3 <_sk_load_u16_be_hsw+0x42>
+ DB 233,233,254,255,255 ; jmpq 4cef <_sk_load_u16_be_hsw+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,220,254,255,255 ; jmpq 4cf3 <_sk_load_u16_be_hsw+0x42>
+ DB 233,220,254,255,255 ; jmpq 4cef <_sk_load_u16_be_hsw+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,211,254,255,255 ; jmpq 4cf3 <_sk_load_u16_be_hsw+0x42>
+ DB 233,211,254,255,255 ; jmpq 4cef <_sk_load_u16_be_hsw+0x42>
PUBLIC _sk_load_rgb_u16_be_hsw
_sk_load_rgb_u16_be_hsw LABEL PROC
@@ -4818,7 +4817,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,203,0,0,0 ; jne 4f16 <_sk_load_rgb_u16_be_hsw+0xf6>
+ DB 15,133,203,0,0,0 ; jne 4f12 <_sk_load_rgb_u16_be_hsw+0xf6>
DB 196,65,122,111,28,64 ; vmovdqu (%r8,%rax,2),%xmm11
DB 196,193,122,111,92,64,12 ; vmovdqu 0xc(%r8,%rax,2),%xmm3
DB 196,193,122,111,84,64,24 ; vmovdqu 0x18(%r8,%rax,2),%xmm2
@@ -4842,7 +4841,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,225,235,192 ; vpor %xmm0,%xmm3,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,29,166,123,2,0 ; vbroadcastss 0x27ba6(%rip),%ymm3 # 2ca6c <_sk_overlay_sse2_8bit+0x500>
+ DB 196,226,125,24,29,122,132,2,0 ; vbroadcastss 0x2847a(%rip),%ymm3 # 2d33c <_sk_overlay_sse2_8bit+0xde4>
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
DB 197,185,109,201 ; vpunpckhqdq %xmm1,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -4859,69 +4858,69 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,200,122,2,0 ; vbroadcastss 0x27ac8(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,156,131,2,0 ; vbroadcastss 0x2839c(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,64 ; vmovd (%r8,%rax,2),%xmm0
DB 196,65,121,196,92,64,4,2 ; vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,32 ; jne 4f4f <_sk_load_rgb_u16_be_hsw+0x12f>
+ DB 117,32 ; jne 4f4b <_sk_load_rgb_u16_be_hsw+0x12f>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
- DB 233,49,255,255,255 ; jmpq 4e80 <_sk_load_rgb_u16_be_hsw+0x60>
+ DB 233,49,255,255,255 ; jmpq 4e7c <_sk_load_rgb_u16_be_hsw+0x60>
DB 196,193,121,110,68,64,6 ; vmovd 0x6(%r8,%rax,2),%xmm0
DB 196,65,121,196,68,64,10,2 ; vpinsrw $0x2,0xa(%r8,%rax,2),%xmm0,%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,49 ; jb 4f9a <_sk_load_rgb_u16_be_hsw+0x17a>
+ DB 114,49 ; jb 4f96 <_sk_load_rgb_u16_be_hsw+0x17a>
DB 196,193,121,110,68,64,12 ; vmovd 0xc(%r8,%rax,2),%xmm0
DB 196,193,121,196,92,64,16,2 ; vpinsrw $0x2,0x10(%r8,%rax,2),%xmm0,%xmm3
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 117,50 ; jne 4fb5 <_sk_load_rgb_u16_be_hsw+0x195>
+ DB 117,50 ; jne 4fb1 <_sk_load_rgb_u16_be_hsw+0x195>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
- DB 233,230,254,255,255 ; jmpq 4e80 <_sk_load_rgb_u16_be_hsw+0x60>
+ DB 233,230,254,255,255 ; jmpq 4e7c <_sk_load_rgb_u16_be_hsw+0x60>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
- DB 233,203,254,255,255 ; jmpq 4e80 <_sk_load_rgb_u16_be_hsw+0x60>
+ DB 233,203,254,255,255 ; jmpq 4e7c <_sk_load_rgb_u16_be_hsw+0x60>
DB 196,193,121,110,68,64,18 ; vmovd 0x12(%r8,%rax,2),%xmm0
DB 196,65,121,196,84,64,22,2 ; vpinsrw $0x2,0x16(%r8,%rax,2),%xmm0,%xmm10
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,40 ; jb 4ff7 <_sk_load_rgb_u16_be_hsw+0x1d7>
+ DB 114,40 ; jb 4ff3 <_sk_load_rgb_u16_be_hsw+0x1d7>
DB 196,193,121,110,68,64,24 ; vmovd 0x18(%r8,%rax,2),%xmm0
DB 196,193,121,196,84,64,28,2 ; vpinsrw $0x2,0x1c(%r8,%rax,2),%xmm0,%xmm2
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 117,32 ; jne 5009 <_sk_load_rgb_u16_be_hsw+0x1e9>
+ DB 117,32 ; jne 5005 <_sk_load_rgb_u16_be_hsw+0x1e9>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
- DB 233,137,254,255,255 ; jmpq 4e80 <_sk_load_rgb_u16_be_hsw+0x60>
+ DB 233,137,254,255,255 ; jmpq 4e7c <_sk_load_rgb_u16_be_hsw+0x60>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
- DB 233,119,254,255,255 ; jmpq 4e80 <_sk_load_rgb_u16_be_hsw+0x60>
+ DB 233,119,254,255,255 ; jmpq 4e7c <_sk_load_rgb_u16_be_hsw+0x60>
DB 196,193,121,110,68,64,30 ; vmovd 0x1e(%r8,%rax,2),%xmm0
DB 196,65,121,196,100,64,34,2 ; vpinsrw $0x2,0x22(%r8,%rax,2),%xmm0,%xmm12
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 114,25 ; jb 503c <_sk_load_rgb_u16_be_hsw+0x21c>
+ DB 114,25 ; jb 5038 <_sk_load_rgb_u16_be_hsw+0x21c>
DB 196,193,121,110,68,64,36 ; vmovd 0x24(%r8,%rax,2),%xmm0
DB 196,193,121,196,68,64,40,2 ; vpinsrw $0x2,0x28(%r8,%rax,2),%xmm0,%xmm0
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
- DB 233,68,254,255,255 ; jmpq 4e80 <_sk_load_rgb_u16_be_hsw+0x60>
+ DB 233,68,254,255,255 ; jmpq 4e7c <_sk_load_rgb_u16_be_hsw+0x60>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
- DB 233,59,254,255,255 ; jmpq 4e80 <_sk_load_rgb_u16_be_hsw+0x60>
+ DB 233,59,254,255,255 ; jmpq 4e7c <_sk_load_rgb_u16_be_hsw+0x60>
PUBLIC _sk_store_u16_be_hsw
_sk_store_u16_be_hsw LABEL PROC
@@ -4933,7 +4932,7 @@ _sk_store_u16_be_hsw LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 73,99,193 ; movslq %r9d,%rax
- DB 196,98,125,24,5,136,122,2,0 ; vbroadcastss 0x27a88(%rip),%ymm8 # 2caf4 <_sk_overlay_sse2_8bit+0x588>
+ DB 196,98,125,24,5,92,131,2,0 ; vbroadcastss 0x2835c(%rip),%ymm8 # 2d3c4 <_sk_overlay_sse2_8bit+0xe6c>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -4971,7 +4970,7 @@ _sk_store_u16_be_hsw LABEL PROC
DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9
DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,31 ; jne 5150 <_sk_store_u16_be_hsw+0x10b>
+ DB 117,31 ; jne 514c <_sk_store_u16_be_hsw+0x10b>
DB 196,65,120,17,28,64 ; vmovups %xmm11,(%r8,%rax,2)
DB 196,65,120,17,84,64,16 ; vmovups %xmm10,0x10(%r8,%rax,2)
DB 196,65,120,17,76,64,32 ; vmovups %xmm9,0x20(%r8,%rax,2)
@@ -4980,29 +4979,29 @@ _sk_store_u16_be_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,64 ; vmovq %xmm11,(%r8,%rax,2)
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,240 ; je 514c <_sk_store_u16_be_hsw+0x107>
+ DB 116,240 ; je 5148 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,92,64,8 ; vmovhpd %xmm11,0x8(%r8,%rax,2)
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,227 ; jb 514c <_sk_store_u16_be_hsw+0x107>
+ DB 114,227 ; jb 5148 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,84,64,16 ; vmovq %xmm10,0x10(%r8,%rax,2)
- DB 116,218 ; je 514c <_sk_store_u16_be_hsw+0x107>
+ DB 116,218 ; je 5148 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,84,64,24 ; vmovhpd %xmm10,0x18(%r8,%rax,2)
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,205 ; jb 514c <_sk_store_u16_be_hsw+0x107>
+ DB 114,205 ; jb 5148 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,76,64,32 ; vmovq %xmm9,0x20(%r8,%rax,2)
- DB 116,196 ; je 514c <_sk_store_u16_be_hsw+0x107>
+ DB 116,196 ; je 5148 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,76,64,40 ; vmovhpd %xmm9,0x28(%r8,%rax,2)
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 114,183 ; jb 514c <_sk_store_u16_be_hsw+0x107>
+ DB 114,183 ; jb 5148 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,68,64,48 ; vmovq %xmm8,0x30(%r8,%rax,2)
- DB 235,174 ; jmp 514c <_sk_store_u16_be_hsw+0x107>
+ DB 235,174 ; jmp 5148 <_sk_store_u16_be_hsw+0x107>
PUBLIC _sk_load_f32_hsw
_sk_load_f32_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,253,87,192 ; vxorpd %ymm0,%ymm0,%ymm0
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 15,135,101,1,0,0 ; ja 5313 <_sk_load_f32_hsw+0x175>
+ DB 15,135,101,1,0,0 ; ja 530f <_sk_load_f32_hsw+0x175>
DB 72,129,236,152,0,0,0 ; sub $0x98,%rsp
DB 197,253,17,36,36 ; vmovupd %ymm4,(%rsp)
DB 197,253,17,108,36,32 ; vmovupd %ymm5,0x20(%rsp)
@@ -5015,7 +5014,7 @@ _sk_load_f32_hsw LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 77,99,201 ; movslq %r9d,%r9
- DB 76,141,21,52,1,0,0 ; lea 0x134(%rip),%r10 # 5324 <_sk_load_f32_hsw+0x186>
+ DB 76,141,21,52,1,0,0 ; lea 0x134(%rip),%r10 # 5320 <_sk_load_f32_hsw+0x186>
DB 73,99,4,186 ; movslq (%r10,%rdi,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 197,221,87,228 ; vxorpd %ymm4,%ymm4,%ymm4
@@ -5078,7 +5077,7 @@ _sk_load_f32_hsw LABEL PROC
DB 197,229,87,219 ; vxorpd %ymm3,%ymm3,%ymm3
DB 196,65,45,87,210 ; vxorpd %ymm10,%ymm10,%ymm10
DB 197,245,87,201 ; vxorpd %ymm1,%ymm1,%ymm1
- DB 235,203 ; jmp 52ed <_sk_load_f32_hsw+0x14f>
+ DB 235,203 ; jmp 52e9 <_sk_load_f32_hsw+0x14f>
DB 102,144 ; xchg %ax,%ax
DB 25,255 ; sbb %edi,%edi
DB 255 ; (bad)
@@ -5103,7 +5102,7 @@ _sk_load_f32_dst_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,221,87,228 ; vxorpd %ymm4,%ymm4,%ymm4
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 15,135,101,1,0,0 ; ja 54b9 <_sk_load_f32_dst_hsw+0x175>
+ DB 15,135,101,1,0,0 ; ja 54b5 <_sk_load_f32_dst_hsw+0x175>
DB 72,129,236,152,0,0,0 ; sub $0x98,%rsp
DB 197,253,17,4,36 ; vmovupd %ymm0,(%rsp)
DB 197,253,17,76,36,32 ; vmovupd %ymm1,0x20(%rsp)
@@ -5116,7 +5115,7 @@ _sk_load_f32_dst_hsw LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 77,99,201 ; movslq %r9d,%r9
- DB 76,141,21,50,1,0,0 ; lea 0x132(%rip),%r10 # 54c8 <_sk_load_f32_dst_hsw+0x184>
+ DB 76,141,21,50,1,0,0 ; lea 0x132(%rip),%r10 # 54c4 <_sk_load_f32_dst_hsw+0x184>
DB 73,99,4,186 ; movslq (%r10,%rdi,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 197,253,87,192 ; vxorpd %ymm0,%ymm0,%ymm0
@@ -5179,7 +5178,7 @@ _sk_load_f32_dst_hsw LABEL PROC
DB 197,197,87,255 ; vxorpd %ymm7,%ymm7,%ymm7
DB 196,65,45,87,210 ; vxorpd %ymm10,%ymm10,%ymm10
DB 197,213,87,237 ; vxorpd %ymm5,%ymm5,%ymm5
- DB 235,203 ; jmp 5493 <_sk_load_f32_dst_hsw+0x14f>
+ DB 235,203 ; jmp 548f <_sk_load_f32_dst_hsw+0x14f>
DB 27,255 ; sbb %edi,%edi
DB 255 ; (bad)
DB 255,161,255,255,255,140 ; jmpq *-0x73000001(%rcx)
@@ -5190,7 +5189,7 @@ _sk_load_f32_dst_hsw LABEL PROC
DB 255,92,255,255 ; lcall *-0x1(%rdi,%rdi,8)
DB 255,70,255 ; incl -0x1(%rsi)
DB 255 ; (bad)
- DB 255,53,255,255,255,40 ; pushq 0x28ffffff(%rip) # 290054e4 <_sk_overlay_sse2_8bit+0x28fd8f78>
+ DB 255,53,255,255,255,40 ; pushq 0x28ffffff(%rip) # 290054e0 <_sk_overlay_sse2_8bit+0x28fd8f88>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -5214,7 +5213,7 @@ _sk_store_f32_hsw LABEL PROC
DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8
DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,55 ; jne 5567 <_sk_store_f32_hsw+0x7f>
+ DB 117,55 ; jne 5563 <_sk_store_f32_hsw+0x7f>
DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -5227,22 +5226,22 @@ _sk_store_f32_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,17,20,128 ; vmovupd %xmm10,(%r8,%rax,4)
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,240 ; je 5563 <_sk_store_f32_hsw+0x7b>
+ DB 116,240 ; je 555f <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,76,128,16 ; vmovupd %xmm9,0x10(%r8,%rax,4)
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,227 ; jb 5563 <_sk_store_f32_hsw+0x7b>
+ DB 114,227 ; jb 555f <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,68,128,32 ; vmovupd %xmm8,0x20(%r8,%rax,4)
- DB 116,218 ; je 5563 <_sk_store_f32_hsw+0x7b>
+ DB 116,218 ; je 555f <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,92,128,48 ; vmovupd %xmm11,0x30(%r8,%rax,4)
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,205 ; jb 5563 <_sk_store_f32_hsw+0x7b>
+ DB 114,205 ; jb 555f <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,84,128,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r8,%rax,4)
- DB 116,195 ; je 5563 <_sk_store_f32_hsw+0x7b>
+ DB 116,195 ; je 555f <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,76,128,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r8,%rax,4)
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 114,181 ; jb 5563 <_sk_store_f32_hsw+0x7b>
+ DB 114,181 ; jb 555f <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,68,128,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r8,%rax,4)
- DB 235,171 ; jmp 5563 <_sk_store_f32_hsw+0x7b>
+ DB 235,171 ; jmp 555f <_sk_store_f32_hsw+0x7b>
PUBLIC _sk_clamp_x_hsw
_sk_clamp_x_hsw LABEL PROC
@@ -5309,7 +5308,7 @@ _sk_mirror_x_hsw LABEL PROC
DB 196,65,124,92,218 ; vsubps %ymm10,%ymm0,%ymm11
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,98,125,24,192 ; vbroadcastss %xmm0,%ymm8
- DB 197,178,89,5,67,115,2,0 ; vmulss 0x27343(%rip),%xmm9,%xmm0 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 197,178,89,5,23,124,2,0 ; vmulss 0x27c17(%rip),%xmm9,%xmm0 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
DB 196,227,125,8,192,1 ; vroundps $0x1,%ymm0,%ymm0
@@ -5334,7 +5333,7 @@ _sk_mirror_y_hsw LABEL PROC
DB 196,65,116,92,218 ; vsubps %ymm10,%ymm1,%ymm11
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,98,125,24,193 ; vbroadcastss %xmm1,%ymm8
- DB 197,178,89,13,223,114,2,0 ; vmulss 0x272df(%rip),%xmm9,%xmm1 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 197,178,89,13,179,123,2,0 ; vmulss 0x27bb3(%rip),%xmm9,%xmm1 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,226,125,24,201 ; vbroadcastss %xmm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
DB 196,227,125,8,201,1 ; vroundps $0x1,%ymm1,%ymm1
@@ -5354,7 +5353,7 @@ PUBLIC _sk_clamp_x_1_hsw
_sk_clamp_x_1_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,148,114,2,0 ; vbroadcastss 0x27294(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,104,123,2,0 ; vbroadcastss 0x27b68(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -5368,9 +5367,9 @@ _sk_repeat_x_1_hsw LABEL PROC
PUBLIC _sk_mirror_x_1_hsw
_sk_mirror_x_1_hsw LABEL PROC
- DB 196,98,125,24,5,139,114,2,0 ; vbroadcastss 0x2728b(%rip),%ymm8 # 2c9f4 <_sk_overlay_sse2_8bit+0x488>
+ DB 196,98,125,24,5,95,123,2,0 ; vbroadcastss 0x27b5f(%rip),%ymm8 # 2d2c4 <_sk_overlay_sse2_8bit+0xd6c>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,97,114,2,0 ; vbroadcastss 0x27261(%rip),%ymm9 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,13,53,123,2,0 ; vbroadcastss 0x27b35(%rip),%ymm9 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -5384,11 +5383,11 @@ _sk_mirror_x_1_hsw LABEL PROC
PUBLIC _sk_luminance_to_alpha_hsw
_sk_luminance_to_alpha_hsw LABEL PROC
- DB 196,226,125,24,29,77,115,2,0 ; vbroadcastss 0x2734d(%rip),%ymm3 # 2caf8 <_sk_overlay_sse2_8bit+0x58c>
- DB 196,98,125,24,5,72,115,2,0 ; vbroadcastss 0x27348(%rip),%ymm8 # 2cafc <_sk_overlay_sse2_8bit+0x590>
+ DB 196,226,125,24,29,33,124,2,0 ; vbroadcastss 0x27c21(%rip),%ymm3 # 2d3c8 <_sk_overlay_sse2_8bit+0xe70>
+ DB 196,98,125,24,5,28,124,2,0 ; vbroadcastss 0x27c1c(%rip),%ymm8 # 2d3cc <_sk_overlay_sse2_8bit+0xe74>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 196,226,125,184,203 ; vfmadd231ps %ymm3,%ymm0,%ymm1
- DB 196,226,125,24,29,57,115,2,0 ; vbroadcastss 0x27339(%rip),%ymm3 # 2cb00 <_sk_overlay_sse2_8bit+0x594>
+ DB 196,226,125,24,29,13,124,2,0 ; vbroadcastss 0x27c0d(%rip),%ymm3 # 2d3d0 <_sk_overlay_sse2_8bit+0xe78>
DB 196,226,109,168,217 ; vfmadd213ps %ymm1,%ymm2,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -5571,9 +5570,9 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 76,139,64,8 ; mov 0x8(%rax),%r8
DB 77,137,202 ; mov %r9,%r10
DB 73,255,202 ; dec %r10
- DB 120,7 ; js 5abf <_sk_evenly_spaced_gradient_hsw+0x18>
+ DB 120,7 ; js 5abb <_sk_evenly_spaced_gradient_hsw+0x18>
DB 196,193,242,42,202 ; vcvtsi2ss %r10,%xmm1,%xmm1
- DB 235,22 ; jmp 5ad5 <_sk_evenly_spaced_gradient_hsw+0x2e>
+ DB 235,22 ; jmp 5ad1 <_sk_evenly_spaced_gradient_hsw+0x2e>
DB 77,137,211 ; mov %r10,%r11
DB 73,209,235 ; shr %r11
DB 65,131,226,1 ; and $0x1,%r10d
@@ -5584,7 +5583,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 197,244,89,200 ; vmulps %ymm0,%ymm1,%ymm1
DB 197,126,91,217 ; vcvttps2dq %ymm1,%ymm11
DB 73,131,249,8 ; cmp $0x8,%r9
- DB 119,70 ; ja 5b2e <_sk_evenly_spaced_gradient_hsw+0x87>
+ DB 119,70 ; ja 5b2a <_sk_evenly_spaced_gradient_hsw+0x87>
DB 196,66,37,22,0 ; vpermps (%r8),%ymm11,%ymm8
DB 76,139,64,40 ; mov 0x28(%rax),%r8
DB 196,66,37,22,8 ; vpermps (%r8),%ymm11,%ymm9
@@ -5600,7 +5599,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 196,194,37,22,24 ; vpermps (%r8),%ymm11,%ymm3
DB 72,139,64,64 ; mov 0x40(%rax),%rax
DB 196,98,37,22,40 ; vpermps (%rax),%ymm11,%ymm13
- DB 235,110 ; jmp 5b9c <_sk_evenly_spaced_gradient_hsw+0xf5>
+ DB 235,110 ; jmp 5b98 <_sk_evenly_spaced_gradient_hsw+0xf5>
DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,2,117,146,4,152 ; vgatherdps %ymm1,(%r8,%ymm11,4),%ymm8
@@ -5634,14 +5633,14 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_hsw
_sk_gauss_a_to_rgba_hsw LABEL PROC
- DB 196,226,125,24,5,67,111,2,0 ; vbroadcastss 0x26f43(%rip),%ymm0 # 2cb04 <_sk_overlay_sse2_8bit+0x598>
- DB 196,226,125,24,13,62,111,2,0 ; vbroadcastss 0x26f3e(%rip),%ymm1 # 2cb08 <_sk_overlay_sse2_8bit+0x59c>
+ DB 196,226,125,24,5,23,120,2,0 ; vbroadcastss 0x27817(%rip),%ymm0 # 2d3d4 <_sk_overlay_sse2_8bit+0xe7c>
+ DB 196,226,125,24,13,18,120,2,0 ; vbroadcastss 0x27812(%rip),%ymm1 # 2d3d8 <_sk_overlay_sse2_8bit+0xe80>
DB 196,226,101,168,200 ; vfmadd213ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,52,111,2,0 ; vbroadcastss 0x26f34(%rip),%ymm0 # 2cb0c <_sk_overlay_sse2_8bit+0x5a0>
+ DB 196,226,125,24,5,8,120,2,0 ; vbroadcastss 0x27808(%rip),%ymm0 # 2d3dc <_sk_overlay_sse2_8bit+0xe84>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
- DB 196,226,125,24,13,42,111,2,0 ; vbroadcastss 0x26f2a(%rip),%ymm1 # 2cb10 <_sk_overlay_sse2_8bit+0x5a4>
+ DB 196,226,125,24,13,254,119,2,0 ; vbroadcastss 0x277fe(%rip),%ymm1 # 2d3e0 <_sk_overlay_sse2_8bit+0xe88>
DB 196,226,101,184,200 ; vfmadd231ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,32,111,2,0 ; vbroadcastss 0x26f20(%rip),%ymm0 # 2cb14 <_sk_overlay_sse2_8bit+0x5a8>
+ DB 196,226,125,24,5,244,119,2,0 ; vbroadcastss 0x277f4(%rip),%ymm0 # 2d3e4 <_sk_overlay_sse2_8bit+0xe8c>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -5654,11 +5653,11 @@ _sk_gradient_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,0 ; mov (%rax),%r8
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 15,134,180,0,0,0 ; jbe 5ccc <_sk_gradient_hsw+0xc3>
+ DB 15,134,180,0,0,0 ; jbe 5cc8 <_sk_gradient_hsw+0xc3>
DB 76,139,72,72 ; mov 0x48(%rax),%r9
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 65,186,1,0,0,0 ; mov $0x1,%r10d
- DB 196,226,125,24,21,177,109,2,0 ; vbroadcastss 0x26db1(%rip),%ymm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,226,125,24,21,133,118,2,0 ; vbroadcastss 0x27685(%rip),%ymm2 # 2d2b0 <_sk_overlay_sse2_8bit+0xd58>
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
DB 196,130,125,24,28,145 ; vbroadcastss (%r9,%r10,4),%ymm3
DB 197,228,194,216,2 ; vcmpleps %ymm0,%ymm3,%ymm3
@@ -5666,10 +5665,10 @@ _sk_gradient_hsw LABEL PROC
DB 196,65,101,254,201 ; vpaddd %ymm9,%ymm3,%ymm9
DB 73,255,194 ; inc %r10
DB 77,57,208 ; cmp %r10,%r8
- DB 117,226 ; jne 5c34 <_sk_gradient_hsw+0x2b>
+ DB 117,226 ; jne 5c30 <_sk_gradient_hsw+0x2b>
DB 76,139,72,8 ; mov 0x8(%rax),%r9
DB 73,131,248,8 ; cmp $0x8,%r8
- DB 118,121 ; jbe 5cd5 <_sk_gradient_hsw+0xcc>
+ DB 118,121 ; jbe 5cd1 <_sk_gradient_hsw+0xcc>
DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,2,117,146,4,137 ; vgatherdps %ymm1,(%r9,%ymm9,4),%ymm8
@@ -5693,7 +5692,7 @@ _sk_gradient_hsw LABEL PROC
DB 196,130,21,146,28,136 ; vgatherdps %ymm13,(%r8,%ymm9,4),%ymm3
DB 72,139,64,64 ; mov 0x40(%rax),%rax
DB 196,34,13,146,44,136 ; vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13
- DB 235,77 ; jmp 5d19 <_sk_gradient_hsw+0x110>
+ DB 235,77 ; jmp 5d15 <_sk_gradient_hsw+0x110>
DB 76,139,72,8 ; mov 0x8(%rax),%r9
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 196,66,53,22,1 ; vpermps (%r9),%ymm9,%ymm8
@@ -5749,24 +5748,24 @@ _sk_xy_to_unit_angle_hsw LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,100,109,2,0 ; vbroadcastss 0x26d64(%rip),%ymm13 # 2cb18 <_sk_overlay_sse2_8bit+0x5ac>
- DB 196,98,125,24,53,95,109,2,0 ; vbroadcastss 0x26d5f(%rip),%ymm14 # 2cb1c <_sk_overlay_sse2_8bit+0x5b0>
+ DB 196,98,125,24,45,56,118,2,0 ; vbroadcastss 0x27638(%rip),%ymm13 # 2d3e8 <_sk_overlay_sse2_8bit+0xe90>
+ DB 196,98,125,24,53,51,118,2,0 ; vbroadcastss 0x27633(%rip),%ymm14 # 2d3ec <_sk_overlay_sse2_8bit+0xe94>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
- DB 196,98,125,24,45,85,109,2,0 ; vbroadcastss 0x26d55(%rip),%ymm13 # 2cb20 <_sk_overlay_sse2_8bit+0x5b4>
+ DB 196,98,125,24,45,41,118,2,0 ; vbroadcastss 0x27629(%rip),%ymm13 # 2d3f0 <_sk_overlay_sse2_8bit+0xe98>
DB 196,66,29,184,238 ; vfmadd231ps %ymm14,%ymm12,%ymm13
- DB 196,98,125,24,53,75,109,2,0 ; vbroadcastss 0x26d4b(%rip),%ymm14 # 2cb24 <_sk_overlay_sse2_8bit+0x5b8>
+ DB 196,98,125,24,53,31,118,2,0 ; vbroadcastss 0x2761f(%rip),%ymm14 # 2d3f4 <_sk_overlay_sse2_8bit+0xe9c>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
DB 196,65,36,89,222 ; vmulps %ymm14,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,54,109,2,0 ; vbroadcastss 0x26d36(%rip),%ymm10 # 2cb28 <_sk_overlay_sse2_8bit+0x5bc>
+ DB 196,98,125,24,21,10,118,2,0 ; vbroadcastss 0x2760a(%rip),%ymm10 # 2d3f8 <_sk_overlay_sse2_8bit+0xea0>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,204,107,2,0 ; vbroadcastss 0x26bcc(%rip),%ymm10 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,21,160,116,2,0 ; vbroadcastss 0x274a0(%rip),%ymm10 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,182,107,2,0 ; vbroadcastss 0x26bb6(%rip),%ymm10 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,21,138,116,2,0 ; vbroadcastss 0x2748a(%rip),%ymm10 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -5790,23 +5789,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw LABEL PROC
DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10
DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,182,108,2,0 ; vbroadcastss 0x26cb6(%rip),%ymm11 # 2cb2c <_sk_overlay_sse2_8bit+0x5c0>
+ DB 196,98,125,24,29,138,117,2,0 ; vbroadcastss 0x2758a(%rip),%ymm11 # 2d3fc <_sk_overlay_sse2_8bit+0xea4>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11
DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,149,108,2,0 ; vbroadcastss 0x26c95(%rip),%ymm9 # 2cb30 <_sk_overlay_sse2_8bit+0x5c4>
+ DB 196,98,125,24,13,105,117,2,0 ; vbroadcastss 0x27569(%rip),%ymm9 # 2d400 <_sk_overlay_sse2_8bit+0xea8>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,120,108,2,0 ; vbroadcastss 0x26c78(%rip),%ymm9 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,125,24,13,76,117,2,0 ; vbroadcastss 0x2754c(%rip),%ymm9 # 2d404 <_sk_overlay_sse2_8bit+0xeac>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,9,107,2,0 ; vbroadcastss 0x26b09(%rip),%ymm11 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,29,221,115,2,0 ; vbroadcastss 0x273dd(%rip),%ymm11 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -5823,23 +5822,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw LABEL PROC
DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10
DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,30,108,2,0 ; vbroadcastss 0x26c1e(%rip),%ymm11 # 2cb2c <_sk_overlay_sse2_8bit+0x5c0>
+ DB 196,98,125,24,29,242,116,2,0 ; vbroadcastss 0x274f2(%rip),%ymm11 # 2d3fc <_sk_overlay_sse2_8bit+0xea4>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11
DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,253,107,2,0 ; vbroadcastss 0x26bfd(%rip),%ymm9 # 2cb30 <_sk_overlay_sse2_8bit+0x5c4>
+ DB 196,98,125,24,13,209,116,2,0 ; vbroadcastss 0x274d1(%rip),%ymm9 # 2d400 <_sk_overlay_sse2_8bit+0xea8>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,224,107,2,0 ; vbroadcastss 0x26be0(%rip),%ymm9 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,125,24,13,180,116,2,0 ; vbroadcastss 0x274b4(%rip),%ymm9 # 2d404 <_sk_overlay_sse2_8bit+0xeac>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,113,106,2,0 ; vbroadcastss 0x26a71(%rip),%ymm11 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,29,69,115,2,0 ; vbroadcastss 0x27345(%rip),%ymm11 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -5855,14 +5854,14 @@ _sk_xy_to_2pt_conical_linear_hsw LABEL PROC
DB 197,58,89,72,44 ; vmulss 0x2c(%rax),%xmm8,%xmm9
DB 196,66,125,24,201 ; vbroadcastss %xmm9,%ymm9
DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
- DB 196,98,125,24,21,140,107,2,0 ; vbroadcastss 0x26b8c(%rip),%ymm10 # 2cb2c <_sk_overlay_sse2_8bit+0x5c0>
+ DB 196,98,125,24,21,96,116,2,0 ; vbroadcastss 0x27460(%rip),%ymm10 # 2d3fc <_sk_overlay_sse2_8bit+0xea4>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10
DB 196,98,125,184,208 ; vfmadd231ps %ymm0,%ymm0,%ymm10
DB 196,193,58,89,192 ; vmulss %xmm8,%xmm8,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0
- DB 196,98,125,24,5,111,107,2,0 ; vbroadcastss 0x26b6f(%rip),%ymm8 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,125,24,5,67,116,2,0 ; vbroadcastss 0x27443(%rip),%ymm8 # 2d404 <_sk_overlay_sse2_8bit+0xeac>
DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0
DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5896,7 +5895,7 @@ _sk_apply_vector_mask_hsw LABEL PROC
PUBLIC _sk_save_xy_hsw
_sk_save_xy_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,175,105,2,0 ; vbroadcastss 0x269af(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,131,114,2,0 ; vbroadcastss 0x27283(%rip),%ymm8 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -5926,9 +5925,9 @@ _sk_accumulate_hsw LABEL PROC
PUBLIC _sk_bilinear_nx_hsw
_sk_bilinear_nx_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,159,106,2,0 ; vbroadcastss 0x26a9f(%rip),%ymm0 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,5,115,115,2,0 ; vbroadcastss 0x27373(%rip),%ymm0 # 2d408 <_sk_overlay_sse2_8bit+0xeb0>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,54,105,2,0 ; vbroadcastss 0x26936(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,10,114,2,0 ; vbroadcastss 0x2720a(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5937,7 +5936,7 @@ _sk_bilinear_nx_hsw LABEL PROC
PUBLIC _sk_bilinear_px_hsw
_sk_bilinear_px_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,22,105,2,0 ; vbroadcastss 0x26916(%rip),%ymm0 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,226,125,24,5,234,113,2,0 ; vbroadcastss 0x271ea(%rip),%ymm0 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5947,9 +5946,9 @@ _sk_bilinear_px_hsw LABEL PROC
PUBLIC _sk_bilinear_ny_hsw
_sk_bilinear_ny_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,86,106,2,0 ; vbroadcastss 0x26a56(%rip),%ymm1 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,13,42,115,2,0 ; vbroadcastss 0x2732a(%rip),%ymm1 # 2d408 <_sk_overlay_sse2_8bit+0xeb0>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,236,104,2,0 ; vbroadcastss 0x268ec(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,192,113,2,0 ; vbroadcastss 0x271c0(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5958,7 +5957,7 @@ _sk_bilinear_ny_hsw LABEL PROC
PUBLIC _sk_bilinear_py_hsw
_sk_bilinear_py_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,204,104,2,0 ; vbroadcastss 0x268cc(%rip),%ymm1 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,226,125,24,13,160,113,2,0 ; vbroadcastss 0x271a0(%rip),%ymm1 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5968,13 +5967,13 @@ _sk_bilinear_py_hsw LABEL PROC
PUBLIC _sk_bicubic_n3x_hsw
_sk_bicubic_n3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,15,106,2,0 ; vbroadcastss 0x26a0f(%rip),%ymm0 # 2cb3c <_sk_overlay_sse2_8bit+0x5d0>
+ DB 196,226,125,24,5,227,114,2,0 ; vbroadcastss 0x272e3(%rip),%ymm0 # 2d40c <_sk_overlay_sse2_8bit+0xeb4>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,162,104,2,0 ; vbroadcastss 0x268a2(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,118,113,2,0 ; vbroadcastss 0x27176(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,255,104,2,0 ; vbroadcastss 0x268ff(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
- DB 196,98,125,24,29,234,105,2,0 ; vbroadcastss 0x269ea(%rip),%ymm11 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,211,113,2,0 ; vbroadcastss 0x271d3(%rip),%ymm10 # 2d31c <_sk_overlay_sse2_8bit+0xdc4>
+ DB 196,98,125,24,29,190,114,2,0 ; vbroadcastss 0x272be(%rip),%ymm11 # 2d410 <_sk_overlay_sse2_8bit+0xeb8>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5984,16 +5983,16 @@ _sk_bicubic_n3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n1x_hsw
_sk_bicubic_n1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,193,105,2,0 ; vbroadcastss 0x269c1(%rip),%ymm0 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,5,149,114,2,0 ; vbroadcastss 0x27295(%rip),%ymm0 # 2d408 <_sk_overlay_sse2_8bit+0xeb0>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,88,104,2,0 ; vbroadcastss 0x26858(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,44,113,2,0 ; vbroadcastss 0x2712c(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,178,105,2,0 ; vbroadcastss 0x269b2(%rip),%ymm9 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
- DB 196,98,125,24,21,173,105,2,0 ; vbroadcastss 0x269ad(%rip),%ymm10 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,13,134,114,2,0 ; vbroadcastss 0x27286(%rip),%ymm9 # 2d414 <_sk_overlay_sse2_8bit+0xebc>
+ DB 196,98,125,24,21,129,114,2,0 ; vbroadcastss 0x27281(%rip),%ymm10 # 2d418 <_sk_overlay_sse2_8bit+0xec0>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,47,104,2,0 ; vbroadcastss 0x2682f(%rip),%ymm9 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,13,3,113,2,0 ; vbroadcastss 0x27103(%rip),%ymm9 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,149,105,2,0 ; vbroadcastss 0x26995(%rip),%ymm10 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,21,105,114,2,0 ; vbroadcastss 0x27269(%rip),%ymm10 # 2d41c <_sk_overlay_sse2_8bit+0xec4>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,128,0,0,0 ; vmovups %ymm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -6002,14 +6001,14 @@ _sk_bicubic_n1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p1x_hsw
_sk_bicubic_p1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,5,104,2,0 ; vbroadcastss 0x26805(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,217,112,2,0 ; vbroadcastss 0x270d9(%rip),%ymm8 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,95,105,2,0 ; vbroadcastss 0x2695f(%rip),%ymm10 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
- DB 196,98,125,24,29,90,105,2,0 ; vbroadcastss 0x2695a(%rip),%ymm11 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,21,51,114,2,0 ; vbroadcastss 0x27233(%rip),%ymm10 # 2d414 <_sk_overlay_sse2_8bit+0xebc>
+ DB 196,98,125,24,29,46,114,2,0 ; vbroadcastss 0x2722e(%rip),%ymm11 # 2d418 <_sk_overlay_sse2_8bit+0xec0>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,75,105,2,0 ; vbroadcastss 0x2694b(%rip),%ymm8 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,5,31,114,2,0 ; vbroadcastss 0x2721f(%rip),%ymm8 # 2d41c <_sk_overlay_sse2_8bit+0xec4>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -6018,12 +6017,12 @@ _sk_bicubic_p1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p3x_hsw
_sk_bicubic_p3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,39,105,2,0 ; vbroadcastss 0x26927(%rip),%ymm0 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,226,125,24,5,251,113,2,0 ; vbroadcastss 0x271fb(%rip),%ymm0 # 2d414 <_sk_overlay_sse2_8bit+0xebc>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,24,104,2,0 ; vbroadcastss 0x26818(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
- DB 196,98,125,24,29,3,105,2,0 ; vbroadcastss 0x26903(%rip),%ymm11 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,236,112,2,0 ; vbroadcastss 0x270ec(%rip),%ymm10 # 2d31c <_sk_overlay_sse2_8bit+0xdc4>
+ DB 196,98,125,24,29,215,113,2,0 ; vbroadcastss 0x271d7(%rip),%ymm11 # 2d410 <_sk_overlay_sse2_8bit+0xeb8>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -6033,13 +6032,13 @@ _sk_bicubic_p3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n3y_hsw
_sk_bicubic_n3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,222,104,2,0 ; vbroadcastss 0x268de(%rip),%ymm1 # 2cb3c <_sk_overlay_sse2_8bit+0x5d0>
+ DB 196,226,125,24,13,178,113,2,0 ; vbroadcastss 0x271b2(%rip),%ymm1 # 2d40c <_sk_overlay_sse2_8bit+0xeb4>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,112,103,2,0 ; vbroadcastss 0x26770(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,68,112,2,0 ; vbroadcastss 0x27044(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,205,103,2,0 ; vbroadcastss 0x267cd(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
- DB 196,98,125,24,29,184,104,2,0 ; vbroadcastss 0x268b8(%rip),%ymm11 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,161,112,2,0 ; vbroadcastss 0x270a1(%rip),%ymm10 # 2d31c <_sk_overlay_sse2_8bit+0xdc4>
+ DB 196,98,125,24,29,140,113,2,0 ; vbroadcastss 0x2718c(%rip),%ymm11 # 2d410 <_sk_overlay_sse2_8bit+0xeb8>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -6049,16 +6048,16 @@ _sk_bicubic_n3y_hsw LABEL PROC
PUBLIC _sk_bicubic_n1y_hsw
_sk_bicubic_n1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,143,104,2,0 ; vbroadcastss 0x2688f(%rip),%ymm1 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,13,99,113,2,0 ; vbroadcastss 0x27163(%rip),%ymm1 # 2d408 <_sk_overlay_sse2_8bit+0xeb0>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,37,103,2,0 ; vbroadcastss 0x26725(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,249,111,2,0 ; vbroadcastss 0x26ff9(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,127,104,2,0 ; vbroadcastss 0x2687f(%rip),%ymm9 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
- DB 196,98,125,24,21,122,104,2,0 ; vbroadcastss 0x2687a(%rip),%ymm10 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,13,83,113,2,0 ; vbroadcastss 0x27153(%rip),%ymm9 # 2d414 <_sk_overlay_sse2_8bit+0xebc>
+ DB 196,98,125,24,21,78,113,2,0 ; vbroadcastss 0x2714e(%rip),%ymm10 # 2d418 <_sk_overlay_sse2_8bit+0xec0>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,252,102,2,0 ; vbroadcastss 0x266fc(%rip),%ymm9 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,13,208,111,2,0 ; vbroadcastss 0x26fd0(%rip),%ymm9 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,98,104,2,0 ; vbroadcastss 0x26862(%rip),%ymm10 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,21,54,113,2,0 ; vbroadcastss 0x27136(%rip),%ymm10 # 2d41c <_sk_overlay_sse2_8bit+0xec4>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,160,0,0,0 ; vmovups %ymm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -6067,14 +6066,14 @@ _sk_bicubic_n1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p1y_hsw
_sk_bicubic_p1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,210,102,2,0 ; vbroadcastss 0x266d2(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,166,111,2,0 ; vbroadcastss 0x26fa6(%rip),%ymm8 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,43,104,2,0 ; vbroadcastss 0x2682b(%rip),%ymm10 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
- DB 196,98,125,24,29,38,104,2,0 ; vbroadcastss 0x26826(%rip),%ymm11 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,21,255,112,2,0 ; vbroadcastss 0x270ff(%rip),%ymm10 # 2d414 <_sk_overlay_sse2_8bit+0xebc>
+ DB 196,98,125,24,29,250,112,2,0 ; vbroadcastss 0x270fa(%rip),%ymm11 # 2d418 <_sk_overlay_sse2_8bit+0xec0>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,23,104,2,0 ; vbroadcastss 0x26817(%rip),%ymm8 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,5,235,112,2,0 ; vbroadcastss 0x270eb(%rip),%ymm8 # 2d41c <_sk_overlay_sse2_8bit+0xec4>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -6083,12 +6082,12 @@ _sk_bicubic_p1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p3y_hsw
_sk_bicubic_p3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,243,103,2,0 ; vbroadcastss 0x267f3(%rip),%ymm1 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,226,125,24,13,199,112,2,0 ; vbroadcastss 0x270c7(%rip),%ymm1 # 2d414 <_sk_overlay_sse2_8bit+0xebc>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,227,102,2,0 ; vbroadcastss 0x266e3(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
- DB 196,98,125,24,29,206,103,2,0 ; vbroadcastss 0x267ce(%rip),%ymm11 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,183,111,2,0 ; vbroadcastss 0x26fb7(%rip),%ymm10 # 2d31c <_sk_overlay_sse2_8bit+0xdc4>
+ DB 196,98,125,24,29,162,112,2,0 ; vbroadcastss 0x270a2(%rip),%ymm11 # 2d410 <_sk_overlay_sse2_8bit+0xeb8>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -6214,19 +6213,19 @@ _sk_clut_3D_hsw LABEL PROC
DB 197,254,127,76,36,32 ; vmovdqu %ymm1,0x20(%rsp)
DB 72,139,0 ; mov (%rax),%rax
DB 196,193,117,254,204 ; vpaddd %ymm12,%ymm1,%ymm1
- DB 196,226,125,88,61,172,101,2,0 ; vpbroadcastd 0x265ac(%rip),%ymm7 # 2cb54 <_sk_overlay_sse2_8bit+0x5e8>
+ DB 196,226,125,88,61,128,110,2,0 ; vpbroadcastd 0x26e80(%rip),%ymm7 # 2d424 <_sk_overlay_sse2_8bit+0xecc>
DB 196,226,117,64,207 ; vpmulld %ymm7,%ymm1,%ymm1
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
DB 196,98,77,146,4,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8
- DB 196,98,125,88,21,32,100,2,0 ; vpbroadcastd 0x26420(%rip),%ymm10 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,98,125,88,21,244,108,2,0 ; vpbroadcastd 0x26cf4(%rip),%ymm10 # 2d2b0 <_sk_overlay_sse2_8bit+0xd58>
DB 196,193,117,254,242 ; vpaddd %ymm10,%ymm1,%ymm6
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
DB 196,226,37,146,28,176 ; vgatherdps %ymm11,(%rax,%ymm6,4),%ymm3
- DB 196,98,125,88,29,15,100,2,0 ; vpbroadcastd 0x2640f(%rip),%ymm11 # 2c9e8 <_sk_overlay_sse2_8bit+0x47c>
+ DB 196,98,125,88,29,227,108,2,0 ; vpbroadcastd 0x26ce3(%rip),%ymm11 # 2d2b8 <_sk_overlay_sse2_8bit+0xd60>
DB 196,193,117,254,203 ; vpaddd %ymm11,%ymm1,%ymm1
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
DB 196,226,77,146,36,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm4
- DB 196,98,125,24,45,95,101,2,0 ; vbroadcastss 0x2655f(%rip),%ymm13 # 2cb50 <_sk_overlay_sse2_8bit+0x5e4>
+ DB 196,98,125,24,45,51,110,2,0 ; vbroadcastss 0x26e33(%rip),%ymm13 # 2d420 <_sk_overlay_sse2_8bit+0xec8>
DB 196,193,124,88,245 ; vaddps %ymm13,%ymm0,%ymm6
DB 197,254,91,246 ; vcvttps2dq %ymm6,%ymm6
DB 196,226,77,64,205 ; vpmulld %ymm5,%ymm6,%ymm1
@@ -6444,19 +6443,19 @@ _sk_clut_4D_hsw LABEL PROC
DB 197,126,91,245 ; vcvttps2dq %ymm5,%ymm14
DB 196,98,13,64,233 ; vpmulld %ymm1,%ymm14,%ymm13
DB 197,149,254,198 ; vpaddd %ymm6,%ymm13,%ymm0
- DB 196,98,125,88,21,216,96,2,0 ; vpbroadcastd 0x260d8(%rip),%ymm10 # 2cb54 <_sk_overlay_sse2_8bit+0x5e8>
+ DB 196,98,125,88,21,172,105,2,0 ; vpbroadcastd 0x269ac(%rip),%ymm10 # 2d424 <_sk_overlay_sse2_8bit+0xecc>
DB 196,194,125,64,194 ; vpmulld %ymm10,%ymm0,%ymm0
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 196,98,61,146,60,128 ; vgatherdps %ymm8,(%rax,%ymm0,4),%ymm15
- DB 196,98,125,88,29,75,95,2,0 ; vpbroadcastd 0x25f4b(%rip),%ymm11 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,98,125,88,29,31,104,2,0 ; vpbroadcastd 0x2681f(%rip),%ymm11 # 2d2b0 <_sk_overlay_sse2_8bit+0xd58>
DB 196,65,125,254,195 ; vpaddd %ymm11,%ymm0,%ymm8
DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
DB 196,162,53,146,20,128 ; vgatherdps %ymm9,(%rax,%ymm8,4),%ymm2
- DB 196,98,125,88,37,58,95,2,0 ; vpbroadcastd 0x25f3a(%rip),%ymm12 # 2c9e8 <_sk_overlay_sse2_8bit+0x47c>
+ DB 196,98,125,88,37,14,104,2,0 ; vpbroadcastd 0x2680e(%rip),%ymm12 # 2d2b8 <_sk_overlay_sse2_8bit+0xd60>
DB 196,193,125,254,196 ; vpaddd %ymm12,%ymm0,%ymm0
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 196,226,61,146,60,128 ; vgatherdps %ymm8,(%rax,%ymm0,4),%ymm7
- DB 196,98,125,24,13,137,96,2,0 ; vbroadcastss 0x26089(%rip),%ymm9 # 2cb50 <_sk_overlay_sse2_8bit+0x5e4>
+ DB 196,98,125,24,13,93,105,2,0 ; vbroadcastss 0x2695d(%rip),%ymm9 # 2d420 <_sk_overlay_sse2_8bit+0xec8>
DB 196,65,84,88,193 ; vaddps %ymm9,%ymm5,%ymm8
DB 196,65,126,91,192 ; vcvttps2dq %ymm8,%ymm8
DB 196,226,61,64,193 ; vpmulld %ymm1,%ymm8,%ymm0
@@ -6781,7 +6780,7 @@ _sk_clut_4D_hsw LABEL PROC
DB 197,196,92,214 ; vsubps %ymm6,%ymm7,%ymm2
DB 196,226,61,168,214 ; vfmadd213ps %ymm6,%ymm8,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,24,88,2,0 ; vbroadcastss 0x25818(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,236,96,2,0 ; vbroadcastss 0x260ec(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,16,164,36,160,3,0,0 ; vmovups 0x3a0(%rsp),%ymm4
DB 197,252,16,172,36,192,3,0,0 ; vmovups 0x3c0(%rsp),%ymm5
DB 197,252,16,180,36,224,3,0,0 ; vmovups 0x3e0(%rsp),%ymm6
@@ -6823,13 +6822,13 @@ _sk_start_pipeline_avx LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,101 ; jae 72d8 <_sk_start_pipeline_avx+0xe4>
+ DB 115,101 ; jae 72d4 <_sk_start_pipeline_avx+0xe4>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,8 ; lea 0x8(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
- DB 119,38 ; ja 72bb <_sk_start_pipeline_avx+0xc7>
+ DB 119,38 ; ja 72b7 <_sk_start_pipeline_avx+0xc7>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 49,255 ; xor %edi,%edi
DB 76,137,246 ; mov %r14,%rsi
@@ -6840,16 +6839,16 @@ _sk_start_pipeline_avx LABEL PROC
DB 73,131,196,16 ; add $0x10,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,225 ; jbe 729c <_sk_start_pipeline_avx+0xa8>
+ DB 118,225 ; jbe 7298 <_sk_start_pipeline_avx+0xa8>
DB 76,137,255 ; mov %r15,%rdi
DB 72,41,215 ; sub %rdx,%rdi
- DB 116,9 ; je 72cc <_sk_start_pipeline_avx+0xd8>
+ DB 116,9 ; je 72c8 <_sk_start_pipeline_avx+0xd8>
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,173 ; jne 7285 <_sk_start_pipeline_avx+0x91>
+ DB 117,173 ; jne 7281 <_sk_start_pipeline_avx+0x91>
DB 197,248,40,181,32,255,255,255 ; vmovaps -0xe0(%rbp),%xmm6
DB 197,248,40,189,48,255,255,255 ; vmovaps -0xd0(%rbp),%xmm7
DB 197,120,40,133,64,255,255,255 ; vmovaps -0xc0(%rbp),%xmm8
@@ -6882,16 +6881,15 @@ _sk_seed_shader_avx LABEL PROC
DB 197,249,112,192,0 ; vpshufd $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,136,86,2,0 ; vbroadcastss 0x25688(%rip),%ymm1 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
- DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
- DB 197,252,88,5,100,91,2,0 ; vaddps 0x25b64(%rip),%ymm0,%ymm0 # 2cec0 <_sk_overlay_sse2_8bit+0x954>
- DB 197,249,110,209 ; vmovd %ecx,%xmm2
- DB 197,249,112,210,0 ; vpshufd $0x0,%xmm2,%xmm2
- DB 196,227,109,24,210,1 ; vinsertf128 $0x1,%xmm2,%ymm2,%ymm2
- DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
+ DB 197,252,88,5,213,89,2,0 ; vaddps 0x259d5(%rip),%ymm0,%ymm0 # 2cd20 <_sk_overlay_sse2_8bit+0x7c8>
+ DB 197,249,110,201 ; vmovd %ecx,%xmm1
+ DB 197,249,112,201,0 ; vpshufd $0x0,%xmm1,%xmm1
+ DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
+ DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
+ DB 196,226,125,24,21,65,95,2,0 ; vbroadcastss 0x25f41(%rip),%ymm2 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
+ DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,94,86,2,0 ; vbroadcastss 0x2565e(%rip),%ymm2 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,21,54,95,2,0 ; vbroadcastss 0x25f36(%rip),%ymm2 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -6904,14 +6902,14 @@ _sk_dither_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,121,110,194 ; vmovd %edx,%xmm8
DB 196,65,121,112,192,0 ; vpshufd $0x0,%xmm8,%xmm8
- DB 197,57,254,13,216,96,2,0 ; vpaddd 0x260d8(%rip),%xmm8,%xmm9 # 2d480 <_sk_overlay_sse2_8bit+0xf14>
- DB 197,57,254,5,224,96,2,0 ; vpaddd 0x260e0(%rip),%xmm8,%xmm8 # 2d490 <_sk_overlay_sse2_8bit+0xf24>
+ DB 197,57,254,13,224,96,2,0 ; vpaddd 0x260e0(%rip),%xmm8,%xmm9 # 2d480 <_sk_overlay_sse2_8bit+0xf28>
+ DB 197,57,254,5,232,96,2,0 ; vpaddd 0x260e8(%rip),%xmm8,%xmm8 # 2d490 <_sk_overlay_sse2_8bit+0xf38>
DB 196,67,53,24,192,1 ; vinsertf128 $0x1,%xmm8,%ymm9,%ymm8
DB 197,121,110,201 ; vmovd %ecx,%xmm9
DB 196,65,121,112,201,0 ; vpshufd $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 196,65,52,87,208 ; vxorps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,12,86,2,0 ; vbroadcastss 0x2560c(%rip),%ymm11 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,98,125,24,29,228,94,2,0 ; vbroadcastss 0x25ee4(%rip),%ymm11 # 2d2b0 <_sk_overlay_sse2_8bit+0xd58>
DB 196,65,44,84,203 ; vandps %ymm11,%ymm10,%ymm9
DB 196,193,25,114,241,5 ; vpslld $0x5,%xmm9,%xmm12
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
@@ -6922,8 +6920,8 @@ _sk_dither_avx LABEL PROC
DB 196,67,125,25,219,1 ; vextractf128 $0x1,%ymm11,%xmm11
DB 196,193,33,114,243,4 ; vpslld $0x4,%xmm11,%xmm11
DB 196,67,29,24,219,1 ; vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- DB 196,98,125,24,37,205,85,2,0 ; vbroadcastss 0x255cd(%rip),%ymm12 # 2c9e4 <_sk_overlay_sse2_8bit+0x478>
- DB 196,98,125,24,45,200,85,2,0 ; vbroadcastss 0x255c8(%rip),%ymm13 # 2c9e8 <_sk_overlay_sse2_8bit+0x47c>
+ DB 196,98,125,24,37,165,94,2,0 ; vbroadcastss 0x25ea5(%rip),%ymm12 # 2d2b4 <_sk_overlay_sse2_8bit+0xd5c>
+ DB 196,98,125,24,45,160,94,2,0 ; vbroadcastss 0x25ea0(%rip),%ymm13 # 2d2b8 <_sk_overlay_sse2_8bit+0xd60>
DB 196,65,44,84,245 ; vandps %ymm13,%ymm10,%ymm14
DB 196,193,1,114,246,2 ; vpslld $0x2,%xmm14,%xmm15
DB 196,67,125,25,246,1 ; vextractf128 $0x1,%ymm14,%xmm14
@@ -6950,9 +6948,9 @@ _sk_dither_avx LABEL PROC
DB 196,65,60,86,193 ; vorps %ymm9,%ymm8,%ymm8
DB 196,65,60,86,194 ; vorps %ymm10,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,51,85,2,0 ; vbroadcastss 0x25533(%rip),%ymm9 # 2c9ec <_sk_overlay_sse2_8bit+0x480>
+ DB 196,98,125,24,13,11,94,2,0 ; vbroadcastss 0x25e0b(%rip),%ymm9 # 2d2bc <_sk_overlay_sse2_8bit+0xd64>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,41,85,2,0 ; vbroadcastss 0x25529(%rip),%ymm9 # 2c9f0 <_sk_overlay_sse2_8bit+0x484>
+ DB 196,98,125,24,13,1,94,2,0 ; vbroadcastss 0x25e01(%rip),%ymm9 # 2d2c0 <_sk_overlay_sse2_8bit+0xd68>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 196,98,125,24,8 ; vbroadcastss (%rax),%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
@@ -6982,7 +6980,7 @@ _sk_uniform_color_avx LABEL PROC
PUBLIC _sk_black_color_avx
_sk_black_color_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,177,84,2,0 ; vbroadcastss 0x254b1(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,137,93,2,0 ; vbroadcastss 0x25d89(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
@@ -6991,7 +6989,7 @@ _sk_black_color_avx LABEL PROC
PUBLIC _sk_white_color_avx
_sk_white_color_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,152,84,2,0 ; vbroadcastss 0x25498(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,112,93,2,0 ; vbroadcastss 0x25d70(%rip),%ymm0 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
@@ -7029,7 +7027,7 @@ _sk_clear_avx LABEL PROC
PUBLIC _sk_srcatop_avx
_sk_srcatop_avx LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,55,84,2,0 ; vbroadcastss 0x25437(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,15,93,2,0 ; vbroadcastss 0x25d0f(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -7048,7 +7046,7 @@ _sk_srcatop_avx LABEL PROC
PUBLIC _sk_dstatop_avx
_sk_dstatop_avx LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
- DB 196,98,125,24,13,245,83,2,0 ; vbroadcastss 0x253f5(%rip),%ymm9 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,13,205,92,2,0 ; vbroadcastss 0x25ccd(%rip),%ymm9 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,52,92,207 ; vsubps %ymm7,%ymm9,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0
@@ -7084,7 +7082,7 @@ _sk_dstin_avx LABEL PROC
PUBLIC _sk_srcout_avx
_sk_srcout_avx LABEL PROC
- DB 196,98,125,24,5,144,83,2,0 ; vbroadcastss 0x25390(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,104,92,2,0 ; vbroadcastss 0x25c68(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -7095,7 +7093,7 @@ _sk_srcout_avx LABEL PROC
PUBLIC _sk_dstout_avx
_sk_dstout_avx LABEL PROC
- DB 196,226,125,24,5,111,83,2,0 ; vbroadcastss 0x2536f(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,71,92,2,0 ; vbroadcastss 0x25c47(%rip),%ymm0 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -7106,7 +7104,7 @@ _sk_dstout_avx LABEL PROC
PUBLIC _sk_srcover_avx
_sk_srcover_avx LABEL PROC
- DB 196,98,125,24,5,78,83,2,0 ; vbroadcastss 0x2534e(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,38,92,2,0 ; vbroadcastss 0x25c26(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -7121,7 +7119,7 @@ _sk_srcover_avx LABEL PROC
PUBLIC _sk_dstover_avx
_sk_dstover_avx LABEL PROC
- DB 196,98,125,24,5,29,83,2,0 ; vbroadcastss 0x2531d(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,245,91,2,0 ; vbroadcastss 0x25bf5(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
@@ -7145,7 +7143,7 @@ _sk_modulate_avx LABEL PROC
PUBLIC _sk_multiply_avx
_sk_multiply_avx LABEL PROC
- DB 196,98,125,24,5,216,82,2,0 ; vbroadcastss 0x252d8(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,176,91,2,0 ; vbroadcastss 0x25bb0(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7174,7 +7172,7 @@ _sk_multiply_avx LABEL PROC
PUBLIC _sk_plus__avx
_sk_plus__avx LABEL PROC
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
- DB 196,98,125,24,5,103,82,2,0 ; vbroadcastss 0x25267(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,63,91,2,0 ; vbroadcastss 0x25b3f(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 197,244,88,205 ; vaddps %ymm5,%ymm1,%ymm1
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
@@ -7204,7 +7202,7 @@ _sk_screen_avx LABEL PROC
PUBLIC _sk_xor__avx
_sk_xor__avx LABEL PROC
- DB 196,98,125,24,5,6,82,2,0 ; vbroadcastss 0x25206(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,222,90,2,0 ; vbroadcastss 0x25ade(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7239,7 +7237,7 @@ _sk_darken_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,130,81,2,0 ; vbroadcastss 0x25182(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,90,90,2,0 ; vbroadcastss 0x25a5a(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7263,7 +7261,7 @@ _sk_lighten_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,42,81,2,0 ; vbroadcastss 0x2512a(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,2,90,2,0 ; vbroadcastss 0x25a02(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7290,7 +7288,7 @@ _sk_difference_avx LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,198,80,2,0 ; vbroadcastss 0x250c6(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,158,89,2,0 ; vbroadcastss 0x2599e(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7311,7 +7309,7 @@ _sk_exclusion_avx LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,125,80,2,0 ; vbroadcastss 0x2507d(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,85,89,2,0 ; vbroadcastss 0x25955(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7320,7 +7318,7 @@ _sk_exclusion_avx LABEL PROC
PUBLIC _sk_colorburn_avx
_sk_colorburn_avx LABEL PROC
- DB 196,98,125,24,5,100,80,2,0 ; vbroadcastss 0x25064(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,60,89,2,0 ; vbroadcastss 0x2593c(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -7380,7 +7378,7 @@ _sk_colorburn_avx LABEL PROC
PUBLIC _sk_colordodge_avx
_sk_colordodge_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,104,79,2,0 ; vbroadcastss 0x24f68(%rip),%ymm9 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,13,64,88,2,0 ; vbroadcastss 0x25840(%rip),%ymm9 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -7435,7 +7433,7 @@ _sk_colordodge_avx LABEL PROC
PUBLIC _sk_hardlight_avx
_sk_hardlight_avx LABEL PROC
- DB 196,98,125,24,5,115,78,2,0 ; vbroadcastss 0x24e73(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,75,87,2,0 ; vbroadcastss 0x2574b(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7488,7 +7486,7 @@ _sk_hardlight_avx LABEL PROC
PUBLIC _sk_overlay_avx
_sk_overlay_avx LABEL PROC
- DB 196,98,125,24,5,152,77,2,0 ; vbroadcastss 0x24d98(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,112,86,2,0 ; vbroadcastss 0x25670(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7553,10 +7551,10 @@ _sk_softlight_avx LABEL PROC
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,65,60,89,216 ; vmulps %ymm8,%ymm8,%ymm11
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,29,155,76,2,0 ; vbroadcastss 0x24c9b(%rip),%ymm11 # 2c9f4 <_sk_overlay_sse2_8bit+0x488>
+ DB 196,98,125,24,29,115,85,2,0 ; vbroadcastss 0x25573(%rip),%ymm11 # 2d2c4 <_sk_overlay_sse2_8bit+0xd6c>
DB 196,65,28,88,235 ; vaddps %ymm11,%ymm12,%ymm13
DB 196,65,20,89,192 ; vmulps %ymm8,%ymm13,%ymm8
- DB 196,98,125,24,45,140,76,2,0 ; vbroadcastss 0x24c8c(%rip),%ymm13 # 2c9f8 <_sk_overlay_sse2_8bit+0x48c>
+ DB 196,98,125,24,45,100,85,2,0 ; vbroadcastss 0x25564(%rip),%ymm13 # 2d2c8 <_sk_overlay_sse2_8bit+0xd70>
DB 196,65,28,89,245 ; vmulps %ymm13,%ymm12,%ymm14
DB 196,65,12,88,192 ; vaddps %ymm8,%ymm14,%ymm8
DB 196,65,124,82,244 ; vrsqrtps %ymm12,%ymm14
@@ -7567,7 +7565,7 @@ _sk_softlight_avx LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,54,76,2,0 ; vbroadcastss 0x24c36(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,14,85,2,0 ; vbroadcastss 0x2550e(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,65,60,92,228 ; vsubps %ymm12,%ymm8,%ymm12
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
@@ -7694,12 +7692,12 @@ _sk_hue_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,20,74,2,0 ; vbroadcastss 0x24a14(%rip),%ymm14 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,53,236,82,2,0 ; vbroadcastss 0x252ec(%rip),%ymm14 # 2d2cc <_sk_overlay_sse2_8bit+0xd74>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,10,74,2,0 ; vbroadcastss 0x24a0a(%rip),%ymm15 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,61,226,82,2,0 ; vbroadcastss 0x252e2(%rip),%ymm15 # 2d2d0 <_sk_overlay_sse2_8bit+0xd78>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,251,73,2,0 ; vbroadcastss 0x249fb(%rip),%ymm0 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,226,125,24,5,211,82,2,0 ; vbroadcastss 0x252d3(%rip),%ymm0 # 2d2d4 <_sk_overlay_sse2_8bit+0xd7c>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -7760,7 +7758,7 @@ _sk_hue_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,168,72,2,0 ; vbroadcastss 0x248a8(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,128,81,2,0 ; vbroadcastss 0x25180(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7817,12 +7815,12 @@ _sk_saturation_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,204,71,2,0 ; vbroadcastss 0x247cc(%rip),%ymm14 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,53,164,80,2,0 ; vbroadcastss 0x250a4(%rip),%ymm14 # 2d2cc <_sk_overlay_sse2_8bit+0xd74>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,194,71,2,0 ; vbroadcastss 0x247c2(%rip),%ymm15 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,61,154,80,2,0 ; vbroadcastss 0x2509a(%rip),%ymm15 # 2d2d0 <_sk_overlay_sse2_8bit+0xd78>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,179,71,2,0 ; vbroadcastss 0x247b3(%rip),%ymm0 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,226,125,24,5,139,80,2,0 ; vbroadcastss 0x2508b(%rip),%ymm0 # 2d2d4 <_sk_overlay_sse2_8bit+0xd7c>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -7883,7 +7881,7 @@ _sk_saturation_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,96,70,2,0 ; vbroadcastss 0x24660(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,56,79,2,0 ; vbroadcastss 0x24f38(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7912,12 +7910,12 @@ _sk_color_avx LABEL PROC
DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp)
DB 197,124,89,199 ; vmulps %ymm7,%ymm0,%ymm8
DB 197,116,89,207 ; vmulps %ymm7,%ymm1,%ymm9
- DB 196,98,125,24,45,12,70,2,0 ; vbroadcastss 0x2460c(%rip),%ymm13 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,45,228,78,2,0 ; vbroadcastss 0x24ee4(%rip),%ymm13 # 2d2cc <_sk_overlay_sse2_8bit+0xd74>
DB 196,65,92,89,213 ; vmulps %ymm13,%ymm4,%ymm10
- DB 196,98,125,24,53,2,70,2,0 ; vbroadcastss 0x24602(%rip),%ymm14 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,53,218,78,2,0 ; vbroadcastss 0x24eda(%rip),%ymm14 # 2d2d0 <_sk_overlay_sse2_8bit+0xd78>
DB 196,65,84,89,222 ; vmulps %ymm14,%ymm5,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,243,69,2,0 ; vbroadcastss 0x245f3(%rip),%ymm15 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,98,125,24,61,203,78,2,0 ; vbroadcastss 0x24ecb(%rip),%ymm15 # 2d2d4 <_sk_overlay_sse2_8bit+0xd7c>
DB 196,65,76,89,223 ; vmulps %ymm15,%ymm6,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -7980,7 +7978,7 @@ _sk_color_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,142,68,2,0 ; vbroadcastss 0x2448e(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,102,77,2,0 ; vbroadcastss 0x24d66(%rip),%ymm0 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -8010,12 +8008,12 @@ _sk_luminosity_avx LABEL PROC
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,205 ; vmulps %ymm5,%ymm3,%ymm9
- DB 196,98,125,24,45,54,68,2,0 ; vbroadcastss 0x24436(%rip),%ymm13 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,45,14,77,2,0 ; vbroadcastss 0x24d0e(%rip),%ymm13 # 2d2cc <_sk_overlay_sse2_8bit+0xd74>
DB 196,65,108,89,213 ; vmulps %ymm13,%ymm2,%ymm10
- DB 196,98,125,24,53,44,68,2,0 ; vbroadcastss 0x2442c(%rip),%ymm14 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,53,4,77,2,0 ; vbroadcastss 0x24d04(%rip),%ymm14 # 2d2d0 <_sk_overlay_sse2_8bit+0xd78>
DB 196,65,116,89,222 ; vmulps %ymm14,%ymm1,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,29,68,2,0 ; vbroadcastss 0x2441d(%rip),%ymm15 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,98,125,24,61,245,76,2,0 ; vbroadcastss 0x24cf5(%rip),%ymm15 # 2d2d4 <_sk_overlay_sse2_8bit+0xd7c>
DB 196,65,28,89,223 ; vmulps %ymm15,%ymm12,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -8078,7 +8076,7 @@ _sk_luminosity_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,184,66,2,0 ; vbroadcastss 0x242b8(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,144,75,2,0 ; vbroadcastss 0x24b90(%rip),%ymm0 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -8109,9 +8107,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,42,1,0,0 ; jne 88bc <_sk_srcover_rgba_8888_avx+0x14a>
+ DB 15,133,42,1,0,0 ; jne 88b4 <_sk_srcover_rgba_8888_avx+0x14a>
DB 196,1,125,16,4,152 ; vmovupd (%r8,%r11,4),%ymm8
- DB 197,125,40,13,64,71,2,0 ; vmovapd 0x24740(%rip),%ymm9 # 2cee0 <_sk_overlay_sse2_8bit+0x974>
+ DB 197,125,40,13,168,69,2,0 ; vmovapd 0x245a8(%rip),%ymm9 # 2cd40 <_sk_overlay_sse2_8bit+0x7e8>
DB 196,193,61,84,225 ; vandpd %ymm9,%ymm8,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,81,114,208,8 ; vpsrld $0x8,%xmm8,%xmm5
@@ -8129,9 +8127,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 197,193,114,215,24 ; vpsrld $0x18,%xmm7,%xmm7
DB 196,227,61,24,255,1 ; vinsertf128 $0x1,%xmm7,%ymm8,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,219,65,2,0 ; vbroadcastss 0x241db(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,179,74,2,0 ; vbroadcastss 0x24ab3(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,250,65,2,0 ; vbroadcastss 0x241fa(%rip),%ymm9 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,13,210,74,2,0 ; vbroadcastss 0x24ad2(%rip),%ymm9 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,60,89,212 ; vmulps %ymm4,%ymm8,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
@@ -8164,7 +8162,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,65,53,86,202 ; vorpd %ymm10,%ymm9,%ymm9
DB 196,65,61,86,193 ; vorpd %ymm9,%ymm8,%ymm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,66 ; jne 88f4 <_sk_srcover_rgba_8888_avx+0x182>
+ DB 117,66 ; jne 88ec <_sk_srcover_rgba_8888_avx+0x182>
DB 196,1,124,17,4,152 ; vmovups %ymm8,(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8173,33 +8171,33 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,195,254,255,255 ; ja 8798 <_sk_srcover_rgba_8888_avx+0x26>
+ DB 15,135,195,254,255,255 ; ja 8790 <_sk_srcover_rgba_8888_avx+0x26>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,4,1,0,0 ; lea 0x104(%rip),%r10 # 89e4 <_sk_srcover_rgba_8888_avx+0x272>
+ DB 76,141,21,4,1,0,0 ; lea 0x104(%rip),%r10 # 89dc <_sk_srcover_rgba_8888_avx+0x272>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,1,122,16,4,152 ; vmovss (%r8,%r11,4),%xmm8
- DB 233,164,254,255,255 ; jmpq 8798 <_sk_srcover_rgba_8888_avx+0x26>
+ DB 233,164,254,255,255 ; jmpq 8790 <_sk_srcover_rgba_8888_avx+0x26>
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,180 ; ja 88b8 <_sk_srcover_rgba_8888_avx+0x146>
+ DB 119,180 ; ja 88b0 <_sk_srcover_rgba_8888_avx+0x146>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 76,141,13,241,0,0,0 ; lea 0xf1(%rip),%r9 # 8a00 <_sk_srcover_rgba_8888_avx+0x28e>
+ DB 76,141,13,241,0,0,0 ; lea 0xf1(%rip),%r9 # 89f8 <_sk_srcover_rgba_8888_avx+0x28e>
DB 73,99,4,129 ; movslq (%r9,%rax,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
DB 196,1,121,126,4,152 ; vmovd %xmm8,(%r8,%r11,4)
- DB 235,152 ; jmp 88b8 <_sk_srcover_rgba_8888_avx+0x146>
+ DB 235,152 ; jmp 88b0 <_sk_srcover_rgba_8888_avx+0x146>
DB 196,129,121,110,100,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
DB 196,99,85,12,196,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm8
DB 196,129,123,16,36,152 ; vmovsd (%r8,%r11,4),%xmm4
DB 196,99,61,13,196,1 ; vblendpd $0x1,%ymm4,%ymm8,%ymm8
- DB 233,81,254,255,255 ; jmpq 8798 <_sk_srcover_rgba_8888_avx+0x26>
+ DB 233,81,254,255,255 ; jmpq 8790 <_sk_srcover_rgba_8888_avx+0x26>
DB 196,129,121,110,100,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -8213,10 +8211,10 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,99,61,24,196,1 ; vinsertf128 $0x1,%xmm4,%ymm8,%ymm8
DB 196,129,121,16,36,152 ; vmovupd (%r8,%r11,4),%xmm4
DB 196,67,93,13,192,12 ; vblendpd $0xc,%ymm8,%ymm4,%ymm8
- DB 233,252,253,255,255 ; jmpq 8798 <_sk_srcover_rgba_8888_avx+0x26>
+ DB 233,252,253,255,255 ; jmpq 8790 <_sk_srcover_rgba_8888_avx+0x26>
DB 196,3,121,22,68,152,8,2 ; vpextrd $0x2,%xmm8,0x8(%r8,%r11,4)
DB 196,1,121,214,4,152 ; vmovq %xmm8,(%r8,%r11,4)
- DB 233,9,255,255,255 ; jmpq 88b8 <_sk_srcover_rgba_8888_avx+0x146>
+ DB 233,9,255,255,255 ; jmpq 88b0 <_sk_srcover_rgba_8888_avx+0x146>
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,3,121,22,76,152,24,2 ; vpextrd $0x2,%xmm9,0x18(%r8,%r11,4)
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -8224,7 +8222,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,1,122,17,76,152,16 ; vmovss %xmm9,0x10(%r8,%r11,4)
DB 196,1,121,17,4,152 ; vmovupd %xmm8,(%r8,%r11,4)
- DB 233,213,254,255,255 ; jmpq 88b8 <_sk_srcover_rgba_8888_avx+0x146>
+ DB 233,213,254,255,255 ; jmpq 88b0 <_sk_srcover_rgba_8888_avx+0x146>
DB 144 ; nop
DB 5,255,255,255,82 ; add $0x52ffffff,%eax
DB 255 ; (bad)
@@ -8236,7 +8234,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,255 ; jg 89f9 <_sk_srcover_rgba_8888_avx+0x287>
+ DB 127,255 ; jg 89f1 <_sk_srcover_rgba_8888_avx+0x287>
DB 255 ; (bad)
DB 255,99,255 ; jmpq *-0x1(%rbx)
DB 255 ; (bad)
@@ -8269,7 +8267,7 @@ _sk_clamp_0_avx LABEL PROC
PUBLIC _sk_clamp_1_avx
_sk_clamp_1_avx LABEL PROC
- DB 196,98,125,24,5,154,63,2,0 ; vbroadcastss 0x23f9a(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,114,72,2,0 ; vbroadcastss 0x24872(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -8279,7 +8277,7 @@ _sk_clamp_1_avx LABEL PROC
PUBLIC _sk_clamp_a_avx
_sk_clamp_a_avx LABEL PROC
- DB 196,98,125,24,5,121,63,2,0 ; vbroadcastss 0x23f79(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,81,72,2,0 ; vbroadcastss 0x24851(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -8289,7 +8287,7 @@ _sk_clamp_a_avx LABEL PROC
PUBLIC _sk_clamp_a_dst_avx
_sk_clamp_a_dst_avx LABEL PROC
- DB 196,98,125,24,5,91,63,2,0 ; vbroadcastss 0x23f5b(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,51,72,2,0 ; vbroadcastss 0x24833(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7
DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4
DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5
@@ -8316,7 +8314,7 @@ _sk_swap_rb_avx LABEL PROC
PUBLIC _sk_invert_avx
_sk_invert_avx LABEL PROC
- DB 196,98,125,24,5,22,63,2,0 ; vbroadcastss 0x23f16(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,238,71,2,0 ; vbroadcastss 0x247ee(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0
DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
@@ -8362,7 +8360,7 @@ PUBLIC _sk_unpremul_avx
_sk_unpremul_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,166,62,2,0 ; vbroadcastss 0x23ea6(%rip),%ymm10 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,21,126,71,2,0 ; vbroadcastss 0x2477e(%rip),%ymm10 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -8373,17 +8371,17 @@ _sk_unpremul_avx LABEL PROC
PUBLIC _sk_from_srgb_avx
_sk_from_srgb_avx LABEL PROC
- DB 196,98,125,24,5,179,62,2,0 ; vbroadcastss 0x23eb3(%rip),%ymm8 # 2ca0c <_sk_overlay_sse2_8bit+0x4a0>
+ DB 196,98,125,24,5,139,71,2,0 ; vbroadcastss 0x2478b(%rip),%ymm8 # 2d2dc <_sk_overlay_sse2_8bit+0xd84>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,145,62,2,0 ; vbroadcastss 0x23e91(%rip),%ymm11 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,29,105,71,2,0 ; vbroadcastss 0x24769(%rip),%ymm11 # 2d2cc <_sk_overlay_sse2_8bit+0xd74>
DB 196,65,124,89,227 ; vmulps %ymm11,%ymm0,%ymm12
- DB 196,98,125,24,45,151,62,2,0 ; vbroadcastss 0x23e97(%rip),%ymm13 # 2ca10 <_sk_overlay_sse2_8bit+0x4a4>
+ DB 196,98,125,24,45,111,71,2,0 ; vbroadcastss 0x2476f(%rip),%ymm13 # 2d2e0 <_sk_overlay_sse2_8bit+0xd88>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,136,62,2,0 ; vbroadcastss 0x23e88(%rip),%ymm12 # 2ca14 <_sk_overlay_sse2_8bit+0x4a8>
+ DB 196,98,125,24,37,96,71,2,0 ; vbroadcastss 0x24760(%rip),%ymm12 # 2d2e4 <_sk_overlay_sse2_8bit+0xd8c>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,126,62,2,0 ; vbroadcastss 0x23e7e(%rip),%ymm14 # 2ca18 <_sk_overlay_sse2_8bit+0x4ac>
+ DB 196,98,125,24,53,86,71,2,0 ; vbroadcastss 0x24756(%rip),%ymm14 # 2d2e8 <_sk_overlay_sse2_8bit+0xd90>
DB 196,193,124,194,198,1 ; vcmpltps %ymm14,%ymm0,%ymm0
DB 196,195,45,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm10,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -8407,17 +8405,17 @@ _sk_from_srgb_avx LABEL PROC
PUBLIC _sk_from_srgb_dst_avx
_sk_from_srgb_dst_avx LABEL PROC
- DB 196,98,125,24,5,7,62,2,0 ; vbroadcastss 0x23e07(%rip),%ymm8 # 2ca0c <_sk_overlay_sse2_8bit+0x4a0>
+ DB 196,98,125,24,5,223,70,2,0 ; vbroadcastss 0x246df(%rip),%ymm8 # 2d2dc <_sk_overlay_sse2_8bit+0xd84>
DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9
DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10
- DB 196,98,125,24,29,229,61,2,0 ; vbroadcastss 0x23de5(%rip),%ymm11 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,29,189,70,2,0 ; vbroadcastss 0x246bd(%rip),%ymm11 # 2d2cc <_sk_overlay_sse2_8bit+0xd74>
DB 196,65,92,89,227 ; vmulps %ymm11,%ymm4,%ymm12
- DB 196,98,125,24,45,235,61,2,0 ; vbroadcastss 0x23deb(%rip),%ymm13 # 2ca10 <_sk_overlay_sse2_8bit+0x4a4>
+ DB 196,98,125,24,45,195,70,2,0 ; vbroadcastss 0x246c3(%rip),%ymm13 # 2d2e0 <_sk_overlay_sse2_8bit+0xd88>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,220,61,2,0 ; vbroadcastss 0x23ddc(%rip),%ymm12 # 2ca14 <_sk_overlay_sse2_8bit+0x4a8>
+ DB 196,98,125,24,37,180,70,2,0 ; vbroadcastss 0x246b4(%rip),%ymm12 # 2d2e4 <_sk_overlay_sse2_8bit+0xd8c>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,210,61,2,0 ; vbroadcastss 0x23dd2(%rip),%ymm14 # 2ca18 <_sk_overlay_sse2_8bit+0x4ac>
+ DB 196,98,125,24,53,170,70,2,0 ; vbroadcastss 0x246aa(%rip),%ymm14 # 2d2e8 <_sk_overlay_sse2_8bit+0xd90>
DB 196,193,92,194,230,1 ; vcmpltps %ymm14,%ymm4,%ymm4
DB 196,195,45,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm10,%ymm4
DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9
@@ -8442,20 +8440,20 @@ _sk_from_srgb_dst_avx LABEL PROC
PUBLIC _sk_to_srgb_avx
_sk_to_srgb_avx LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,103,61,2,0 ; vbroadcastss 0x23d67(%rip),%ymm8 # 2ca1c <_sk_overlay_sse2_8bit+0x4b0>
+ DB 196,98,125,24,5,63,70,2,0 ; vbroadcastss 0x2463f(%rip),%ymm8 # 2d2ec <_sk_overlay_sse2_8bit+0xd94>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,97,61,2,0 ; vbroadcastss 0x23d61(%rip),%ymm11 # 2ca24 <_sk_overlay_sse2_8bit+0x4b8>
+ DB 196,98,125,24,29,57,70,2,0 ; vbroadcastss 0x24639(%rip),%ymm11 # 2d2f4 <_sk_overlay_sse2_8bit+0xd9c>
DB 196,65,52,89,227 ; vmulps %ymm11,%ymm9,%ymm12
- DB 196,98,125,24,45,79,61,2,0 ; vbroadcastss 0x23d4f(%rip),%ymm13 # 2ca20 <_sk_overlay_sse2_8bit+0x4b4>
+ DB 196,98,125,24,45,39,70,2,0 ; vbroadcastss 0x24627(%rip),%ymm13 # 2d2f0 <_sk_overlay_sse2_8bit+0xd98>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,52,89,228 ; vmulps %ymm12,%ymm9,%ymm12
- DB 196,98,125,24,53,68,61,2,0 ; vbroadcastss 0x23d44(%rip),%ymm14 # 2ca28 <_sk_overlay_sse2_8bit+0x4bc>
+ DB 196,98,125,24,53,28,70,2,0 ; vbroadcastss 0x2461c(%rip),%ymm14 # 2d2f8 <_sk_overlay_sse2_8bit+0xda0>
DB 196,65,28,88,230 ; vaddps %ymm14,%ymm12,%ymm12
- DB 196,98,125,24,61,58,61,2,0 ; vbroadcastss 0x23d3a(%rip),%ymm15 # 2ca2c <_sk_overlay_sse2_8bit+0x4c0>
+ DB 196,98,125,24,61,18,70,2,0 ; vbroadcastss 0x24612(%rip),%ymm15 # 2d2fc <_sk_overlay_sse2_8bit+0xda4>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
- DB 196,98,125,24,37,38,61,2,0 ; vbroadcastss 0x23d26(%rip),%ymm12 # 2ca30 <_sk_overlay_sse2_8bit+0x4c4>
+ DB 196,98,125,24,37,254,69,2,0 ; vbroadcastss 0x245fe(%rip),%ymm12 # 2d300 <_sk_overlay_sse2_8bit+0xda8>
DB 196,193,124,194,196,1 ; vcmpltps %ymm12,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -8490,7 +8488,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,116,93,202 ; vminps %ymm2,%ymm1,%ymm9
DB 196,65,124,93,201 ; vminps %ymm9,%ymm0,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,50,60,2,0 ; vbroadcastss 0x23c32(%rip),%ymm11 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,29,10,69,2,0 ; vbroadcastss 0x2450a(%rip),%ymm11 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 196,65,28,89,227 ; vmulps %ymm11,%ymm12,%ymm12
@@ -8500,19 +8498,19 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
DB 196,193,116,89,203 ; vmulps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,95,60,2,0 ; vbroadcastss 0x23c5f(%rip),%ymm11 # 2ca3c <_sk_overlay_sse2_8bit+0x4d0>
+ DB 196,98,125,24,29,55,69,2,0 ; vbroadcastss 0x24537(%rip),%ymm11 # 2d30c <_sk_overlay_sse2_8bit+0xdb4>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,77,60,2,0 ; vbroadcastss 0x23c4d(%rip),%ymm11 # 2ca38 <_sk_overlay_sse2_8bit+0x4cc>
+ DB 196,98,125,24,29,37,69,2,0 ; vbroadcastss 0x24525(%rip),%ymm11 # 2d308 <_sk_overlay_sse2_8bit+0xdb0>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,227,117,74,202,224 ; vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,53,60,2,0 ; vbroadcastss 0x23c35(%rip),%ymm2 # 2ca34 <_sk_overlay_sse2_8bit+0x4c8>
+ DB 196,226,125,24,21,13,69,2,0 ; vbroadcastss 0x2450d(%rip),%ymm2 # 2d304 <_sk_overlay_sse2_8bit+0xdac>
DB 196,65,12,87,246 ; vxorps %ymm14,%ymm14,%ymm14
DB 196,227,13,74,210,208 ; vblendvps %ymm13,%ymm2,%ymm14,%ymm2
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
DB 196,227,117,74,194,0 ; vblendvps %ymm0,%ymm2,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,37,176,59,2,0 ; vbroadcastss 0x23bb0(%rip),%ymm12 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,37,136,68,2,0 ; vbroadcastss 0x24488(%rip),%ymm12 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,193,116,89,212 ; vmulps %ymm12,%ymm1,%ymm2
DB 197,28,194,226,1 ; vcmpltps %ymm2,%ymm12,%ymm12
DB 196,65,36,92,216 ; vsubps %ymm8,%ymm11,%ymm11
@@ -8522,7 +8520,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,198,128 ; vblendvps %ymm8,%ymm14,%ymm0,%ymm0
DB 196,195,117,74,206,128 ; vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- DB 196,98,125,24,5,223,59,2,0 ; vbroadcastss 0x23bdf(%rip),%ymm8 # 2ca40 <_sk_overlay_sse2_8bit+0x4d4>
+ DB 196,98,125,24,5,183,68,2,0 ; vbroadcastss 0x244b7(%rip),%ymm8 # 2d310 <_sk_overlay_sse2_8bit+0xdb8>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8537,7 +8535,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,225 ; vmovaps %ymm1,%ymm4
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
- DB 196,98,125,24,5,54,59,2,0 ; vbroadcastss 0x23b36(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,14,68,2,0 ; vbroadcastss 0x2440e(%rip),%ymm8 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,92,89,210 ; vmulps %ymm2,%ymm4,%ymm10
DB 196,65,92,92,218 ; vsubps %ymm10,%ymm4,%ymm11
@@ -8545,23 +8543,23 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
DB 197,108,88,202 ; vaddps %ymm2,%ymm2,%ymm9
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,29,120,59,2,0 ; vbroadcastss 0x23b78(%rip),%ymm11 # 2ca44 <_sk_overlay_sse2_8bit+0x4d8>
+ DB 196,98,125,24,29,80,68,2,0 ; vbroadcastss 0x24450(%rip),%ymm11 # 2d314 <_sk_overlay_sse2_8bit+0xdbc>
DB 196,65,100,88,219 ; vaddps %ymm11,%ymm3,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,37,74,59,2,0 ; vbroadcastss 0x23b4a(%rip),%ymm12 # 2ca34 <_sk_overlay_sse2_8bit+0x4c8>
+ DB 196,98,125,24,37,34,68,2,0 ; vbroadcastss 0x24422(%rip),%ymm12 # 2d304 <_sk_overlay_sse2_8bit+0xdac>
DB 196,193,4,89,196 ; vmulps %ymm12,%ymm15,%ymm0
- DB 196,98,125,24,45,68,59,2,0 ; vbroadcastss 0x23b44(%rip),%ymm13 # 2ca3c <_sk_overlay_sse2_8bit+0x4d0>
+ DB 196,98,125,24,45,28,68,2,0 ; vbroadcastss 0x2441c(%rip),%ymm13 # 2d30c <_sk_overlay_sse2_8bit+0xdb4>
DB 197,20,92,240 ; vsubps %ymm0,%ymm13,%ymm14
DB 196,65,36,89,246 ; vmulps %ymm14,%ymm11,%ymm14
DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14
- DB 196,226,125,24,13,57,59,2,0 ; vbroadcastss 0x23b39(%rip),%ymm1 # 2ca48 <_sk_overlay_sse2_8bit+0x4dc>
+ DB 196,226,125,24,13,17,68,2,0 ; vbroadcastss 0x24411(%rip),%ymm1 # 2d318 <_sk_overlay_sse2_8bit+0xdc0>
DB 196,193,116,194,255,2 ; vcmpleps %ymm15,%ymm1,%ymm7
DB 196,195,13,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm14,%ymm7
DB 196,65,60,194,247,2 ; vcmpleps %ymm15,%ymm8,%ymm14
DB 196,227,45,74,255,224 ; vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,53,16,59,2,0 ; vbroadcastss 0x23b10(%rip),%ymm14 # 2ca40 <_sk_overlay_sse2_8bit+0x4d4>
+ DB 196,98,125,24,53,232,67,2,0 ; vbroadcastss 0x243e8(%rip),%ymm14 # 2d310 <_sk_overlay_sse2_8bit+0xdb8>
DB 196,65,12,194,255,2 ; vcmpleps %ymm15,%ymm14,%ymm15
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -8580,7 +8578,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,164,89,247 ; vmulps %ymm7,%ymm11,%ymm6
DB 197,180,88,246 ; vaddps %ymm6,%ymm9,%ymm6
DB 196,227,77,74,237,0 ; vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- DB 196,226,125,24,5,186,58,2,0 ; vbroadcastss 0x23aba(%rip),%ymm0 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,226,125,24,5,146,67,2,0 ; vbroadcastss 0x24392(%rip),%ymm0 # 2d31c <_sk_overlay_sse2_8bit+0xdc4>
DB 197,228,88,192 ; vaddps %ymm0,%ymm3,%ymm0
DB 196,227,125,8,216,1 ; vroundps $0x1,%ymm0,%ymm3
DB 197,252,92,195 ; vsubps %ymm3,%ymm0,%ymm0
@@ -8630,15 +8628,15 @@ _sk_scale_u8_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,74 ; jne 909d <_sk_scale_u8_avx+0x62>
+ DB 117,74 ; jne 9095 <_sk_scale_u8_avx+0x62>
DB 196,2,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm8
- DB 197,57,219,5,239,67,2,0 ; vpand 0x243ef(%rip),%xmm8,%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,57,219,5,247,67,2,0 ; vpand 0x243f7(%rip),%xmm8,%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,204,57,2,0 ; vbroadcastss 0x239cc(%rip),%ymm9 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,13,164,66,2,0 ; vbroadcastss 0x242a4(%rip),%ymm9 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -8651,15 +8649,15 @@ _sk_scale_u8_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,167 ; ja 9059 <_sk_scale_u8_avx+0x1e>
+ DB 119,167 ; ja 9051 <_sk_scale_u8_avx+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,123,0,0,0 ; lea 0x7b(%rip),%r10 # 9138 <_sk_scale_u8_avx+0xfd>
+ DB 76,141,21,123,0,0,0 ; lea 0x7b(%rip),%r10 # 9130 <_sk_scale_u8_avx+0xfd>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 235,136 ; jmp 9059 <_sk_scale_u8_avx+0x1e>
+ DB 235,136 ; jmp 9051 <_sk_scale_u8_avx+0x1e>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -8667,7 +8665,7 @@ _sk_scale_u8_avx LABEL PROC
DB 197,121,110,200 ; vmovd %eax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
- DB 233,95,255,255,255 ; jmpq 9059 <_sk_scale_u8_avx+0x1e>
+ DB 233,95,255,255,255 ; jmpq 9051 <_sk_scale_u8_avx+0x1e>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -8678,7 +8676,7 @@ _sk_scale_u8_avx LABEL PROC
DB 196,1,121,110,12,24 ; vmovd (%r8,%r11,1),%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- DB 233,35,255,255,255 ; jmpq 9059 <_sk_scale_u8_avx+0x1e>
+ DB 233,35,255,255,255 ; jmpq 9051 <_sk_scale_u8_avx+0x1e>
DB 102,144 ; xchg %ax,%ax
DB 142,255 ; mov %edi,%?
DB 255 ; (bad)
@@ -8686,7 +8684,7 @@ _sk_scale_u8_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde009148 <_sk_overlay_sse2_8bit+0xffffffffddfdcbdc>
+ DB 232,255,255,255,221 ; callq ffffffffde009140 <_sk_overlay_sse2_8bit+0xffffffffddfdcbe8>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -8707,26 +8705,26 @@ _sk_scale_565_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,177,0,0,0 ; jne 9224 <_sk_scale_565_avx+0xd0>
+ DB 15,133,177,0,0,0 ; jne 921c <_sk_scale_565_avx+0xd0>
DB 196,1,122,111,4,88 ; vmovdqu (%r8,%r11,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- DB 196,98,125,24,13,189,56,2,0 ; vbroadcastss 0x238bd(%rip),%ymm9 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,98,125,24,13,149,65,2,0 ; vbroadcastss 0x24195(%rip),%ymm9 # 2d324 <_sk_overlay_sse2_8bit+0xdcc>
DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,174,56,2,0 ; vbroadcastss 0x238ae(%rip),%ymm10 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,98,125,24,21,134,65,2,0 ; vbroadcastss 0x24186(%rip),%ymm10 # 2d328 <_sk_overlay_sse2_8bit+0xdd0>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,164,56,2,0 ; vbroadcastss 0x238a4(%rip),%ymm10 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,98,125,24,21,124,65,2,0 ; vbroadcastss 0x2417c(%rip),%ymm10 # 2d32c <_sk_overlay_sse2_8bit+0xdd4>
DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,149,56,2,0 ; vbroadcastss 0x23895(%rip),%ymm11 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,98,125,24,29,109,65,2,0 ; vbroadcastss 0x2416d(%rip),%ymm11 # 2d330 <_sk_overlay_sse2_8bit+0xdd8>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,29,139,56,2,0 ; vbroadcastss 0x2388b(%rip),%ymm11 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,98,125,24,29,99,65,2,0 ; vbroadcastss 0x24163(%rip),%ymm11 # 2d334 <_sk_overlay_sse2_8bit+0xddc>
DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,124,56,2,0 ; vbroadcastss 0x2387c(%rip),%ymm11 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,98,125,24,29,84,65,2,0 ; vbroadcastss 0x24154(%rip),%ymm11 # 2d338 <_sk_overlay_sse2_8bit+0xde0>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
@@ -8745,27 +8743,27 @@ _sk_scale_565_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,60,255,255,255 ; ja 9179 <_sk_scale_565_avx+0x25>
+ DB 15,135,60,255,255,255 ; ja 9171 <_sk_scale_565_avx+0x25>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,100,0,0,0 ; lea 0x64(%rip),%r10 # 92ac <_sk_scale_565_avx+0x158>
+ DB 76,141,21,100,0,0,0 ; lea 0x64(%rip),%r10 # 92a4 <_sk_scale_565_avx+0x158>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 233,26,255,255,255 ; jmpq 9179 <_sk_scale_565_avx+0x25>
+ DB 233,26,255,255,255 ; jmpq 9171 <_sk_scale_565_avx+0x25>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,1,57,196,68,88,4,2 ; vpinsrw $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,121,110,12,88 ; vmovd (%r8,%r11,2),%xmm9
DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
- DB 233,252,254,255,255 ; jmpq 9179 <_sk_scale_565_avx+0x25>
+ DB 233,252,254,255,255 ; jmpq 9171 <_sk_scale_565_avx+0x25>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,1,57,196,68,88,12,6 ; vpinsrw $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,57,196,68,88,10,5 ; vpinsrw $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,57,196,68,88,8,4 ; vpinsrw $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,122,126,12,88 ; vmovq (%r8,%r11,2),%xmm9
DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- DB 233,206,254,255,255 ; jmpq 9179 <_sk_scale_565_avx+0x25>
+ DB 233,206,254,255,255 ; jmpq 9171 <_sk_scale_565_avx+0x25>
DB 144 ; nop
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -8815,15 +8813,15 @@ _sk_lerp_u8_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,110 ; jne 938d <_sk_lerp_u8_avx+0x86>
+ DB 117,110 ; jne 9385 <_sk_lerp_u8_avx+0x86>
DB 196,2,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm8
- DB 197,57,219,5,35,65,2,0 ; vpand 0x24123(%rip),%xmm8,%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,57,219,5,43,65,2,0 ; vpand 0x2412b(%rip),%xmm8,%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,0,55,2,0 ; vbroadcastss 0x23700(%rip),%ymm9 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,13,216,63,2,0 ; vbroadcastss 0x23fd8(%rip),%ymm9 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
@@ -8844,15 +8842,15 @@ _sk_lerp_u8_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,131 ; ja 9325 <_sk_lerp_u8_avx+0x1e>
+ DB 119,131 ; ja 931d <_sk_lerp_u8_avx+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,127,0,0,0 ; lea 0x7f(%rip),%r10 # 942c <_sk_lerp_u8_avx+0x125>
+ DB 76,141,21,127,0,0,0 ; lea 0x7f(%rip),%r10 # 9424 <_sk_lerp_u8_avx+0x125>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 233,97,255,255,255 ; jmpq 9325 <_sk_lerp_u8_avx+0x1e>
+ DB 233,97,255,255,255 ; jmpq 931d <_sk_lerp_u8_avx+0x1e>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -8860,7 +8858,7 @@ _sk_lerp_u8_avx LABEL PROC
DB 197,121,110,200 ; vmovd %eax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
- DB 233,56,255,255,255 ; jmpq 9325 <_sk_lerp_u8_avx+0x1e>
+ DB 233,56,255,255,255 ; jmpq 931d <_sk_lerp_u8_avx+0x1e>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -8871,7 +8869,7 @@ _sk_lerp_u8_avx LABEL PROC
DB 196,1,121,110,12,24 ; vmovd (%r8,%r11,1),%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- DB 233,252,254,255,255 ; jmpq 9325 <_sk_lerp_u8_avx+0x1e>
+ DB 233,252,254,255,255 ; jmpq 931d <_sk_lerp_u8_avx+0x1e>
DB 15,31,0 ; nopl (%rax)
DB 138,255 ; mov %bh,%bh
DB 255 ; (bad)
@@ -8902,26 +8900,26 @@ _sk_lerp_565_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,213,0,0,0 ; jne 953c <_sk_lerp_565_avx+0xf4>
+ DB 15,133,213,0,0,0 ; jne 9534 <_sk_lerp_565_avx+0xf4>
DB 196,1,122,111,4,88 ; vmovdqu (%r8,%r11,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- DB 196,98,125,24,13,201,53,2,0 ; vbroadcastss 0x235c9(%rip),%ymm9 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,98,125,24,13,161,62,2,0 ; vbroadcastss 0x23ea1(%rip),%ymm9 # 2d324 <_sk_overlay_sse2_8bit+0xdcc>
DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,186,53,2,0 ; vbroadcastss 0x235ba(%rip),%ymm10 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,98,125,24,21,146,62,2,0 ; vbroadcastss 0x23e92(%rip),%ymm10 # 2d328 <_sk_overlay_sse2_8bit+0xdd0>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,176,53,2,0 ; vbroadcastss 0x235b0(%rip),%ymm10 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,98,125,24,21,136,62,2,0 ; vbroadcastss 0x23e88(%rip),%ymm10 # 2d32c <_sk_overlay_sse2_8bit+0xdd4>
DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,161,53,2,0 ; vbroadcastss 0x235a1(%rip),%ymm11 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,98,125,24,29,121,62,2,0 ; vbroadcastss 0x23e79(%rip),%ymm11 # 2d330 <_sk_overlay_sse2_8bit+0xdd8>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,29,151,53,2,0 ; vbroadcastss 0x23597(%rip),%ymm11 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,98,125,24,29,111,62,2,0 ; vbroadcastss 0x23e6f(%rip),%ymm11 # 2d334 <_sk_overlay_sse2_8bit+0xddc>
DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,136,53,2,0 ; vbroadcastss 0x23588(%rip),%ymm11 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,98,125,24,29,96,62,2,0 ; vbroadcastss 0x23e60(%rip),%ymm11 # 2d338 <_sk_overlay_sse2_8bit+0xde0>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
@@ -8948,27 +8946,27 @@ _sk_lerp_565_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,24,255,255,255 ; ja 946d <_sk_lerp_565_avx+0x25>
+ DB 15,135,24,255,255,255 ; ja 9465 <_sk_lerp_565_avx+0x25>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,100,0,0,0 ; lea 0x64(%rip),%r10 # 95c4 <_sk_lerp_565_avx+0x17c>
+ DB 76,141,21,100,0,0,0 ; lea 0x64(%rip),%r10 # 95bc <_sk_lerp_565_avx+0x17c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 233,246,254,255,255 ; jmpq 946d <_sk_lerp_565_avx+0x25>
+ DB 233,246,254,255,255 ; jmpq 9465 <_sk_lerp_565_avx+0x25>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,1,57,196,68,88,4,2 ; vpinsrw $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,121,110,12,88 ; vmovd (%r8,%r11,2),%xmm9
DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
- DB 233,216,254,255,255 ; jmpq 946d <_sk_lerp_565_avx+0x25>
+ DB 233,216,254,255,255 ; jmpq 9465 <_sk_lerp_565_avx+0x25>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,1,57,196,68,88,12,6 ; vpinsrw $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,57,196,68,88,10,5 ; vpinsrw $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,57,196,68,88,8,4 ; vpinsrw $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
DB 196,1,122,126,12,88 ; vmovq (%r8,%r11,2),%xmm9
DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- DB 233,170,254,255,255 ; jmpq 946d <_sk_lerp_565_avx+0x25>
+ DB 233,170,254,255,255 ; jmpq 9465 <_sk_lerp_565_avx+0x25>
DB 144 ; nop
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -8997,9 +8995,9 @@ _sk_load_tables_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,0 ; mov (%rax),%r8
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,7,2,0,0 ; jne 97fe <_sk_load_tables_avx+0x21e>
+ DB 15,133,7,2,0,0 ; jne 97f6 <_sk_load_tables_avx+0x21e>
DB 196,65,125,16,20,144 ; vmovupd (%r8,%rdx,4),%ymm10
- DB 197,125,40,13,251,56,2,0 ; vmovapd 0x238fb(%rip),%ymm9 # 2cf00 <_sk_overlay_sse2_8bit+0x994>
+ DB 197,125,40,13,99,55,2,0 ; vmovapd 0x23763(%rip),%ymm9 # 2cd60 <_sk_overlay_sse2_8bit+0x808>
DB 196,193,45,84,201 ; vandpd %ymm9,%ymm10,%ymm1
DB 196,227,125,25,200,1 ; vextractf128 $0x1,%ymm1,%xmm0
DB 196,193,249,126,192 ; vmovq %xmm0,%r8
@@ -9091,7 +9089,7 @@ _sk_load_tables_avx LABEL PROC
DB 196,193,65,114,213,24 ; vpsrld $0x18,%xmm13,%xmm7
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,99,50,2,0 ; vbroadcastss 0x23263(%rip),%ymm7 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,61,59,59,2,0 ; vbroadcastss 0x23b3b(%rip),%ymm7 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7
@@ -9102,21 +9100,21 @@ _sk_load_tables_avx LABEL PROC
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,230,253,255,255 ; ja 95fd <_sk_load_tables_avx+0x1d>
+ DB 15,135,230,253,255,255 ; ja 95f5 <_sk_load_tables_avx+0x1d>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,146,0,0,0 ; lea 0x92(%rip),%r10 # 98b4 <_sk_load_tables_avx+0x2d4>
+ DB 76,141,21,146,0,0,0 ; lea 0x92(%rip),%r10 # 98ac <_sk_load_tables_avx+0x2d4>
DB 79,99,12,138 ; movslq (%r10,%r9,4),%r9
DB 77,1,209 ; add %r10,%r9
DB 65,255,225 ; jmpq *%r9
DB 196,65,122,16,20,144 ; vmovss (%r8,%rdx,4),%xmm10
- DB 233,198,253,255,255 ; jmpq 95fd <_sk_load_tables_avx+0x1d>
+ DB 233,198,253,255,255 ; jmpq 95f5 <_sk_load_tables_avx+0x1d>
DB 196,193,121,110,68,144,8 ; vmovd 0x8(%r8,%rdx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,99,117,12,208,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm10
DB 196,193,123,16,4,144 ; vmovsd (%r8,%rdx,4),%xmm0
DB 196,99,45,13,208,1 ; vblendpd $0x1,%ymm0,%ymm10,%ymm10
- DB 233,159,253,255,255 ; jmpq 95fd <_sk_load_tables_avx+0x1d>
+ DB 233,159,253,255,255 ; jmpq 95f5 <_sk_load_tables_avx+0x1d>
DB 196,193,121,110,68,144,24 ; vmovd 0x18(%r8,%rdx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -9130,9 +9128,9 @@ _sk_load_tables_avx LABEL PROC
DB 196,99,45,24,208,1 ; vinsertf128 $0x1,%xmm0,%ymm10,%ymm10
DB 196,193,121,16,4,144 ; vmovupd (%r8,%rdx,4),%xmm0
DB 196,67,125,13,210,12 ; vblendpd $0xc,%ymm10,%ymm0,%ymm10
- DB 233,74,253,255,255 ; jmpq 95fd <_sk_load_tables_avx+0x1d>
+ DB 233,74,253,255,255 ; jmpq 95f5 <_sk_load_tables_avx+0x1d>
DB 144 ; nop
- DB 120,255 ; js 98b5 <_sk_load_tables_avx+0x2d5>
+ DB 120,255 ; js 98ad <_sk_load_tables_avx+0x2d5>
DB 255 ; (bad)
DB 255,153,255,255,255,131 ; lcall *-0x7c000001(%rcx)
DB 255 ; (bad)
@@ -9161,7 +9159,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 76,141,12,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r9
DB 72,133,255 ; test %rdi,%rdi
DB 197,252,17,60,36 ; vmovups %ymm7,(%rsp)
- DB 15,133,87,2,0,0 ; jne 9b46 <_sk_load_tables_u16_be_avx+0x276>
+ DB 15,133,87,2,0,0 ; jne 9b3e <_sk_load_tables_u16_be_avx+0x276>
DB 196,1,121,16,4,72 ; vmovupd (%r8,%r9,2),%xmm8
DB 196,129,121,16,84,72,16 ; vmovupd 0x10(%r8,%r9,2),%xmm2
DB 196,129,121,16,92,72,32 ; vmovupd 0x20(%r8,%r9,2),%xmm3
@@ -9176,7 +9174,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 197,113,105,219 ; vpunpckhwd %xmm3,%xmm1,%xmm11
DB 197,177,108,200 ; vpunpcklqdq %xmm0,%xmm9,%xmm1
DB 197,49,109,224 ; vpunpckhqdq %xmm0,%xmm9,%xmm12
- DB 197,121,111,21,20,59,2,0 ; vmovdqa 0x23b14(%rip),%xmm10 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,121,111,21,28,59,2,0 ; vmovdqa 0x23b1c(%rip),%xmm10 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 196,193,113,219,202 ; vpand %xmm10,%xmm1,%xmm1
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,193,113,105,209 ; vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -9274,7 +9272,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,226,121,51,219 ; vpmovzxwd %xmm3,%xmm3
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,55,47,2,0 ; vbroadcastss 0x22f37(%rip),%ymm7 # 2ca6c <_sk_overlay_sse2_8bit+0x500>
+ DB 196,226,125,24,61,15,56,2,0 ; vbroadcastss 0x2380f(%rip),%ymm7 # 2d33c <_sk_overlay_sse2_8bit+0xde4>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7
@@ -9283,29 +9281,29 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,1,123,16,4,72 ; vmovsd (%r8,%r9,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,85 ; je 9bac <_sk_load_tables_u16_be_avx+0x2dc>
+ DB 116,85 ; je 9ba4 <_sk_load_tables_u16_be_avx+0x2dc>
DB 196,1,57,22,68,72,8 ; vmovhpd 0x8(%r8,%r9,2),%xmm8,%xmm8
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,72 ; jb 9bac <_sk_load_tables_u16_be_avx+0x2dc>
+ DB 114,72 ; jb 9ba4 <_sk_load_tables_u16_be_avx+0x2dc>
DB 196,129,123,16,84,72,16 ; vmovsd 0x10(%r8,%r9,2),%xmm2
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 116,72 ; je 9bb9 <_sk_load_tables_u16_be_avx+0x2e9>
+ DB 116,72 ; je 9bb1 <_sk_load_tables_u16_be_avx+0x2e9>
DB 196,129,105,22,84,72,24 ; vmovhpd 0x18(%r8,%r9,2),%xmm2,%xmm2
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,59 ; jb 9bb9 <_sk_load_tables_u16_be_avx+0x2e9>
+ DB 114,59 ; jb 9bb1 <_sk_load_tables_u16_be_avx+0x2e9>
DB 196,129,123,16,92,72,32 ; vmovsd 0x20(%r8,%r9,2),%xmm3
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 15,132,123,253,255,255 ; je 990a <_sk_load_tables_u16_be_avx+0x3a>
+ DB 15,132,123,253,255,255 ; je 9902 <_sk_load_tables_u16_be_avx+0x3a>
DB 196,129,97,22,92,72,40 ; vmovhpd 0x28(%r8,%r9,2),%xmm3,%xmm3
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 15,130,106,253,255,255 ; jb 990a <_sk_load_tables_u16_be_avx+0x3a>
+ DB 15,130,106,253,255,255 ; jb 9902 <_sk_load_tables_u16_be_avx+0x3a>
DB 196,1,122,126,76,72,48 ; vmovq 0x30(%r8,%r9,2),%xmm9
- DB 233,94,253,255,255 ; jmpq 990a <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,94,253,255,255 ; jmpq 9902 <_sk_load_tables_u16_be_avx+0x3a>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,81,253,255,255 ; jmpq 990a <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,81,253,255,255 ; jmpq 9902 <_sk_load_tables_u16_be_avx+0x3a>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,72,253,255,255 ; jmpq 990a <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,72,253,255,255 ; jmpq 9902 <_sk_load_tables_u16_be_avx+0x3a>
PUBLIC _sk_load_tables_rgb_u16_be_avx
_sk_load_tables_rgb_u16_be_avx LABEL PROC
@@ -9316,7 +9314,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 197,252,17,124,36,32 ; vmovups %ymm7,0x20(%rsp)
DB 197,252,17,52,36 ; vmovups %ymm6,(%rsp)
- DB 15,133,75,2,0,0 ; jne 9e2e <_sk_load_tables_rgb_u16_be_avx+0x26c>
+ DB 15,133,75,2,0,0 ; jne 9e26 <_sk_load_tables_rgb_u16_be_avx+0x26c>
DB 196,1,122,111,28,72 ; vmovdqu (%r8,%r9,2),%xmm11
DB 196,129,122,111,92,72,12 ; vmovdqu 0xc(%r8,%r9,2),%xmm3
DB 196,129,122,111,84,72,24 ; vmovdqu 0x18(%r8,%r9,2),%xmm2
@@ -9337,7 +9335,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 197,185,108,211 ; vpunpcklqdq %xmm3,%xmm8,%xmm2
DB 197,57,109,219 ; vpunpckhqdq %xmm3,%xmm8,%xmm11
DB 197,113,108,192 ; vpunpcklqdq %xmm0,%xmm1,%xmm8
- DB 197,121,111,13,2,56,2,0 ; vmovdqa 0x23802(%rip),%xmm9 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,121,111,13,10,56,2,0 ; vmovdqa 0x2380a(%rip),%xmm9 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 196,193,105,219,193 ; vpand %xmm9,%xmm2,%xmm0
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 196,193,121,105,202 ; vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -9427,7 +9425,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 196,195,105,33,211,48 ; vinsertps $0x30,%xmm11,%xmm2,%xmm2
DB 196,227,109,24,211,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,191,43,2,0 ; vbroadcastss 0x22bbf(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,151,52,2,0 ; vbroadcastss 0x23497(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,16,52,36 ; vmovups (%rsp),%ymm6
DB 197,252,16,124,36,32 ; vmovups 0x20(%rsp),%ymm7
DB 72,131,196,88 ; add $0x58,%rsp
@@ -9436,68 +9434,68 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 196,1,121,196,92,72,4,2 ; vpinsrw $0x2,0x4(%r8,%r9,2),%xmm0,%xmm11
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,32 ; jne 9e67 <_sk_load_tables_rgb_u16_be_avx+0x2a5>
+ DB 117,32 ; jne 9e5f <_sk_load_tables_rgb_u16_be_avx+0x2a5>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
- DB 233,177,253,255,255 ; jmpq 9c18 <_sk_load_tables_rgb_u16_be_avx+0x56>
+ DB 233,177,253,255,255 ; jmpq 9c10 <_sk_load_tables_rgb_u16_be_avx+0x56>
DB 196,129,121,110,68,72,6 ; vmovd 0x6(%r8,%r9,2),%xmm0
DB 196,1,121,196,68,72,10,2 ; vpinsrw $0x2,0xa(%r8,%r9,2),%xmm0,%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,49 ; jb 9eb2 <_sk_load_tables_rgb_u16_be_avx+0x2f0>
+ DB 114,49 ; jb 9eaa <_sk_load_tables_rgb_u16_be_avx+0x2f0>
DB 196,129,121,110,68,72,12 ; vmovd 0xc(%r8,%r9,2),%xmm0
DB 196,129,121,196,92,72,16,2 ; vpinsrw $0x2,0x10(%r8,%r9,2),%xmm0,%xmm3
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 117,50 ; jne 9ecd <_sk_load_tables_rgb_u16_be_avx+0x30b>
+ DB 117,50 ; jne 9ec5 <_sk_load_tables_rgb_u16_be_avx+0x30b>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
- DB 233,102,253,255,255 ; jmpq 9c18 <_sk_load_tables_rgb_u16_be_avx+0x56>
+ DB 233,102,253,255,255 ; jmpq 9c10 <_sk_load_tables_rgb_u16_be_avx+0x56>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
- DB 233,75,253,255,255 ; jmpq 9c18 <_sk_load_tables_rgb_u16_be_avx+0x56>
+ DB 233,75,253,255,255 ; jmpq 9c10 <_sk_load_tables_rgb_u16_be_avx+0x56>
DB 196,129,121,110,68,72,18 ; vmovd 0x12(%r8,%r9,2),%xmm0
DB 196,1,121,196,84,72,22,2 ; vpinsrw $0x2,0x16(%r8,%r9,2),%xmm0,%xmm10
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,40 ; jb 9f0f <_sk_load_tables_rgb_u16_be_avx+0x34d>
+ DB 114,40 ; jb 9f07 <_sk_load_tables_rgb_u16_be_avx+0x34d>
DB 196,129,121,110,68,72,24 ; vmovd 0x18(%r8,%r9,2),%xmm0
DB 196,129,121,196,84,72,28,2 ; vpinsrw $0x2,0x1c(%r8,%r9,2),%xmm0,%xmm2
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 117,32 ; jne 9f21 <_sk_load_tables_rgb_u16_be_avx+0x35f>
+ DB 117,32 ; jne 9f19 <_sk_load_tables_rgb_u16_be_avx+0x35f>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
- DB 233,9,253,255,255 ; jmpq 9c18 <_sk_load_tables_rgb_u16_be_avx+0x56>
+ DB 233,9,253,255,255 ; jmpq 9c10 <_sk_load_tables_rgb_u16_be_avx+0x56>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
- DB 233,247,252,255,255 ; jmpq 9c18 <_sk_load_tables_rgb_u16_be_avx+0x56>
+ DB 233,247,252,255,255 ; jmpq 9c10 <_sk_load_tables_rgb_u16_be_avx+0x56>
DB 196,129,121,110,68,72,30 ; vmovd 0x1e(%r8,%r9,2),%xmm0
DB 196,1,121,196,100,72,34,2 ; vpinsrw $0x2,0x22(%r8,%r9,2),%xmm0,%xmm12
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 114,25 ; jb 9f54 <_sk_load_tables_rgb_u16_be_avx+0x392>
+ DB 114,25 ; jb 9f4c <_sk_load_tables_rgb_u16_be_avx+0x392>
DB 196,129,121,110,68,72,36 ; vmovd 0x24(%r8,%r9,2),%xmm0
DB 196,129,121,196,68,72,40,2 ; vpinsrw $0x2,0x28(%r8,%r9,2),%xmm0,%xmm0
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
- DB 233,196,252,255,255 ; jmpq 9c18 <_sk_load_tables_rgb_u16_be_avx+0x56>
+ DB 233,196,252,255,255 ; jmpq 9c10 <_sk_load_tables_rgb_u16_be_avx+0x56>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
- DB 233,187,252,255,255 ; jmpq 9c18 <_sk_load_tables_rgb_u16_be_avx+0x56>
+ DB 233,187,252,255,255 ; jmpq 9c10 <_sk_load_tables_rgb_u16_be_avx+0x56>
PUBLIC _sk_byte_tables_avx
_sk_byte_tables_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,160,42,2,0 ; vbroadcastss 0x22aa0(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,120,51,2,0 ; vbroadcastss 0x23378(%rip),%ymm8 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,200 ; vmovq %xmm9,%r8
@@ -9616,7 +9614,7 @@ _sk_byte_tables_avx LABEL PROC
DB 196,194,121,49,204 ; vpmovzxbd %xmm12,%xmm1
DB 196,194,121,49,213 ; vpmovzxbd %xmm13,%xmm2
DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- DB 196,98,125,24,13,142,40,2,0 ; vbroadcastss 0x2288e(%rip),%ymm9 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,13,102,49,2,0 ; vbroadcastss 0x23166(%rip),%ymm9 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -9730,7 +9728,7 @@ _sk_byte_tables_rgb_avx LABEL PROC
DB 196,194,121,49,203 ; vpmovzxbd %xmm11,%xmm1
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,107,38,2,0 ; vbroadcastss 0x2266b(%rip),%ymm9 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,13,67,47,2,0 ; vbroadcastss 0x22f43(%rip),%ymm9 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,121,49,202 ; vpmovzxbd %xmm10,%xmm1
DB 196,194,121,49,212 ; vpmovzxbd %xmm12,%xmm2
@@ -9957,36 +9955,36 @@ _sk_parametric_r_avx LABEL PROC
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,216 ; vcvtdq2ps %ymm0,%ymm11
- DB 196,98,125,24,37,252,34,2,0 ; vbroadcastss 0x222fc(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,98,125,24,37,212,43,2,0 ; vbroadcastss 0x22bd4(%rip),%ymm12 # 2d340 <_sk_overlay_sse2_8bit+0xde8>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,242,34,2,0 ; vbroadcastss 0x222f2(%rip),%ymm12 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,202,43,2,0 ; vbroadcastss 0x22bca(%rip),%ymm12 # 2d344 <_sk_overlay_sse2_8bit+0xdec>
DB 196,193,124,84,196 ; vandps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,72,34,2,0 ; vbroadcastss 0x22248(%rip),%ymm12 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,37,32,43,2,0 ; vbroadcastss 0x22b20(%rip),%ymm12 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,193,124,86,196 ; vorps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,218,34,2,0 ; vbroadcastss 0x222da(%rip),%ymm12 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,37,178,43,2,0 ; vbroadcastss 0x22bb2(%rip),%ymm12 # 2d348 <_sk_overlay_sse2_8bit+0xdf0>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,208,34,2,0 ; vbroadcastss 0x222d0(%rip),%ymm12 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,37,168,43,2,0 ; vbroadcastss 0x22ba8(%rip),%ymm12 # 2d34c <_sk_overlay_sse2_8bit+0xdf4>
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,193,34,2,0 ; vbroadcastss 0x222c1(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,153,43,2,0 ; vbroadcastss 0x22b99(%rip),%ymm12 # 2d350 <_sk_overlay_sse2_8bit+0xdf8>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,183,34,2,0 ; vbroadcastss 0x222b7(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,143,43,2,0 ; vbroadcastss 0x22b8f(%rip),%ymm12 # 2d354 <_sk_overlay_sse2_8bit+0xdfc>
DB 197,156,94,192 ; vdivps %ymm0,%ymm12,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,155,34,2,0 ; vbroadcastss 0x2229b(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,115,43,2,0 ; vbroadcastss 0x22b73(%rip),%ymm11 # 2d358 <_sk_overlay_sse2_8bit+0xe00>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,145,34,2,0 ; vbroadcastss 0x22291(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,105,43,2,0 ; vbroadcastss 0x22b69(%rip),%ymm11 # 2d35c <_sk_overlay_sse2_8bit+0xe04>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,130,34,2,0 ; vbroadcastss 0x22282(%rip),%ymm11 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,98,125,24,29,90,43,2,0 ; vbroadcastss 0x22b5a(%rip),%ymm11 # 2d360 <_sk_overlay_sse2_8bit+0xe08>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,120,34,2,0 ; vbroadcastss 0x22278(%rip),%ymm11 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,29,80,43,2,0 ; vbroadcastss 0x22b50(%rip),%ymm11 # 2d364 <_sk_overlay_sse2_8bit+0xe0c>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,105,34,2,0 ; vbroadcastss 0x22269(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,65,43,2,0 ; vbroadcastss 0x22b41(%rip),%ymm10 # 2d368 <_sk_overlay_sse2_8bit+0xe10>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9994,7 +9992,7 @@ _sk_parametric_r_avx LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,128,33,2,0 ; vbroadcastss 0x22180(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,88,42,2,0 ; vbroadcastss 0x22a58(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10014,36 +10012,36 @@ _sk_parametric_g_avx LABEL PROC
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,217 ; vcvtdq2ps %ymm1,%ymm11
- DB 196,98,125,24,37,193,33,2,0 ; vbroadcastss 0x221c1(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,98,125,24,37,153,42,2,0 ; vbroadcastss 0x22a99(%rip),%ymm12 # 2d340 <_sk_overlay_sse2_8bit+0xde8>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,183,33,2,0 ; vbroadcastss 0x221b7(%rip),%ymm12 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,143,42,2,0 ; vbroadcastss 0x22a8f(%rip),%ymm12 # 2d344 <_sk_overlay_sse2_8bit+0xdec>
DB 196,193,116,84,204 ; vandps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,13,33,2,0 ; vbroadcastss 0x2210d(%rip),%ymm12 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,37,229,41,2,0 ; vbroadcastss 0x229e5(%rip),%ymm12 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,193,116,86,204 ; vorps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,159,33,2,0 ; vbroadcastss 0x2219f(%rip),%ymm12 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,37,119,42,2,0 ; vbroadcastss 0x22a77(%rip),%ymm12 # 2d348 <_sk_overlay_sse2_8bit+0xdf0>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,149,33,2,0 ; vbroadcastss 0x22195(%rip),%ymm12 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,37,109,42,2,0 ; vbroadcastss 0x22a6d(%rip),%ymm12 # 2d34c <_sk_overlay_sse2_8bit+0xdf4>
DB 196,65,116,89,228 ; vmulps %ymm12,%ymm1,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,134,33,2,0 ; vbroadcastss 0x22186(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,94,42,2,0 ; vbroadcastss 0x22a5e(%rip),%ymm12 # 2d350 <_sk_overlay_sse2_8bit+0xdf8>
DB 196,193,116,88,204 ; vaddps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,124,33,2,0 ; vbroadcastss 0x2217c(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,84,42,2,0 ; vbroadcastss 0x22a54(%rip),%ymm12 # 2d354 <_sk_overlay_sse2_8bit+0xdfc>
DB 197,156,94,201 ; vdivps %ymm1,%ymm12,%ymm1
DB 197,164,92,201 ; vsubps %ymm1,%ymm11,%ymm1
DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,96,33,2,0 ; vbroadcastss 0x22160(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,56,42,2,0 ; vbroadcastss 0x22a38(%rip),%ymm11 # 2d358 <_sk_overlay_sse2_8bit+0xe00>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,86,33,2,0 ; vbroadcastss 0x22156(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,46,42,2,0 ; vbroadcastss 0x22a2e(%rip),%ymm11 # 2d35c <_sk_overlay_sse2_8bit+0xe04>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,71,33,2,0 ; vbroadcastss 0x22147(%rip),%ymm11 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,98,125,24,29,31,42,2,0 ; vbroadcastss 0x22a1f(%rip),%ymm11 # 2d360 <_sk_overlay_sse2_8bit+0xe08>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,61,33,2,0 ; vbroadcastss 0x2213d(%rip),%ymm11 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,29,21,42,2,0 ; vbroadcastss 0x22a15(%rip),%ymm11 # 2d364 <_sk_overlay_sse2_8bit+0xe0c>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,46,33,2,0 ; vbroadcastss 0x2212e(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,6,42,2,0 ; vbroadcastss 0x22a06(%rip),%ymm10 # 2d368 <_sk_overlay_sse2_8bit+0xe10>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -10051,7 +10049,7 @@ _sk_parametric_g_avx LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,69,32,2,0 ; vbroadcastss 0x22045(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,29,41,2,0 ; vbroadcastss 0x2291d(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10071,36 +10069,36 @@ _sk_parametric_b_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,218 ; vcvtdq2ps %ymm2,%ymm11
- DB 196,98,125,24,37,134,32,2,0 ; vbroadcastss 0x22086(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,98,125,24,37,94,41,2,0 ; vbroadcastss 0x2295e(%rip),%ymm12 # 2d340 <_sk_overlay_sse2_8bit+0xde8>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,124,32,2,0 ; vbroadcastss 0x2207c(%rip),%ymm12 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,84,41,2,0 ; vbroadcastss 0x22954(%rip),%ymm12 # 2d344 <_sk_overlay_sse2_8bit+0xdec>
DB 196,193,108,84,212 ; vandps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,210,31,2,0 ; vbroadcastss 0x21fd2(%rip),%ymm12 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,37,170,40,2,0 ; vbroadcastss 0x228aa(%rip),%ymm12 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,193,108,86,212 ; vorps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,100,32,2,0 ; vbroadcastss 0x22064(%rip),%ymm12 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,37,60,41,2,0 ; vbroadcastss 0x2293c(%rip),%ymm12 # 2d348 <_sk_overlay_sse2_8bit+0xdf0>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,90,32,2,0 ; vbroadcastss 0x2205a(%rip),%ymm12 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,37,50,41,2,0 ; vbroadcastss 0x22932(%rip),%ymm12 # 2d34c <_sk_overlay_sse2_8bit+0xdf4>
DB 196,65,108,89,228 ; vmulps %ymm12,%ymm2,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,75,32,2,0 ; vbroadcastss 0x2204b(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,35,41,2,0 ; vbroadcastss 0x22923(%rip),%ymm12 # 2d350 <_sk_overlay_sse2_8bit+0xdf8>
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,65,32,2,0 ; vbroadcastss 0x22041(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,25,41,2,0 ; vbroadcastss 0x22919(%rip),%ymm12 # 2d354 <_sk_overlay_sse2_8bit+0xdfc>
DB 197,156,94,210 ; vdivps %ymm2,%ymm12,%ymm2
DB 197,164,92,210 ; vsubps %ymm2,%ymm11,%ymm2
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,37,32,2,0 ; vbroadcastss 0x22025(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,253,40,2,0 ; vbroadcastss 0x228fd(%rip),%ymm11 # 2d358 <_sk_overlay_sse2_8bit+0xe00>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,27,32,2,0 ; vbroadcastss 0x2201b(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,243,40,2,0 ; vbroadcastss 0x228f3(%rip),%ymm11 # 2d35c <_sk_overlay_sse2_8bit+0xe04>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,108,92,211 ; vsubps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,12,32,2,0 ; vbroadcastss 0x2200c(%rip),%ymm11 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,98,125,24,29,228,40,2,0 ; vbroadcastss 0x228e4(%rip),%ymm11 # 2d360 <_sk_overlay_sse2_8bit+0xe08>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,2,32,2,0 ; vbroadcastss 0x22002(%rip),%ymm11 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,29,218,40,2,0 ; vbroadcastss 0x228da(%rip),%ymm11 # 2d364 <_sk_overlay_sse2_8bit+0xe0c>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,108,88,210 ; vaddps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,243,31,2,0 ; vbroadcastss 0x21ff3(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,203,40,2,0 ; vbroadcastss 0x228cb(%rip),%ymm10 # 2d368 <_sk_overlay_sse2_8bit+0xe10>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -10108,7 +10106,7 @@ _sk_parametric_b_avx LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,10,31,2,0 ; vbroadcastss 0x21f0a(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,226,39,2,0 ; vbroadcastss 0x227e2(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10128,36 +10126,36 @@ _sk_parametric_a_avx LABEL PROC
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,219 ; vcvtdq2ps %ymm3,%ymm11
- DB 196,98,125,24,37,75,31,2,0 ; vbroadcastss 0x21f4b(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,98,125,24,37,35,40,2,0 ; vbroadcastss 0x22823(%rip),%ymm12 # 2d340 <_sk_overlay_sse2_8bit+0xde8>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,65,31,2,0 ; vbroadcastss 0x21f41(%rip),%ymm12 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,25,40,2,0 ; vbroadcastss 0x22819(%rip),%ymm12 # 2d344 <_sk_overlay_sse2_8bit+0xdec>
DB 196,193,100,84,220 ; vandps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,151,30,2,0 ; vbroadcastss 0x21e97(%rip),%ymm12 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,37,111,39,2,0 ; vbroadcastss 0x2276f(%rip),%ymm12 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,193,100,86,220 ; vorps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,41,31,2,0 ; vbroadcastss 0x21f29(%rip),%ymm12 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,37,1,40,2,0 ; vbroadcastss 0x22801(%rip),%ymm12 # 2d348 <_sk_overlay_sse2_8bit+0xdf0>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,31,31,2,0 ; vbroadcastss 0x21f1f(%rip),%ymm12 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,37,247,39,2,0 ; vbroadcastss 0x227f7(%rip),%ymm12 # 2d34c <_sk_overlay_sse2_8bit+0xdf4>
DB 196,65,100,89,228 ; vmulps %ymm12,%ymm3,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,16,31,2,0 ; vbroadcastss 0x21f10(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,232,39,2,0 ; vbroadcastss 0x227e8(%rip),%ymm12 # 2d350 <_sk_overlay_sse2_8bit+0xdf8>
DB 196,193,100,88,220 ; vaddps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,6,31,2,0 ; vbroadcastss 0x21f06(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,222,39,2,0 ; vbroadcastss 0x227de(%rip),%ymm12 # 2d354 <_sk_overlay_sse2_8bit+0xdfc>
DB 197,156,94,219 ; vdivps %ymm3,%ymm12,%ymm3
DB 197,164,92,219 ; vsubps %ymm3,%ymm11,%ymm3
DB 197,172,89,219 ; vmulps %ymm3,%ymm10,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,234,30,2,0 ; vbroadcastss 0x21eea(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,194,39,2,0 ; vbroadcastss 0x227c2(%rip),%ymm11 # 2d358 <_sk_overlay_sse2_8bit+0xe00>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,224,30,2,0 ; vbroadcastss 0x21ee0(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,184,39,2,0 ; vbroadcastss 0x227b8(%rip),%ymm11 # 2d35c <_sk_overlay_sse2_8bit+0xe04>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,100,92,219 ; vsubps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,209,30,2,0 ; vbroadcastss 0x21ed1(%rip),%ymm11 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,98,125,24,29,169,39,2,0 ; vbroadcastss 0x227a9(%rip),%ymm11 # 2d360 <_sk_overlay_sse2_8bit+0xe08>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,199,30,2,0 ; vbroadcastss 0x21ec7(%rip),%ymm11 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,29,159,39,2,0 ; vbroadcastss 0x2279f(%rip),%ymm11 # 2d364 <_sk_overlay_sse2_8bit+0xe0c>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,100,88,218 ; vaddps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,184,30,2,0 ; vbroadcastss 0x21eb8(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,144,39,2,0 ; vbroadcastss 0x22790(%rip),%ymm10 # 2d368 <_sk_overlay_sse2_8bit+0xe10>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -10165,7 +10163,7 @@ _sk_parametric_a_avx LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,207,29,2,0 ; vbroadcastss 0x21dcf(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,167,38,2,0 ; vbroadcastss 0x226a7(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10182,34 +10180,34 @@ _sk_gamma_avx LABEL PROC
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,91,200 ; vcvtdq2ps %ymm0,%ymm1
- DB 196,98,125,24,5,24,30,2,0 ; vbroadcastss 0x21e18(%rip),%ymm8 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,98,125,24,5,240,38,2,0 ; vbroadcastss 0x226f0(%rip),%ymm8 # 2d340 <_sk_overlay_sse2_8bit+0xde8>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,14,30,2,0 ; vbroadcastss 0x21e0e(%rip),%ymm9 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,13,230,38,2,0 ; vbroadcastss 0x226e6(%rip),%ymm9 # 2d344 <_sk_overlay_sse2_8bit+0xdec>
DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0
- DB 196,226,125,24,37,100,29,2,0 ; vbroadcastss 0x21d64(%rip),%ymm4 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,226,125,24,37,60,38,2,0 ; vbroadcastss 0x2263c(%rip),%ymm4 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 197,252,86,196 ; vorps %ymm4,%ymm0,%ymm0
- DB 196,98,125,24,21,247,29,2,0 ; vbroadcastss 0x21df7(%rip),%ymm10 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,21,207,38,2,0 ; vbroadcastss 0x226cf(%rip),%ymm10 # 2d348 <_sk_overlay_sse2_8bit+0xdf0>
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,29,237,29,2,0 ; vbroadcastss 0x21ded(%rip),%ymm11 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,29,197,38,2,0 ; vbroadcastss 0x226c5(%rip),%ymm11 # 2d34c <_sk_overlay_sse2_8bit+0xdf4>
DB 196,193,124,89,211 ; vmulps %ymm11,%ymm0,%ymm2
DB 197,244,92,202 ; vsubps %ymm2,%ymm1,%ymm1
- DB 196,98,125,24,37,223,29,2,0 ; vbroadcastss 0x21ddf(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,183,38,2,0 ; vbroadcastss 0x226b7(%rip),%ymm12 # 2d350 <_sk_overlay_sse2_8bit+0xdf8>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,45,213,29,2,0 ; vbroadcastss 0x21dd5(%rip),%ymm13 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,45,173,38,2,0 ; vbroadcastss 0x226ad(%rip),%ymm13 # 2d354 <_sk_overlay_sse2_8bit+0xdfc>
DB 197,148,94,192 ; vdivps %ymm0,%ymm13,%ymm0
DB 197,244,92,192 ; vsubps %ymm0,%ymm1,%ymm0
DB 196,98,125,24,48 ; vbroadcastss (%rax),%ymm14
DB 196,193,124,89,198 ; vmulps %ymm14,%ymm0,%ymm0
DB 196,227,125,8,200,1 ; vroundps $0x1,%ymm0,%ymm1
DB 197,252,92,241 ; vsubps %ymm1,%ymm0,%ymm6
- DB 196,98,125,24,61,180,29,2,0 ; vbroadcastss 0x21db4(%rip),%ymm15 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,61,140,38,2,0 ; vbroadcastss 0x2268c(%rip),%ymm15 # 2d358 <_sk_overlay_sse2_8bit+0xe00>
DB 196,193,124,88,199 ; vaddps %ymm15,%ymm0,%ymm0
- DB 196,226,125,24,29,170,29,2,0 ; vbroadcastss 0x21daa(%rip),%ymm3 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
+ DB 196,226,125,24,29,130,38,2,0 ; vbroadcastss 0x22682(%rip),%ymm3 # 2d35c <_sk_overlay_sse2_8bit+0xe04>
DB 197,204,89,203 ; vmulps %ymm3,%ymm6,%ymm1
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
- DB 196,226,125,24,21,157,29,2,0 ; vbroadcastss 0x21d9d(%rip),%ymm2 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,226,125,24,21,117,38,2,0 ; vbroadcastss 0x22675(%rip),%ymm2 # 2d360 <_sk_overlay_sse2_8bit+0xe08>
DB 197,236,92,198 ; vsubps %ymm6,%ymm2,%ymm0
- DB 196,226,125,24,53,148,29,2,0 ; vbroadcastss 0x21d94(%rip),%ymm6 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,226,125,24,53,108,38,2,0 ; vbroadcastss 0x2266c(%rip),%ymm6 # 2d364 <_sk_overlay_sse2_8bit+0xe0c>
DB 197,204,94,192 ; vdivps %ymm0,%ymm6,%ymm0
DB 197,244,88,192 ; vaddps %ymm0,%ymm1,%ymm0
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
@@ -10251,7 +10249,7 @@ _sk_gamma_avx LABEL PROC
DB 197,236,92,212 ; vsubps %ymm4,%ymm2,%ymm2
DB 197,204,94,210 ; vdivps %ymm2,%ymm6,%ymm2
DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,216,28,2,0 ; vbroadcastss 0x21cd8(%rip),%ymm2 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,226,125,24,21,176,37,2,0 ; vbroadcastss 0x225b0(%rip),%ymm2 # 2d368 <_sk_overlay_sse2_8bit+0xe10>
DB 197,236,89,28,36 ; vmulps (%rsp),%ymm2,%ymm3
DB 197,252,89,226 ; vmulps %ymm2,%ymm0,%ymm4
DB 197,244,89,210 ; vmulps %ymm2,%ymm1,%ymm2
@@ -10269,31 +10267,31 @@ _sk_gamma_avx LABEL PROC
PUBLIC _sk_lab_to_xyz_avx
_sk_lab_to_xyz_avx LABEL PROC
- DB 196,98,125,24,5,139,28,2,0 ; vbroadcastss 0x21c8b(%rip),%ymm8 # 2ca9c <_sk_overlay_sse2_8bit+0x530>
+ DB 196,98,125,24,5,99,37,2,0 ; vbroadcastss 0x22563(%rip),%ymm8 # 2d36c <_sk_overlay_sse2_8bit+0xe14>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,233,27,2,0 ; vbroadcastss 0x21be9(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,193,36,2,0 ; vbroadcastss 0x224c1(%rip),%ymm8 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,115,28,2,0 ; vbroadcastss 0x21c73(%rip),%ymm9 # 2caa0 <_sk_overlay_sse2_8bit+0x534>
+ DB 196,98,125,24,13,75,37,2,0 ; vbroadcastss 0x2254b(%rip),%ymm9 # 2d370 <_sk_overlay_sse2_8bit+0xe18>
DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 196,193,108,88,209 ; vaddps %ymm9,%ymm2,%ymm2
- DB 196,98,125,24,5,95,28,2,0 ; vbroadcastss 0x21c5f(%rip),%ymm8 # 2caa4 <_sk_overlay_sse2_8bit+0x538>
+ DB 196,98,125,24,5,55,37,2,0 ; vbroadcastss 0x22537(%rip),%ymm8 # 2d374 <_sk_overlay_sse2_8bit+0xe1c>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,85,28,2,0 ; vbroadcastss 0x21c55(%rip),%ymm8 # 2caa8 <_sk_overlay_sse2_8bit+0x53c>
+ DB 196,98,125,24,5,45,37,2,0 ; vbroadcastss 0x2252d(%rip),%ymm8 # 2d378 <_sk_overlay_sse2_8bit+0xe20>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,75,28,2,0 ; vbroadcastss 0x21c4b(%rip),%ymm8 # 2caac <_sk_overlay_sse2_8bit+0x540>
+ DB 196,98,125,24,5,35,37,2,0 ; vbroadcastss 0x22523(%rip),%ymm8 # 2d37c <_sk_overlay_sse2_8bit+0xe24>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 197,252,88,201 ; vaddps %ymm1,%ymm0,%ymm1
- DB 196,98,125,24,5,61,28,2,0 ; vbroadcastss 0x21c3d(%rip),%ymm8 # 2cab0 <_sk_overlay_sse2_8bit+0x544>
+ DB 196,98,125,24,5,21,37,2,0 ; vbroadcastss 0x22515(%rip),%ymm8 # 2d380 <_sk_overlay_sse2_8bit+0xe28>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,252,92,210 ; vsubps %ymm2,%ymm0,%ymm2
DB 197,116,89,193 ; vmulps %ymm1,%ymm1,%ymm8
DB 196,65,116,89,192 ; vmulps %ymm8,%ymm1,%ymm8
- DB 196,98,125,24,13,38,28,2,0 ; vbroadcastss 0x21c26(%rip),%ymm9 # 2cab4 <_sk_overlay_sse2_8bit+0x548>
+ DB 196,98,125,24,13,254,36,2,0 ; vbroadcastss 0x224fe(%rip),%ymm9 # 2d384 <_sk_overlay_sse2_8bit+0xe2c>
DB 196,65,52,194,208,1 ; vcmpltps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,27,28,2,0 ; vbroadcastss 0x21c1b(%rip),%ymm11 # 2cab8 <_sk_overlay_sse2_8bit+0x54c>
+ DB 196,98,125,24,29,243,36,2,0 ; vbroadcastss 0x224f3(%rip),%ymm11 # 2d388 <_sk_overlay_sse2_8bit+0xe30>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,37,17,28,2,0 ; vbroadcastss 0x21c11(%rip),%ymm12 # 2cabc <_sk_overlay_sse2_8bit+0x550>
+ DB 196,98,125,24,37,233,36,2,0 ; vbroadcastss 0x224e9(%rip),%ymm12 # 2d38c <_sk_overlay_sse2_8bit+0xe34>
DB 196,193,116,89,204 ; vmulps %ymm12,%ymm1,%ymm1
DB 196,67,117,74,192,160 ; vblendvps %ymm10,%ymm8,%ymm1,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -10308,9 +10306,9 @@ _sk_lab_to_xyz_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,193,108,89,212 ; vmulps %ymm12,%ymm2,%ymm2
DB 196,227,109,74,208,144 ; vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- DB 196,226,125,24,5,199,27,2,0 ; vbroadcastss 0x21bc7(%rip),%ymm0 # 2cac0 <_sk_overlay_sse2_8bit+0x554>
+ DB 196,226,125,24,5,159,36,2,0 ; vbroadcastss 0x2249f(%rip),%ymm0 # 2d390 <_sk_overlay_sse2_8bit+0xe38>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,190,27,2,0 ; vbroadcastss 0x21bbe(%rip),%ymm8 # 2cac4 <_sk_overlay_sse2_8bit+0x558>
+ DB 196,98,125,24,5,150,36,2,0 ; vbroadcastss 0x22496(%rip),%ymm8 # 2d394 <_sk_overlay_sse2_8bit+0xe3c>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10324,15 +10322,15 @@ _sk_load_a8_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,66 ; jne af69 <_sk_load_a8_avx+0x5a>
+ DB 117,66 ; jne af61 <_sk_load_a8_avx+0x5a>
DB 196,130,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm0
- DB 197,249,219,5,27,37,2,0 ; vpand 0x2251b(%rip),%xmm0,%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,249,219,5,35,37,2,0 ; vpand 0x22523(%rip),%xmm0,%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,251,26,2,0 ; vbroadcastss 0x21afb(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,211,35,2,0 ; vbroadcastss 0x223d3(%rip),%ymm1 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -10344,15 +10342,15 @@ _sk_load_a8_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,176 ; ja af2d <_sk_load_a8_avx+0x1e>
+ DB 119,176 ; ja af25 <_sk_load_a8_avx+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,120,0,0,0 ; lea 0x78(%rip),%r10 # b000 <_sk_load_a8_avx+0xf1>
+ DB 76,141,21,120,0,0,0 ; lea 0x78(%rip),%r10 # aff8 <_sk_load_a8_avx+0xf1>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,145 ; jmp af2d <_sk_load_a8_avx+0x1e>
+ DB 235,145 ; jmp af25 <_sk_load_a8_avx+0x1e>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -10360,7 +10358,7 @@ _sk_load_a8_avx LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,105,255,255,255 ; jmpq af2d <_sk_load_a8_avx+0x1e>
+ DB 233,105,255,255,255 ; jmpq af25 <_sk_load_a8_avx+0x1e>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -10371,7 +10369,7 @@ _sk_load_a8_avx LABEL PROC
DB 196,129,121,110,12,24 ; vmovd (%r8,%r11,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,46,255,255,255 ; jmpq af2d <_sk_load_a8_avx+0x1e>
+ DB 233,46,255,255,255 ; jmpq af25 <_sk_load_a8_avx+0x1e>
DB 144 ; nop
DB 145 ; xchg %eax,%ecx
DB 255 ; (bad)
@@ -10380,7 +10378,7 @@ _sk_load_a8_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf00b010 <_sk_overlay_sse2_8bit+0xffffffffdefdeaa4>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf00b008 <_sk_overlay_sse2_8bit+0xffffffffdefdeab0>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -10400,15 +10398,15 @@ _sk_load_a8_dst_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,66 ; jne b076 <_sk_load_a8_dst_avx+0x5a>
+ DB 117,66 ; jne b06e <_sk_load_a8_dst_avx+0x5a>
DB 196,130,121,48,36,24 ; vpmovzxbw (%r8,%r11,1),%xmm4
- DB 197,217,219,37,14,36,2,0 ; vpand 0x2240e(%rip),%xmm4,%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,217,219,37,22,36,2,0 ; vpand 0x22416(%rip),%xmm4,%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,238,25,2,0 ; vbroadcastss 0x219ee(%rip),%ymm5 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,45,198,34,2,0 ; vbroadcastss 0x222c6(%rip),%ymm5 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
@@ -10420,15 +10418,15 @@ _sk_load_a8_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,176 ; ja b03a <_sk_load_a8_dst_avx+0x1e>
+ DB 119,176 ; ja b032 <_sk_load_a8_dst_avx+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # b10c <_sk_load_a8_dst_avx+0xf0>
+ DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # b104 <_sk_load_a8_dst_avx+0xf0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,145 ; jmp b03a <_sk_load_a8_dst_avx+0x1e>
+ DB 235,145 ; jmp b032 <_sk_load_a8_dst_avx+0x1e>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -10436,7 +10434,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,105,255,255,255 ; jmpq b03a <_sk_load_a8_dst_avx+0x1e>
+ DB 233,105,255,255,255 ; jmpq b032 <_sk_load_a8_dst_avx+0x1e>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -10447,7 +10445,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 196,129,121,110,44,24 ; vmovd (%r8,%r11,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,46,255,255,255 ; jmpq b03a <_sk_load_a8_dst_avx+0x1e>
+ DB 233,46,255,255,255 ; jmpq b032 <_sk_load_a8_dst_avx+0x1e>
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -10514,7 +10512,7 @@ _sk_gather_a8_avx LABEL PROC
DB 196,226,121,49,201 ; vpmovzxbd %xmm1,%xmm1
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,85,24,2,0 ; vbroadcastss 0x21855(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,45,33,2,0 ; vbroadcastss 0x2212d(%rip),%ymm1 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -10534,14 +10532,14 @@ _sk_store_a8_avx LABEL PROC
DB 77,15,175,193 ; imul %r9,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,214,23,2,0 ; vbroadcastss 0x217d6(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,174,32,2,0 ; vbroadcastss 0x220ae(%rip),%ymm8 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne b25b <_sk_store_a8_avx+0x45>
+ DB 117,10 ; jne b253 <_sk_store_a8_avx+0x45>
DB 196,1,123,17,4,24 ; vmovsd %xmm8,(%r8,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10549,25 +10547,25 @@ _sk_store_a8_avx LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja b257 <_sk_store_a8_avx+0x41>
+ DB 119,236 ; ja b24f <_sk_store_a8_avx+0x41>
DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,85,0,0,0 ; lea 0x55(%rip),%r10 # b2d0 <_sk_store_a8_avx+0xba>
+ DB 76,141,21,85,0,0,0 ; lea 0x55(%rip),%r10 # b2c8 <_sk_store_a8_avx+0xba>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,3,121,20,4,24,0 ; vpextrb $0x0,%xmm8,(%r8,%r11,1)
- DB 235,202 ; jmp b257 <_sk_store_a8_avx+0x41>
+ DB 235,202 ; jmp b24f <_sk_store_a8_avx+0x41>
DB 196,3,121,20,68,24,2,4 ; vpextrb $0x4,%xmm8,0x2(%r8,%r11,1)
- DB 196,98,57,0,5,194,33,2,0 ; vpshufb 0x221c2(%rip),%xmm8,%xmm8 # 2d460 <_sk_overlay_sse2_8bit+0xef4>
+ DB 196,98,57,0,5,202,33,2,0 ; vpshufb 0x221ca(%rip),%xmm8,%xmm8 # 2d460 <_sk_overlay_sse2_8bit+0xf08>
DB 196,3,121,21,4,24,0 ; vpextrw $0x0,%xmm8,(%r8,%r11,1)
- DB 235,176 ; jmp b257 <_sk_store_a8_avx+0x41>
+ DB 235,176 ; jmp b24f <_sk_store_a8_avx+0x41>
DB 196,3,121,20,68,24,6,12 ; vpextrb $0xc,%xmm8,0x6(%r8,%r11,1)
DB 196,3,121,20,68,24,5,10 ; vpextrb $0xa,%xmm8,0x5(%r8,%r11,1)
DB 196,3,121,20,68,24,4,8 ; vpextrb $0x8,%xmm8,0x4(%r8,%r11,1)
- DB 196,98,57,0,5,168,33,2,0 ; vpshufb 0x221a8(%rip),%xmm8,%xmm8 # 2d470 <_sk_overlay_sse2_8bit+0xf04>
+ DB 196,98,57,0,5,176,33,2,0 ; vpshufb 0x221b0(%rip),%xmm8,%xmm8 # 2d470 <_sk_overlay_sse2_8bit+0xf18>
DB 196,1,121,126,4,24 ; vmovd %xmm8,(%r8,%r11,1)
- DB 235,135 ; jmp b257 <_sk_store_a8_avx+0x41>
+ DB 235,135 ; jmp b24f <_sk_store_a8_avx+0x41>
DB 180,255 ; mov $0xff,%ah
DB 255 ; (bad)
DB 255,197 ; inc %ebp
@@ -10597,18 +10595,18 @@ _sk_load_g8_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,71 ; jne b34b <_sk_load_g8_avx+0x5f>
+ DB 117,71 ; jne b343 <_sk_load_g8_avx+0x5f>
DB 196,130,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm0
- DB 197,249,219,5,62,33,2,0 ; vpand 0x2213e(%rip),%xmm0,%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,249,219,5,70,33,2,0 ; vpand 0x22146(%rip),%xmm0,%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,30,23,2,0 ; vbroadcastss 0x2171e(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,246,31,2,0 ; vbroadcastss 0x21ff6(%rip),%ymm1 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,155,22,2,0 ; vbroadcastss 0x2169b(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,115,31,2,0 ; vbroadcastss 0x21f73(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -10617,15 +10615,15 @@ _sk_load_g8_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,171 ; ja b30a <_sk_load_g8_avx+0x1e>
+ DB 119,171 ; ja b302 <_sk_load_g8_avx+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,122,0,0,0 ; lea 0x7a(%rip),%r10 # b3e4 <_sk_load_g8_avx+0xf8>
+ DB 76,141,21,122,0,0,0 ; lea 0x7a(%rip),%r10 # b3dc <_sk_load_g8_avx+0xf8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,140 ; jmp b30a <_sk_load_g8_avx+0x1e>
+ DB 235,140 ; jmp b302 <_sk_load_g8_avx+0x1e>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -10633,7 +10631,7 @@ _sk_load_g8_avx LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,100,255,255,255 ; jmpq b30a <_sk_load_g8_avx+0x1e>
+ DB 233,100,255,255,255 ; jmpq b302 <_sk_load_g8_avx+0x1e>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -10644,7 +10642,7 @@ _sk_load_g8_avx LABEL PROC
DB 196,129,121,110,12,24 ; vmovd (%r8,%r11,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,41,255,255,255 ; jmpq b30a <_sk_load_g8_avx+0x1e>
+ DB 233,41,255,255,255 ; jmpq b302 <_sk_load_g8_avx+0x1e>
DB 15,31,0 ; nopl (%rax)
DB 143 ; (bad)
DB 255 ; (bad)
@@ -10675,18 +10673,18 @@ _sk_load_g8_dst_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,71 ; jne b45f <_sk_load_g8_dst_avx+0x5f>
+ DB 117,71 ; jne b457 <_sk_load_g8_dst_avx+0x5f>
DB 196,130,121,48,36,24 ; vpmovzxbw (%r8,%r11,1),%xmm4
- DB 197,217,219,37,42,32,2,0 ; vpand 0x2202a(%rip),%xmm4,%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 197,217,219,37,50,32,2,0 ; vpand 0x22032(%rip),%xmm4,%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,10,22,2,0 ; vbroadcastss 0x2160a(%rip),%ymm5 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,45,226,30,2,0 ; vbroadcastss 0x21ee2(%rip),%ymm5 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,135,21,2,0 ; vbroadcastss 0x21587(%rip),%ymm7 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,61,95,30,2,0 ; vbroadcastss 0x21e5f(%rip),%ymm7 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,40,236 ; vmovaps %ymm4,%ymm5
DB 197,252,40,244 ; vmovaps %ymm4,%ymm6
DB 255,224 ; jmpq *%rax
@@ -10695,15 +10693,15 @@ _sk_load_g8_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,171 ; ja b41e <_sk_load_g8_dst_avx+0x1e>
+ DB 119,171 ; ja b416 <_sk_load_g8_dst_avx+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,122,0,0,0 ; lea 0x7a(%rip),%r10 # b4f8 <_sk_load_g8_dst_avx+0xf8>
+ DB 76,141,21,122,0,0,0 ; lea 0x7a(%rip),%r10 # b4f0 <_sk_load_g8_dst_avx+0xf8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,140 ; jmp b41e <_sk_load_g8_dst_avx+0x1e>
+ DB 235,140 ; jmp b416 <_sk_load_g8_dst_avx+0x1e>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -10711,7 +10709,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,100,255,255,255 ; jmpq b41e <_sk_load_g8_dst_avx+0x1e>
+ DB 233,100,255,255,255 ; jmpq b416 <_sk_load_g8_dst_avx+0x1e>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -10722,7 +10720,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 196,129,121,110,44,24 ; vmovd (%r8,%r11,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,41,255,255,255 ; jmpq b41e <_sk_load_g8_dst_avx+0x1e>
+ DB 233,41,255,255,255 ; jmpq b416 <_sk_load_g8_dst_avx+0x1e>
DB 15,31,0 ; nopl (%rax)
DB 143 ; (bad)
DB 255 ; (bad)
@@ -10790,10 +10788,10 @@ _sk_gather_g8_avx LABEL PROC
DB 196,226,121,49,201 ; vpmovzxbd %xmm1,%xmm1
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,105,20,2,0 ; vbroadcastss 0x21469(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,65,29,2,0 ; vbroadcastss 0x21d41(%rip),%ymm1 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,230,19,2,0 ; vbroadcastss 0x213e6(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,190,28,2,0 ; vbroadcastss 0x21cbe(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -10812,56 +10810,56 @@ _sk_load_565_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,128,0,0,0 ; jne b6a6 <_sk_load_565_avx+0x9f>
+ DB 15,133,128,0,0,0 ; jne b69e <_sk_load_565_avx+0x9f>
DB 196,129,122,111,4,88 ; vmovdqu (%r8,%r11,2),%xmm0
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,12,20,2,0 ; vbroadcastss 0x2140c(%rip),%ymm0 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,226,125,24,5,228,28,2,0 ; vbroadcastss 0x21ce4(%rip),%ymm0 # 2d324 <_sk_overlay_sse2_8bit+0xdcc>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,255,19,2,0 ; vbroadcastss 0x213ff(%rip),%ymm1 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,226,125,24,13,215,28,2,0 ; vbroadcastss 0x21cd7(%rip),%ymm1 # 2d328 <_sk_overlay_sse2_8bit+0xdd0>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,246,19,2,0 ; vbroadcastss 0x213f6(%rip),%ymm1 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,226,125,24,13,206,28,2,0 ; vbroadcastss 0x21cce(%rip),%ymm1 # 2d32c <_sk_overlay_sse2_8bit+0xdd4>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,233,19,2,0 ; vbroadcastss 0x213e9(%rip),%ymm3 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,226,125,24,29,193,28,2,0 ; vbroadcastss 0x21cc1(%rip),%ymm3 # 2d330 <_sk_overlay_sse2_8bit+0xdd8>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,224,19,2,0 ; vbroadcastss 0x213e0(%rip),%ymm3 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,226,125,24,29,184,28,2,0 ; vbroadcastss 0x21cb8(%rip),%ymm3 # 2d334 <_sk_overlay_sse2_8bit+0xddc>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,211,19,2,0 ; vbroadcastss 0x213d3(%rip),%ymm3 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,226,125,24,29,171,28,2,0 ; vbroadcastss 0x21cab(%rip),%ymm3 # 2d338 <_sk_overlay_sse2_8bit+0xde0>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,56,19,2,0 ; vbroadcastss 0x21338(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,16,28,2,0 ; vbroadcastss 0x21c10(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,110,255,255,255 ; ja b62c <_sk_load_565_avx+0x25>
+ DB 15,135,110,255,255,255 ; ja b624 <_sk_load_565_avx+0x25>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,99,0,0,0 ; lea 0x63(%rip),%r10 # b72c <_sk_load_565_avx+0x125>
+ DB 76,141,21,99,0,0,0 ; lea 0x63(%rip),%r10 # b724 <_sk_load_565_avx+0x125>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,76,255,255,255 ; jmpq b62c <_sk_load_565_avx+0x25>
+ DB 233,76,255,255,255 ; jmpq b624 <_sk_load_565_avx+0x25>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,129,121,196,68,88,4,2 ; vpinsrw $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,121,110,12,88 ; vmovd (%r8,%r11,2),%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,47,255,255,255 ; jmpq b62c <_sk_load_565_avx+0x25>
+ DB 233,47,255,255,255 ; jmpq b624 <_sk_load_565_avx+0x25>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,129,121,196,68,88,12,6 ; vpinsrw $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,121,196,68,88,10,5 ; vpinsrw $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,121,196,68,88,8,4 ; vpinsrw $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,122,126,12,88 ; vmovq (%r8,%r11,2),%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,2,255,255,255 ; jmpq b62c <_sk_load_565_avx+0x25>
+ DB 233,2,255,255,255 ; jmpq b624 <_sk_load_565_avx+0x25>
DB 102,144 ; xchg %ax,%ax
DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -10892,56 +10890,56 @@ _sk_load_565_dst_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,128,0,0,0 ; jne b7e7 <_sk_load_565_dst_avx+0x9f>
+ DB 15,133,128,0,0,0 ; jne b7df <_sk_load_565_dst_avx+0x9f>
DB 196,129,122,111,36,88 ; vmovdqu (%r8,%r11,2),%xmm4
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,245,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- DB 196,226,125,24,37,203,18,2,0 ; vbroadcastss 0x212cb(%rip),%ymm4 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,226,125,24,37,163,27,2,0 ; vbroadcastss 0x21ba3(%rip),%ymm4 # 2d324 <_sk_overlay_sse2_8bit+0xdcc>
DB 197,204,84,228 ; vandps %ymm4,%ymm6,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,190,18,2,0 ; vbroadcastss 0x212be(%rip),%ymm5 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,226,125,24,45,150,27,2,0 ; vbroadcastss 0x21b96(%rip),%ymm5 # 2d328 <_sk_overlay_sse2_8bit+0xdd0>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,24,45,181,18,2,0 ; vbroadcastss 0x212b5(%rip),%ymm5 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,226,125,24,45,141,27,2,0 ; vbroadcastss 0x21b8d(%rip),%ymm5 # 2d32c <_sk_overlay_sse2_8bit+0xdd4>
DB 197,204,84,237 ; vandps %ymm5,%ymm6,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,61,168,18,2,0 ; vbroadcastss 0x212a8(%rip),%ymm7 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,226,125,24,61,128,27,2,0 ; vbroadcastss 0x21b80(%rip),%ymm7 # 2d330 <_sk_overlay_sse2_8bit+0xdd8>
DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5
- DB 196,226,125,24,61,159,18,2,0 ; vbroadcastss 0x2129f(%rip),%ymm7 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,226,125,24,61,119,27,2,0 ; vbroadcastss 0x21b77(%rip),%ymm7 # 2d334 <_sk_overlay_sse2_8bit+0xddc>
DB 197,204,84,247 ; vandps %ymm7,%ymm6,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,226,125,24,61,146,18,2,0 ; vbroadcastss 0x21292(%rip),%ymm7 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,226,125,24,61,106,27,2,0 ; vbroadcastss 0x21b6a(%rip),%ymm7 # 2d338 <_sk_overlay_sse2_8bit+0xde0>
DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,247,17,2,0 ; vbroadcastss 0x211f7(%rip),%ymm7 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,61,207,26,2,0 ; vbroadcastss 0x21acf(%rip),%ymm7 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,110,255,255,255 ; ja b76d <_sk_load_565_dst_avx+0x25>
+ DB 15,135,110,255,255,255 ; ja b765 <_sk_load_565_dst_avx+0x25>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,98,0,0,0 ; lea 0x62(%rip),%r10 # b86c <_sk_load_565_dst_avx+0x124>
+ DB 76,141,21,98,0,0,0 ; lea 0x62(%rip),%r10 # b864 <_sk_load_565_dst_avx+0x124>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,76,255,255,255 ; jmpq b76d <_sk_load_565_dst_avx+0x25>
+ DB 233,76,255,255,255 ; jmpq b765 <_sk_load_565_dst_avx+0x25>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,129,89,196,100,88,4,2 ; vpinsrw $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,121,110,44,88 ; vmovd (%r8,%r11,2),%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,47,255,255,255 ; jmpq b76d <_sk_load_565_dst_avx+0x25>
+ DB 233,47,255,255,255 ; jmpq b765 <_sk_load_565_dst_avx+0x25>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,129,89,196,100,88,12,6 ; vpinsrw $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,89,196,100,88,10,5 ; vpinsrw $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,89,196,100,88,8,4 ; vpinsrw $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,122,126,44,88 ; vmovq (%r8,%r11,2),%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,2,255,255,255 ; jmpq b76d <_sk_load_565_dst_avx+0x25>
+ DB 233,2,255,255,255 ; jmpq b765 <_sk_load_565_dst_avx+0x25>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -11014,23 +11012,23 @@ _sk_gather_565_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,242,16,2,0 ; vbroadcastss 0x210f2(%rip),%ymm0 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,226,125,24,5,202,25,2,0 ; vbroadcastss 0x219ca(%rip),%ymm0 # 2d324 <_sk_overlay_sse2_8bit+0xdcc>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,229,16,2,0 ; vbroadcastss 0x210e5(%rip),%ymm1 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,226,125,24,13,189,25,2,0 ; vbroadcastss 0x219bd(%rip),%ymm1 # 2d328 <_sk_overlay_sse2_8bit+0xdd0>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,220,16,2,0 ; vbroadcastss 0x210dc(%rip),%ymm1 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,226,125,24,13,180,25,2,0 ; vbroadcastss 0x219b4(%rip),%ymm1 # 2d32c <_sk_overlay_sse2_8bit+0xdd4>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,207,16,2,0 ; vbroadcastss 0x210cf(%rip),%ymm3 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,226,125,24,29,167,25,2,0 ; vbroadcastss 0x219a7(%rip),%ymm3 # 2d330 <_sk_overlay_sse2_8bit+0xdd8>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,198,16,2,0 ; vbroadcastss 0x210c6(%rip),%ymm3 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,226,125,24,29,158,25,2,0 ; vbroadcastss 0x2199e(%rip),%ymm3 # 2d334 <_sk_overlay_sse2_8bit+0xddc>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,185,16,2,0 ; vbroadcastss 0x210b9(%rip),%ymm3 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,226,125,24,29,145,25,2,0 ; vbroadcastss 0x21991(%rip),%ymm3 # 2d338 <_sk_overlay_sse2_8bit+0xde0>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,30,16,2,0 ; vbroadcastss 0x2101e(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,246,24,2,0 ; vbroadcastss 0x218f6(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 91 ; pop %rbx
DB 65,92 ; pop %r12
DB 65,94 ; pop %r14
@@ -11047,14 +11045,14 @@ _sk_store_565_avx LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,225,16,2,0 ; vbroadcastss 0x210e1(%rip),%ymm8 # 2cac8 <_sk_overlay_sse2_8bit+0x55c>
+ DB 196,98,125,24,5,185,25,2,0 ; vbroadcastss 0x219b9(%rip),%ymm8 # 2d398 <_sk_overlay_sse2_8bit+0xe40>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,11 ; vpslld $0xb,%xmm9,%xmm10
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
DB 196,193,49,114,241,11 ; vpslld $0xb,%xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- DB 196,98,125,24,21,186,16,2,0 ; vbroadcastss 0x210ba(%rip),%ymm10 # 2cacc <_sk_overlay_sse2_8bit+0x560>
+ DB 196,98,125,24,21,146,25,2,0 ; vbroadcastss 0x21992(%rip),%ymm10 # 2d39c <_sk_overlay_sse2_8bit+0xe44>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,33,114,242,5 ; vpslld $0x5,%xmm10,%xmm11
@@ -11068,7 +11066,7 @@ _sk_store_565_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne ba62 <_sk_store_565_avx+0x9a>
+ DB 117,10 ; jne ba5a <_sk_store_565_avx+0x9a>
DB 196,1,122,127,4,88 ; vmovdqu %xmm8,(%r8,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -11076,22 +11074,22 @@ _sk_store_565_avx LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja ba5e <_sk_store_565_avx+0x96>
+ DB 119,236 ; ja ba56 <_sk_store_565_avx+0x96>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,67,0,0,0 ; lea 0x43(%rip),%r10 # bac0 <_sk_store_565_avx+0xf8>
+ DB 76,141,21,67,0,0,0 ; lea 0x43(%rip),%r10 # bab8 <_sk_store_565_avx+0xf8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,3,121,21,4,88,0 ; vpextrw $0x0,%xmm8,(%r8,%r11,2)
- DB 235,207 ; jmp ba5e <_sk_store_565_avx+0x96>
+ DB 235,207 ; jmp ba56 <_sk_store_565_avx+0x96>
DB 196,3,121,21,68,88,4,2 ; vpextrw $0x2,%xmm8,0x4(%r8,%r11,2)
DB 196,1,121,126,4,88 ; vmovd %xmm8,(%r8,%r11,2)
- DB 235,191 ; jmp ba5e <_sk_store_565_avx+0x96>
+ DB 235,191 ; jmp ba56 <_sk_store_565_avx+0x96>
DB 196,3,121,21,68,88,12,6 ; vpextrw $0x6,%xmm8,0xc(%r8,%r11,2)
DB 196,3,121,21,68,88,10,5 ; vpextrw $0x5,%xmm8,0xa(%r8,%r11,2)
DB 196,3,121,21,68,88,8,4 ; vpextrw $0x4,%xmm8,0x8(%r8,%r11,2)
DB 196,1,121,214,4,88 ; vmovq %xmm8,(%r8,%r11,2)
- DB 235,159 ; jmp ba5e <_sk_store_565_avx+0x96>
+ DB 235,159 ; jmp ba56 <_sk_store_565_avx+0x96>
DB 144 ; nop
DB 198 ; (bad)
DB 255 ; (bad)
@@ -11127,31 +11125,31 @@ _sk_load_4444_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,152,0,0,0 ; jne bb93 <_sk_load_4444_avx+0xb7>
+ DB 15,133,152,0,0,0 ; jne bb8b <_sk_load_4444_avx+0xb7>
DB 196,129,122,111,4,88 ; vmovdqu (%r8,%r11,2),%xmm0
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,179,15,2,0 ; vbroadcastss 0x20fb3(%rip),%ymm0 # 2cad0 <_sk_overlay_sse2_8bit+0x564>
+ DB 196,226,125,24,5,139,24,2,0 ; vbroadcastss 0x2188b(%rip),%ymm0 # 2d3a0 <_sk_overlay_sse2_8bit+0xe48>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,166,15,2,0 ; vbroadcastss 0x20fa6(%rip),%ymm1 # 2cad4 <_sk_overlay_sse2_8bit+0x568>
+ DB 196,226,125,24,13,126,24,2,0 ; vbroadcastss 0x2187e(%rip),%ymm1 # 2d3a4 <_sk_overlay_sse2_8bit+0xe4c>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,157,15,2,0 ; vbroadcastss 0x20f9d(%rip),%ymm1 # 2cad8 <_sk_overlay_sse2_8bit+0x56c>
+ DB 196,226,125,24,13,117,24,2,0 ; vbroadcastss 0x21875(%rip),%ymm1 # 2d3a8 <_sk_overlay_sse2_8bit+0xe50>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,144,15,2,0 ; vbroadcastss 0x20f90(%rip),%ymm2 # 2cadc <_sk_overlay_sse2_8bit+0x570>
+ DB 196,226,125,24,21,104,24,2,0 ; vbroadcastss 0x21868(%rip),%ymm2 # 2d3ac <_sk_overlay_sse2_8bit+0xe54>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,135,15,2,0 ; vbroadcastss 0x20f87(%rip),%ymm2 # 2cae0 <_sk_overlay_sse2_8bit+0x574>
+ DB 196,226,125,24,21,95,24,2,0 ; vbroadcastss 0x2185f(%rip),%ymm2 # 2d3b0 <_sk_overlay_sse2_8bit+0xe58>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,122,15,2,0 ; vbroadcastss 0x20f7a(%rip),%ymm8 # 2cae4 <_sk_overlay_sse2_8bit+0x578>
+ DB 196,98,125,24,5,82,24,2,0 ; vbroadcastss 0x21852(%rip),%ymm8 # 2d3b4 <_sk_overlay_sse2_8bit+0xe5c>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,112,15,2,0 ; vbroadcastss 0x20f70(%rip),%ymm8 # 2cae8 <_sk_overlay_sse2_8bit+0x57c>
+ DB 196,98,125,24,5,72,24,2,0 ; vbroadcastss 0x21848(%rip),%ymm8 # 2d3b8 <_sk_overlay_sse2_8bit+0xe60>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,98,15,2,0 ; vbroadcastss 0x20f62(%rip),%ymm8 # 2caec <_sk_overlay_sse2_8bit+0x580>
+ DB 196,98,125,24,5,58,24,2,0 ; vbroadcastss 0x2183a(%rip),%ymm8 # 2d3bc <_sk_overlay_sse2_8bit+0xe64>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -11160,27 +11158,27 @@ _sk_load_4444_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,86,255,255,255 ; ja bb01 <_sk_load_4444_avx+0x25>
+ DB 15,135,86,255,255,255 ; ja baf9 <_sk_load_4444_avx+0x25>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,98,0,0,0 ; lea 0x62(%rip),%r10 # bc18 <_sk_load_4444_avx+0x13c>
+ DB 76,141,21,98,0,0,0 ; lea 0x62(%rip),%r10 # bc10 <_sk_load_4444_avx+0x13c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,52,255,255,255 ; jmpq bb01 <_sk_load_4444_avx+0x25>
+ DB 233,52,255,255,255 ; jmpq baf9 <_sk_load_4444_avx+0x25>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,129,121,196,68,88,4,2 ; vpinsrw $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,121,110,12,88 ; vmovd (%r8,%r11,2),%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,23,255,255,255 ; jmpq bb01 <_sk_load_4444_avx+0x25>
+ DB 233,23,255,255,255 ; jmpq baf9 <_sk_load_4444_avx+0x25>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,129,121,196,68,88,12,6 ; vpinsrw $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,121,196,68,88,10,5 ; vpinsrw $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,121,196,68,88,8,4 ; vpinsrw $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
DB 196,129,122,126,12,88 ; vmovq (%r8,%r11,2),%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,234,254,255,255 ; jmpq bb01 <_sk_load_4444_avx+0x25>
+ DB 233,234,254,255,255 ; jmpq baf9 <_sk_load_4444_avx+0x25>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -11212,31 +11210,31 @@ _sk_load_4444_dst_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,152,0,0,0 ; jne bceb <_sk_load_4444_dst_avx+0xb7>
+ DB 15,133,152,0,0,0 ; jne bce3 <_sk_load_4444_dst_avx+0xb7>
DB 196,129,122,111,36,88 ; vmovdqu (%r8,%r11,2),%xmm4
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,253,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- DB 196,226,125,24,37,91,14,2,0 ; vbroadcastss 0x20e5b(%rip),%ymm4 # 2cad0 <_sk_overlay_sse2_8bit+0x564>
+ DB 196,226,125,24,37,51,23,2,0 ; vbroadcastss 0x21733(%rip),%ymm4 # 2d3a0 <_sk_overlay_sse2_8bit+0xe48>
DB 197,196,84,228 ; vandps %ymm4,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,78,14,2,0 ; vbroadcastss 0x20e4e(%rip),%ymm5 # 2cad4 <_sk_overlay_sse2_8bit+0x568>
+ DB 196,226,125,24,45,38,23,2,0 ; vbroadcastss 0x21726(%rip),%ymm5 # 2d3a4 <_sk_overlay_sse2_8bit+0xe4c>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,24,45,69,14,2,0 ; vbroadcastss 0x20e45(%rip),%ymm5 # 2cad8 <_sk_overlay_sse2_8bit+0x56c>
+ DB 196,226,125,24,45,29,23,2,0 ; vbroadcastss 0x2171d(%rip),%ymm5 # 2d3a8 <_sk_overlay_sse2_8bit+0xe50>
DB 197,196,84,237 ; vandps %ymm5,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,53,56,14,2,0 ; vbroadcastss 0x20e38(%rip),%ymm6 # 2cadc <_sk_overlay_sse2_8bit+0x570>
+ DB 196,226,125,24,53,16,23,2,0 ; vbroadcastss 0x21710(%rip),%ymm6 # 2d3ac <_sk_overlay_sse2_8bit+0xe54>
DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5
- DB 196,226,125,24,53,47,14,2,0 ; vbroadcastss 0x20e2f(%rip),%ymm6 # 2cae0 <_sk_overlay_sse2_8bit+0x574>
+ DB 196,226,125,24,53,7,23,2,0 ; vbroadcastss 0x21707(%rip),%ymm6 # 2d3b0 <_sk_overlay_sse2_8bit+0xe58>
DB 197,196,84,246 ; vandps %ymm6,%ymm7,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,98,125,24,5,34,14,2,0 ; vbroadcastss 0x20e22(%rip),%ymm8 # 2cae4 <_sk_overlay_sse2_8bit+0x578>
+ DB 196,98,125,24,5,250,22,2,0 ; vbroadcastss 0x216fa(%rip),%ymm8 # 2d3b4 <_sk_overlay_sse2_8bit+0xe5c>
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
- DB 196,98,125,24,5,24,14,2,0 ; vbroadcastss 0x20e18(%rip),%ymm8 # 2cae8 <_sk_overlay_sse2_8bit+0x57c>
+ DB 196,98,125,24,5,240,22,2,0 ; vbroadcastss 0x216f0(%rip),%ymm8 # 2d3b8 <_sk_overlay_sse2_8bit+0xe60>
DB 196,193,68,84,248 ; vandps %ymm8,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,10,14,2,0 ; vbroadcastss 0x20e0a(%rip),%ymm8 # 2caec <_sk_overlay_sse2_8bit+0x580>
+ DB 196,98,125,24,5,226,22,2,0 ; vbroadcastss 0x216e2(%rip),%ymm8 # 2d3bc <_sk_overlay_sse2_8bit+0xe64>
DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -11245,27 +11243,27 @@ _sk_load_4444_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,86,255,255,255 ; ja bc59 <_sk_load_4444_dst_avx+0x25>
+ DB 15,135,86,255,255,255 ; ja bc51 <_sk_load_4444_dst_avx+0x25>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,98,0,0,0 ; lea 0x62(%rip),%r10 # bd70 <_sk_load_4444_dst_avx+0x13c>
+ DB 76,141,21,98,0,0,0 ; lea 0x62(%rip),%r10 # bd68 <_sk_load_4444_dst_avx+0x13c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,52,255,255,255 ; jmpq bc59 <_sk_load_4444_dst_avx+0x25>
+ DB 233,52,255,255,255 ; jmpq bc51 <_sk_load_4444_dst_avx+0x25>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,129,89,196,100,88,4,2 ; vpinsrw $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,121,110,44,88 ; vmovd (%r8,%r11,2),%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,23,255,255,255 ; jmpq bc59 <_sk_load_4444_dst_avx+0x25>
+ DB 233,23,255,255,255 ; jmpq bc51 <_sk_load_4444_dst_avx+0x25>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,129,89,196,100,88,12,6 ; vpinsrw $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,89,196,100,88,10,5 ; vpinsrw $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,89,196,100,88,8,4 ; vpinsrw $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
DB 196,129,122,126,44,88 ; vmovq (%r8,%r11,2),%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,234,254,255,255 ; jmpq bc59 <_sk_load_4444_dst_avx+0x25>
+ DB 233,234,254,255,255 ; jmpq bc51 <_sk_load_4444_dst_avx+0x25>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -11338,25 +11336,25 @@ _sk_gather_4444_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,106,12,2,0 ; vbroadcastss 0x20c6a(%rip),%ymm0 # 2cad0 <_sk_overlay_sse2_8bit+0x564>
+ DB 196,226,125,24,5,66,21,2,0 ; vbroadcastss 0x21542(%rip),%ymm0 # 2d3a0 <_sk_overlay_sse2_8bit+0xe48>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,93,12,2,0 ; vbroadcastss 0x20c5d(%rip),%ymm1 # 2cad4 <_sk_overlay_sse2_8bit+0x568>
+ DB 196,226,125,24,13,53,21,2,0 ; vbroadcastss 0x21535(%rip),%ymm1 # 2d3a4 <_sk_overlay_sse2_8bit+0xe4c>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,84,12,2,0 ; vbroadcastss 0x20c54(%rip),%ymm1 # 2cad8 <_sk_overlay_sse2_8bit+0x56c>
+ DB 196,226,125,24,13,44,21,2,0 ; vbroadcastss 0x2152c(%rip),%ymm1 # 2d3a8 <_sk_overlay_sse2_8bit+0xe50>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,71,12,2,0 ; vbroadcastss 0x20c47(%rip),%ymm2 # 2cadc <_sk_overlay_sse2_8bit+0x570>
+ DB 196,226,125,24,21,31,21,2,0 ; vbroadcastss 0x2151f(%rip),%ymm2 # 2d3ac <_sk_overlay_sse2_8bit+0xe54>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,62,12,2,0 ; vbroadcastss 0x20c3e(%rip),%ymm2 # 2cae0 <_sk_overlay_sse2_8bit+0x574>
+ DB 196,226,125,24,21,22,21,2,0 ; vbroadcastss 0x21516(%rip),%ymm2 # 2d3b0 <_sk_overlay_sse2_8bit+0xe58>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,49,12,2,0 ; vbroadcastss 0x20c31(%rip),%ymm8 # 2cae4 <_sk_overlay_sse2_8bit+0x578>
+ DB 196,98,125,24,5,9,21,2,0 ; vbroadcastss 0x21509(%rip),%ymm8 # 2d3b4 <_sk_overlay_sse2_8bit+0xe5c>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,39,12,2,0 ; vbroadcastss 0x20c27(%rip),%ymm8 # 2cae8 <_sk_overlay_sse2_8bit+0x57c>
+ DB 196,98,125,24,5,255,20,2,0 ; vbroadcastss 0x214ff(%rip),%ymm8 # 2d3b8 <_sk_overlay_sse2_8bit+0xe60>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,25,12,2,0 ; vbroadcastss 0x20c19(%rip),%ymm8 # 2caec <_sk_overlay_sse2_8bit+0x580>
+ DB 196,98,125,24,5,241,20,2,0 ; vbroadcastss 0x214f1(%rip),%ymm8 # 2d3bc <_sk_overlay_sse2_8bit+0xe64>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -11375,7 +11373,7 @@ _sk_store_4444_avx LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,237,11,2,0 ; vbroadcastss 0x20bed(%rip),%ymm8 # 2caf0 <_sk_overlay_sse2_8bit+0x584>
+ DB 196,98,125,24,5,197,20,2,0 ; vbroadcastss 0x214c5(%rip),%ymm8 # 2d3c0 <_sk_overlay_sse2_8bit+0xe68>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,12 ; vpslld $0xc,%xmm9,%xmm10
@@ -11402,7 +11400,7 @@ _sk_store_4444_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne bf9c <_sk_store_4444_avx+0xb8>
+ DB 117,10 ; jne bf94 <_sk_store_4444_avx+0xb8>
DB 196,1,122,127,4,88 ; vmovdqu %xmm8,(%r8,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -11410,22 +11408,22 @@ _sk_store_4444_avx LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja bf98 <_sk_store_4444_avx+0xb4>
+ DB 119,236 ; ja bf90 <_sk_store_4444_avx+0xb4>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,69,0,0,0 ; lea 0x45(%rip),%r10 # bffc <_sk_store_4444_avx+0x118>
+ DB 76,141,21,69,0,0,0 ; lea 0x45(%rip),%r10 # bff4 <_sk_store_4444_avx+0x118>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,3,121,21,4,88,0 ; vpextrw $0x0,%xmm8,(%r8,%r11,2)
- DB 235,207 ; jmp bf98 <_sk_store_4444_avx+0xb4>
+ DB 235,207 ; jmp bf90 <_sk_store_4444_avx+0xb4>
DB 196,3,121,21,68,88,4,2 ; vpextrw $0x2,%xmm8,0x4(%r8,%r11,2)
DB 196,1,121,126,4,88 ; vmovd %xmm8,(%r8,%r11,2)
- DB 235,191 ; jmp bf98 <_sk_store_4444_avx+0xb4>
+ DB 235,191 ; jmp bf90 <_sk_store_4444_avx+0xb4>
DB 196,3,121,21,68,88,12,6 ; vpextrw $0x6,%xmm8,0xc(%r8,%r11,2)
DB 196,3,121,21,68,88,10,5 ; vpextrw $0x5,%xmm8,0xa(%r8,%r11,2)
DB 196,3,121,21,68,88,8,4 ; vpextrw $0x4,%xmm8,0x8(%r8,%r11,2)
DB 196,1,121,214,4,88 ; vmovq %xmm8,(%r8,%r11,2)
- DB 235,159 ; jmp bf98 <_sk_store_4444_avx+0xb4>
+ DB 235,159 ; jmp bf90 <_sk_store_4444_avx+0xb4>
DB 15,31,0 ; nopl (%rax)
DB 196 ; (bad)
DB 255 ; (bad)
@@ -11461,12 +11459,12 @@ _sk_load_8888_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,135,0,0,0 ; jne c0bf <_sk_load_8888_avx+0xa7>
+ DB 15,133,135,0,0,0 ; jne c0b7 <_sk_load_8888_avx+0xa7>
DB 196,1,125,16,12,152 ; vmovupd (%r8,%r11,4),%ymm9
- DB 197,125,40,21,218,14,2,0 ; vmovapd 0x20eda(%rip),%ymm10 # 2cf20 <_sk_overlay_sse2_8bit+0x9b4>
+ DB 197,125,40,21,66,13,2,0 ; vmovapd 0x20d42(%rip),%ymm10 # 2cd80 <_sk_overlay_sse2_8bit+0x828>
DB 196,193,53,84,194 ; vandpd %ymm10,%ymm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,248,9,2,0 ; vbroadcastss 0x209f8(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,208,18,2,0 ; vbroadcastss 0x212d0(%rip),%ymm8 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,193,113,114,209,8 ; vpsrld $0x8,%xmm9,%xmm1
DB 196,99,125,25,203,1 ; vextractf128 $0x1,%ymm9,%xmm3
@@ -11493,21 +11491,21 @@ _sk_load_8888_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,102,255,255,255 ; ja c03e <_sk_load_8888_avx+0x26>
+ DB 15,135,102,255,255,255 ; ja c036 <_sk_load_8888_avx+0x26>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,145,0,0,0 ; lea 0x91(%rip),%r10 # c174 <_sk_load_8888_avx+0x15c>
+ DB 76,141,21,145,0,0,0 ; lea 0x91(%rip),%r10 # c16c <_sk_load_8888_avx+0x15c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,1,122,16,12,152 ; vmovss (%r8,%r11,4),%xmm9
- DB 233,71,255,255,255 ; jmpq c03e <_sk_load_8888_avx+0x26>
+ DB 233,71,255,255,255 ; jmpq c036 <_sk_load_8888_avx+0x26>
DB 196,129,121,110,68,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,99,117,12,200,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm9
DB 196,129,123,16,4,152 ; vmovsd (%r8,%r11,4),%xmm0
DB 196,99,53,13,200,1 ; vblendpd $0x1,%ymm0,%ymm9,%ymm9
- DB 233,32,255,255,255 ; jmpq c03e <_sk_load_8888_avx+0x26>
+ DB 233,32,255,255,255 ; jmpq c036 <_sk_load_8888_avx+0x26>
DB 196,129,121,110,68,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -11521,9 +11519,9 @@ _sk_load_8888_avx LABEL PROC
DB 196,99,53,24,200,1 ; vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
DB 196,129,121,16,4,152 ; vmovupd (%r8,%r11,4),%xmm0
DB 196,67,125,13,201,12 ; vblendpd $0xc,%ymm9,%ymm0,%ymm9
- DB 233,203,254,255,255 ; jmpq c03e <_sk_load_8888_avx+0x26>
+ DB 233,203,254,255,255 ; jmpq c036 <_sk_load_8888_avx+0x26>
DB 144 ; nop
- DB 120,255 ; js c175 <_sk_load_8888_avx+0x15d>
+ DB 120,255 ; js c16d <_sk_load_8888_avx+0x15d>
DB 255 ; (bad)
DB 255,153,255,255,255,131 ; lcall *-0x7c000001(%rcx)
DB 255 ; (bad)
@@ -11554,12 +11552,12 @@ _sk_load_8888_dst_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,135,0,0,0 ; jne c237 <_sk_load_8888_dst_avx+0xa7>
+ DB 15,133,135,0,0,0 ; jne c22f <_sk_load_8888_dst_avx+0xa7>
DB 196,1,125,16,12,152 ; vmovupd (%r8,%r11,4),%ymm9
- DB 197,125,40,21,130,13,2,0 ; vmovapd 0x20d82(%rip),%ymm10 # 2cf40 <_sk_overlay_sse2_8bit+0x9d4>
+ DB 197,125,40,21,234,11,2,0 ; vmovapd 0x20bea(%rip),%ymm10 # 2cda0 <_sk_overlay_sse2_8bit+0x848>
DB 196,193,53,84,226 ; vandpd %ymm10,%ymm9,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,128,8,2,0 ; vbroadcastss 0x20880(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,88,17,2,0 ; vbroadcastss 0x21158(%rip),%ymm8 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
DB 196,193,81,114,209,8 ; vpsrld $0x8,%xmm9,%xmm5
DB 196,99,125,25,207,1 ; vextractf128 $0x1,%ymm9,%xmm7
@@ -11586,21 +11584,21 @@ _sk_load_8888_dst_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,102,255,255,255 ; ja c1b6 <_sk_load_8888_dst_avx+0x26>
+ DB 15,135,102,255,255,255 ; ja c1ae <_sk_load_8888_dst_avx+0x26>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,145,0,0,0 ; lea 0x91(%rip),%r10 # c2ec <_sk_load_8888_dst_avx+0x15c>
+ DB 76,141,21,145,0,0,0 ; lea 0x91(%rip),%r10 # c2e4 <_sk_load_8888_dst_avx+0x15c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,1,122,16,12,152 ; vmovss (%r8,%r11,4),%xmm9
- DB 233,71,255,255,255 ; jmpq c1b6 <_sk_load_8888_dst_avx+0x26>
+ DB 233,71,255,255,255 ; jmpq c1ae <_sk_load_8888_dst_avx+0x26>
DB 196,129,121,110,100,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
DB 196,99,85,12,204,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm9
DB 196,129,123,16,36,152 ; vmovsd (%r8,%r11,4),%xmm4
DB 196,99,53,13,204,1 ; vblendpd $0x1,%ymm4,%ymm9,%ymm9
- DB 233,32,255,255,255 ; jmpq c1b6 <_sk_load_8888_dst_avx+0x26>
+ DB 233,32,255,255,255 ; jmpq c1ae <_sk_load_8888_dst_avx+0x26>
DB 196,129,121,110,100,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -11614,9 +11612,9 @@ _sk_load_8888_dst_avx LABEL PROC
DB 196,99,53,24,204,1 ; vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
DB 196,129,121,16,36,152 ; vmovupd (%r8,%r11,4),%xmm4
DB 196,67,93,13,201,12 ; vblendpd $0xc,%ymm9,%ymm4,%ymm9
- DB 233,203,254,255,255 ; jmpq c1b6 <_sk_load_8888_dst_avx+0x26>
+ DB 233,203,254,255,255 ; jmpq c1ae <_sk_load_8888_dst_avx+0x26>
DB 144 ; nop
- DB 120,255 ; js c2ed <_sk_load_8888_dst_avx+0x15d>
+ DB 120,255 ; js c2e5 <_sk_load_8888_dst_avx+0x15d>
DB 255 ; (bad)
DB 255,153,255,255,255,131 ; lcall *-0x7c000001(%rcx)
DB 255 ; (bad)
@@ -11676,10 +11674,10 @@ _sk_gather_8888_avx LABEL PROC
DB 196,131,121,34,4,152,2 ; vpinsrd $0x2,(%r8,%r11,4),%xmm0,%xmm0
DB 196,131,121,34,28,144,3 ; vpinsrd $0x3,(%r8,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,21,166,11,2,0 ; vmovaps 0x20ba6(%rip),%ymm10 # 2cf60 <_sk_overlay_sse2_8bit+0x9f4>
+ DB 197,124,40,21,14,10,2,0 ; vmovaps 0x20a0e(%rip),%ymm10 # 2cdc0 <_sk_overlay_sse2_8bit+0x868>
DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,132,6,2,0 ; vbroadcastss 0x20684(%rip),%ymm9 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,13,92,15,2,0 ; vbroadcastss 0x20f5c(%rip),%ymm9 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1
DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2
@@ -11714,7 +11712,7 @@ _sk_store_8888_avx LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,180,5,2,0 ; vbroadcastss 0x205b4(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,140,14,2,0 ; vbroadcastss 0x20e8c(%rip),%ymm8 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -11739,7 +11737,7 @@ _sk_store_8888_avx LABEL PROC
DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8
DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne c4e2 <_sk_store_8888_avx+0xae>
+ DB 117,10 ; jne c4da <_sk_store_8888_avx+0xae>
DB 196,1,124,17,4,152 ; vmovups %ymm8,(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -11747,17 +11745,17 @@ _sk_store_8888_avx LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja c4de <_sk_store_8888_avx+0xaa>
+ DB 119,236 ; ja c4d6 <_sk_store_8888_avx+0xaa>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,83,0,0,0 ; lea 0x53(%rip),%r10 # c550 <_sk_store_8888_avx+0x11c>
+ DB 76,141,21,83,0,0,0 ; lea 0x53(%rip),%r10 # c548 <_sk_store_8888_avx+0x11c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,1,121,126,4,152 ; vmovd %xmm8,(%r8,%r11,4)
- DB 235,208 ; jmp c4de <_sk_store_8888_avx+0xaa>
+ DB 235,208 ; jmp c4d6 <_sk_store_8888_avx+0xaa>
DB 196,3,121,22,68,152,8,2 ; vpextrd $0x2,%xmm8,0x8(%r8,%r11,4)
DB 196,1,121,214,4,152 ; vmovq %xmm8,(%r8,%r11,4)
- DB 235,192 ; jmp c4de <_sk_store_8888_avx+0xaa>
+ DB 235,192 ; jmp c4d6 <_sk_store_8888_avx+0xaa>
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,3,121,22,76,152,24,2 ; vpextrd $0x2,%xmm9,0x18(%r8,%r11,4)
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -11765,7 +11763,7 @@ _sk_store_8888_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,1,122,17,76,152,16 ; vmovss %xmm9,0x10(%r8,%r11,4)
DB 196,1,121,17,4,152 ; vmovupd %xmm8,(%r8,%r11,4)
- DB 235,143 ; jmp c4de <_sk_store_8888_avx+0xaa>
+ DB 235,143 ; jmp c4d6 <_sk_store_8888_avx+0xaa>
DB 144 ; nop
DB 182,255 ; mov $0xff,%dh
DB 255 ; (bad)
@@ -11798,12 +11796,12 @@ _sk_load_bgra_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,135,0,0,0 ; jne c613 <_sk_load_bgra_avx+0xa7>
+ DB 15,133,135,0,0,0 ; jne c60b <_sk_load_bgra_avx+0xa7>
DB 196,1,125,16,12,152 ; vmovupd (%r8,%r11,4),%ymm9
- DB 197,125,40,21,230,9,2,0 ; vmovapd 0x209e6(%rip),%ymm10 # 2cf80 <_sk_overlay_sse2_8bit+0xa14>
+ DB 197,125,40,21,78,8,2,0 ; vmovapd 0x2084e(%rip),%ymm10 # 2cde0 <_sk_overlay_sse2_8bit+0x888>
DB 196,193,53,84,202 ; vandpd %ymm10,%ymm9,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,98,125,24,5,164,4,2,0 ; vbroadcastss 0x204a4(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,124,13,2,0 ; vbroadcastss 0x20d7c(%rip),%ymm8 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,116,89,208 ; vmulps %ymm8,%ymm1,%ymm2
DB 196,193,113,114,209,8 ; vpsrld $0x8,%xmm9,%xmm1
DB 196,99,125,25,203,1 ; vextractf128 $0x1,%ymm9,%xmm3
@@ -11830,21 +11828,21 @@ _sk_load_bgra_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,102,255,255,255 ; ja c592 <_sk_load_bgra_avx+0x26>
+ DB 15,135,102,255,255,255 ; ja c58a <_sk_load_bgra_avx+0x26>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,145,0,0,0 ; lea 0x91(%rip),%r10 # c6c8 <_sk_load_bgra_avx+0x15c>
+ DB 76,141,21,145,0,0,0 ; lea 0x91(%rip),%r10 # c6c0 <_sk_load_bgra_avx+0x15c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,1,122,16,12,152 ; vmovss (%r8,%r11,4),%xmm9
- DB 233,71,255,255,255 ; jmpq c592 <_sk_load_bgra_avx+0x26>
+ DB 233,71,255,255,255 ; jmpq c58a <_sk_load_bgra_avx+0x26>
DB 196,129,121,110,68,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,99,117,12,200,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm9
DB 196,129,123,16,4,152 ; vmovsd (%r8,%r11,4),%xmm0
DB 196,99,53,13,200,1 ; vblendpd $0x1,%ymm0,%ymm9,%ymm9
- DB 233,32,255,255,255 ; jmpq c592 <_sk_load_bgra_avx+0x26>
+ DB 233,32,255,255,255 ; jmpq c58a <_sk_load_bgra_avx+0x26>
DB 196,129,121,110,68,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -11858,9 +11856,9 @@ _sk_load_bgra_avx LABEL PROC
DB 196,99,53,24,200,1 ; vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
DB 196,129,121,16,4,152 ; vmovupd (%r8,%r11,4),%xmm0
DB 196,67,125,13,201,12 ; vblendpd $0xc,%ymm9,%ymm0,%ymm9
- DB 233,203,254,255,255 ; jmpq c592 <_sk_load_bgra_avx+0x26>
+ DB 233,203,254,255,255 ; jmpq c58a <_sk_load_bgra_avx+0x26>
DB 144 ; nop
- DB 120,255 ; js c6c9 <_sk_load_bgra_avx+0x15d>
+ DB 120,255 ; js c6c1 <_sk_load_bgra_avx+0x15d>
DB 255 ; (bad)
DB 255,153,255,255,255,131 ; lcall *-0x7c000001(%rcx)
DB 255 ; (bad)
@@ -11891,12 +11889,12 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,135,0,0,0 ; jne c78b <_sk_load_bgra_dst_avx+0xa7>
+ DB 15,133,135,0,0,0 ; jne c783 <_sk_load_bgra_dst_avx+0xa7>
DB 196,1,125,16,12,152 ; vmovupd (%r8,%r11,4),%ymm9
- DB 197,125,40,21,142,8,2,0 ; vmovapd 0x2088e(%rip),%ymm10 # 2cfa0 <_sk_overlay_sse2_8bit+0xa34>
+ DB 197,125,40,21,246,6,2,0 ; vmovapd 0x206f6(%rip),%ymm10 # 2ce00 <_sk_overlay_sse2_8bit+0x8a8>
DB 196,193,53,84,234 ; vandpd %ymm10,%ymm9,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,98,125,24,5,44,3,2,0 ; vbroadcastss 0x2032c(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,4,12,2,0 ; vbroadcastss 0x20c04(%rip),%ymm8 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,84,89,240 ; vmulps %ymm8,%ymm5,%ymm6
DB 196,193,81,114,209,8 ; vpsrld $0x8,%xmm9,%xmm5
DB 196,99,125,25,207,1 ; vextractf128 $0x1,%ymm9,%xmm7
@@ -11923,21 +11921,21 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,102,255,255,255 ; ja c70a <_sk_load_bgra_dst_avx+0x26>
+ DB 15,135,102,255,255,255 ; ja c702 <_sk_load_bgra_dst_avx+0x26>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,145,0,0,0 ; lea 0x91(%rip),%r10 # c840 <_sk_load_bgra_dst_avx+0x15c>
+ DB 76,141,21,145,0,0,0 ; lea 0x91(%rip),%r10 # c838 <_sk_load_bgra_dst_avx+0x15c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,1,122,16,12,152 ; vmovss (%r8,%r11,4),%xmm9
- DB 233,71,255,255,255 ; jmpq c70a <_sk_load_bgra_dst_avx+0x26>
+ DB 233,71,255,255,255 ; jmpq c702 <_sk_load_bgra_dst_avx+0x26>
DB 196,129,121,110,100,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
DB 196,99,85,12,204,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm9
DB 196,129,123,16,36,152 ; vmovsd (%r8,%r11,4),%xmm4
DB 196,99,53,13,204,1 ; vblendpd $0x1,%ymm4,%ymm9,%ymm9
- DB 233,32,255,255,255 ; jmpq c70a <_sk_load_bgra_dst_avx+0x26>
+ DB 233,32,255,255,255 ; jmpq c702 <_sk_load_bgra_dst_avx+0x26>
DB 196,129,121,110,100,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -11951,9 +11949,9 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 196,99,53,24,204,1 ; vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
DB 196,129,121,16,36,152 ; vmovupd (%r8,%r11,4),%xmm4
DB 196,67,93,13,201,12 ; vblendpd $0xc,%ymm9,%ymm4,%ymm9
- DB 233,203,254,255,255 ; jmpq c70a <_sk_load_bgra_dst_avx+0x26>
+ DB 233,203,254,255,255 ; jmpq c702 <_sk_load_bgra_dst_avx+0x26>
DB 144 ; nop
- DB 120,255 ; js c841 <_sk_load_bgra_dst_avx+0x15d>
+ DB 120,255 ; js c839 <_sk_load_bgra_dst_avx+0x15d>
DB 255 ; (bad)
DB 255,153,255,255,255,131 ; lcall *-0x7c000001(%rcx)
DB 255 ; (bad)
@@ -12013,10 +12011,10 @@ _sk_gather_bgra_avx LABEL PROC
DB 196,131,121,34,4,152,2 ; vpinsrd $0x2,(%r8,%r11,4),%xmm0,%xmm0
DB 196,131,121,34,28,144,3 ; vpinsrd $0x3,(%r8,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,13,178,6,2,0 ; vmovaps 0x206b2(%rip),%ymm9 # 2cfc0 <_sk_overlay_sse2_8bit+0xa54>
+ DB 197,124,40,13,26,5,2,0 ; vmovaps 0x2051a(%rip),%ymm9 # 2ce20 <_sk_overlay_sse2_8bit+0x8c8>
DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,48,1,2,0 ; vbroadcastss 0x20130(%rip),%ymm10 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,21,8,10,2,0 ; vbroadcastss 0x20a08(%rip),%ymm10 # 2d320 <_sk_overlay_sse2_8bit+0xdc8>
DB 196,193,124,89,210 ; vmulps %ymm10,%ymm0,%ymm2
DB 196,193,121,114,208,8 ; vpsrld $0x8,%xmm8,%xmm0
DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1
@@ -12051,7 +12049,7 @@ _sk_store_bgra_avx LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,96,0,2,0 ; vbroadcastss 0x20060(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,56,9,2,0 ; vbroadcastss 0x20938(%rip),%ymm8 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -12076,7 +12074,7 @@ _sk_store_bgra_avx LABEL PROC
DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8
DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne ca36 <_sk_store_bgra_avx+0xae>
+ DB 117,10 ; jne ca2e <_sk_store_bgra_avx+0xae>
DB 196,1,124,17,4,152 ; vmovups %ymm8,(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -12084,17 +12082,17 @@ _sk_store_bgra_avx LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja ca32 <_sk_store_bgra_avx+0xaa>
+ DB 119,236 ; ja ca2a <_sk_store_bgra_avx+0xaa>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,83,0,0,0 ; lea 0x53(%rip),%r10 # caa4 <_sk_store_bgra_avx+0x11c>
+ DB 76,141,21,83,0,0,0 ; lea 0x53(%rip),%r10 # ca9c <_sk_store_bgra_avx+0x11c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,1,121,126,4,152 ; vmovd %xmm8,(%r8,%r11,4)
- DB 235,208 ; jmp ca32 <_sk_store_bgra_avx+0xaa>
+ DB 235,208 ; jmp ca2a <_sk_store_bgra_avx+0xaa>
DB 196,3,121,22,68,152,8,2 ; vpextrd $0x2,%xmm8,0x8(%r8,%r11,4)
DB 196,1,121,214,4,152 ; vmovq %xmm8,(%r8,%r11,4)
- DB 235,192 ; jmp ca32 <_sk_store_bgra_avx+0xaa>
+ DB 235,192 ; jmp ca2a <_sk_store_bgra_avx+0xaa>
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,3,121,22,76,152,24,2 ; vpextrd $0x2,%xmm9,0x18(%r8,%r11,4)
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -12102,7 +12100,7 @@ _sk_store_bgra_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,1,122,17,76,152,16 ; vmovss %xmm9,0x10(%r8,%r11,4)
DB 196,1,121,17,4,152 ; vmovupd %xmm8,(%r8,%r11,4)
- DB 235,143 ; jmp ca32 <_sk_store_bgra_avx+0xaa>
+ DB 235,143 ; jmp ca2a <_sk_store_bgra_avx+0xaa>
DB 144 ; nop
DB 182,255 ; mov $0xff,%dh
DB 255 ; (bad)
@@ -12140,7 +12138,7 @@ _sk_load_f16_avx LABEL PROC
DB 197,252,17,116,36,64 ; vmovups %ymm6,0x40(%rsp)
DB 197,252,17,108,36,32 ; vmovups %ymm5,0x20(%rsp)
DB 197,254,127,36,36 ; vmovdqu %ymm4,(%rsp)
- DB 15,133,147,2,0,0 ; jne cd91 <_sk_load_f16_avx+0x2d1>
+ DB 15,133,147,2,0,0 ; jne cd89 <_sk_load_f16_avx+0x2d1>
DB 196,65,121,16,4,192 ; vmovupd (%r8,%rax,8),%xmm8
DB 196,193,121,16,84,192,16 ; vmovupd 0x10(%r8,%rax,8),%xmm2
DB 196,193,121,16,76,192,32 ; vmovupd 0x20(%r8,%rax,8),%xmm1
@@ -12158,13 +12156,13 @@ _sk_load_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,253,255,1,0 ; vbroadcastss 0x1fffd(%rip),%ymm12 # 2cb58 <_sk_overlay_sse2_8bit+0x5ec>
+ DB 196,98,125,24,37,213,8,2,0 ; vbroadcastss 0x208d5(%rip),%ymm12 # 2d428 <_sk_overlay_sse2_8bit+0xed0>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,193,255,1,0 ; vbroadcastss 0x1ffc1(%rip),%xmm11 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,121,24,29,153,8,2,0 ; vbroadcastss 0x20899(%rip),%xmm11 # 2d404 <_sk_overlay_sse2_8bit+0xeac>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,219,255,1,0 ; vbroadcastss 0x1ffdb(%rip),%xmm13 # 2cb5c <_sk_overlay_sse2_8bit+0x5f0>
+ DB 196,98,121,24,45,179,8,2,0 ; vbroadcastss 0x208b3(%rip),%xmm13 # 2d42c <_sk_overlay_sse2_8bit+0xed4>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -12178,7 +12176,7 @@ _sk_load_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,145,255,1,0 ; vbroadcastss 0x1ff91(%rip),%xmm3 # 2cb60 <_sk_overlay_sse2_8bit+0x5f4>
+ DB 196,226,121,24,29,105,8,2,0 ; vbroadcastss 0x20869(%rip),%xmm3 # 2d430 <_sk_overlay_sse2_8bit+0xed8>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -12271,29 +12269,29 @@ _sk_load_f16_avx LABEL PROC
DB 196,65,123,16,4,192 ; vmovsd (%r8,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,85 ; je cdf7 <_sk_load_f16_avx+0x337>
+ DB 116,85 ; je cdef <_sk_load_f16_avx+0x337>
DB 196,65,57,22,68,192,8 ; vmovhpd 0x8(%r8,%rax,8),%xmm8,%xmm8
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,72 ; jb cdf7 <_sk_load_f16_avx+0x337>
+ DB 114,72 ; jb cdef <_sk_load_f16_avx+0x337>
DB 196,193,123,16,84,192,16 ; vmovsd 0x10(%r8,%rax,8),%xmm2
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 116,72 ; je ce04 <_sk_load_f16_avx+0x344>
+ DB 116,72 ; je cdfc <_sk_load_f16_avx+0x344>
DB 196,193,105,22,84,192,24 ; vmovhpd 0x18(%r8,%rax,8),%xmm2,%xmm2
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,59 ; jb ce04 <_sk_load_f16_avx+0x344>
+ DB 114,59 ; jb cdfc <_sk_load_f16_avx+0x344>
DB 196,193,123,16,76,192,32 ; vmovsd 0x20(%r8,%rax,8),%xmm1
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 15,132,63,253,255,255 ; je cb19 <_sk_load_f16_avx+0x59>
+ DB 15,132,63,253,255,255 ; je cb11 <_sk_load_f16_avx+0x59>
DB 196,193,113,22,76,192,40 ; vmovhpd 0x28(%r8,%rax,8),%xmm1,%xmm1
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 15,130,46,253,255,255 ; jb cb19 <_sk_load_f16_avx+0x59>
+ DB 15,130,46,253,255,255 ; jb cb11 <_sk_load_f16_avx+0x59>
DB 196,65,122,126,76,192,48 ; vmovq 0x30(%r8,%rax,8),%xmm9
- DB 233,34,253,255,255 ; jmpq cb19 <_sk_load_f16_avx+0x59>
+ DB 233,34,253,255,255 ; jmpq cb11 <_sk_load_f16_avx+0x59>
DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,21,253,255,255 ; jmpq cb19 <_sk_load_f16_avx+0x59>
+ DB 233,21,253,255,255 ; jmpq cb11 <_sk_load_f16_avx+0x59>
DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1
- DB 233,12,253,255,255 ; jmpq cb19 <_sk_load_f16_avx+0x59>
+ DB 233,12,253,255,255 ; jmpq cb11 <_sk_load_f16_avx+0x59>
PUBLIC _sk_load_f16_dst_avx
_sk_load_f16_dst_avx LABEL PROC
@@ -12310,7 +12308,7 @@ _sk_load_f16_dst_avx LABEL PROC
DB 197,252,17,84,36,64 ; vmovups %ymm2,0x40(%rsp)
DB 197,252,17,76,36,32 ; vmovups %ymm1,0x20(%rsp)
DB 197,254,127,4,36 ; vmovdqu %ymm0,(%rsp)
- DB 15,133,147,2,0,0 ; jne d0de <_sk_load_f16_dst_avx+0x2d1>
+ DB 15,133,147,2,0,0 ; jne d0d6 <_sk_load_f16_dst_avx+0x2d1>
DB 196,65,121,16,4,192 ; vmovupd (%r8,%rax,8),%xmm8
DB 196,193,121,16,116,192,16 ; vmovupd 0x10(%r8,%rax,8),%xmm6
DB 196,193,121,16,108,192,32 ; vmovupd 0x20(%r8,%rax,8),%xmm5
@@ -12328,13 +12326,13 @@ _sk_load_f16_dst_avx LABEL PROC
DB 197,217,105,232 ; vpunpckhwd %xmm0,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- DB 196,98,125,24,37,176,252,1,0 ; vbroadcastss 0x1fcb0(%rip),%ymm12 # 2cb58 <_sk_overlay_sse2_8bit+0x5ec>
+ DB 196,98,125,24,37,136,5,2,0 ; vbroadcastss 0x20588(%rip),%ymm12 # 2d428 <_sk_overlay_sse2_8bit+0xed0>
DB 196,193,92,84,236 ; vandps %ymm12,%ymm4,%ymm5
DB 197,220,87,229 ; vxorps %ymm5,%ymm4,%ymm4
DB 196,195,125,25,230,1 ; vextractf128 $0x1,%ymm4,%xmm14
- DB 196,98,121,24,29,116,252,1,0 ; vbroadcastss 0x1fc74(%rip),%xmm11 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,121,24,29,76,5,2,0 ; vbroadcastss 0x2054c(%rip),%xmm11 # 2d404 <_sk_overlay_sse2_8bit+0xeac>
DB 196,193,8,87,251 ; vxorps %xmm11,%xmm14,%xmm7
- DB 196,98,121,24,45,142,252,1,0 ; vbroadcastss 0x1fc8e(%rip),%xmm13 # 2cb5c <_sk_overlay_sse2_8bit+0x5f0>
+ DB 196,98,121,24,45,102,5,2,0 ; vbroadcastss 0x20566(%rip),%xmm13 # 2d42c <_sk_overlay_sse2_8bit+0xed4>
DB 197,145,102,255 ; vpcmpgtd %xmm7,%xmm13,%xmm7
DB 196,65,88,87,211 ; vxorps %xmm11,%xmm4,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -12348,7 +12346,7 @@ _sk_load_f16_dst_avx LABEL PROC
DB 196,227,93,24,231,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
DB 197,220,86,229 ; vorps %ymm5,%ymm4,%ymm4
DB 196,227,125,25,229,1 ; vextractf128 $0x1,%ymm4,%xmm5
- DB 196,226,121,24,61,68,252,1,0 ; vbroadcastss 0x1fc44(%rip),%xmm7 # 2cb60 <_sk_overlay_sse2_8bit+0x5f4>
+ DB 196,226,121,24,61,28,5,2,0 ; vbroadcastss 0x2051c(%rip),%xmm7 # 2d430 <_sk_overlay_sse2_8bit+0xed8>
DB 197,209,254,239 ; vpaddd %xmm7,%xmm5,%xmm5
DB 197,217,254,231 ; vpaddd %xmm7,%xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -12441,29 +12439,29 @@ _sk_load_f16_dst_avx LABEL PROC
DB 196,65,123,16,4,192 ; vmovsd (%r8,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,85 ; je d144 <_sk_load_f16_dst_avx+0x337>
+ DB 116,85 ; je d13c <_sk_load_f16_dst_avx+0x337>
DB 196,65,57,22,68,192,8 ; vmovhpd 0x8(%r8,%rax,8),%xmm8,%xmm8
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,72 ; jb d144 <_sk_load_f16_dst_avx+0x337>
+ DB 114,72 ; jb d13c <_sk_load_f16_dst_avx+0x337>
DB 196,193,123,16,116,192,16 ; vmovsd 0x10(%r8,%rax,8),%xmm6
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 116,72 ; je d151 <_sk_load_f16_dst_avx+0x344>
+ DB 116,72 ; je d149 <_sk_load_f16_dst_avx+0x344>
DB 196,193,73,22,116,192,24 ; vmovhpd 0x18(%r8,%rax,8),%xmm6,%xmm6
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,59 ; jb d151 <_sk_load_f16_dst_avx+0x344>
+ DB 114,59 ; jb d149 <_sk_load_f16_dst_avx+0x344>
DB 196,193,123,16,108,192,32 ; vmovsd 0x20(%r8,%rax,8),%xmm5
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 15,132,63,253,255,255 ; je ce66 <_sk_load_f16_dst_avx+0x59>
+ DB 15,132,63,253,255,255 ; je ce5e <_sk_load_f16_dst_avx+0x59>
DB 196,193,81,22,108,192,40 ; vmovhpd 0x28(%r8,%rax,8),%xmm5,%xmm5
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 15,130,46,253,255,255 ; jb ce66 <_sk_load_f16_dst_avx+0x59>
+ DB 15,130,46,253,255,255 ; jb ce5e <_sk_load_f16_dst_avx+0x59>
DB 196,65,122,126,76,192,48 ; vmovq 0x30(%r8,%rax,8),%xmm9
- DB 233,34,253,255,255 ; jmpq ce66 <_sk_load_f16_dst_avx+0x59>
+ DB 233,34,253,255,255 ; jmpq ce5e <_sk_load_f16_dst_avx+0x59>
DB 197,209,87,237 ; vxorpd %xmm5,%xmm5,%xmm5
DB 197,201,87,246 ; vxorpd %xmm6,%xmm6,%xmm6
- DB 233,21,253,255,255 ; jmpq ce66 <_sk_load_f16_dst_avx+0x59>
+ DB 233,21,253,255,255 ; jmpq ce5e <_sk_load_f16_dst_avx+0x59>
DB 197,209,87,237 ; vxorpd %xmm5,%xmm5,%xmm5
- DB 233,12,253,255,255 ; jmpq ce66 <_sk_load_f16_dst_avx+0x59>
+ DB 233,12,253,255,255 ; jmpq ce5e <_sk_load_f16_dst_avx+0x59>
PUBLIC _sk_gather_f16_avx
_sk_gather_f16_avx LABEL PROC
@@ -12525,13 +12523,13 @@ _sk_gather_f16_avx LABEL PROC
DB 197,249,105,210 ; vpunpckhwd %xmm2,%xmm0,%xmm2
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,194,1 ; vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
- DB 196,98,125,24,37,241,248,1,0 ; vbroadcastss 0x1f8f1(%rip),%ymm12 # 2cb58 <_sk_overlay_sse2_8bit+0x5ec>
+ DB 196,98,125,24,37,201,1,2,0 ; vbroadcastss 0x201c9(%rip),%ymm12 # 2d428 <_sk_overlay_sse2_8bit+0xed0>
DB 196,193,124,84,212 ; vandps %ymm12,%ymm0,%ymm2
DB 197,252,87,194 ; vxorps %ymm2,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,181,248,1,0 ; vbroadcastss 0x1f8b5(%rip),%xmm11 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,121,24,29,141,1,2,0 ; vbroadcastss 0x2018d(%rip),%xmm11 # 2d404 <_sk_overlay_sse2_8bit+0xeac>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,207,248,1,0 ; vbroadcastss 0x1f8cf(%rip),%xmm13 # 2cb5c <_sk_overlay_sse2_8bit+0x5f0>
+ DB 196,98,121,24,45,167,1,2,0 ; vbroadcastss 0x201a7(%rip),%xmm13 # 2d42c <_sk_overlay_sse2_8bit+0xed4>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -12545,7 +12543,7 @@ _sk_gather_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,194 ; vorps %ymm2,%ymm0,%ymm0
DB 196,227,125,25,194,1 ; vextractf128 $0x1,%ymm0,%xmm2
- DB 196,226,121,24,29,133,248,1,0 ; vbroadcastss 0x1f885(%rip),%xmm3 # 2cb60 <_sk_overlay_sse2_8bit+0x5f4>
+ DB 196,226,121,24,29,93,1,2,0 ; vbroadcastss 0x2015d(%rip),%xmm3 # 2d430 <_sk_overlay_sse2_8bit+0xed8>
DB 197,233,254,211 ; vpaddd %xmm3,%xmm2,%xmm2
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,194,1 ; vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
@@ -12647,12 +12645,12 @@ _sk_store_f16_avx LABEL PROC
DB 197,252,17,180,36,128,0,0,0 ; vmovups %ymm6,0x80(%rsp)
DB 197,252,17,108,36,96 ; vmovups %ymm5,0x60(%rsp)
DB 197,252,17,100,36,64 ; vmovups %ymm4,0x40(%rsp)
- DB 196,98,125,24,13,98,246,1,0 ; vbroadcastss 0x1f662(%rip),%ymm9 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,125,24,13,58,255,1,0 ; vbroadcastss 0x1ff3a(%rip),%ymm9 # 2d404 <_sk_overlay_sse2_8bit+0xeac>
DB 196,65,124,84,209 ; vandps %ymm9,%ymm0,%ymm10
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
DB 196,65,124,87,218 ; vxorps %ymm10,%ymm0,%ymm11
DB 196,67,125,25,220,1 ; vextractf128 $0x1,%ymm11,%xmm12
- DB 196,98,121,24,5,116,246,1,0 ; vbroadcastss 0x1f674(%rip),%xmm8 # 2cb64 <_sk_overlay_sse2_8bit+0x5f8>
+ DB 196,98,121,24,5,76,255,1,0 ; vbroadcastss 0x1ff4c(%rip),%xmm8 # 2d434 <_sk_overlay_sse2_8bit+0xedc>
DB 196,65,57,102,236 ; vpcmpgtd %xmm12,%xmm8,%xmm13
DB 196,65,57,102,243 ; vpcmpgtd %xmm11,%xmm8,%xmm14
DB 196,67,13,24,237,1 ; vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -12662,7 +12660,7 @@ _sk_store_f16_avx LABEL PROC
DB 196,67,13,24,242,1 ; vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
DB 196,193,33,114,211,13 ; vpsrld $0xd,%xmm11,%xmm11
DB 196,193,25,114,212,13 ; vpsrld $0xd,%xmm12,%xmm12
- DB 196,98,125,24,21,59,246,1,0 ; vbroadcastss 0x1f63b(%rip),%ymm10 # 2cb68 <_sk_overlay_sse2_8bit+0x5fc>
+ DB 196,98,125,24,21,19,255,1,0 ; vbroadcastss 0x1ff13(%rip),%ymm10 # 2d438 <_sk_overlay_sse2_8bit+0xee0>
DB 196,65,12,86,242 ; vorps %ymm10,%ymm14,%ymm14
DB 196,67,125,25,247,1 ; vextractf128 $0x1,%ymm14,%xmm15
DB 196,65,1,254,228 ; vpaddd %xmm12,%xmm15,%xmm12
@@ -12749,7 +12747,7 @@ _sk_store_f16_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 117,79 ; jne d72a <_sk_store_f16_avx+0x286>
+ DB 117,79 ; jne d722 <_sk_store_f16_avx+0x286>
DB 196,65,120,17,28,192 ; vmovups %xmm11,(%r8,%rax,8)
DB 196,65,120,17,84,192,16 ; vmovups %xmm10,0x10(%r8,%rax,8)
DB 196,65,120,17,76,192,32 ; vmovups %xmm9,0x20(%r8,%rax,8)
@@ -12765,22 +12763,22 @@ _sk_store_f16_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,192 ; vmovq %xmm11,(%r8,%rax,8)
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,192 ; je d6f6 <_sk_store_f16_avx+0x252>
+ DB 116,192 ; je d6ee <_sk_store_f16_avx+0x252>
DB 196,65,121,23,92,192,8 ; vmovhpd %xmm11,0x8(%r8,%rax,8)
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,179 ; jb d6f6 <_sk_store_f16_avx+0x252>
+ DB 114,179 ; jb d6ee <_sk_store_f16_avx+0x252>
DB 196,65,121,214,84,192,16 ; vmovq %xmm10,0x10(%r8,%rax,8)
- DB 116,170 ; je d6f6 <_sk_store_f16_avx+0x252>
+ DB 116,170 ; je d6ee <_sk_store_f16_avx+0x252>
DB 196,65,121,23,84,192,24 ; vmovhpd %xmm10,0x18(%r8,%rax,8)
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,157 ; jb d6f6 <_sk_store_f16_avx+0x252>
+ DB 114,157 ; jb d6ee <_sk_store_f16_avx+0x252>
DB 196,65,121,214,76,192,32 ; vmovq %xmm9,0x20(%r8,%rax,8)
- DB 116,148 ; je d6f6 <_sk_store_f16_avx+0x252>
+ DB 116,148 ; je d6ee <_sk_store_f16_avx+0x252>
DB 196,65,121,23,76,192,40 ; vmovhpd %xmm9,0x28(%r8,%rax,8)
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 114,135 ; jb d6f6 <_sk_store_f16_avx+0x252>
+ DB 114,135 ; jb d6ee <_sk_store_f16_avx+0x252>
DB 196,65,121,214,68,192,48 ; vmovq %xmm8,0x30(%r8,%rax,8)
- DB 233,123,255,255,255 ; jmpq d6f6 <_sk_store_f16_avx+0x252>
+ DB 233,123,255,255,255 ; jmpq d6ee <_sk_store_f16_avx+0x252>
PUBLIC _sk_load_u16_be_avx
_sk_load_u16_be_avx LABEL PROC
@@ -12793,7 +12791,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 73,99,193 ; movslq %r9d,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,253,0,0,0 ; jne d89f <_sk_load_u16_be_avx+0x124>
+ DB 15,133,253,0,0,0 ; jne d897 <_sk_load_u16_be_avx+0x124>
DB 196,65,121,16,4,64 ; vmovupd (%r8,%rax,2),%xmm8
DB 196,193,121,16,84,64,16 ; vmovupd 0x10(%r8,%rax,2),%xmm2
DB 196,193,121,16,92,64,32 ; vmovupd 0x20(%r8,%rax,2),%xmm3
@@ -12815,7 +12813,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,89,242,1,0 ; vbroadcastss 0x1f259(%rip),%ymm11 # 2ca6c <_sk_overlay_sse2_8bit+0x500>
+ DB 196,98,125,24,29,49,251,1,0 ; vbroadcastss 0x1fb31(%rip),%ymm11 # 2d33c <_sk_overlay_sse2_8bit+0xde4>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,177,109,202 ; vpunpckhqdq %xmm2,%xmm9,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -12849,29 +12847,29 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,65,123,16,4,64 ; vmovsd (%r8,%rax,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,85 ; je d905 <_sk_load_u16_be_avx+0x18a>
+ DB 116,85 ; je d8fd <_sk_load_u16_be_avx+0x18a>
DB 196,65,57,22,68,64,8 ; vmovhpd 0x8(%r8,%rax,2),%xmm8,%xmm8
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,72 ; jb d905 <_sk_load_u16_be_avx+0x18a>
+ DB 114,72 ; jb d8fd <_sk_load_u16_be_avx+0x18a>
DB 196,193,123,16,84,64,16 ; vmovsd 0x10(%r8,%rax,2),%xmm2
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 116,72 ; je d912 <_sk_load_u16_be_avx+0x197>
+ DB 116,72 ; je d90a <_sk_load_u16_be_avx+0x197>
DB 196,193,105,22,84,64,24 ; vmovhpd 0x18(%r8,%rax,2),%xmm2,%xmm2
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,59 ; jb d912 <_sk_load_u16_be_avx+0x197>
+ DB 114,59 ; jb d90a <_sk_load_u16_be_avx+0x197>
DB 196,193,123,16,92,64,32 ; vmovsd 0x20(%r8,%rax,2),%xmm3
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 15,132,213,254,255,255 ; je d7bd <_sk_load_u16_be_avx+0x42>
+ DB 15,132,213,254,255,255 ; je d7b5 <_sk_load_u16_be_avx+0x42>
DB 196,193,97,22,92,64,40 ; vmovhpd 0x28(%r8,%rax,2),%xmm3,%xmm3
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 15,130,196,254,255,255 ; jb d7bd <_sk_load_u16_be_avx+0x42>
+ DB 15,130,196,254,255,255 ; jb d7b5 <_sk_load_u16_be_avx+0x42>
DB 196,65,122,126,76,64,48 ; vmovq 0x30(%r8,%rax,2),%xmm9
- DB 233,184,254,255,255 ; jmpq d7bd <_sk_load_u16_be_avx+0x42>
+ DB 233,184,254,255,255 ; jmpq d7b5 <_sk_load_u16_be_avx+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,171,254,255,255 ; jmpq d7bd <_sk_load_u16_be_avx+0x42>
+ DB 233,171,254,255,255 ; jmpq d7b5 <_sk_load_u16_be_avx+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,162,254,255,255 ; jmpq d7bd <_sk_load_u16_be_avx+0x42>
+ DB 233,162,254,255,255 ; jmpq d7b5 <_sk_load_u16_be_avx+0x42>
PUBLIC _sk_load_rgb_u16_be_avx
_sk_load_rgb_u16_be_avx LABEL PROC
@@ -12886,7 +12884,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,241,0,0,0 ; jne da37 <_sk_load_rgb_u16_be_avx+0x11c>
+ DB 15,133,241,0,0,0 ; jne da2f <_sk_load_rgb_u16_be_avx+0x11c>
DB 196,65,122,111,28,64 ; vmovdqu (%r8,%rax,2),%xmm11
DB 196,193,122,111,92,64,12 ; vmovdqu 0xc(%r8,%rax,2),%xmm3
DB 196,193,122,111,84,64,24 ; vmovdqu 0x18(%r8,%rax,2),%xmm2
@@ -12913,7 +12911,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,194,1 ; vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,21,155,240,1,0 ; vbroadcastss 0x1f09b(%rip),%ymm2 # 2ca6c <_sk_overlay_sse2_8bit+0x500>
+ DB 196,226,125,24,21,115,249,1,0 ; vbroadcastss 0x1f973(%rip),%ymm2 # 2d33c <_sk_overlay_sse2_8bit+0xde4>
DB 197,252,89,194 ; vmulps %ymm2,%ymm0,%ymm0
DB 197,185,109,201 ; vpunpckhqdq %xmm1,%xmm8,%xmm1
DB 197,225,113,241,8 ; vpsllw $0x8,%xmm1,%xmm3
@@ -12934,69 +12932,69 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,167,239,1,0 ; vbroadcastss 0x1efa7(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,127,248,1,0 ; vbroadcastss 0x1f87f(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,64 ; vmovd (%r8,%rax,2),%xmm0
DB 196,65,121,196,92,64,4,2 ; vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,32 ; jne da70 <_sk_load_rgb_u16_be_avx+0x155>
+ DB 117,32 ; jne da68 <_sk_load_rgb_u16_be_avx+0x155>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
- DB 233,11,255,255,255 ; jmpq d97b <_sk_load_rgb_u16_be_avx+0x60>
+ DB 233,11,255,255,255 ; jmpq d973 <_sk_load_rgb_u16_be_avx+0x60>
DB 196,193,121,110,68,64,6 ; vmovd 0x6(%r8,%rax,2),%xmm0
DB 196,65,121,196,68,64,10,2 ; vpinsrw $0x2,0xa(%r8,%rax,2),%xmm0,%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,49 ; jb dabb <_sk_load_rgb_u16_be_avx+0x1a0>
+ DB 114,49 ; jb dab3 <_sk_load_rgb_u16_be_avx+0x1a0>
DB 196,193,121,110,68,64,12 ; vmovd 0xc(%r8,%rax,2),%xmm0
DB 196,193,121,196,92,64,16,2 ; vpinsrw $0x2,0x10(%r8,%rax,2),%xmm0,%xmm3
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 117,50 ; jne dad6 <_sk_load_rgb_u16_be_avx+0x1bb>
+ DB 117,50 ; jne dace <_sk_load_rgb_u16_be_avx+0x1bb>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
- DB 233,192,254,255,255 ; jmpq d97b <_sk_load_rgb_u16_be_avx+0x60>
+ DB 233,192,254,255,255 ; jmpq d973 <_sk_load_rgb_u16_be_avx+0x60>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
- DB 233,165,254,255,255 ; jmpq d97b <_sk_load_rgb_u16_be_avx+0x60>
+ DB 233,165,254,255,255 ; jmpq d973 <_sk_load_rgb_u16_be_avx+0x60>
DB 196,193,121,110,68,64,18 ; vmovd 0x12(%r8,%rax,2),%xmm0
DB 196,65,121,196,84,64,22,2 ; vpinsrw $0x2,0x16(%r8,%rax,2),%xmm0,%xmm10
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,40 ; jb db18 <_sk_load_rgb_u16_be_avx+0x1fd>
+ DB 114,40 ; jb db10 <_sk_load_rgb_u16_be_avx+0x1fd>
DB 196,193,121,110,68,64,24 ; vmovd 0x18(%r8,%rax,2),%xmm0
DB 196,193,121,196,84,64,28,2 ; vpinsrw $0x2,0x1c(%r8,%rax,2),%xmm0,%xmm2
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 117,32 ; jne db2a <_sk_load_rgb_u16_be_avx+0x20f>
+ DB 117,32 ; jne db22 <_sk_load_rgb_u16_be_avx+0x20f>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
- DB 233,99,254,255,255 ; jmpq d97b <_sk_load_rgb_u16_be_avx+0x60>
+ DB 233,99,254,255,255 ; jmpq d973 <_sk_load_rgb_u16_be_avx+0x60>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
- DB 233,81,254,255,255 ; jmpq d97b <_sk_load_rgb_u16_be_avx+0x60>
+ DB 233,81,254,255,255 ; jmpq d973 <_sk_load_rgb_u16_be_avx+0x60>
DB 196,193,121,110,68,64,30 ; vmovd 0x1e(%r8,%rax,2),%xmm0
DB 196,65,121,196,100,64,34,2 ; vpinsrw $0x2,0x22(%r8,%rax,2),%xmm0,%xmm12
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 114,25 ; jb db5d <_sk_load_rgb_u16_be_avx+0x242>
+ DB 114,25 ; jb db55 <_sk_load_rgb_u16_be_avx+0x242>
DB 196,193,121,110,68,64,36 ; vmovd 0x24(%r8,%rax,2),%xmm0
DB 196,193,121,196,68,64,40,2 ; vpinsrw $0x2,0x28(%r8,%rax,2),%xmm0,%xmm0
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
- DB 233,30,254,255,255 ; jmpq d97b <_sk_load_rgb_u16_be_avx+0x60>
+ DB 233,30,254,255,255 ; jmpq d973 <_sk_load_rgb_u16_be_avx+0x60>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
- DB 233,21,254,255,255 ; jmpq d97b <_sk_load_rgb_u16_be_avx+0x60>
+ DB 233,21,254,255,255 ; jmpq d973 <_sk_load_rgb_u16_be_avx+0x60>
PUBLIC _sk_store_u16_be_avx
_sk_store_u16_be_avx LABEL PROC
@@ -13008,7 +13006,7 @@ _sk_store_u16_be_avx LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 73,99,193 ; movslq %r9d,%rax
- DB 196,98,125,24,5,103,239,1,0 ; vbroadcastss 0x1ef67(%rip),%ymm8 # 2caf4 <_sk_overlay_sse2_8bit+0x588>
+ DB 196,98,125,24,5,63,248,1,0 ; vbroadcastss 0x1f83f(%rip),%ymm8 # 2d3c4 <_sk_overlay_sse2_8bit+0xe6c>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -13046,7 +13044,7 @@ _sk_store_u16_be_avx LABEL PROC
DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9
DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,31 ; jne dc71 <_sk_store_u16_be_avx+0x10b>
+ DB 117,31 ; jne dc69 <_sk_store_u16_be_avx+0x10b>
DB 196,65,120,17,28,64 ; vmovups %xmm11,(%r8,%rax,2)
DB 196,65,120,17,84,64,16 ; vmovups %xmm10,0x10(%r8,%rax,2)
DB 196,65,120,17,76,64,32 ; vmovups %xmm9,0x20(%r8,%rax,2)
@@ -13055,29 +13053,29 @@ _sk_store_u16_be_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,64 ; vmovq %xmm11,(%r8,%rax,2)
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,240 ; je dc6d <_sk_store_u16_be_avx+0x107>
+ DB 116,240 ; je dc65 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,92,64,8 ; vmovhpd %xmm11,0x8(%r8,%rax,2)
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,227 ; jb dc6d <_sk_store_u16_be_avx+0x107>
+ DB 114,227 ; jb dc65 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,84,64,16 ; vmovq %xmm10,0x10(%r8,%rax,2)
- DB 116,218 ; je dc6d <_sk_store_u16_be_avx+0x107>
+ DB 116,218 ; je dc65 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,84,64,24 ; vmovhpd %xmm10,0x18(%r8,%rax,2)
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,205 ; jb dc6d <_sk_store_u16_be_avx+0x107>
+ DB 114,205 ; jb dc65 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,76,64,32 ; vmovq %xmm9,0x20(%r8,%rax,2)
- DB 116,196 ; je dc6d <_sk_store_u16_be_avx+0x107>
+ DB 116,196 ; je dc65 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,76,64,40 ; vmovhpd %xmm9,0x28(%r8,%rax,2)
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 114,183 ; jb dc6d <_sk_store_u16_be_avx+0x107>
+ DB 114,183 ; jb dc65 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,68,64,48 ; vmovq %xmm8,0x30(%r8,%rax,2)
- DB 235,174 ; jmp dc6d <_sk_store_u16_be_avx+0x107>
+ DB 235,174 ; jmp dc65 <_sk_store_u16_be_avx+0x107>
PUBLIC _sk_load_f32_avx
_sk_load_f32_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,253,87,192 ; vxorpd %ymm0,%ymm0,%ymm0
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 15,135,101,1,0,0 ; ja de34 <_sk_load_f32_avx+0x175>
+ DB 15,135,101,1,0,0 ; ja de2c <_sk_load_f32_avx+0x175>
DB 72,129,236,152,0,0,0 ; sub $0x98,%rsp
DB 197,253,17,36,36 ; vmovupd %ymm4,(%rsp)
DB 197,253,17,108,36,32 ; vmovupd %ymm5,0x20(%rsp)
@@ -13090,7 +13088,7 @@ _sk_load_f32_avx LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 77,99,201 ; movslq %r9d,%r9
- DB 76,141,21,51,1,0,0 ; lea 0x133(%rip),%r10 # de44 <_sk_load_f32_avx+0x185>
+ DB 76,141,21,51,1,0,0 ; lea 0x133(%rip),%r10 # de3c <_sk_load_f32_avx+0x185>
DB 73,99,4,186 ; movslq (%r10,%rdi,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 197,221,87,228 ; vxorpd %ymm4,%ymm4,%ymm4
@@ -13153,7 +13151,7 @@ _sk_load_f32_avx LABEL PROC
DB 197,229,87,219 ; vxorpd %ymm3,%ymm3,%ymm3
DB 196,65,45,87,210 ; vxorpd %ymm10,%ymm10,%ymm10
DB 197,245,87,201 ; vxorpd %ymm1,%ymm1,%ymm1
- DB 235,203 ; jmp de0e <_sk_load_f32_avx+0x14f>
+ DB 235,203 ; jmp de06 <_sk_load_f32_avx+0x14f>
DB 144 ; nop
DB 26,255 ; sbb %bh,%bh
DB 255 ; (bad)
@@ -13178,7 +13176,7 @@ _sk_load_f32_dst_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,221,87,228 ; vxorpd %ymm4,%ymm4,%ymm4
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 15,135,101,1,0,0 ; ja dfd9 <_sk_load_f32_dst_avx+0x175>
+ DB 15,135,101,1,0,0 ; ja dfd1 <_sk_load_f32_dst_avx+0x175>
DB 72,129,236,152,0,0,0 ; sub $0x98,%rsp
DB 197,253,17,4,36 ; vmovupd %ymm0,(%rsp)
DB 197,253,17,76,36,32 ; vmovupd %ymm1,0x20(%rsp)
@@ -13191,7 +13189,7 @@ _sk_load_f32_dst_avx LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 77,99,201 ; movslq %r9d,%r9
- DB 76,141,21,50,1,0,0 ; lea 0x132(%rip),%r10 # dfe8 <_sk_load_f32_dst_avx+0x184>
+ DB 76,141,21,50,1,0,0 ; lea 0x132(%rip),%r10 # dfe0 <_sk_load_f32_dst_avx+0x184>
DB 73,99,4,186 ; movslq (%r10,%rdi,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 197,253,87,192 ; vxorpd %ymm0,%ymm0,%ymm0
@@ -13254,7 +13252,7 @@ _sk_load_f32_dst_avx LABEL PROC
DB 197,197,87,255 ; vxorpd %ymm7,%ymm7,%ymm7
DB 196,65,45,87,210 ; vxorpd %ymm10,%ymm10,%ymm10
DB 197,213,87,237 ; vxorpd %ymm5,%ymm5,%ymm5
- DB 235,203 ; jmp dfb3 <_sk_load_f32_dst_avx+0x14f>
+ DB 235,203 ; jmp dfab <_sk_load_f32_dst_avx+0x14f>
DB 27,255 ; sbb %edi,%edi
DB 255 ; (bad)
DB 255,161,255,255,255,140 ; jmpq *-0x73000001(%rcx)
@@ -13265,7 +13263,7 @@ _sk_load_f32_dst_avx LABEL PROC
DB 255,92,255,255 ; lcall *-0x1(%rdi,%rdi,8)
DB 255,70,255 ; incl -0x1(%rsi)
DB 255 ; (bad)
- DB 255,53,255,255,255,40 ; pushq 0x28ffffff(%rip) # 2900e004 <_sk_overlay_sse2_8bit+0x28fe1a98>
+ DB 255,53,255,255,255,40 ; pushq 0x28ffffff(%rip) # 2900dffc <_sk_overlay_sse2_8bit+0x28fe1aa4>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -13289,7 +13287,7 @@ _sk_store_f32_avx LABEL PROC
DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8
DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,55 ; jne e087 <_sk_store_f32_avx+0x7f>
+ DB 117,55 ; jne e07f <_sk_store_f32_avx+0x7f>
DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -13302,22 +13300,22 @@ _sk_store_f32_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,17,20,128 ; vmovupd %xmm10,(%r8,%rax,4)
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,240 ; je e083 <_sk_store_f32_avx+0x7b>
+ DB 116,240 ; je e07b <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,76,128,16 ; vmovupd %xmm9,0x10(%r8,%rax,4)
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,227 ; jb e083 <_sk_store_f32_avx+0x7b>
+ DB 114,227 ; jb e07b <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,68,128,32 ; vmovupd %xmm8,0x20(%r8,%rax,4)
- DB 116,218 ; je e083 <_sk_store_f32_avx+0x7b>
+ DB 116,218 ; je e07b <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,92,128,48 ; vmovupd %xmm11,0x30(%r8,%rax,4)
DB 72,131,255,5 ; cmp $0x5,%rdi
- DB 114,205 ; jb e083 <_sk_store_f32_avx+0x7b>
+ DB 114,205 ; jb e07b <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,84,128,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r8,%rax,4)
- DB 116,195 ; je e083 <_sk_store_f32_avx+0x7b>
+ DB 116,195 ; je e07b <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,76,128,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r8,%rax,4)
DB 72,131,255,7 ; cmp $0x7,%rdi
- DB 114,181 ; jb e083 <_sk_store_f32_avx+0x7b>
+ DB 114,181 ; jb e07b <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,68,128,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r8,%rax,4)
- DB 235,171 ; jmp e083 <_sk_store_f32_avx+0x7b>
+ DB 235,171 ; jmp e07b <_sk_store_f32_avx+0x7b>
PUBLIC _sk_clamp_x_avx
_sk_clamp_x_avx LABEL PROC
@@ -13400,7 +13398,7 @@ _sk_mirror_x_avx LABEL PROC
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,99,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- DB 197,178,89,5,203,231,1,0 ; vmulss 0x1e7cb(%rip),%xmm9,%xmm0 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 197,178,89,5,163,240,1,0 ; vmulss 0x1f0a3(%rip),%xmm9,%xmm0 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
@@ -13432,7 +13430,7 @@ _sk_mirror_y_avx LABEL PROC
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,99,117,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- DB 197,178,89,13,62,231,1,0 ; vmulss 0x1e73e(%rip),%xmm9,%xmm1 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 197,178,89,13,22,240,1,0 ; vmulss 0x1f016(%rip),%xmm9,%xmm1 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
@@ -13457,7 +13455,7 @@ PUBLIC _sk_clamp_x_1_avx
_sk_clamp_x_1_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,216,230,1,0 ; vbroadcastss 0x1e6d8(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,176,239,1,0 ; vbroadcastss 0x1efb0(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -13471,9 +13469,9 @@ _sk_repeat_x_1_avx LABEL PROC
PUBLIC _sk_mirror_x_1_avx
_sk_mirror_x_1_avx LABEL PROC
- DB 196,98,125,24,5,207,230,1,0 ; vbroadcastss 0x1e6cf(%rip),%ymm8 # 2c9f4 <_sk_overlay_sse2_8bit+0x488>
+ DB 196,98,125,24,5,167,239,1,0 ; vbroadcastss 0x1efa7(%rip),%ymm8 # 2d2c4 <_sk_overlay_sse2_8bit+0xd6c>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,165,230,1,0 ; vbroadcastss 0x1e6a5(%rip),%ymm9 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,13,125,239,1,0 ; vbroadcastss 0x1ef7d(%rip),%ymm9 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -13487,12 +13485,12 @@ _sk_mirror_x_1_avx LABEL PROC
PUBLIC _sk_luminance_to_alpha_avx
_sk_luminance_to_alpha_avx LABEL PROC
- DB 196,226,125,24,29,145,231,1,0 ; vbroadcastss 0x1e791(%rip),%ymm3 # 2caf8 <_sk_overlay_sse2_8bit+0x58c>
+ DB 196,226,125,24,29,105,240,1,0 ; vbroadcastss 0x1f069(%rip),%ymm3 # 2d3c8 <_sk_overlay_sse2_8bit+0xe70>
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,29,136,231,1,0 ; vbroadcastss 0x1e788(%rip),%ymm3 # 2cafc <_sk_overlay_sse2_8bit+0x590>
+ DB 196,226,125,24,29,96,240,1,0 ; vbroadcastss 0x1f060(%rip),%ymm3 # 2d3cc <_sk_overlay_sse2_8bit+0xe74>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,123,231,1,0 ; vbroadcastss 0x1e77b(%rip),%ymm1 # 2cb00 <_sk_overlay_sse2_8bit+0x594>
+ DB 196,226,125,24,13,83,240,1,0 ; vbroadcastss 0x1f053(%rip),%ymm1 # 2d3d0 <_sk_overlay_sse2_8bit+0xe78>
DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1
DB 197,252,88,217 ; vaddps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13725,9 +13723,9 @@ _sk_evenly_spaced_gradient_avx LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 72,139,104,8 ; mov 0x8(%rax),%rbp
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js e72c <_sk_evenly_spaced_gradient_avx+0x28>
+ DB 120,7 ; js e724 <_sk_evenly_spaced_gradient_avx+0x28>
DB 196,225,242,42,203 ; vcvtsi2ss %rbx,%xmm1,%xmm1
- DB 235,21 ; jmp e741 <_sk_evenly_spaced_gradient_avx+0x3d>
+ DB 235,21 ; jmp e739 <_sk_evenly_spaced_gradient_avx+0x3d>
DB 73,137,216 ; mov %rbx,%r8
DB 73,209,232 ; shr %r8
DB 131,227,1 ; and $0x1,%ebx
@@ -13884,18 +13882,18 @@ _sk_evenly_spaced_gradient_avx LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_avx
_sk_gauss_a_to_rgba_avx LABEL PROC
- DB 196,226,125,24,5,144,224,1,0 ; vbroadcastss 0x1e090(%rip),%ymm0 # 2cb08 <_sk_overlay_sse2_8bit+0x59c>
+ DB 196,226,125,24,5,104,233,1,0 ; vbroadcastss 0x1e968(%rip),%ymm0 # 2d3d8 <_sk_overlay_sse2_8bit+0xe80>
DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
- DB 196,226,125,24,13,127,224,1,0 ; vbroadcastss 0x1e07f(%rip),%ymm1 # 2cb04 <_sk_overlay_sse2_8bit+0x598>
+ DB 196,226,125,24,13,87,233,1,0 ; vbroadcastss 0x1e957(%rip),%ymm1 # 2d3d4 <_sk_overlay_sse2_8bit+0xe7c>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,118,224,1,0 ; vbroadcastss 0x1e076(%rip),%ymm1 # 2cb0c <_sk_overlay_sse2_8bit+0x5a0>
+ DB 196,226,125,24,13,78,233,1,0 ; vbroadcastss 0x1e94e(%rip),%ymm1 # 2d3dc <_sk_overlay_sse2_8bit+0xe84>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,105,224,1,0 ; vbroadcastss 0x1e069(%rip),%ymm1 # 2cb10 <_sk_overlay_sse2_8bit+0x5a4>
+ DB 196,226,125,24,13,65,233,1,0 ; vbroadcastss 0x1e941(%rip),%ymm1 # 2d3e0 <_sk_overlay_sse2_8bit+0xe88>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,92,224,1,0 ; vbroadcastss 0x1e05c(%rip),%ymm1 # 2cb14 <_sk_overlay_sse2_8bit+0x5a8>
+ DB 196,226,125,24,13,52,233,1,0 ; vbroadcastss 0x1e934(%rip),%ymm1 # 2d3e4 <_sk_overlay_sse2_8bit+0xe8c>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -13916,12 +13914,12 @@ _sk_gradient_avx LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 73,131,248,2 ; cmp $0x2,%r8
- DB 114,80 ; jb eb3d <_sk_gradient_avx+0x71>
+ DB 114,80 ; jb eb35 <_sk_gradient_avx+0x71>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,200 ; dec %r8
DB 72,131,195,4 ; add $0x4,%rbx
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
- DB 196,98,125,24,21,218,222,1,0 ; vbroadcastss 0x1deda(%rip),%ymm10 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,98,125,24,21,178,231,1,0 ; vbroadcastss 0x1e7b2(%rip),%ymm10 # 2d2b0 <_sk_overlay_sse2_8bit+0xd58>
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,98,125,24,3 ; vbroadcastss (%rbx),%ymm8
DB 197,60,194,192,2 ; vcmpleps %ymm0,%ymm8,%ymm8
@@ -13933,7 +13931,7 @@ _sk_gradient_avx LABEL PROC
DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,200 ; dec %r8
- DB 117,205 ; jne eb0a <_sk_gradient_avx+0x3e>
+ DB 117,205 ; jne eb02 <_sk_gradient_avx+0x3e>
DB 196,195,249,22,200,1 ; vpextrq $0x1,%xmm1,%r8
DB 69,137,193 ; mov %r8d,%r9d
DB 73,193,232,32 ; shr $0x20,%r8
@@ -14112,27 +14110,27 @@ _sk_xy_to_unit_angle_avx LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,2,220,1,0 ; vbroadcastss 0x1dc02(%rip),%ymm13 # 2cb18 <_sk_overlay_sse2_8bit+0x5ac>
+ DB 196,98,125,24,45,218,228,1,0 ; vbroadcastss 0x1e4da(%rip),%ymm13 # 2d3e8 <_sk_overlay_sse2_8bit+0xe90>
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,248,219,1,0 ; vbroadcastss 0x1dbf8(%rip),%ymm14 # 2cb1c <_sk_overlay_sse2_8bit+0x5b0>
+ DB 196,98,125,24,53,208,228,1,0 ; vbroadcastss 0x1e4d0(%rip),%ymm14 # 2d3ec <_sk_overlay_sse2_8bit+0xe94>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,233,219,1,0 ; vbroadcastss 0x1dbe9(%rip),%ymm14 # 2cb20 <_sk_overlay_sse2_8bit+0x5b4>
+ DB 196,98,125,24,53,193,228,1,0 ; vbroadcastss 0x1e4c1(%rip),%ymm14 # 2d3f0 <_sk_overlay_sse2_8bit+0xe98>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,229 ; vmulps %ymm13,%ymm12,%ymm12
- DB 196,98,125,24,45,218,219,1,0 ; vbroadcastss 0x1dbda(%rip),%ymm13 # 2cb24 <_sk_overlay_sse2_8bit+0x5b8>
+ DB 196,98,125,24,45,178,228,1,0 ; vbroadcastss 0x1e4b2(%rip),%ymm13 # 2d3f4 <_sk_overlay_sse2_8bit+0xe9c>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,197,219,1,0 ; vbroadcastss 0x1dbc5(%rip),%ymm10 # 2cb28 <_sk_overlay_sse2_8bit+0x5bc>
+ DB 196,98,125,24,21,157,228,1,0 ; vbroadcastss 0x1e49d(%rip),%ymm10 # 2d3f8 <_sk_overlay_sse2_8bit+0xea0>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,91,218,1,0 ; vbroadcastss 0x1da5b(%rip),%ymm10 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,21,51,227,1,0 ; vbroadcastss 0x1e333(%rip),%ymm10 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,69,218,1,0 ; vbroadcastss 0x1da45(%rip),%ymm10 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,21,29,227,1,0 ; vbroadcastss 0x1e31d(%rip),%ymm10 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -14158,7 +14156,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC
DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10
DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,59,219,1,0 ; vbroadcastss 0x1db3b(%rip),%ymm11 # 2cb2c <_sk_overlay_sse2_8bit+0x5c0>
+ DB 196,98,125,24,29,19,228,1,0 ; vbroadcastss 0x1e413(%rip),%ymm11 # 2d3fc <_sk_overlay_sse2_8bit+0xea4>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
@@ -14167,17 +14165,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,15,219,1,0 ; vbroadcastss 0x1db0f(%rip),%ymm9 # 2cb30 <_sk_overlay_sse2_8bit+0x5c4>
+ DB 196,98,125,24,13,231,227,1,0 ; vbroadcastss 0x1e3e7(%rip),%ymm9 # 2d400 <_sk_overlay_sse2_8bit+0xea8>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,237,218,1,0 ; vbroadcastss 0x1daed(%rip),%ymm9 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,125,24,13,197,227,1,0 ; vbroadcastss 0x1e3c5(%rip),%ymm9 # 2d404 <_sk_overlay_sse2_8bit+0xeac>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,126,217,1,0 ; vbroadcastss 0x1d97e(%rip),%ymm11 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,29,86,226,1,0 ; vbroadcastss 0x1e256(%rip),%ymm11 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -14195,7 +14193,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC
DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10
DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,141,218,1,0 ; vbroadcastss 0x1da8d(%rip),%ymm11 # 2cb2c <_sk_overlay_sse2_8bit+0x5c0>
+ DB 196,98,125,24,29,101,227,1,0 ; vbroadcastss 0x1e365(%rip),%ymm11 # 2d3fc <_sk_overlay_sse2_8bit+0xea4>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
@@ -14204,17 +14202,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,97,218,1,0 ; vbroadcastss 0x1da61(%rip),%ymm9 # 2cb30 <_sk_overlay_sse2_8bit+0x5c4>
+ DB 196,98,125,24,13,57,227,1,0 ; vbroadcastss 0x1e339(%rip),%ymm9 # 2d400 <_sk_overlay_sse2_8bit+0xea8>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,63,218,1,0 ; vbroadcastss 0x1da3f(%rip),%ymm9 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,125,24,13,23,227,1,0 ; vbroadcastss 0x1e317(%rip),%ymm9 # 2d404 <_sk_overlay_sse2_8bit+0xeac>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,208,216,1,0 ; vbroadcastss 0x1d8d0(%rip),%ymm11 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,29,168,225,1,0 ; vbroadcastss 0x1e1a8(%rip),%ymm11 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -14231,7 +14229,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC
DB 196,67,121,4,201,0 ; vpermilps $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
- DB 196,98,125,24,21,229,217,1,0 ; vbroadcastss 0x1d9e5(%rip),%ymm10 # 2cb2c <_sk_overlay_sse2_8bit+0x5c0>
+ DB 196,98,125,24,21,189,226,1,0 ; vbroadcastss 0x1e2bd(%rip),%ymm10 # 2d3fc <_sk_overlay_sse2_8bit+0xea4>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10
@@ -14240,7 +14238,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0
- DB 196,98,125,24,5,189,217,1,0 ; vbroadcastss 0x1d9bd(%rip),%ymm8 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,125,24,5,149,226,1,0 ; vbroadcastss 0x1e295(%rip),%ymm8 # 2d404 <_sk_overlay_sse2_8bit+0xeac>
DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0
DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14275,7 +14273,7 @@ _sk_apply_vector_mask_avx LABEL PROC
PUBLIC _sk_save_xy_avx
_sk_save_xy_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,249,215,1,0 ; vbroadcastss 0x1d7f9(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,209,224,1,0 ; vbroadcastss 0x1e0d1(%rip),%ymm8 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -14308,9 +14306,9 @@ _sk_accumulate_avx LABEL PROC
PUBLIC _sk_bilinear_nx_avx
_sk_bilinear_nx_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,225,216,1,0 ; vbroadcastss 0x1d8e1(%rip),%ymm0 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,5,185,225,1,0 ; vbroadcastss 0x1e1b9(%rip),%ymm0 # 2d408 <_sk_overlay_sse2_8bit+0xeb0>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,120,215,1,0 ; vbroadcastss 0x1d778(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,80,224,1,0 ; vbroadcastss 0x1e050(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14319,7 +14317,7 @@ _sk_bilinear_nx_avx LABEL PROC
PUBLIC _sk_bilinear_px_avx
_sk_bilinear_px_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,88,215,1,0 ; vbroadcastss 0x1d758(%rip),%ymm0 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,226,125,24,5,48,224,1,0 ; vbroadcastss 0x1e030(%rip),%ymm0 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -14329,9 +14327,9 @@ _sk_bilinear_px_avx LABEL PROC
PUBLIC _sk_bilinear_ny_avx
_sk_bilinear_ny_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,152,216,1,0 ; vbroadcastss 0x1d898(%rip),%ymm1 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,13,112,225,1,0 ; vbroadcastss 0x1e170(%rip),%ymm1 # 2d408 <_sk_overlay_sse2_8bit+0xeb0>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,46,215,1,0 ; vbroadcastss 0x1d72e(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,6,224,1,0 ; vbroadcastss 0x1e006(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14340,7 +14338,7 @@ _sk_bilinear_ny_avx LABEL PROC
PUBLIC _sk_bilinear_py_avx
_sk_bilinear_py_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,14,215,1,0 ; vbroadcastss 0x1d70e(%rip),%ymm1 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,226,125,24,13,230,223,1,0 ; vbroadcastss 0x1dfe6(%rip),%ymm1 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -14350,14 +14348,14 @@ _sk_bilinear_py_avx LABEL PROC
PUBLIC _sk_bicubic_n3x_avx
_sk_bicubic_n3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,81,216,1,0 ; vbroadcastss 0x1d851(%rip),%ymm0 # 2cb3c <_sk_overlay_sse2_8bit+0x5d0>
+ DB 196,226,125,24,5,41,225,1,0 ; vbroadcastss 0x1e129(%rip),%ymm0 # 2d40c <_sk_overlay_sse2_8bit+0xeb4>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,228,214,1,0 ; vbroadcastss 0x1d6e4(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,188,223,1,0 ; vbroadcastss 0x1dfbc(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,53,216,1,0 ; vbroadcastss 0x1d835(%rip),%ymm10 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,13,225,1,0 ; vbroadcastss 0x1e10d(%rip),%ymm10 # 2d410 <_sk_overlay_sse2_8bit+0xeb8>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,51,215,1,0 ; vbroadcastss 0x1d733(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,98,125,24,21,11,224,1,0 ; vbroadcastss 0x1e00b(%rip),%ymm10 # 2d31c <_sk_overlay_sse2_8bit+0xdc4>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -14367,19 +14365,19 @@ _sk_bicubic_n3x_avx LABEL PROC
PUBLIC _sk_bicubic_n1x_avx
_sk_bicubic_n1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,254,215,1,0 ; vbroadcastss 0x1d7fe(%rip),%ymm0 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,5,214,224,1,0 ; vbroadcastss 0x1e0d6(%rip),%ymm0 # 2d408 <_sk_overlay_sse2_8bit+0xeb0>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,149,214,1,0 ; vbroadcastss 0x1d695(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,109,223,1,0 ; vbroadcastss 0x1df6d(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,243,215,1,0 ; vbroadcastss 0x1d7f3(%rip),%ymm9 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,13,203,224,1,0 ; vbroadcastss 0x1e0cb(%rip),%ymm9 # 2d418 <_sk_overlay_sse2_8bit+0xec0>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,225,215,1,0 ; vbroadcastss 0x1d7e1(%rip),%ymm10 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,98,125,24,21,185,224,1,0 ; vbroadcastss 0x1e0b9(%rip),%ymm10 # 2d414 <_sk_overlay_sse2_8bit+0xebc>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,98,214,1,0 ; vbroadcastss 0x1d662(%rip),%ymm10 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,21,58,223,1,0 ; vbroadcastss 0x1df3a(%rip),%ymm10 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,195,215,1,0 ; vbroadcastss 0x1d7c3(%rip),%ymm9 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,13,155,224,1,0 ; vbroadcastss 0x1e09b(%rip),%ymm9 # 2d41c <_sk_overlay_sse2_8bit+0xec4>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14388,17 +14386,17 @@ _sk_bicubic_n1x_avx LABEL PROC
PUBLIC _sk_bicubic_p1x_avx
_sk_bicubic_p1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,51,214,1,0 ; vbroadcastss 0x1d633(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,11,223,1,0 ; vbroadcastss 0x1df0b(%rip),%ymm8 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,145,215,1,0 ; vbroadcastss 0x1d791(%rip),%ymm10 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,21,105,224,1,0 ; vbroadcastss 0x1e069(%rip),%ymm10 # 2d418 <_sk_overlay_sse2_8bit+0xec0>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,127,215,1,0 ; vbroadcastss 0x1d77f(%rip),%ymm11 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,98,125,24,29,87,224,1,0 ; vbroadcastss 0x1e057(%rip),%ymm11 # 2d414 <_sk_overlay_sse2_8bit+0xebc>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,106,215,1,0 ; vbroadcastss 0x1d76a(%rip),%ymm9 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,13,66,224,1,0 ; vbroadcastss 0x1e042(%rip),%ymm9 # 2d41c <_sk_overlay_sse2_8bit+0xec4>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14407,13 +14405,13 @@ _sk_bicubic_p1x_avx LABEL PROC
PUBLIC _sk_bicubic_p3x_avx
_sk_bicubic_p3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,70,215,1,0 ; vbroadcastss 0x1d746(%rip),%ymm0 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,226,125,24,5,30,224,1,0 ; vbroadcastss 0x1e01e(%rip),%ymm0 # 2d414 <_sk_overlay_sse2_8bit+0xebc>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,43,215,1,0 ; vbroadcastss 0x1d72b(%rip),%ymm10 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,3,224,1,0 ; vbroadcastss 0x1e003(%rip),%ymm10 # 2d410 <_sk_overlay_sse2_8bit+0xeb8>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,41,214,1,0 ; vbroadcastss 0x1d629(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,98,125,24,21,1,223,1,0 ; vbroadcastss 0x1df01(%rip),%ymm10 # 2d31c <_sk_overlay_sse2_8bit+0xdc4>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -14423,14 +14421,14 @@ _sk_bicubic_p3x_avx LABEL PROC
PUBLIC _sk_bicubic_n3y_avx
_sk_bicubic_n3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,248,214,1,0 ; vbroadcastss 0x1d6f8(%rip),%ymm1 # 2cb3c <_sk_overlay_sse2_8bit+0x5d0>
+ DB 196,226,125,24,13,208,223,1,0 ; vbroadcastss 0x1dfd0(%rip),%ymm1 # 2d40c <_sk_overlay_sse2_8bit+0xeb4>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,138,213,1,0 ; vbroadcastss 0x1d58a(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,98,222,1,0 ; vbroadcastss 0x1de62(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,219,214,1,0 ; vbroadcastss 0x1d6db(%rip),%ymm10 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,179,223,1,0 ; vbroadcastss 0x1dfb3(%rip),%ymm10 # 2d410 <_sk_overlay_sse2_8bit+0xeb8>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,217,213,1,0 ; vbroadcastss 0x1d5d9(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,98,125,24,21,177,222,1,0 ; vbroadcastss 0x1deb1(%rip),%ymm10 # 2d31c <_sk_overlay_sse2_8bit+0xdc4>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -14440,19 +14438,19 @@ _sk_bicubic_n3y_avx LABEL PROC
PUBLIC _sk_bicubic_n1y_avx
_sk_bicubic_n1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,164,214,1,0 ; vbroadcastss 0x1d6a4(%rip),%ymm1 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,13,124,223,1,0 ; vbroadcastss 0x1df7c(%rip),%ymm1 # 2d408 <_sk_overlay_sse2_8bit+0xeb0>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,58,213,1,0 ; vbroadcastss 0x1d53a(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,18,222,1,0 ; vbroadcastss 0x1de12(%rip),%ymm8 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,152,214,1,0 ; vbroadcastss 0x1d698(%rip),%ymm9 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,13,112,223,1,0 ; vbroadcastss 0x1df70(%rip),%ymm9 # 2d418 <_sk_overlay_sse2_8bit+0xec0>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,134,214,1,0 ; vbroadcastss 0x1d686(%rip),%ymm10 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,98,125,24,21,94,223,1,0 ; vbroadcastss 0x1df5e(%rip),%ymm10 # 2d414 <_sk_overlay_sse2_8bit+0xebc>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,7,213,1,0 ; vbroadcastss 0x1d507(%rip),%ymm10 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,21,223,221,1,0 ; vbroadcastss 0x1dddf(%rip),%ymm10 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,104,214,1,0 ; vbroadcastss 0x1d668(%rip),%ymm9 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,13,64,223,1,0 ; vbroadcastss 0x1df40(%rip),%ymm9 # 2d41c <_sk_overlay_sse2_8bit+0xec4>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14461,17 +14459,17 @@ _sk_bicubic_n1y_avx LABEL PROC
PUBLIC _sk_bicubic_p1y_avx
_sk_bicubic_p1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,216,212,1,0 ; vbroadcastss 0x1d4d8(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,176,221,1,0 ; vbroadcastss 0x1ddb0(%rip),%ymm8 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,53,214,1,0 ; vbroadcastss 0x1d635(%rip),%ymm10 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,21,13,223,1,0 ; vbroadcastss 0x1df0d(%rip),%ymm10 # 2d418 <_sk_overlay_sse2_8bit+0xec0>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,35,214,1,0 ; vbroadcastss 0x1d623(%rip),%ymm11 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,98,125,24,29,251,222,1,0 ; vbroadcastss 0x1defb(%rip),%ymm11 # 2d414 <_sk_overlay_sse2_8bit+0xebc>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,14,214,1,0 ; vbroadcastss 0x1d60e(%rip),%ymm9 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,13,230,222,1,0 ; vbroadcastss 0x1dee6(%rip),%ymm9 # 2d41c <_sk_overlay_sse2_8bit+0xec4>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14480,13 +14478,13 @@ _sk_bicubic_p1y_avx LABEL PROC
PUBLIC _sk_bicubic_p3y_avx
_sk_bicubic_p3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,234,213,1,0 ; vbroadcastss 0x1d5ea(%rip),%ymm1 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,226,125,24,13,194,222,1,0 ; vbroadcastss 0x1dec2(%rip),%ymm1 # 2d414 <_sk_overlay_sse2_8bit+0xebc>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,206,213,1,0 ; vbroadcastss 0x1d5ce(%rip),%ymm10 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,166,222,1,0 ; vbroadcastss 0x1dea6(%rip),%ymm10 # 2d410 <_sk_overlay_sse2_8bit+0xeb8>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,204,212,1,0 ; vbroadcastss 0x1d4cc(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,98,125,24,21,164,221,1,0 ; vbroadcastss 0x1dda4(%rip),%ymm10 # 2d31c <_sk_overlay_sse2_8bit+0xdc4>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -14617,7 +14615,7 @@ _sk_clut_3D_avx LABEL PROC
DB 197,249,127,68,36,96 ; vmovdqa %xmm0,0x60(%rsp)
DB 72,139,0 ; mov (%rax),%rax
DB 196,193,121,254,194 ; vpaddd %xmm10,%xmm0,%xmm0
- DB 196,98,121,24,29,130,211,1,0 ; vbroadcastss 0x1d382(%rip),%xmm11 # 2cb54 <_sk_overlay_sse2_8bit+0x5e8>
+ DB 196,98,121,24,29,90,220,1,0 ; vbroadcastss 0x1dc5a(%rip),%xmm11 # 2d424 <_sk_overlay_sse2_8bit+0xecc>
DB 196,194,121,64,203 ; vpmulld %xmm11,%xmm0,%xmm1
DB 196,193,249,126,200 ; vmovq %xmm1,%r8
DB 69,137,193 ; mov %r8d,%r9d
@@ -14651,7 +14649,7 @@ _sk_clut_3D_avx LABEL PROC
DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
DB 196,227,93,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm3
DB 197,252,17,156,36,192,0,0,0 ; vmovups %ymm3,0xc0(%rsp)
- DB 196,98,121,24,13,73,209,1,0 ; vbroadcastss 0x1d149(%rip),%xmm9 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,98,121,24,13,33,218,1,0 ; vbroadcastss 0x1da21(%rip),%xmm9 # 2d2b0 <_sk_overlay_sse2_8bit+0xd58>
DB 196,193,105,254,249 ; vpaddd %xmm9,%xmm2,%xmm7
DB 196,195,249,22,248,1 ; vpextrq $0x1,%xmm7,%r8
DB 196,193,249,126,249 ; vmovq %xmm7,%r9
@@ -14679,7 +14677,7 @@ _sk_clut_3D_avx LABEL PROC
DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7
DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5
DB 196,99,85,24,254,1 ; vinsertf128 $0x1,%xmm6,%ymm5,%ymm15
- DB 196,98,121,24,37,190,208,1,0 ; vbroadcastss 0x1d0be(%rip),%xmm12 # 2c9e8 <_sk_overlay_sse2_8bit+0x47c>
+ DB 196,98,121,24,37,150,217,1,0 ; vbroadcastss 0x1d996(%rip),%xmm12 # 2d2b8 <_sk_overlay_sse2_8bit+0xd60>
DB 196,193,105,254,212 ; vpaddd %xmm12,%xmm2,%xmm2
DB 196,195,249,22,208,1 ; vpextrq $0x1,%xmm2,%r8
DB 196,193,249,126,209 ; vmovq %xmm2,%r9
@@ -14707,7 +14705,7 @@ _sk_clut_3D_avx LABEL PROC
DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
DB 196,227,105,33,213,48 ; vinsertps $0x30,%xmm5,%xmm2,%xmm2
DB 196,227,109,24,225,1 ; vinsertf128 $0x1,%xmm1,%ymm2,%ymm4
- DB 196,226,125,24,13,146,209,1,0 ; vbroadcastss 0x1d192(%rip),%ymm1 # 2cb50 <_sk_overlay_sse2_8bit+0x5e4>
+ DB 196,226,125,24,13,106,218,1,0 ; vbroadcastss 0x1da6a(%rip),%ymm1 # 2d420 <_sk_overlay_sse2_8bit+0xec8>
DB 197,188,88,209 ; vaddps %ymm1,%ymm8,%ymm2
DB 197,252,17,140,36,160,0,0,0 ; vmovups %ymm1,0xa0(%rsp)
DB 197,254,91,210 ; vcvttps2dq %ymm2,%ymm2
@@ -15458,7 +15456,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,226,25,64,200 ; vpmulld %xmm0,%xmm12,%xmm1
DB 197,249,127,12,36 ; vmovdqa %xmm1,(%rsp)
DB 197,241,254,202 ; vpaddd %xmm2,%xmm1,%xmm1
- DB 196,98,121,24,61,23,194,1,0 ; vbroadcastss 0x1c217(%rip),%xmm15 # 2cb54 <_sk_overlay_sse2_8bit+0x5e8>
+ DB 196,98,121,24,61,239,202,1,0 ; vbroadcastss 0x1caef(%rip),%xmm15 # 2d424 <_sk_overlay_sse2_8bit+0xecc>
DB 196,194,113,64,247 ; vpmulld %xmm15,%xmm1,%xmm6
DB 196,193,249,126,240 ; vmovq %xmm6,%r8
DB 69,137,193 ; mov %r8d,%r9d
@@ -15496,7 +15494,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,163,65,33,60,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
DB 196,99,53,24,247,1 ; vinsertf128 $0x1,%xmm7,%ymm9,%ymm14
- DB 196,98,121,24,21,197,191,1,0 ; vbroadcastss 0x1bfc5(%rip),%xmm10 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,98,121,24,21,157,200,1,0 ; vbroadcastss 0x1c89d(%rip),%xmm10 # 2d2b0 <_sk_overlay_sse2_8bit+0xd58>
DB 196,65,97,254,202 ; vpaddd %xmm10,%xmm3,%xmm9
DB 196,67,249,22,200,1 ; vpextrq $0x1,%xmm9,%r8
DB 196,65,249,126,201 ; vmovq %xmm9,%r9
@@ -15524,7 +15522,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7
DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5
DB 196,99,85,24,220,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm11
- DB 196,98,121,24,13,58,191,1,0 ; vbroadcastss 0x1bf3a(%rip),%xmm9 # 2c9e8 <_sk_overlay_sse2_8bit+0x47c>
+ DB 196,98,121,24,13,18,200,1,0 ; vbroadcastss 0x1c812(%rip),%xmm9 # 2d2b8 <_sk_overlay_sse2_8bit+0xd60>
DB 196,193,97,254,217 ; vpaddd %xmm9,%xmm3,%xmm3
DB 196,195,249,22,216,1 ; vpextrq $0x1,%xmm3,%r8
DB 196,193,249,126,217 ; vmovq %xmm3,%r9
@@ -15552,7 +15550,7 @@ _sk_clut_4D_avx LABEL PROC
DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
DB 196,227,89,33,229,48 ; vinsertps $0x30,%xmm5,%xmm4,%xmm4
DB 196,227,93,24,243,1 ; vinsertf128 $0x1,%xmm3,%ymm4,%ymm6
- DB 196,226,125,24,37,14,192,1,0 ; vbroadcastss 0x1c00e(%rip),%ymm4 # 2cb50 <_sk_overlay_sse2_8bit+0x5e4>
+ DB 196,226,125,24,37,230,200,1,0 ; vbroadcastss 0x1c8e6(%rip),%ymm4 # 2d420 <_sk_overlay_sse2_8bit+0xec8>
DB 197,148,88,220 ; vaddps %ymm4,%ymm13,%ymm3
DB 197,252,40,252 ; vmovaps %ymm4,%ymm7
DB 197,252,17,188,36,160,0,0,0 ; vmovups %ymm7,0xa0(%rsp)
@@ -16982,7 +16980,7 @@ _sk_clut_4D_avx LABEL PROC
DB 197,220,89,210 ; vmulps %ymm2,%ymm4,%ymm2
DB 197,212,88,210 ; vaddps %ymm2,%ymm5,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,211,160,1,0 ; vbroadcastss 0x1a0d3(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,171,169,1,0 ; vbroadcastss 0x1a9ab(%rip),%ymm3 # 2d2ac <_sk_overlay_sse2_8bit+0xd54>
DB 197,252,16,164,36,160,2,0,0 ; vmovups 0x2a0(%rsp),%ymm4
DB 197,252,16,172,36,192,2,0,0 ; vmovups 0x2c0(%rsp),%ymm5
DB 197,252,16,180,36,224,2,0,0 ; vmovups 0x2e0(%rsp),%ymm6
@@ -17023,13 +17021,13 @@ _sk_start_pipeline_sse41 LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,101 ; jae 12a1b <_sk_start_pipeline_sse41+0xe2>
+ DB 115,101 ; jae 12a13 <_sk_start_pipeline_sse41+0xe2>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,4 ; lea 0x4(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
- DB 119,38 ; ja 129fe <_sk_start_pipeline_sse41+0xc5>
+ DB 119,38 ; ja 129f6 <_sk_start_pipeline_sse41+0xc5>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 49,255 ; xor %edi,%edi
DB 76,137,246 ; mov %r14,%rsi
@@ -17040,16 +17038,16 @@ _sk_start_pipeline_sse41 LABEL PROC
DB 73,131,196,8 ; add $0x8,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,225 ; jbe 129df <_sk_start_pipeline_sse41+0xa6>
+ DB 118,225 ; jbe 129d7 <_sk_start_pipeline_sse41+0xa6>
DB 76,137,255 ; mov %r15,%rdi
DB 72,41,215 ; sub %rdx,%rdi
- DB 116,9 ; je 12a0f <_sk_start_pipeline_sse41+0xd6>
+ DB 116,9 ; je 12a07 <_sk_start_pipeline_sse41+0xd6>
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,173 ; jne 129c8 <_sk_start_pipeline_sse41+0x8f>
+ DB 117,173 ; jne 129c0 <_sk_start_pipeline_sse41+0x8f>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -17080,15 +17078,13 @@ _sk_seed_shader_sse41 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,21,27,170,1,0 ; movaps 0x1aa1b(%rip),%xmm2 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
- DB 15,88,194 ; addps %xmm2,%xmm0
- DB 15,88,5,33,170,1,0 ; addps 0x1aa21(%rip),%xmm0 # 2d4b0 <_sk_overlay_sse2_8bit+0xf44>
+ DB 15,88,5,35,170,1,0 ; addps 0x1aa23(%rip),%xmm0 # 2d4a0 <_sk_overlay_sse2_8bit+0xf48>
DB 102,15,110,201 ; movd %ecx,%xmm1
DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,88,202 ; addps %xmm2,%xmm1
+ DB 15,88,13,32,170,1,0 ; addps 0x1aa20(%rip),%xmm1 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,25,170,1,0 ; movaps 0x1aa19(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,21,39,170,1,0 ; movaps 0x1aa27(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -17101,18 +17097,18 @@ _sk_dither_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 102,68,15,110,194 ; movd %edx,%xmm8
DB 102,69,15,112,200,0 ; pshufd $0x0,%xmm8,%xmm9
- DB 102,68,15,254,13,178,169,1,0 ; paddd 0x1a9b2(%rip),%xmm9 # 2d480 <_sk_overlay_sse2_8bit+0xf14>
+ DB 102,68,15,254,13,192,169,1,0 ; paddd 0x1a9c0(%rip),%xmm9 # 2d480 <_sk_overlay_sse2_8bit+0xf28>
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,233,169,1,0 ; movdqa 0x1a9e9(%rip),%xmm10 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,68,15,111,21,247,169,1,0 ; movdqa 0x1a9f7(%rip),%xmm10 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,213,169,1,0 ; movdqa 0x1a9d5(%rip),%xmm12 # 2d4e0 <_sk_overlay_sse2_8bit+0xf74>
- DB 102,68,15,111,45,220,169,1,0 ; movdqa 0x1a9dc(%rip),%xmm13 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,68,15,111,37,227,169,1,0 ; movdqa 0x1a9e3(%rip),%xmm12 # 2d4e0 <_sk_overlay_sse2_8bit+0xf88>
+ DB 102,68,15,111,45,234,169,1,0 ; movdqa 0x1a9ea(%rip),%xmm13 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -17128,8 +17124,8 @@ _sk_dither_sse41 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,151,169,1,0 ; mulps 0x1a997(%rip),%xmm8 # 2d500 <_sk_overlay_sse2_8bit+0xf94>
- DB 68,15,88,5,159,169,1,0 ; addps 0x1a99f(%rip),%xmm8 # 2d510 <_sk_overlay_sse2_8bit+0xfa4>
+ DB 68,15,89,5,165,169,1,0 ; mulps 0x1a9a5(%rip),%xmm8 # 2d500 <_sk_overlay_sse2_8bit+0xfa8>
+ DB 68,15,88,5,173,169,1,0 ; addps 0x1a9ad(%rip),%xmm8 # 2d510 <_sk_overlay_sse2_8bit+0xfb8>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -17167,7 +17163,7 @@ _sk_uniform_color_sse41 LABEL PROC
PUBLIC _sk_black_color_sse41
_sk_black_color_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,213,168,1,0 ; movaps 0x1a8d5(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,227,168,1,0 ; movaps 0x1a8e3(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -17176,7 +17172,7 @@ _sk_black_color_sse41 LABEL PROC
PUBLIC _sk_white_color_sse41
_sk_white_color_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,193,168,1,0 ; movaps 0x1a8c1(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,5,207,168,1,0 ; movaps 0x1a8cf(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -17214,7 +17210,7 @@ _sk_clear_sse41 LABEL PROC
PUBLIC _sk_srcatop_sse41
_sk_srcatop_sse41 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,113,168,1,0 ; movaps 0x1a871(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,127,168,1,0 ; movaps 0x1a87f(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -17237,7 +17233,7 @@ PUBLIC _sk_dstatop_sse41
_sk_dstatop_sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,36,168,1,0 ; movaps 0x1a824(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,13,50,168,1,0 ; movaps 0x1a832(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -17278,7 +17274,7 @@ _sk_dstin_sse41 LABEL PROC
PUBLIC _sk_srcout_sse41
_sk_srcout_sse41 LABEL PROC
- DB 68,15,40,5,184,167,1,0 ; movaps 0x1a7b8(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,198,167,1,0 ; movaps 0x1a7c6(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -17289,7 +17285,7 @@ _sk_srcout_sse41 LABEL PROC
PUBLIC _sk_dstout_sse41
_sk_dstout_sse41 LABEL PROC
- DB 68,15,40,5,152,167,1,0 ; movaps 0x1a798(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,166,167,1,0 ; movaps 0x1a7a6(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -17304,7 +17300,7 @@ _sk_dstout_sse41 LABEL PROC
PUBLIC _sk_srcover_sse41
_sk_srcover_sse41 LABEL PROC
- DB 68,15,40,5,107,167,1,0 ; movaps 0x1a76b(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,121,167,1,0 ; movaps 0x1a779(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -17322,7 +17318,7 @@ _sk_srcover_sse41 LABEL PROC
PUBLIC _sk_dstover_sse41
_sk_dstover_sse41 LABEL PROC
- DB 68,15,40,5,47,167,1,0 ; movaps 0x1a72f(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,61,167,1,0 ; movaps 0x1a73d(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -17346,7 +17342,7 @@ _sk_modulate_sse41 LABEL PROC
PUBLIC _sk_multiply_sse41
_sk_multiply_sse41 LABEL PROC
- DB 68,15,40,5,243,166,1,0 ; movaps 0x1a6f3(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,1,167,1,0 ; movaps 0x1a701(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -17382,7 +17378,7 @@ _sk_multiply_sse41 LABEL PROC
PUBLIC _sk_plus__sse41
_sk_plus__sse41 LABEL PROC
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 68,15,40,5,116,166,1,0 ; movaps 0x1a674(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,130,166,1,0 ; movaps 0x1a682(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 15,88,205 ; addps %xmm5,%xmm1
DB 65,15,93,200 ; minps %xmm8,%xmm1
@@ -17420,7 +17416,7 @@ _sk_screen_sse41 LABEL PROC
PUBLIC _sk_xor__sse41
_sk_xor__sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,0,166,1,0 ; movaps 0x1a600(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,14,166,1,0 ; movaps 0x1a60e(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -17466,7 +17462,7 @@ _sk_darken_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,91,165,1,0 ; movaps 0x1a55b(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,21,105,165,1,0 ; movaps 0x1a569(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17498,7 +17494,7 @@ _sk_lighten_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,240,164,1,0 ; movaps 0x1a4f0(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,21,254,164,1,0 ; movaps 0x1a4fe(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17533,7 +17529,7 @@ _sk_difference_sse41 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,122,164,1,0 ; movaps 0x1a47a(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,21,136,164,1,0 ; movaps 0x1a488(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17559,7 +17555,7 @@ _sk_exclusion_sse41 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,42,164,1,0 ; movaps 0x1a42a(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,21,56,164,1,0 ; movaps 0x1a438(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17569,7 +17565,7 @@ _sk_exclusion_sse41 LABEL PROC
PUBLIC _sk_colorburn_sse41
_sk_colorburn_sse41 LABEL PROC
- DB 68,15,40,29,17,164,1,0 ; movaps 0x1a411(%rip),%xmm11 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,29,31,164,1,0 ; movaps 0x1a41f(%rip),%xmm11 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 68,15,92,231 ; subps %xmm7,%xmm12
DB 69,15,40,204 ; movaps %xmm12,%xmm9
@@ -17651,7 +17647,7 @@ _sk_colorburn_sse41 LABEL PROC
PUBLIC _sk_colordodge_sse41
_sk_colordodge_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,219,162,1,0 ; movaps 0x1a2db(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,21,233,162,1,0 ; movaps 0x1a2e9(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -17732,7 +17728,7 @@ _sk_hardlight_sse41 LABEL PROC
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,163,161,1,0 ; movaps 0x1a1a3(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,21,177,161,1,0 ; movaps 0x1a1b1(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 65,15,40,234 ; movaps %xmm10,%xmm5
DB 15,92,239 ; subps %xmm7,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
@@ -17814,7 +17810,7 @@ PUBLIC _sk_overlay_sse41
_sk_overlay_sse41 LABEL PROC
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,40,240 ; movaps %xmm0,%xmm14
- DB 68,15,40,21,117,160,1,0 ; movaps 0x1a075(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,21,131,160,1,0 ; movaps 0x1a083(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 65,15,40,195 ; movaps %xmm11,%xmm0
@@ -17898,7 +17894,7 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 65,15,84,193 ; andps %xmm9,%xmm0
- DB 15,40,13,56,159,1,0 ; movaps 0x19f38(%rip),%xmm1 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,13,70,159,1,0 ; movaps 0x19f46(%rip),%xmm1 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 68,15,40,240 ; movaps %xmm0,%xmm14
@@ -17911,10 +17907,10 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,210 ; mulps %xmm2,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,40,45,102,159,1,0 ; movaps 0x19f66(%rip),%xmm13 # 2d520 <_sk_overlay_sse2_8bit+0xfb4>
+ DB 68,15,40,45,116,159,1,0 ; movaps 0x19f74(%rip),%xmm13 # 2d520 <_sk_overlay_sse2_8bit+0xfc8>
DB 69,15,88,245 ; addps %xmm13,%xmm14
DB 68,15,89,242 ; mulps %xmm2,%xmm14
- DB 68,15,40,37,102,159,1,0 ; movaps 0x19f66(%rip),%xmm12 # 2d530 <_sk_overlay_sse2_8bit+0xfc4>
+ DB 68,15,40,37,116,159,1,0 ; movaps 0x19f74(%rip),%xmm12 # 2d530 <_sk_overlay_sse2_8bit+0xfd8>
DB 69,15,89,252 ; mulps %xmm12,%xmm15
DB 69,15,88,254 ; addps %xmm14,%xmm15
DB 15,40,198 ; movaps %xmm6,%xmm0
@@ -18100,12 +18096,12 @@ _sk_hue_sse41 LABEL PROC
DB 68,15,84,208 ; andps %xmm0,%xmm10
DB 15,84,200 ; andps %xmm0,%xmm1
DB 68,15,84,232 ; andps %xmm0,%xmm13
- DB 15,40,5,204,156,1,0 ; movaps 0x19ccc(%rip),%xmm0 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
+ DB 15,40,5,218,156,1,0 ; movaps 0x19cda(%rip),%xmm0 # 2d540 <_sk_overlay_sse2_8bit+0xfe8>
DB 68,15,89,224 ; mulps %xmm0,%xmm12
- DB 15,40,21,209,156,1,0 ; movaps 0x19cd1(%rip),%xmm2 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
+ DB 15,40,21,223,156,1,0 ; movaps 0x19cdf(%rip),%xmm2 # 2d550 <_sk_overlay_sse2_8bit+0xff8>
DB 15,89,250 ; mulps %xmm2,%xmm7
DB 65,15,88,252 ; addps %xmm12,%xmm7
- DB 68,15,40,53,210,156,1,0 ; movaps 0x19cd2(%rip),%xmm14 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
+ DB 68,15,40,53,224,156,1,0 ; movaps 0x19ce0(%rip),%xmm14 # 2d560 <_sk_overlay_sse2_8bit+0x1008>
DB 68,15,40,252 ; movaps %xmm4,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,255 ; addps %xmm7,%xmm15
@@ -18188,7 +18184,7 @@ _sk_hue_sse41 LABEL PROC
DB 65,15,88,214 ; addps %xmm14,%xmm2
DB 15,40,196 ; movaps %xmm4,%xmm0
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,40,13,231,154,1,0 ; movaps 0x19ae7(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,13,245,154,1,0 ; movaps 0x19af5(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 65,15,40,225 ; movaps %xmm9,%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,40,68,36,48 ; movaps 0x30(%rsp),%xmm0
@@ -18282,14 +18278,14 @@ _sk_saturation_sse41 LABEL PROC
DB 68,15,84,215 ; andps %xmm7,%xmm10
DB 68,15,84,223 ; andps %xmm7,%xmm11
DB 68,15,84,199 ; andps %xmm7,%xmm8
- DB 15,40,21,10,154,1,0 ; movaps 0x19a0a(%rip),%xmm2 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
+ DB 15,40,21,24,154,1,0 ; movaps 0x19a18(%rip),%xmm2 # 2d540 <_sk_overlay_sse2_8bit+0xfe8>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,218 ; mulps %xmm2,%xmm3
- DB 15,40,13,13,154,1,0 ; movaps 0x19a0d(%rip),%xmm1 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
+ DB 15,40,13,27,154,1,0 ; movaps 0x19a1b(%rip),%xmm1 # 2d550 <_sk_overlay_sse2_8bit+0xff8>
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,249 ; mulps %xmm1,%xmm7
DB 15,88,251 ; addps %xmm3,%xmm7
- DB 68,15,40,45,12,154,1,0 ; movaps 0x19a0c(%rip),%xmm13 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
+ DB 68,15,40,45,26,154,1,0 ; movaps 0x19a1a(%rip),%xmm13 # 2d560 <_sk_overlay_sse2_8bit+0x1008>
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 68,15,88,247 ; addps %xmm7,%xmm14
DB 65,15,40,218 ; movaps %xmm10,%xmm3
@@ -18370,7 +18366,7 @@ _sk_saturation_sse41 LABEL PROC
DB 65,15,88,253 ; addps %xmm13,%xmm7
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 102,68,15,56,20,223 ; blendvps %xmm0,%xmm7,%xmm11
- DB 68,15,40,13,34,152,1,0 ; movaps 0x19822(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,13,48,152,1,0 ; movaps 0x19830(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 68,15,92,204 ; subps %xmm4,%xmm9
DB 15,40,60,36 ; movaps (%rsp),%xmm7
@@ -18425,14 +18421,14 @@ _sk_color_sse41 LABEL PROC
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 68,15,89,244 ; mulps %xmm4,%xmm14
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 68,15,40,13,215,151,1,0 ; movaps 0x197d7(%rip),%xmm9 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
+ DB 68,15,40,13,229,151,1,0 ; movaps 0x197e5(%rip),%xmm9 # 2d540 <_sk_overlay_sse2_8bit+0xfe8>
DB 65,15,40,250 ; movaps %xmm10,%xmm7
DB 65,15,89,249 ; mulps %xmm9,%xmm7
- DB 68,15,40,21,215,151,1,0 ; movaps 0x197d7(%rip),%xmm10 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
+ DB 68,15,40,21,229,151,1,0 ; movaps 0x197e5(%rip),%xmm10 # 2d550 <_sk_overlay_sse2_8bit+0xff8>
DB 65,15,40,219 ; movaps %xmm11,%xmm3
DB 65,15,89,218 ; mulps %xmm10,%xmm3
DB 15,88,223 ; addps %xmm7,%xmm3
- DB 68,15,40,29,212,151,1,0 ; movaps 0x197d4(%rip),%xmm11 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
+ DB 68,15,40,29,226,151,1,0 ; movaps 0x197e2(%rip),%xmm11 # 2d560 <_sk_overlay_sse2_8bit+0x1008>
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
@@ -18517,7 +18513,7 @@ _sk_color_sse41 LABEL PROC
DB 65,15,88,251 ; addps %xmm11,%xmm7
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,15,56,20,207 ; blendvps %xmm0,%xmm7,%xmm1
- DB 68,15,40,13,224,149,1,0 ; movaps 0x195e0(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,13,238,149,1,0 ; movaps 0x195ee(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
DB 68,15,89,192 ; mulps %xmm0,%xmm8
@@ -18569,13 +18565,13 @@ _sk_luminosity_sse41 LABEL PROC
DB 69,15,89,216 ; mulps %xmm8,%xmm11
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,89,205 ; mulps %xmm5,%xmm9
- DB 68,15,40,5,162,149,1,0 ; movaps 0x195a2(%rip),%xmm8 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
+ DB 68,15,40,5,176,149,1,0 ; movaps 0x195b0(%rip),%xmm8 # 2d540 <_sk_overlay_sse2_8bit+0xfe8>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 68,15,40,21,166,149,1,0 ; movaps 0x195a6(%rip),%xmm10 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
+ DB 68,15,40,21,180,149,1,0 ; movaps 0x195b4(%rip),%xmm10 # 2d550 <_sk_overlay_sse2_8bit+0xff8>
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 65,15,89,234 ; mulps %xmm10,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 68,15,40,37,164,149,1,0 ; movaps 0x195a4(%rip),%xmm12 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
+ DB 68,15,40,37,178,149,1,0 ; movaps 0x195b2(%rip),%xmm12 # 2d560 <_sk_overlay_sse2_8bit+0x1008>
DB 68,15,40,242 ; movaps %xmm2,%xmm14
DB 69,15,89,244 ; mulps %xmm12,%xmm14
DB 68,15,88,245 ; addps %xmm5,%xmm14
@@ -18660,7 +18656,7 @@ _sk_luminosity_sse41 LABEL PROC
DB 65,15,88,244 ; addps %xmm12,%xmm6
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 102,68,15,56,20,206 ; blendvps %xmm0,%xmm6,%xmm9
- DB 15,40,5,170,147,1,0 ; movaps 0x193aa(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,5,184,147,1,0 ; movaps 0x193b8(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,92,215 ; subps %xmm7,%xmm2
DB 15,89,226 ; mulps %xmm2,%xmm4
@@ -18704,23 +18700,23 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,219,0,0,0 ; jne 14281 <_sk_srcover_rgba_8888_sse41+0xfb>
+ DB 15,133,219,0,0,0 ; jne 14273 <_sk_srcover_rgba_8888_sse41+0xfb>
DB 243,65,15,111,60,128 ; movdqu (%r8,%rax,4),%xmm7
DB 72,133,255 ; test %rdi,%rdi
- DB 102,15,111,37,185,147,1,0 ; movdqa 0x193b9(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,37,199,147,1,0 ; movdqa 0x193c7(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,181,147,1,0 ; pshufb 0x193b5(%rip),%xmm5 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
+ DB 102,15,56,0,45,195,147,1,0 ; pshufb 0x193c3(%rip),%xmm5 # 2d580 <_sk_overlay_sse2_8bit+0x1028>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,181,147,1,0 ; pshufb 0x193b5(%rip),%xmm6 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
+ DB 102,15,56,0,53,195,147,1,0 ; pshufb 0x193c3(%rip),%xmm6 # 2d590 <_sk_overlay_sse2_8bit+0x1038>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 68,15,40,5,210,146,1,0 ; movaps 0x192d2(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,224,146,1,0 ; movaps 0x192e0(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,166,147,1,0 ; movaps 0x193a6(%rip),%xmm12 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
+ DB 68,15,40,37,180,147,1,0 ; movaps 0x193b4(%rip),%xmm12 # 2d5a0 <_sk_overlay_sse2_8bit+0x1048>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -18746,7 +18742,7 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 102,15,114,240,24 ; pslld $0x18,%xmm0
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 102,15,235,193 ; por %xmm1,%xmm0
- DB 117,88 ; jne 142bf <_sk_srcover_rgba_8888_sse41+0x139>
+ DB 117,88 ; jne 142b1 <_sk_srcover_rgba_8888_sse41+0x139>
DB 243,65,15,127,4,128 ; movdqu %xmm0,(%r8,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -18757,32 +18753,32 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,91 ; je 142e9 <_sk_srcover_rgba_8888_sse41+0x163>
+ DB 116,91 ; je 142db <_sk_srcover_rgba_8888_sse41+0x163>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,22 ; je 142ae <_sk_srcover_rgba_8888_sse41+0x128>
+ DB 116,22 ; je 142a0 <_sk_srcover_rgba_8888_sse41+0x128>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 15,133,10,255,255,255 ; jne 141ac <_sk_srcover_rgba_8888_sse41+0x26>
+ DB 15,133,10,255,255,255 ; jne 1419e <_sk_srcover_rgba_8888_sse41+0x26>
DB 102,65,15,110,100,128,8 ; movd 0x8(%r8,%rax,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 243,65,15,126,36,128 ; movq (%r8,%rax,4),%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,237,254,255,255 ; jmpq 141ac <_sk_srcover_rgba_8888_sse41+0x26>
+ DB 233,237,254,255,255 ; jmpq 1419e <_sk_srcover_rgba_8888_sse41+0x26>
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,40 ; je 142f4 <_sk_srcover_rgba_8888_sse41+0x16e>
+ DB 116,40 ; je 142e6 <_sk_srcover_rgba_8888_sse41+0x16e>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,15 ; je 142e1 <_sk_srcover_rgba_8888_sse41+0x15b>
+ DB 116,15 ; je 142d3 <_sk_srcover_rgba_8888_sse41+0x15b>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,149 ; jne 1426d <_sk_srcover_rgba_8888_sse41+0xe7>
+ DB 117,149 ; jne 1425f <_sk_srcover_rgba_8888_sse41+0xe7>
DB 102,65,15,58,22,68,128,8,2 ; pextrd $0x2,%xmm0,0x8(%r8,%rax,4)
DB 102,65,15,214,4,128 ; movq %xmm0,(%r8,%rax,4)
- DB 235,132 ; jmp 1426d <_sk_srcover_rgba_8888_sse41+0xe7>
+ DB 235,132 ; jmp 1425f <_sk_srcover_rgba_8888_sse41+0xe7>
DB 102,65,15,110,60,128 ; movd (%r8,%rax,4),%xmm7
- DB 233,184,254,255,255 ; jmpq 141ac <_sk_srcover_rgba_8888_sse41+0x26>
+ DB 233,184,254,255,255 ; jmpq 1419e <_sk_srcover_rgba_8888_sse41+0x26>
DB 102,65,15,126,4,128 ; movd %xmm0,(%r8,%rax,4)
- DB 233,110,255,255,255 ; jmpq 1426d <_sk_srcover_rgba_8888_sse41+0xe7>
+ DB 233,110,255,255,255 ; jmpq 1425f <_sk_srcover_rgba_8888_sse41+0xe7>
PUBLIC _sk_clamp_0_sse41
_sk_clamp_0_sse41 LABEL PROC
@@ -18796,7 +18792,7 @@ _sk_clamp_0_sse41 LABEL PROC
PUBLIC _sk_clamp_1_sse41
_sk_clamp_1_sse41 LABEL PROC
- DB 68,15,40,5,161,145,1,0 ; movaps 0x191a1(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,175,145,1,0 ; movaps 0x191af(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -18806,7 +18802,7 @@ _sk_clamp_1_sse41 LABEL PROC
PUBLIC _sk_clamp_a_sse41
_sk_clamp_a_sse41 LABEL PROC
- DB 15,93,29,134,145,1,0 ; minps 0x19186(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,93,29,148,145,1,0 ; minps 0x19194(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -18815,7 +18811,7 @@ _sk_clamp_a_sse41 LABEL PROC
PUBLIC _sk_clamp_a_dst_sse41
_sk_clamp_a_dst_sse41 LABEL PROC
- DB 15,93,61,114,145,1,0 ; minps 0x19172(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,93,61,128,145,1,0 ; minps 0x19180(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,93,239 ; minps %xmm7,%xmm5
DB 15,93,247 ; minps %xmm7,%xmm6
@@ -18844,7 +18840,7 @@ _sk_swap_rb_sse41 LABEL PROC
PUBLIC _sk_invert_sse41
_sk_invert_sse41 LABEL PROC
- DB 68,15,40,5,46,145,1,0 ; movaps 0x1912e(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,60,145,1,0 ; movaps 0x1913c(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,200 ; subps %xmm0,%xmm9
DB 69,15,40,208 ; movaps %xmm8,%xmm10
@@ -18896,7 +18892,7 @@ _sk_premul_dst_sse41 LABEL PROC
PUBLIC _sk_unpremul_sse41
_sk_unpremul_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,184,144,1,0 ; movaps 0x190b8(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,13,198,144,1,0 ; movaps 0x190c6(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -18908,20 +18904,20 @@ _sk_unpremul_sse41 LABEL PROC
PUBLIC _sk_from_srgb_sse41
_sk_from_srgb_sse41 LABEL PROC
- DB 68,15,40,29,131,145,1,0 ; movaps 0x19183(%rip),%xmm11 # 2d5b0 <_sk_overlay_sse2_8bit+0x1044>
+ DB 68,15,40,29,145,145,1,0 ; movaps 0x19191(%rip),%xmm11 # 2d5b0 <_sk_overlay_sse2_8bit+0x1058>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
DB 68,15,40,208 ; movaps %xmm0,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
- DB 68,15,40,37,251,144,1,0 ; movaps 0x190fb(%rip),%xmm12 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
+ DB 68,15,40,37,9,145,1,0 ; movaps 0x19109(%rip),%xmm12 # 2d540 <_sk_overlay_sse2_8bit+0xfe8>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,107,145,1,0 ; movaps 0x1916b(%rip),%xmm13 # 2d5c0 <_sk_overlay_sse2_8bit+0x1054>
+ DB 68,15,40,45,121,145,1,0 ; movaps 0x19179(%rip),%xmm13 # 2d5c0 <_sk_overlay_sse2_8bit+0x1068>
DB 69,15,88,197 ; addps %xmm13,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
- DB 68,15,40,53,107,145,1,0 ; movaps 0x1916b(%rip),%xmm14 # 2d5d0 <_sk_overlay_sse2_8bit+0x1064>
+ DB 68,15,40,53,121,145,1,0 ; movaps 0x19179(%rip),%xmm14 # 2d5d0 <_sk_overlay_sse2_8bit+0x1078>
DB 69,15,88,198 ; addps %xmm14,%xmm8
- DB 68,15,40,61,111,145,1,0 ; movaps 0x1916f(%rip),%xmm15 # 2d5e0 <_sk_overlay_sse2_8bit+0x1074>
+ DB 68,15,40,61,125,145,1,0 ; movaps 0x1917d(%rip),%xmm15 # 2d5e0 <_sk_overlay_sse2_8bit+0x1088>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,40,209 ; movaps %xmm1,%xmm10
@@ -18956,19 +18952,19 @@ PUBLIC _sk_from_srgb_dst_sse41
_sk_from_srgb_dst_sse41 LABEL PROC
DB 68,15,40,204 ; movaps %xmm4,%xmm9
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,29,186,144,1,0 ; movaps 0x190ba(%rip),%xmm11 # 2d5b0 <_sk_overlay_sse2_8bit+0x1044>
+ DB 68,15,40,29,200,144,1,0 ; movaps 0x190c8(%rip),%xmm11 # 2d5b0 <_sk_overlay_sse2_8bit+0x1058>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
- DB 68,15,40,37,51,144,1,0 ; movaps 0x19033(%rip),%xmm12 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
+ DB 68,15,40,37,65,144,1,0 ; movaps 0x19041(%rip),%xmm12 # 2d540 <_sk_overlay_sse2_8bit+0xfe8>
DB 65,15,89,228 ; mulps %xmm12,%xmm4
- DB 68,15,40,45,167,144,1,0 ; movaps 0x190a7(%rip),%xmm13 # 2d5c0 <_sk_overlay_sse2_8bit+0x1054>
+ DB 68,15,40,45,181,144,1,0 ; movaps 0x190b5(%rip),%xmm13 # 2d5c0 <_sk_overlay_sse2_8bit+0x1068>
DB 65,15,88,229 ; addps %xmm13,%xmm4
DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 68,15,40,53,168,144,1,0 ; movaps 0x190a8(%rip),%xmm14 # 2d5d0 <_sk_overlay_sse2_8bit+0x1064>
+ DB 68,15,40,53,182,144,1,0 ; movaps 0x190b6(%rip),%xmm14 # 2d5d0 <_sk_overlay_sse2_8bit+0x1078>
DB 65,15,88,230 ; addps %xmm14,%xmm4
- DB 68,15,40,61,172,144,1,0 ; movaps 0x190ac(%rip),%xmm15 # 2d5e0 <_sk_overlay_sse2_8bit+0x1074>
+ DB 68,15,40,61,186,144,1,0 ; movaps 0x190ba(%rip),%xmm15 # 2d5e0 <_sk_overlay_sse2_8bit+0x1088>
DB 69,15,194,207,1 ; cmpltps %xmm15,%xmm9
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,226 ; blendvps %xmm0,%xmm10,%xmm4
@@ -19011,22 +19007,22 @@ _sk_to_srgb_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 68,15,82,192 ; rsqrtps %xmm0,%xmm8
- DB 68,15,40,29,29,144,1,0 ; movaps 0x1901d(%rip),%xmm11 # 2d5f0 <_sk_overlay_sse2_8bit+0x1084>
+ DB 68,15,40,29,43,144,1,0 ; movaps 0x1902b(%rip),%xmm11 # 2d5f0 <_sk_overlay_sse2_8bit+0x1098>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
- DB 68,15,40,37,29,144,1,0 ; movaps 0x1901d(%rip),%xmm12 # 2d600 <_sk_overlay_sse2_8bit+0x1094>
+ DB 68,15,40,37,43,144,1,0 ; movaps 0x1902b(%rip),%xmm12 # 2d600 <_sk_overlay_sse2_8bit+0x10a8>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 69,15,89,252 ; mulps %xmm12,%xmm15
- DB 68,15,40,21,29,144,1,0 ; movaps 0x1901d(%rip),%xmm10 # 2d610 <_sk_overlay_sse2_8bit+0x10a4>
+ DB 68,15,40,21,43,144,1,0 ; movaps 0x1902b(%rip),%xmm10 # 2d610 <_sk_overlay_sse2_8bit+0x10b8>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,248 ; mulps %xmm8,%xmm15
- DB 68,15,40,45,29,144,1,0 ; movaps 0x1901d(%rip),%xmm13 # 2d620 <_sk_overlay_sse2_8bit+0x10b4>
+ DB 68,15,40,45,43,144,1,0 ; movaps 0x1902b(%rip),%xmm13 # 2d620 <_sk_overlay_sse2_8bit+0x10c8>
DB 69,15,88,253 ; addps %xmm13,%xmm15
- DB 68,15,40,53,33,144,1,0 ; movaps 0x19021(%rip),%xmm14 # 2d630 <_sk_overlay_sse2_8bit+0x10c4>
+ DB 68,15,40,53,47,144,1,0 ; movaps 0x1902f(%rip),%xmm14 # 2d630 <_sk_overlay_sse2_8bit+0x10d8>
DB 69,15,88,198 ; addps %xmm14,%xmm8
DB 69,15,83,192 ; rcpps %xmm8,%xmm8
DB 69,15,89,199 ; mulps %xmm15,%xmm8
- DB 68,15,40,61,29,144,1,0 ; movaps 0x1901d(%rip),%xmm15 # 2d640 <_sk_overlay_sse2_8bit+0x10d4>
+ DB 68,15,40,61,43,144,1,0 ; movaps 0x1902b(%rip),%xmm15 # 2d640 <_sk_overlay_sse2_8bit+0x10e8>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,82,202 ; rsqrtps %xmm2,%xmm9
@@ -19080,7 +19076,7 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 68,15,93,224 ; minps %xmm0,%xmm12
DB 65,15,40,203 ; movaps %xmm11,%xmm1
DB 65,15,92,204 ; subps %xmm12,%xmm1
- DB 68,15,40,53,209,141,1,0 ; movaps 0x18dd1(%rip),%xmm14 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,53,223,141,1,0 ; movaps 0x18ddf(%rip),%xmm14 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,94,241 ; divps %xmm1,%xmm14
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 69,15,194,208,0 ; cmpeqps %xmm8,%xmm10
@@ -19089,27 +19085,27 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 68,15,194,250,1 ; cmpltps %xmm2,%xmm15
- DB 68,15,84,61,56,143,1,0 ; andps 0x18f38(%rip),%xmm15 # 2d650 <_sk_overlay_sse2_8bit+0x10e4>
+ DB 68,15,84,61,70,143,1,0 ; andps 0x18f46(%rip),%xmm15 # 2d650 <_sk_overlay_sse2_8bit+0x10f8>
DB 68,15,88,248 ; addps %xmm0,%xmm15
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,193,0 ; cmpeqps %xmm9,%xmm0
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 68,15,40,45,43,143,1,0 ; movaps 0x18f2b(%rip),%xmm13 # 2d660 <_sk_overlay_sse2_8bit+0x10f4>
+ DB 68,15,40,45,57,143,1,0 ; movaps 0x18f39(%rip),%xmm13 # 2d660 <_sk_overlay_sse2_8bit+0x1108>
DB 65,15,88,213 ; addps %xmm13,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,198 ; mulps %xmm14,%xmm8
- DB 68,15,88,5,39,143,1,0 ; addps 0x18f27(%rip),%xmm8 # 2d670 <_sk_overlay_sse2_8bit+0x1104>
+ DB 68,15,88,5,53,143,1,0 ; addps 0x18f35(%rip),%xmm8 # 2d670 <_sk_overlay_sse2_8bit+0x1118>
DB 102,68,15,56,20,194 ; blendvps %xmm0,%xmm2,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,69,15,56,20,199 ; blendvps %xmm0,%xmm15,%xmm8
- DB 68,15,89,5,31,143,1,0 ; mulps 0x18f1f(%rip),%xmm8 # 2d680 <_sk_overlay_sse2_8bit+0x1114>
+ DB 68,15,89,5,45,143,1,0 ; mulps 0x18f2d(%rip),%xmm8 # 2d680 <_sk_overlay_sse2_8bit+0x1128>
DB 69,15,40,203 ; movaps %xmm11,%xmm9
DB 69,15,194,204,4 ; cmpneqps %xmm12,%xmm9
DB 69,15,84,193 ; andps %xmm9,%xmm8
DB 69,15,92,235 ; subps %xmm11,%xmm13
DB 69,15,88,220 ; addps %xmm12,%xmm11
- DB 15,40,5,35,141,1,0 ; movaps 0x18d23(%rip),%xmm0 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 15,40,5,65,141,1,0 ; movaps 0x18d41(%rip),%xmm0 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 65,15,40,211 ; movaps %xmm11,%xmm2
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,194,194,1 ; cmpltps %xmm2,%xmm0
@@ -19130,7 +19126,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,100,36,32 ; movaps %xmm4,0x20(%rsp)
DB 15,41,92,36,16 ; movaps %xmm3,0x10(%rsp)
DB 68,15,40,208 ; movaps %xmm0,%xmm10
- DB 68,15,40,13,213,140,1,0 ; movaps 0x18cd5(%rip),%xmm9 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,40,13,243,140,1,0 ; movaps 0x18cf3(%rip),%xmm9 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,194,194,2 ; cmpleps %xmm2,%xmm0
DB 15,40,217 ; movaps %xmm1,%xmm3
@@ -19143,19 +19139,19 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,20,36 ; movaps %xmm2,(%rsp)
DB 69,15,88,192 ; addps %xmm8,%xmm8
DB 68,15,92,197 ; subps %xmm5,%xmm8
- DB 68,15,40,53,145,142,1,0 ; movaps 0x18e91(%rip),%xmm14 # 2d690 <_sk_overlay_sse2_8bit+0x1124>
+ DB 68,15,40,53,159,142,1,0 ; movaps 0x18e9f(%rip),%xmm14 # 2d690 <_sk_overlay_sse2_8bit+0x1138>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 102,65,15,58,8,198,1 ; roundps $0x1,%xmm14,%xmm0
DB 68,15,92,240 ; subps %xmm0,%xmm14
- DB 68,15,40,29,138,142,1,0 ; movaps 0x18e8a(%rip),%xmm11 # 2d6a0 <_sk_overlay_sse2_8bit+0x1134>
+ DB 68,15,40,29,152,142,1,0 ; movaps 0x18e98(%rip),%xmm11 # 2d6a0 <_sk_overlay_sse2_8bit+0x1148>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 65,15,92,240 ; subps %xmm8,%xmm6
- DB 15,40,61,35,142,1,0 ; movaps 0x18e23(%rip),%xmm7 # 2d650 <_sk_overlay_sse2_8bit+0x10e4>
+ DB 15,40,61,49,142,1,0 ; movaps 0x18e31(%rip),%xmm7 # 2d650 <_sk_overlay_sse2_8bit+0x10f8>
DB 69,15,40,238 ; movaps %xmm14,%xmm13
DB 68,15,89,239 ; mulps %xmm7,%xmm13
- DB 15,40,29,52,142,1,0 ; movaps 0x18e34(%rip),%xmm3 # 2d670 <_sk_overlay_sse2_8bit+0x1104>
+ DB 15,40,29,66,142,1,0 ; movaps 0x18e42(%rip),%xmm3 # 2d670 <_sk_overlay_sse2_8bit+0x1118>
DB 68,15,40,227 ; movaps %xmm3,%xmm12
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 68,15,89,230 ; mulps %xmm6,%xmm12
@@ -19165,7 +19161,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,40,253 ; movaps %xmm5,%xmm15
DB 102,69,15,56,20,252 ; blendvps %xmm0,%xmm12,%xmm15
- DB 68,15,40,37,19,142,1,0 ; movaps 0x18e13(%rip),%xmm12 # 2d680 <_sk_overlay_sse2_8bit+0x1114>
+ DB 68,15,40,37,33,142,1,0 ; movaps 0x18e21(%rip),%xmm12 # 2d680 <_sk_overlay_sse2_8bit+0x1128>
DB 65,15,40,196 ; movaps %xmm12,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,89,238 ; mulps %xmm6,%xmm13
@@ -19199,7 +19195,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,40,198 ; movaps %xmm14,%xmm0
DB 15,40,20,36 ; movaps (%rsp),%xmm2
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,88,21,172,141,1,0 ; addps 0x18dac(%rip),%xmm10 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
+ DB 68,15,88,21,186,141,1,0 ; addps 0x18dba(%rip),%xmm10 # 2d6b0 <_sk_overlay_sse2_8bit+0x1158>
DB 102,65,15,58,8,194,1 ; roundps $0x1,%xmm10,%xmm0
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 69,15,194,218,2 ; cmpleps %xmm10,%xmm11
@@ -19251,11 +19247,11 @@ _sk_scale_u8_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,52 ; jne 149ef <_sk_scale_u8_sse41+0x4c>
+ DB 117,52 ; jne 149e1 <_sk_scale_u8_sse41+0x4c>
DB 102,71,15,56,49,4,16 ; pmovzxbd (%r8,%r10,1),%xmm8
- DB 102,68,15,219,5,165,139,1,0 ; pand 0x18ba5(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,68,15,219,5,179,139,1,0 ; pand 0x18bb3(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,233,140,1,0 ; mulps 0x18ce9(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,89,5,247,140,1,0 ; mulps 0x18cf7(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -19266,12 +19262,12 @@ _sk_scale_u8_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,59 ; je 14a37 <_sk_scale_u8_sse41+0x94>
+ DB 116,59 ; je 14a29 <_sk_scale_u8_sse41+0x94>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,23 ; je 14a1e <_sk_scale_u8_sse41+0x7b>
+ DB 116,23 ; je 14a10 <_sk_scale_u8_sse41+0x7b>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,181 ; jne 149c2 <_sk_scale_u8_sse41+0x1f>
+ DB 117,181 ; jne 149b4 <_sk_scale_u8_sse41+0x1f>
DB 67,15,182,68,16,2 ; movzbl 0x2(%r8,%r10,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -19279,10 +19275,10 @@ _sk_scale_u8_sse41 LABEL PROC
DB 102,68,15,110,200 ; movd %eax,%xmm9
DB 102,69,15,56,49,201 ; pmovzxbd %xmm9,%xmm9
DB 102,69,15,58,14,193,15 ; pblendw $0xf,%xmm9,%xmm8
- DB 235,139 ; jmp 149c2 <_sk_scale_u8_sse41+0x1f>
+ DB 235,139 ; jmp 149b4 <_sk_scale_u8_sse41+0x1f>
DB 67,15,182,4,16 ; movzbl (%r8,%r10,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,124,255,255,255 ; jmpq 149c2 <_sk_scale_u8_sse41+0x1f>
+ DB 233,124,255,255,255 ; jmpq 149b4 <_sk_scale_u8_sse41+0x1f>
PUBLIC _sk_scale_565_sse41
_sk_scale_565_sse41 LABEL PROC
@@ -19295,19 +19291,19 @@ _sk_scale_565_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,159,0,0,0 ; jne 14b09 <_sk_scale_565_sse41+0xc3>
+ DB 15,133,159,0,0,0 ; jne 14afb <_sk_scale_565_sse41+0xc3>
DB 102,71,15,56,51,28,80 ; pmovzxwd (%r8,%r10,2),%xmm11
- DB 102,15,111,5,87,140,1,0 ; movdqa 0x18c57(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
+ DB 102,15,111,5,101,140,1,0 ; movdqa 0x18c65(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1178>
DB 102,65,15,219,195 ; pand %xmm11,%xmm0
DB 68,15,91,200 ; cvtdq2ps %xmm0,%xmm9
- DB 68,15,89,13,86,140,1,0 ; mulps 0x18c56(%rip),%xmm9 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
- DB 102,15,111,5,94,140,1,0 ; movdqa 0x18c5e(%rip),%xmm0 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
+ DB 68,15,89,13,100,140,1,0 ; mulps 0x18c64(%rip),%xmm9 # 2d6e0 <_sk_overlay_sse2_8bit+0x1188>
+ DB 102,15,111,5,108,140,1,0 ; movdqa 0x18c6c(%rip),%xmm0 # 2d6f0 <_sk_overlay_sse2_8bit+0x1198>
DB 102,65,15,219,195 ; pand %xmm11,%xmm0
DB 68,15,91,208 ; cvtdq2ps %xmm0,%xmm10
- DB 68,15,89,21,93,140,1,0 ; mulps 0x18c5d(%rip),%xmm10 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
- DB 102,68,15,219,29,100,140,1,0 ; pand 0x18c64(%rip),%xmm11 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
+ DB 68,15,89,21,107,140,1,0 ; mulps 0x18c6b(%rip),%xmm10 # 2d700 <_sk_overlay_sse2_8bit+0x11a8>
+ DB 102,68,15,219,29,114,140,1,0 ; pand 0x18c72(%rip),%xmm11 # 2d710 <_sk_overlay_sse2_8bit+0x11b8>
DB 69,15,91,219 ; cvtdq2ps %xmm11,%xmm11
- DB 68,15,89,29,104,140,1,0 ; mulps 0x18c68(%rip),%xmm11 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
+ DB 68,15,89,29,118,140,1,0 ; mulps 0x18c76(%rip),%xmm11 # 2d720 <_sk_overlay_sse2_8bit+0x11c8>
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
DB 69,15,40,226 ; movaps %xmm10,%xmm12
@@ -19332,22 +19328,22 @@ _sk_scale_565_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,60 ; je 14b52 <_sk_scale_565_sse41+0x10c>
+ DB 116,60 ; je 14b44 <_sk_scale_565_sse41+0x10c>
DB 102,69,15,239,219 ; pxor %xmm11,%xmm11
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,26 ; je 14b3b <_sk_scale_565_sse41+0xf5>
+ DB 116,26 ; je 14b2d <_sk_scale_565_sse41+0xf5>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 15,133,70,255,255,255 ; jne 14a71 <_sk_scale_565_sse41+0x2b>
+ DB 15,133,70,255,255,255 ; jne 14a63 <_sk_scale_565_sse41+0x2b>
DB 67,15,183,68,80,4 ; movzwl 0x4(%r8,%r10,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,68,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm11
DB 102,67,15,110,4,80 ; movd (%r8,%r10,2),%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 102,68,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm11
- DB 233,31,255,255,255 ; jmpq 14a71 <_sk_scale_565_sse41+0x2b>
+ DB 233,31,255,255,255 ; jmpq 14a63 <_sk_scale_565_sse41+0x2b>
DB 67,15,183,4,80 ; movzwl (%r8,%r10,2),%eax
DB 102,68,15,110,216 ; movd %eax,%xmm11
- DB 233,16,255,255,255 ; jmpq 14a71 <_sk_scale_565_sse41+0x2b>
+ DB 233,16,255,255,255 ; jmpq 14a63 <_sk_scale_565_sse41+0x2b>
PUBLIC _sk_lerp_1_float_sse41
_sk_lerp_1_float_sse41 LABEL PROC
@@ -19378,11 +19374,11 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,72 ; jne 14bf9 <_sk_lerp_u8_sse41+0x60>
+ DB 117,72 ; jne 14beb <_sk_lerp_u8_sse41+0x60>
DB 102,71,15,56,49,4,16 ; pmovzxbd (%r8,%r10,1),%xmm8
- DB 102,68,15,219,5,175,137,1,0 ; pand 0x189af(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,68,15,219,5,189,137,1,0 ; pand 0x189bd(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,243,138,1,0 ; mulps 0x18af3(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,89,5,1,139,1,0 ; mulps 0x18b01(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -19400,12 +19396,12 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,62 ; je 14c44 <_sk_lerp_u8_sse41+0xab>
+ DB 116,62 ; je 14c36 <_sk_lerp_u8_sse41+0xab>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,23 ; je 14c28 <_sk_lerp_u8_sse41+0x8f>
+ DB 116,23 ; je 14c1a <_sk_lerp_u8_sse41+0x8f>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,161 ; jne 14bb8 <_sk_lerp_u8_sse41+0x1f>
+ DB 117,161 ; jne 14baa <_sk_lerp_u8_sse41+0x1f>
DB 67,15,182,68,16,2 ; movzbl 0x2(%r8,%r10,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -19413,10 +19409,10 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 102,68,15,110,200 ; movd %eax,%xmm9
DB 102,69,15,56,49,201 ; pmovzxbd %xmm9,%xmm9
DB 102,69,15,58,14,193,15 ; pblendw $0xf,%xmm9,%xmm8
- DB 233,116,255,255,255 ; jmpq 14bb8 <_sk_lerp_u8_sse41+0x1f>
+ DB 233,116,255,255,255 ; jmpq 14baa <_sk_lerp_u8_sse41+0x1f>
DB 67,15,182,4,16 ; movzbl (%r8,%r10,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,101,255,255,255 ; jmpq 14bb8 <_sk_lerp_u8_sse41+0x1f>
+ DB 233,101,255,255,255 ; jmpq 14baa <_sk_lerp_u8_sse41+0x1f>
PUBLIC _sk_lerp_565_sse41
_sk_lerp_565_sse41 LABEL PROC
@@ -19429,19 +19425,19 @@ _sk_lerp_565_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,165,0,0,0 ; jne 14d1c <_sk_lerp_565_sse41+0xc9>
+ DB 15,133,165,0,0,0 ; jne 14d0e <_sk_lerp_565_sse41+0xc9>
DB 102,71,15,56,51,20,80 ; pmovzxwd (%r8,%r10,2),%xmm10
- DB 102,15,111,5,74,138,1,0 ; movdqa 0x18a4a(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
+ DB 102,15,111,5,88,138,1,0 ; movdqa 0x18a58(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1178>
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 68,15,91,200 ; cvtdq2ps %xmm0,%xmm9
- DB 68,15,89,13,73,138,1,0 ; mulps 0x18a49(%rip),%xmm9 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
- DB 102,15,111,5,81,138,1,0 ; movdqa 0x18a51(%rip),%xmm0 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
+ DB 68,15,89,13,87,138,1,0 ; mulps 0x18a57(%rip),%xmm9 # 2d6e0 <_sk_overlay_sse2_8bit+0x1188>
+ DB 102,15,111,5,95,138,1,0 ; movdqa 0x18a5f(%rip),%xmm0 # 2d6f0 <_sk_overlay_sse2_8bit+0x1198>
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 68,15,91,216 ; cvtdq2ps %xmm0,%xmm11
- DB 68,15,89,29,80,138,1,0 ; mulps 0x18a50(%rip),%xmm11 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
- DB 102,68,15,219,21,87,138,1,0 ; pand 0x18a57(%rip),%xmm10 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
+ DB 68,15,89,29,94,138,1,0 ; mulps 0x18a5e(%rip),%xmm11 # 2d700 <_sk_overlay_sse2_8bit+0x11a8>
+ DB 102,68,15,219,21,101,138,1,0 ; pand 0x18a65(%rip),%xmm10 # 2d710 <_sk_overlay_sse2_8bit+0x11b8>
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,91,138,1,0 ; mulps 0x18a5b(%rip),%xmm10 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
+ DB 68,15,89,21,105,138,1,0 ; mulps 0x18a69(%rip),%xmm10 # 2d720 <_sk_overlay_sse2_8bit+0x11c8>
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -19469,33 +19465,33 @@ _sk_lerp_565_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,60 ; je 14d65 <_sk_lerp_565_sse41+0x112>
+ DB 116,60 ; je 14d57 <_sk_lerp_565_sse41+0x112>
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,26 ; je 14d4e <_sk_lerp_565_sse41+0xfb>
+ DB 116,26 ; je 14d40 <_sk_lerp_565_sse41+0xfb>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 15,133,64,255,255,255 ; jne 14c7e <_sk_lerp_565_sse41+0x2b>
+ DB 15,133,64,255,255,255 ; jne 14c70 <_sk_lerp_565_sse41+0x2b>
DB 67,15,183,68,80,4 ; movzwl 0x4(%r8,%r10,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,68,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm10
DB 102,67,15,110,4,80 ; movd (%r8,%r10,2),%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 102,68,15,58,14,208,15 ; pblendw $0xf,%xmm0,%xmm10
- DB 233,25,255,255,255 ; jmpq 14c7e <_sk_lerp_565_sse41+0x2b>
+ DB 233,25,255,255,255 ; jmpq 14c70 <_sk_lerp_565_sse41+0x2b>
DB 67,15,183,4,80 ; movzwl (%r8,%r10,2),%eax
DB 102,68,15,110,208 ; movd %eax,%xmm10
- DB 233,10,255,255,255 ; jmpq 14c7e <_sk_lerp_565_sse41+0x2b>
+ DB 233,10,255,255,255 ; jmpq 14c70 <_sk_lerp_565_sse41+0x2b>
PUBLIC _sk_load_tables_sse41
_sk_load_tables_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,0 ; mov (%rax),%r8
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,20,1,0,0 ; jne 14e96 <_sk_load_tables_sse41+0x122>
+ DB 15,133,20,1,0,0 ; jne 14e88 <_sk_load_tables_sse41+0x122>
DB 243,69,15,111,4,144 ; movdqu (%r8,%rdx,4),%xmm8
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,15,111,5,221,135,1,0 ; movdqa 0x187dd(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,5,235,135,1,0 ; movdqa 0x187eb(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,73,15,58,22,192,1 ; pextrq $0x1,%xmm0,%r8
DB 102,73,15,126,193 ; movq %xmm0,%r9
@@ -19510,7 +19506,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,66,15,58,33,4,155,32 ; insertps $0x20,(%rbx,%r11,4),%xmm0
DB 102,66,15,58,33,4,3,48 ; insertps $0x30,(%rbx,%r8,1),%xmm0
DB 102,65,15,111,200 ; movdqa %xmm8,%xmm1
- DB 102,15,56,0,13,152,135,1,0 ; pshufb 0x18798(%rip),%xmm1 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
+ DB 102,15,56,0,13,166,135,1,0 ; pshufb 0x187a6(%rip),%xmm1 # 2d580 <_sk_overlay_sse2_8bit+0x1028>
DB 102,73,15,58,22,200,1 ; pextrq $0x1,%xmm1,%r8
DB 102,72,15,126,203 ; movq %xmm1,%rbx
DB 68,15,182,203 ; movzbl %bl,%r9d
@@ -19525,7 +19521,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1
DB 76,139,64,24 ; mov 0x18(%rax),%r8
DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2
- DB 102,15,56,0,21,84,135,1,0 ; pshufb 0x18754(%rip),%xmm2 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
+ DB 102,15,56,0,21,98,135,1,0 ; pshufb 0x18762(%rip),%xmm2 # 2d590 <_sk_overlay_sse2_8bit+0x1038>
DB 102,72,15,58,22,211,1 ; pextrq $0x1,%xmm2,%rbx
DB 102,72,15,126,208 ; movq %xmm2,%rax
DB 68,15,182,200 ; movzbl %al,%r9d
@@ -19540,7 +19536,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,216 ; cvtdq2ps %xmm8,%xmm3
- DB 15,89,29,49,136,1,0 ; mulps 0x18831(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 15,89,29,63,136,1,0 ; mulps 0x1883f(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -19548,19 +19544,19 @@ _sk_load_tables_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,52 ; je 14ed7 <_sk_load_tables_sse41+0x163>
+ DB 116,52 ; je 14ec9 <_sk_load_tables_sse41+0x163>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,23 ; je 14ec5 <_sk_load_tables_sse41+0x151>
+ DB 116,23 ; je 14eb7 <_sk_load_tables_sse41+0x151>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 15,133,208,254,255,255 ; jne 14d88 <_sk_load_tables_sse41+0x14>
+ DB 15,133,208,254,255,255 ; jne 14d7a <_sk_load_tables_sse41+0x14>
DB 102,65,15,110,68,144,8 ; movd 0x8(%r8,%rdx,4),%xmm0
DB 102,68,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm8
DB 243,65,15,126,4,144 ; movq (%r8,%rdx,4),%xmm0
DB 102,68,15,58,14,192,15 ; pblendw $0xf,%xmm0,%xmm8
- DB 233,177,254,255,255 ; jmpq 14d88 <_sk_load_tables_sse41+0x14>
+ DB 233,177,254,255,255 ; jmpq 14d7a <_sk_load_tables_sse41+0x14>
DB 102,69,15,110,4,144 ; movd (%r8,%rdx,4),%xmm8
- DB 233,166,254,255,255 ; jmpq 14d88 <_sk_load_tables_sse41+0x14>
+ DB 233,166,254,255,255 ; jmpq 14d7a <_sk_load_tables_sse41+0x14>
PUBLIC _sk_load_tables_u16_be_sse41
_sk_load_tables_u16_be_sse41 LABEL PROC
@@ -19568,7 +19564,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 76,141,12,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r9
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,95,1,0,0 ; jne 15057 <_sk_load_tables_u16_be_sse41+0x175>
+ DB 15,133,95,1,0,0 ; jne 15049 <_sk_load_tables_u16_be_sse41+0x175>
DB 102,67,15,16,4,72 ; movupd (%r8,%r9,2),%xmm0
DB 243,67,15,111,76,72,16 ; movdqu 0x10(%r8,%r9,2),%xmm1
DB 65,86 ; push %r14
@@ -19579,7 +19575,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,5,3,136,1,0 ; movdqa 0x18803(%rip),%xmm8 # 2d730 <_sk_overlay_sse2_8bit+0x11c4>
+ DB 102,68,15,111,5,17,136,1,0 ; movdqa 0x18811(%rip),%xmm8 # 2d730 <_sk_overlay_sse2_8bit+0x11d8>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -19597,7 +19593,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,15,58,33,194,32 ; insertps $0x20,%xmm2,%xmm0
DB 243,66,15,16,20,3 ; movss (%rbx,%r8,1),%xmm2
DB 102,15,58,33,194,48 ; insertps $0x30,%xmm2,%xmm0
- DB 102,15,56,0,13,178,135,1,0 ; pshufb 0x187b2(%rip),%xmm1 # 2d740 <_sk_overlay_sse2_8bit+0x11d4>
+ DB 102,15,56,0,13,192,135,1,0 ; pshufb 0x187c0(%rip),%xmm1 # 2d740 <_sk_overlay_sse2_8bit+0x11e8>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,200,1 ; pextrq $0x1,%xmm1,%r8
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -19633,23 +19629,23 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,235,216 ; por %xmm8,%xmm3
DB 102,15,56,51,219 ; pmovzxwd %xmm3,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,0,135,1,0 ; mulps 0x18700(%rip),%xmm3 # 2d750 <_sk_overlay_sse2_8bit+0x11e4>
+ DB 15,89,29,14,135,1,0 ; mulps 0x1870e(%rip),%xmm3 # 2d750 <_sk_overlay_sse2_8bit+0x11f8>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 255,224 ; jmpq *%rax
DB 242,67,15,16,4,72 ; movsd (%r8,%r9,2),%xmm0
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,13 ; jne 15070 <_sk_load_tables_u16_be_sse41+0x18e>
+ DB 117,13 ; jne 15062 <_sk_load_tables_u16_be_sse41+0x18e>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,149,254,255,255 ; jmpq 14f05 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 233,149,254,255,255 ; jmpq 14ef7 <_sk_load_tables_u16_be_sse41+0x23>
DB 102,67,15,22,68,72,8 ; movhpd 0x8(%r8,%r9,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 15,130,128,254,255,255 ; jb 14f05 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 15,130,128,254,255,255 ; jb 14ef7 <_sk_load_tables_u16_be_sse41+0x23>
DB 243,67,15,126,76,72,16 ; movq 0x10(%r8,%r9,2),%xmm1
- DB 233,116,254,255,255 ; jmpq 14f05 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 233,116,254,255,255 ; jmpq 14ef7 <_sk_load_tables_u16_be_sse41+0x23>
PUBLIC _sk_load_tables_rgb_u16_be_sse41
_sk_load_tables_rgb_u16_be_sse41 LABEL PROC
@@ -19657,7 +19653,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 76,141,12,82 ; lea (%rdx,%rdx,2),%r9
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,79,1,0,0 ; jne 151f2 <_sk_load_tables_rgb_u16_be_sse41+0x161>
+ DB 15,133,79,1,0,0 ; jne 151e4 <_sk_load_tables_rgb_u16_be_sse41+0x161>
DB 243,67,15,111,20,72 ; movdqu (%r8,%r9,2),%xmm2
DB 243,67,15,111,76,72,8 ; movdqu 0x8(%r8,%r9,2),%xmm1
DB 102,15,115,217,4 ; psrldq $0x4,%xmm1
@@ -19671,7 +19667,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
- DB 102,68,15,111,5,73,134,1,0 ; movdqa 0x18649(%rip),%xmm8 # 2d730 <_sk_overlay_sse2_8bit+0x11c4>
+ DB 102,68,15,111,5,87,134,1,0 ; movdqa 0x18657(%rip),%xmm8 # 2d730 <_sk_overlay_sse2_8bit+0x11d8>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -19689,7 +19685,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,15,58,33,195,32 ; insertps $0x20,%xmm3,%xmm0
DB 243,66,15,16,28,3 ; movss (%rbx,%r8,1),%xmm3
DB 102,15,58,33,195,48 ; insertps $0x30,%xmm3,%xmm0
- DB 102,15,56,0,13,24,134,1,0 ; pshufb 0x18618(%rip),%xmm1 # 2d760 <_sk_overlay_sse2_8bit+0x11f4>
+ DB 102,15,56,0,13,38,134,1,0 ; pshufb 0x18626(%rip),%xmm1 # 2d760 <_sk_overlay_sse2_8bit+0x1208>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,200,1 ; pextrq $0x1,%xmm1,%r8
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -19720,7 +19716,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 243,65,15,16,28,24 ; movss (%r8,%rbx,1),%xmm3
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,211,130,1,0 ; movaps 0x182d3(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,225,130,1,0 ; movaps 0x182e1(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 255,224 ; jmpq *%rax
@@ -19728,21 +19724,21 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,67,15,196,84,72,4,2 ; pinsrw $0x2,0x4(%r8,%r9,2),%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,14 ; jne 15218 <_sk_load_tables_rgb_u16_be_sse41+0x187>
+ DB 117,14 ; jne 1520a <_sk_load_tables_rgb_u16_be_sse41+0x187>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
- DB 233,177,254,255,255 ; jmpq 150c9 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,177,254,255,255 ; jmpq 150bb <_sk_load_tables_rgb_u16_be_sse41+0x38>
DB 102,71,15,110,76,72,6 ; movd 0x6(%r8,%r9,2),%xmm9
DB 102,71,15,196,76,72,10,2 ; pinsrw $0x2,0xa(%r8,%r9,2),%xmm9
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,24 ; jb 15249 <_sk_load_tables_rgb_u16_be_sse41+0x1b8>
+ DB 114,24 ; jb 1523b <_sk_load_tables_rgb_u16_be_sse41+0x1b8>
DB 102,67,15,110,76,72,12 ; movd 0xc(%r8,%r9,2),%xmm1
DB 102,67,15,196,76,72,16,2 ; pinsrw $0x2,0x10(%r8,%r9,2),%xmm1
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,128,254,255,255 ; jmpq 150c9 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,128,254,255,255 ; jmpq 150bb <_sk_load_tables_rgb_u16_be_sse41+0x38>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,119,254,255,255 ; jmpq 150c9 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,119,254,255,255 ; jmpq 150bb <_sk_load_tables_rgb_u16_be_sse41+0x38>
PUBLIC _sk_byte_tables_sse41
_sk_byte_tables_sse41 LABEL PROC
@@ -19750,7 +19746,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 65,86 ; push %r14
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,63,131,1,0 ; movaps 0x1833f(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
+ DB 68,15,40,5,77,131,1,0 ; movaps 0x1834d(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1048>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,58,22,192,1 ; pextrq $0x1,%xmm0,%r8
@@ -19769,7 +19765,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,0,132,1,0 ; movaps 0x18400(%rip),%xmm9 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,13,14,132,1,0 ; movaps 0x1840e(%rip),%xmm9 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -19861,7 +19857,7 @@ _sk_byte_tables_rgb_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,108,130,1,0 ; movaps 0x1826c(%rip),%xmm9 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,13,122,130,1,0 ; movaps 0x1827a(%rip),%xmm9 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -20029,31 +20025,31 @@ _sk_parametric_r_sse41 LABEL PROC
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,194 ; cvtdq2ps %xmm10,%xmm8
- DB 68,15,89,5,94,128,1,0 ; mulps 0x1805e(%rip),%xmm8 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
- DB 68,15,84,21,102,128,1,0 ; andps 0x18066(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
- DB 68,15,86,21,126,125,1,0 ; orps 0x17d7e(%rip),%xmm10 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
- DB 68,15,88,5,102,128,1,0 ; addps 0x18066(%rip),%xmm8 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
- DB 68,15,40,37,110,128,1,0 ; movaps 0x1806e(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
+ DB 68,15,89,5,108,128,1,0 ; mulps 0x1806c(%rip),%xmm8 # 2d770 <_sk_overlay_sse2_8bit+0x1218>
+ DB 68,15,84,21,116,128,1,0 ; andps 0x18074(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1228>
+ DB 68,15,86,21,156,125,1,0 ; orps 0x17d9c(%rip),%xmm10 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
+ DB 68,15,88,5,116,128,1,0 ; addps 0x18074(%rip),%xmm8 # 2d790 <_sk_overlay_sse2_8bit+0x1238>
+ DB 68,15,40,37,124,128,1,0 ; movaps 0x1807c(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1248>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
- DB 68,15,88,21,110,128,1,0 ; addps 0x1806e(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
- DB 68,15,40,37,118,128,1,0 ; movaps 0x18076(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
+ DB 68,15,88,21,124,128,1,0 ; addps 0x1807c(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1258>
+ DB 68,15,40,37,132,128,1,0 ; movaps 0x18084(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1268>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
DB 69,15,89,195 ; mulps %xmm11,%xmm8
DB 102,69,15,58,8,208,1 ; roundps $0x1,%xmm8,%xmm10
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,5,99,128,1,0 ; addps 0x18063(%rip),%xmm8 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
- DB 68,15,40,21,107,128,1,0 ; movaps 0x1806b(%rip),%xmm10 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
+ DB 68,15,88,5,113,128,1,0 ; addps 0x18071(%rip),%xmm8 # 2d7d0 <_sk_overlay_sse2_8bit+0x1278>
+ DB 68,15,40,21,121,128,1,0 ; movaps 0x18079(%rip),%xmm10 # 2d7e0 <_sk_overlay_sse2_8bit+0x1288>
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 69,15,92,194 ; subps %xmm10,%xmm8
- DB 68,15,40,21,107,128,1,0 ; movaps 0x1806b(%rip),%xmm10 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
+ DB 68,15,40,21,121,128,1,0 ; movaps 0x18079(%rip),%xmm10 # 2d7f0 <_sk_overlay_sse2_8bit+0x1298>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 68,15,40,29,111,128,1,0 ; movaps 0x1806f(%rip),%xmm11 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
+ DB 68,15,40,29,125,128,1,0 ; movaps 0x1807d(%rip),%xmm11 # 2d800 <_sk_overlay_sse2_8bit+0x12a8>
DB 69,15,94,218 ; divps %xmm10,%xmm11
DB 69,15,88,216 ; addps %xmm8,%xmm11
- DB 68,15,89,29,111,128,1,0 ; mulps 0x1806f(%rip),%xmm11 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
+ DB 68,15,89,29,125,128,1,0 ; mulps 0x1807d(%rip),%xmm11 # 2d810 <_sk_overlay_sse2_8bit+0x12b8>
DB 102,69,15,91,211 ; cvtps2dq %xmm11,%xmm10
DB 243,68,15,16,64,20 ; movss 0x14(%rax),%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
@@ -20061,7 +20057,7 @@ _sk_parametric_r_sse41 LABEL PROC
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,246,124,1,0 ; minps 0x17cf6(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,93,5,4,125,1,0 ; minps 0x17d04(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -20089,31 +20085,31 @@ _sk_parametric_g_sse41 LABEL PROC
DB 68,15,88,217 ; addps %xmm1,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,55,127,1,0 ; mulps 0x17f37(%rip),%xmm12 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
- DB 68,15,84,29,63,127,1,0 ; andps 0x17f3f(%rip),%xmm11 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
- DB 68,15,86,29,87,124,1,0 ; orps 0x17c57(%rip),%xmm11 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
- DB 68,15,88,37,63,127,1,0 ; addps 0x17f3f(%rip),%xmm12 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
- DB 15,40,13,72,127,1,0 ; movaps 0x17f48(%rip),%xmm1 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
+ DB 68,15,89,37,69,127,1,0 ; mulps 0x17f45(%rip),%xmm12 # 2d770 <_sk_overlay_sse2_8bit+0x1218>
+ DB 68,15,84,29,77,127,1,0 ; andps 0x17f4d(%rip),%xmm11 # 2d780 <_sk_overlay_sse2_8bit+0x1228>
+ DB 68,15,86,29,117,124,1,0 ; orps 0x17c75(%rip),%xmm11 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
+ DB 68,15,88,37,77,127,1,0 ; addps 0x17f4d(%rip),%xmm12 # 2d790 <_sk_overlay_sse2_8bit+0x1238>
+ DB 15,40,13,86,127,1,0 ; movaps 0x17f56(%rip),%xmm1 # 2d7a0 <_sk_overlay_sse2_8bit+0x1248>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,88,29,72,127,1,0 ; addps 0x17f48(%rip),%xmm11 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
- DB 15,40,13,81,127,1,0 ; movaps 0x17f51(%rip),%xmm1 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
+ DB 68,15,88,29,86,127,1,0 ; addps 0x17f56(%rip),%xmm11 # 2d7b0 <_sk_overlay_sse2_8bit+0x1258>
+ DB 15,40,13,95,127,1,0 ; movaps 0x17f5f(%rip),%xmm1 # 2d7c0 <_sk_overlay_sse2_8bit+0x1268>
DB 65,15,94,203 ; divps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,62,127,1,0 ; addps 0x17f3e(%rip),%xmm12 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
- DB 15,40,13,71,127,1,0 ; movaps 0x17f47(%rip),%xmm1 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
+ DB 68,15,88,37,76,127,1,0 ; addps 0x17f4c(%rip),%xmm12 # 2d7d0 <_sk_overlay_sse2_8bit+0x1278>
+ DB 15,40,13,85,127,1,0 ; movaps 0x17f55(%rip),%xmm1 # 2d7e0 <_sk_overlay_sse2_8bit+0x1288>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,40,21,71,127,1,0 ; movaps 0x17f47(%rip),%xmm10 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
+ DB 68,15,40,21,85,127,1,0 ; movaps 0x17f55(%rip),%xmm10 # 2d7f0 <_sk_overlay_sse2_8bit+0x1298>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,13,76,127,1,0 ; movaps 0x17f4c(%rip),%xmm1 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
+ DB 15,40,13,90,127,1,0 ; movaps 0x17f5a(%rip),%xmm1 # 2d800 <_sk_overlay_sse2_8bit+0x12a8>
DB 65,15,94,202 ; divps %xmm10,%xmm1
DB 65,15,88,204 ; addps %xmm12,%xmm1
- DB 15,89,13,77,127,1,0 ; mulps 0x17f4d(%rip),%xmm1 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
+ DB 15,89,13,91,127,1,0 ; mulps 0x17f5b(%rip),%xmm1 # 2d810 <_sk_overlay_sse2_8bit+0x12b8>
DB 102,68,15,91,209 ; cvtps2dq %xmm1,%xmm10
DB 243,15,16,72,20 ; movss 0x14(%rax),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
@@ -20121,7 +20117,7 @@ _sk_parametric_g_sse41 LABEL PROC
DB 102,65,15,56,20,201 ; blendvps %xmm0,%xmm9,%xmm1
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,200 ; maxps %xmm0,%xmm1
- DB 15,93,13,216,123,1,0 ; minps 0x17bd8(%rip),%xmm1 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,93,13,230,123,1,0 ; minps 0x17be6(%rip),%xmm1 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -20149,31 +20145,31 @@ _sk_parametric_b_sse41 LABEL PROC
DB 68,15,88,218 ; addps %xmm2,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,25,126,1,0 ; mulps 0x17e19(%rip),%xmm12 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
- DB 68,15,84,29,33,126,1,0 ; andps 0x17e21(%rip),%xmm11 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
- DB 68,15,86,29,57,123,1,0 ; orps 0x17b39(%rip),%xmm11 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
- DB 68,15,88,37,33,126,1,0 ; addps 0x17e21(%rip),%xmm12 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
- DB 15,40,21,42,126,1,0 ; movaps 0x17e2a(%rip),%xmm2 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
+ DB 68,15,89,37,39,126,1,0 ; mulps 0x17e27(%rip),%xmm12 # 2d770 <_sk_overlay_sse2_8bit+0x1218>
+ DB 68,15,84,29,47,126,1,0 ; andps 0x17e2f(%rip),%xmm11 # 2d780 <_sk_overlay_sse2_8bit+0x1228>
+ DB 68,15,86,29,87,123,1,0 ; orps 0x17b57(%rip),%xmm11 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
+ DB 68,15,88,37,47,126,1,0 ; addps 0x17e2f(%rip),%xmm12 # 2d790 <_sk_overlay_sse2_8bit+0x1238>
+ DB 15,40,21,56,126,1,0 ; movaps 0x17e38(%rip),%xmm2 # 2d7a0 <_sk_overlay_sse2_8bit+0x1248>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,88,29,42,126,1,0 ; addps 0x17e2a(%rip),%xmm11 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
- DB 15,40,21,51,126,1,0 ; movaps 0x17e33(%rip),%xmm2 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
+ DB 68,15,88,29,56,126,1,0 ; addps 0x17e38(%rip),%xmm11 # 2d7b0 <_sk_overlay_sse2_8bit+0x1258>
+ DB 15,40,21,65,126,1,0 ; movaps 0x17e41(%rip),%xmm2 # 2d7c0 <_sk_overlay_sse2_8bit+0x1268>
DB 65,15,94,211 ; divps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,32,126,1,0 ; addps 0x17e20(%rip),%xmm12 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
- DB 15,40,21,41,126,1,0 ; movaps 0x17e29(%rip),%xmm2 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
+ DB 68,15,88,37,46,126,1,0 ; addps 0x17e2e(%rip),%xmm12 # 2d7d0 <_sk_overlay_sse2_8bit+0x1278>
+ DB 15,40,21,55,126,1,0 ; movaps 0x17e37(%rip),%xmm2 # 2d7e0 <_sk_overlay_sse2_8bit+0x1288>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,40,21,41,126,1,0 ; movaps 0x17e29(%rip),%xmm10 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
+ DB 68,15,40,21,55,126,1,0 ; movaps 0x17e37(%rip),%xmm10 # 2d7f0 <_sk_overlay_sse2_8bit+0x1298>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,21,46,126,1,0 ; movaps 0x17e2e(%rip),%xmm2 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
+ DB 15,40,21,60,126,1,0 ; movaps 0x17e3c(%rip),%xmm2 # 2d800 <_sk_overlay_sse2_8bit+0x12a8>
DB 65,15,94,210 ; divps %xmm10,%xmm2
DB 65,15,88,212 ; addps %xmm12,%xmm2
- DB 15,89,21,47,126,1,0 ; mulps 0x17e2f(%rip),%xmm2 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
+ DB 15,89,21,61,126,1,0 ; mulps 0x17e3d(%rip),%xmm2 # 2d810 <_sk_overlay_sse2_8bit+0x12b8>
DB 102,68,15,91,210 ; cvtps2dq %xmm2,%xmm10
DB 243,15,16,80,20 ; movss 0x14(%rax),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
@@ -20181,7 +20177,7 @@ _sk_parametric_b_sse41 LABEL PROC
DB 102,65,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm2
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,208 ; maxps %xmm0,%xmm2
- DB 15,93,21,186,122,1,0 ; minps 0x17aba(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,93,21,200,122,1,0 ; minps 0x17ac8(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -20209,31 +20205,31 @@ _sk_parametric_a_sse41 LABEL PROC
DB 68,15,88,219 ; addps %xmm3,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,251,124,1,0 ; mulps 0x17cfb(%rip),%xmm12 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
- DB 68,15,84,29,3,125,1,0 ; andps 0x17d03(%rip),%xmm11 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
- DB 68,15,86,29,27,122,1,0 ; orps 0x17a1b(%rip),%xmm11 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
- DB 68,15,88,37,3,125,1,0 ; addps 0x17d03(%rip),%xmm12 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
- DB 15,40,29,12,125,1,0 ; movaps 0x17d0c(%rip),%xmm3 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
+ DB 68,15,89,37,9,125,1,0 ; mulps 0x17d09(%rip),%xmm12 # 2d770 <_sk_overlay_sse2_8bit+0x1218>
+ DB 68,15,84,29,17,125,1,0 ; andps 0x17d11(%rip),%xmm11 # 2d780 <_sk_overlay_sse2_8bit+0x1228>
+ DB 68,15,86,29,57,122,1,0 ; orps 0x17a39(%rip),%xmm11 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
+ DB 68,15,88,37,17,125,1,0 ; addps 0x17d11(%rip),%xmm12 # 2d790 <_sk_overlay_sse2_8bit+0x1238>
+ DB 15,40,29,26,125,1,0 ; movaps 0x17d1a(%rip),%xmm3 # 2d7a0 <_sk_overlay_sse2_8bit+0x1248>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,88,29,12,125,1,0 ; addps 0x17d0c(%rip),%xmm11 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
- DB 15,40,29,21,125,1,0 ; movaps 0x17d15(%rip),%xmm3 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
+ DB 68,15,88,29,26,125,1,0 ; addps 0x17d1a(%rip),%xmm11 # 2d7b0 <_sk_overlay_sse2_8bit+0x1258>
+ DB 15,40,29,35,125,1,0 ; movaps 0x17d23(%rip),%xmm3 # 2d7c0 <_sk_overlay_sse2_8bit+0x1268>
DB 65,15,94,219 ; divps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,2,125,1,0 ; addps 0x17d02(%rip),%xmm12 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
- DB 15,40,29,11,125,1,0 ; movaps 0x17d0b(%rip),%xmm3 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
+ DB 68,15,88,37,16,125,1,0 ; addps 0x17d10(%rip),%xmm12 # 2d7d0 <_sk_overlay_sse2_8bit+0x1278>
+ DB 15,40,29,25,125,1,0 ; movaps 0x17d19(%rip),%xmm3 # 2d7e0 <_sk_overlay_sse2_8bit+0x1288>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,40,21,11,125,1,0 ; movaps 0x17d0b(%rip),%xmm10 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
+ DB 68,15,40,21,25,125,1,0 ; movaps 0x17d19(%rip),%xmm10 # 2d7f0 <_sk_overlay_sse2_8bit+0x1298>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,29,16,125,1,0 ; movaps 0x17d10(%rip),%xmm3 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
+ DB 15,40,29,30,125,1,0 ; movaps 0x17d1e(%rip),%xmm3 # 2d800 <_sk_overlay_sse2_8bit+0x12a8>
DB 65,15,94,218 ; divps %xmm10,%xmm3
DB 65,15,88,220 ; addps %xmm12,%xmm3
- DB 15,89,29,17,125,1,0 ; mulps 0x17d11(%rip),%xmm3 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
+ DB 15,89,29,31,125,1,0 ; mulps 0x17d1f(%rip),%xmm3 # 2d810 <_sk_overlay_sse2_8bit+0x12b8>
DB 102,68,15,91,211 ; cvtps2dq %xmm3,%xmm10
DB 243,15,16,88,20 ; movss 0x14(%rax),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
@@ -20241,7 +20237,7 @@ _sk_parametric_a_sse41 LABEL PROC
DB 102,65,15,56,20,217 ; blendvps %xmm0,%xmm9,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,216 ; maxps %xmm0,%xmm3
- DB 15,93,29,156,121,1,0 ; minps 0x1799c(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,93,29,170,121,1,0 ; minps 0x179aa(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -20257,20 +20253,20 @@ _sk_gamma_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,5,24,124,1,0 ; mulps 0x17c18(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
- DB 68,15,40,53,32,124,1,0 ; movaps 0x17c20(%rip),%xmm14 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
+ DB 15,89,5,38,124,1,0 ; mulps 0x17c26(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1218>
+ DB 68,15,40,53,46,124,1,0 ; movaps 0x17c2e(%rip),%xmm14 # 2d780 <_sk_overlay_sse2_8bit+0x1228>
DB 65,15,84,214 ; andps %xmm14,%xmm2
- DB 68,15,40,37,52,121,1,0 ; movaps 0x17934(%rip),%xmm12 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,40,37,82,121,1,0 ; movaps 0x17952(%rip),%xmm12 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 65,15,86,212 ; orps %xmm12,%xmm2
- DB 68,15,40,21,24,124,1,0 ; movaps 0x17c18(%rip),%xmm10 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
+ DB 68,15,40,21,38,124,1,0 ; movaps 0x17c26(%rip),%xmm10 # 2d790 <_sk_overlay_sse2_8bit+0x1238>
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,29,28,124,1,0 ; movaps 0x17c1c(%rip),%xmm11 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
+ DB 68,15,40,29,42,124,1,0 ; movaps 0x17c2a(%rip),%xmm11 # 2d7a0 <_sk_overlay_sse2_8bit+0x1248>
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 65,15,89,227 ; mulps %xmm11,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 68,15,40,13,26,124,1,0 ; movaps 0x17c1a(%rip),%xmm9 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
+ DB 68,15,40,13,40,124,1,0 ; movaps 0x17c28(%rip),%xmm9 # 2d7b0 <_sk_overlay_sse2_8bit+0x1258>
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 68,15,40,45,30,124,1,0 ; movaps 0x17c1e(%rip),%xmm13 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
+ DB 68,15,40,45,44,124,1,0 ; movaps 0x17c2c(%rip),%xmm13 # 2d7c0 <_sk_overlay_sse2_8bit+0x1268>
DB 65,15,40,229 ; movaps %xmm13,%xmm4
DB 15,94,226 ; divps %xmm2,%xmm4
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20281,21 +20277,21 @@ _sk_gamma_sse41 LABEL PROC
DB 102,15,58,8,208,1 ; roundps $0x1,%xmm0,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,53,1,124,1,0 ; movaps 0x17c01(%rip),%xmm6 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
+ DB 15,40,53,15,124,1,0 ; movaps 0x17c0f(%rip),%xmm6 # 2d7d0 <_sk_overlay_sse2_8bit+0x1278>
DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,40,61,23,124,1,0 ; movaps 0x17c17(%rip),%xmm7 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
+ DB 15,40,61,37,124,1,0 ; movaps 0x17c25(%rip),%xmm7 # 2d7f0 <_sk_overlay_sse2_8bit+0x1298>
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,37,247,123,1,0 ; movaps 0x17bf7(%rip),%xmm4 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
+ DB 15,40,37,5,124,1,0 ; movaps 0x17c05(%rip),%xmm4 # 2d7e0 <_sk_overlay_sse2_8bit+0x1288>
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,92,194 ; subps %xmm2,%xmm0
- DB 68,15,40,61,9,124,1,0 ; movaps 0x17c09(%rip),%xmm15 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
+ DB 68,15,40,61,23,124,1,0 ; movaps 0x17c17(%rip),%xmm15 # 2d800 <_sk_overlay_sse2_8bit+0x12a8>
DB 65,15,40,215 ; movaps %xmm15,%xmm2
DB 15,94,213 ; divps %xmm5,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,5,101,123,1,0 ; mulps 0x17b65(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
+ DB 15,89,5,115,123,1,0 ; mulps 0x17b73(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1218>
DB 65,15,84,206 ; andps %xmm14,%xmm1
DB 65,15,86,204 ; orps %xmm12,%xmm1
DB 65,15,88,194 ; addps %xmm10,%xmm0
@@ -20321,8 +20317,8 @@ _sk_gamma_sse41 LABEL PROC
DB 15,94,206 ; divps %xmm6,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,5,6,123,1,0 ; mulps 0x17b06(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
- DB 15,84,29,15,123,1,0 ; andps 0x17b0f(%rip),%xmm3 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
+ DB 15,89,5,20,123,1,0 ; mulps 0x17b14(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1218>
+ DB 15,84,29,29,123,1,0 ; andps 0x17b1d(%rip),%xmm3 # 2d780 <_sk_overlay_sse2_8bit+0x1228>
DB 65,15,86,220 ; orps %xmm12,%xmm3
DB 65,15,88,194 ; addps %xmm10,%xmm0
DB 68,15,89,219 ; mulps %xmm3,%xmm11
@@ -20340,7 +20336,7 @@ _sk_gamma_sse41 LABEL PROC
DB 15,92,253 ; subps %xmm5,%xmm7
DB 68,15,94,255 ; divps %xmm7,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 15,40,5,87,123,1,0 ; movaps 0x17b57(%rip),%xmm0 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
+ DB 15,40,5,101,123,1,0 ; movaps 0x17b65(%rip),%xmm0 # 2d810 <_sk_overlay_sse2_8bit+0x12b8>
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 68,15,89,248 ; mulps %xmm0,%xmm15
@@ -20359,29 +20355,29 @@ _sk_gamma_sse41 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse41
_sk_lab_to_xyz_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,89,5,36,123,1,0 ; mulps 0x17b24(%rip),%xmm8 # 2d820 <_sk_overlay_sse2_8bit+0x12b4>
- DB 68,15,40,13,156,120,1,0 ; movaps 0x1789c(%rip),%xmm9 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
+ DB 68,15,89,5,50,123,1,0 ; mulps 0x17b32(%rip),%xmm8 # 2d820 <_sk_overlay_sse2_8bit+0x12c8>
+ DB 68,15,40,13,170,120,1,0 ; movaps 0x178aa(%rip),%xmm9 # 2d5a0 <_sk_overlay_sse2_8bit+0x1048>
DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 15,40,5,33,123,1,0 ; movaps 0x17b21(%rip),%xmm0 # 2d830 <_sk_overlay_sse2_8bit+0x12c4>
+ DB 15,40,5,47,123,1,0 ; movaps 0x17b2f(%rip),%xmm0 # 2d830 <_sk_overlay_sse2_8bit+0x12d8>
DB 15,88,200 ; addps %xmm0,%xmm1
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,88,5,31,123,1,0 ; addps 0x17b1f(%rip),%xmm8 # 2d840 <_sk_overlay_sse2_8bit+0x12d4>
- DB 68,15,89,5,39,123,1,0 ; mulps 0x17b27(%rip),%xmm8 # 2d850 <_sk_overlay_sse2_8bit+0x12e4>
- DB 15,89,13,48,123,1,0 ; mulps 0x17b30(%rip),%xmm1 # 2d860 <_sk_overlay_sse2_8bit+0x12f4>
+ DB 68,15,88,5,45,123,1,0 ; addps 0x17b2d(%rip),%xmm8 # 2d840 <_sk_overlay_sse2_8bit+0x12e8>
+ DB 68,15,89,5,53,123,1,0 ; mulps 0x17b35(%rip),%xmm8 # 2d850 <_sk_overlay_sse2_8bit+0x12f8>
+ DB 15,89,13,62,123,1,0 ; mulps 0x17b3e(%rip),%xmm1 # 2d860 <_sk_overlay_sse2_8bit+0x1308>
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 15,89,21,53,123,1,0 ; mulps 0x17b35(%rip),%xmm2 # 2d870 <_sk_overlay_sse2_8bit+0x1304>
+ DB 15,89,21,67,123,1,0 ; mulps 0x17b43(%rip),%xmm2 # 2d870 <_sk_overlay_sse2_8bit+0x1318>
DB 69,15,40,208 ; movaps %xmm8,%xmm10
DB 68,15,92,210 ; subps %xmm2,%xmm10
DB 68,15,40,217 ; movaps %xmm1,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
- DB 68,15,40,13,41,123,1,0 ; movaps 0x17b29(%rip),%xmm9 # 2d880 <_sk_overlay_sse2_8bit+0x1314>
+ DB 68,15,40,13,55,123,1,0 ; movaps 0x17b37(%rip),%xmm9 # 2d880 <_sk_overlay_sse2_8bit+0x1328>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 15,40,21,41,123,1,0 ; movaps 0x17b29(%rip),%xmm2 # 2d890 <_sk_overlay_sse2_8bit+0x1324>
+ DB 15,40,21,55,123,1,0 ; movaps 0x17b37(%rip),%xmm2 # 2d890 <_sk_overlay_sse2_8bit+0x1338>
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 68,15,40,37,46,123,1,0 ; movaps 0x17b2e(%rip),%xmm12 # 2d8a0 <_sk_overlay_sse2_8bit+0x1334>
+ DB 68,15,40,37,60,123,1,0 ; movaps 0x17b3c(%rip),%xmm12 # 2d8a0 <_sk_overlay_sse2_8bit+0x1348>
DB 65,15,89,204 ; mulps %xmm12,%xmm1
DB 102,65,15,56,20,203 ; blendvps %xmm0,%xmm11,%xmm1
DB 69,15,40,216 ; movaps %xmm8,%xmm11
@@ -20400,8 +20396,8 @@ _sk_lab_to_xyz_sse41 LABEL PROC
DB 65,15,89,212 ; mulps %xmm12,%xmm2
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm2
- DB 15,89,13,231,122,1,0 ; mulps 0x17ae7(%rip),%xmm1 # 2d8b0 <_sk_overlay_sse2_8bit+0x1344>
- DB 15,89,21,240,122,1,0 ; mulps 0x17af0(%rip),%xmm2 # 2d8c0 <_sk_overlay_sse2_8bit+0x1354>
+ DB 15,89,13,245,122,1,0 ; mulps 0x17af5(%rip),%xmm1 # 2d8b0 <_sk_overlay_sse2_8bit+0x1358>
+ DB 15,89,21,254,122,1,0 ; mulps 0x17afe(%rip),%xmm2 # 2d8c0 <_sk_overlay_sse2_8bit+0x1368>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,40,200 ; movaps %xmm8,%xmm1
@@ -20416,11 +20412,11 @@ _sk_load_a8_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,39 ; jne 15e1a <_sk_load_a8_sse41+0x3f>
+ DB 117,39 ; jne 15e0c <_sk_load_a8_sse41+0x3f>
DB 102,67,15,56,49,4,16 ; pmovzxbd (%r8,%r10,1),%xmm0
- DB 102,15,219,5,110,119,1,0 ; pand 0x1776e(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,219,5,124,119,1,0 ; pand 0x1777c(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,180,120,1,0 ; mulps 0x178b4(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 15,89,29,194,120,1,0 ; mulps 0x178c2(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -20429,12 +20425,12 @@ _sk_load_a8_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,53 ; je 15e5c <_sk_load_a8_sse41+0x81>
+ DB 116,53 ; je 15e4e <_sk_load_a8_sse41+0x81>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 15e46 <_sk_load_a8_sse41+0x6b>
+ DB 116,21 ; je 15e38 <_sk_load_a8_sse41+0x6b>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,195 ; jne 15dfa <_sk_load_a8_sse41+0x1f>
+ DB 117,195 ; jne 15dec <_sk_load_a8_sse41+0x1f>
DB 67,15,182,68,16,2 ; movzbl 0x2(%r8,%r10,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -20442,10 +20438,10 @@ _sk_load_a8_sse41 LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1
DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0
- DB 235,158 ; jmp 15dfa <_sk_load_a8_sse41+0x1f>
+ DB 235,158 ; jmp 15dec <_sk_load_a8_sse41+0x1f>
DB 67,15,182,4,16 ; movzbl (%r8,%r10,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,147 ; jmp 15dfa <_sk_load_a8_sse41+0x1f>
+ DB 235,147 ; jmp 15dec <_sk_load_a8_sse41+0x1f>
PUBLIC _sk_load_a8_dst_sse41
_sk_load_a8_dst_sse41 LABEL PROC
@@ -20456,11 +20452,11 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,39 ; jne 15ea6 <_sk_load_a8_dst_sse41+0x3f>
+ DB 117,39 ; jne 15e98 <_sk_load_a8_dst_sse41+0x3f>
DB 102,67,15,56,49,36,16 ; pmovzxbd (%r8,%r10,1),%xmm4
- DB 102,15,219,37,226,118,1,0 ; pand 0x176e2(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,219,37,240,118,1,0 ; pand 0x176f0(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
- DB 15,89,61,40,120,1,0 ; mulps 0x17828(%rip),%xmm7 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 15,89,61,54,120,1,0 ; mulps 0x17836(%rip),%xmm7 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
@@ -20469,12 +20465,12 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,53 ; je 15ee8 <_sk_load_a8_dst_sse41+0x81>
+ DB 116,53 ; je 15eda <_sk_load_a8_dst_sse41+0x81>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 15ed2 <_sk_load_a8_dst_sse41+0x6b>
+ DB 116,21 ; je 15ec4 <_sk_load_a8_dst_sse41+0x6b>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,195 ; jne 15e86 <_sk_load_a8_dst_sse41+0x1f>
+ DB 117,195 ; jne 15e78 <_sk_load_a8_dst_sse41+0x1f>
DB 67,15,182,68,16,2 ; movzbl 0x2(%r8,%r10,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -20482,10 +20478,10 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,49,237 ; pmovzxbd %xmm5,%xmm5
DB 102,15,58,14,229,15 ; pblendw $0xf,%xmm5,%xmm4
- DB 235,158 ; jmp 15e86 <_sk_load_a8_dst_sse41+0x1f>
+ DB 235,158 ; jmp 15e78 <_sk_load_a8_dst_sse41+0x1f>
DB 67,15,182,4,16 ; movzbl (%r8,%r10,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,147 ; jmp 15e86 <_sk_load_a8_dst_sse41+0x1f>
+ DB 235,147 ; jmp 15e78 <_sk_load_a8_dst_sse41+0x1f>
PUBLIC _sk_gather_a8_sse41
_sk_gather_a8_sse41 LABEL PROC
@@ -20511,7 +20507,7 @@ _sk_gather_a8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,93,119,1,0 ; mulps 0x1775d(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 15,89,29,107,119,1,0 ; mulps 0x1776b(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -20527,13 +20523,13 @@ _sk_store_a8_sse41 LABEL PROC
DB 77,15,175,193 ; imul %r9,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
- DB 68,15,40,5,15,118,1,0 ; movaps 0x1760f(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
+ DB 68,15,40,5,29,118,1,0 ; movaps 0x1761d(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1048>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 15fbb <_sk_store_a8_sse41+0x49>
+ DB 117,17 ; jne 15fad <_sk_store_a8_sse41+0x49>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 67,137,4,16 ; mov %eax,(%r8,%r10,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20543,17 +20539,17 @@ _sk_store_a8_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,41 ; je 15ff7 <_sk_store_a8_sse41+0x85>
+ DB 116,41 ; je 15fe9 <_sk_store_a8_sse41+0x85>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,15 ; je 15fe3 <_sk_store_a8_sse41+0x71>
+ DB 116,15 ; je 15fd5 <_sk_store_a8_sse41+0x71>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,217 ; jne 15fb3 <_sk_store_a8_sse41+0x41>
+ DB 117,217 ; jne 15fa5 <_sk_store_a8_sse41+0x41>
DB 102,71,15,58,20,68,16,2,8 ; pextrb $0x8,%xmm8,0x2(%r8,%r10,1)
- DB 102,68,15,56,0,5,227,120,1,0 ; pshufb 0x178e3(%rip),%xmm8 # 2d8d0 <_sk_overlay_sse2_8bit+0x1364>
+ DB 102,68,15,56,0,5,241,120,1,0 ; pshufb 0x178f1(%rip),%xmm8 # 2d8d0 <_sk_overlay_sse2_8bit+0x1378>
DB 102,71,15,58,21,4,16,0 ; pextrw $0x0,%xmm8,(%r8,%r10,1)
- DB 235,188 ; jmp 15fb3 <_sk_store_a8_sse41+0x41>
+ DB 235,188 ; jmp 15fa5 <_sk_store_a8_sse41+0x41>
DB 102,71,15,58,20,4,16,0 ; pextrb $0x0,%xmm8,(%r8,%r10,1)
- DB 235,178 ; jmp 15fb3 <_sk_store_a8_sse41+0x41>
+ DB 235,178 ; jmp 15fa5 <_sk_store_a8_sse41+0x41>
PUBLIC _sk_load_g8_sse41
_sk_load_g8_sse41 LABEL PROC
@@ -20564,25 +20560,25 @@ _sk_load_g8_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,42 ; jne 16043 <_sk_load_g8_sse41+0x42>
+ DB 117,42 ; jne 16035 <_sk_load_g8_sse41+0x42>
DB 102,67,15,56,49,4,16 ; pmovzxbd (%r8,%r10,1),%xmm0
- DB 102,15,219,5,72,117,1,0 ; pand 0x17548(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,219,5,86,117,1,0 ; pand 0x17556(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,142,118,1,0 ; mulps 0x1768e(%rip),%xmm0 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 15,89,5,156,118,1,0 ; mulps 0x1769c(%rip),%xmm0 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,133,116,1,0 ; movaps 0x17485(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,147,116,1,0 ; movaps 0x17493(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,53 ; je 16085 <_sk_load_g8_sse41+0x84>
+ DB 116,53 ; je 16077 <_sk_load_g8_sse41+0x84>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 1606f <_sk_load_g8_sse41+0x6e>
+ DB 116,21 ; je 16061 <_sk_load_g8_sse41+0x6e>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,192 ; jne 16020 <_sk_load_g8_sse41+0x1f>
+ DB 117,192 ; jne 16012 <_sk_load_g8_sse41+0x1f>
DB 67,15,182,68,16,2 ; movzbl 0x2(%r8,%r10,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -20590,10 +20586,10 @@ _sk_load_g8_sse41 LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1
DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0
- DB 235,155 ; jmp 16020 <_sk_load_g8_sse41+0x1f>
+ DB 235,155 ; jmp 16012 <_sk_load_g8_sse41+0x1f>
DB 67,15,182,4,16 ; movzbl (%r8,%r10,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,144 ; jmp 16020 <_sk_load_g8_sse41+0x1f>
+ DB 235,144 ; jmp 16012 <_sk_load_g8_sse41+0x1f>
PUBLIC _sk_load_g8_dst_sse41
_sk_load_g8_dst_sse41 LABEL PROC
@@ -20604,25 +20600,25 @@ _sk_load_g8_dst_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,42 ; jne 160d2 <_sk_load_g8_dst_sse41+0x42>
+ DB 117,42 ; jne 160c4 <_sk_load_g8_dst_sse41+0x42>
DB 102,67,15,56,49,36,16 ; pmovzxbd (%r8,%r10,1),%xmm4
- DB 102,15,219,37,185,116,1,0 ; pand 0x174b9(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,219,37,199,116,1,0 ; pand 0x174c7(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,255,117,1,0 ; mulps 0x175ff(%rip),%xmm4 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 15,89,37,13,118,1,0 ; mulps 0x1760d(%rip),%xmm4 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,246,115,1,0 ; movaps 0x173f6(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,61,4,116,1,0 ; movaps 0x17404(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,53 ; je 16114 <_sk_load_g8_dst_sse41+0x84>
+ DB 116,53 ; je 16106 <_sk_load_g8_dst_sse41+0x84>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 160fe <_sk_load_g8_dst_sse41+0x6e>
+ DB 116,21 ; je 160f0 <_sk_load_g8_dst_sse41+0x6e>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,192 ; jne 160af <_sk_load_g8_dst_sse41+0x1f>
+ DB 117,192 ; jne 160a1 <_sk_load_g8_dst_sse41+0x1f>
DB 67,15,182,68,16,2 ; movzbl 0x2(%r8,%r10,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -20630,10 +20626,10 @@ _sk_load_g8_dst_sse41 LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,49,237 ; pmovzxbd %xmm5,%xmm5
DB 102,15,58,14,229,15 ; pblendw $0xf,%xmm5,%xmm4
- DB 235,155 ; jmp 160af <_sk_load_g8_dst_sse41+0x1f>
+ DB 235,155 ; jmp 160a1 <_sk_load_g8_dst_sse41+0x1f>
DB 67,15,182,4,16 ; movzbl (%r8,%r10,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,144 ; jmp 160af <_sk_load_g8_dst_sse41+0x1f>
+ DB 235,144 ; jmp 160a1 <_sk_load_g8_dst_sse41+0x1f>
PUBLIC _sk_gather_g8_sse41
_sk_gather_g8_sse41 LABEL PROC
@@ -20659,9 +20655,9 @@ _sk_gather_g8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,49,117,1,0 ; mulps 0x17531(%rip),%xmm0 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 15,89,5,63,117,1,0 ; mulps 0x1753f(%rip),%xmm0 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,40,115,1,0 ; movaps 0x17328(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,54,115,1,0 ; movaps 0x17336(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
@@ -20676,41 +20672,41 @@ _sk_load_565_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,80 ; jne 1620b <_sk_load_565_sse41+0x6b>
+ DB 117,80 ; jne 161fd <_sk_load_565_sse41+0x6b>
DB 102,67,15,56,51,20,80 ; pmovzxwd (%r8,%r10,2),%xmm2
- DB 102,15,111,5,6,117,1,0 ; movdqa 0x17506(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
+ DB 102,15,111,5,20,117,1,0 ; movdqa 0x17514(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1178>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,8,117,1,0 ; mulps 0x17508(%rip),%xmm0 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
- DB 102,15,111,13,16,117,1,0 ; movdqa 0x17510(%rip),%xmm1 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
+ DB 15,89,5,22,117,1,0 ; mulps 0x17516(%rip),%xmm0 # 2d6e0 <_sk_overlay_sse2_8bit+0x1188>
+ DB 102,15,111,13,30,117,1,0 ; movdqa 0x1751e(%rip),%xmm1 # 2d6f0 <_sk_overlay_sse2_8bit+0x1198>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,18,117,1,0 ; mulps 0x17512(%rip),%xmm1 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
- DB 102,15,219,21,26,117,1,0 ; pand 0x1751a(%rip),%xmm2 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
+ DB 15,89,13,32,117,1,0 ; mulps 0x17520(%rip),%xmm1 # 2d700 <_sk_overlay_sse2_8bit+0x11a8>
+ DB 102,15,219,21,40,117,1,0 ; pand 0x17528(%rip),%xmm2 # 2d710 <_sk_overlay_sse2_8bit+0x11b8>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,32,117,1,0 ; mulps 0x17520(%rip),%xmm2 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
+ DB 15,89,21,46,117,1,0 ; mulps 0x1752e(%rip),%xmm2 # 2d720 <_sk_overlay_sse2_8bit+0x11c8>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,183,114,1,0 ; movaps 0x172b7(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,197,114,1,0 ; movaps 0x172c5(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,53 ; je 1624d <_sk_load_565_sse41+0xad>
+ DB 116,53 ; je 1623f <_sk_load_565_sse41+0xad>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 16237 <_sk_load_565_sse41+0x97>
+ DB 116,21 ; je 16229 <_sk_load_565_sse41+0x97>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,154 ; jne 161c2 <_sk_load_565_sse41+0x22>
+ DB 117,154 ; jne 161b4 <_sk_load_565_sse41+0x22>
DB 67,15,183,68,80,4 ; movzwl 0x4(%r8,%r10,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,67,15,110,4,80 ; movd (%r8,%r10,2),%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 102,15,58,14,208,15 ; pblendw $0xf,%xmm0,%xmm2
- DB 233,117,255,255,255 ; jmpq 161c2 <_sk_load_565_sse41+0x22>
+ DB 233,117,255,255,255 ; jmpq 161b4 <_sk_load_565_sse41+0x22>
DB 67,15,183,4,80 ; movzwl (%r8,%r10,2),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,103,255,255,255 ; jmpq 161c2 <_sk_load_565_sse41+0x22>
+ DB 233,103,255,255,255 ; jmpq 161b4 <_sk_load_565_sse41+0x22>
PUBLIC _sk_load_565_dst_sse41
_sk_load_565_dst_sse41 LABEL PROC
@@ -20722,41 +20718,41 @@ _sk_load_565_dst_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,80 ; jne 162c6 <_sk_load_565_dst_sse41+0x6b>
+ DB 117,80 ; jne 162b8 <_sk_load_565_dst_sse41+0x6b>
DB 102,67,15,56,51,52,80 ; pmovzxwd (%r8,%r10,2),%xmm6
- DB 102,15,111,37,75,116,1,0 ; movdqa 0x1744b(%rip),%xmm4 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
+ DB 102,15,111,37,89,116,1,0 ; movdqa 0x17459(%rip),%xmm4 # 2d6d0 <_sk_overlay_sse2_8bit+0x1178>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,77,116,1,0 ; mulps 0x1744d(%rip),%xmm4 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
- DB 102,15,111,45,85,116,1,0 ; movdqa 0x17455(%rip),%xmm5 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
+ DB 15,89,37,91,116,1,0 ; mulps 0x1745b(%rip),%xmm4 # 2d6e0 <_sk_overlay_sse2_8bit+0x1188>
+ DB 102,15,111,45,99,116,1,0 ; movdqa 0x17463(%rip),%xmm5 # 2d6f0 <_sk_overlay_sse2_8bit+0x1198>
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,87,116,1,0 ; mulps 0x17457(%rip),%xmm5 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
- DB 102,15,219,53,95,116,1,0 ; pand 0x1745f(%rip),%xmm6 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
+ DB 15,89,45,101,116,1,0 ; mulps 0x17465(%rip),%xmm5 # 2d700 <_sk_overlay_sse2_8bit+0x11a8>
+ DB 102,15,219,53,109,116,1,0 ; pand 0x1746d(%rip),%xmm6 # 2d710 <_sk_overlay_sse2_8bit+0x11b8>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,101,116,1,0 ; mulps 0x17465(%rip),%xmm6 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
+ DB 15,89,53,115,116,1,0 ; mulps 0x17473(%rip),%xmm6 # 2d720 <_sk_overlay_sse2_8bit+0x11c8>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,252,113,1,0 ; movaps 0x171fc(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,61,10,114,1,0 ; movaps 0x1720a(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,53 ; je 16308 <_sk_load_565_dst_sse41+0xad>
+ DB 116,53 ; je 162fa <_sk_load_565_dst_sse41+0xad>
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 162f2 <_sk_load_565_dst_sse41+0x97>
+ DB 116,21 ; je 162e4 <_sk_load_565_dst_sse41+0x97>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,154 ; jne 1627d <_sk_load_565_dst_sse41+0x22>
+ DB 117,154 ; jne 1626f <_sk_load_565_dst_sse41+0x22>
DB 67,15,183,68,80,4 ; movzwl 0x4(%r8,%r10,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
DB 102,67,15,110,36,80 ; movd (%r8,%r10,2),%xmm4
DB 102,15,56,51,228 ; pmovzxwd %xmm4,%xmm4
DB 102,15,58,14,244,15 ; pblendw $0xf,%xmm4,%xmm6
- DB 233,117,255,255,255 ; jmpq 1627d <_sk_load_565_dst_sse41+0x22>
+ DB 233,117,255,255,255 ; jmpq 1626f <_sk_load_565_dst_sse41+0x22>
DB 67,15,183,4,80 ; movzwl (%r8,%r10,2),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,103,255,255,255 ; jmpq 1627d <_sk_load_565_dst_sse41+0x22>
+ DB 233,103,255,255,255 ; jmpq 1626f <_sk_load_565_dst_sse41+0x22>
PUBLIC _sk_gather_565_sse41
_sk_gather_565_sse41 LABEL PROC
@@ -20781,19 +20777,19 @@ _sk_gather_565_sse41 LABEL PROC
DB 65,15,183,4,64 ; movzwl (%r8,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,208 ; pmovzxwd %xmm0,%xmm2
- DB 102,15,111,5,80,115,1,0 ; movdqa 0x17350(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
+ DB 102,15,111,5,94,115,1,0 ; movdqa 0x1735e(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1178>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,82,115,1,0 ; mulps 0x17352(%rip),%xmm0 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
- DB 102,15,111,13,90,115,1,0 ; movdqa 0x1735a(%rip),%xmm1 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
+ DB 15,89,5,96,115,1,0 ; mulps 0x17360(%rip),%xmm0 # 2d6e0 <_sk_overlay_sse2_8bit+0x1188>
+ DB 102,15,111,13,104,115,1,0 ; movdqa 0x17368(%rip),%xmm1 # 2d6f0 <_sk_overlay_sse2_8bit+0x1198>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,92,115,1,0 ; mulps 0x1735c(%rip),%xmm1 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
- DB 102,15,219,21,100,115,1,0 ; pand 0x17364(%rip),%xmm2 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
+ DB 15,89,13,106,115,1,0 ; mulps 0x1736a(%rip),%xmm1 # 2d700 <_sk_overlay_sse2_8bit+0x11a8>
+ DB 102,15,219,21,114,115,1,0 ; pand 0x17372(%rip),%xmm2 # 2d710 <_sk_overlay_sse2_8bit+0x11b8>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,106,115,1,0 ; mulps 0x1736a(%rip),%xmm2 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
+ DB 15,89,21,120,115,1,0 ; mulps 0x17378(%rip),%xmm2 # 2d720 <_sk_overlay_sse2_8bit+0x11c8>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,1,113,1,0 ; movaps 0x17101(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,15,113,1,0 ; movaps 0x1710f(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_sse41
@@ -20805,12 +20801,12 @@ _sk_store_565_sse41 LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,1,117,1,0 ; movaps 0x17501(%rip),%xmm8 # 2d8e0 <_sk_overlay_sse2_8bit+0x1374>
+ DB 68,15,40,5,15,117,1,0 ; movaps 0x1750f(%rip),%xmm8 # 2d8e0 <_sk_overlay_sse2_8bit+0x1388>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,246,116,1,0 ; movaps 0x174f6(%rip),%xmm10 # 2d8f0 <_sk_overlay_sse2_8bit+0x1384>
+ DB 68,15,40,21,4,117,1,0 ; movaps 0x17504(%rip),%xmm10 # 2d8f0 <_sk_overlay_sse2_8bit+0x1398>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -20820,7 +20816,7 @@ _sk_store_565_sse41 LABEL PROC
DB 102,69,15,86,194 ; orpd %xmm10,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 16431 <_sk_store_565_sse41+0x70>
+ DB 117,10 ; jne 16423 <_sk_store_565_sse41+0x70>
DB 242,69,15,17,4,64 ; movsd %xmm8,(%r8,%rax,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20828,17 +20824,17 @@ _sk_store_565_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,35 ; je 16467 <_sk_store_565_sse41+0xa6>
+ DB 116,35 ; je 16459 <_sk_store_565_sse41+0xa6>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,15 ; je 16459 <_sk_store_565_sse41+0x98>
+ DB 116,15 ; je 1644b <_sk_store_565_sse41+0x98>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,221 ; jne 1642d <_sk_store_565_sse41+0x6c>
+ DB 117,221 ; jne 1641f <_sk_store_565_sse41+0x6c>
DB 102,69,15,58,21,68,64,4,4 ; pextrw $0x4,%xmm8,0x4(%r8,%rax,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,69,15,126,4,64 ; movd %xmm8,(%r8,%rax,2)
- DB 235,198 ; jmp 1642d <_sk_store_565_sse41+0x6c>
+ DB 235,198 ; jmp 1641f <_sk_store_565_sse41+0x6c>
DB 102,69,15,58,21,4,64,0 ; pextrw $0x0,%xmm8,(%r8,%rax,2)
- DB 235,188 ; jmp 1642d <_sk_store_565_sse41+0x6c>
+ DB 235,188 ; jmp 1641f <_sk_store_565_sse41+0x6c>
PUBLIC _sk_load_4444_sse41
_sk_load_4444_sse41 LABEL PROC
@@ -20850,44 +20846,44 @@ _sk_load_4444_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,95 ; jne 164eb <_sk_load_4444_sse41+0x7a>
+ DB 117,95 ; jne 164dd <_sk_load_4444_sse41+0x7a>
DB 102,67,15,56,51,28,80 ; pmovzxwd (%r8,%r10,2),%xmm3
- DB 102,15,111,5,101,116,1,0 ; movdqa 0x17465(%rip),%xmm0 # 2d900 <_sk_overlay_sse2_8bit+0x1394>
+ DB 102,15,111,5,115,116,1,0 ; movdqa 0x17473(%rip),%xmm0 # 2d900 <_sk_overlay_sse2_8bit+0x13a8>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,103,116,1,0 ; mulps 0x17467(%rip),%xmm0 # 2d910 <_sk_overlay_sse2_8bit+0x13a4>
- DB 102,15,111,13,111,116,1,0 ; movdqa 0x1746f(%rip),%xmm1 # 2d920 <_sk_overlay_sse2_8bit+0x13b4>
+ DB 15,89,5,117,116,1,0 ; mulps 0x17475(%rip),%xmm0 # 2d910 <_sk_overlay_sse2_8bit+0x13b8>
+ DB 102,15,111,13,125,116,1,0 ; movdqa 0x1747d(%rip),%xmm1 # 2d920 <_sk_overlay_sse2_8bit+0x13c8>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,113,116,1,0 ; mulps 0x17471(%rip),%xmm1 # 2d930 <_sk_overlay_sse2_8bit+0x13c4>
- DB 102,15,111,21,121,116,1,0 ; movdqa 0x17479(%rip),%xmm2 # 2d940 <_sk_overlay_sse2_8bit+0x13d4>
+ DB 15,89,13,127,116,1,0 ; mulps 0x1747f(%rip),%xmm1 # 2d930 <_sk_overlay_sse2_8bit+0x13d8>
+ DB 102,15,111,21,135,116,1,0 ; movdqa 0x17487(%rip),%xmm2 # 2d940 <_sk_overlay_sse2_8bit+0x13e8>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,123,116,1,0 ; mulps 0x1747b(%rip),%xmm2 # 2d950 <_sk_overlay_sse2_8bit+0x13e4>
- DB 102,15,219,29,131,116,1,0 ; pand 0x17483(%rip),%xmm3 # 2d960 <_sk_overlay_sse2_8bit+0x13f4>
+ DB 15,89,21,137,116,1,0 ; mulps 0x17489(%rip),%xmm2 # 2d950 <_sk_overlay_sse2_8bit+0x13f8>
+ DB 102,15,219,29,145,116,1,0 ; pand 0x17491(%rip),%xmm3 # 2d960 <_sk_overlay_sse2_8bit+0x1408>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,137,116,1,0 ; mulps 0x17489(%rip),%xmm3 # 2d970 <_sk_overlay_sse2_8bit+0x1404>
+ DB 15,89,29,151,116,1,0 ; mulps 0x17497(%rip),%xmm3 # 2d970 <_sk_overlay_sse2_8bit+0x1418>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,53 ; je 1652d <_sk_load_4444_sse41+0xbc>
+ DB 116,53 ; je 1651f <_sk_load_4444_sse41+0xbc>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 16517 <_sk_load_4444_sse41+0xa6>
+ DB 116,21 ; je 16509 <_sk_load_4444_sse41+0xa6>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,139 ; jne 16493 <_sk_load_4444_sse41+0x22>
+ DB 117,139 ; jne 16485 <_sk_load_4444_sse41+0x22>
DB 67,15,183,68,80,4 ; movzwl 0x4(%r8,%r10,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,67,15,110,4,80 ; movd (%r8,%r10,2),%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,102,255,255,255 ; jmpq 16493 <_sk_load_4444_sse41+0x22>
+ DB 233,102,255,255,255 ; jmpq 16485 <_sk_load_4444_sse41+0x22>
DB 67,15,183,4,80 ; movzwl (%r8,%r10,2),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 233,88,255,255,255 ; jmpq 16493 <_sk_load_4444_sse41+0x22>
+ DB 233,88,255,255,255 ; jmpq 16485 <_sk_load_4444_sse41+0x22>
PUBLIC _sk_load_4444_dst_sse41
_sk_load_4444_dst_sse41 LABEL PROC
@@ -20899,44 +20895,44 @@ _sk_load_4444_dst_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,95 ; jne 165b5 <_sk_load_4444_dst_sse41+0x7a>
+ DB 117,95 ; jne 165a7 <_sk_load_4444_dst_sse41+0x7a>
DB 102,67,15,56,51,60,80 ; pmovzxwd (%r8,%r10,2),%xmm7
- DB 102,15,111,37,155,115,1,0 ; movdqa 0x1739b(%rip),%xmm4 # 2d900 <_sk_overlay_sse2_8bit+0x1394>
+ DB 102,15,111,37,169,115,1,0 ; movdqa 0x173a9(%rip),%xmm4 # 2d900 <_sk_overlay_sse2_8bit+0x13a8>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,157,115,1,0 ; mulps 0x1739d(%rip),%xmm4 # 2d910 <_sk_overlay_sse2_8bit+0x13a4>
- DB 102,15,111,45,165,115,1,0 ; movdqa 0x173a5(%rip),%xmm5 # 2d920 <_sk_overlay_sse2_8bit+0x13b4>
+ DB 15,89,37,171,115,1,0 ; mulps 0x173ab(%rip),%xmm4 # 2d910 <_sk_overlay_sse2_8bit+0x13b8>
+ DB 102,15,111,45,179,115,1,0 ; movdqa 0x173b3(%rip),%xmm5 # 2d920 <_sk_overlay_sse2_8bit+0x13c8>
DB 102,15,219,239 ; pand %xmm7,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,167,115,1,0 ; mulps 0x173a7(%rip),%xmm5 # 2d930 <_sk_overlay_sse2_8bit+0x13c4>
- DB 102,15,111,53,175,115,1,0 ; movdqa 0x173af(%rip),%xmm6 # 2d940 <_sk_overlay_sse2_8bit+0x13d4>
+ DB 15,89,45,181,115,1,0 ; mulps 0x173b5(%rip),%xmm5 # 2d930 <_sk_overlay_sse2_8bit+0x13d8>
+ DB 102,15,111,53,189,115,1,0 ; movdqa 0x173bd(%rip),%xmm6 # 2d940 <_sk_overlay_sse2_8bit+0x13e8>
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,177,115,1,0 ; mulps 0x173b1(%rip),%xmm6 # 2d950 <_sk_overlay_sse2_8bit+0x13e4>
- DB 102,15,219,61,185,115,1,0 ; pand 0x173b9(%rip),%xmm7 # 2d960 <_sk_overlay_sse2_8bit+0x13f4>
+ DB 15,89,53,191,115,1,0 ; mulps 0x173bf(%rip),%xmm6 # 2d950 <_sk_overlay_sse2_8bit+0x13f8>
+ DB 102,15,219,61,199,115,1,0 ; pand 0x173c7(%rip),%xmm7 # 2d960 <_sk_overlay_sse2_8bit+0x1408>
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,61,191,115,1,0 ; mulps 0x173bf(%rip),%xmm7 # 2d970 <_sk_overlay_sse2_8bit+0x1404>
+ DB 15,89,61,205,115,1,0 ; mulps 0x173cd(%rip),%xmm7 # 2d970 <_sk_overlay_sse2_8bit+0x1418>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,53 ; je 165f7 <_sk_load_4444_dst_sse41+0xbc>
+ DB 116,53 ; je 165e9 <_sk_load_4444_dst_sse41+0xbc>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 165e1 <_sk_load_4444_dst_sse41+0xa6>
+ DB 116,21 ; je 165d3 <_sk_load_4444_dst_sse41+0xa6>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,139 ; jne 1655d <_sk_load_4444_dst_sse41+0x22>
+ DB 117,139 ; jne 1654f <_sk_load_4444_dst_sse41+0x22>
DB 67,15,183,68,80,4 ; movzwl 0x4(%r8,%r10,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 102,67,15,110,36,80 ; movd (%r8,%r10,2),%xmm4
DB 102,15,56,51,228 ; pmovzxwd %xmm4,%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,102,255,255,255 ; jmpq 1655d <_sk_load_4444_dst_sse41+0x22>
+ DB 233,102,255,255,255 ; jmpq 1654f <_sk_load_4444_dst_sse41+0x22>
DB 67,15,183,4,80 ; movzwl (%r8,%r10,2),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,88,255,255,255 ; jmpq 1655d <_sk_load_4444_dst_sse41+0x22>
+ DB 233,88,255,255,255 ; jmpq 1654f <_sk_load_4444_dst_sse41+0x22>
PUBLIC _sk_gather_4444_sse41
_sk_gather_4444_sse41 LABEL PROC
@@ -20961,21 +20957,21 @@ _sk_gather_4444_sse41 LABEL PROC
DB 65,15,183,4,64 ; movzwl (%r8,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,216 ; pmovzxwd %xmm0,%xmm3
- DB 102,15,111,5,145,114,1,0 ; movdqa 0x17291(%rip),%xmm0 # 2d900 <_sk_overlay_sse2_8bit+0x1394>
+ DB 102,15,111,5,159,114,1,0 ; movdqa 0x1729f(%rip),%xmm0 # 2d900 <_sk_overlay_sse2_8bit+0x13a8>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,147,114,1,0 ; mulps 0x17293(%rip),%xmm0 # 2d910 <_sk_overlay_sse2_8bit+0x13a4>
- DB 102,15,111,13,155,114,1,0 ; movdqa 0x1729b(%rip),%xmm1 # 2d920 <_sk_overlay_sse2_8bit+0x13b4>
+ DB 15,89,5,161,114,1,0 ; mulps 0x172a1(%rip),%xmm0 # 2d910 <_sk_overlay_sse2_8bit+0x13b8>
+ DB 102,15,111,13,169,114,1,0 ; movdqa 0x172a9(%rip),%xmm1 # 2d920 <_sk_overlay_sse2_8bit+0x13c8>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,157,114,1,0 ; mulps 0x1729d(%rip),%xmm1 # 2d930 <_sk_overlay_sse2_8bit+0x13c4>
- DB 102,15,111,21,165,114,1,0 ; movdqa 0x172a5(%rip),%xmm2 # 2d940 <_sk_overlay_sse2_8bit+0x13d4>
+ DB 15,89,13,171,114,1,0 ; mulps 0x172ab(%rip),%xmm1 # 2d930 <_sk_overlay_sse2_8bit+0x13d8>
+ DB 102,15,111,21,179,114,1,0 ; movdqa 0x172b3(%rip),%xmm2 # 2d940 <_sk_overlay_sse2_8bit+0x13e8>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,167,114,1,0 ; mulps 0x172a7(%rip),%xmm2 # 2d950 <_sk_overlay_sse2_8bit+0x13e4>
- DB 102,15,219,29,175,114,1,0 ; pand 0x172af(%rip),%xmm3 # 2d960 <_sk_overlay_sse2_8bit+0x13f4>
+ DB 15,89,21,181,114,1,0 ; mulps 0x172b5(%rip),%xmm2 # 2d950 <_sk_overlay_sse2_8bit+0x13f8>
+ DB 102,15,219,29,189,114,1,0 ; pand 0x172bd(%rip),%xmm3 # 2d960 <_sk_overlay_sse2_8bit+0x1408>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,181,114,1,0 ; mulps 0x172b5(%rip),%xmm3 # 2d970 <_sk_overlay_sse2_8bit+0x1404>
+ DB 15,89,29,195,114,1,0 ; mulps 0x172c3(%rip),%xmm3 # 2d970 <_sk_overlay_sse2_8bit+0x1418>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20988,7 +20984,7 @@ _sk_store_4444_sse41 LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,163,114,1,0 ; movaps 0x172a3(%rip),%xmm8 # 2d980 <_sk_overlay_sse2_8bit+0x1414>
+ DB 68,15,40,5,177,114,1,0 ; movaps 0x172b1(%rip),%xmm8 # 2d980 <_sk_overlay_sse2_8bit+0x1428>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -21008,7 +21004,7 @@ _sk_store_4444_sse41 LABEL PROC
DB 102,69,15,86,194 ; orpd %xmm10,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 16743 <_sk_store_4444_sse41+0x84>
+ DB 117,10 ; jne 16735 <_sk_store_4444_sse41+0x84>
DB 242,69,15,17,4,64 ; movsd %xmm8,(%r8,%rax,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -21016,17 +21012,17 @@ _sk_store_4444_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,35 ; je 16779 <_sk_store_4444_sse41+0xba>
+ DB 116,35 ; je 1676b <_sk_store_4444_sse41+0xba>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,15 ; je 1676b <_sk_store_4444_sse41+0xac>
+ DB 116,15 ; je 1675d <_sk_store_4444_sse41+0xac>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,221 ; jne 1673f <_sk_store_4444_sse41+0x80>
+ DB 117,221 ; jne 16731 <_sk_store_4444_sse41+0x80>
DB 102,69,15,58,21,68,64,4,4 ; pextrw $0x4,%xmm8,0x4(%r8,%rax,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,69,15,126,4,64 ; movd %xmm8,(%r8,%rax,2)
- DB 235,198 ; jmp 1673f <_sk_store_4444_sse41+0x80>
+ DB 235,198 ; jmp 16731 <_sk_store_4444_sse41+0x80>
DB 102,69,15,58,21,4,64,0 ; pextrw $0x0,%xmm8,(%r8,%rax,2)
- DB 235,188 ; jmp 1673f <_sk_store_4444_sse41+0x80>
+ DB 235,188 ; jmp 16731 <_sk_store_4444_sse41+0x80>
PUBLIC _sk_load_8888_sse41
_sk_load_8888_sse41 LABEL PROC
@@ -21038,19 +21034,19 @@ _sk_load_8888_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 117,89 ; jne 167f8 <_sk_load_8888_sse41+0x75>
+ DB 117,89 ; jne 167ea <_sk_load_8888_sse41+0x75>
DB 243,65,15,111,28,128 ; movdqu (%r8,%rax,4),%xmm3
- DB 102,15,111,5,195,109,1,0 ; movdqa 0x16dc3(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,5,209,109,1,0 ; movdqa 0x16dd1(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,4,111,1,0 ; movaps 0x16f04(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,5,18,111,1,0 ; movaps 0x16f12(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,179,109,1,0 ; pshufb 0x16db3(%rip),%xmm1 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
+ DB 102,15,56,0,13,193,109,1,0 ; pshufb 0x16dc1(%rip),%xmm1 # 2d580 <_sk_overlay_sse2_8bit+0x1028>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,175,109,1,0 ; pshufb 0x16daf(%rip),%xmm2 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
+ DB 102,15,56,0,21,189,109,1,0 ; pshufb 0x16dbd(%rip),%xmm2 # 2d590 <_sk_overlay_sse2_8bit+0x1038>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -21061,19 +21057,19 @@ _sk_load_8888_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,45 ; je 16832 <_sk_load_8888_sse41+0xaf>
+ DB 116,45 ; je 16824 <_sk_load_8888_sse41+0xaf>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 16821 <_sk_load_8888_sse41+0x9e>
+ DB 116,18 ; je 16813 <_sk_load_8888_sse41+0x9e>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,144 ; jne 167a5 <_sk_load_8888_sse41+0x22>
+ DB 117,144 ; jne 16797 <_sk_load_8888_sse41+0x22>
DB 102,65,15,110,68,128,8 ; movd 0x8(%r8,%rax,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 243,65,15,126,4,128 ; movq (%r8,%rax,4),%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,115,255,255,255 ; jmpq 167a5 <_sk_load_8888_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 16797 <_sk_load_8888_sse41+0x22>
DB 102,65,15,110,28,128 ; movd (%r8,%rax,4),%xmm3
- DB 233,104,255,255,255 ; jmpq 167a5 <_sk_load_8888_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 16797 <_sk_load_8888_sse41+0x22>
PUBLIC _sk_load_8888_dst_sse41
_sk_load_8888_dst_sse41 LABEL PROC
@@ -21085,19 +21081,19 @@ _sk_load_8888_dst_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 117,89 ; jne 168b2 <_sk_load_8888_dst_sse41+0x75>
+ DB 117,89 ; jne 168a4 <_sk_load_8888_dst_sse41+0x75>
DB 243,65,15,111,60,128 ; movdqu (%r8,%rax,4),%xmm7
- DB 102,15,111,37,9,109,1,0 ; movdqa 0x16d09(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,37,23,109,1,0 ; movdqa 0x16d17(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 68,15,40,5,74,110,1,0 ; movaps 0x16e4a(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,5,88,110,1,0 ; movaps 0x16e58(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,249,108,1,0 ; pshufb 0x16cf9(%rip),%xmm5 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
+ DB 102,15,56,0,45,7,109,1,0 ; pshufb 0x16d07(%rip),%xmm5 # 2d580 <_sk_overlay_sse2_8bit+0x1028>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 65,15,89,232 ; mulps %xmm8,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,245,108,1,0 ; pshufb 0x16cf5(%rip),%xmm6 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
+ DB 102,15,56,0,53,3,109,1,0 ; pshufb 0x16d03(%rip),%xmm6 # 2d590 <_sk_overlay_sse2_8bit+0x1038>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
@@ -21108,19 +21104,19 @@ _sk_load_8888_dst_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,45 ; je 168ec <_sk_load_8888_dst_sse41+0xaf>
+ DB 116,45 ; je 168de <_sk_load_8888_dst_sse41+0xaf>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 168db <_sk_load_8888_dst_sse41+0x9e>
+ DB 116,18 ; je 168cd <_sk_load_8888_dst_sse41+0x9e>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,144 ; jne 1685f <_sk_load_8888_dst_sse41+0x22>
+ DB 117,144 ; jne 16851 <_sk_load_8888_dst_sse41+0x22>
DB 102,65,15,110,100,128,8 ; movd 0x8(%r8,%rax,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 243,65,15,126,36,128 ; movq (%r8,%rax,4),%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,115,255,255,255 ; jmpq 1685f <_sk_load_8888_dst_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 16851 <_sk_load_8888_dst_sse41+0x22>
DB 102,65,15,110,60,128 ; movd (%r8,%rax,4),%xmm7
- DB 233,104,255,255,255 ; jmpq 1685f <_sk_load_8888_dst_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 16851 <_sk_load_8888_dst_sse41+0x22>
PUBLIC _sk_gather_8888_sse41
_sk_gather_8888_sse41 LABEL PROC
@@ -21142,17 +21138,17 @@ _sk_gather_8888_sse41 LABEL PROC
DB 102,65,15,58,34,28,128,1 ; pinsrd $0x1,(%r8,%rax,4),%xmm3
DB 102,67,15,58,34,28,152,2 ; pinsrd $0x2,(%r8,%r11,4),%xmm3
DB 102,67,15,58,34,28,144,3 ; pinsrd $0x3,(%r8,%r10,4),%xmm3
- DB 102,15,111,5,25,108,1,0 ; movdqa 0x16c19(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,5,39,108,1,0 ; movdqa 0x16c27(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,90,109,1,0 ; movaps 0x16d5a(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,5,104,109,1,0 ; movaps 0x16d68(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,9,108,1,0 ; pshufb 0x16c09(%rip),%xmm1 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
+ DB 102,15,56,0,13,23,108,1,0 ; pshufb 0x16c17(%rip),%xmm1 # 2d580 <_sk_overlay_sse2_8bit+0x1028>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,5,108,1,0 ; pshufb 0x16c05(%rip),%xmm2 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
+ DB 102,15,56,0,21,19,108,1,0 ; pshufb 0x16c13(%rip),%xmm2 # 2d590 <_sk_overlay_sse2_8bit+0x1038>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -21170,7 +21166,7 @@ _sk_store_8888_sse41 LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,223,107,1,0 ; movaps 0x16bdf(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
+ DB 68,15,40,5,237,107,1,0 ; movaps 0x16bed(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1048>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -21189,23 +21185,23 @@ _sk_store_8888_sse41 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 16a21 <_sk_store_8888_sse41+0x7f>
+ DB 117,10 ; jne 16a13 <_sk_store_8888_sse41+0x7f>
DB 243,69,15,127,4,128 ; movdqu %xmm8,(%r8,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,29 ; je 16a4b <_sk_store_8888_sse41+0xa9>
+ DB 116,29 ; je 16a3d <_sk_store_8888_sse41+0xa9>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,15 ; je 16a43 <_sk_store_8888_sse41+0xa1>
+ DB 116,15 ; je 16a35 <_sk_store_8888_sse41+0xa1>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,227 ; jne 16a1d <_sk_store_8888_sse41+0x7b>
+ DB 117,227 ; jne 16a0f <_sk_store_8888_sse41+0x7b>
DB 102,69,15,58,22,68,128,8,2 ; pextrd $0x2,%xmm8,0x8(%r8,%rax,4)
DB 102,69,15,214,4,128 ; movq %xmm8,(%r8,%rax,4)
- DB 235,210 ; jmp 16a1d <_sk_store_8888_sse41+0x7b>
+ DB 235,210 ; jmp 16a0f <_sk_store_8888_sse41+0x7b>
DB 102,69,15,126,4,128 ; movd %xmm8,(%r8,%rax,4)
- DB 235,202 ; jmp 16a1d <_sk_store_8888_sse41+0x7b>
+ DB 235,202 ; jmp 16a0f <_sk_store_8888_sse41+0x7b>
PUBLIC _sk_load_bgra_sse41
_sk_load_bgra_sse41 LABEL PROC
@@ -21217,19 +21213,19 @@ _sk_load_bgra_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 117,89 ; jne 16ac8 <_sk_load_bgra_sse41+0x75>
+ DB 117,89 ; jne 16aba <_sk_load_bgra_sse41+0x75>
DB 243,65,15,111,28,128 ; movdqu (%r8,%rax,4),%xmm3
- DB 102,15,111,5,243,106,1,0 ; movdqa 0x16af3(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,5,1,107,1,0 ; movdqa 0x16b01(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2
- DB 68,15,40,5,52,108,1,0 ; movaps 0x16c34(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,5,66,108,1,0 ; movaps 0x16c42(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,227,106,1,0 ; pshufb 0x16ae3(%rip),%xmm0 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
+ DB 102,15,56,0,5,241,106,1,0 ; pshufb 0x16af1(%rip),%xmm0 # 2d580 <_sk_overlay_sse2_8bit+0x1028>
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,223,106,1,0 ; pshufb 0x16adf(%rip),%xmm0 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
+ DB 102,15,56,0,5,237,106,1,0 ; pshufb 0x16aed(%rip),%xmm0 # 2d590 <_sk_overlay_sse2_8bit+0x1038>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -21240,19 +21236,19 @@ _sk_load_bgra_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,45 ; je 16b02 <_sk_load_bgra_sse41+0xaf>
+ DB 116,45 ; je 16af4 <_sk_load_bgra_sse41+0xaf>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 16af1 <_sk_load_bgra_sse41+0x9e>
+ DB 116,18 ; je 16ae3 <_sk_load_bgra_sse41+0x9e>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,144 ; jne 16a75 <_sk_load_bgra_sse41+0x22>
+ DB 117,144 ; jne 16a67 <_sk_load_bgra_sse41+0x22>
DB 102,65,15,110,68,128,8 ; movd 0x8(%r8,%rax,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 243,65,15,126,4,128 ; movq (%r8,%rax,4),%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,115,255,255,255 ; jmpq 16a75 <_sk_load_bgra_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 16a67 <_sk_load_bgra_sse41+0x22>
DB 102,65,15,110,28,128 ; movd (%r8,%rax,4),%xmm3
- DB 233,104,255,255,255 ; jmpq 16a75 <_sk_load_bgra_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 16a67 <_sk_load_bgra_sse41+0x22>
PUBLIC _sk_load_bgra_dst_sse41
_sk_load_bgra_dst_sse41 LABEL PROC
@@ -21264,19 +21260,19 @@ _sk_load_bgra_dst_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 117,89 ; jne 16b82 <_sk_load_bgra_dst_sse41+0x75>
+ DB 117,89 ; jne 16b74 <_sk_load_bgra_dst_sse41+0x75>
DB 243,65,15,111,60,128 ; movdqu (%r8,%rax,4),%xmm7
- DB 102,15,111,37,57,106,1,0 ; movdqa 0x16a39(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,37,71,106,1,0 ; movdqa 0x16a47(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,244 ; cvtdq2ps %xmm4,%xmm6
- DB 68,15,40,5,122,107,1,0 ; movaps 0x16b7a(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,5,136,107,1,0 ; movaps 0x16b88(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,56,0,37,41,106,1,0 ; pshufb 0x16a29(%rip),%xmm4 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
+ DB 102,15,56,0,37,55,106,1,0 ; pshufb 0x16a37(%rip),%xmm4 # 2d580 <_sk_overlay_sse2_8bit+0x1028>
DB 15,91,236 ; cvtdq2ps %xmm4,%xmm5
DB 65,15,89,232 ; mulps %xmm8,%xmm5
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,56,0,37,37,106,1,0 ; pshufb 0x16a25(%rip),%xmm4 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
+ DB 102,15,56,0,37,51,106,1,0 ; pshufb 0x16a33(%rip),%xmm4 # 2d590 <_sk_overlay_sse2_8bit+0x1038>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
@@ -21287,19 +21283,19 @@ _sk_load_bgra_dst_sse41 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,45 ; je 16bbc <_sk_load_bgra_dst_sse41+0xaf>
+ DB 116,45 ; je 16bae <_sk_load_bgra_dst_sse41+0xaf>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 16bab <_sk_load_bgra_dst_sse41+0x9e>
+ DB 116,18 ; je 16b9d <_sk_load_bgra_dst_sse41+0x9e>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,144 ; jne 16b2f <_sk_load_bgra_dst_sse41+0x22>
+ DB 117,144 ; jne 16b21 <_sk_load_bgra_dst_sse41+0x22>
DB 102,65,15,110,100,128,8 ; movd 0x8(%r8,%rax,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 243,65,15,126,36,128 ; movq (%r8,%rax,4),%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,115,255,255,255 ; jmpq 16b2f <_sk_load_bgra_dst_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 16b21 <_sk_load_bgra_dst_sse41+0x22>
DB 102,65,15,110,60,128 ; movd (%r8,%rax,4),%xmm7
- DB 233,104,255,255,255 ; jmpq 16b2f <_sk_load_bgra_dst_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 16b21 <_sk_load_bgra_dst_sse41+0x22>
PUBLIC _sk_gather_bgra_sse41
_sk_gather_bgra_sse41 LABEL PROC
@@ -21321,17 +21317,17 @@ _sk_gather_bgra_sse41 LABEL PROC
DB 102,65,15,58,34,28,128,1 ; pinsrd $0x1,(%r8,%rax,4),%xmm3
DB 102,67,15,58,34,28,152,2 ; pinsrd $0x2,(%r8,%r11,4),%xmm3
DB 102,67,15,58,34,28,144,3 ; pinsrd $0x3,(%r8,%r10,4),%xmm3
- DB 102,15,111,5,73,105,1,0 ; movdqa 0x16949(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,5,87,105,1,0 ; movdqa 0x16957(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2
- DB 68,15,40,5,138,106,1,0 ; movaps 0x16a8a(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,5,152,106,1,0 ; movaps 0x16a98(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,57,105,1,0 ; pshufb 0x16939(%rip),%xmm0 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
+ DB 102,15,56,0,5,71,105,1,0 ; pshufb 0x16947(%rip),%xmm0 # 2d580 <_sk_overlay_sse2_8bit+0x1028>
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,53,105,1,0 ; pshufb 0x16935(%rip),%xmm0 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
+ DB 102,15,56,0,5,67,105,1,0 ; pshufb 0x16943(%rip),%xmm0 # 2d590 <_sk_overlay_sse2_8bit+0x1038>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -21349,7 +21345,7 @@ _sk_store_bgra_sse41 LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,15,105,1,0 ; movaps 0x1690f(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
+ DB 68,15,40,5,29,105,1,0 ; movaps 0x1691d(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1048>
DB 68,15,40,202 ; movaps %xmm2,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -21368,23 +21364,23 @@ _sk_store_bgra_sse41 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 16cf1 <_sk_store_bgra_sse41+0x7f>
+ DB 117,10 ; jne 16ce3 <_sk_store_bgra_sse41+0x7f>
DB 243,69,15,127,4,128 ; movdqu %xmm8,(%r8,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,29 ; je 16d1b <_sk_store_bgra_sse41+0xa9>
+ DB 116,29 ; je 16d0d <_sk_store_bgra_sse41+0xa9>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,15 ; je 16d13 <_sk_store_bgra_sse41+0xa1>
+ DB 116,15 ; je 16d05 <_sk_store_bgra_sse41+0xa1>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,227 ; jne 16ced <_sk_store_bgra_sse41+0x7b>
+ DB 117,227 ; jne 16cdf <_sk_store_bgra_sse41+0x7b>
DB 102,69,15,58,22,68,128,8,2 ; pextrd $0x2,%xmm8,0x8(%r8,%rax,4)
DB 102,69,15,214,4,128 ; movq %xmm8,(%r8,%rax,4)
- DB 235,210 ; jmp 16ced <_sk_store_bgra_sse41+0x7b>
+ DB 235,210 ; jmp 16cdf <_sk_store_bgra_sse41+0x7b>
DB 102,69,15,126,4,128 ; movd %xmm8,(%r8,%rax,4)
- DB 235,202 ; jmp 16ced <_sk_store_bgra_sse41+0x7b>
+ DB 235,202 ; jmp 16cdf <_sk_store_bgra_sse41+0x7b>
PUBLIC _sk_load_f16_sse41
_sk_load_f16_sse41 LABEL PROC
@@ -21396,7 +21392,7 @@ _sk_load_f16_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,62,1,0,0 ; jne 16e81 <_sk_load_f16_sse41+0x15e>
+ DB 15,133,62,1,0,0 ; jne 16e73 <_sk_load_f16_sse41+0x15e>
DB 102,65,15,16,4,192 ; movupd (%r8,%rax,8),%xmm0
DB 243,65,15,111,76,192,16 ; movdqu 0x10(%r8,%rax,8),%xmm1
DB 102,68,15,40,200 ; movapd %xmm0,%xmm9
@@ -21406,18 +21402,18 @@ _sk_load_f16_sse41 LABEL PROC
DB 102,68,15,97,216 ; punpcklwd %xmm0,%xmm11
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,20,108,1,0 ; movdqa 0x16c14(%rip),%xmm8 # 2d990 <_sk_overlay_sse2_8bit+0x1424>
+ DB 102,68,15,111,5,34,108,1,0 ; movdqa 0x16c22(%rip),%xmm8 # 2d990 <_sk_overlay_sse2_8bit+0x1438>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,15,108,1,0 ; movdqa 0x16c0f(%rip),%xmm3 # 2d9a0 <_sk_overlay_sse2_8bit+0x1434>
+ DB 102,15,111,29,29,108,1,0 ; movdqa 0x16c1d(%rip),%xmm3 # 2d9a0 <_sk_overlay_sse2_8bit+0x1448>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,251,107,1,0 ; movdqa 0x16bfb(%rip),%xmm10 # 2d9b0 <_sk_overlay_sse2_8bit+0x1444>
+ DB 102,68,15,111,21,9,108,1,0 ; movdqa 0x16c09(%rip),%xmm10 # 2d9b0 <_sk_overlay_sse2_8bit+0x1458>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -21460,16 +21456,16 @@ _sk_load_f16_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,192 ; movsd (%r8,%rax,8),%xmm0
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,13 ; jne 16e9a <_sk_load_f16_sse41+0x177>
+ DB 117,13 ; jne 16e8c <_sk_load_f16_sse41+0x177>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,182,254,255,255 ; jmpq 16d50 <_sk_load_f16_sse41+0x2d>
+ DB 233,182,254,255,255 ; jmpq 16d42 <_sk_load_f16_sse41+0x2d>
DB 102,65,15,22,68,192,8 ; movhpd 0x8(%r8,%rax,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 15,130,161,254,255,255 ; jb 16d50 <_sk_load_f16_sse41+0x2d>
+ DB 15,130,161,254,255,255 ; jb 16d42 <_sk_load_f16_sse41+0x2d>
DB 243,65,15,126,76,192,16 ; movq 0x10(%r8,%rax,8),%xmm1
- DB 233,149,254,255,255 ; jmpq 16d50 <_sk_load_f16_sse41+0x2d>
+ DB 233,149,254,255,255 ; jmpq 16d42 <_sk_load_f16_sse41+0x2d>
PUBLIC _sk_load_f16_dst_sse41
_sk_load_f16_dst_sse41 LABEL PROC
@@ -21481,7 +21477,7 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,62,1,0,0 ; jne 17019 <_sk_load_f16_dst_sse41+0x15e>
+ DB 15,133,62,1,0,0 ; jne 1700b <_sk_load_f16_dst_sse41+0x15e>
DB 102,65,15,16,36,192 ; movupd (%r8,%rax,8),%xmm4
DB 243,65,15,111,108,192,16 ; movdqu 0x10(%r8,%rax,8),%xmm5
DB 102,68,15,40,204 ; movapd %xmm4,%xmm9
@@ -21491,18 +21487,18 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 102,68,15,97,220 ; punpcklwd %xmm4,%xmm11
DB 102,68,15,105,204 ; punpckhwd %xmm4,%xmm9
DB 102,65,15,56,51,235 ; pmovzxwd %xmm11,%xmm5
- DB 102,68,15,111,5,124,106,1,0 ; movdqa 0x16a7c(%rip),%xmm8 # 2d990 <_sk_overlay_sse2_8bit+0x1424>
+ DB 102,68,15,111,5,138,106,1,0 ; movdqa 0x16a8a(%rip),%xmm8 # 2d990 <_sk_overlay_sse2_8bit+0x1438>
DB 102,15,111,245 ; movdqa %xmm5,%xmm6
DB 102,65,15,219,240 ; pand %xmm8,%xmm6
DB 102,15,239,238 ; pxor %xmm6,%xmm5
- DB 102,15,111,61,119,106,1,0 ; movdqa 0x16a77(%rip),%xmm7 # 2d9a0 <_sk_overlay_sse2_8bit+0x1434>
+ DB 102,15,111,61,133,106,1,0 ; movdqa 0x16a85(%rip),%xmm7 # 2d9a0 <_sk_overlay_sse2_8bit+0x1448>
DB 102,15,114,246,16 ; pslld $0x10,%xmm6
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,15,56,63,231 ; pmaxud %xmm7,%xmm4
DB 102,15,118,229 ; pcmpeqd %xmm5,%xmm4
DB 102,15,114,245,13 ; pslld $0xd,%xmm5
DB 102,15,235,238 ; por %xmm6,%xmm5
- DB 102,68,15,111,21,99,106,1,0 ; movdqa 0x16a63(%rip),%xmm10 # 2d9b0 <_sk_overlay_sse2_8bit+0x1444>
+ DB 102,68,15,111,21,113,106,1,0 ; movdqa 0x16a71(%rip),%xmm10 # 2d9b0 <_sk_overlay_sse2_8bit+0x1458>
DB 102,65,15,254,234 ; paddd %xmm10,%xmm5
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -21545,16 +21541,16 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,36,192 ; movsd (%r8,%rax,8),%xmm4
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,13 ; jne 17032 <_sk_load_f16_dst_sse41+0x177>
+ DB 117,13 ; jne 17024 <_sk_load_f16_dst_sse41+0x177>
DB 243,15,126,228 ; movq %xmm4,%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
- DB 233,182,254,255,255 ; jmpq 16ee8 <_sk_load_f16_dst_sse41+0x2d>
+ DB 233,182,254,255,255 ; jmpq 16eda <_sk_load_f16_dst_sse41+0x2d>
DB 102,65,15,22,100,192,8 ; movhpd 0x8(%r8,%rax,8),%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 15,130,161,254,255,255 ; jb 16ee8 <_sk_load_f16_dst_sse41+0x2d>
+ DB 15,130,161,254,255,255 ; jb 16eda <_sk_load_f16_dst_sse41+0x2d>
DB 243,65,15,126,108,192,16 ; movq 0x10(%r8,%rax,8),%xmm5
- DB 233,149,254,255,255 ; jmpq 16ee8 <_sk_load_f16_dst_sse41+0x2d>
+ DB 233,149,254,255,255 ; jmpq 16eda <_sk_load_f16_dst_sse41+0x2d>
PUBLIC _sk_gather_f16_sse41
_sk_gather_f16_sse41 LABEL PROC
@@ -21585,18 +21581,18 @@ _sk_gather_f16_sse41 LABEL PROC
DB 102,68,15,97,218 ; punpcklwd %xmm2,%xmm11
DB 102,68,15,105,202 ; punpckhwd %xmm2,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,183,104,1,0 ; movdqa 0x168b7(%rip),%xmm8 # 2d990 <_sk_overlay_sse2_8bit+0x1424>
+ DB 102,68,15,111,5,197,104,1,0 ; movdqa 0x168c5(%rip),%xmm8 # 2d990 <_sk_overlay_sse2_8bit+0x1438>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,178,104,1,0 ; movdqa 0x168b2(%rip),%xmm3 # 2d9a0 <_sk_overlay_sse2_8bit+0x1434>
+ DB 102,15,111,29,192,104,1,0 ; movdqa 0x168c0(%rip),%xmm3 # 2d9a0 <_sk_overlay_sse2_8bit+0x1448>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,158,104,1,0 ; movdqa 0x1689e(%rip),%xmm10 # 2d9b0 <_sk_overlay_sse2_8bit+0x1444>
+ DB 102,68,15,111,21,172,104,1,0 ; movdqa 0x168ac(%rip),%xmm10 # 2d9b0 <_sk_overlay_sse2_8bit+0x1458>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -21647,17 +21643,17 @@ _sk_store_f16_sse41 LABEL PROC
DB 73,193,224,3 ; shl $0x3,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 102,68,15,111,21,194,103,1,0 ; movdqa 0x167c2(%rip),%xmm10 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
+ DB 102,68,15,111,21,208,103,1,0 ; movdqa 0x167d0(%rip),%xmm10 # 2d9c0 <_sk_overlay_sse2_8bit+0x1468>
DB 102,68,15,111,216 ; movdqa %xmm0,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,235 ; pxor %xmm11,%xmm13
- DB 102,68,15,111,13,181,103,1,0 ; movdqa 0x167b5(%rip),%xmm9 # 2d9d0 <_sk_overlay_sse2_8bit+0x1464>
+ DB 102,68,15,111,13,195,103,1,0 ; movdqa 0x167c3(%rip),%xmm9 # 2d9d0 <_sk_overlay_sse2_8bit+0x1478>
DB 102,65,15,114,211,16 ; psrld $0x10,%xmm11
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,37,166,103,1,0 ; movdqa 0x167a6(%rip),%xmm12 # 2d9e0 <_sk_overlay_sse2_8bit+0x1474>
+ DB 102,68,15,111,37,180,103,1,0 ; movdqa 0x167b4(%rip),%xmm12 # 2d9e0 <_sk_overlay_sse2_8bit+0x1488>
DB 102,69,15,235,220 ; por %xmm12,%xmm11
DB 102,69,15,254,221 ; paddd %xmm13,%xmm11
DB 102,69,15,223,195 ; pandn %xmm11,%xmm8
@@ -21701,7 +21697,7 @@ _sk_store_f16_sse41 LABEL PROC
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,69,15,98,203 ; punpckldq %xmm11,%xmm9
DB 72,133,255 ; test %rdi,%rdi
- DB 117,21 ; jne 17330 <_sk_store_f16_sse41+0x152>
+ DB 117,21 ; jne 17322 <_sk_store_f16_sse41+0x152>
DB 69,15,17,12,192 ; movups %xmm9,(%r8,%rax,8)
DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8
DB 243,69,15,127,68,192,16 ; movdqu %xmm8,0x10(%r8,%rax,8)
@@ -21709,13 +21705,13 @@ _sk_store_f16_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,12,192 ; movq %xmm9,(%r8,%rax,8)
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,240 ; je 1732c <_sk_store_f16_sse41+0x14e>
+ DB 116,240 ; je 1731e <_sk_store_f16_sse41+0x14e>
DB 102,69,15,23,76,192,8 ; movhpd %xmm9,0x8(%r8,%rax,8)
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,227 ; jb 1732c <_sk_store_f16_sse41+0x14e>
+ DB 114,227 ; jb 1731e <_sk_store_f16_sse41+0x14e>
DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8
DB 102,69,15,214,68,192,16 ; movq %xmm8,0x10(%r8,%rax,8)
- DB 235,213 ; jmp 1732c <_sk_store_f16_sse41+0x14e>
+ DB 235,213 ; jmp 1731e <_sk_store_f16_sse41+0x14e>
PUBLIC _sk_load_u16_be_sse41
_sk_load_u16_be_sse41 LABEL PROC
@@ -21728,7 +21724,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 73,99,193 ; movslq %r9d,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,185,0,0,0 ; jne 17437 <_sk_load_u16_be_sse41+0xe0>
+ DB 15,133,185,0,0,0 ; jne 17429 <_sk_load_u16_be_sse41+0xe0>
DB 102,65,15,16,4,64 ; movupd (%r8,%rax,2),%xmm0
DB 243,65,15,111,76,64,16 ; movdqu 0x10(%r8,%rax,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -21744,7 +21740,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,134,99,1,0 ; movaps 0x16386(%rip),%xmm8 # 2d750 <_sk_overlay_sse2_8bit+0x11e4>
+ DB 68,15,40,5,148,99,1,0 ; movaps 0x16394(%rip),%xmm8 # 2d750 <_sk_overlay_sse2_8bit+0x11f8>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -21772,16 +21768,16 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,64 ; movsd (%r8,%rax,2),%xmm0
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,13 ; jne 17450 <_sk_load_u16_be_sse41+0xf9>
+ DB 117,13 ; jne 17442 <_sk_load_u16_be_sse41+0xf9>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,59,255,255,255 ; jmpq 1738b <_sk_load_u16_be_sse41+0x34>
+ DB 233,59,255,255,255 ; jmpq 1737d <_sk_load_u16_be_sse41+0x34>
DB 102,65,15,22,68,64,8 ; movhpd 0x8(%r8,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 15,130,38,255,255,255 ; jb 1738b <_sk_load_u16_be_sse41+0x34>
+ DB 15,130,38,255,255,255 ; jb 1737d <_sk_load_u16_be_sse41+0x34>
DB 243,65,15,126,76,64,16 ; movq 0x10(%r8,%rax,2),%xmm1
- DB 233,26,255,255,255 ; jmpq 1738b <_sk_load_u16_be_sse41+0x34>
+ DB 233,26,255,255,255 ; jmpq 1737d <_sk_load_u16_be_sse41+0x34>
PUBLIC _sk_load_rgb_u16_be_sse41
_sk_load_rgb_u16_be_sse41 LABEL PROC
@@ -21796,7 +21792,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,170,0,0,0 ; jne 17546 <_sk_load_rgb_u16_be_sse41+0xd5>
+ DB 15,133,170,0,0,0 ; jne 17538 <_sk_load_rgb_u16_be_sse41+0xd5>
DB 243,65,15,111,20,64 ; movdqu (%r8,%rax,2),%xmm2
DB 243,65,15,111,92,64,8 ; movdqu 0x8(%r8,%rax,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -21816,7 +21812,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,85,98,1,0 ; movaps 0x16255(%rip),%xmm8 # 2d750 <_sk_overlay_sse2_8bit+0x11e4>
+ DB 68,15,40,5,99,98,1,0 ; movaps 0x16263(%rip),%xmm8 # 2d750 <_sk_overlay_sse2_8bit+0x11f8>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -21833,27 +21829,27 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,124,95,1,0 ; movaps 0x15f7c(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,138,95,1,0 ; movaps 0x15f8a(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,64 ; movd (%r8,%rax,2),%xmm2
DB 102,65,15,196,84,64,4,2 ; pinsrw $0x2,0x4(%r8,%rax,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,13 ; jne 1756b <_sk_load_rgb_u16_be_sse41+0xfa>
+ DB 117,13 ; jne 1755d <_sk_load_rgb_u16_be_sse41+0xfa>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,85,255,255,255 ; jmpq 174c0 <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,85,255,255,255 ; jmpq 174b2 <_sk_load_rgb_u16_be_sse41+0x4f>
DB 102,65,15,110,68,64,6 ; movd 0x6(%r8,%rax,2),%xmm0
DB 102,65,15,196,68,64,10,2 ; pinsrw $0x2,0xa(%r8,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,24 ; jb 1759c <_sk_load_rgb_u16_be_sse41+0x12b>
+ DB 114,24 ; jb 1758e <_sk_load_rgb_u16_be_sse41+0x12b>
DB 102,65,15,110,92,64,12 ; movd 0xc(%r8,%rax,2),%xmm3
DB 102,65,15,196,92,64,16,2 ; pinsrw $0x2,0x10(%r8,%rax,2),%xmm3
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,36,255,255,255 ; jmpq 174c0 <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,36,255,255,255 ; jmpq 174b2 <_sk_load_rgb_u16_be_sse41+0x4f>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,27,255,255,255 ; jmpq 174c0 <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,27,255,255,255 ; jmpq 174b2 <_sk_load_rgb_u16_be_sse41+0x4f>
PUBLIC _sk_store_u16_be_sse41
_sk_store_u16_be_sse41 LABEL PROC
@@ -21865,7 +21861,7 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 73,99,193 ; movslq %r9d,%rax
- DB 68,15,40,21,37,100,1,0 ; movaps 0x16425(%rip),%xmm10 # 2d9f0 <_sk_overlay_sse2_8bit+0x1484>
+ DB 68,15,40,21,51,100,1,0 ; movaps 0x16433(%rip),%xmm10 # 2d9f0 <_sk_overlay_sse2_8bit+0x1498>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -21902,7 +21898,7 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10
DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,21 ; jne 17699 <_sk_store_u16_be_sse41+0xf4>
+ DB 117,21 ; jne 1768b <_sk_store_u16_be_sse41+0xf4>
DB 69,15,17,20,64 ; movups %xmm10,(%r8,%rax,2)
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 243,69,15,127,68,64,16 ; movdqu %xmm8,0x10(%r8,%rax,2)
@@ -21910,13 +21906,13 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,20,64 ; movq %xmm10,(%r8,%rax,2)
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,240 ; je 17695 <_sk_store_u16_be_sse41+0xf0>
+ DB 116,240 ; je 17687 <_sk_store_u16_be_sse41+0xf0>
DB 102,69,15,23,84,64,8 ; movhpd %xmm10,0x8(%r8,%rax,2)
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,227 ; jb 17695 <_sk_store_u16_be_sse41+0xf0>
+ DB 114,227 ; jb 17687 <_sk_store_u16_be_sse41+0xf0>
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 102,69,15,214,68,64,16 ; movq %xmm8,0x10(%r8,%rax,2)
- DB 235,213 ; jmp 17695 <_sk_store_u16_be_sse41+0xf0>
+ DB 235,213 ; jmp 17687 <_sk_store_u16_be_sse41+0xf0>
PUBLIC _sk_load_f32_sse41
_sk_load_f32_sse41 LABEL PROC
@@ -21930,7 +21926,7 @@ _sk_load_f32_sse41 LABEL PROC
DB 73,99,193 ; movslq %r9d,%rax
DB 69,15,16,4,128 ; movups (%r8,%rax,4),%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,66 ; jne 1772b <_sk_load_f32_sse41+0x6b>
+ DB 117,66 ; jne 1771d <_sk_load_f32_sse41+0x6b>
DB 65,15,16,68,128,16 ; movups 0x10(%r8,%rax,4),%xmm0
DB 65,15,16,92,128,32 ; movups 0x20(%r8,%rax,4),%xmm3
DB 69,15,16,76,128,48 ; movups 0x30(%r8,%rax,4),%xmm9
@@ -21950,17 +21946,17 @@ _sk_load_f32_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,8 ; jne 1773d <_sk_load_f32_sse41+0x7d>
+ DB 117,8 ; jne 1772f <_sk_load_f32_sse41+0x7d>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 235,190 ; jmp 176fb <_sk_load_f32_sse41+0x3b>
+ DB 235,190 ; jmp 176ed <_sk_load_f32_sse41+0x3b>
DB 65,15,16,68,128,16 ; movups 0x10(%r8,%rax,4),%xmm0
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,8 ; jb 17751 <_sk_load_f32_sse41+0x91>
+ DB 114,8 ; jb 17743 <_sk_load_f32_sse41+0x91>
DB 65,15,16,92,128,32 ; movups 0x20(%r8,%rax,4),%xmm3
- DB 235,170 ; jmp 176fb <_sk_load_f32_sse41+0x3b>
+ DB 235,170 ; jmp 176ed <_sk_load_f32_sse41+0x3b>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,165 ; jmp 176fb <_sk_load_f32_sse41+0x3b>
+ DB 235,165 ; jmp 176ed <_sk_load_f32_sse41+0x3b>
PUBLIC _sk_load_f32_dst_sse41
_sk_load_f32_dst_sse41 LABEL PROC
@@ -21974,7 +21970,7 @@ _sk_load_f32_dst_sse41 LABEL PROC
DB 73,99,193 ; movslq %r9d,%rax
DB 69,15,16,4,128 ; movups (%r8,%rax,4),%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,66 ; jne 177c1 <_sk_load_f32_dst_sse41+0x6b>
+ DB 117,66 ; jne 177b3 <_sk_load_f32_dst_sse41+0x6b>
DB 65,15,16,100,128,16 ; movups 0x10(%r8,%rax,4),%xmm4
DB 65,15,16,124,128,32 ; movups 0x20(%r8,%rax,4),%xmm7
DB 69,15,16,76,128,48 ; movups 0x30(%r8,%rax,4),%xmm9
@@ -21994,17 +21990,17 @@ _sk_load_f32_dst_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,8 ; jne 177d3 <_sk_load_f32_dst_sse41+0x7d>
+ DB 117,8 ; jne 177c5 <_sk_load_f32_dst_sse41+0x7d>
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 235,190 ; jmp 17791 <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,190 ; jmp 17783 <_sk_load_f32_dst_sse41+0x3b>
DB 65,15,16,100,128,16 ; movups 0x10(%r8,%rax,4),%xmm4
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,8 ; jb 177e7 <_sk_load_f32_dst_sse41+0x91>
+ DB 114,8 ; jb 177d9 <_sk_load_f32_dst_sse41+0x91>
DB 65,15,16,124,128,32 ; movups 0x20(%r8,%rax,4),%xmm7
- DB 235,170 ; jmp 17791 <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,170 ; jmp 17783 <_sk_load_f32_dst_sse41+0x3b>
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,165 ; jmp 17791 <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,165 ; jmp 17783 <_sk_load_f32_dst_sse41+0x3b>
PUBLIC _sk_store_f32_sse41
_sk_store_f32_sse41 LABEL PROC
@@ -22031,7 +22027,7 @@ _sk_store_f32_sse41 LABEL PROC
DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9
DB 102,69,15,17,36,128 ; movupd %xmm12,(%r8,%rax,4)
DB 72,133,255 ; test %rdi,%rdi
- DB 117,29 ; jne 17869 <_sk_store_f32_sse41+0x7d>
+ DB 117,29 ; jne 1785b <_sk_store_f32_sse41+0x7d>
DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10
DB 69,15,17,68,128,16 ; movups %xmm8,0x10(%r8,%rax,4)
DB 102,69,15,17,76,128,32 ; movupd %xmm9,0x20(%r8,%rax,4)
@@ -22039,12 +22035,12 @@ _sk_store_f32_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,246 ; je 17865 <_sk_store_f32_sse41+0x79>
+ DB 116,246 ; je 17857 <_sk_store_f32_sse41+0x79>
DB 69,15,17,68,128,16 ; movups %xmm8,0x10(%r8,%rax,4)
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,234 ; jb 17865 <_sk_store_f32_sse41+0x79>
+ DB 114,234 ; jb 17857 <_sk_store_f32_sse41+0x79>
DB 102,69,15,17,76,128,32 ; movupd %xmm9,0x20(%r8,%rax,4)
- DB 235,225 ; jmp 17865 <_sk_store_f32_sse41+0x79>
+ DB 235,225 ; jmp 17857 <_sk_store_f32_sse41+0x79>
PUBLIC _sk_clamp_x_sse41
_sk_clamp_x_sse41 LABEL PROC
@@ -22124,7 +22120,7 @@ _sk_mirror_x_sse41 LABEL PROC
DB 65,15,92,194 ; subps %xmm10,%xmm0
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,71,80,1,0 ; mulss 0x15047(%rip),%xmm9 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 243,68,15,89,13,37,89,1,0 ; mulss 0x15925(%rip),%xmm9 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -22153,7 +22149,7 @@ _sk_mirror_y_sse41 LABEL PROC
DB 65,15,92,202 ; subps %xmm10,%xmm1
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,213,79,1,0 ; mulss 0x14fd5(%rip),%xmm9 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 243,68,15,89,13,179,88,1,0 ; mulss 0x158b3(%rip),%xmm9 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,201 ; mulps %xmm1,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -22176,7 +22172,7 @@ PUBLIC _sk_clamp_x_1_sse41
_sk_clamp_x_1_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,104,90,1,0 ; minps 0x15a68(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,93,5,118,90,1,0 ; minps 0x15a76(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -22190,9 +22186,9 @@ _sk_repeat_x_1_sse41 LABEL PROC
PUBLIC _sk_mirror_x_1_sse41
_sk_mirror_x_1_sse41 LABEL PROC
- DB 68,15,40,5,169,90,1,0 ; movaps 0x15aa9(%rip),%xmm8 # 2d520 <_sk_overlay_sse2_8bit+0xfb4>
+ DB 68,15,40,5,183,90,1,0 ; movaps 0x15ab7(%rip),%xmm8 # 2d520 <_sk_overlay_sse2_8bit+0xfc8>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,29,90,1,0 ; movaps 0x15a1d(%rip),%xmm9 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,40,13,59,90,1,0 ; movaps 0x15a3b(%rip),%xmm9 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
DB 69,15,88,201 ; addps %xmm9,%xmm9
@@ -22207,10 +22203,10 @@ _sk_mirror_x_1_sse41 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse41
_sk_luminance_to_alpha_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,76,95,1,0 ; mulps 0x15f4c(%rip),%xmm0 # 2da00 <_sk_overlay_sse2_8bit+0x1494>
- DB 15,89,13,85,95,1,0 ; mulps 0x15f55(%rip),%xmm1 # 2da10 <_sk_overlay_sse2_8bit+0x14a4>
+ DB 15,89,5,90,95,1,0 ; mulps 0x15f5a(%rip),%xmm0 # 2da00 <_sk_overlay_sse2_8bit+0x14a8>
+ DB 15,89,13,99,95,1,0 ; mulps 0x15f63(%rip),%xmm1 # 2da10 <_sk_overlay_sse2_8bit+0x14b8>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,91,95,1,0 ; mulps 0x15f5b(%rip),%xmm3 # 2da20 <_sk_overlay_sse2_8bit+0x14b4>
+ DB 15,89,29,105,95,1,0 ; mulps 0x15f69(%rip),%xmm3 # 2da20 <_sk_overlay_sse2_8bit+0x14c8>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -22506,9 +22502,9 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 76,139,112,8 ; mov 0x8(%rax),%r14
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js 17f65 <_sk_evenly_spaced_gradient_sse41+0x18>
+ DB 120,7 ; js 17f57 <_sk_evenly_spaced_gradient_sse41+0x18>
DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1
- DB 235,21 ; jmp 17f7a <_sk_evenly_spaced_gradient_sse41+0x2d>
+ DB 235,21 ; jmp 17f6c <_sk_evenly_spaced_gradient_sse41+0x2d>
DB 73,137,216 ; mov %rbx,%r8
DB 73,209,232 ; shr %r8
DB 131,227,1 ; and $0x1,%ebx
@@ -22595,15 +22591,15 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse41
_sk_gauss_a_to_rgba_sse41 LABEL PROC
- DB 15,40,5,10,89,1,0 ; movaps 0x1590a(%rip),%xmm0 # 2da30 <_sk_overlay_sse2_8bit+0x14c4>
+ DB 15,40,5,24,89,1,0 ; movaps 0x15918(%rip),%xmm0 # 2da30 <_sk_overlay_sse2_8bit+0x14d8>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,16,89,1,0 ; addps 0x15910(%rip),%xmm0 # 2da40 <_sk_overlay_sse2_8bit+0x14d4>
+ DB 15,88,5,30,89,1,0 ; addps 0x1591e(%rip),%xmm0 # 2da40 <_sk_overlay_sse2_8bit+0x14e8>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,22,89,1,0 ; addps 0x15916(%rip),%xmm0 # 2da50 <_sk_overlay_sse2_8bit+0x14e4>
+ DB 15,88,5,36,89,1,0 ; addps 0x15924(%rip),%xmm0 # 2da50 <_sk_overlay_sse2_8bit+0x14f8>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,28,89,1,0 ; addps 0x1591c(%rip),%xmm0 # 2da60 <_sk_overlay_sse2_8bit+0x14f4>
+ DB 15,88,5,42,89,1,0 ; addps 0x1592a(%rip),%xmm0 # 2da60 <_sk_overlay_sse2_8bit+0x1508>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,34,89,1,0 ; addps 0x15922(%rip),%xmm0 # 2da70 <_sk_overlay_sse2_8bit+0x1504>
+ DB 15,88,5,48,89,1,0 ; addps 0x15930(%rip),%xmm0 # 2da70 <_sk_overlay_sse2_8bit+0x1518>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -22616,12 +22612,12 @@ _sk_gradient_sse41 LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,2 ; cmp $0x2,%r8
- DB 114,51 ; jb 1819d <_sk_gradient_sse41+0x42>
+ DB 114,51 ; jb 1818f <_sk_gradient_sse41+0x42>
DB 76,139,72,72 ; mov 0x48(%rax),%r9
DB 73,255,200 ; dec %r8
DB 73,131,193,4 ; add $0x4,%r9
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,80,83,1,0 ; movaps 0x15350(%rip),%xmm2 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 15,40,21,94,83,1,0 ; movaps 0x1535e(%rip),%xmm2 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 243,65,15,16,25 ; movss (%r9),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -22629,7 +22625,7 @@ _sk_gradient_sse41 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 73,131,193,4 ; add $0x4,%r9
DB 73,255,200 ; dec %r8
- DB 117,227 ; jne 18180 <_sk_gradient_sse41+0x25>
+ DB 117,227 ; jne 18172 <_sk_gradient_sse41+0x25>
DB 65,86 ; push %r14
DB 83 ; push %rbx
DB 102,73,15,58,22,200,1 ; pextrq $0x1,%xmm1,%r8
@@ -22756,26 +22752,26 @@ _sk_xy_to_unit_angle_sse41 LABEL PROC
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,237 ; mulps %xmm13,%xmm13
- DB 68,15,40,21,143,86,1,0 ; movaps 0x1568f(%rip),%xmm10 # 2da80 <_sk_overlay_sse2_8bit+0x1514>
+ DB 68,15,40,21,157,86,1,0 ; movaps 0x1569d(%rip),%xmm10 # 2da80 <_sk_overlay_sse2_8bit+0x1528>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,147,86,1,0 ; addps 0x15693(%rip),%xmm10 # 2da90 <_sk_overlay_sse2_8bit+0x1524>
+ DB 68,15,88,21,161,86,1,0 ; addps 0x156a1(%rip),%xmm10 # 2da90 <_sk_overlay_sse2_8bit+0x1538>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,151,86,1,0 ; addps 0x15697(%rip),%xmm10 # 2daa0 <_sk_overlay_sse2_8bit+0x1534>
+ DB 68,15,88,21,165,86,1,0 ; addps 0x156a5(%rip),%xmm10 # 2daa0 <_sk_overlay_sse2_8bit+0x1548>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,155,86,1,0 ; addps 0x1569b(%rip),%xmm10 # 2dab0 <_sk_overlay_sse2_8bit+0x1544>
+ DB 68,15,88,21,169,86,1,0 ; addps 0x156a9(%rip),%xmm10 # 2dab0 <_sk_overlay_sse2_8bit+0x1558>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 68,15,40,29,154,86,1,0 ; movaps 0x1569a(%rip),%xmm11 # 2dac0 <_sk_overlay_sse2_8bit+0x1554>
+ DB 68,15,40,29,168,86,1,0 ; movaps 0x156a8(%rip),%xmm11 # 2dac0 <_sk_overlay_sse2_8bit+0x1568>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,40,29,99,80,1,0 ; movaps 0x15063(%rip),%xmm11 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,40,29,129,80,1,0 ; movaps 0x15081(%rip),%xmm11 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,194,192,1 ; cmpltps %xmm8,%xmm0
- DB 68,15,40,13,101,80,1,0 ; movaps 0x15065(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,13,115,80,1,0 ; movaps 0x15073(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 102,69,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm10
DB 69,15,194,194,7 ; cmpordps %xmm10,%xmm8
@@ -22805,7 +22801,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,14,86,1,0 ; mulps 0x1560e(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1564>
+ DB 68,15,89,13,28,86,1,0 ; mulps 0x1561c(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1578>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -22813,7 +22809,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,249,85,1,0 ; mulps 0x155f9(%rip),%xmm10 # 2dae0 <_sk_overlay_sse2_8bit+0x1574>
+ DB 68,15,89,21,7,86,1,0 ; mulps 0x15607(%rip),%xmm10 # 2dae0 <_sk_overlay_sse2_8bit+0x1588>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -22822,8 +22818,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,177,84,1,0 ; xorps 0x154b1(%rip),%xmm9 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
- DB 68,15,89,5,137,79,1,0 ; mulps 0x14f89(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,87,13,191,84,1,0 ; xorps 0x154bf(%rip),%xmm9 # 2d9c0 <_sk_overlay_sse2_8bit+0x1468>
+ DB 68,15,89,5,167,79,1,0 ; mulps 0x14fa7(%rip),%xmm8 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -22842,7 +22838,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,112,85,1,0 ; mulps 0x15570(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1564>
+ DB 68,15,89,13,126,85,1,0 ; mulps 0x1557e(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1578>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -22850,7 +22846,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,91,85,1,0 ; mulps 0x1555b(%rip),%xmm10 # 2dae0 <_sk_overlay_sse2_8bit+0x1574>
+ DB 68,15,89,21,105,85,1,0 ; mulps 0x15569(%rip),%xmm10 # 2dae0 <_sk_overlay_sse2_8bit+0x1588>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -22859,8 +22855,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,19,84,1,0 ; xorps 0x15413(%rip),%xmm9 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
- DB 68,15,89,5,235,78,1,0 ; mulps 0x14eeb(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,87,13,33,84,1,0 ; xorps 0x15421(%rip),%xmm9 # 2d9c0 <_sk_overlay_sse2_8bit+0x1468>
+ DB 68,15,89,5,9,79,1,0 ; mulps 0x14f09(%rip),%xmm8 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -22876,7 +22872,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC
DB 243,69,15,89,200 ; mulss %xmm8,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,227,84,1,0 ; mulps 0x154e3(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1564>
+ DB 68,15,89,13,241,84,1,0 ; mulps 0x154f1(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1578>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
@@ -22884,7 +22880,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC
DB 243,69,15,89,192 ; mulss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 15,87,5,175,83,1,0 ; xorps 0x153af(%rip),%xmm0 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
+ DB 15,87,5,189,83,1,0 ; xorps 0x153bd(%rip),%xmm0 # 2d9c0 <_sk_overlay_sse2_8bit+0x1468>
DB 65,15,94,193 ; divps %xmm9,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22921,7 +22917,7 @@ _sk_apply_vector_mask_sse41 LABEL PROC
PUBLIC _sk_save_xy_sse41
_sk_save_xy_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,37,78,1,0 ; movaps 0x14e25(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,40,5,67,78,1,0 ; movaps 0x14e43(%rip),%xmm8 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -22961,8 +22957,8 @@ _sk_bilinear_nx_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,231,83,1,0 ; addps 0x153e7(%rip),%xmm0 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
- DB 68,15,40,13,175,77,1,0 ; movaps 0x14daf(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,88,5,245,83,1,0 ; addps 0x153f5(%rip),%xmm0 # 2daf0 <_sk_overlay_sse2_8bit+0x1598>
+ DB 68,15,40,13,189,77,1,0 ; movaps 0x14dbd(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22973,7 +22969,7 @@ _sk_bilinear_px_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,110,77,1,0 ; addps 0x14d6e(%rip),%xmm0 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 15,88,5,140,77,1,0 ; addps 0x14d8c(%rip),%xmm0 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22983,8 +22979,8 @@ _sk_bilinear_ny_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,160,83,1,0 ; addps 0x153a0(%rip),%xmm1 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
- DB 68,15,40,13,104,77,1,0 ; movaps 0x14d68(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,88,13,174,83,1,0 ; addps 0x153ae(%rip),%xmm1 # 2daf0 <_sk_overlay_sse2_8bit+0x1598>
+ DB 68,15,40,13,118,77,1,0 ; movaps 0x14d76(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22995,7 +22991,7 @@ _sk_bilinear_py_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,38,77,1,0 ; addps 0x14d26(%rip),%xmm1 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 15,88,13,68,77,1,0 ; addps 0x14d44(%rip),%xmm1 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -23005,13 +23001,13 @@ _sk_bicubic_n3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,105,83,1,0 ; addps 0x15369(%rip),%xmm0 # 2db00 <_sk_overlay_sse2_8bit+0x1594>
- DB 68,15,40,13,33,77,1,0 ; movaps 0x14d21(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,88,5,119,83,1,0 ; addps 0x15377(%rip),%xmm0 # 2db00 <_sk_overlay_sse2_8bit+0x15a8>
+ DB 68,15,40,13,47,77,1,0 ; movaps 0x14d2f(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,93,83,1,0 ; mulps 0x1535d(%rip),%xmm9 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
- DB 68,15,88,13,245,78,1,0 ; addps 0x14ef5(%rip),%xmm9 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
+ DB 68,15,89,13,107,83,1,0 ; mulps 0x1536b(%rip),%xmm9 # 2db10 <_sk_overlay_sse2_8bit+0x15b8>
+ DB 68,15,88,13,3,79,1,0 ; addps 0x14f03(%rip),%xmm9 # 2d6b0 <_sk_overlay_sse2_8bit+0x1158>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -23022,16 +23018,16 @@ _sk_bicubic_n1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,20,83,1,0 ; addps 0x15314(%rip),%xmm0 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
- DB 68,15,40,13,220,76,1,0 ; movaps 0x14cdc(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,88,5,34,83,1,0 ; addps 0x15322(%rip),%xmm0 # 2daf0 <_sk_overlay_sse2_8bit+0x1598>
+ DB 68,15,40,13,234,76,1,0 ; movaps 0x14cea(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,48,83,1,0 ; movaps 0x15330(%rip),%xmm8 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
+ DB 68,15,40,5,62,83,1,0 ; movaps 0x1533e(%rip),%xmm8 # 2db20 <_sk_overlay_sse2_8bit+0x15c8>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,52,83,1,0 ; addps 0x15334(%rip),%xmm8 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
+ DB 68,15,88,5,66,83,1,0 ; addps 0x15342(%rip),%xmm8 # 2db30 <_sk_overlay_sse2_8bit+0x15d8>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,152,76,1,0 ; addps 0x14c98(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,88,5,182,76,1,0 ; addps 0x14cb6(%rip),%xmm8 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,44,83,1,0 ; addps 0x1532c(%rip),%xmm8 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
+ DB 68,15,88,5,58,83,1,0 ; addps 0x1533a(%rip),%xmm8 # 2db40 <_sk_overlay_sse2_8bit+0x15e8>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -23039,17 +23035,17 @@ _sk_bicubic_n1x_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse41
_sk_bicubic_p1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,118,76,1,0 ; movaps 0x14c76(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,40,5,148,76,1,0 ; movaps 0x14c94(%rip),%xmm8 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,226,82,1,0 ; movaps 0x152e2(%rip),%xmm10 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
+ DB 68,15,40,21,240,82,1,0 ; movaps 0x152f0(%rip),%xmm10 # 2db20 <_sk_overlay_sse2_8bit+0x15c8>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,230,82,1,0 ; addps 0x152e6(%rip),%xmm10 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
+ DB 68,15,88,21,244,82,1,0 ; addps 0x152f4(%rip),%xmm10 # 2db30 <_sk_overlay_sse2_8bit+0x15d8>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,226,82,1,0 ; addps 0x152e2(%rip),%xmm10 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
+ DB 68,15,88,21,240,82,1,0 ; addps 0x152f0(%rip),%xmm10 # 2db40 <_sk_overlay_sse2_8bit+0x15e8>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -23059,11 +23055,11 @@ _sk_bicubic_p3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,181,82,1,0 ; addps 0x152b5(%rip),%xmm0 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
+ DB 15,88,5,195,82,1,0 ; addps 0x152c3(%rip),%xmm0 # 2db30 <_sk_overlay_sse2_8bit+0x15d8>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,133,82,1,0 ; mulps 0x15285(%rip),%xmm8 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
- DB 68,15,88,5,29,78,1,0 ; addps 0x14e1d(%rip),%xmm8 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
+ DB 68,15,89,5,147,82,1,0 ; mulps 0x15293(%rip),%xmm8 # 2db10 <_sk_overlay_sse2_8bit+0x15b8>
+ DB 68,15,88,5,43,78,1,0 ; addps 0x14e2b(%rip),%xmm8 # 2d6b0 <_sk_overlay_sse2_8bit+0x1158>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -23074,13 +23070,13 @@ _sk_bicubic_n3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,75,82,1,0 ; addps 0x1524b(%rip),%xmm1 # 2db00 <_sk_overlay_sse2_8bit+0x1594>
- DB 68,15,40,13,3,76,1,0 ; movaps 0x14c03(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,88,13,89,82,1,0 ; addps 0x15259(%rip),%xmm1 # 2db00 <_sk_overlay_sse2_8bit+0x15a8>
+ DB 68,15,40,13,17,76,1,0 ; movaps 0x14c11(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,63,82,1,0 ; mulps 0x1523f(%rip),%xmm9 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
- DB 68,15,88,13,215,77,1,0 ; addps 0x14dd7(%rip),%xmm9 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
+ DB 68,15,89,13,77,82,1,0 ; mulps 0x1524d(%rip),%xmm9 # 2db10 <_sk_overlay_sse2_8bit+0x15b8>
+ DB 68,15,88,13,229,77,1,0 ; addps 0x14de5(%rip),%xmm9 # 2d6b0 <_sk_overlay_sse2_8bit+0x1158>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -23091,16 +23087,16 @@ _sk_bicubic_n1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,245,81,1,0 ; addps 0x151f5(%rip),%xmm1 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
- DB 68,15,40,13,189,75,1,0 ; movaps 0x14bbd(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,88,13,3,82,1,0 ; addps 0x15203(%rip),%xmm1 # 2daf0 <_sk_overlay_sse2_8bit+0x1598>
+ DB 68,15,40,13,203,75,1,0 ; movaps 0x14bcb(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,17,82,1,0 ; movaps 0x15211(%rip),%xmm8 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
+ DB 68,15,40,5,31,82,1,0 ; movaps 0x1521f(%rip),%xmm8 # 2db20 <_sk_overlay_sse2_8bit+0x15c8>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,21,82,1,0 ; addps 0x15215(%rip),%xmm8 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
+ DB 68,15,88,5,35,82,1,0 ; addps 0x15223(%rip),%xmm8 # 2db30 <_sk_overlay_sse2_8bit+0x15d8>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,121,75,1,0 ; addps 0x14b79(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,88,5,151,75,1,0 ; addps 0x14b97(%rip),%xmm8 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,13,82,1,0 ; addps 0x1520d(%rip),%xmm8 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
+ DB 68,15,88,5,27,82,1,0 ; addps 0x1521b(%rip),%xmm8 # 2db40 <_sk_overlay_sse2_8bit+0x15e8>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -23108,17 +23104,17 @@ _sk_bicubic_n1y_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse41
_sk_bicubic_p1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,87,75,1,0 ; movaps 0x14b57(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,40,5,117,75,1,0 ; movaps 0x14b75(%rip),%xmm8 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,194,81,1,0 ; movaps 0x151c2(%rip),%xmm10 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
+ DB 68,15,40,21,208,81,1,0 ; movaps 0x151d0(%rip),%xmm10 # 2db20 <_sk_overlay_sse2_8bit+0x15c8>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,198,81,1,0 ; addps 0x151c6(%rip),%xmm10 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
+ DB 68,15,88,21,212,81,1,0 ; addps 0x151d4(%rip),%xmm10 # 2db30 <_sk_overlay_sse2_8bit+0x15d8>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,194,81,1,0 ; addps 0x151c2(%rip),%xmm10 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
+ DB 68,15,88,21,208,81,1,0 ; addps 0x151d0(%rip),%xmm10 # 2db40 <_sk_overlay_sse2_8bit+0x15e8>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -23128,11 +23124,11 @@ _sk_bicubic_p3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,148,81,1,0 ; addps 0x15194(%rip),%xmm1 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
+ DB 15,88,13,162,81,1,0 ; addps 0x151a2(%rip),%xmm1 # 2db30 <_sk_overlay_sse2_8bit+0x15d8>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,100,81,1,0 ; mulps 0x15164(%rip),%xmm8 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
- DB 68,15,88,5,252,76,1,0 ; addps 0x14cfc(%rip),%xmm8 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
+ DB 68,15,89,5,114,81,1,0 ; mulps 0x15172(%rip),%xmm8 # 2db10 <_sk_overlay_sse2_8bit+0x15b8>
+ DB 68,15,88,5,10,77,1,0 ; addps 0x14d0a(%rip),%xmm8 # 2d6b0 <_sk_overlay_sse2_8bit+0x1158>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -23259,10 +23255,10 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,68,15,56,64,227 ; pmulld %xmm3,%xmm12
DB 102,65,15,111,212 ; movdqa %xmm12,%xmm2
DB 102,15,254,209 ; paddd %xmm1,%xmm2
- DB 102,15,111,37,218,79,1,0 ; movdqa 0x14fda(%rip),%xmm4 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,37,232,79,1,0 ; movdqa 0x14fe8(%rip),%xmm4 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,56,64,212 ; pmulld %xmm4,%xmm2
DB 102,68,15,111,220 ; movdqa %xmm4,%xmm11
- DB 102,68,15,111,61,55,73,1,0 ; movdqa 0x14937(%rip),%xmm15 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,68,15,111,61,69,73,1,0 ; movdqa 0x14945(%rip),%xmm15 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,111,226 ; movdqa %xmm2,%xmm4
DB 102,65,15,254,231 ; paddd %xmm15,%xmm4
DB 102,73,15,58,22,224,1 ; pextrq $0x1,%xmm4,%r8
@@ -23282,7 +23278,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,65,15,58,22,209,1 ; pextrd $0x1,%xmm2,%r9d
DB 102,65,15,58,22,210,2 ; pextrd $0x2,%xmm2,%r10d
DB 102,65,15,58,22,211,3 ; pextrd $0x3,%xmm2,%r11d
- DB 102,68,15,111,13,232,72,1,0 ; movdqa 0x148e8(%rip),%xmm9 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,68,15,111,13,246,72,1,0 ; movdqa 0x148f6(%rip),%xmm9 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,65,15,254,209 ; paddd %xmm9,%xmm2
DB 102,73,15,58,22,214,1 ; pextrq $0x1,%xmm2,%r14
DB 102,72,15,126,211 ; movq %xmm2,%rbx
@@ -23296,7 +23292,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 73,193,238,32 ; shr $0x20,%r14
DB 243,66,15,16,20,176 ; movss (%rax,%r14,4),%xmm2
DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6
- DB 15,40,45,253,78,1,0 ; movaps 0x14efd(%rip),%xmm5 # 2db50 <_sk_overlay_sse2_8bit+0x15e4>
+ DB 15,40,45,11,79,1,0 ; movaps 0x14f0b(%rip),%xmm5 # 2db50 <_sk_overlay_sse2_8bit+0x15f8>
DB 68,15,88,197 ; addps %xmm5,%xmm8
DB 68,15,41,68,36,48 ; movaps %xmm8,0x30(%rsp)
DB 15,40,215 ; movaps %xmm7,%xmm2
@@ -23465,7 +23461,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,68,15,254,232 ; paddd %xmm0,%xmm13
DB 102,65,15,111,212 ; movdqa %xmm12,%xmm2
DB 102,65,15,254,213 ; paddd %xmm13,%xmm2
- DB 102,15,111,45,178,75,1,0 ; movdqa 0x14bb2(%rip),%xmm5 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,45,192,75,1,0 ; movdqa 0x14bc0(%rip),%xmm5 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,56,64,213 ; pmulld %xmm5,%xmm2
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,65,15,254,207 ; paddd %xmm15,%xmm1
@@ -23571,7 +23567,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,69,15,58,22,225,1 ; pextrd $0x1,%xmm12,%r9d
DB 102,69,15,58,22,226,2 ; pextrd $0x2,%xmm12,%r10d
DB 102,69,15,58,22,227,3 ; pextrd $0x3,%xmm12,%r11d
- DB 102,15,111,21,13,67,1,0 ; movdqa 0x1430d(%rip),%xmm2 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,111,21,27,67,1,0 ; movdqa 0x1431b(%rip),%xmm2 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,68,15,254,226 ; paddd %xmm2,%xmm12
DB 102,76,15,58,22,225,1 ; pextrq $0x1,%xmm12,%rcx
DB 102,76,15,126,227 ; movq %xmm12,%rbx
@@ -23744,8 +23740,8 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,111,197 ; movdqa %xmm13,%xmm0
DB 102,68,15,127,108,36,48 ; movdqa %xmm13,0x30(%rsp)
DB 102,15,254,193 ; paddd %xmm1,%xmm0
- DB 102,15,56,64,5,90,70,1,0 ; pmulld 0x1465a(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
- DB 102,68,15,111,29,193,63,1,0 ; movdqa 0x13fc1(%rip),%xmm11 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,56,64,5,104,70,1,0 ; pmulld 0x14668(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
+ DB 102,68,15,111,29,207,63,1,0 ; movdqa 0x13fcf(%rip),%xmm11 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,65,15,254,211 ; paddd %xmm11,%xmm2
DB 102,73,15,58,22,208,1 ; pextrq $0x1,%xmm2,%r8
@@ -23765,7 +23761,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,68,15,111,5,114,63,1,0 ; movdqa 0x13f72(%rip),%xmm8 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,68,15,111,5,128,63,1,0 ; movdqa 0x13f80(%rip),%xmm8 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,65,15,254,192 ; paddd %xmm8,%xmm0
DB 102,73,15,58,22,198,1 ; pextrq $0x1,%xmm0,%r14
DB 102,72,15,126,195 ; movq %xmm0,%rbx
@@ -23779,7 +23775,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 73,193,238,32 ; shr $0x20,%r14
DB 243,66,15,16,4,176 ; movss (%rax,%r14,4),%xmm0
DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5
- DB 15,40,53,135,69,1,0 ; movaps 0x14587(%rip),%xmm6 # 2db50 <_sk_overlay_sse2_8bit+0x15e4>
+ DB 15,40,53,149,69,1,0 ; movaps 0x14595(%rip),%xmm6 # 2db50 <_sk_overlay_sse2_8bit+0x15f8>
DB 68,15,88,214 ; addps %xmm6,%xmm10
DB 68,15,41,148,36,176,0,0,0 ; movaps %xmm10,0xb0(%rsp)
DB 15,88,254 ; addps %xmm6,%xmm7
@@ -23792,7 +23788,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,206 ; paddd %xmm6,%xmm1
DB 102,68,15,111,214 ; movdqa %xmm6,%xmm10
DB 102,68,15,127,84,36,32 ; movdqa %xmm10,0x20(%rsp)
- DB 102,15,56,64,13,82,69,1,0 ; pmulld 0x14552(%rip),%xmm1 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,56,64,13,96,69,1,0 ; pmulld 0x14560(%rip),%xmm1 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,65,15,254,227 ; paddd %xmm11,%xmm4
DB 102,73,15,58,22,230,1 ; pextrq $0x1,%xmm4,%r14
@@ -23850,11 +23846,11 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
- DB 102,15,111,5,36,68,1,0 ; movdqa 0x14424(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,5,50,68,1,0 ; movdqa 0x14432(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,56,64,200 ; pmulld %xmm0,%xmm1
DB 102,68,15,111,200 ; movdqa %xmm0,%xmm9
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
- DB 102,68,15,111,5,125,61,1,0 ; movdqa 0x13d7d(%rip),%xmm8 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,68,15,111,5,139,61,1,0 ; movdqa 0x13d8b(%rip),%xmm8 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,65,15,254,192 ; paddd %xmm8,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,197 ; movq %xmm0,%rbp
@@ -23956,7 +23952,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,68,15,111,108,36,48 ; movdqa 0x30(%rsp),%xmm13
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
- DB 102,15,111,45,234,65,1,0 ; movdqa 0x141ea(%rip),%xmm5 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,45,248,65,1,0 ; movdqa 0x141f8(%rip),%xmm5 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,56,64,205 ; pmulld %xmm5,%xmm1
DB 102,15,126,201 ; movd %xmm1,%ecx
DB 102,15,58,22,205,1 ; pextrd $0x1,%xmm1,%ebp
@@ -23968,7 +23964,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,111,29,19,59,1,0 ; movdqa 0x13b13(%rip),%xmm3 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,111,29,33,59,1,0 ; movdqa 0x13b21(%rip),%xmm3 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,72,15,58,22,209,1 ; pextrq $0x1,%xmm2,%rcx
DB 102,72,15,126,213 ; movq %xmm2,%rbp
@@ -24016,7 +24012,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,195,1 ; pextrd $0x1,%xmm0,%r11d
DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
DB 102,65,15,58,22,192,3 ; pextrd $0x3,%xmm0,%r8d
- DB 102,15,254,5,59,58,1,0 ; paddd 0x13a3b(%rip),%xmm0 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,254,5,73,58,1,0 ; paddd 0x13a49(%rip),%xmm0 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,195 ; movq %xmm0,%rbx
DB 137,221 ; mov %ebx,%ebp
@@ -24045,10 +24041,10 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,100,36,16 ; paddd 0x10(%rsp),%xmm4
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,65,15,254,197 ; paddd %xmm13,%xmm0
- DB 102,68,15,111,45,27,64,1,0 ; movdqa 0x1401b(%rip),%xmm13 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,68,15,111,45,41,64,1,0 ; movdqa 0x14029(%rip),%xmm13 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,65,15,56,64,197 ; pmulld %xmm13,%xmm0
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,111,53,121,57,1,0 ; movdqa 0x13979(%rip),%xmm6 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,111,53,135,57,1,0 ; movdqa 0x13987(%rip),%xmm6 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,254,206 ; paddd %xmm6,%xmm1
DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
DB 102,72,15,126,205 ; movq %xmm1,%rbp
@@ -24066,7 +24062,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,15,111,61,55,57,1,0 ; movdqa 0x13937(%rip),%xmm7 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,111,61,69,57,1,0 ; movdqa 0x13945(%rip),%xmm7 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,15,254,199 ; paddd %xmm7,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,195 ; movq %xmm0,%rbx
@@ -24083,7 +24079,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,254,227 ; paddd %xmm11,%xmm4
DB 102,65,15,56,64,229 ; pmulld %xmm13,%xmm4
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
- DB 102,68,15,111,45,191,56,1,0 ; movdqa 0x138bf(%rip),%xmm13 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,68,15,111,45,205,56,1,0 ; movdqa 0x138cd(%rip),%xmm13 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,65,15,254,245 ; paddd %xmm13,%xmm6
DB 102,72,15,58,22,241,1 ; pextrq $0x1,%xmm6,%rcx
DB 102,72,15,126,243 ; movq %xmm6,%rbx
@@ -24162,7 +24158,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,68,15,111,76,36,48 ; movdqa 0x30(%rsp),%xmm9
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,254,194 ; paddd %xmm2,%xmm0
- DB 102,15,111,29,201,61,1,0 ; movdqa 0x13dc9(%rip),%xmm3 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,29,215,61,1,0 ; movdqa 0x13dd7(%rip),%xmm3 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,56,64,195 ; pmulld %xmm3,%xmm0
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,69,15,111,213 ; movdqa %xmm13,%xmm10
@@ -24183,7 +24179,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,15,111,45,232,54,1,0 ; movdqa 0x136e8(%rip),%xmm5 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,111,45,246,54,1,0 ; movdqa 0x136f6(%rip),%xmm5 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,15,254,197 ; paddd %xmm5,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,195 ; movq %xmm0,%rbx
@@ -24271,7 +24267,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,225,1 ; pextrd $0x1,%xmm4,%r9d
DB 102,65,15,58,22,226,2 ; pextrd $0x2,%xmm4,%r10d
DB 102,65,15,58,22,227,3 ; pextrd $0x3,%xmm4,%r11d
- DB 102,68,15,111,13,28,53,1,0 ; movdqa 0x1351c(%rip),%xmm9 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,68,15,111,13,42,53,1,0 ; movdqa 0x1352a(%rip),%xmm9 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,65,15,254,225 ; paddd %xmm9,%xmm4
DB 102,72,15,58,22,225,1 ; pextrq $0x1,%xmm4,%rcx
DB 102,72,15,126,227 ; movq %xmm4,%rbx
@@ -24353,7 +24349,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,76,36,48 ; paddd 0x30(%rsp),%xmm1
DB 102,65,15,56,64,205 ; pmulld %xmm13,%xmm1
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
- DB 102,68,15,111,37,81,51,1,0 ; movdqa 0x13351(%rip),%xmm12 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,68,15,111,37,95,51,1,0 ; movdqa 0x1335f(%rip),%xmm12 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,65,15,254,196 ; paddd %xmm12,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,197 ; movq %xmm0,%rbp
@@ -24371,7 +24367,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,201,1 ; pextrd $0x1,%xmm1,%r9d
DB 102,65,15,58,22,202,2 ; pextrd $0x2,%xmm1,%r10d
DB 102,65,15,58,22,203,3 ; pextrd $0x3,%xmm1,%r11d
- DB 102,15,111,29,14,51,1,0 ; movdqa 0x1330e(%rip),%xmm3 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,111,29,28,51,1,0 ; movdqa 0x1331c(%rip),%xmm3 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -24440,9 +24436,9 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,68,15,254,116,36,16 ; paddd 0x10(%rsp),%xmm14
DB 102,15,111,68,36,48 ; movdqa 0x30(%rsp),%xmm0
DB 102,65,15,254,198 ; paddd %xmm14,%xmm0
- DB 102,15,56,64,5,10,56,1,0 ; pmulld 0x1380a(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,56,64,5,24,56,1,0 ; pmulld 0x13818(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,5,110,49,1,0 ; paddd 0x1316e(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,254,5,124,49,1,0 ; paddd 0x1317c(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,197 ; movq %xmm0,%rbp
DB 137,235 ; mov %ebp,%ebx
@@ -24475,8 +24471,8 @@ _sk_clut_4D_sse41 LABEL PROC
DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0
DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5
DB 102,68,15,254,116,36,32 ; paddd 0x20(%rsp),%xmm14
- DB 102,68,15,56,64,53,79,55,1,0 ; pmulld 0x1374f(%rip),%xmm14 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
- DB 102,15,111,5,183,48,1,0 ; movdqa 0x130b7(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,68,15,56,64,53,93,55,1,0 ; pmulld 0x1375d(%rip),%xmm14 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
+ DB 102,15,111,5,197,48,1,0 ; movdqa 0x130c5(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,65,15,254,198 ; paddd %xmm14,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,195 ; movq %xmm0,%rbx
@@ -24557,7 +24553,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,88,215 ; addps %xmm7,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,47,47,1,0 ; movaps 0x12f2f(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,61,47,1,0 ; movaps 0x12f3d(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 72,139,76,36,120 ; mov 0x78(%rsp),%rcx
DB 15,40,164,36,208,0,0,0 ; movaps 0xd0(%rsp),%xmm4
DB 15,40,172,36,224,0,0,0 ; movaps 0xe0(%rsp),%xmm5
@@ -24603,13 +24599,13 @@ _sk_start_pipeline_sse2 LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,101 ; jae 1a6ab <_sk_start_pipeline_sse2+0xe2>
+ DB 115,101 ; jae 1a69d <_sk_start_pipeline_sse2+0xe2>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,4 ; lea 0x4(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
- DB 119,38 ; ja 1a68e <_sk_start_pipeline_sse2+0xc5>
+ DB 119,38 ; ja 1a680 <_sk_start_pipeline_sse2+0xc5>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 49,255 ; xor %edi,%edi
DB 76,137,246 ; mov %r14,%rsi
@@ -24620,16 +24616,16 @@ _sk_start_pipeline_sse2 LABEL PROC
DB 73,131,196,8 ; add $0x8,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,225 ; jbe 1a66f <_sk_start_pipeline_sse2+0xa6>
+ DB 118,225 ; jbe 1a661 <_sk_start_pipeline_sse2+0xa6>
DB 76,137,255 ; mov %r15,%rdi
DB 72,41,215 ; sub %rdx,%rdi
- DB 116,9 ; je 1a69f <_sk_start_pipeline_sse2+0xd6>
+ DB 116,9 ; je 1a691 <_sk_start_pipeline_sse2+0xd6>
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,173 ; jne 1a658 <_sk_start_pipeline_sse2+0x8f>
+ DB 117,173 ; jne 1a64a <_sk_start_pipeline_sse2+0x8f>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -24660,15 +24656,13 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,21,139,45,1,0 ; movaps 0x12d8b(%rip),%xmm2 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
- DB 15,88,194 ; addps %xmm2,%xmm0
- DB 15,88,5,145,45,1,0 ; addps 0x12d91(%rip),%xmm0 # 2d4b0 <_sk_overlay_sse2_8bit+0xf44>
+ DB 15,88,5,153,45,1,0 ; addps 0x12d99(%rip),%xmm0 # 2d4a0 <_sk_overlay_sse2_8bit+0xf48>
DB 102,15,110,201 ; movd %ecx,%xmm1
DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,88,202 ; addps %xmm2,%xmm1
+ DB 15,88,13,150,45,1,0 ; addps 0x12d96(%rip),%xmm1 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,137,45,1,0 ; movaps 0x12d89(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,21,157,45,1,0 ; movaps 0x12d9d(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -24681,18 +24675,18 @@ _sk_dither_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 102,68,15,110,194 ; movd %edx,%xmm8
DB 102,69,15,112,200,0 ; pshufd $0x0,%xmm8,%xmm9
- DB 102,68,15,254,13,34,45,1,0 ; paddd 0x12d22(%rip),%xmm9 # 2d480 <_sk_overlay_sse2_8bit+0xf14>
+ DB 102,68,15,254,13,54,45,1,0 ; paddd 0x12d36(%rip),%xmm9 # 2d480 <_sk_overlay_sse2_8bit+0xf28>
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,89,45,1,0 ; movdqa 0x12d59(%rip),%xmm10 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,68,15,111,21,109,45,1,0 ; movdqa 0x12d6d(%rip),%xmm10 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,69,45,1,0 ; movdqa 0x12d45(%rip),%xmm12 # 2d4e0 <_sk_overlay_sse2_8bit+0xf74>
- DB 102,68,15,111,45,76,45,1,0 ; movdqa 0x12d4c(%rip),%xmm13 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,68,15,111,37,89,45,1,0 ; movdqa 0x12d59(%rip),%xmm12 # 2d4e0 <_sk_overlay_sse2_8bit+0xf88>
+ DB 102,68,15,111,45,96,45,1,0 ; movdqa 0x12d60(%rip),%xmm13 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -24708,8 +24702,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,7,45,1,0 ; mulps 0x12d07(%rip),%xmm8 # 2d500 <_sk_overlay_sse2_8bit+0xf94>
- DB 68,15,88,5,15,45,1,0 ; addps 0x12d0f(%rip),%xmm8 # 2d510 <_sk_overlay_sse2_8bit+0xfa4>
+ DB 68,15,89,5,27,45,1,0 ; mulps 0x12d1b(%rip),%xmm8 # 2d500 <_sk_overlay_sse2_8bit+0xfa8>
+ DB 68,15,88,5,35,45,1,0 ; addps 0x12d23(%rip),%xmm8 # 2d510 <_sk_overlay_sse2_8bit+0xfb8>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -24747,7 +24741,7 @@ _sk_uniform_color_sse2 LABEL PROC
PUBLIC _sk_black_color_sse2
_sk_black_color_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,69,44,1,0 ; movaps 0x12c45(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,89,44,1,0 ; movaps 0x12c59(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -24756,7 +24750,7 @@ _sk_black_color_sse2 LABEL PROC
PUBLIC _sk_white_color_sse2
_sk_white_color_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,49,44,1,0 ; movaps 0x12c31(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,5,69,44,1,0 ; movaps 0x12c45(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -24794,7 +24788,7 @@ _sk_clear_sse2 LABEL PROC
PUBLIC _sk_srcatop_sse2
_sk_srcatop_sse2 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,225,43,1,0 ; movaps 0x12be1(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,245,43,1,0 ; movaps 0x12bf5(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -24817,7 +24811,7 @@ PUBLIC _sk_dstatop_sse2
_sk_dstatop_sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,148,43,1,0 ; movaps 0x12b94(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,13,168,43,1,0 ; movaps 0x12ba8(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -24858,7 +24852,7 @@ _sk_dstin_sse2 LABEL PROC
PUBLIC _sk_srcout_sse2
_sk_srcout_sse2 LABEL PROC
- DB 68,15,40,5,40,43,1,0 ; movaps 0x12b28(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,60,43,1,0 ; movaps 0x12b3c(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -24869,7 +24863,7 @@ _sk_srcout_sse2 LABEL PROC
PUBLIC _sk_dstout_sse2
_sk_dstout_sse2 LABEL PROC
- DB 68,15,40,5,8,43,1,0 ; movaps 0x12b08(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,28,43,1,0 ; movaps 0x12b1c(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -24884,7 +24878,7 @@ _sk_dstout_sse2 LABEL PROC
PUBLIC _sk_srcover_sse2
_sk_srcover_sse2 LABEL PROC
- DB 68,15,40,5,219,42,1,0 ; movaps 0x12adb(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,239,42,1,0 ; movaps 0x12aef(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -24902,7 +24896,7 @@ _sk_srcover_sse2 LABEL PROC
PUBLIC _sk_dstover_sse2
_sk_dstover_sse2 LABEL PROC
- DB 68,15,40,5,159,42,1,0 ; movaps 0x12a9f(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,179,42,1,0 ; movaps 0x12ab3(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -24926,7 +24920,7 @@ _sk_modulate_sse2 LABEL PROC
PUBLIC _sk_multiply_sse2
_sk_multiply_sse2 LABEL PROC
- DB 68,15,40,5,99,42,1,0 ; movaps 0x12a63(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,119,42,1,0 ; movaps 0x12a77(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -24962,7 +24956,7 @@ _sk_multiply_sse2 LABEL PROC
PUBLIC _sk_plus__sse2
_sk_plus__sse2 LABEL PROC
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 68,15,40,5,228,41,1,0 ; movaps 0x129e4(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,248,41,1,0 ; movaps 0x129f8(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 15,88,205 ; addps %xmm5,%xmm1
DB 65,15,93,200 ; minps %xmm8,%xmm1
@@ -25000,7 +24994,7 @@ _sk_screen_sse2 LABEL PROC
PUBLIC _sk_xor__sse2
_sk_xor__sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,112,41,1,0 ; movaps 0x12970(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,132,41,1,0 ; movaps 0x12984(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -25046,7 +25040,7 @@ _sk_darken_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,203,40,1,0 ; movaps 0x128cb(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,21,223,40,1,0 ; movaps 0x128df(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -25078,7 +25072,7 @@ _sk_lighten_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,96,40,1,0 ; movaps 0x12860(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,21,116,40,1,0 ; movaps 0x12874(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -25113,7 +25107,7 @@ _sk_difference_sse2 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,234,39,1,0 ; movaps 0x127ea(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,21,254,39,1,0 ; movaps 0x127fe(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -25139,7 +25133,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,154,39,1,0 ; movaps 0x1279a(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,21,174,39,1,0 ; movaps 0x127ae(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -25150,7 +25144,7 @@ _sk_exclusion_sse2 LABEL PROC
PUBLIC _sk_colorburn_sse2
_sk_colorburn_sse2 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,13,125,39,1,0 ; movaps 0x1277d(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,13,145,39,1,0 ; movaps 0x12791(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -25243,7 +25237,7 @@ _sk_colorburn_sse2 LABEL PROC
PUBLIC _sk_colordodge_sse2
_sk_colordodge_sse2 LABEL PROC
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,37,38,1,0 ; movaps 0x12625(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,21,57,38,1,0 ; movaps 0x12639(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 65,15,40,195 ; movaps %xmm11,%xmm0
@@ -25334,7 +25328,7 @@ _sk_hardlight_sse2 LABEL PROC
DB 15,41,52,36 ; movaps %xmm6,(%rsp)
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 68,15,40,29,203,36,1,0 ; movaps 0x124cb(%rip),%xmm11 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,29,223,36,1,0 ; movaps 0x124df(%rip),%xmm11 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,194 ; movaps %xmm10,%xmm8
@@ -25421,7 +25415,7 @@ PUBLIC _sk_overlay_sse2
_sk_overlay_sse2 LABEL PROC
DB 68,15,40,193 ; movaps %xmm1,%xmm8
DB 68,15,40,232 ; movaps %xmm0,%xmm13
- DB 68,15,40,13,134,35,1,0 ; movaps 0x12386(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,13,154,35,1,0 ; movaps 0x1239a(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -25511,7 +25505,7 @@ _sk_softlight_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 68,15,94,215 ; divps %xmm7,%xmm10
DB 69,15,84,212 ; andps %xmm12,%xmm10
- DB 68,15,40,13,48,34,1,0 ; movaps 0x12230(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,13,68,34,1,0 ; movaps 0x12244(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 69,15,92,250 ; subps %xmm10,%xmm15
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -25524,10 +25518,10 @@ _sk_softlight_sse2 LABEL PROC
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,53,90,34,1,0 ; movaps 0x1225a(%rip),%xmm14 # 2d520 <_sk_overlay_sse2_8bit+0xfb4>
+ DB 68,15,40,53,110,34,1,0 ; movaps 0x1226e(%rip),%xmm14 # 2d520 <_sk_overlay_sse2_8bit+0xfc8>
DB 69,15,88,222 ; addps %xmm14,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
- DB 68,15,40,21,90,34,1,0 ; movaps 0x1225a(%rip),%xmm10 # 2d530 <_sk_overlay_sse2_8bit+0xfc4>
+ DB 68,15,40,21,110,34,1,0 ; movaps 0x1226e(%rip),%xmm10 # 2d530 <_sk_overlay_sse2_8bit+0xfd8>
DB 69,15,89,234 ; mulps %xmm10,%xmm13
DB 69,15,88,235 ; addps %xmm11,%xmm13
DB 15,88,228 ; addps %xmm4,%xmm4
@@ -25672,7 +25666,7 @@ _sk_hue_sse2 LABEL PROC
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 68,15,89,211 ; mulps %xmm3,%xmm10
- DB 68,15,40,5,230,31,1,0 ; movaps 0x11fe6(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,250,31,1,0 ; movaps 0x11ffa(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 15,40,207 ; movaps %xmm7,%xmm1
DB 68,15,92,217 ; subps %xmm1,%xmm11
@@ -25720,12 +25714,12 @@ _sk_hue_sse2 LABEL PROC
DB 69,15,84,206 ; andps %xmm14,%xmm9
DB 69,15,84,214 ; andps %xmm14,%xmm10
DB 65,15,84,214 ; andps %xmm14,%xmm2
- DB 68,15,40,61,163,31,1,0 ; movaps 0x11fa3(%rip),%xmm15 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
+ DB 68,15,40,61,183,31,1,0 ; movaps 0x11fb7(%rip),%xmm15 # 2d540 <_sk_overlay_sse2_8bit+0xfe8>
DB 65,15,89,231 ; mulps %xmm15,%xmm4
- DB 15,40,5,168,31,1,0 ; movaps 0x11fa8(%rip),%xmm0 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
+ DB 15,40,5,188,31,1,0 ; movaps 0x11fbc(%rip),%xmm0 # 2d550 <_sk_overlay_sse2_8bit+0xff8>
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
- DB 68,15,40,53,170,31,1,0 ; movaps 0x11faa(%rip),%xmm14 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
+ DB 68,15,40,53,190,31,1,0 ; movaps 0x11fbe(%rip),%xmm14 # 2d560 <_sk_overlay_sse2_8bit+0x1008>
DB 68,15,40,239 ; movaps %xmm7,%xmm13
DB 69,15,89,238 ; mulps %xmm14,%xmm13
DB 68,15,88,238 ; addps %xmm6,%xmm13
@@ -25903,14 +25897,14 @@ _sk_saturation_sse2 LABEL PROC
DB 68,15,84,211 ; andps %xmm3,%xmm10
DB 68,15,84,203 ; andps %xmm3,%xmm9
DB 15,84,195 ; andps %xmm3,%xmm0
- DB 68,15,40,5,247,28,1,0 ; movaps 0x11cf7(%rip),%xmm8 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
+ DB 68,15,40,5,11,29,1,0 ; movaps 0x11d0b(%rip),%xmm8 # 2d540 <_sk_overlay_sse2_8bit+0xfe8>
DB 15,40,214 ; movaps %xmm6,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
- DB 15,40,13,249,28,1,0 ; movaps 0x11cf9(%rip),%xmm1 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
+ DB 15,40,13,13,29,1,0 ; movaps 0x11d0d(%rip),%xmm1 # 2d550 <_sk_overlay_sse2_8bit+0xff8>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,217 ; mulps %xmm1,%xmm3
DB 15,88,218 ; addps %xmm2,%xmm3
- DB 68,15,40,37,248,28,1,0 ; movaps 0x11cf8(%rip),%xmm12 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
+ DB 68,15,40,37,12,29,1,0 ; movaps 0x11d0c(%rip),%xmm12 # 2d560 <_sk_overlay_sse2_8bit+0x1008>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
DB 65,15,40,210 ; movaps %xmm10,%xmm2
@@ -25955,7 +25949,7 @@ _sk_saturation_sse2 LABEL PROC
DB 15,40,223 ; movaps %xmm7,%xmm3
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,221 ; mulps %xmm5,%xmm3
- DB 68,15,40,5,173,27,1,0 ; movaps 0x11bad(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,193,27,1,0 ; movaps 0x11bc1(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 15,88,253 ; addps %xmm5,%xmm7
@@ -26056,14 +26050,14 @@ _sk_color_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
DB 65,15,40,208 ; movaps %xmm8,%xmm2
- DB 68,15,40,45,181,26,1,0 ; movaps 0x11ab5(%rip),%xmm13 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
+ DB 68,15,40,45,201,26,1,0 ; movaps 0x11ac9(%rip),%xmm13 # 2d540 <_sk_overlay_sse2_8bit+0xfe8>
DB 68,15,40,198 ; movaps %xmm6,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,40,53,181,26,1,0 ; movaps 0x11ab5(%rip),%xmm14 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
+ DB 68,15,40,53,201,26,1,0 ; movaps 0x11ac9(%rip),%xmm14 # 2d550 <_sk_overlay_sse2_8bit+0xff8>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,29,177,26,1,0 ; movaps 0x11ab1(%rip),%xmm11 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
+ DB 68,15,40,29,197,26,1,0 ; movaps 0x11ac5(%rip),%xmm11 # 2d560 <_sk_overlay_sse2_8bit+0x1008>
DB 69,15,89,227 ; mulps %xmm11,%xmm12
DB 68,15,88,224 ; addps %xmm0,%xmm12
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -26071,7 +26065,7 @@ _sk_color_sse2 LABEL PROC
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 68,15,40,5,237,25,1,0 ; movaps 0x119ed(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,1,26,1,0 ; movaps 0x11a01(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
DB 15,89,252 ; mulps %xmm4,%xmm7
@@ -26207,15 +26201,15 @@ _sk_luminosity_sse2 LABEL PROC
DB 68,15,40,205 ; movaps %xmm5,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 68,15,40,37,111,24,1,0 ; movaps 0x1186f(%rip),%xmm12 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
+ DB 68,15,40,37,131,24,1,0 ; movaps 0x11883(%rip),%xmm12 # 2d540 <_sk_overlay_sse2_8bit+0xfe8>
DB 68,15,40,199 ; movaps %xmm7,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,111,24,1,0 ; movaps 0x1186f(%rip),%xmm13 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
+ DB 68,15,40,45,131,24,1,0 ; movaps 0x11883(%rip),%xmm13 # 2d550 <_sk_overlay_sse2_8bit+0xff8>
DB 68,15,40,241 ; movaps %xmm1,%xmm14
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 69,15,88,240 ; addps %xmm8,%xmm14
- DB 68,15,40,29,107,24,1,0 ; movaps 0x1186b(%rip),%xmm11 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
- DB 68,15,40,5,195,23,1,0 ; movaps 0x117c3(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,29,127,24,1,0 ; movaps 0x1187f(%rip),%xmm11 # 2d560 <_sk_overlay_sse2_8bit+0x1008>
+ DB 68,15,40,5,215,23,1,0 ; movaps 0x117d7(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 68,15,92,248 ; subps %xmm0,%xmm15
@@ -26355,10 +26349,10 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,228,0,0,0 ; jne 1bfea <_sk_srcover_rgba_8888_sse2+0x104>
+ DB 15,133,228,0,0,0 ; jne 1bfd6 <_sk_srcover_rgba_8888_sse2+0x104>
DB 243,69,15,111,4,128 ; movdqu (%r8,%rax,4),%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 102,15,111,53,89,22,1,0 ; movdqa 0x11659(%rip),%xmm6 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,53,109,22,1,0 ; movdqa 0x1166d(%rip),%xmm6 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,65,15,111,224 ; movdqa %xmm8,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
@@ -26372,9 +26366,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 15,91,247 ; cvtdq2ps %xmm7,%xmm6
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,248 ; cvtdq2ps %xmm8,%xmm7
- DB 68,15,40,5,105,21,1,0 ; movaps 0x11569(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,125,21,1,0 ; movaps 0x1157d(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,61,22,1,0 ; movaps 0x1163d(%rip),%xmm12 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
+ DB 68,15,40,37,81,22,1,0 ; movaps 0x11651(%rip),%xmm12 # 2d5a0 <_sk_overlay_sse2_8bit+0x1048>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -26400,7 +26394,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 102,15,114,240,24 ; pslld $0x18,%xmm0
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 102,15,235,193 ; por %xmm1,%xmm0
- DB 117,84 ; jne 1c024 <_sk_srcover_rgba_8888_sse2+0x13e>
+ DB 117,84 ; jne 1c010 <_sk_srcover_rgba_8888_sse2+0x13e>
DB 243,65,15,127,4,128 ; movdqu %xmm0,(%r8,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -26411,32 +26405,32 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,90 ; je 1c051 <_sk_srcover_rgba_8888_sse2+0x16b>
+ DB 116,90 ; je 1c03d <_sk_srcover_rgba_8888_sse2+0x16b>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,23 ; je 1c019 <_sk_srcover_rgba_8888_sse2+0x133>
+ DB 116,23 ; je 1c005 <_sk_srcover_rgba_8888_sse2+0x133>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 15,133,0,255,255,255 ; jne 1bf0c <_sk_srcover_rgba_8888_sse2+0x26>
+ DB 15,133,0,255,255,255 ; jne 1bef8 <_sk_srcover_rgba_8888_sse2+0x26>
DB 102,65,15,110,100,128,8 ; movd 0x8(%r8,%rax,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
DB 102,69,15,18,4,128 ; movlpd (%r8,%rax,4),%xmm8
- DB 233,232,254,255,255 ; jmpq 1bf0c <_sk_srcover_rgba_8888_sse2+0x26>
+ DB 233,232,254,255,255 ; jmpq 1bef8 <_sk_srcover_rgba_8888_sse2+0x26>
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,43 ; je 1c05c <_sk_srcover_rgba_8888_sse2+0x176>
+ DB 116,43 ; je 1c048 <_sk_srcover_rgba_8888_sse2+0x176>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 1c049 <_sk_srcover_rgba_8888_sse2+0x163>
+ DB 116,18 ; je 1c035 <_sk_srcover_rgba_8888_sse2+0x163>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,153 ; jne 1bfd6 <_sk_srcover_rgba_8888_sse2+0xf0>
+ DB 117,153 ; jne 1bfc2 <_sk_srcover_rgba_8888_sse2+0xf0>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,65,15,126,76,128,8 ; movd %xmm1,0x8(%r8,%rax,4)
DB 102,65,15,214,4,128 ; movq %xmm0,(%r8,%rax,4)
- DB 235,133 ; jmp 1bfd6 <_sk_srcover_rgba_8888_sse2+0xf0>
+ DB 235,133 ; jmp 1bfc2 <_sk_srcover_rgba_8888_sse2+0xf0>
DB 102,69,15,110,4,128 ; movd (%r8,%rax,4),%xmm8
- DB 233,176,254,255,255 ; jmpq 1bf0c <_sk_srcover_rgba_8888_sse2+0x26>
+ DB 233,176,254,255,255 ; jmpq 1bef8 <_sk_srcover_rgba_8888_sse2+0x26>
DB 102,65,15,126,4,128 ; movd %xmm0,(%r8,%rax,4)
- DB 233,111,255,255,255 ; jmpq 1bfd6 <_sk_srcover_rgba_8888_sse2+0xf0>
+ DB 233,111,255,255,255 ; jmpq 1bfc2 <_sk_srcover_rgba_8888_sse2+0xf0>
PUBLIC _sk_clamp_0_sse2
_sk_clamp_0_sse2 LABEL PROC
@@ -26450,7 +26444,7 @@ _sk_clamp_0_sse2 LABEL PROC
PUBLIC _sk_clamp_1_sse2
_sk_clamp_1_sse2 LABEL PROC
- DB 68,15,40,5,57,20,1,0 ; movaps 0x11439(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,77,20,1,0 ; movaps 0x1144d(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -26460,7 +26454,7 @@ _sk_clamp_1_sse2 LABEL PROC
PUBLIC _sk_clamp_a_sse2
_sk_clamp_a_sse2 LABEL PROC
- DB 15,93,29,30,20,1,0 ; minps 0x1141e(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,93,29,50,20,1,0 ; minps 0x11432(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -26469,7 +26463,7 @@ _sk_clamp_a_sse2 LABEL PROC
PUBLIC _sk_clamp_a_dst_sse2
_sk_clamp_a_dst_sse2 LABEL PROC
- DB 15,93,61,10,20,1,0 ; minps 0x1140a(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,93,61,30,20,1,0 ; minps 0x1141e(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,93,239 ; minps %xmm7,%xmm5
DB 15,93,247 ; minps %xmm7,%xmm6
@@ -26498,7 +26492,7 @@ _sk_swap_rb_sse2 LABEL PROC
PUBLIC _sk_invert_sse2
_sk_invert_sse2 LABEL PROC
- DB 68,15,40,5,198,19,1,0 ; movaps 0x113c6(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,5,218,19,1,0 ; movaps 0x113da(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,200 ; subps %xmm0,%xmm9
DB 69,15,40,208 ; movaps %xmm8,%xmm10
@@ -26550,7 +26544,7 @@ _sk_premul_dst_sse2 LABEL PROC
PUBLIC _sk_unpremul_sse2
_sk_unpremul_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,80,19,1,0 ; movaps 0x11350(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,13,100,19,1,0 ; movaps 0x11364(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -26562,20 +26556,20 @@ _sk_unpremul_sse2 LABEL PROC
PUBLIC _sk_from_srgb_sse2
_sk_from_srgb_sse2 LABEL PROC
- DB 68,15,40,5,27,20,1,0 ; movaps 0x1141b(%rip),%xmm8 # 2d5b0 <_sk_overlay_sse2_8bit+0x1044>
+ DB 68,15,40,5,47,20,1,0 ; movaps 0x1142f(%rip),%xmm8 # 2d5b0 <_sk_overlay_sse2_8bit+0x1058>
DB 68,15,40,232 ; movaps %xmm0,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,216 ; movaps %xmm0,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,147,19,1,0 ; movaps 0x11393(%rip),%xmm9 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
+ DB 68,15,40,13,167,19,1,0 ; movaps 0x113a7(%rip),%xmm9 # 2d540 <_sk_overlay_sse2_8bit+0xfe8>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,3,20,1,0 ; movaps 0x11403(%rip),%xmm10 # 2d5c0 <_sk_overlay_sse2_8bit+0x1054>
+ DB 68,15,40,21,23,20,1,0 ; movaps 0x11417(%rip),%xmm10 # 2d5c0 <_sk_overlay_sse2_8bit+0x1068>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,3,20,1,0 ; movaps 0x11403(%rip),%xmm11 # 2d5d0 <_sk_overlay_sse2_8bit+0x1064>
+ DB 68,15,40,29,23,20,1,0 ; movaps 0x11417(%rip),%xmm11 # 2d5d0 <_sk_overlay_sse2_8bit+0x1078>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,7,20,1,0 ; movaps 0x11407(%rip),%xmm12 # 2d5e0 <_sk_overlay_sse2_8bit+0x1074>
+ DB 68,15,40,37,27,20,1,0 ; movaps 0x1141b(%rip),%xmm12 # 2d5e0 <_sk_overlay_sse2_8bit+0x1088>
DB 65,15,194,196,1 ; cmpltps %xmm12,%xmm0
DB 68,15,84,232 ; andps %xmm0,%xmm13
DB 65,15,85,198 ; andnps %xmm14,%xmm0
@@ -26609,20 +26603,20 @@ _sk_from_srgb_sse2 LABEL PROC
PUBLIC _sk_from_srgb_dst_sse2
_sk_from_srgb_dst_sse2 LABEL PROC
- DB 68,15,40,5,88,19,1,0 ; movaps 0x11358(%rip),%xmm8 # 2d5b0 <_sk_overlay_sse2_8bit+0x1044>
+ DB 68,15,40,5,108,19,1,0 ; movaps 0x1136c(%rip),%xmm8 # 2d5b0 <_sk_overlay_sse2_8bit+0x1058>
DB 68,15,40,236 ; movaps %xmm4,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,220 ; movaps %xmm4,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,208,18,1,0 ; movaps 0x112d0(%rip),%xmm9 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
+ DB 68,15,40,13,228,18,1,0 ; movaps 0x112e4(%rip),%xmm9 # 2d540 <_sk_overlay_sse2_8bit+0xfe8>
DB 68,15,40,244 ; movaps %xmm4,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,64,19,1,0 ; movaps 0x11340(%rip),%xmm10 # 2d5c0 <_sk_overlay_sse2_8bit+0x1054>
+ DB 68,15,40,21,84,19,1,0 ; movaps 0x11354(%rip),%xmm10 # 2d5c0 <_sk_overlay_sse2_8bit+0x1068>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,64,19,1,0 ; movaps 0x11340(%rip),%xmm11 # 2d5d0 <_sk_overlay_sse2_8bit+0x1064>
+ DB 68,15,40,29,84,19,1,0 ; movaps 0x11354(%rip),%xmm11 # 2d5d0 <_sk_overlay_sse2_8bit+0x1078>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,68,19,1,0 ; movaps 0x11344(%rip),%xmm12 # 2d5e0 <_sk_overlay_sse2_8bit+0x1074>
+ DB 68,15,40,37,88,19,1,0 ; movaps 0x11358(%rip),%xmm12 # 2d5e0 <_sk_overlay_sse2_8bit+0x1088>
DB 65,15,194,228,1 ; cmpltps %xmm12,%xmm4
DB 68,15,84,236 ; andps %xmm4,%xmm13
DB 65,15,85,230 ; andnps %xmm14,%xmm4
@@ -26657,22 +26651,22 @@ _sk_from_srgb_dst_sse2 LABEL PROC
PUBLIC _sk_to_srgb_sse2
_sk_to_srgb_sse2 LABEL PROC
DB 68,15,82,232 ; rsqrtps %xmm0,%xmm13
- DB 68,15,40,5,209,18,1,0 ; movaps 0x112d1(%rip),%xmm8 # 2d5f0 <_sk_overlay_sse2_8bit+0x1084>
+ DB 68,15,40,5,229,18,1,0 ; movaps 0x112e5(%rip),%xmm8 # 2d5f0 <_sk_overlay_sse2_8bit+0x1098>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,240 ; mulps %xmm8,%xmm14
- DB 68,15,40,13,209,18,1,0 ; movaps 0x112d1(%rip),%xmm9 # 2d600 <_sk_overlay_sse2_8bit+0x1094>
+ DB 68,15,40,13,229,18,1,0 ; movaps 0x112e5(%rip),%xmm9 # 2d600 <_sk_overlay_sse2_8bit+0x10a8>
DB 69,15,40,253 ; movaps %xmm13,%xmm15
DB 69,15,89,249 ; mulps %xmm9,%xmm15
- DB 68,15,40,21,209,18,1,0 ; movaps 0x112d1(%rip),%xmm10 # 2d610 <_sk_overlay_sse2_8bit+0x10a4>
+ DB 68,15,40,21,229,18,1,0 ; movaps 0x112e5(%rip),%xmm10 # 2d610 <_sk_overlay_sse2_8bit+0x10b8>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,253 ; mulps %xmm13,%xmm15
- DB 68,15,40,29,209,18,1,0 ; movaps 0x112d1(%rip),%xmm11 # 2d620 <_sk_overlay_sse2_8bit+0x10b4>
+ DB 68,15,40,29,229,18,1,0 ; movaps 0x112e5(%rip),%xmm11 # 2d620 <_sk_overlay_sse2_8bit+0x10c8>
DB 69,15,88,251 ; addps %xmm11,%xmm15
- DB 68,15,40,37,213,18,1,0 ; movaps 0x112d5(%rip),%xmm12 # 2d630 <_sk_overlay_sse2_8bit+0x10c4>
+ DB 68,15,40,37,233,18,1,0 ; movaps 0x112e9(%rip),%xmm12 # 2d630 <_sk_overlay_sse2_8bit+0x10d8>
DB 69,15,88,236 ; addps %xmm12,%xmm13
DB 69,15,83,237 ; rcpps %xmm13,%xmm13
DB 69,15,89,239 ; mulps %xmm15,%xmm13
- DB 68,15,40,61,209,18,1,0 ; movaps 0x112d1(%rip),%xmm15 # 2d640 <_sk_overlay_sse2_8bit+0x10d4>
+ DB 68,15,40,61,229,18,1,0 ; movaps 0x112e5(%rip),%xmm15 # 2d640 <_sk_overlay_sse2_8bit+0x10e8>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,197 ; andnps %xmm13,%xmm0
@@ -26722,7 +26716,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 68,15,93,216 ; minps %xmm0,%xmm11
DB 65,15,40,202 ; movaps %xmm10,%xmm1
DB 65,15,92,203 ; subps %xmm11,%xmm1
- DB 68,15,40,45,148,16,1,0 ; movaps 0x11094(%rip),%xmm13 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,45,168,16,1,0 ; movaps 0x110a8(%rip),%xmm13 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 68,15,94,233 ; divps %xmm1,%xmm13
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,194,192,0 ; cmpeqps %xmm8,%xmm0
@@ -26731,30 +26725,30 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,40,241 ; movaps %xmm9,%xmm14
DB 68,15,194,242,1 ; cmpltps %xmm2,%xmm14
- DB 68,15,84,53,250,17,1,0 ; andps 0x111fa(%rip),%xmm14 # 2d650 <_sk_overlay_sse2_8bit+0x10e4>
+ DB 68,15,84,53,14,18,1,0 ; andps 0x1120e(%rip),%xmm14 # 2d650 <_sk_overlay_sse2_8bit+0x10f8>
DB 69,15,88,244 ; addps %xmm12,%xmm14
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,194,249,0 ; cmpeqps %xmm9,%xmm15
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,213 ; mulps %xmm13,%xmm2
- DB 68,15,40,37,237,17,1,0 ; movaps 0x111ed(%rip),%xmm12 # 2d660 <_sk_overlay_sse2_8bit+0x10f4>
+ DB 68,15,40,37,1,18,1,0 ; movaps 0x11201(%rip),%xmm12 # 2d660 <_sk_overlay_sse2_8bit+0x1108>
DB 65,15,88,212 ; addps %xmm12,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,88,5,233,17,1,0 ; addps 0x111e9(%rip),%xmm8 # 2d670 <_sk_overlay_sse2_8bit+0x1104>
+ DB 68,15,88,5,253,17,1,0 ; addps 0x111fd(%rip),%xmm8 # 2d670 <_sk_overlay_sse2_8bit+0x1118>
DB 65,15,84,215 ; andps %xmm15,%xmm2
DB 69,15,85,248 ; andnps %xmm8,%xmm15
DB 68,15,86,250 ; orps %xmm2,%xmm15
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,199 ; andnps %xmm15,%xmm0
DB 65,15,86,198 ; orps %xmm14,%xmm0
- DB 15,89,5,218,17,1,0 ; mulps 0x111da(%rip),%xmm0 # 2d680 <_sk_overlay_sse2_8bit+0x1114>
+ DB 15,89,5,238,17,1,0 ; mulps 0x111ee(%rip),%xmm0 # 2d680 <_sk_overlay_sse2_8bit+0x1128>
DB 69,15,40,194 ; movaps %xmm10,%xmm8
DB 69,15,194,195,4 ; cmpneqps %xmm11,%xmm8
DB 65,15,84,192 ; andps %xmm8,%xmm0
DB 69,15,92,226 ; subps %xmm10,%xmm12
DB 69,15,88,211 ; addps %xmm11,%xmm10
- DB 68,15,40,13,221,15,1,0 ; movaps 0x10fdd(%rip),%xmm9 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,40,13,1,16,1,0 ; movaps 0x11001(%rip),%xmm9 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 65,15,40,210 ; movaps %xmm10,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 68,15,194,202,1 ; cmpltps %xmm2,%xmm9
@@ -26777,7 +26771,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,92,36,32 ; movaps %xmm3,0x20(%rsp)
DB 68,15,40,218 ; movaps %xmm2,%xmm11
DB 15,40,240 ; movaps %xmm0,%xmm6
- DB 68,15,40,13,136,15,1,0 ; movaps 0x10f88(%rip),%xmm9 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,40,13,172,15,1,0 ; movaps 0x10fac(%rip),%xmm9 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,194,211,2 ; cmpleps %xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
@@ -26794,28 +26788,28 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 69,15,88,211 ; addps %xmm11,%xmm10
DB 69,15,88,219 ; addps %xmm11,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 15,40,5,50,17,1,0 ; movaps 0x11132(%rip),%xmm0 # 2d690 <_sk_overlay_sse2_8bit+0x1124>
+ DB 15,40,5,70,17,1,0 ; movaps 0x11146(%rip),%xmm0 # 2d690 <_sk_overlay_sse2_8bit+0x1138>
DB 15,88,198 ; addps %xmm6,%xmm0
DB 243,15,91,200 ; cvttps2dq %xmm0,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,216 ; movaps %xmm0,%xmm3
DB 15,194,217,1 ; cmpltps %xmm1,%xmm3
- DB 15,84,29,74,15,1,0 ; andps 0x10f4a(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,84,29,94,15,1,0 ; andps 0x10f5e(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
- DB 68,15,40,45,28,17,1,0 ; movaps 0x1111c(%rip),%xmm13 # 2d6a0 <_sk_overlay_sse2_8bit+0x1134>
+ DB 68,15,40,45,48,17,1,0 ; movaps 0x11130(%rip),%xmm13 # 2d6a0 <_sk_overlay_sse2_8bit+0x1148>
DB 69,15,40,197 ; movaps %xmm13,%xmm8
DB 68,15,194,192,2 ; cmpleps %xmm0,%xmm8
DB 69,15,40,242 ; movaps %xmm10,%xmm14
DB 69,15,92,243 ; subps %xmm11,%xmm14
DB 65,15,40,217 ; movaps %xmm9,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
- DB 15,40,21,220,16,1,0 ; movaps 0x110dc(%rip),%xmm2 # 2d680 <_sk_overlay_sse2_8bit+0x1114>
+ DB 15,40,21,240,16,1,0 ; movaps 0x110f0(%rip),%xmm2 # 2d680 <_sk_overlay_sse2_8bit+0x1128>
DB 68,15,40,250 ; movaps %xmm2,%xmm15
DB 68,15,194,248,2 ; cmpleps %xmm0,%xmm15
- DB 15,40,13,156,16,1,0 ; movaps 0x1109c(%rip),%xmm1 # 2d650 <_sk_overlay_sse2_8bit+0x10e4>
+ DB 15,40,13,176,16,1,0 ; movaps 0x110b0(%rip),%xmm1 # 2d650 <_sk_overlay_sse2_8bit+0x10f8>
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,45,178,16,1,0 ; movaps 0x110b2(%rip),%xmm5 # 2d670 <_sk_overlay_sse2_8bit+0x1104>
+ DB 15,40,45,198,16,1,0 ; movaps 0x110c6(%rip),%xmm5 # 2d670 <_sk_overlay_sse2_8bit+0x1118>
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,92,224 ; subps %xmm0,%xmm4
DB 65,15,89,230 ; mulps %xmm14,%xmm4
@@ -26838,7 +26832,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,167,14,1,0 ; andps 0x10ea7(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,84,29,187,14,1,0 ; andps 0x10ebb(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 68,15,40,230 ; movaps %xmm6,%xmm12
DB 68,15,92,224 ; subps %xmm0,%xmm12
@@ -26868,12 +26862,12 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,60,36 ; movaps (%rsp),%xmm7
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 15,85,227 ; andnps %xmm3,%xmm4
- DB 15,88,53,32,16,1,0 ; addps 0x11020(%rip),%xmm6 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
+ DB 15,88,53,52,16,1,0 ; addps 0x11034(%rip),%xmm6 # 2d6b0 <_sk_overlay_sse2_8bit+0x1158>
DB 243,15,91,198 ; cvttps2dq %xmm6,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,27,14,1,0 ; andps 0x10e1b(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,84,29,47,14,1,0 ; andps 0x10e2f(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,89,206 ; mulps %xmm6,%xmm1
@@ -26934,13 +26928,13 @@ _sk_scale_u8_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,61 ; jne 1c7aa <_sk_scale_u8_sse2+0x55>
+ DB 117,61 ; jne 1c796 <_sk_scale_u8_sse2+0x55>
DB 102,71,15,110,4,16 ; movd (%r8,%r10,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,234,13,1,0 ; pand 0x10dea(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,68,15,219,5,254,13,1,0 ; pand 0x10dfe(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,46,15,1,0 ; mulps 0x10f2e(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,89,5,66,15,1,0 ; mulps 0x10f42(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -26951,12 +26945,12 @@ _sk_scale_u8_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,61 ; je 1c7f4 <_sk_scale_u8_sse2+0x9f>
+ DB 116,61 ; je 1c7e0 <_sk_scale_u8_sse2+0x9f>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,23 ; je 1c7d9 <_sk_scale_u8_sse2+0x84>
+ DB 116,23 ; je 1c7c5 <_sk_scale_u8_sse2+0x84>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,181 ; jne 1c77d <_sk_scale_u8_sse2+0x28>
+ DB 117,181 ; jne 1c769 <_sk_scale_u8_sse2+0x28>
DB 67,15,182,68,16,2 ; movzbl 0x2(%r8,%r10,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -26965,10 +26959,10 @@ _sk_scale_u8_sse2 LABEL PROC
DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
- DB 235,137 ; jmp 1c77d <_sk_scale_u8_sse2+0x28>
+ DB 235,137 ; jmp 1c769 <_sk_scale_u8_sse2+0x28>
DB 67,15,182,4,16 ; movzbl (%r8,%r10,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,122,255,255,255 ; jmpq 1c77d <_sk_scale_u8_sse2+0x28>
+ DB 233,122,255,255,255 ; jmpq 1c769 <_sk_scale_u8_sse2+0x28>
PUBLIC _sk_scale_565_sse2
_sk_scale_565_sse2 LABEL PROC
@@ -26980,20 +26974,20 @@ _sk_scale_565_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,173,0,0,0 ; jne 1c8cf <_sk_scale_565_sse2+0xcc>
+ DB 15,133,173,0,0,0 ; jne 1c8bb <_sk_scale_565_sse2+0xcc>
DB 243,71,15,126,20,80 ; movq (%r8,%r10,2),%xmm10
DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10
- DB 102,68,15,111,5,154,14,1,0 ; movdqa 0x10e9a(%rip),%xmm8 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
+ DB 102,68,15,111,5,174,14,1,0 ; movdqa 0x10eae(%rip),%xmm8 # 2d6d0 <_sk_overlay_sse2_8bit+0x1178>
DB 102,69,15,219,194 ; pand %xmm10,%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,153,14,1,0 ; mulps 0x10e99(%rip),%xmm8 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
- DB 102,68,15,111,13,160,14,1,0 ; movdqa 0x10ea0(%rip),%xmm9 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
+ DB 68,15,89,5,173,14,1,0 ; mulps 0x10ead(%rip),%xmm8 # 2d6e0 <_sk_overlay_sse2_8bit+0x1188>
+ DB 102,68,15,111,13,180,14,1,0 ; movdqa 0x10eb4(%rip),%xmm9 # 2d6f0 <_sk_overlay_sse2_8bit+0x1198>
DB 102,69,15,219,202 ; pand %xmm10,%xmm9
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,159,14,1,0 ; mulps 0x10e9f(%rip),%xmm9 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
- DB 102,68,15,219,21,166,14,1,0 ; pand 0x10ea6(%rip),%xmm10 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
+ DB 68,15,89,13,179,14,1,0 ; mulps 0x10eb3(%rip),%xmm9 # 2d700 <_sk_overlay_sse2_8bit+0x11a8>
+ DB 102,68,15,219,21,186,14,1,0 ; pand 0x10eba(%rip),%xmm10 # 2d710 <_sk_overlay_sse2_8bit+0x11b8>
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,170,14,1,0 ; mulps 0x10eaa(%rip),%xmm10 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
+ DB 68,15,89,21,190,14,1,0 ; mulps 0x10ebe(%rip),%xmm10 # 2d720 <_sk_overlay_sse2_8bit+0x11c8>
DB 68,15,40,219 ; movaps %xmm3,%xmm11
DB 68,15,194,223,1 ; cmpltps %xmm7,%xmm11
DB 69,15,40,225 ; movaps %xmm9,%xmm12
@@ -27020,22 +27014,22 @@ _sk_scale_565_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,59 ; je 1c917 <_sk_scale_565_sse2+0x114>
+ DB 116,59 ; je 1c903 <_sk_scale_565_sse2+0x114>
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,27 ; je 1c902 <_sk_scale_565_sse2+0xff>
+ DB 116,27 ; je 1c8ee <_sk_scale_565_sse2+0xff>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 15,133,60,255,255,255 ; jne 1c82d <_sk_scale_565_sse2+0x2a>
+ DB 15,133,60,255,255,255 ; jne 1c819 <_sk_scale_565_sse2+0x2a>
DB 67,15,183,68,80,4 ; movzwl 0x4(%r8,%r10,2),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,208,69 ; pshufd $0x45,%xmm8,%xmm10
DB 102,71,15,110,4,80 ; movd (%r8,%r10,2),%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
DB 242,69,15,16,208 ; movsd %xmm8,%xmm10
- DB 233,22,255,255,255 ; jmpq 1c82d <_sk_scale_565_sse2+0x2a>
+ DB 233,22,255,255,255 ; jmpq 1c819 <_sk_scale_565_sse2+0x2a>
DB 67,15,183,4,80 ; movzwl (%r8,%r10,2),%eax
DB 102,68,15,110,208 ; movd %eax,%xmm10
- DB 233,7,255,255,255 ; jmpq 1c82d <_sk_scale_565_sse2+0x2a>
+ DB 233,7,255,255,255 ; jmpq 1c819 <_sk_scale_565_sse2+0x2a>
PUBLIC _sk_lerp_1_float_sse2
_sk_lerp_1_float_sse2 LABEL PROC
@@ -27066,13 +27060,13 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,81 ; jne 1c9c7 <_sk_lerp_u8_sse2+0x69>
+ DB 117,81 ; jne 1c9b3 <_sk_lerp_u8_sse2+0x69>
DB 102,71,15,110,4,16 ; movd (%r8,%r10,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,225,11,1,0 ; pand 0x10be1(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,68,15,219,5,245,11,1,0 ; pand 0x10bf5(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,37,13,1,0 ; mulps 0x10d25(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,89,5,57,13,1,0 ; mulps 0x10d39(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -27090,12 +27084,12 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,64 ; je 1ca14 <_sk_lerp_u8_sse2+0xb6>
+ DB 116,64 ; je 1ca00 <_sk_lerp_u8_sse2+0xb6>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,23 ; je 1c9f6 <_sk_lerp_u8_sse2+0x98>
+ DB 116,23 ; je 1c9e2 <_sk_lerp_u8_sse2+0x98>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,161 ; jne 1c986 <_sk_lerp_u8_sse2+0x28>
+ DB 117,161 ; jne 1c972 <_sk_lerp_u8_sse2+0x28>
DB 67,15,182,68,16,2 ; movzbl 0x2(%r8,%r10,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -27104,10 +27098,10 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
- DB 233,114,255,255,255 ; jmpq 1c986 <_sk_lerp_u8_sse2+0x28>
+ DB 233,114,255,255,255 ; jmpq 1c972 <_sk_lerp_u8_sse2+0x28>
DB 67,15,182,4,16 ; movzbl (%r8,%r10,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,99,255,255,255 ; jmpq 1c986 <_sk_lerp_u8_sse2+0x28>
+ DB 233,99,255,255,255 ; jmpq 1c972 <_sk_lerp_u8_sse2+0x28>
PUBLIC _sk_lerp_565_sse2
_sk_lerp_565_sse2 LABEL PROC
@@ -27119,20 +27113,20 @@ _sk_lerp_565_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,173,0,0,0 ; jne 1caef <_sk_lerp_565_sse2+0xcc>
+ DB 15,133,173,0,0,0 ; jne 1cadb <_sk_lerp_565_sse2+0xcc>
DB 243,71,15,126,4,80 ; movq (%r8,%r10,2),%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,111,13,122,12,1,0 ; movdqa 0x10c7a(%rip),%xmm9 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
+ DB 102,68,15,111,13,142,12,1,0 ; movdqa 0x10c8e(%rip),%xmm9 # 2d6d0 <_sk_overlay_sse2_8bit+0x1178>
DB 102,69,15,219,200 ; pand %xmm8,%xmm9
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,121,12,1,0 ; mulps 0x10c79(%rip),%xmm9 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
- DB 102,68,15,111,21,128,12,1,0 ; movdqa 0x10c80(%rip),%xmm10 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
+ DB 68,15,89,13,141,12,1,0 ; mulps 0x10c8d(%rip),%xmm9 # 2d6e0 <_sk_overlay_sse2_8bit+0x1188>
+ DB 102,68,15,111,21,148,12,1,0 ; movdqa 0x10c94(%rip),%xmm10 # 2d6f0 <_sk_overlay_sse2_8bit+0x1198>
DB 102,69,15,219,208 ; pand %xmm8,%xmm10
DB 69,15,91,218 ; cvtdq2ps %xmm10,%xmm11
- DB 68,15,89,29,127,12,1,0 ; mulps 0x10c7f(%rip),%xmm11 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
- DB 102,68,15,219,5,134,12,1,0 ; pand 0x10c86(%rip),%xmm8 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
+ DB 68,15,89,29,147,12,1,0 ; mulps 0x10c93(%rip),%xmm11 # 2d700 <_sk_overlay_sse2_8bit+0x11a8>
+ DB 102,68,15,219,5,154,12,1,0 ; pand 0x10c9a(%rip),%xmm8 # 2d710 <_sk_overlay_sse2_8bit+0x11b8>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,138,12,1,0 ; mulps 0x10c8a(%rip),%xmm8 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
+ DB 68,15,89,5,158,12,1,0 ; mulps 0x10c9e(%rip),%xmm8 # 2d720 <_sk_overlay_sse2_8bit+0x11c8>
DB 68,15,40,211 ; movaps %xmm3,%xmm10
DB 68,15,194,215,1 ; cmpltps %xmm7,%xmm10
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -27161,33 +27155,33 @@ _sk_lerp_565_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,59 ; je 1cb37 <_sk_lerp_565_sse2+0x114>
+ DB 116,59 ; je 1cb23 <_sk_lerp_565_sse2+0x114>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,27 ; je 1cb22 <_sk_lerp_565_sse2+0xff>
+ DB 116,27 ; je 1cb0e <_sk_lerp_565_sse2+0xff>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 15,133,60,255,255,255 ; jne 1ca4d <_sk_lerp_565_sse2+0x2a>
+ DB 15,133,60,255,255,255 ; jne 1ca39 <_sk_lerp_565_sse2+0x2a>
DB 67,15,183,68,80,4 ; movzwl 0x4(%r8,%r10,2),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
DB 102,71,15,110,12,80 ; movd (%r8,%r10,2),%xmm9
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
- DB 233,22,255,255,255 ; jmpq 1ca4d <_sk_lerp_565_sse2+0x2a>
+ DB 233,22,255,255,255 ; jmpq 1ca39 <_sk_lerp_565_sse2+0x2a>
DB 67,15,183,4,80 ; movzwl (%r8,%r10,2),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,7,255,255,255 ; jmpq 1ca4d <_sk_lerp_565_sse2+0x2a>
+ DB 233,7,255,255,255 ; jmpq 1ca39 <_sk_lerp_565_sse2+0x2a>
PUBLIC _sk_load_tables_sse2
_sk_load_tables_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,0 ; mov (%rax),%r8
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,32,1,0,0 ; jne 1cc74 <_sk_load_tables_sse2+0x12e>
+ DB 15,133,32,1,0,0 ; jne 1cc60 <_sk_load_tables_sse2+0x12e>
DB 243,69,15,111,12,144 ; movdqu (%r8,%rdx,4),%xmm9
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,68,15,111,5,10,10,1,0 ; movdqa 0x10a0a(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,68,15,111,5,30,10,1,0 ; movdqa 0x10a1e(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
@@ -27243,7 +27237,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 102,65,15,114,209,24 ; psrld $0x18,%xmm9
DB 65,15,91,217 ; cvtdq2ps %xmm9,%xmm3
- DB 15,89,29,83,10,1,0 ; mulps 0x10a53(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 15,89,29,103,10,1,0 ; mulps 0x10a67(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -27251,18 +27245,18 @@ _sk_load_tables_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,45 ; je 1ccae <_sk_load_tables_sse2+0x168>
+ DB 116,45 ; je 1cc9a <_sk_load_tables_sse2+0x168>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,23 ; je 1cca3 <_sk_load_tables_sse2+0x15d>
+ DB 116,23 ; je 1cc8f <_sk_load_tables_sse2+0x15d>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 15,133,196,254,255,255 ; jne 1cb5a <_sk_load_tables_sse2+0x14>
+ DB 15,133,196,254,255,255 ; jne 1cb46 <_sk_load_tables_sse2+0x14>
DB 102,65,15,110,68,144,8 ; movd 0x8(%r8,%rdx,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
DB 102,69,15,18,12,144 ; movlpd (%r8,%rdx,4),%xmm9
- DB 233,172,254,255,255 ; jmpq 1cb5a <_sk_load_tables_sse2+0x14>
+ DB 233,172,254,255,255 ; jmpq 1cb46 <_sk_load_tables_sse2+0x14>
DB 102,69,15,110,12,144 ; movd (%r8,%rdx,4),%xmm9
- DB 233,161,254,255,255 ; jmpq 1cb5a <_sk_load_tables_sse2+0x14>
+ DB 233,161,254,255,255 ; jmpq 1cb46 <_sk_load_tables_sse2+0x14>
PUBLIC _sk_load_tables_u16_be_sse2
_sk_load_tables_u16_be_sse2 LABEL PROC
@@ -27270,7 +27264,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 76,141,12,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r9
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,97,1,0,0 ; jne 1ce30 <_sk_load_tables_u16_be_sse2+0x177>
+ DB 15,133,97,1,0,0 ; jne 1ce1c <_sk_load_tables_u16_be_sse2+0x177>
DB 102,67,15,16,4,72 ; movupd (%r8,%r9,2),%xmm0
DB 102,67,15,16,76,72,16 ; movupd 0x10(%r8,%r9,2),%xmm1
DB 65,86 ; push %r14
@@ -27281,7 +27275,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,21,44,10,1,0 ; movdqa 0x10a2c(%rip),%xmm10 # 2d730 <_sk_overlay_sse2_8bit+0x11c4>
+ DB 102,68,15,111,21,64,10,1,0 ; movdqa 0x10a40(%rip),%xmm10 # 2d730 <_sk_overlay_sse2_8bit+0x11d8>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -27343,24 +27337,24 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,235,217 ; por %xmm9,%xmm3
DB 102,65,15,97,216 ; punpcklwd %xmm8,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,39,9,1,0 ; mulps 0x10927(%rip),%xmm3 # 2d750 <_sk_overlay_sse2_8bit+0x11e4>
+ DB 15,89,29,59,9,1,0 ; mulps 0x1093b(%rip),%xmm3 # 2d750 <_sk_overlay_sse2_8bit+0x11f8>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 255,224 ; jmpq *%rax
DB 242,67,15,16,4,72 ; movsd (%r8,%r9,2),%xmm0
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,17 ; jne 1ce4d <_sk_load_tables_u16_be_sse2+0x194>
+ DB 117,17 ; jne 1ce39 <_sk_load_tables_u16_be_sse2+0x194>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,143,254,255,255 ; jmpq 1ccdc <_sk_load_tables_u16_be_sse2+0x23>
+ DB 233,143,254,255,255 ; jmpq 1ccc8 <_sk_load_tables_u16_be_sse2+0x23>
DB 102,67,15,22,68,72,8 ; movhpd 0x8(%r8,%r9,2),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 15,130,122,254,255,255 ; jb 1ccdc <_sk_load_tables_u16_be_sse2+0x23>
+ DB 15,130,122,254,255,255 ; jb 1ccc8 <_sk_load_tables_u16_be_sse2+0x23>
DB 242,67,15,16,76,72,16 ; movsd 0x10(%r8,%r9,2),%xmm1
- DB 233,110,254,255,255 ; jmpq 1ccdc <_sk_load_tables_u16_be_sse2+0x23>
+ DB 233,110,254,255,255 ; jmpq 1ccc8 <_sk_load_tables_u16_be_sse2+0x23>
PUBLIC _sk_load_tables_rgb_u16_be_sse2
_sk_load_tables_rgb_u16_be_sse2 LABEL PROC
@@ -27368,7 +27362,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 76,141,12,82 ; lea (%rdx,%rdx,2),%r9
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,80,1,0,0 ; jne 1cfd0 <_sk_load_tables_rgb_u16_be_sse2+0x162>
+ DB 15,133,80,1,0,0 ; jne 1cfbc <_sk_load_tables_rgb_u16_be_sse2+0x162>
DB 243,71,15,111,28,72 ; movdqu (%r8,%r9,2),%xmm11
DB 243,67,15,111,76,72,8 ; movdqu 0x8(%r8,%r9,2),%xmm1
DB 102,15,115,217,4 ; psrldq $0x4,%xmm1
@@ -27382,7 +27376,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10
DB 102,65,15,111,195 ; movdqa %xmm11,%xmm0
DB 102,65,15,97,194 ; punpcklwd %xmm10,%xmm0
- DB 102,68,15,111,5,106,8,1,0 ; movdqa 0x1086a(%rip),%xmm8 # 2d730 <_sk_overlay_sse2_8bit+0x11c4>
+ DB 102,68,15,111,5,126,8,1,0 ; movdqa 0x1087e(%rip),%xmm8 # 2d730 <_sk_overlay_sse2_8bit+0x11d8>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
@@ -27438,7 +27432,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 15,20,211 ; unpcklps %xmm3,%xmm2
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,245,4,1,0 ; movaps 0x104f5(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,9,5,1,0 ; movaps 0x10509(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 255,224 ; jmpq *%rax
@@ -27446,21 +27440,21 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,71,15,196,92,72,4,2 ; pinsrw $0x2,0x4(%r8,%r9,2),%xmm11
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,14 ; jne 1cff6 <_sk_load_tables_rgb_u16_be_sse2+0x188>
+ DB 117,14 ; jne 1cfe2 <_sk_load_tables_rgb_u16_be_sse2+0x188>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
- DB 233,176,254,255,255 ; jmpq 1cea6 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,176,254,255,255 ; jmpq 1ce92 <_sk_load_tables_rgb_u16_be_sse2+0x38>
DB 102,71,15,110,84,72,6 ; movd 0x6(%r8,%r9,2),%xmm10
DB 102,71,15,196,84,72,10,2 ; pinsrw $0x2,0xa(%r8,%r9,2),%xmm10
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,24 ; jb 1d027 <_sk_load_tables_rgb_u16_be_sse2+0x1b9>
+ DB 114,24 ; jb 1d013 <_sk_load_tables_rgb_u16_be_sse2+0x1b9>
DB 102,67,15,110,76,72,12 ; movd 0xc(%r8,%r9,2),%xmm1
DB 102,67,15,196,76,72,16,2 ; pinsrw $0x2,0x10(%r8,%r9,2),%xmm1
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,127,254,255,255 ; jmpq 1cea6 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,127,254,255,255 ; jmpq 1ce92 <_sk_load_tables_rgb_u16_be_sse2+0x38>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,118,254,255,255 ; jmpq 1cea6 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,118,254,255,255 ; jmpq 1ce92 <_sk_load_tables_rgb_u16_be_sse2+0x38>
PUBLIC _sk_byte_tables_sse2
_sk_byte_tables_sse2 LABEL PROC
@@ -27468,7 +27462,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 65,86 ; push %r14
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,98,5,1,0 ; movaps 0x10562(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
+ DB 68,15,40,5,118,5,1,0 ; movaps 0x10576(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1048>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,126,192 ; movq %xmm0,%r8
@@ -27496,7 +27490,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,12,6,1,0 ; movaps 0x1060c(%rip),%xmm10 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,21,32,6,1,0 ; movaps 0x10620(%rip),%xmm10 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -27613,7 +27607,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,72,4,1,0 ; movaps 0x10448(%rip),%xmm10 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,21,92,4,1,0 ; movaps 0x1045c(%rip),%xmm10 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -27801,15 +27795,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,38,2,1,0 ; mulps 0x10226(%rip),%xmm9 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
- DB 68,15,84,21,46,2,1,0 ; andps 0x1022e(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
- DB 68,15,86,21,70,255,0,0 ; orps 0xff46(%rip),%xmm10 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
- DB 68,15,88,13,46,2,1,0 ; addps 0x1022e(%rip),%xmm9 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
- DB 68,15,40,37,54,2,1,0 ; movaps 0x10236(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
+ DB 68,15,89,13,58,2,1,0 ; mulps 0x1023a(%rip),%xmm9 # 2d770 <_sk_overlay_sse2_8bit+0x1218>
+ DB 68,15,84,21,66,2,1,0 ; andps 0x10242(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1228>
+ DB 68,15,86,21,106,255,0,0 ; orps 0xff6a(%rip),%xmm10 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
+ DB 68,15,88,13,66,2,1,0 ; addps 0x10242(%rip),%xmm9 # 2d790 <_sk_overlay_sse2_8bit+0x1238>
+ DB 68,15,40,37,74,2,1,0 ; movaps 0x1024a(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1248>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,54,2,1,0 ; addps 0x10236(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
- DB 68,15,40,37,62,2,1,0 ; movaps 0x1023e(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
+ DB 68,15,88,21,74,2,1,0 ; addps 0x1024a(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1258>
+ DB 68,15,40,37,82,2,1,0 ; movaps 0x10252(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1268>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27817,22 +27811,22 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,24,255,0,0 ; movaps 0xff18(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,21,44,255,0,0 ; movaps 0xff2c(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,12,2,1,0 ; addps 0x1020c(%rip),%xmm9 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
- DB 68,15,40,37,20,2,1,0 ; movaps 0x10214(%rip),%xmm12 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
+ DB 68,15,88,13,32,2,1,0 ; addps 0x10220(%rip),%xmm9 # 2d7d0 <_sk_overlay_sse2_8bit+0x1278>
+ DB 68,15,40,37,40,2,1,0 ; movaps 0x10228(%rip),%xmm12 # 2d7e0 <_sk_overlay_sse2_8bit+0x1288>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,20,2,1,0 ; movaps 0x10214(%rip),%xmm12 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
+ DB 68,15,40,37,40,2,1,0 ; movaps 0x10228(%rip),%xmm12 # 2d7f0 <_sk_overlay_sse2_8bit+0x1298>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,24,2,1,0 ; movaps 0x10218(%rip),%xmm13 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
+ DB 68,15,40,45,44,2,1,0 ; movaps 0x1022c(%rip),%xmm13 # 2d800 <_sk_overlay_sse2_8bit+0x12a8>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,24,2,1,0 ; mulps 0x10218(%rip),%xmm13 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
+ DB 68,15,89,45,44,2,1,0 ; mulps 0x1022c(%rip),%xmm13 # 2d810 <_sk_overlay_sse2_8bit+0x12b8>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27866,15 +27860,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,232,0,1,0 ; mulps 0x100e8(%rip),%xmm9 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
- DB 68,15,84,21,240,0,1,0 ; andps 0x100f0(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
- DB 68,15,86,21,8,254,0,0 ; orps 0xfe08(%rip),%xmm10 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
- DB 68,15,88,13,240,0,1,0 ; addps 0x100f0(%rip),%xmm9 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
- DB 68,15,40,37,248,0,1,0 ; movaps 0x100f8(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
+ DB 68,15,89,13,252,0,1,0 ; mulps 0x100fc(%rip),%xmm9 # 2d770 <_sk_overlay_sse2_8bit+0x1218>
+ DB 68,15,84,21,4,1,1,0 ; andps 0x10104(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1228>
+ DB 68,15,86,21,44,254,0,0 ; orps 0xfe2c(%rip),%xmm10 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
+ DB 68,15,88,13,4,1,1,0 ; addps 0x10104(%rip),%xmm9 # 2d790 <_sk_overlay_sse2_8bit+0x1238>
+ DB 68,15,40,37,12,1,1,0 ; movaps 0x1010c(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1248>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,248,0,1,0 ; addps 0x100f8(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
- DB 68,15,40,37,0,1,1,0 ; movaps 0x10100(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
+ DB 68,15,88,21,12,1,1,0 ; addps 0x1010c(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1258>
+ DB 68,15,40,37,20,1,1,0 ; movaps 0x10114(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1268>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27882,22 +27876,22 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,218,253,0,0 ; movaps 0xfdda(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,21,238,253,0,0 ; movaps 0xfdee(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,206,0,1,0 ; addps 0x100ce(%rip),%xmm9 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
- DB 68,15,40,37,214,0,1,0 ; movaps 0x100d6(%rip),%xmm12 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
+ DB 68,15,88,13,226,0,1,0 ; addps 0x100e2(%rip),%xmm9 # 2d7d0 <_sk_overlay_sse2_8bit+0x1278>
+ DB 68,15,40,37,234,0,1,0 ; movaps 0x100ea(%rip),%xmm12 # 2d7e0 <_sk_overlay_sse2_8bit+0x1288>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,214,0,1,0 ; movaps 0x100d6(%rip),%xmm12 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
+ DB 68,15,40,37,234,0,1,0 ; movaps 0x100ea(%rip),%xmm12 # 2d7f0 <_sk_overlay_sse2_8bit+0x1298>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,218,0,1,0 ; movaps 0x100da(%rip),%xmm13 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
+ DB 68,15,40,45,238,0,1,0 ; movaps 0x100ee(%rip),%xmm13 # 2d800 <_sk_overlay_sse2_8bit+0x12a8>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,218,0,1,0 ; mulps 0x100da(%rip),%xmm13 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
+ DB 68,15,89,45,238,0,1,0 ; mulps 0x100ee(%rip),%xmm13 # 2d810 <_sk_overlay_sse2_8bit+0x12b8>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27931,15 +27925,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,170,255,0,0 ; mulps 0xffaa(%rip),%xmm9 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
- DB 68,15,84,21,178,255,0,0 ; andps 0xffb2(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
- DB 68,15,86,21,202,252,0,0 ; orps 0xfcca(%rip),%xmm10 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
- DB 68,15,88,13,178,255,0,0 ; addps 0xffb2(%rip),%xmm9 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
- DB 68,15,40,37,186,255,0,0 ; movaps 0xffba(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
+ DB 68,15,89,13,190,255,0,0 ; mulps 0xffbe(%rip),%xmm9 # 2d770 <_sk_overlay_sse2_8bit+0x1218>
+ DB 68,15,84,21,198,255,0,0 ; andps 0xffc6(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1228>
+ DB 68,15,86,21,238,252,0,0 ; orps 0xfcee(%rip),%xmm10 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
+ DB 68,15,88,13,198,255,0,0 ; addps 0xffc6(%rip),%xmm9 # 2d790 <_sk_overlay_sse2_8bit+0x1238>
+ DB 68,15,40,37,206,255,0,0 ; movaps 0xffce(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1248>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,186,255,0,0 ; addps 0xffba(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
- DB 68,15,40,37,194,255,0,0 ; movaps 0xffc2(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
+ DB 68,15,88,21,206,255,0,0 ; addps 0xffce(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1258>
+ DB 68,15,40,37,214,255,0,0 ; movaps 0xffd6(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1268>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27947,22 +27941,22 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,156,252,0,0 ; movaps 0xfc9c(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,21,176,252,0,0 ; movaps 0xfcb0(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,144,255,0,0 ; addps 0xff90(%rip),%xmm9 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
- DB 68,15,40,37,152,255,0,0 ; movaps 0xff98(%rip),%xmm12 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
+ DB 68,15,88,13,164,255,0,0 ; addps 0xffa4(%rip),%xmm9 # 2d7d0 <_sk_overlay_sse2_8bit+0x1278>
+ DB 68,15,40,37,172,255,0,0 ; movaps 0xffac(%rip),%xmm12 # 2d7e0 <_sk_overlay_sse2_8bit+0x1288>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,152,255,0,0 ; movaps 0xff98(%rip),%xmm12 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
+ DB 68,15,40,37,172,255,0,0 ; movaps 0xffac(%rip),%xmm12 # 2d7f0 <_sk_overlay_sse2_8bit+0x1298>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,156,255,0,0 ; movaps 0xff9c(%rip),%xmm13 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
+ DB 68,15,40,45,176,255,0,0 ; movaps 0xffb0(%rip),%xmm13 # 2d800 <_sk_overlay_sse2_8bit+0x12a8>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,156,255,0,0 ; mulps 0xff9c(%rip),%xmm13 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
+ DB 68,15,89,45,176,255,0,0 ; mulps 0xffb0(%rip),%xmm13 # 2d810 <_sk_overlay_sse2_8bit+0x12b8>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27996,15 +27990,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,108,254,0,0 ; mulps 0xfe6c(%rip),%xmm9 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
- DB 68,15,84,21,116,254,0,0 ; andps 0xfe74(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
- DB 68,15,86,21,140,251,0,0 ; orps 0xfb8c(%rip),%xmm10 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
- DB 68,15,88,13,116,254,0,0 ; addps 0xfe74(%rip),%xmm9 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
- DB 68,15,40,37,124,254,0,0 ; movaps 0xfe7c(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
+ DB 68,15,89,13,128,254,0,0 ; mulps 0xfe80(%rip),%xmm9 # 2d770 <_sk_overlay_sse2_8bit+0x1218>
+ DB 68,15,84,21,136,254,0,0 ; andps 0xfe88(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1228>
+ DB 68,15,86,21,176,251,0,0 ; orps 0xfbb0(%rip),%xmm10 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
+ DB 68,15,88,13,136,254,0,0 ; addps 0xfe88(%rip),%xmm9 # 2d790 <_sk_overlay_sse2_8bit+0x1238>
+ DB 68,15,40,37,144,254,0,0 ; movaps 0xfe90(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1248>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,124,254,0,0 ; addps 0xfe7c(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
- DB 68,15,40,37,132,254,0,0 ; movaps 0xfe84(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
+ DB 68,15,88,21,144,254,0,0 ; addps 0xfe90(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1258>
+ DB 68,15,40,37,152,254,0,0 ; movaps 0xfe98(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1268>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -28012,22 +28006,22 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,94,251,0,0 ; movaps 0xfb5e(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,21,114,251,0,0 ; movaps 0xfb72(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,82,254,0,0 ; addps 0xfe52(%rip),%xmm9 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
- DB 68,15,40,37,90,254,0,0 ; movaps 0xfe5a(%rip),%xmm12 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
+ DB 68,15,88,13,102,254,0,0 ; addps 0xfe66(%rip),%xmm9 # 2d7d0 <_sk_overlay_sse2_8bit+0x1278>
+ DB 68,15,40,37,110,254,0,0 ; movaps 0xfe6e(%rip),%xmm12 # 2d7e0 <_sk_overlay_sse2_8bit+0x1288>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,90,254,0,0 ; movaps 0xfe5a(%rip),%xmm12 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
+ DB 68,15,40,37,110,254,0,0 ; movaps 0xfe6e(%rip),%xmm12 # 2d7f0 <_sk_overlay_sse2_8bit+0x1298>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,94,254,0,0 ; movaps 0xfe5e(%rip),%xmm13 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
+ DB 68,15,40,45,114,254,0,0 ; movaps 0xfe72(%rip),%xmm13 # 2d800 <_sk_overlay_sse2_8bit+0x12a8>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,94,254,0,0 ; mulps 0xfe5e(%rip),%xmm13 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
+ DB 68,15,89,45,114,254,0,0 ; mulps 0xfe72(%rip),%xmm13 # 2d810 <_sk_overlay_sse2_8bit+0x12b8>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -28051,19 +28045,19 @@ _sk_gamma_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,5,102,253,0,0 ; mulps 0xfd66(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
- DB 15,84,21,111,253,0,0 ; andps 0xfd6f(%rip),%xmm2 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
- DB 68,15,40,53,135,250,0,0 ; movaps 0xfa87(%rip),%xmm14 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 15,89,5,122,253,0,0 ; mulps 0xfd7a(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1218>
+ DB 15,84,21,131,253,0,0 ; andps 0xfd83(%rip),%xmm2 # 2d780 <_sk_overlay_sse2_8bit+0x1228>
+ DB 68,15,40,53,171,250,0,0 ; movaps 0xfaab(%rip),%xmm14 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 65,15,86,214 ; orps %xmm14,%xmm2
- DB 68,15,40,37,107,253,0,0 ; movaps 0xfd6b(%rip),%xmm12 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
+ DB 68,15,40,37,127,253,0,0 ; movaps 0xfd7f(%rip),%xmm12 # 2d790 <_sk_overlay_sse2_8bit+0x1238>
DB 65,15,88,196 ; addps %xmm12,%xmm0
- DB 68,15,40,29,111,253,0,0 ; movaps 0xfd6f(%rip),%xmm11 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
+ DB 68,15,40,29,131,253,0,0 ; movaps 0xfd83(%rip),%xmm11 # 2d7a0 <_sk_overlay_sse2_8bit+0x1248>
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 65,15,89,227 ; mulps %xmm11,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 68,15,40,21,109,253,0,0 ; movaps 0xfd6d(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
+ DB 68,15,40,21,129,253,0,0 ; movaps 0xfd81(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1258>
DB 65,15,88,210 ; addps %xmm10,%xmm2
- DB 68,15,40,45,113,253,0,0 ; movaps 0xfd71(%rip),%xmm13 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
+ DB 68,15,40,45,133,253,0,0 ; movaps 0xfd85(%rip),%xmm13 # 2d7c0 <_sk_overlay_sse2_8bit+0x1268>
DB 65,15,40,229 ; movaps %xmm13,%xmm4
DB 15,94,226 ; divps %xmm2,%xmm4
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -28075,27 +28069,27 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,194,226,1 ; cmpltps %xmm2,%xmm4
- DB 68,15,40,13,65,250,0,0 ; movaps 0xfa41(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,13,85,250,0,0 ; movaps 0xfa55(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 65,15,84,225 ; andps %xmm9,%xmm4
DB 15,92,212 ; subps %xmm4,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,53,61,253,0,0 ; movaps 0xfd3d(%rip),%xmm6 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
+ DB 15,40,53,81,253,0,0 ; movaps 0xfd51(%rip),%xmm6 # 2d7d0 <_sk_overlay_sse2_8bit+0x1278>
DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,40,61,83,253,0,0 ; movaps 0xfd53(%rip),%xmm7 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
+ DB 15,40,61,103,253,0,0 ; movaps 0xfd67(%rip),%xmm7 # 2d7f0 <_sk_overlay_sse2_8bit+0x1298>
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,37,51,253,0,0 ; movaps 0xfd33(%rip),%xmm4 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
+ DB 15,40,37,71,253,0,0 ; movaps 0xfd47(%rip),%xmm4 # 2d7e0 <_sk_overlay_sse2_8bit+0x1288>
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,92,194 ; subps %xmm2,%xmm0
- DB 68,15,40,61,69,253,0,0 ; movaps 0xfd45(%rip),%xmm15 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
+ DB 68,15,40,61,89,253,0,0 ; movaps 0xfd59(%rip),%xmm15 # 2d800 <_sk_overlay_sse2_8bit+0x12a8>
DB 65,15,40,215 ; movaps %xmm15,%xmm2
DB 15,94,213 ; divps %xmm5,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,5,161,252,0,0 ; mulps 0xfca1(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
- DB 15,84,13,170,252,0,0 ; andps 0xfcaa(%rip),%xmm1 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
+ DB 15,89,5,181,252,0,0 ; mulps 0xfcb5(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1218>
+ DB 15,84,13,190,252,0,0 ; andps 0xfcbe(%rip),%xmm1 # 2d780 <_sk_overlay_sse2_8bit+0x1228>
DB 65,15,86,206 ; orps %xmm14,%xmm1
DB 65,15,88,196 ; addps %xmm12,%xmm0
DB 15,40,233 ; movaps %xmm1,%xmm5
@@ -28125,9 +28119,9 @@ _sk_gamma_sse2 LABEL PROC
DB 15,94,206 ; divps %xmm6,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,5,48,252,0,0 ; mulps 0xfc30(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
- DB 15,84,29,57,252,0,0 ; andps 0xfc39(%rip),%xmm3 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
- DB 15,86,29,82,249,0,0 ; orps 0xf952(%rip),%xmm3 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 15,89,5,68,252,0,0 ; mulps 0xfc44(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1218>
+ DB 15,84,29,77,252,0,0 ; andps 0xfc4d(%rip),%xmm3 # 2d780 <_sk_overlay_sse2_8bit+0x1228>
+ DB 15,86,29,118,249,0,0 ; orps 0xf976(%rip),%xmm3 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 65,15,88,196 ; addps %xmm12,%xmm0
DB 68,15,89,219 ; mulps %xmm3,%xmm11
DB 65,15,92,195 ; subps %xmm11,%xmm0
@@ -28149,7 +28143,7 @@ _sk_gamma_sse2 LABEL PROC
DB 15,92,253 ; subps %xmm5,%xmm7
DB 68,15,94,255 ; divps %xmm7,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 15,40,5,111,252,0,0 ; movaps 0xfc6f(%rip),%xmm0 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
+ DB 15,40,5,131,252,0,0 ; movaps 0xfc83(%rip),%xmm0 # 2d810 <_sk_overlay_sse2_8bit+0x12b8>
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 68,15,89,248 ; mulps %xmm0,%xmm15
@@ -28167,29 +28161,29 @@ _sk_gamma_sse2 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse2
_sk_lab_to_xyz_sse2 LABEL PROC
- DB 15,89,5,65,252,0,0 ; mulps 0xfc41(%rip),%xmm0 # 2d820 <_sk_overlay_sse2_8bit+0x12b4>
- DB 68,15,40,5,185,249,0,0 ; movaps 0xf9b9(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
+ DB 15,89,5,85,252,0,0 ; mulps 0xfc55(%rip),%xmm0 # 2d820 <_sk_overlay_sse2_8bit+0x12c8>
+ DB 68,15,40,5,205,249,0,0 ; movaps 0xf9cd(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1048>
DB 65,15,89,200 ; mulps %xmm8,%xmm1
- DB 68,15,40,13,61,252,0,0 ; movaps 0xfc3d(%rip),%xmm9 # 2d830 <_sk_overlay_sse2_8bit+0x12c4>
+ DB 68,15,40,13,81,252,0,0 ; movaps 0xfc51(%rip),%xmm9 # 2d830 <_sk_overlay_sse2_8bit+0x12d8>
DB 65,15,88,201 ; addps %xmm9,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 15,88,5,58,252,0,0 ; addps 0xfc3a(%rip),%xmm0 # 2d840 <_sk_overlay_sse2_8bit+0x12d4>
- DB 15,89,5,67,252,0,0 ; mulps 0xfc43(%rip),%xmm0 # 2d850 <_sk_overlay_sse2_8bit+0x12e4>
- DB 15,89,13,76,252,0,0 ; mulps 0xfc4c(%rip),%xmm1 # 2d860 <_sk_overlay_sse2_8bit+0x12f4>
+ DB 15,88,5,78,252,0,0 ; addps 0xfc4e(%rip),%xmm0 # 2d840 <_sk_overlay_sse2_8bit+0x12e8>
+ DB 15,89,5,87,252,0,0 ; mulps 0xfc57(%rip),%xmm0 # 2d850 <_sk_overlay_sse2_8bit+0x12f8>
+ DB 15,89,13,96,252,0,0 ; mulps 0xfc60(%rip),%xmm1 # 2d860 <_sk_overlay_sse2_8bit+0x1308>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,21,82,252,0,0 ; mulps 0xfc52(%rip),%xmm2 # 2d870 <_sk_overlay_sse2_8bit+0x1304>
+ DB 15,89,21,102,252,0,0 ; mulps 0xfc66(%rip),%xmm2 # 2d870 <_sk_overlay_sse2_8bit+0x1318>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 68,15,92,202 ; subps %xmm2,%xmm9
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
DB 68,15,89,225 ; mulps %xmm1,%xmm12
- DB 15,40,21,71,252,0,0 ; movaps 0xfc47(%rip),%xmm2 # 2d880 <_sk_overlay_sse2_8bit+0x1314>
+ DB 15,40,21,91,252,0,0 ; movaps 0xfc5b(%rip),%xmm2 # 2d880 <_sk_overlay_sse2_8bit+0x1328>
DB 68,15,40,194 ; movaps %xmm2,%xmm8
DB 69,15,194,196,1 ; cmpltps %xmm12,%xmm8
- DB 68,15,40,21,70,252,0,0 ; movaps 0xfc46(%rip),%xmm10 # 2d890 <_sk_overlay_sse2_8bit+0x1324>
+ DB 68,15,40,21,90,252,0,0 ; movaps 0xfc5a(%rip),%xmm10 # 2d890 <_sk_overlay_sse2_8bit+0x1338>
DB 65,15,88,202 ; addps %xmm10,%xmm1
- DB 68,15,40,29,74,252,0,0 ; movaps 0xfc4a(%rip),%xmm11 # 2d8a0 <_sk_overlay_sse2_8bit+0x1334>
+ DB 68,15,40,29,94,252,0,0 ; movaps 0xfc5e(%rip),%xmm11 # 2d8a0 <_sk_overlay_sse2_8bit+0x1348>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 69,15,84,224 ; andps %xmm8,%xmm12
DB 68,15,85,193 ; andnps %xmm1,%xmm8
@@ -28213,8 +28207,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,84,194 ; andps %xmm2,%xmm0
DB 65,15,85,209 ; andnps %xmm9,%xmm2
DB 15,86,208 ; orps %xmm0,%xmm2
- DB 68,15,89,5,250,251,0,0 ; mulps 0xfbfa(%rip),%xmm8 # 2d8b0 <_sk_overlay_sse2_8bit+0x1344>
- DB 15,89,21,3,252,0,0 ; mulps 0xfc03(%rip),%xmm2 # 2d8c0 <_sk_overlay_sse2_8bit+0x1354>
+ DB 68,15,89,5,14,252,0,0 ; mulps 0xfc0e(%rip),%xmm8 # 2d8b0 <_sk_overlay_sse2_8bit+0x1358>
+ DB 15,89,21,23,252,0,0 ; mulps 0xfc17(%rip),%xmm2 # 2d8c0 <_sk_overlay_sse2_8bit+0x1368>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -28228,13 +28222,13 @@ _sk_load_a8_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,46 ; jne 1dd0b <_sk_load_a8_sse2+0x46>
+ DB 117,46 ; jne 1dcf7 <_sk_load_a8_sse2+0x46>
DB 102,67,15,110,4,16 ; movd (%r8,%r10,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,125,248,0,0 ; pand 0xf87d(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,219,5,145,248,0,0 ; pand 0xf891(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,195,249,0,0 ; mulps 0xf9c3(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 15,89,29,215,249,0,0 ; mulps 0xf9d7(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
@@ -28243,12 +28237,12 @@ _sk_load_a8_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,54 ; je 1dd4e <_sk_load_a8_sse2+0x89>
+ DB 116,54 ; je 1dd3a <_sk_load_a8_sse2+0x89>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 1dd37 <_sk_load_a8_sse2+0x72>
+ DB 116,21 ; je 1dd23 <_sk_load_a8_sse2+0x72>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,195 ; jne 1dceb <_sk_load_a8_sse2+0x26>
+ DB 117,195 ; jne 1dcd7 <_sk_load_a8_sse2+0x26>
DB 67,15,182,68,16,2 ; movzbl 0x2(%r8,%r10,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -28257,10 +28251,10 @@ _sk_load_a8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,157 ; jmp 1dceb <_sk_load_a8_sse2+0x26>
+ DB 235,157 ; jmp 1dcd7 <_sk_load_a8_sse2+0x26>
DB 67,15,182,4,16 ; movzbl (%r8,%r10,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,146 ; jmp 1dceb <_sk_load_a8_sse2+0x26>
+ DB 235,146 ; jmp 1dcd7 <_sk_load_a8_sse2+0x26>
PUBLIC _sk_load_a8_dst_sse2
_sk_load_a8_dst_sse2 LABEL PROC
@@ -28271,13 +28265,13 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,46 ; jne 1dd9f <_sk_load_a8_dst_sse2+0x46>
+ DB 117,46 ; jne 1dd8b <_sk_load_a8_dst_sse2+0x46>
DB 102,67,15,110,36,16 ; movd (%r8,%r10,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,37,233,247,0,0 ; pand 0xf7e9(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,219,37,253,247,0,0 ; pand 0xf7fd(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
- DB 15,89,61,47,249,0,0 ; mulps 0xf92f(%rip),%xmm7 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 15,89,61,67,249,0,0 ; mulps 0xf943(%rip),%xmm7 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
@@ -28286,12 +28280,12 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,54 ; je 1dde2 <_sk_load_a8_dst_sse2+0x89>
+ DB 116,54 ; je 1ddce <_sk_load_a8_dst_sse2+0x89>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 1ddcb <_sk_load_a8_dst_sse2+0x72>
+ DB 116,21 ; je 1ddb7 <_sk_load_a8_dst_sse2+0x72>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,195 ; jne 1dd7f <_sk_load_a8_dst_sse2+0x26>
+ DB 117,195 ; jne 1dd6b <_sk_load_a8_dst_sse2+0x26>
DB 67,15,182,68,16,2 ; movzbl 0x2(%r8,%r10,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -28300,10 +28294,10 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,157 ; jmp 1dd7f <_sk_load_a8_dst_sse2+0x26>
+ DB 235,157 ; jmp 1dd6b <_sk_load_a8_dst_sse2+0x26>
DB 67,15,182,4,16 ; movzbl (%r8,%r10,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,146 ; jmp 1dd7f <_sk_load_a8_dst_sse2+0x26>
+ DB 235,146 ; jmp 1dd6b <_sk_load_a8_dst_sse2+0x26>
PUBLIC _sk_gather_a8_sse2
_sk_gather_a8_sse2 LABEL PROC
@@ -28341,7 +28335,7 @@ _sk_gather_a8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,62,248,0,0 ; mulps 0xf83e(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 15,89,29,82,248,0,0 ; mulps 0xf852(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -28357,7 +28351,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 77,15,175,193 ; imul %r9,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
- DB 68,15,40,5,240,246,0,0 ; movaps 0xf6f0(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
+ DB 68,15,40,5,4,247,0,0 ; movaps 0xf704(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1048>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,65,15,114,240,16 ; pslld $0x10,%xmm8
@@ -28365,7 +28359,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 1dee5 <_sk_store_a8_sse2+0x54>
+ DB 117,17 ; jne 1ded1 <_sk_store_a8_sse2+0x54>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 67,137,4,16 ; mov %eax,(%r8,%r10,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -28376,24 +28370,24 @@ _sk_store_a8_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,59 ; je 1df37 <_sk_store_a8_sse2+0xa6>
+ DB 116,59 ; je 1df23 <_sk_store_a8_sse2+0xa6>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,22 ; je 1df18 <_sk_store_a8_sse2+0x87>
+ DB 116,22 ; je 1df04 <_sk_store_a8_sse2+0x87>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,213 ; jne 1dedd <_sk_store_a8_sse2+0x4c>
+ DB 117,213 ; jne 1dec9 <_sk_store_a8_sse2+0x4c>
DB 102,68,15,127,68,36,16 ; movdqa %xmm8,0x10(%rsp)
DB 138,68,36,24 ; mov 0x18(%rsp),%al
DB 67,136,68,16,2 ; mov %al,0x2(%r8,%r10,1)
- DB 102,68,15,219,5,79,246,0,0 ; pand 0xf64f(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,68,15,219,5,99,246,0,0 ; pand 0xf663(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,16 ; mov %ax,(%r8,%r10,1)
- DB 235,166 ; jmp 1dedd <_sk_store_a8_sse2+0x4c>
+ DB 235,166 ; jmp 1dec9 <_sk_store_a8_sse2+0x4c>
DB 102,68,15,127,4,36 ; movdqa %xmm8,(%rsp)
DB 138,4,36 ; mov (%rsp),%al
DB 67,136,4,16 ; mov %al,(%r8,%r10,1)
- DB 235,151 ; jmp 1dedd <_sk_store_a8_sse2+0x4c>
+ DB 235,151 ; jmp 1dec9 <_sk_store_a8_sse2+0x4c>
PUBLIC _sk_load_g8_sse2
_sk_load_g8_sse2 LABEL PROC
@@ -28404,27 +28398,27 @@ _sk_load_g8_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,49 ; jne 1df8f <_sk_load_g8_sse2+0x49>
+ DB 117,49 ; jne 1df7b <_sk_load_g8_sse2+0x49>
DB 102,67,15,110,4,16 ; movd (%r8,%r10,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,252,245,0,0 ; pand 0xf5fc(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,219,5,16,246,0,0 ; pand 0xf610(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,66,247,0,0 ; mulps 0xf742(%rip),%xmm0 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 15,89,5,86,247,0,0 ; mulps 0xf756(%rip),%xmm0 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,57,245,0,0 ; movaps 0xf539(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,77,245,0,0 ; movaps 0xf54d(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,54 ; je 1dfd2 <_sk_load_g8_sse2+0x8c>
+ DB 116,54 ; je 1dfbe <_sk_load_g8_sse2+0x8c>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 1dfbb <_sk_load_g8_sse2+0x75>
+ DB 116,21 ; je 1dfa7 <_sk_load_g8_sse2+0x75>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,192 ; jne 1df6c <_sk_load_g8_sse2+0x26>
+ DB 117,192 ; jne 1df58 <_sk_load_g8_sse2+0x26>
DB 67,15,182,68,16,2 ; movzbl 0x2(%r8,%r10,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -28433,10 +28427,10 @@ _sk_load_g8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,154 ; jmp 1df6c <_sk_load_g8_sse2+0x26>
+ DB 235,154 ; jmp 1df58 <_sk_load_g8_sse2+0x26>
DB 67,15,182,4,16 ; movzbl (%r8,%r10,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,143 ; jmp 1df6c <_sk_load_g8_sse2+0x26>
+ DB 235,143 ; jmp 1df58 <_sk_load_g8_sse2+0x26>
PUBLIC _sk_load_g8_dst_sse2
_sk_load_g8_dst_sse2 LABEL PROC
@@ -28447,27 +28441,27 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,49 ; jne 1e026 <_sk_load_g8_dst_sse2+0x49>
+ DB 117,49 ; jne 1e012 <_sk_load_g8_dst_sse2+0x49>
DB 102,67,15,110,36,16 ; movd (%r8,%r10,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,37,101,245,0,0 ; pand 0xf565(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,219,37,121,245,0,0 ; pand 0xf579(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,171,246,0,0 ; mulps 0xf6ab(%rip),%xmm4 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 15,89,37,191,246,0,0 ; mulps 0xf6bf(%rip),%xmm4 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,162,244,0,0 ; movaps 0xf4a2(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,61,182,244,0,0 ; movaps 0xf4b6(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,54 ; je 1e069 <_sk_load_g8_dst_sse2+0x8c>
+ DB 116,54 ; je 1e055 <_sk_load_g8_dst_sse2+0x8c>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 1e052 <_sk_load_g8_dst_sse2+0x75>
+ DB 116,21 ; je 1e03e <_sk_load_g8_dst_sse2+0x75>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,192 ; jne 1e003 <_sk_load_g8_dst_sse2+0x26>
+ DB 117,192 ; jne 1dfef <_sk_load_g8_dst_sse2+0x26>
DB 67,15,182,68,16,2 ; movzbl 0x2(%r8,%r10,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -28476,10 +28470,10 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,154 ; jmp 1e003 <_sk_load_g8_dst_sse2+0x26>
+ DB 235,154 ; jmp 1dfef <_sk_load_g8_dst_sse2+0x26>
DB 67,15,182,4,16 ; movzbl (%r8,%r10,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,143 ; jmp 1e003 <_sk_load_g8_dst_sse2+0x26>
+ DB 235,143 ; jmp 1dfef <_sk_load_g8_dst_sse2+0x26>
PUBLIC _sk_gather_g8_sse2
_sk_gather_g8_sse2 LABEL PROC
@@ -28517,9 +28511,9 @@ _sk_gather_g8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,183,245,0,0 ; mulps 0xf5b7(%rip),%xmm0 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 15,89,5,203,245,0,0 ; mulps 0xf5cb(%rip),%xmm0 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,174,243,0,0 ; movaps 0xf3ae(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,194,243,0,0 ; movaps 0xf3c2(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
@@ -28534,42 +28528,42 @@ _sk_load_565_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,83 ; jne 1e188 <_sk_load_565_sse2+0x6e>
+ DB 117,83 ; jne 1e174 <_sk_load_565_sse2+0x6e>
DB 243,67,15,126,20,80 ; movq (%r8,%r10,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,137,245,0,0 ; movdqa 0xf589(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
+ DB 102,15,111,5,157,245,0,0 ; movdqa 0xf59d(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1178>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,139,245,0,0 ; mulps 0xf58b(%rip),%xmm0 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
- DB 102,15,111,13,147,245,0,0 ; movdqa 0xf593(%rip),%xmm1 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
+ DB 15,89,5,159,245,0,0 ; mulps 0xf59f(%rip),%xmm0 # 2d6e0 <_sk_overlay_sse2_8bit+0x1188>
+ DB 102,15,111,13,167,245,0,0 ; movdqa 0xf5a7(%rip),%xmm1 # 2d6f0 <_sk_overlay_sse2_8bit+0x1198>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,149,245,0,0 ; mulps 0xf595(%rip),%xmm1 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
- DB 102,15,219,21,157,245,0,0 ; pand 0xf59d(%rip),%xmm2 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
+ DB 15,89,13,169,245,0,0 ; mulps 0xf5a9(%rip),%xmm1 # 2d700 <_sk_overlay_sse2_8bit+0x11a8>
+ DB 102,15,219,21,177,245,0,0 ; pand 0xf5b1(%rip),%xmm2 # 2d710 <_sk_overlay_sse2_8bit+0x11b8>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,163,245,0,0 ; mulps 0xf5a3(%rip),%xmm2 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
+ DB 15,89,21,183,245,0,0 ; mulps 0xf5b7(%rip),%xmm2 # 2d720 <_sk_overlay_sse2_8bit+0x11c8>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,58,243,0,0 ; movaps 0xf33a(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,78,243,0,0 ; movaps 0xf34e(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,50 ; je 1e1c7 <_sk_load_565_sse2+0xad>
+ DB 116,50 ; je 1e1b3 <_sk_load_565_sse2+0xad>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 1e1b4 <_sk_load_565_sse2+0x9a>
+ DB 116,21 ; je 1e1a0 <_sk_load_565_sse2+0x9a>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,154 ; jne 1e13f <_sk_load_565_sse2+0x25>
+ DB 117,154 ; jne 1e12b <_sk_load_565_sse2+0x25>
DB 67,15,183,68,80,4 ; movzwl 0x4(%r8,%r10,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,67,15,110,4,80 ; movd (%r8,%r10,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,208 ; movsd %xmm0,%xmm2
- DB 233,120,255,255,255 ; jmpq 1e13f <_sk_load_565_sse2+0x25>
+ DB 233,120,255,255,255 ; jmpq 1e12b <_sk_load_565_sse2+0x25>
DB 67,15,183,4,80 ; movzwl (%r8,%r10,2),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,106,255,255,255 ; jmpq 1e13f <_sk_load_565_sse2+0x25>
+ DB 233,106,255,255,255 ; jmpq 1e12b <_sk_load_565_sse2+0x25>
PUBLIC _sk_load_565_dst_sse2
_sk_load_565_dst_sse2 LABEL PROC
@@ -28581,42 +28575,42 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,83 ; jne 1e243 <_sk_load_565_dst_sse2+0x6e>
+ DB 117,83 ; jne 1e22f <_sk_load_565_dst_sse2+0x6e>
DB 243,67,15,126,52,80 ; movq (%r8,%r10,2),%xmm6
DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,111,37,206,244,0,0 ; movdqa 0xf4ce(%rip),%xmm4 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
+ DB 102,15,111,37,226,244,0,0 ; movdqa 0xf4e2(%rip),%xmm4 # 2d6d0 <_sk_overlay_sse2_8bit+0x1178>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,208,244,0,0 ; mulps 0xf4d0(%rip),%xmm4 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
- DB 102,15,111,45,216,244,0,0 ; movdqa 0xf4d8(%rip),%xmm5 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
+ DB 15,89,37,228,244,0,0 ; mulps 0xf4e4(%rip),%xmm4 # 2d6e0 <_sk_overlay_sse2_8bit+0x1188>
+ DB 102,15,111,45,236,244,0,0 ; movdqa 0xf4ec(%rip),%xmm5 # 2d6f0 <_sk_overlay_sse2_8bit+0x1198>
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,218,244,0,0 ; mulps 0xf4da(%rip),%xmm5 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
- DB 102,15,219,53,226,244,0,0 ; pand 0xf4e2(%rip),%xmm6 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
+ DB 15,89,45,238,244,0,0 ; mulps 0xf4ee(%rip),%xmm5 # 2d700 <_sk_overlay_sse2_8bit+0x11a8>
+ DB 102,15,219,53,246,244,0,0 ; pand 0xf4f6(%rip),%xmm6 # 2d710 <_sk_overlay_sse2_8bit+0x11b8>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,232,244,0,0 ; mulps 0xf4e8(%rip),%xmm6 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
+ DB 15,89,53,252,244,0,0 ; mulps 0xf4fc(%rip),%xmm6 # 2d720 <_sk_overlay_sse2_8bit+0x11c8>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,127,242,0,0 ; movaps 0xf27f(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,61,147,242,0,0 ; movaps 0xf293(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,50 ; je 1e282 <_sk_load_565_dst_sse2+0xad>
+ DB 116,50 ; je 1e26e <_sk_load_565_dst_sse2+0xad>
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 1e26f <_sk_load_565_dst_sse2+0x9a>
+ DB 116,21 ; je 1e25b <_sk_load_565_dst_sse2+0x9a>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,154 ; jne 1e1fa <_sk_load_565_dst_sse2+0x25>
+ DB 117,154 ; jne 1e1e6 <_sk_load_565_dst_sse2+0x25>
DB 67,15,183,68,80,4 ; movzwl 0x4(%r8,%r10,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
DB 102,67,15,110,36,80 ; movd (%r8,%r10,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 242,15,16,244 ; movsd %xmm4,%xmm6
- DB 233,120,255,255,255 ; jmpq 1e1fa <_sk_load_565_dst_sse2+0x25>
+ DB 233,120,255,255,255 ; jmpq 1e1e6 <_sk_load_565_dst_sse2+0x25>
DB 67,15,183,4,80 ; movzwl (%r8,%r10,2),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,106,255,255,255 ; jmpq 1e1fa <_sk_load_565_dst_sse2+0x25>
+ DB 233,106,255,255,255 ; jmpq 1e1e6 <_sk_load_565_dst_sse2+0x25>
PUBLIC _sk_gather_565_sse2
_sk_gather_565_sse2 LABEL PROC
@@ -28648,19 +28642,19 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,208,3 ; pinsrw $0x3,%eax,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,186,243,0,0 ; movdqa 0xf3ba(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
+ DB 102,15,111,5,206,243,0,0 ; movdqa 0xf3ce(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1178>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,188,243,0,0 ; mulps 0xf3bc(%rip),%xmm0 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
- DB 102,15,111,13,196,243,0,0 ; movdqa 0xf3c4(%rip),%xmm1 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
+ DB 15,89,5,208,243,0,0 ; mulps 0xf3d0(%rip),%xmm0 # 2d6e0 <_sk_overlay_sse2_8bit+0x1188>
+ DB 102,15,111,13,216,243,0,0 ; movdqa 0xf3d8(%rip),%xmm1 # 2d6f0 <_sk_overlay_sse2_8bit+0x1198>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,198,243,0,0 ; mulps 0xf3c6(%rip),%xmm1 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
- DB 102,15,219,21,206,243,0,0 ; pand 0xf3ce(%rip),%xmm2 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
+ DB 15,89,13,218,243,0,0 ; mulps 0xf3da(%rip),%xmm1 # 2d700 <_sk_overlay_sse2_8bit+0x11a8>
+ DB 102,15,219,21,226,243,0,0 ; pand 0xf3e2(%rip),%xmm2 # 2d710 <_sk_overlay_sse2_8bit+0x11b8>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,212,243,0,0 ; mulps 0xf3d4(%rip),%xmm2 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
+ DB 15,89,21,232,243,0,0 ; mulps 0xf3e8(%rip),%xmm2 # 2d720 <_sk_overlay_sse2_8bit+0x11c8>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,107,241,0,0 ; movaps 0xf16b(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,127,241,0,0 ; movaps 0xf17f(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_sse2
@@ -28672,12 +28666,12 @@ _sk_store_565_sse2 LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
- DB 68,15,40,5,107,245,0,0 ; movaps 0xf56b(%rip),%xmm8 # 2d8e0 <_sk_overlay_sse2_8bit+0x1374>
+ DB 68,15,40,5,127,245,0,0 ; movaps 0xf57f(%rip),%xmm8 # 2d8e0 <_sk_overlay_sse2_8bit+0x1388>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,96,245,0,0 ; movaps 0xf560(%rip),%xmm10 # 2d8f0 <_sk_overlay_sse2_8bit+0x1384>
+ DB 68,15,40,21,116,245,0,0 ; movaps 0xf574(%rip),%xmm10 # 2d8f0 <_sk_overlay_sse2_8bit+0x1398>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -28689,7 +28683,7 @@ _sk_store_565_sse2 LABEL PROC
DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 1e3d2 <_sk_store_565_sse2+0x7b>
+ DB 117,10 ; jne 1e3be <_sk_store_565_sse2+0x7b>
DB 242,71,15,17,4,80 ; movsd %xmm8,(%r8,%r10,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28697,19 +28691,19 @@ _sk_store_565_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,38 ; je 1e40a <_sk_store_565_sse2+0xb3>
+ DB 116,38 ; je 1e3f6 <_sk_store_565_sse2+0xb3>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 1e3fc <_sk_store_565_sse2+0xa5>
+ DB 116,18 ; je 1e3e8 <_sk_store_565_sse2+0xa5>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,222 ; jne 1e3ce <_sk_store_565_sse2+0x77>
+ DB 117,222 ; jne 1e3ba <_sk_store_565_sse2+0x77>
DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax
DB 102,67,137,68,80,4 ; mov %ax,0x4(%r8,%r10,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,71,15,126,4,80 ; movd %xmm8,(%r8,%r10,2)
- DB 235,196 ; jmp 1e3ce <_sk_store_565_sse2+0x77>
+ DB 235,196 ; jmp 1e3ba <_sk_store_565_sse2+0x77>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,80 ; mov %ax,(%r8,%r10,2)
- DB 235,184 ; jmp 1e3ce <_sk_store_565_sse2+0x77>
+ DB 235,184 ; jmp 1e3ba <_sk_store_565_sse2+0x77>
PUBLIC _sk_load_4444_sse2
_sk_load_4444_sse2 LABEL PROC
@@ -28721,45 +28715,45 @@ _sk_load_4444_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,98 ; jne 1e493 <_sk_load_4444_sse2+0x7d>
+ DB 117,98 ; jne 1e47f <_sk_load_4444_sse2+0x7d>
DB 243,67,15,126,28,80 ; movq (%r8,%r10,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,189,244,0,0 ; movdqa 0xf4bd(%rip),%xmm0 # 2d900 <_sk_overlay_sse2_8bit+0x1394>
+ DB 102,15,111,5,209,244,0,0 ; movdqa 0xf4d1(%rip),%xmm0 # 2d900 <_sk_overlay_sse2_8bit+0x13a8>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,191,244,0,0 ; mulps 0xf4bf(%rip),%xmm0 # 2d910 <_sk_overlay_sse2_8bit+0x13a4>
- DB 102,15,111,13,199,244,0,0 ; movdqa 0xf4c7(%rip),%xmm1 # 2d920 <_sk_overlay_sse2_8bit+0x13b4>
+ DB 15,89,5,211,244,0,0 ; mulps 0xf4d3(%rip),%xmm0 # 2d910 <_sk_overlay_sse2_8bit+0x13b8>
+ DB 102,15,111,13,219,244,0,0 ; movdqa 0xf4db(%rip),%xmm1 # 2d920 <_sk_overlay_sse2_8bit+0x13c8>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,201,244,0,0 ; mulps 0xf4c9(%rip),%xmm1 # 2d930 <_sk_overlay_sse2_8bit+0x13c4>
- DB 102,15,111,21,209,244,0,0 ; movdqa 0xf4d1(%rip),%xmm2 # 2d940 <_sk_overlay_sse2_8bit+0x13d4>
+ DB 15,89,13,221,244,0,0 ; mulps 0xf4dd(%rip),%xmm1 # 2d930 <_sk_overlay_sse2_8bit+0x13d8>
+ DB 102,15,111,21,229,244,0,0 ; movdqa 0xf4e5(%rip),%xmm2 # 2d940 <_sk_overlay_sse2_8bit+0x13e8>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,211,244,0,0 ; mulps 0xf4d3(%rip),%xmm2 # 2d950 <_sk_overlay_sse2_8bit+0x13e4>
- DB 102,15,219,29,219,244,0,0 ; pand 0xf4db(%rip),%xmm3 # 2d960 <_sk_overlay_sse2_8bit+0x13f4>
+ DB 15,89,21,231,244,0,0 ; mulps 0xf4e7(%rip),%xmm2 # 2d950 <_sk_overlay_sse2_8bit+0x13f8>
+ DB 102,15,219,29,239,244,0,0 ; pand 0xf4ef(%rip),%xmm3 # 2d960 <_sk_overlay_sse2_8bit+0x1408>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,225,244,0,0 ; mulps 0xf4e1(%rip),%xmm3 # 2d970 <_sk_overlay_sse2_8bit+0x1404>
+ DB 15,89,29,245,244,0,0 ; mulps 0xf4f5(%rip),%xmm3 # 2d970 <_sk_overlay_sse2_8bit+0x1418>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,50 ; je 1e4d2 <_sk_load_4444_sse2+0xbc>
+ DB 116,50 ; je 1e4be <_sk_load_4444_sse2+0xbc>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 1e4bf <_sk_load_4444_sse2+0xa9>
+ DB 116,21 ; je 1e4ab <_sk_load_4444_sse2+0xa9>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,139 ; jne 1e43b <_sk_load_4444_sse2+0x25>
+ DB 117,139 ; jne 1e427 <_sk_load_4444_sse2+0x25>
DB 67,15,183,68,80,4 ; movzwl 0x4(%r8,%r10,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,67,15,110,4,80 ; movd (%r8,%r10,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,216 ; movsd %xmm0,%xmm3
- DB 233,105,255,255,255 ; jmpq 1e43b <_sk_load_4444_sse2+0x25>
+ DB 233,105,255,255,255 ; jmpq 1e427 <_sk_load_4444_sse2+0x25>
DB 67,15,183,4,80 ; movzwl (%r8,%r10,2),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 233,91,255,255,255 ; jmpq 1e43b <_sk_load_4444_sse2+0x25>
+ DB 233,91,255,255,255 ; jmpq 1e427 <_sk_load_4444_sse2+0x25>
PUBLIC _sk_load_4444_dst_sse2
_sk_load_4444_dst_sse2 LABEL PROC
@@ -28771,45 +28765,45 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,98 ; jne 1e55d <_sk_load_4444_dst_sse2+0x7d>
+ DB 117,98 ; jne 1e549 <_sk_load_4444_dst_sse2+0x7d>
DB 243,67,15,126,60,80 ; movq (%r8,%r10,2),%xmm7
DB 102,15,97,248 ; punpcklwd %xmm0,%xmm7
- DB 102,15,111,37,243,243,0,0 ; movdqa 0xf3f3(%rip),%xmm4 # 2d900 <_sk_overlay_sse2_8bit+0x1394>
+ DB 102,15,111,37,7,244,0,0 ; movdqa 0xf407(%rip),%xmm4 # 2d900 <_sk_overlay_sse2_8bit+0x13a8>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,245,243,0,0 ; mulps 0xf3f5(%rip),%xmm4 # 2d910 <_sk_overlay_sse2_8bit+0x13a4>
- DB 102,15,111,45,253,243,0,0 ; movdqa 0xf3fd(%rip),%xmm5 # 2d920 <_sk_overlay_sse2_8bit+0x13b4>
+ DB 15,89,37,9,244,0,0 ; mulps 0xf409(%rip),%xmm4 # 2d910 <_sk_overlay_sse2_8bit+0x13b8>
+ DB 102,15,111,45,17,244,0,0 ; movdqa 0xf411(%rip),%xmm5 # 2d920 <_sk_overlay_sse2_8bit+0x13c8>
DB 102,15,219,239 ; pand %xmm7,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,255,243,0,0 ; mulps 0xf3ff(%rip),%xmm5 # 2d930 <_sk_overlay_sse2_8bit+0x13c4>
- DB 102,15,111,53,7,244,0,0 ; movdqa 0xf407(%rip),%xmm6 # 2d940 <_sk_overlay_sse2_8bit+0x13d4>
+ DB 15,89,45,19,244,0,0 ; mulps 0xf413(%rip),%xmm5 # 2d930 <_sk_overlay_sse2_8bit+0x13d8>
+ DB 102,15,111,53,27,244,0,0 ; movdqa 0xf41b(%rip),%xmm6 # 2d940 <_sk_overlay_sse2_8bit+0x13e8>
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,9,244,0,0 ; mulps 0xf409(%rip),%xmm6 # 2d950 <_sk_overlay_sse2_8bit+0x13e4>
- DB 102,15,219,61,17,244,0,0 ; pand 0xf411(%rip),%xmm7 # 2d960 <_sk_overlay_sse2_8bit+0x13f4>
+ DB 15,89,53,29,244,0,0 ; mulps 0xf41d(%rip),%xmm6 # 2d950 <_sk_overlay_sse2_8bit+0x13f8>
+ DB 102,15,219,61,37,244,0,0 ; pand 0xf425(%rip),%xmm7 # 2d960 <_sk_overlay_sse2_8bit+0x1408>
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,61,23,244,0,0 ; mulps 0xf417(%rip),%xmm7 # 2d970 <_sk_overlay_sse2_8bit+0x1404>
+ DB 15,89,61,43,244,0,0 ; mulps 0xf42b(%rip),%xmm7 # 2d970 <_sk_overlay_sse2_8bit+0x1418>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,50 ; je 1e59c <_sk_load_4444_dst_sse2+0xbc>
+ DB 116,50 ; je 1e588 <_sk_load_4444_dst_sse2+0xbc>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 1e589 <_sk_load_4444_dst_sse2+0xa9>
+ DB 116,21 ; je 1e575 <_sk_load_4444_dst_sse2+0xa9>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,139 ; jne 1e505 <_sk_load_4444_dst_sse2+0x25>
+ DB 117,139 ; jne 1e4f1 <_sk_load_4444_dst_sse2+0x25>
DB 67,15,183,68,80,4 ; movzwl 0x4(%r8,%r10,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 102,67,15,110,36,80 ; movd (%r8,%r10,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 242,15,16,252 ; movsd %xmm4,%xmm7
- DB 233,105,255,255,255 ; jmpq 1e505 <_sk_load_4444_dst_sse2+0x25>
+ DB 233,105,255,255,255 ; jmpq 1e4f1 <_sk_load_4444_dst_sse2+0x25>
DB 67,15,183,4,80 ; movzwl (%r8,%r10,2),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,91,255,255,255 ; jmpq 1e505 <_sk_load_4444_dst_sse2+0x25>
+ DB 233,91,255,255,255 ; jmpq 1e4f1 <_sk_load_4444_dst_sse2+0x25>
PUBLIC _sk_gather_4444_sse2
_sk_gather_4444_sse2 LABEL PROC
@@ -28841,21 +28835,21 @@ _sk_gather_4444_sse2 LABEL PROC
DB 102,15,196,216,3 ; pinsrw $0x3,%eax,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,208,242,0,0 ; movdqa 0xf2d0(%rip),%xmm0 # 2d900 <_sk_overlay_sse2_8bit+0x1394>
+ DB 102,15,111,5,228,242,0,0 ; movdqa 0xf2e4(%rip),%xmm0 # 2d900 <_sk_overlay_sse2_8bit+0x13a8>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,210,242,0,0 ; mulps 0xf2d2(%rip),%xmm0 # 2d910 <_sk_overlay_sse2_8bit+0x13a4>
- DB 102,15,111,13,218,242,0,0 ; movdqa 0xf2da(%rip),%xmm1 # 2d920 <_sk_overlay_sse2_8bit+0x13b4>
+ DB 15,89,5,230,242,0,0 ; mulps 0xf2e6(%rip),%xmm0 # 2d910 <_sk_overlay_sse2_8bit+0x13b8>
+ DB 102,15,111,13,238,242,0,0 ; movdqa 0xf2ee(%rip),%xmm1 # 2d920 <_sk_overlay_sse2_8bit+0x13c8>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,220,242,0,0 ; mulps 0xf2dc(%rip),%xmm1 # 2d930 <_sk_overlay_sse2_8bit+0x13c4>
- DB 102,15,111,21,228,242,0,0 ; movdqa 0xf2e4(%rip),%xmm2 # 2d940 <_sk_overlay_sse2_8bit+0x13d4>
+ DB 15,89,13,240,242,0,0 ; mulps 0xf2f0(%rip),%xmm1 # 2d930 <_sk_overlay_sse2_8bit+0x13d8>
+ DB 102,15,111,21,248,242,0,0 ; movdqa 0xf2f8(%rip),%xmm2 # 2d940 <_sk_overlay_sse2_8bit+0x13e8>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,230,242,0,0 ; mulps 0xf2e6(%rip),%xmm2 # 2d950 <_sk_overlay_sse2_8bit+0x13e4>
- DB 102,15,219,29,238,242,0,0 ; pand 0xf2ee(%rip),%xmm3 # 2d960 <_sk_overlay_sse2_8bit+0x13f4>
+ DB 15,89,21,250,242,0,0 ; mulps 0xf2fa(%rip),%xmm2 # 2d950 <_sk_overlay_sse2_8bit+0x13f8>
+ DB 102,15,219,29,2,243,0,0 ; pand 0xf302(%rip),%xmm3 # 2d960 <_sk_overlay_sse2_8bit+0x1408>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,244,242,0,0 ; mulps 0xf2f4(%rip),%xmm3 # 2d970 <_sk_overlay_sse2_8bit+0x1404>
+ DB 15,89,29,8,243,0,0 ; mulps 0xf308(%rip),%xmm3 # 2d970 <_sk_overlay_sse2_8bit+0x1418>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28868,7 +28862,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
- DB 68,15,40,5,226,242,0,0 ; movaps 0xf2e2(%rip),%xmm8 # 2d980 <_sk_overlay_sse2_8bit+0x1414>
+ DB 68,15,40,5,246,242,0,0 ; movaps 0xf2f6(%rip),%xmm8 # 2d980 <_sk_overlay_sse2_8bit+0x1428>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -28890,7 +28884,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 1e70f <_sk_store_4444_sse2+0x8f>
+ DB 117,10 ; jne 1e6fb <_sk_store_4444_sse2+0x8f>
DB 242,71,15,17,4,80 ; movsd %xmm8,(%r8,%r10,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28898,19 +28892,19 @@ _sk_store_4444_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,38 ; je 1e747 <_sk_store_4444_sse2+0xc7>
+ DB 116,38 ; je 1e733 <_sk_store_4444_sse2+0xc7>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 1e739 <_sk_store_4444_sse2+0xb9>
+ DB 116,18 ; je 1e725 <_sk_store_4444_sse2+0xb9>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,222 ; jne 1e70b <_sk_store_4444_sse2+0x8b>
+ DB 117,222 ; jne 1e6f7 <_sk_store_4444_sse2+0x8b>
DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax
DB 102,67,137,68,80,4 ; mov %ax,0x4(%r8,%r10,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,71,15,126,4,80 ; movd %xmm8,(%r8,%r10,2)
- DB 235,196 ; jmp 1e70b <_sk_store_4444_sse2+0x8b>
+ DB 235,196 ; jmp 1e6f7 <_sk_store_4444_sse2+0x8b>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,80 ; mov %ax,(%r8,%r10,2)
- DB 235,184 ; jmp 1e70b <_sk_store_4444_sse2+0x8b>
+ DB 235,184 ; jmp 1e6f7 <_sk_store_4444_sse2+0x8b>
PUBLIC _sk_load_8888_sse2
_sk_load_8888_sse2 LABEL PROC
@@ -28922,13 +28916,13 @@ _sk_load_8888_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 117,98 ; jne 1e7d1 <_sk_load_8888_sse2+0x7e>
+ DB 117,98 ; jne 1e7bd <_sk_load_8888_sse2+0x7e>
DB 243,69,15,111,12,128 ; movdqu (%r8,%rax,4),%xmm9
- DB 102,15,111,21,243,237,0,0 ; movdqa 0xedf3(%rip),%xmm2 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,21,7,238,0,0 ; movdqa 0xee07(%rip),%xmm2 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,47,239,0,0 ; movaps 0xef2f(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,5,67,239,0,0 ; movaps 0xef43(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -28948,18 +28942,18 @@ _sk_load_8888_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,41 ; je 1e807 <_sk_load_8888_sse2+0xb4>
+ DB 116,41 ; je 1e7f3 <_sk_load_8888_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,19 ; je 1e7fc <_sk_load_8888_sse2+0xa9>
+ DB 116,19 ; je 1e7e8 <_sk_load_8888_sse2+0xa9>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,134 ; jne 1e775 <_sk_load_8888_sse2+0x22>
+ DB 117,134 ; jne 1e761 <_sk_load_8888_sse2+0x22>
DB 102,65,15,110,68,128,8 ; movd 0x8(%r8,%rax,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
DB 102,69,15,18,12,128 ; movlpd (%r8,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1e775 <_sk_load_8888_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1e761 <_sk_load_8888_sse2+0x22>
DB 102,69,15,110,12,128 ; movd (%r8,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1e775 <_sk_load_8888_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1e761 <_sk_load_8888_sse2+0x22>
PUBLIC _sk_load_8888_dst_sse2
_sk_load_8888_dst_sse2 LABEL PROC
@@ -28971,13 +28965,13 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 117,98 ; jne 1e890 <_sk_load_8888_dst_sse2+0x7e>
+ DB 117,98 ; jne 1e87c <_sk_load_8888_dst_sse2+0x7e>
DB 243,69,15,111,12,128 ; movdqu (%r8,%rax,4),%xmm9
- DB 102,15,111,53,52,237,0,0 ; movdqa 0xed34(%rip),%xmm6 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,53,72,237,0,0 ; movdqa 0xed48(%rip),%xmm6 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,65,15,111,225 ; movdqa %xmm9,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 68,15,40,5,112,238,0,0 ; movaps 0xee70(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,5,132,238,0,0 ; movaps 0xee84(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,114,213,8 ; psrld $0x8,%xmm5
@@ -28997,18 +28991,18 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,41 ; je 1e8c6 <_sk_load_8888_dst_sse2+0xb4>
+ DB 116,41 ; je 1e8b2 <_sk_load_8888_dst_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,19 ; je 1e8bb <_sk_load_8888_dst_sse2+0xa9>
+ DB 116,19 ; je 1e8a7 <_sk_load_8888_dst_sse2+0xa9>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,134 ; jne 1e834 <_sk_load_8888_dst_sse2+0x22>
+ DB 117,134 ; jne 1e820 <_sk_load_8888_dst_sse2+0x22>
DB 102,65,15,110,100,128,8 ; movd 0x8(%r8,%rax,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,69,15,18,12,128 ; movlpd (%r8,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1e834 <_sk_load_8888_dst_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1e820 <_sk_load_8888_dst_sse2+0x22>
DB 102,69,15,110,12,128 ; movd (%r8,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1e834 <_sk_load_8888_dst_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1e820 <_sk_load_8888_dst_sse2+0x22>
PUBLIC _sk_gather_8888_sse2
_sk_gather_8888_sse2 LABEL PROC
@@ -29039,11 +29033,11 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,67,15,110,12,136 ; movd (%r8,%r9,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,21,30,236,0,0 ; movdqa 0xec1e(%rip),%xmm2 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,21,50,236,0,0 ; movdqa 0xec32(%rip),%xmm2 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,90,237,0,0 ; movaps 0xed5a(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,5,110,237,0,0 ; movaps 0xed6e(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -29070,7 +29064,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,219,235,0,0 ; movaps 0xebdb(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
+ DB 68,15,40,5,239,235,0,0 ; movaps 0xebef(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1048>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -29089,24 +29083,24 @@ _sk_store_8888_sse2 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 1ea25 <_sk_store_8888_sse2+0x7f>
+ DB 117,10 ; jne 1ea11 <_sk_store_8888_sse2+0x7f>
DB 243,69,15,127,4,128 ; movdqu %xmm8,(%r8,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,33 ; je 1ea53 <_sk_store_8888_sse2+0xad>
+ DB 116,33 ; je 1ea3f <_sk_store_8888_sse2+0xad>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,19 ; je 1ea4b <_sk_store_8888_sse2+0xa5>
+ DB 116,19 ; je 1ea37 <_sk_store_8888_sse2+0xa5>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,227 ; jne 1ea21 <_sk_store_8888_sse2+0x7b>
+ DB 117,227 ; jne 1ea0d <_sk_store_8888_sse2+0x7b>
DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9
DB 102,69,15,126,76,128,8 ; movd %xmm9,0x8(%r8,%rax,4)
DB 102,69,15,214,4,128 ; movq %xmm8,(%r8,%rax,4)
- DB 235,206 ; jmp 1ea21 <_sk_store_8888_sse2+0x7b>
+ DB 235,206 ; jmp 1ea0d <_sk_store_8888_sse2+0x7b>
DB 102,69,15,126,4,128 ; movd %xmm8,(%r8,%rax,4)
- DB 235,198 ; jmp 1ea21 <_sk_store_8888_sse2+0x7b>
+ DB 235,198 ; jmp 1ea0d <_sk_store_8888_sse2+0x7b>
PUBLIC _sk_load_bgra_sse2
_sk_load_bgra_sse2 LABEL PROC
@@ -29118,13 +29112,13 @@ _sk_load_bgra_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 117,98 ; jne 1ead9 <_sk_load_bgra_sse2+0x7e>
+ DB 117,98 ; jne 1eac5 <_sk_load_bgra_sse2+0x7e>
DB 243,69,15,111,12,128 ; movdqu (%r8,%rax,4),%xmm9
- DB 102,15,111,5,235,234,0,0 ; movdqa 0xeaeb(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,5,255,234,0,0 ; movdqa 0xeaff(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 68,15,40,5,39,236,0,0 ; movaps 0xec27(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,5,59,236,0,0 ; movaps 0xec3b(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -29144,18 +29138,18 @@ _sk_load_bgra_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,41 ; je 1eb0f <_sk_load_bgra_sse2+0xb4>
+ DB 116,41 ; je 1eafb <_sk_load_bgra_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,19 ; je 1eb04 <_sk_load_bgra_sse2+0xa9>
+ DB 116,19 ; je 1eaf0 <_sk_load_bgra_sse2+0xa9>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,134 ; jne 1ea7d <_sk_load_bgra_sse2+0x22>
+ DB 117,134 ; jne 1ea69 <_sk_load_bgra_sse2+0x22>
DB 102,65,15,110,68,128,8 ; movd 0x8(%r8,%rax,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
DB 102,69,15,18,12,128 ; movlpd (%r8,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1ea7d <_sk_load_bgra_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1ea69 <_sk_load_bgra_sse2+0x22>
DB 102,69,15,110,12,128 ; movd (%r8,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1ea7d <_sk_load_bgra_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1ea69 <_sk_load_bgra_sse2+0x22>
PUBLIC _sk_load_bgra_dst_sse2
_sk_load_bgra_dst_sse2 LABEL PROC
@@ -29167,13 +29161,13 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 117,98 ; jne 1eb98 <_sk_load_bgra_dst_sse2+0x7e>
+ DB 117,98 ; jne 1eb84 <_sk_load_bgra_dst_sse2+0x7e>
DB 243,69,15,111,12,128 ; movdqu (%r8,%rax,4),%xmm9
- DB 102,15,111,37,44,234,0,0 ; movdqa 0xea2c(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,37,64,234,0,0 ; movdqa 0xea40(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,245 ; cvtdq2ps %xmm5,%xmm6
- DB 68,15,40,5,104,235,0,0 ; movaps 0xeb68(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,5,124,235,0,0 ; movaps 0xeb7c(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,114,213,8 ; psrld $0x8,%xmm5
@@ -29193,18 +29187,18 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,41 ; je 1ebce <_sk_load_bgra_dst_sse2+0xb4>
+ DB 116,41 ; je 1ebba <_sk_load_bgra_dst_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,19 ; je 1ebc3 <_sk_load_bgra_dst_sse2+0xa9>
+ DB 116,19 ; je 1ebaf <_sk_load_bgra_dst_sse2+0xa9>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,134 ; jne 1eb3c <_sk_load_bgra_dst_sse2+0x22>
+ DB 117,134 ; jne 1eb28 <_sk_load_bgra_dst_sse2+0x22>
DB 102,65,15,110,100,128,8 ; movd 0x8(%r8,%rax,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,69,15,18,12,128 ; movlpd (%r8,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1eb3c <_sk_load_bgra_dst_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1eb28 <_sk_load_bgra_dst_sse2+0x22>
DB 102,69,15,110,12,128 ; movd (%r8,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1eb3c <_sk_load_bgra_dst_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1eb28 <_sk_load_bgra_dst_sse2+0x22>
PUBLIC _sk_gather_bgra_sse2
_sk_gather_bgra_sse2 LABEL PROC
@@ -29235,11 +29229,11 @@ _sk_gather_bgra_sse2 LABEL PROC
DB 102,67,15,110,12,136 ; movd (%r8,%r9,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,5,22,233,0,0 ; movdqa 0xe916(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
+ DB 102,15,111,5,42,233,0,0 ; movdqa 0xe92a(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1018>
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 68,15,40,5,82,234,0,0 ; movaps 0xea52(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
+ DB 68,15,40,5,102,234,0,0 ; movaps 0xea66(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1168>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -29266,7 +29260,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,211,232,0,0 ; movaps 0xe8d3(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
+ DB 68,15,40,5,231,232,0,0 ; movaps 0xe8e7(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1048>
DB 68,15,40,202 ; movaps %xmm2,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -29285,24 +29279,24 @@ _sk_store_bgra_sse2 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 1ed2d <_sk_store_bgra_sse2+0x7f>
+ DB 117,10 ; jne 1ed19 <_sk_store_bgra_sse2+0x7f>
DB 243,69,15,127,4,128 ; movdqu %xmm8,(%r8,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,33 ; je 1ed5b <_sk_store_bgra_sse2+0xad>
+ DB 116,33 ; je 1ed47 <_sk_store_bgra_sse2+0xad>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,19 ; je 1ed53 <_sk_store_bgra_sse2+0xa5>
+ DB 116,19 ; je 1ed3f <_sk_store_bgra_sse2+0xa5>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,227 ; jne 1ed29 <_sk_store_bgra_sse2+0x7b>
+ DB 117,227 ; jne 1ed15 <_sk_store_bgra_sse2+0x7b>
DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9
DB 102,69,15,126,76,128,8 ; movd %xmm9,0x8(%r8,%rax,4)
DB 102,69,15,214,4,128 ; movq %xmm8,(%r8,%rax,4)
- DB 235,206 ; jmp 1ed29 <_sk_store_bgra_sse2+0x7b>
+ DB 235,206 ; jmp 1ed15 <_sk_store_bgra_sse2+0x7b>
DB 102,69,15,126,4,128 ; movd %xmm8,(%r8,%rax,4)
- DB 235,198 ; jmp 1ed29 <_sk_store_bgra_sse2+0x7b>
+ DB 235,198 ; jmp 1ed15 <_sk_store_bgra_sse2+0x7b>
PUBLIC _sk_load_f16_sse2
_sk_load_f16_sse2 LABEL PROC
@@ -29314,7 +29308,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,98,1,0,0 ; jne 1eee5 <_sk_load_f16_sse2+0x182>
+ DB 15,133,98,1,0,0 ; jne 1eed1 <_sk_load_f16_sse2+0x182>
DB 102,65,15,16,4,192 ; movupd (%r8,%rax,8),%xmm0
DB 102,65,15,16,76,192,16 ; movupd 0x10(%r8,%rax,8),%xmm1
DB 102,68,15,40,192 ; movapd %xmm0,%xmm8
@@ -29326,7 +29320,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,203,235,0,0 ; movdqa 0xebcb(%rip),%xmm9 # 2d990 <_sk_overlay_sse2_8bit+0x1424>
+ DB 102,68,15,111,13,223,235,0,0 ; movdqa 0xebdf(%rip),%xmm9 # 2d990 <_sk_overlay_sse2_8bit+0x1438>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -29334,11 +29328,11 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,192,235,0,0 ; movdqa 0xebc0(%rip),%xmm11 # 2d9b0 <_sk_overlay_sse2_8bit+0x1444>
+ DB 102,68,15,111,29,212,235,0,0 ; movdqa 0xebd4(%rip),%xmm11 # 2d9b0 <_sk_overlay_sse2_8bit+0x1458>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,194,235,0,0 ; movdqa 0xebc2(%rip),%xmm12 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
+ DB 102,68,15,111,37,214,235,0,0 ; movdqa 0xebd6(%rip),%xmm12 # 2d9c0 <_sk_overlay_sse2_8bit+0x1468>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,101,237,0,0 ; movdqa 0xed65(%rip),%xmm3 # 2db70 <_sk_overlay_sse2_8bit+0x1604>
+ DB 102,15,111,29,121,237,0,0 ; movdqa 0xed79(%rip),%xmm3 # 2db70 <_sk_overlay_sse2_8bit+0x1618>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -29386,17 +29380,17 @@ _sk_load_f16_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,192 ; movsd (%r8,%rax,8),%xmm0
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,17 ; jne 1ef02 <_sk_load_f16_sse2+0x19f>
+ DB 117,17 ; jne 1eeee <_sk_load_f16_sse2+0x19f>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,142,254,255,255 ; jmpq 1ed90 <_sk_load_f16_sse2+0x2d>
+ DB 233,142,254,255,255 ; jmpq 1ed7c <_sk_load_f16_sse2+0x2d>
DB 102,65,15,22,68,192,8 ; movhpd 0x8(%r8,%rax,8),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 15,130,121,254,255,255 ; jb 1ed90 <_sk_load_f16_sse2+0x2d>
+ DB 15,130,121,254,255,255 ; jb 1ed7c <_sk_load_f16_sse2+0x2d>
DB 242,65,15,16,76,192,16 ; movsd 0x10(%r8,%rax,8),%xmm1
- DB 233,109,254,255,255 ; jmpq 1ed90 <_sk_load_f16_sse2+0x2d>
+ DB 233,109,254,255,255 ; jmpq 1ed7c <_sk_load_f16_sse2+0x2d>
PUBLIC _sk_load_f16_dst_sse2
_sk_load_f16_dst_sse2 LABEL PROC
@@ -29408,7 +29402,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,98,1,0,0 ; jne 1f0a5 <_sk_load_f16_dst_sse2+0x182>
+ DB 15,133,98,1,0,0 ; jne 1f091 <_sk_load_f16_dst_sse2+0x182>
DB 102,65,15,16,36,192 ; movupd (%r8,%rax,8),%xmm4
DB 102,65,15,16,108,192,16 ; movupd 0x10(%r8,%rax,8),%xmm5
DB 102,68,15,40,196 ; movapd %xmm4,%xmm8
@@ -29420,7 +29414,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,238 ; movdqa %xmm14,%xmm5
DB 102,65,15,97,234 ; punpcklwd %xmm10,%xmm5
- DB 102,68,15,111,13,11,234,0,0 ; movdqa 0xea0b(%rip),%xmm9 # 2d990 <_sk_overlay_sse2_8bit+0x1424>
+ DB 102,68,15,111,13,31,234,0,0 ; movdqa 0xea1f(%rip),%xmm9 # 2d990 <_sk_overlay_sse2_8bit+0x1438>
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,65,15,219,225 ; pand %xmm9,%xmm4
DB 102,15,239,236 ; pxor %xmm4,%xmm5
@@ -29428,11 +29422,11 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,68,15,111,237 ; movdqa %xmm5,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,236 ; por %xmm4,%xmm13
- DB 102,68,15,111,29,0,234,0,0 ; movdqa 0xea00(%rip),%xmm11 # 2d9b0 <_sk_overlay_sse2_8bit+0x1444>
+ DB 102,68,15,111,29,20,234,0,0 ; movdqa 0xea14(%rip),%xmm11 # 2d9b0 <_sk_overlay_sse2_8bit+0x1458>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,2,234,0,0 ; movdqa 0xea02(%rip),%xmm12 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
+ DB 102,68,15,111,37,22,234,0,0 ; movdqa 0xea16(%rip),%xmm12 # 2d9c0 <_sk_overlay_sse2_8bit+0x1468>
DB 102,65,15,239,236 ; pxor %xmm12,%xmm5
- DB 102,15,111,61,165,235,0,0 ; movdqa 0xeba5(%rip),%xmm7 # 2db70 <_sk_overlay_sse2_8bit+0x1604>
+ DB 102,15,111,61,185,235,0,0 ; movdqa 0xebb9(%rip),%xmm7 # 2db70 <_sk_overlay_sse2_8bit+0x1618>
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
DB 102,15,102,229 ; pcmpgtd %xmm5,%xmm4
DB 102,65,15,223,229 ; pandn %xmm13,%xmm4
@@ -29480,17 +29474,17 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,36,192 ; movsd (%r8,%rax,8),%xmm4
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,17 ; jne 1f0c2 <_sk_load_f16_dst_sse2+0x19f>
+ DB 117,17 ; jne 1f0ae <_sk_load_f16_dst_sse2+0x19f>
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
DB 102,15,20,229 ; unpcklpd %xmm5,%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
- DB 233,142,254,255,255 ; jmpq 1ef50 <_sk_load_f16_dst_sse2+0x2d>
+ DB 233,142,254,255,255 ; jmpq 1ef3c <_sk_load_f16_dst_sse2+0x2d>
DB 102,65,15,22,100,192,8 ; movhpd 0x8(%r8,%rax,8),%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 15,130,121,254,255,255 ; jb 1ef50 <_sk_load_f16_dst_sse2+0x2d>
+ DB 15,130,121,254,255,255 ; jb 1ef3c <_sk_load_f16_dst_sse2+0x2d>
DB 242,65,15,16,108,192,16 ; movsd 0x10(%r8,%rax,8),%xmm5
- DB 233,109,254,255,255 ; jmpq 1ef50 <_sk_load_f16_dst_sse2+0x2d>
+ DB 233,109,254,255,255 ; jmpq 1ef3c <_sk_load_f16_dst_sse2+0x2d>
PUBLIC _sk_gather_f16_sse2
_sk_gather_f16_sse2 LABEL PROC
@@ -29529,7 +29523,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,5,232,0,0 ; movdqa 0xe805(%rip),%xmm9 # 2d990 <_sk_overlay_sse2_8bit+0x1424>
+ DB 102,68,15,111,13,25,232,0,0 ; movdqa 0xe819(%rip),%xmm9 # 2d990 <_sk_overlay_sse2_8bit+0x1438>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -29537,11 +29531,11 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,250,231,0,0 ; movdqa 0xe7fa(%rip),%xmm11 # 2d9b0 <_sk_overlay_sse2_8bit+0x1444>
+ DB 102,68,15,111,29,14,232,0,0 ; movdqa 0xe80e(%rip),%xmm11 # 2d9b0 <_sk_overlay_sse2_8bit+0x1458>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,252,231,0,0 ; movdqa 0xe7fc(%rip),%xmm12 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
+ DB 102,68,15,111,37,16,232,0,0 ; movdqa 0xe810(%rip),%xmm12 # 2d9c0 <_sk_overlay_sse2_8bit+0x1468>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,159,233,0,0 ; movdqa 0xe99f(%rip),%xmm3 # 2db70 <_sk_overlay_sse2_8bit+0x1604>
+ DB 102,15,111,29,179,233,0,0 ; movdqa 0xe9b3(%rip),%xmm3 # 2db70 <_sk_overlay_sse2_8bit+0x1618>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -29597,17 +29591,17 @@ _sk_store_f16_sse2 LABEL PROC
DB 73,193,224,3 ; shl $0x3,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 102,68,15,111,21,245,230,0,0 ; movdqa 0xe6f5(%rip),%xmm10 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
+ DB 102,68,15,111,21,9,231,0,0 ; movdqa 0xe709(%rip),%xmm10 # 2d9c0 <_sk_overlay_sse2_8bit+0x1468>
DB 102,68,15,111,224 ; movdqa %xmm0,%xmm12
DB 102,69,15,219,226 ; pand %xmm10,%xmm12
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,236 ; pxor %xmm12,%xmm13
- DB 102,68,15,111,13,232,230,0,0 ; movdqa 0xe6e8(%rip),%xmm9 # 2d9d0 <_sk_overlay_sse2_8bit+0x1464>
+ DB 102,68,15,111,13,252,230,0,0 ; movdqa 0xe6fc(%rip),%xmm9 # 2d9d0 <_sk_overlay_sse2_8bit+0x1478>
DB 102,65,15,114,212,16 ; psrld $0x10,%xmm12
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,29,217,230,0,0 ; movdqa 0xe6d9(%rip),%xmm11 # 2d9e0 <_sk_overlay_sse2_8bit+0x1474>
+ DB 102,68,15,111,29,237,230,0,0 ; movdqa 0xe6ed(%rip),%xmm11 # 2d9e0 <_sk_overlay_sse2_8bit+0x1488>
DB 102,69,15,235,227 ; por %xmm11,%xmm12
DB 102,69,15,254,229 ; paddd %xmm13,%xmm12
DB 102,65,15,114,244,16 ; pslld $0x10,%xmm12
@@ -29659,7 +29653,7 @@ _sk_store_f16_sse2 LABEL PROC
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,69,15,98,204 ; punpckldq %xmm12,%xmm9
DB 72,133,255 ; test %rdi,%rdi
- DB 117,21 ; jne 1f429 <_sk_store_f16_sse2+0x17e>
+ DB 117,21 ; jne 1f415 <_sk_store_f16_sse2+0x17e>
DB 69,15,17,12,192 ; movups %xmm9,(%r8,%rax,8)
DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8
DB 243,69,15,127,68,192,16 ; movdqu %xmm8,0x10(%r8,%rax,8)
@@ -29667,13 +29661,13 @@ _sk_store_f16_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,12,192 ; movq %xmm9,(%r8,%rax,8)
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,240 ; je 1f425 <_sk_store_f16_sse2+0x17a>
+ DB 116,240 ; je 1f411 <_sk_store_f16_sse2+0x17a>
DB 102,69,15,23,76,192,8 ; movhpd %xmm9,0x8(%r8,%rax,8)
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,227 ; jb 1f425 <_sk_store_f16_sse2+0x17a>
+ DB 114,227 ; jb 1f411 <_sk_store_f16_sse2+0x17a>
DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8
DB 102,69,15,214,68,192,16 ; movq %xmm8,0x10(%r8,%rax,8)
- DB 235,213 ; jmp 1f425 <_sk_store_f16_sse2+0x17a>
+ DB 235,213 ; jmp 1f411 <_sk_store_f16_sse2+0x17a>
PUBLIC _sk_load_u16_be_sse2
_sk_load_u16_be_sse2 LABEL PROC
@@ -29686,7 +29680,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 73,99,193 ; movslq %r9d,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,190,0,0,0 ; jne 1f535 <_sk_load_u16_be_sse2+0xe5>
+ DB 15,133,190,0,0,0 ; jne 1f521 <_sk_load_u16_be_sse2+0xe5>
DB 102,65,15,16,4,64 ; movupd (%r8,%rax,2),%xmm0
DB 102,65,15,16,76,64,16 ; movupd 0x10(%r8,%rax,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -29703,7 +29697,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,5,136,226,0,0 ; movaps 0xe288(%rip),%xmm8 # 2d750 <_sk_overlay_sse2_8bit+0x11e4>
+ DB 68,15,40,5,156,226,0,0 ; movaps 0xe29c(%rip),%xmm8 # 2d750 <_sk_overlay_sse2_8bit+0x11f8>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -29731,17 +29725,17 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,64 ; movsd (%r8,%rax,2),%xmm0
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,17 ; jne 1f552 <_sk_load_u16_be_sse2+0x102>
+ DB 117,17 ; jne 1f53e <_sk_load_u16_be_sse2+0x102>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,50,255,255,255 ; jmpq 1f484 <_sk_load_u16_be_sse2+0x34>
+ DB 233,50,255,255,255 ; jmpq 1f470 <_sk_load_u16_be_sse2+0x34>
DB 102,65,15,22,68,64,8 ; movhpd 0x8(%r8,%rax,2),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 15,130,29,255,255,255 ; jb 1f484 <_sk_load_u16_be_sse2+0x34>
+ DB 15,130,29,255,255,255 ; jb 1f470 <_sk_load_u16_be_sse2+0x34>
DB 242,65,15,16,76,64,16 ; movsd 0x10(%r8,%rax,2),%xmm1
- DB 233,17,255,255,255 ; jmpq 1f484 <_sk_load_u16_be_sse2+0x34>
+ DB 233,17,255,255,255 ; jmpq 1f470 <_sk_load_u16_be_sse2+0x34>
PUBLIC _sk_load_rgb_u16_be_sse2
_sk_load_rgb_u16_be_sse2 LABEL PROC
@@ -29756,7 +29750,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,175,0,0,0 ; jne 1f64d <_sk_load_rgb_u16_be_sse2+0xda>
+ DB 15,133,175,0,0,0 ; jne 1f639 <_sk_load_rgb_u16_be_sse2+0xda>
DB 243,65,15,111,20,64 ; movdqu (%r8,%rax,2),%xmm2
DB 243,65,15,111,92,64,8 ; movdqu 0x8(%r8,%rax,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -29777,7 +29771,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,65,15,97,200 ; punpcklwd %xmm8,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,13,78,225,0,0 ; movaps 0xe14e(%rip),%xmm9 # 2d750 <_sk_overlay_sse2_8bit+0x11e4>
+ DB 68,15,40,13,98,225,0,0 ; movaps 0xe162(%rip),%xmm9 # 2d750 <_sk_overlay_sse2_8bit+0x11f8>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -29794,27 +29788,27 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,117,222,0,0 ; movaps 0xde75(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,137,222,0,0 ; movaps 0xde89(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,64 ; movd (%r8,%rax,2),%xmm2
DB 102,65,15,196,84,64,4,2 ; pinsrw $0x2,0x4(%r8,%rax,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,13 ; jne 1f672 <_sk_load_rgb_u16_be_sse2+0xff>
+ DB 117,13 ; jne 1f65e <_sk_load_rgb_u16_be_sse2+0xff>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,80,255,255,255 ; jmpq 1f5c2 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,80,255,255,255 ; jmpq 1f5ae <_sk_load_rgb_u16_be_sse2+0x4f>
DB 102,65,15,110,68,64,6 ; movd 0x6(%r8,%rax,2),%xmm0
DB 102,65,15,196,68,64,10,2 ; pinsrw $0x2,0xa(%r8,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,24 ; jb 1f6a3 <_sk_load_rgb_u16_be_sse2+0x130>
+ DB 114,24 ; jb 1f68f <_sk_load_rgb_u16_be_sse2+0x130>
DB 102,65,15,110,92,64,12 ; movd 0xc(%r8,%rax,2),%xmm3
DB 102,65,15,196,92,64,16,2 ; pinsrw $0x2,0x10(%r8,%rax,2),%xmm3
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,31,255,255,255 ; jmpq 1f5c2 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,31,255,255,255 ; jmpq 1f5ae <_sk_load_rgb_u16_be_sse2+0x4f>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,22,255,255,255 ; jmpq 1f5c2 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,22,255,255,255 ; jmpq 1f5ae <_sk_load_rgb_u16_be_sse2+0x4f>
PUBLIC _sk_store_u16_be_sse2
_sk_store_u16_be_sse2 LABEL PROC
@@ -29826,7 +29820,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 73,99,193 ; movslq %r9d,%rax
- DB 68,15,40,21,30,227,0,0 ; movaps 0xe31e(%rip),%xmm10 # 2d9f0 <_sk_overlay_sse2_8bit+0x1484>
+ DB 68,15,40,21,50,227,0,0 ; movaps 0xe332(%rip),%xmm10 # 2d9f0 <_sk_overlay_sse2_8bit+0x1498>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -29871,7 +29865,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10
DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10
DB 72,133,255 ; test %rdi,%rdi
- DB 117,21 ; jne 1f7cc <_sk_store_u16_be_sse2+0x120>
+ DB 117,21 ; jne 1f7b8 <_sk_store_u16_be_sse2+0x120>
DB 69,15,17,20,64 ; movups %xmm10,(%r8,%rax,2)
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 243,69,15,127,68,64,16 ; movdqu %xmm8,0x10(%r8,%rax,2)
@@ -29879,13 +29873,13 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,20,64 ; movq %xmm10,(%r8,%rax,2)
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,240 ; je 1f7c8 <_sk_store_u16_be_sse2+0x11c>
+ DB 116,240 ; je 1f7b4 <_sk_store_u16_be_sse2+0x11c>
DB 102,69,15,23,84,64,8 ; movhpd %xmm10,0x8(%r8,%rax,2)
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,227 ; jb 1f7c8 <_sk_store_u16_be_sse2+0x11c>
+ DB 114,227 ; jb 1f7b4 <_sk_store_u16_be_sse2+0x11c>
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 102,69,15,214,68,64,16 ; movq %xmm8,0x10(%r8,%rax,2)
- DB 235,213 ; jmp 1f7c8 <_sk_store_u16_be_sse2+0x11c>
+ DB 235,213 ; jmp 1f7b4 <_sk_store_u16_be_sse2+0x11c>
PUBLIC _sk_load_f32_sse2
_sk_load_f32_sse2 LABEL PROC
@@ -29899,7 +29893,7 @@ _sk_load_f32_sse2 LABEL PROC
DB 73,99,193 ; movslq %r9d,%rax
DB 69,15,16,4,128 ; movups (%r8,%rax,4),%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,66 ; jne 1f85e <_sk_load_f32_sse2+0x6b>
+ DB 117,66 ; jne 1f84a <_sk_load_f32_sse2+0x6b>
DB 65,15,16,68,128,16 ; movups 0x10(%r8,%rax,4),%xmm0
DB 65,15,16,92,128,32 ; movups 0x20(%r8,%rax,4),%xmm3
DB 69,15,16,76,128,48 ; movups 0x30(%r8,%rax,4),%xmm9
@@ -29919,17 +29913,17 @@ _sk_load_f32_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,8 ; jne 1f870 <_sk_load_f32_sse2+0x7d>
+ DB 117,8 ; jne 1f85c <_sk_load_f32_sse2+0x7d>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 235,190 ; jmp 1f82e <_sk_load_f32_sse2+0x3b>
+ DB 235,190 ; jmp 1f81a <_sk_load_f32_sse2+0x3b>
DB 65,15,16,68,128,16 ; movups 0x10(%r8,%rax,4),%xmm0
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,8 ; jb 1f884 <_sk_load_f32_sse2+0x91>
+ DB 114,8 ; jb 1f870 <_sk_load_f32_sse2+0x91>
DB 65,15,16,92,128,32 ; movups 0x20(%r8,%rax,4),%xmm3
- DB 235,170 ; jmp 1f82e <_sk_load_f32_sse2+0x3b>
+ DB 235,170 ; jmp 1f81a <_sk_load_f32_sse2+0x3b>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,165 ; jmp 1f82e <_sk_load_f32_sse2+0x3b>
+ DB 235,165 ; jmp 1f81a <_sk_load_f32_sse2+0x3b>
PUBLIC _sk_load_f32_dst_sse2
_sk_load_f32_dst_sse2 LABEL PROC
@@ -29943,7 +29937,7 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 73,99,193 ; movslq %r9d,%rax
DB 69,15,16,4,128 ; movups (%r8,%rax,4),%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 117,66 ; jne 1f8f4 <_sk_load_f32_dst_sse2+0x6b>
+ DB 117,66 ; jne 1f8e0 <_sk_load_f32_dst_sse2+0x6b>
DB 65,15,16,100,128,16 ; movups 0x10(%r8,%rax,4),%xmm4
DB 65,15,16,124,128,32 ; movups 0x20(%r8,%rax,4),%xmm7
DB 69,15,16,76,128,48 ; movups 0x30(%r8,%rax,4),%xmm9
@@ -29963,17 +29957,17 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 117,8 ; jne 1f906 <_sk_load_f32_dst_sse2+0x7d>
+ DB 117,8 ; jne 1f8f2 <_sk_load_f32_dst_sse2+0x7d>
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 235,190 ; jmp 1f8c4 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,190 ; jmp 1f8b0 <_sk_load_f32_dst_sse2+0x3b>
DB 65,15,16,100,128,16 ; movups 0x10(%r8,%rax,4),%xmm4
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,8 ; jb 1f91a <_sk_load_f32_dst_sse2+0x91>
+ DB 114,8 ; jb 1f906 <_sk_load_f32_dst_sse2+0x91>
DB 65,15,16,124,128,32 ; movups 0x20(%r8,%rax,4),%xmm7
- DB 235,170 ; jmp 1f8c4 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,170 ; jmp 1f8b0 <_sk_load_f32_dst_sse2+0x3b>
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,165 ; jmp 1f8c4 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,165 ; jmp 1f8b0 <_sk_load_f32_dst_sse2+0x3b>
PUBLIC _sk_store_f32_sse2
_sk_store_f32_sse2 LABEL PROC
@@ -30000,7 +29994,7 @@ _sk_store_f32_sse2 LABEL PROC
DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9
DB 102,69,15,17,36,128 ; movupd %xmm12,(%r8,%rax,4)
DB 72,133,255 ; test %rdi,%rdi
- DB 117,29 ; jne 1f99c <_sk_store_f32_sse2+0x7d>
+ DB 117,29 ; jne 1f988 <_sk_store_f32_sse2+0x7d>
DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10
DB 69,15,17,68,128,16 ; movups %xmm8,0x10(%r8,%rax,4)
DB 102,69,15,17,76,128,32 ; movupd %xmm9,0x20(%r8,%rax,4)
@@ -30008,12 +30002,12 @@ _sk_store_f32_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 72,131,255,1 ; cmp $0x1,%rdi
- DB 116,246 ; je 1f998 <_sk_store_f32_sse2+0x79>
+ DB 116,246 ; je 1f984 <_sk_store_f32_sse2+0x79>
DB 69,15,17,68,128,16 ; movups %xmm8,0x10(%r8,%rax,4)
DB 72,131,255,3 ; cmp $0x3,%rdi
- DB 114,234 ; jb 1f998 <_sk_store_f32_sse2+0x79>
+ DB 114,234 ; jb 1f984 <_sk_store_f32_sse2+0x79>
DB 102,69,15,17,76,128,32 ; movupd %xmm9,0x20(%r8,%rax,4)
- DB 235,225 ; jmp 1f998 <_sk_store_f32_sse2+0x79>
+ DB 235,225 ; jmp 1f984 <_sk_store_f32_sse2+0x79>
PUBLIC _sk_clamp_x_sse2
_sk_clamp_x_sse2 LABEL PROC
@@ -30053,7 +30047,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8
DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,139,218,0,0 ; andps 0xda8b(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,84,21,159,218,0,0 ; andps 0xda9f(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
@@ -30077,7 +30071,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8
DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,49,218,0,0 ; andps 0xda31(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,84,21,69,218,0,0 ; andps 0xda45(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
@@ -30101,13 +30095,13 @@ _sk_mirror_x_sse2 LABEL PROC
DB 65,15,92,193 ; subps %xmm9,%xmm0
DB 243,69,15,88,210 ; addss %xmm10,%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
- DB 243,68,15,89,29,238,206,0,0 ; mulss 0xceee(%rip),%xmm11 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 243,68,15,89,29,210,215,0,0 ; mulss 0xd7d2(%rip),%xmm11 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8
DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12
DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11
- DB 68,15,84,29,183,217,0,0 ; andps 0xd9b7(%rip),%xmm11 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,84,29,203,217,0,0 ; andps 0xd9cb(%rip),%xmm11 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
@@ -30134,13 +30128,13 @@ _sk_mirror_y_sse2 LABEL PROC
DB 65,15,92,201 ; subps %xmm9,%xmm1
DB 243,69,15,88,210 ; addss %xmm10,%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
- DB 243,68,15,89,29,105,206,0,0 ; mulss 0xce69(%rip),%xmm11 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
+ DB 243,68,15,89,29,77,215,0,0 ; mulss 0xd74d(%rip),%xmm11 # 2d2a8 <_sk_overlay_sse2_8bit+0xd50>
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8
DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12
DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11
- DB 68,15,84,29,50,217,0,0 ; andps 0xd932(%rip),%xmm11 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,84,29,70,217,0,0 ; andps 0xd946(%rip),%xmm11 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
@@ -30161,7 +30155,7 @@ PUBLIC _sk_clamp_x_1_sse2
_sk_clamp_x_1_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,233,216,0,0 ; minps 0xd8e9(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,93,5,253,216,0,0 ; minps 0xd8fd(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -30172,7 +30166,7 @@ _sk_repeat_x_1_sse2 LABEL PROC
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,84,13,199,216,0,0 ; andps 0xd8c7(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,84,13,219,216,0,0 ; andps 0xd8db(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30180,14 +30174,14 @@ _sk_repeat_x_1_sse2 LABEL PROC
PUBLIC _sk_mirror_x_1_sse2
_sk_mirror_x_1_sse2 LABEL PROC
- DB 68,15,40,5,19,217,0,0 ; movaps 0xd913(%rip),%xmm8 # 2d520 <_sk_overlay_sse2_8bit+0xfb4>
+ DB 68,15,40,5,39,217,0,0 ; movaps 0xd927(%rip),%xmm8 # 2d520 <_sk_overlay_sse2_8bit+0xfc8>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,135,216,0,0 ; movaps 0xd887(%rip),%xmm9 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,40,13,171,216,0,0 ; movaps 0xd8ab(%rip),%xmm9 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,84,13,141,216,0,0 ; andps 0xd88d(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,84,13,161,216,0,0 ; andps 0xd8a1(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,88,210 ; addps %xmm10,%xmm10
@@ -30201,10 +30195,10 @@ _sk_mirror_x_1_sse2 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse2
_sk_luminance_to_alpha_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,163,221,0,0 ; mulps 0xdda3(%rip),%xmm0 # 2da00 <_sk_overlay_sse2_8bit+0x1494>
- DB 15,89,13,172,221,0,0 ; mulps 0xddac(%rip),%xmm1 # 2da10 <_sk_overlay_sse2_8bit+0x14a4>
+ DB 15,89,5,183,221,0,0 ; mulps 0xddb7(%rip),%xmm0 # 2da00 <_sk_overlay_sse2_8bit+0x14a8>
+ DB 15,89,13,192,221,0,0 ; mulps 0xddc0(%rip),%xmm1 # 2da10 <_sk_overlay_sse2_8bit+0x14b8>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,178,221,0,0 ; mulps 0xddb2(%rip),%xmm3 # 2da20 <_sk_overlay_sse2_8bit+0x14b4>
+ DB 15,89,29,198,221,0,0 ; mulps 0xddc6(%rip),%xmm3 # 2da20 <_sk_overlay_sse2_8bit+0x14c8>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -30500,9 +30494,9 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 76,139,112,8 ; mov 0x8(%rax),%r14
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js 2010e <_sk_evenly_spaced_gradient_sse2+0x18>
+ DB 120,7 ; js 200fa <_sk_evenly_spaced_gradient_sse2+0x18>
DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1
- DB 235,21 ; jmp 20123 <_sk_evenly_spaced_gradient_sse2+0x2d>
+ DB 235,21 ; jmp 2010f <_sk_evenly_spaced_gradient_sse2+0x2d>
DB 73,137,216 ; mov %rbx,%r8
DB 73,209,232 ; shr %r8
DB 131,227,1 ; and $0x1,%ebx
@@ -30598,15 +30592,15 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse2
_sk_gauss_a_to_rgba_sse2 LABEL PROC
- DB 15,40,5,129,215,0,0 ; movaps 0xd781(%rip),%xmm0 # 2da30 <_sk_overlay_sse2_8bit+0x14c4>
+ DB 15,40,5,149,215,0,0 ; movaps 0xd795(%rip),%xmm0 # 2da30 <_sk_overlay_sse2_8bit+0x14d8>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,135,215,0,0 ; addps 0xd787(%rip),%xmm0 # 2da40 <_sk_overlay_sse2_8bit+0x14d4>
+ DB 15,88,5,155,215,0,0 ; addps 0xd79b(%rip),%xmm0 # 2da40 <_sk_overlay_sse2_8bit+0x14e8>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,141,215,0,0 ; addps 0xd78d(%rip),%xmm0 # 2da50 <_sk_overlay_sse2_8bit+0x14e4>
+ DB 15,88,5,161,215,0,0 ; addps 0xd7a1(%rip),%xmm0 # 2da50 <_sk_overlay_sse2_8bit+0x14f8>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,147,215,0,0 ; addps 0xd793(%rip),%xmm0 # 2da60 <_sk_overlay_sse2_8bit+0x14f4>
+ DB 15,88,5,167,215,0,0 ; addps 0xd7a7(%rip),%xmm0 # 2da60 <_sk_overlay_sse2_8bit+0x1508>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,153,215,0,0 ; addps 0xd799(%rip),%xmm0 # 2da70 <_sk_overlay_sse2_8bit+0x1504>
+ DB 15,88,5,173,215,0,0 ; addps 0xd7ad(%rip),%xmm0 # 2da70 <_sk_overlay_sse2_8bit+0x1518>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -30619,12 +30613,12 @@ _sk_gradient_sse2 LABEL PROC
DB 76,139,0 ; mov (%rax),%r8
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,2 ; cmp $0x2,%r8
- DB 114,51 ; jb 20326 <_sk_gradient_sse2+0x42>
+ DB 114,51 ; jb 20312 <_sk_gradient_sse2+0x42>
DB 76,139,72,72 ; mov 0x48(%rax),%r9
DB 73,255,200 ; dec %r8
DB 73,131,193,4 ; add $0x4,%r9
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,199,209,0,0 ; movaps 0xd1c7(%rip),%xmm2 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 15,40,21,219,209,0,0 ; movaps 0xd1db(%rip),%xmm2 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 243,65,15,16,25 ; movss (%r9),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -30632,7 +30626,7 @@ _sk_gradient_sse2 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 73,131,193,4 ; add $0x4,%r9
DB 73,255,200 ; dec %r8
- DB 117,227 ; jne 20309 <_sk_gradient_sse2+0x25>
+ DB 117,227 ; jne 202f5 <_sk_gradient_sse2+0x25>
DB 65,86 ; push %r14
DB 83 ; push %rbx
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
@@ -30768,29 +30762,29 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 69,15,94,220 ; divps %xmm12,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
- DB 68,15,40,45,38,213,0,0 ; movaps 0xd526(%rip),%xmm13 # 2da80 <_sk_overlay_sse2_8bit+0x1514>
+ DB 68,15,40,45,58,213,0,0 ; movaps 0xd53a(%rip),%xmm13 # 2da80 <_sk_overlay_sse2_8bit+0x1528>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,42,213,0,0 ; addps 0xd52a(%rip),%xmm13 # 2da90 <_sk_overlay_sse2_8bit+0x1524>
+ DB 68,15,88,45,62,213,0,0 ; addps 0xd53e(%rip),%xmm13 # 2da90 <_sk_overlay_sse2_8bit+0x1538>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,46,213,0,0 ; addps 0xd52e(%rip),%xmm13 # 2daa0 <_sk_overlay_sse2_8bit+0x1534>
+ DB 68,15,88,45,66,213,0,0 ; addps 0xd542(%rip),%xmm13 # 2daa0 <_sk_overlay_sse2_8bit+0x1548>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,50,213,0,0 ; addps 0xd532(%rip),%xmm13 # 2dab0 <_sk_overlay_sse2_8bit+0x1544>
+ DB 68,15,88,45,70,213,0,0 ; addps 0xd546(%rip),%xmm13 # 2dab0 <_sk_overlay_sse2_8bit+0x1558>
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,40,21,49,213,0,0 ; movaps 0xd531(%rip),%xmm10 # 2dac0 <_sk_overlay_sse2_8bit+0x1554>
+ DB 68,15,40,21,69,213,0,0 ; movaps 0xd545(%rip),%xmm10 # 2dac0 <_sk_overlay_sse2_8bit+0x1568>
DB 69,15,92,213 ; subps %xmm13,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,205 ; andnps %xmm13,%xmm9
DB 69,15,86,202 ; orps %xmm10,%xmm9
DB 68,15,194,192,1 ; cmpltps %xmm0,%xmm8
- DB 68,15,40,21,244,206,0,0 ; movaps 0xcef4(%rip),%xmm10 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,40,21,24,207,0,0 ; movaps 0xcf18(%rip),%xmm10 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,84,208 ; andps %xmm8,%xmm10
DB 69,15,85,193 ; andnps %xmm9,%xmm8
DB 69,15,86,194 ; orps %xmm10,%xmm8
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,194,200,1 ; cmpltps %xmm0,%xmm9
- DB 68,15,40,21,243,206,0,0 ; movaps 0xcef3(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,21,7,207,0,0 ; movaps 0xcf07(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,208 ; subps %xmm8,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,200 ; andnps %xmm8,%xmm9
@@ -30821,7 +30815,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,154,212,0,0 ; mulps 0xd49a(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1564>
+ DB 68,15,89,13,174,212,0,0 ; mulps 0xd4ae(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1578>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -30829,7 +30823,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,133,212,0,0 ; mulps 0xd485(%rip),%xmm10 # 2dae0 <_sk_overlay_sse2_8bit+0x1574>
+ DB 68,15,89,21,153,212,0,0 ; mulps 0xd499(%rip),%xmm10 # 2dae0 <_sk_overlay_sse2_8bit+0x1588>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -30838,8 +30832,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,61,211,0,0 ; xorps 0xd33d(%rip),%xmm9 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
- DB 68,15,89,5,21,206,0,0 ; mulps 0xce15(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,87,13,81,211,0,0 ; xorps 0xd351(%rip),%xmm9 # 2d9c0 <_sk_overlay_sse2_8bit+0x1468>
+ DB 68,15,89,5,57,206,0,0 ; mulps 0xce39(%rip),%xmm8 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -30858,7 +30852,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,252,211,0,0 ; mulps 0xd3fc(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1564>
+ DB 68,15,89,13,16,212,0,0 ; mulps 0xd410(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1578>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -30866,7 +30860,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,231,211,0,0 ; mulps 0xd3e7(%rip),%xmm10 # 2dae0 <_sk_overlay_sse2_8bit+0x1574>
+ DB 68,15,89,21,251,211,0,0 ; mulps 0xd3fb(%rip),%xmm10 # 2dae0 <_sk_overlay_sse2_8bit+0x1588>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -30875,8 +30869,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,159,210,0,0 ; xorps 0xd29f(%rip),%xmm9 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
- DB 68,15,89,5,119,205,0,0 ; mulps 0xcd77(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,87,13,179,210,0,0 ; xorps 0xd2b3(%rip),%xmm9 # 2d9c0 <_sk_overlay_sse2_8bit+0x1468>
+ DB 68,15,89,5,155,205,0,0 ; mulps 0xcd9b(%rip),%xmm8 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -30892,7 +30886,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,69,15,89,200 ; mulss %xmm8,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,111,211,0,0 ; mulps 0xd36f(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1564>
+ DB 68,15,89,13,131,211,0,0 ; mulps 0xd383(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1578>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
@@ -30900,7 +30894,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,69,15,89,192 ; mulss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 15,87,5,59,210,0,0 ; xorps 0xd23b(%rip),%xmm0 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
+ DB 15,87,5,79,210,0,0 ; xorps 0xd24f(%rip),%xmm0 # 2d9c0 <_sk_overlay_sse2_8bit+0x1468>
DB 65,15,94,193 ; divps %xmm9,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30937,7 +30931,7 @@ _sk_apply_vector_mask_sse2 LABEL PROC
PUBLIC _sk_save_xy_sse2
_sk_save_xy_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,177,204,0,0 ; movaps 0xccb1(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,40,5,213,204,0,0 ; movaps 0xccd5(%rip),%xmm8 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -30945,7 +30939,7 @@ _sk_save_xy_sse2 LABEL PROC
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,40,217 ; movaps %xmm9,%xmm11
DB 69,15,194,218,1 ; cmpltps %xmm10,%xmm11
- DB 68,15,40,37,172,204,0,0 ; movaps 0xccac(%rip),%xmm12 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 68,15,40,37,192,204,0,0 ; movaps 0xccc0(%rip),%xmm12 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,84,220 ; andps %xmm12,%xmm11
DB 69,15,92,211 ; subps %xmm11,%xmm10
DB 69,15,92,202 ; subps %xmm10,%xmm9
@@ -30988,8 +30982,8 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,69,210,0,0 ; addps 0xd245(%rip),%xmm0 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
- DB 68,15,40,13,13,204,0,0 ; movaps 0xcc0d(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,88,5,89,210,0,0 ; addps 0xd259(%rip),%xmm0 # 2daf0 <_sk_overlay_sse2_8bit+0x1598>
+ DB 68,15,40,13,33,204,0,0 ; movaps 0xcc21(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -31000,7 +30994,7 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,204,203,0,0 ; addps 0xcbcc(%rip),%xmm0 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 15,88,5,240,203,0,0 ; addps 0xcbf0(%rip),%xmm0 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -31010,8 +31004,8 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,254,209,0,0 ; addps 0xd1fe(%rip),%xmm1 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
- DB 68,15,40,13,198,203,0,0 ; movaps 0xcbc6(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,88,13,18,210,0,0 ; addps 0xd212(%rip),%xmm1 # 2daf0 <_sk_overlay_sse2_8bit+0x1598>
+ DB 68,15,40,13,218,203,0,0 ; movaps 0xcbda(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -31022,7 +31016,7 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,132,203,0,0 ; addps 0xcb84(%rip),%xmm1 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 15,88,13,168,203,0,0 ; addps 0xcba8(%rip),%xmm1 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -31032,13 +31026,13 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,199,209,0,0 ; addps 0xd1c7(%rip),%xmm0 # 2db00 <_sk_overlay_sse2_8bit+0x1594>
- DB 68,15,40,13,127,203,0,0 ; movaps 0xcb7f(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,88,5,219,209,0,0 ; addps 0xd1db(%rip),%xmm0 # 2db00 <_sk_overlay_sse2_8bit+0x15a8>
+ DB 68,15,40,13,147,203,0,0 ; movaps 0xcb93(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,187,209,0,0 ; mulps 0xd1bb(%rip),%xmm9 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
- DB 68,15,88,13,83,205,0,0 ; addps 0xcd53(%rip),%xmm9 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
+ DB 68,15,89,13,207,209,0,0 ; mulps 0xd1cf(%rip),%xmm9 # 2db10 <_sk_overlay_sse2_8bit+0x15b8>
+ DB 68,15,88,13,103,205,0,0 ; addps 0xcd67(%rip),%xmm9 # 2d6b0 <_sk_overlay_sse2_8bit+0x1158>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -31049,16 +31043,16 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,114,209,0,0 ; addps 0xd172(%rip),%xmm0 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
- DB 68,15,40,13,58,203,0,0 ; movaps 0xcb3a(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,88,5,134,209,0,0 ; addps 0xd186(%rip),%xmm0 # 2daf0 <_sk_overlay_sse2_8bit+0x1598>
+ DB 68,15,40,13,78,203,0,0 ; movaps 0xcb4e(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,142,209,0,0 ; movaps 0xd18e(%rip),%xmm8 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
+ DB 68,15,40,5,162,209,0,0 ; movaps 0xd1a2(%rip),%xmm8 # 2db20 <_sk_overlay_sse2_8bit+0x15c8>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,146,209,0,0 ; addps 0xd192(%rip),%xmm8 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
+ DB 68,15,88,5,166,209,0,0 ; addps 0xd1a6(%rip),%xmm8 # 2db30 <_sk_overlay_sse2_8bit+0x15d8>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,246,202,0,0 ; addps 0xcaf6(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,88,5,26,203,0,0 ; addps 0xcb1a(%rip),%xmm8 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,138,209,0,0 ; addps 0xd18a(%rip),%xmm8 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
+ DB 68,15,88,5,158,209,0,0 ; addps 0xd19e(%rip),%xmm8 # 2db40 <_sk_overlay_sse2_8bit+0x15e8>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -31066,17 +31060,17 @@ _sk_bicubic_n1x_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse2
_sk_bicubic_p1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,212,202,0,0 ; movaps 0xcad4(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,40,5,248,202,0,0 ; movaps 0xcaf8(%rip),%xmm8 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,64,209,0,0 ; movaps 0xd140(%rip),%xmm10 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
+ DB 68,15,40,21,84,209,0,0 ; movaps 0xd154(%rip),%xmm10 # 2db20 <_sk_overlay_sse2_8bit+0x15c8>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,68,209,0,0 ; addps 0xd144(%rip),%xmm10 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
+ DB 68,15,88,21,88,209,0,0 ; addps 0xd158(%rip),%xmm10 # 2db30 <_sk_overlay_sse2_8bit+0x15d8>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,64,209,0,0 ; addps 0xd140(%rip),%xmm10 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
+ DB 68,15,88,21,84,209,0,0 ; addps 0xd154(%rip),%xmm10 # 2db40 <_sk_overlay_sse2_8bit+0x15e8>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -31086,11 +31080,11 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,19,209,0,0 ; addps 0xd113(%rip),%xmm0 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
+ DB 15,88,5,39,209,0,0 ; addps 0xd127(%rip),%xmm0 # 2db30 <_sk_overlay_sse2_8bit+0x15d8>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,227,208,0,0 ; mulps 0xd0e3(%rip),%xmm8 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
- DB 68,15,88,5,123,204,0,0 ; addps 0xcc7b(%rip),%xmm8 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
+ DB 68,15,89,5,247,208,0,0 ; mulps 0xd0f7(%rip),%xmm8 # 2db10 <_sk_overlay_sse2_8bit+0x15b8>
+ DB 68,15,88,5,143,204,0,0 ; addps 0xcc8f(%rip),%xmm8 # 2d6b0 <_sk_overlay_sse2_8bit+0x1158>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -31101,13 +31095,13 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,169,208,0,0 ; addps 0xd0a9(%rip),%xmm1 # 2db00 <_sk_overlay_sse2_8bit+0x1594>
- DB 68,15,40,13,97,202,0,0 ; movaps 0xca61(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,88,13,189,208,0,0 ; addps 0xd0bd(%rip),%xmm1 # 2db00 <_sk_overlay_sse2_8bit+0x15a8>
+ DB 68,15,40,13,117,202,0,0 ; movaps 0xca75(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,157,208,0,0 ; mulps 0xd09d(%rip),%xmm9 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
- DB 68,15,88,13,53,204,0,0 ; addps 0xcc35(%rip),%xmm9 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
+ DB 68,15,89,13,177,208,0,0 ; mulps 0xd0b1(%rip),%xmm9 # 2db10 <_sk_overlay_sse2_8bit+0x15b8>
+ DB 68,15,88,13,73,204,0,0 ; addps 0xcc49(%rip),%xmm9 # 2d6b0 <_sk_overlay_sse2_8bit+0x1158>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -31118,16 +31112,16 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,83,208,0,0 ; addps 0xd053(%rip),%xmm1 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
- DB 68,15,40,13,27,202,0,0 ; movaps 0xca1b(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,88,13,103,208,0,0 ; addps 0xd067(%rip),%xmm1 # 2daf0 <_sk_overlay_sse2_8bit+0x1598>
+ DB 68,15,40,13,47,202,0,0 ; movaps 0xca2f(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,111,208,0,0 ; movaps 0xd06f(%rip),%xmm8 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
+ DB 68,15,40,5,131,208,0,0 ; movaps 0xd083(%rip),%xmm8 # 2db20 <_sk_overlay_sse2_8bit+0x15c8>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,115,208,0,0 ; addps 0xd073(%rip),%xmm8 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
+ DB 68,15,88,5,135,208,0,0 ; addps 0xd087(%rip),%xmm8 # 2db30 <_sk_overlay_sse2_8bit+0x15d8>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,215,201,0,0 ; addps 0xc9d7(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,88,5,251,201,0,0 ; addps 0xc9fb(%rip),%xmm8 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,107,208,0,0 ; addps 0xd06b(%rip),%xmm8 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
+ DB 68,15,88,5,127,208,0,0 ; addps 0xd07f(%rip),%xmm8 # 2db40 <_sk_overlay_sse2_8bit+0x15e8>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -31135,17 +31129,17 @@ _sk_bicubic_n1y_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse2
_sk_bicubic_p1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,181,201,0,0 ; movaps 0xc9b5(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,40,5,217,201,0,0 ; movaps 0xc9d9(%rip),%xmm8 # 2d4b0 <_sk_overlay_sse2_8bit+0xf58>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,32,208,0,0 ; movaps 0xd020(%rip),%xmm10 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
+ DB 68,15,40,21,52,208,0,0 ; movaps 0xd034(%rip),%xmm10 # 2db20 <_sk_overlay_sse2_8bit+0x15c8>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,36,208,0,0 ; addps 0xd024(%rip),%xmm10 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
+ DB 68,15,88,21,56,208,0,0 ; addps 0xd038(%rip),%xmm10 # 2db30 <_sk_overlay_sse2_8bit+0x15d8>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,32,208,0,0 ; addps 0xd020(%rip),%xmm10 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
+ DB 68,15,88,21,52,208,0,0 ; addps 0xd034(%rip),%xmm10 # 2db40 <_sk_overlay_sse2_8bit+0x15e8>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -31155,11 +31149,11 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,242,207,0,0 ; addps 0xcff2(%rip),%xmm1 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
+ DB 15,88,13,6,208,0,0 ; addps 0xd006(%rip),%xmm1 # 2db30 <_sk_overlay_sse2_8bit+0x15d8>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,194,207,0,0 ; mulps 0xcfc2(%rip),%xmm8 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
- DB 68,15,88,5,90,203,0,0 ; addps 0xcb5a(%rip),%xmm8 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
+ DB 68,15,89,5,214,207,0,0 ; mulps 0xcfd6(%rip),%xmm8 # 2db10 <_sk_overlay_sse2_8bit+0x15b8>
+ DB 68,15,88,5,110,203,0,0 ; addps 0xcb6e(%rip),%xmm8 # 2d6b0 <_sk_overlay_sse2_8bit+0x1158>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -31289,7 +31283,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,65,15,111,198 ; movdqa %xmm14,%xmm0
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,45,26,206,0,0 ; movdqa 0xce1a(%rip),%xmm5 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,45,46,206,0,0 ; movdqa 0xce2e(%rip),%xmm5 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
DB 102,15,244,197 ; pmuludq %xmm5,%xmm0
DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
@@ -31312,7 +31306,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,241 ; unpcklps %xmm1,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,29,199,0,0 ; paddd 0xc71d(%rip),%xmm1 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,254,13,49,199,0,0 ; paddd 0xc731(%rip),%xmm1 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,112,233,78 ; pshufd $0x4e,%xmm1,%xmm5
DB 102,73,15,126,232 ; movq %xmm5,%r8
DB 102,73,15,126,201 ; movq %xmm1,%r9
@@ -31329,7 +31323,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,44,131 ; movss (%r11,%r8,4),%xmm5
DB 15,20,253 ; unpcklps %xmm5,%xmm7
DB 15,20,249 ; unpcklps %xmm1,%xmm7
- DB 102,15,254,5,241,198,0,0 ; paddd 0xc6f1(%rip),%xmm0 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,254,5,5,199,0,0 ; paddd 0xc705(%rip),%xmm0 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,73,15,126,200 ; movq %xmm1,%r8
DB 102,73,15,126,193 ; movq %xmm0,%r9
@@ -31346,7 +31340,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,44,131 ; movss (%r11,%r8,4),%xmm5
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,20,200 ; unpcklps %xmm0,%xmm1
- DB 15,40,45,6,205,0,0 ; movaps 0xcd06(%rip),%xmm5 # 2db50 <_sk_overlay_sse2_8bit+0x15e4>
+ DB 15,40,45,26,205,0,0 ; movaps 0xcd1a(%rip),%xmm5 # 2db50 <_sk_overlay_sse2_8bit+0x15f8>
DB 15,88,229 ; addps %xmm5,%xmm4
DB 15,41,100,36,64 ; movaps %xmm4,0x40(%rsp)
DB 68,15,88,213 ; addps %xmm5,%xmm10
@@ -31361,7 +31355,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,127,68,36,32 ; movdqa %xmm0,0x20(%rsp)
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
- DB 102,15,111,5,207,204,0,0 ; movdqa 0xcccf(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,5,227,204,0,0 ; movdqa 0xcce3(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
DB 102,15,112,211,232 ; pshufd $0xe8,%xmm3,%xmm2
DB 102,15,244,224 ; pmuludq %xmm0,%xmm4
@@ -31383,7 +31377,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,227 ; unpcklps %xmm3,%xmm4
DB 15,20,229 ; unpcklps %xmm5,%xmm4
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
- DB 102,15,254,29,214,197,0,0 ; paddd 0xc5d6(%rip),%xmm3 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,254,29,234,197,0,0 ; paddd 0xc5ea(%rip),%xmm3 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,112,235,78 ; pshufd $0x4e,%xmm3,%xmm5
DB 102,73,15,126,232 ; movq %xmm5,%r8
DB 102,73,15,126,217 ; movq %xmm3,%r9
@@ -31400,7 +31394,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,4,131 ; movss (%r11,%r8,4),%xmm0
DB 15,20,216 ; unpcklps %xmm0,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
- DB 102,15,254,21,170,197,0,0 ; paddd 0xc5aa(%rip),%xmm2 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,254,21,190,197,0,0 ; paddd 0xc5be(%rip),%xmm2 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
DB 102,73,15,126,192 ; movq %xmm0,%r8
DB 102,73,15,126,209 ; movq %xmm2,%r9
@@ -31462,7 +31456,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 68,15,20,193 ; unpcklps %xmm1,%xmm8
DB 68,15,20,199 ; unpcklps %xmm7,%xmm8
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,68,15,111,21,114,196,0,0 ; movdqa 0xc472(%rip),%xmm10 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,68,15,111,21,134,196,0,0 ; movdqa 0xc486(%rip),%xmm10 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,112,249,78 ; pshufd $0x4e,%xmm1,%xmm7
DB 102,73,15,126,248 ; movq %xmm7,%r8
@@ -31480,7 +31474,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,44,131 ; movss (%r11,%r8,4),%xmm5
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,111,45,65,196,0,0 ; movdqa 0xc441(%rip),%xmm5 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,111,45,85,196,0,0 ; movdqa 0xc455(%rip),%xmm5 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,15,254,197 ; paddd %xmm5,%xmm0
DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5
DB 102,73,15,126,232 ; movq %xmm5,%r8
@@ -31538,7 +31532,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,60,131 ; movss (%r11,%r8,4),%xmm7
DB 68,15,20,223 ; unpcklps %xmm7,%xmm11
DB 68,15,20,221 ; unpcklps %xmm5,%xmm11
- DB 102,15,111,45,56,195,0,0 ; movdqa 0xc338(%rip),%xmm5 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,111,45,76,195,0,0 ; movdqa 0xc34c(%rip),%xmm5 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,15,254,245 ; paddd %xmm5,%xmm6
DB 102,15,111,253 ; movdqa %xmm5,%xmm7
DB 102,15,112,238,78 ; pshufd $0x4e,%xmm6,%xmm5
@@ -31585,7 +31579,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,254,201 ; paddd %xmm9,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,5,218,200,0,0 ; movdqa 0xc8da(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,5,238,200,0,0 ; movdqa 0xc8ee(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
DB 102,15,112,217,232 ; pshufd $0xe8,%xmm1,%xmm3
DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
@@ -31607,7 +31601,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,202 ; unpcklps %xmm2,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,111,5,226,193,0,0 ; movdqa 0xc1e2(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,111,5,246,193,0,0 ; movdqa 0xc1f6(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4
DB 102,73,15,126,224 ; movq %xmm4,%r8
@@ -31683,7 +31677,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,4,131 ; movss (%r11,%r8,4),%xmm0
DB 15,20,240 ; unpcklps %xmm0,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
- DB 102,15,254,29,172,192,0,0 ; paddd 0xc0ac(%rip),%xmm3 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,254,29,192,192,0,0 ; paddd 0xc0c0(%rip),%xmm3 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,15,112,195,78 ; pshufd $0x4e,%xmm3,%xmm0
DB 102,73,15,126,192 ; movq %xmm0,%r8
DB 102,73,15,126,217 ; movq %xmm3,%r9
@@ -31734,7 +31728,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 68,15,20,201 ; unpcklps %xmm1,%xmm9
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,166,191,0,0 ; paddd 0xbfa6(%rip),%xmm1 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,254,13,186,191,0,0 ; paddd 0xbfba(%rip),%xmm1 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,208 ; movq %xmm2,%r8
DB 102,73,15,126,201 ; movq %xmm1,%r9
@@ -31751,7 +31745,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,20,131 ; movss (%r11,%r8,4),%xmm2
DB 68,15,20,242 ; unpcklps %xmm2,%xmm14
DB 68,15,20,241 ; unpcklps %xmm1,%xmm14
- DB 102,15,254,5,120,191,0,0 ; paddd 0xbf78(%rip),%xmm0 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,254,5,140,191,0,0 ; paddd 0xbf8c(%rip),%xmm0 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,73,15,126,200 ; movq %xmm1,%r8
DB 102,73,15,126,193 ; movq %xmm0,%r9
@@ -31789,7 +31783,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,60,131 ; movss (%r11,%r8,4),%xmm7
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
- DB 102,15,111,37,167,190,0,0 ; movdqa 0xbea7(%rip),%xmm4 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,111,37,187,190,0,0 ; movdqa 0xbebb(%rip),%xmm4 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,254,226 ; paddd %xmm2,%xmm4
DB 102,15,112,204,78 ; pshufd $0x4e,%xmm4,%xmm1
DB 102,73,15,126,200 ; movq %xmm1,%r8
@@ -31807,7 +31801,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,36,131 ; movss (%r11,%r8,4),%xmm4
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,254,21,119,190,0,0 ; paddd 0xbe77(%rip),%xmm2 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,254,21,139,190,0,0 ; paddd 0xbe8b(%rip),%xmm2 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4
DB 102,73,15,126,224 ; movq %xmm4,%r8
DB 102,73,15,126,209 ; movq %xmm2,%r9
@@ -31956,7 +31950,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,209 ; paddd %xmm1,%xmm2
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
DB 102,15,254,218 ; paddd %xmm2,%xmm3
- DB 102,68,15,111,21,67,194,0,0 ; movdqa 0xc243(%rip),%xmm10 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,68,15,111,21,87,194,0,0 ; movdqa 0xc257(%rip),%xmm10 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,112,235,245 ; pshufd $0xf5,%xmm3,%xmm5
DB 102,65,15,244,218 ; pmuludq %xmm10,%xmm3
DB 102,15,112,227,232 ; pshufd $0xe8,%xmm3,%xmm4
@@ -31979,7 +31973,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,222 ; unpcklps %xmm6,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 102,15,111,236 ; movdqa %xmm4,%xmm5
- DB 102,15,254,45,68,187,0,0 ; paddd 0xbb44(%rip),%xmm5 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,254,45,88,187,0,0 ; paddd 0xbb58(%rip),%xmm5 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,112,245,78 ; pshufd $0x4e,%xmm5,%xmm6
DB 102,73,15,126,240 ; movq %xmm6,%r8
DB 102,73,15,126,233 ; movq %xmm5,%r9
@@ -31996,7 +31990,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,67,15,16,60,131 ; movss (%r11,%r8,4),%xmm7
DB 15,20,247 ; unpcklps %xmm7,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
- DB 102,15,254,37,24,187,0,0 ; paddd 0xbb18(%rip),%xmm4 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,254,37,44,187,0,0 ; paddd 0xbb2c(%rip),%xmm4 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,73,15,126,232 ; movq %xmm5,%r8
DB 102,73,15,126,225 ; movq %xmm4,%r9
@@ -32013,7 +32007,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,67,15,16,60,131 ; movss (%r11,%r8,4),%xmm7
DB 15,20,239 ; unpcklps %xmm7,%xmm5
DB 15,20,236 ; unpcklps %xmm4,%xmm5
- DB 15,40,61,45,193,0,0 ; movaps 0xc12d(%rip),%xmm7 # 2db50 <_sk_overlay_sse2_8bit+0x15e4>
+ DB 15,40,61,65,193,0,0 ; movaps 0xc141(%rip),%xmm7 # 2db50 <_sk_overlay_sse2_8bit+0x15f8>
DB 68,15,88,199 ; addps %xmm7,%xmm8
DB 68,15,41,68,36,48 ; movaps %xmm8,0x30(%rsp)
DB 68,15,88,207 ; addps %xmm7,%xmm9
@@ -32051,7 +32045,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,234 ; unpcklps %xmm2,%xmm13
DB 68,15,20,239 ; unpcklps %xmm7,%xmm13
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
- DB 102,15,254,21,236,185,0,0 ; paddd 0xb9ec(%rip),%xmm2 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,254,21,0,186,0,0 ; paddd 0xba00(%rip),%xmm2 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7
DB 102,73,15,126,248 ; movq %xmm7,%r8
DB 102,73,15,126,209 ; movq %xmm2,%r9
@@ -32068,7 +32062,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,71,15,16,12,131 ; movss (%r11,%r8,4),%xmm9
DB 65,15,20,209 ; unpcklps %xmm9,%xmm2
DB 15,20,215 ; unpcklps %xmm7,%xmm2
- DB 102,15,254,5,191,185,0,0 ; paddd 0xb9bf(%rip),%xmm0 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,254,5,211,185,0,0 ; paddd 0xb9d3(%rip),%xmm0 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,15,112,248,78 ; pshufd $0x4e,%xmm0,%xmm7
DB 102,73,15,126,248 ; movq %xmm7,%r8
DB 102,73,15,126,193 ; movq %xmm0,%r9
@@ -32109,7 +32103,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,217 ; movdqa %xmm1,%xmm3
DB 102,15,254,92,36,32 ; paddd 0x20(%rsp),%xmm3
DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
- DB 102,68,15,111,53,123,191,0,0 ; movdqa 0xbf7b(%rip),%xmm14 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,68,15,111,53,143,191,0,0 ; movdqa 0xbf8f(%rip),%xmm14 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,65,15,244,222 ; pmuludq %xmm14,%xmm3
DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
DB 102,65,15,244,230 ; pmuludq %xmm14,%xmm4
@@ -32130,7 +32124,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,228 ; unpcklps %xmm4,%xmm12
DB 68,15,20,229 ; unpcklps %xmm5,%xmm12
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
- DB 102,15,111,61,131,184,0,0 ; movdqa 0xb883(%rip),%xmm7 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,111,61,151,184,0,0 ; movdqa 0xb897(%rip),%xmm7 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,254,231 ; paddd %xmm7,%xmm4
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,73,15,126,232 ; movq %xmm5,%r8
@@ -32148,7 +32142,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,67,15,16,44,131 ; movss (%r11,%r8,4),%xmm5
DB 15,20,245 ; unpcklps %xmm5,%xmm6
DB 15,20,244 ; unpcklps %xmm4,%xmm6
- DB 102,68,15,111,5,82,184,0,0 ; movdqa 0xb852(%rip),%xmm8 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,68,15,111,5,102,184,0,0 ; movdqa 0xb866(%rip),%xmm8 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,65,15,254,216 ; paddd %xmm8,%xmm3
DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
DB 102,73,15,126,224 ; movq %xmm4,%r8
@@ -32262,7 +32256,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,68,15,111,108,36,32 ; movdqa 0x20(%rsp),%xmm13
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,29,176,188,0,0 ; movdqa 0xbcb0(%rip),%xmm3 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,29,196,188,0,0 ; movdqa 0xbcc4(%rip),%xmm3 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
@@ -32284,7 +32278,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 68,15,20,205 ; unpcklps %xmm5,%xmm9
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,111,29,182,181,0,0 ; movdqa 0xb5b6(%rip),%xmm3 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,111,29,202,181,0,0 ; movdqa 0xb5ca(%rip),%xmm3 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,234,78 ; pshufd $0x4e,%xmm2,%xmm5
DB 102,73,15,126,232 ; movq %xmm5,%r8
@@ -32392,7 +32386,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,65,15,111,211 ; movdqa %xmm11,%xmm2
DB 102,65,15,254,213 ; paddd %xmm13,%xmm2
DB 102,15,112,218,245 ; pshufd $0xf5,%xmm2,%xmm3
- DB 102,15,111,5,107,186,0,0 ; movdqa 0xba6b(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,5,127,186,0,0 ; movdqa 0xba7f(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
DB 102,15,112,250,232 ; pshufd $0xe8,%xmm2,%xmm7
DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
@@ -32413,7 +32407,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 68,15,20,203 ; unpcklps %xmm3,%xmm9
DB 102,15,111,215 ; movdqa %xmm7,%xmm2
- DB 102,15,111,5,117,179,0,0 ; movdqa 0xb375(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,111,5,137,179,0,0 ; movdqa 0xb389(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
DB 102,73,15,126,216 ; movq %xmm3,%r8
@@ -32431,7 +32425,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,67,15,16,28,131 ; movss (%r11,%r8,4),%xmm3
DB 15,20,243 ; unpcklps %xmm3,%xmm6
DB 15,20,242 ; unpcklps %xmm2,%xmm6
- DB 102,68,15,111,45,68,179,0,0 ; movdqa 0xb344(%rip),%xmm13 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,68,15,111,45,88,179,0,0 ; movdqa 0xb358(%rip),%xmm13 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,65,15,254,253 ; paddd %xmm13,%xmm7
DB 102,15,112,215,78 ; pshufd $0x4e,%xmm7,%xmm2
DB 102,73,15,126,208 ; movq %xmm2,%r8
@@ -32451,7 +32445,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,250 ; unpcklps %xmm2,%xmm7
DB 102,68,15,254,220 ; paddd %xmm4,%xmm11
DB 102,65,15,112,219,245 ; pshufd $0xf5,%xmm11,%xmm3
- DB 102,15,111,37,88,185,0,0 ; movdqa 0xb958(%rip),%xmm4 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,37,108,185,0,0 ; movdqa 0xb96c(%rip),%xmm4 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,68,15,244,220 ; pmuludq %xmm4,%xmm11
DB 102,65,15,112,211,232 ; pshufd $0xe8,%xmm11,%xmm2
DB 102,15,244,220 ; pmuludq %xmm4,%xmm3
@@ -32552,7 +32546,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,65,15,111,202 ; movdqa %xmm10,%xmm1
DB 102,15,254,200 ; paddd %xmm0,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,29,139,183,0,0 ; movdqa 0xb78b(%rip),%xmm3 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,29,159,183,0,0 ; movdqa 0xb79f(%rip),%xmm3 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
@@ -32574,7 +32568,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,212 ; unpcklps %xmm4,%xmm2
DB 15,20,211 ; unpcklps %xmm3,%xmm2
DB 102,15,111,217 ; movdqa %xmm1,%xmm3
- DB 102,15,111,61,146,176,0,0 ; movdqa 0xb092(%rip),%xmm7 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,111,61,166,176,0,0 ; movdqa 0xb0a6(%rip),%xmm7 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,254,223 ; paddd %xmm7,%xmm3
DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
DB 102,73,15,126,224 ; movq %xmm4,%r8
@@ -32592,7 +32586,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,67,15,16,44,131 ; movss (%r11,%r8,4),%xmm5
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 15,20,220 ; unpcklps %xmm4,%xmm3
- DB 102,68,15,111,13,97,176,0,0 ; movdqa 0xb061(%rip),%xmm9 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,68,15,111,13,117,176,0,0 ; movdqa 0xb075(%rip),%xmm9 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,65,15,254,201 ; paddd %xmm9,%xmm1
DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
DB 102,73,15,126,224 ; movq %xmm4,%r8
@@ -32704,7 +32698,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,246 ; unpcklps %xmm6,%xmm14
DB 68,15,20,243 ; unpcklps %xmm3,%xmm14
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
- DB 102,68,15,111,21,72,174,0,0 ; movdqa 0xae48(%rip),%xmm10 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,68,15,111,21,92,174,0,0 ; movdqa 0xae5c(%rip),%xmm10 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,65,15,254,218 ; paddd %xmm10,%xmm3
DB 102,15,112,243,78 ; pshufd $0x4e,%xmm3,%xmm6
DB 102,73,15,126,240 ; movq %xmm6,%r8
@@ -32825,7 +32819,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,116,36,32 ; movdqa 0x20(%rsp),%xmm6
DB 102,15,254,198 ; paddd %xmm6,%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,29,184,178,0,0 ; movdqa 0xb2b8(%rip),%xmm3 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,29,204,178,0,0 ; movdqa 0xb2cc(%rip),%xmm3 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,244,195 ; pmuludq %xmm3,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
@@ -32847,7 +32841,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,195 ; unpcklps %xmm3,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
- DB 102,68,15,111,5,190,171,0,0 ; movdqa 0xabbe(%rip),%xmm8 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,68,15,111,5,210,171,0,0 ; movdqa 0xabd2(%rip),%xmm8 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,65,15,254,200 ; paddd %xmm8,%xmm1
DB 102,15,112,217,78 ; pshufd $0x4e,%xmm1,%xmm3
DB 102,73,15,126,216 ; movq %xmm3,%r8
@@ -32953,7 +32947,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,60,36 ; paddd (%rsp),%xmm7
DB 102,15,254,247 ; paddd %xmm7,%xmm6
DB 102,15,112,206,245 ; pshufd $0xf5,%xmm6,%xmm1
- DB 102,15,111,21,121,176,0,0 ; movdqa 0xb079(%rip),%xmm2 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,21,141,176,0,0 ; movdqa 0xb08d(%rip),%xmm2 # 2db60 <_sk_overlay_sse2_8bit+0x1608>
DB 102,15,244,242 ; pmuludq %xmm2,%xmm6
DB 102,15,112,198,232 ; pshufd $0xe8,%xmm6,%xmm0
DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
@@ -32975,7 +32969,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,201 ; unpcklps %xmm1,%xmm9
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,127,169,0,0 ; paddd 0xa97f(%rip),%xmm1 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,254,13,147,169,0,0 ; paddd 0xa993(%rip),%xmm1 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,208 ; movq %xmm2,%r8
DB 102,73,15,126,201 ; movq %xmm1,%r9
@@ -33031,7 +33025,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,67,15,16,60,131 ; movss (%r11,%r8,4),%xmm7
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
- DB 102,15,111,53,123,168,0,0 ; movdqa 0xa87b(%rip),%xmm6 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
+ DB 102,15,111,53,143,168,0,0 ; movdqa 0xa88f(%rip),%xmm6 # 2d4d0 <_sk_overlay_sse2_8bit+0xf78>
DB 102,15,254,242 ; paddd %xmm2,%xmm6
DB 102,15,112,206,78 ; pshufd $0x4e,%xmm6,%xmm1
DB 102,73,15,126,200 ; movq %xmm1,%r8
@@ -33049,7 +33043,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,71,15,16,60,131 ; movss (%r11,%r8,4),%xmm15
DB 65,15,20,207 ; unpcklps %xmm15,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,254,21,74,168,0,0 ; paddd 0xa84a(%rip),%xmm2 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
+ DB 102,15,254,21,94,168,0,0 ; paddd 0xa85e(%rip),%xmm2 # 2d4f0 <_sk_overlay_sse2_8bit+0xf98>
DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7
DB 102,73,15,126,248 ; movq %xmm7,%r8
DB 102,73,15,126,209 ; movq %xmm2,%r9
@@ -33111,7 +33105,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 65,15,88,213 ; addps %xmm13,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,36,167,0,0 ; movaps 0xa724(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
+ DB 15,40,29,56,167,0,0 ; movaps 0xa738(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf68>
DB 15,40,164,36,240,0,0,0 ; movaps 0xf0(%rsp),%xmm4
DB 15,40,172,36,0,1,0,0 ; movaps 0x100(%rsp),%xmm5
DB 15,40,180,36,16,1,0,0 ; movaps 0x110(%rsp),%xmm6
@@ -33153,13 +33147,13 @@ _sk_start_pipeline_hsw_8bit LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,101 ; jae 22eac <_sk_start_pipeline_hsw_8bit+0xe4>
+ DB 115,101 ; jae 22e98 <_sk_start_pipeline_hsw_8bit+0xe4>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,16 ; lea 0x10(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
- DB 119,38 ; ja 22e8f <_sk_start_pipeline_hsw_8bit+0xc7>
+ DB 119,38 ; ja 22e7b <_sk_start_pipeline_hsw_8bit+0xc7>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 49,255 ; xor %edi,%edi
DB 76,137,246 ; mov %r14,%rsi
@@ -33170,16 +33164,16 @@ _sk_start_pipeline_hsw_8bit LABEL PROC
DB 73,131,196,32 ; add $0x20,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,225 ; jbe 22e70 <_sk_start_pipeline_hsw_8bit+0xa8>
+ DB 118,225 ; jbe 22e5c <_sk_start_pipeline_hsw_8bit+0xa8>
DB 76,137,255 ; mov %r15,%rdi
DB 72,41,215 ; sub %rdx,%rdi
- DB 116,9 ; je 22ea0 <_sk_start_pipeline_hsw_8bit+0xd8>
+ DB 116,9 ; je 22e8c <_sk_start_pipeline_hsw_8bit+0xd8>
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,173 ; jne 22e59 <_sk_start_pipeline_hsw_8bit+0x91>
+ DB 117,173 ; jne 22e45 <_sk_start_pipeline_hsw_8bit+0x91>
DB 197,248,40,181,32,255,255,255 ; vmovaps -0xe0(%rbp),%xmm6
DB 197,248,40,189,48,255,255,255 ; vmovaps -0xd0(%rbp),%xmm7
DB 197,120,40,133,64,255,255,255 ; vmovaps -0xc0(%rbp),%xmm8
@@ -33217,7 +33211,7 @@ _sk_uniform_color_hsw_8bit LABEL PROC
PUBLIC _sk_set_rgb_hsw_8bit
_sk_set_rgb_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 197,250,16,37,230,154,0,0 ; vmovss 0x9ae6(%rip),%xmm4 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 197,250,16,37,202,163,0,0 ; vmovss 0xa3ca(%rip),%xmm4 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 197,218,89,40 ; vmulss (%rax),%xmm4,%xmm5
DB 196,97,250,44,197 ; vcvttss2si %xmm5,%r8
DB 197,218,89,104,4 ; vmulss 0x4(%rax),%xmm4,%xmm5
@@ -33230,7 +33224,7 @@ _sk_set_rgb_hsw_8bit LABEL PROC
DB 68,9,200 ; or %r9d,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,88,228 ; vpbroadcastd %xmm4,%ymm4
- DB 197,253,111,45,131,160,0,0 ; vmovdqa 0xa083(%rip),%ymm5 # 2cfe0 <_sk_overlay_sse2_8bit+0xa74>
+ DB 197,253,111,45,247,158,0,0 ; vmovdqa 0x9ef7(%rip),%ymm5 # 2ce40 <_sk_overlay_sse2_8bit+0x8e8>
DB 197,245,219,205 ; vpand %ymm5,%ymm1,%ymm1
DB 197,253,219,197 ; vpand %ymm5,%ymm0,%ymm0
DB 197,221,235,192 ; vpor %ymm0,%ymm4,%ymm0
@@ -33240,10 +33234,10 @@ _sk_set_rgb_hsw_8bit LABEL PROC
PUBLIC _sk_premul_hsw_8bit
_sk_premul_hsw_8bit LABEL PROC
- DB 197,253,111,37,135,160,0,0 ; vmovdqa 0xa087(%rip),%ymm4 # 2d000 <_sk_overlay_sse2_8bit+0xa94>
+ DB 197,253,111,37,251,158,0,0 ; vmovdqa 0x9efb(%rip),%ymm4 # 2ce60 <_sk_overlay_sse2_8bit+0x908>
DB 196,226,125,0,236 ; vpshufb %ymm4,%ymm0,%ymm5
DB 196,226,117,0,228 ; vpshufb %ymm4,%ymm1,%ymm4
- DB 197,253,111,53,149,160,0,0 ; vmovdqa 0xa095(%rip),%ymm6 # 2d020 <_sk_overlay_sse2_8bit+0xab4>
+ DB 197,253,111,53,9,159,0,0 ; vmovdqa 0x9f09(%rip),%ymm6 # 2ce80 <_sk_overlay_sse2_8bit+0x928>
DB 197,221,235,230 ; vpor %ymm6,%ymm4,%ymm4
DB 197,213,235,238 ; vpor %ymm6,%ymm5,%ymm5
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -33281,7 +33275,7 @@ _sk_premul_hsw_8bit LABEL PROC
PUBLIC _sk_swap_rb_hsw_8bit
_sk_swap_rb_hsw_8bit LABEL PROC
- DB 197,253,111,37,13,160,0,0 ; vmovdqa 0xa00d(%rip),%ymm4 # 2d040 <_sk_overlay_sse2_8bit+0xad4>
+ DB 197,253,111,37,129,158,0,0 ; vmovdqa 0x9e81(%rip),%ymm4 # 2cea0 <_sk_overlay_sse2_8bit+0x948>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33305,7 +33299,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 2307e <_sk_load_8888_hsw_8bit+0x2d>
+ DB 117,17 ; jne 2306a <_sk_load_8888_hsw_8bit+0x2d>
DB 196,129,126,111,76,152,32 ; vmovdqu 0x20(%r8,%r11,4),%ymm1
DB 196,129,126,111,4,152 ; vmovdqu (%r8,%r11,4),%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33316,14 +33310,14 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 197,253,239,192 ; vpxor %ymm0,%ymm0,%ymm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,228 ; ja 2307a <_sk_load_8888_hsw_8bit+0x29>
+ DB 119,228 ; ja 23066 <_sk_load_8888_hsw_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,23,1,0,0 ; lea 0x117(%rip),%r10 # 231b8 <_sk_load_8888_hsw_8bit+0x167>
+ DB 76,141,21,23,1,0,0 ; lea 0x117(%rip),%r10 # 231a4 <_sk_load_8888_hsw_8bit+0x167>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,4,152 ; vmovd (%r8,%r11,4),%xmm0
- DB 235,200 ; jmp 2307a <_sk_load_8888_hsw_8bit+0x29>
+ DB 235,200 ; jmp 23066 <_sk_load_8888_hsw_8bit+0x29>
DB 196,129,121,110,68,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33331,7 +33325,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,130,121,53,36,152 ; vpmovzxdq (%r8,%r11,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,125,2,196,3 ; vpblendd $0x3,%ymm4,%ymm0,%ymm0
- DB 235,159 ; jmp 2307a <_sk_load_8888_hsw_8bit+0x29>
+ DB 235,159 ; jmp 23066 <_sk_load_8888_hsw_8bit+0x29>
DB 196,129,121,110,68,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33344,7 +33338,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,227,125,56,196,1 ; vinserti128 $0x1,%xmm4,%ymm0,%ymm0
DB 196,129,122,111,36,152 ; vmovdqu (%r8,%r11,4),%xmm4
DB 196,227,93,2,192,240 ; vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- DB 233,80,255,255,255 ; jmpq 2307a <_sk_load_8888_hsw_8bit+0x29>
+ DB 233,80,255,255,255 ; jmpq 23066 <_sk_load_8888_hsw_8bit+0x29>
DB 196,129,121,110,68,152,40 ; vmovd 0x28(%r8,%r11,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33353,7 +33347,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,227,117,2,200,15 ; vpblendd $0xf,%ymm0,%ymm1,%ymm1
DB 196,129,121,110,68,152,32 ; vmovd 0x20(%r8,%r11,4),%xmm0
DB 196,227,117,2,200,1 ; vpblendd $0x1,%ymm0,%ymm1,%ymm1
- DB 233,20,255,255,255 ; jmpq 23074 <_sk_load_8888_hsw_8bit+0x23>
+ DB 233,20,255,255,255 ; jmpq 23060 <_sk_load_8888_hsw_8bit+0x23>
DB 196,129,121,110,68,152,56 ; vmovd 0x38(%r8,%r11,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33367,7 +33361,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,129,126,111,4,152 ; vmovdqu (%r8,%r11,4),%ymm0
DB 196,129,122,111,100,152,32 ; vmovdqu 0x20(%r8,%r11,4),%xmm4
DB 196,227,93,2,201,240 ; vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- DB 233,196,254,255,255 ; jmpq 2307a <_sk_load_8888_hsw_8bit+0x29>
+ DB 233,196,254,255,255 ; jmpq 23066 <_sk_load_8888_hsw_8bit+0x29>
DB 102,144 ; xchg %ax,%ax
DB 242,254 ; repnz (bad)
DB 255 ; (bad)
@@ -33417,7 +33411,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 23221 <_sk_load_8888_dst_hsw_8bit+0x2d>
+ DB 117,17 ; jne 2320d <_sk_load_8888_dst_hsw_8bit+0x2d>
DB 196,129,126,111,92,152,32 ; vmovdqu 0x20(%r8,%r11,4),%ymm3
DB 196,129,126,111,20,152 ; vmovdqu (%r8,%r11,4),%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33428,14 +33422,14 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 197,237,239,210 ; vpxor %ymm2,%ymm2,%ymm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,228 ; ja 2321d <_sk_load_8888_dst_hsw_8bit+0x29>
+ DB 119,228 ; ja 23209 <_sk_load_8888_dst_hsw_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,24,1,0,0 ; lea 0x118(%rip),%r10 # 2335c <_sk_load_8888_dst_hsw_8bit+0x168>
+ DB 76,141,21,24,1,0,0 ; lea 0x118(%rip),%r10 # 23348 <_sk_load_8888_dst_hsw_8bit+0x168>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,20,152 ; vmovd (%r8,%r11,4),%xmm2
- DB 235,200 ; jmp 2321d <_sk_load_8888_dst_hsw_8bit+0x29>
+ DB 235,200 ; jmp 23209 <_sk_load_8888_dst_hsw_8bit+0x29>
DB 196,129,121,110,84,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33443,7 +33437,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,130,121,53,36,152 ; vpmovzxdq (%r8,%r11,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,109,2,212,3 ; vpblendd $0x3,%ymm4,%ymm2,%ymm2
- DB 235,159 ; jmp 2321d <_sk_load_8888_dst_hsw_8bit+0x29>
+ DB 235,159 ; jmp 23209 <_sk_load_8888_dst_hsw_8bit+0x29>
DB 196,129,121,110,84,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33456,7 +33450,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,227,109,56,212,1 ; vinserti128 $0x1,%xmm4,%ymm2,%ymm2
DB 196,129,122,111,36,152 ; vmovdqu (%r8,%r11,4),%xmm4
DB 196,227,93,2,210,240 ; vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- DB 233,80,255,255,255 ; jmpq 2321d <_sk_load_8888_dst_hsw_8bit+0x29>
+ DB 233,80,255,255,255 ; jmpq 23209 <_sk_load_8888_dst_hsw_8bit+0x29>
DB 196,129,121,110,84,152,40 ; vmovd 0x28(%r8,%r11,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33465,7 +33459,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,227,101,2,218,15 ; vpblendd $0xf,%ymm2,%ymm3,%ymm3
DB 196,129,121,110,84,152,32 ; vmovd 0x20(%r8,%r11,4),%xmm2
DB 196,227,101,2,218,1 ; vpblendd $0x1,%ymm2,%ymm3,%ymm3
- DB 233,20,255,255,255 ; jmpq 23217 <_sk_load_8888_dst_hsw_8bit+0x23>
+ DB 233,20,255,255,255 ; jmpq 23203 <_sk_load_8888_dst_hsw_8bit+0x23>
DB 196,129,121,110,84,152,56 ; vmovd 0x38(%r8,%r11,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33479,7 +33473,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,129,126,111,20,152 ; vmovdqu (%r8,%r11,4),%ymm2
DB 196,129,122,111,100,152,32 ; vmovdqu 0x20(%r8,%r11,4),%xmm4
DB 196,227,93,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- DB 233,196,254,255,255 ; jmpq 2321d <_sk_load_8888_dst_hsw_8bit+0x29>
+ DB 233,196,254,255,255 ; jmpq 23209 <_sk_load_8888_dst_hsw_8bit+0x29>
DB 15,31,0 ; nopl (%rax)
DB 241 ; icebp
DB 254 ; (bad)
@@ -33529,7 +33523,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 233c5 <_sk_store_8888_hsw_8bit+0x2d>
+ DB 117,17 ; jne 233b1 <_sk_store_8888_hsw_8bit+0x2d>
DB 196,129,126,127,4,152 ; vmovdqu %ymm0,(%r8,%r11,4)
DB 196,129,126,127,76,152,32 ; vmovdqu %ymm1,0x20(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33538,17 +33532,17 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,236 ; ja 233c1 <_sk_store_8888_hsw_8bit+0x29>
+ DB 119,236 ; ja 233ad <_sk_store_8888_hsw_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,176,0,0,0 ; lea 0xb0(%rip),%r10 # 23490 <_sk_store_8888_hsw_8bit+0xf8>
+ DB 76,141,21,176,0,0,0 ; lea 0xb0(%rip),%r10 # 2347c <_sk_store_8888_hsw_8bit+0xf8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,129,121,126,4,152 ; vmovd %xmm0,(%r8,%r11,4)
- DB 235,208 ; jmp 233c1 <_sk_store_8888_hsw_8bit+0x29>
+ DB 235,208 ; jmp 233ad <_sk_store_8888_hsw_8bit+0x29>
DB 196,131,121,22,68,152,8,2 ; vpextrd $0x2,%xmm0,0x8(%r8,%r11,4)
DB 196,129,121,214,4,152 ; vmovq %xmm0,(%r8,%r11,4)
- DB 235,192 ; jmp 233c1 <_sk_store_8888_hsw_8bit+0x29>
+ DB 235,192 ; jmp 233ad <_sk_store_8888_hsw_8bit+0x29>
DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4
DB 196,131,121,22,100,152,24,2 ; vpextrd $0x2,%xmm4,0x18(%r8,%r11,4)
DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4
@@ -33556,12 +33550,12 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4
DB 196,129,121,126,100,152,16 ; vmovd %xmm4,0x10(%r8,%r11,4)
DB 196,129,122,127,4,152 ; vmovdqu %xmm0,(%r8,%r11,4)
- DB 235,143 ; jmp 233c1 <_sk_store_8888_hsw_8bit+0x29>
+ DB 235,143 ; jmp 233ad <_sk_store_8888_hsw_8bit+0x29>
DB 196,131,121,22,76,152,40,2 ; vpextrd $0x2,%xmm1,0x28(%r8,%r11,4)
DB 196,131,121,22,76,152,36,1 ; vpextrd $0x1,%xmm1,0x24(%r8,%r11,4)
DB 196,129,121,126,76,152,32 ; vmovd %xmm1,0x20(%r8,%r11,4)
DB 196,129,126,127,4,152 ; vmovdqu %ymm0,(%r8,%r11,4)
- DB 233,109,255,255,255 ; jmpq 233c1 <_sk_store_8888_hsw_8bit+0x29>
+ DB 233,109,255,255,255 ; jmpq 233ad <_sk_store_8888_hsw_8bit+0x29>
DB 196,227,125,57,204,1 ; vextracti128 $0x1,%ymm1,%xmm4
DB 196,131,121,22,100,152,56,2 ; vpextrd $0x2,%xmm4,0x38(%r8,%r11,4)
DB 196,227,125,57,204,1 ; vextracti128 $0x1,%ymm1,%xmm4
@@ -33570,7 +33564,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 196,129,121,126,100,152,48 ; vmovd %xmm4,0x30(%r8,%r11,4)
DB 196,129,126,127,4,152 ; vmovdqu %ymm0,(%r8,%r11,4)
DB 196,129,122,127,76,152,32 ; vmovdqu %xmm1,0x20(%r8,%r11,4)
- DB 233,50,255,255,255 ; jmpq 233c1 <_sk_store_8888_hsw_8bit+0x29>
+ DB 233,50,255,255,255 ; jmpq 233ad <_sk_store_8888_hsw_8bit+0x29>
DB 144 ; nop
DB 89 ; pop %rcx
DB 255 ; (bad)
@@ -33583,7 +33577,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,255 ; jg 234a5 <_sk_store_8888_hsw_8bit+0x10d>
+ DB 127,255 ; jg 23491 <_sk_store_8888_hsw_8bit+0x10d>
DB 255 ; (bad)
DB 255,113,255 ; pushq -0x1(%rcx)
DB 255 ; (bad)
@@ -33619,10 +33613,10 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,35 ; jne 2350b <_sk_load_bgra_hsw_8bit+0x3f>
+ DB 117,35 ; jne 234f7 <_sk_load_bgra_hsw_8bit+0x3f>
DB 196,129,126,111,76,152,32 ; vmovdqu 0x20(%r8,%r11,4),%ymm1
DB 196,129,126,111,4,152 ; vmovdqu (%r8,%r11,4),%ymm0
- DB 197,253,111,37,99,155,0,0 ; vmovdqa 0x9b63(%rip),%ymm4 # 2d060 <_sk_overlay_sse2_8bit+0xaf4>
+ DB 197,253,111,37,215,153,0,0 ; vmovdqa 0x99d7(%rip),%ymm4 # 2cec0 <_sk_overlay_sse2_8bit+0x968>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33633,14 +33627,14 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 197,253,239,192 ; vpxor %ymm0,%ymm0,%ymm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,210 ; ja 234f5 <_sk_load_bgra_hsw_8bit+0x29>
+ DB 119,210 ; ja 234e1 <_sk_load_bgra_hsw_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,22,1,0,0 ; lea 0x116(%rip),%r10 # 23644 <_sk_load_bgra_hsw_8bit+0x178>
+ DB 76,141,21,22,1,0,0 ; lea 0x116(%rip),%r10 # 23630 <_sk_load_bgra_hsw_8bit+0x178>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,4,152 ; vmovd (%r8,%r11,4),%xmm0
- DB 235,182 ; jmp 234f5 <_sk_load_bgra_hsw_8bit+0x29>
+ DB 235,182 ; jmp 234e1 <_sk_load_bgra_hsw_8bit+0x29>
DB 196,129,121,110,68,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33648,7 +33642,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,130,121,53,36,152 ; vpmovzxdq (%r8,%r11,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,125,2,196,3 ; vpblendd $0x3,%ymm4,%ymm0,%ymm0
- DB 235,141 ; jmp 234f5 <_sk_load_bgra_hsw_8bit+0x29>
+ DB 235,141 ; jmp 234e1 <_sk_load_bgra_hsw_8bit+0x29>
DB 196,129,121,110,68,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33661,7 +33655,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,227,125,56,196,1 ; vinserti128 $0x1,%xmm4,%ymm0,%ymm0
DB 196,129,122,111,36,152 ; vmovdqu (%r8,%r11,4),%xmm4
DB 196,227,93,2,192,240 ; vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- DB 233,62,255,255,255 ; jmpq 234f5 <_sk_load_bgra_hsw_8bit+0x29>
+ DB 233,62,255,255,255 ; jmpq 234e1 <_sk_load_bgra_hsw_8bit+0x29>
DB 196,129,121,110,68,152,40 ; vmovd 0x28(%r8,%r11,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33670,7 +33664,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,227,117,2,200,15 ; vpblendd $0xf,%ymm0,%ymm1,%ymm1
DB 196,129,121,110,68,152,32 ; vmovd 0x20(%r8,%r11,4),%xmm0
DB 196,227,117,2,200,1 ; vpblendd $0x1,%ymm0,%ymm1,%ymm1
- DB 233,2,255,255,255 ; jmpq 234ef <_sk_load_bgra_hsw_8bit+0x23>
+ DB 233,2,255,255,255 ; jmpq 234db <_sk_load_bgra_hsw_8bit+0x23>
DB 196,129,121,110,68,152,56 ; vmovd 0x38(%r8,%r11,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33684,7 +33678,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,129,126,111,4,152 ; vmovdqu (%r8,%r11,4),%ymm0
DB 196,129,122,111,100,152,32 ; vmovdqu 0x20(%r8,%r11,4),%xmm4
DB 196,227,93,2,201,240 ; vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- DB 233,178,254,255,255 ; jmpq 234f5 <_sk_load_bgra_hsw_8bit+0x29>
+ DB 233,178,254,255,255 ; jmpq 234e1 <_sk_load_bgra_hsw_8bit+0x29>
DB 144 ; nop
DB 243,254 ; repz (bad)
DB 255 ; (bad)
@@ -33732,10 +33726,10 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,35 ; jne 236bf <_sk_load_bgra_dst_hsw_8bit+0x3f>
+ DB 117,35 ; jne 236ab <_sk_load_bgra_dst_hsw_8bit+0x3f>
DB 196,129,126,111,92,152,32 ; vmovdqu 0x20(%r8,%r11,4),%ymm3
DB 196,129,126,111,20,152 ; vmovdqu (%r8,%r11,4),%ymm2
- DB 197,253,111,37,207,153,0,0 ; vmovdqa 0x99cf(%rip),%ymm4 # 2d080 <_sk_overlay_sse2_8bit+0xb14>
+ DB 197,253,111,37,67,152,0,0 ; vmovdqa 0x9843(%rip),%ymm4 # 2cee0 <_sk_overlay_sse2_8bit+0x988>
DB 196,226,109,0,212 ; vpshufb %ymm4,%ymm2,%ymm2
DB 196,226,101,0,220 ; vpshufb %ymm4,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33746,14 +33740,14 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 197,237,239,210 ; vpxor %ymm2,%ymm2,%ymm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,210 ; ja 236a9 <_sk_load_bgra_dst_hsw_8bit+0x29>
+ DB 119,210 ; ja 23695 <_sk_load_bgra_dst_hsw_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,22,1,0,0 ; lea 0x116(%rip),%r10 # 237f8 <_sk_load_bgra_dst_hsw_8bit+0x178>
+ DB 76,141,21,22,1,0,0 ; lea 0x116(%rip),%r10 # 237e4 <_sk_load_bgra_dst_hsw_8bit+0x178>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,20,152 ; vmovd (%r8,%r11,4),%xmm2
- DB 235,182 ; jmp 236a9 <_sk_load_bgra_dst_hsw_8bit+0x29>
+ DB 235,182 ; jmp 23695 <_sk_load_bgra_dst_hsw_8bit+0x29>
DB 196,129,121,110,84,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33761,7 +33755,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,130,121,53,36,152 ; vpmovzxdq (%r8,%r11,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,109,2,212,3 ; vpblendd $0x3,%ymm4,%ymm2,%ymm2
- DB 235,141 ; jmp 236a9 <_sk_load_bgra_dst_hsw_8bit+0x29>
+ DB 235,141 ; jmp 23695 <_sk_load_bgra_dst_hsw_8bit+0x29>
DB 196,129,121,110,84,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33774,7 +33768,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,227,109,56,212,1 ; vinserti128 $0x1,%xmm4,%ymm2,%ymm2
DB 196,129,122,111,36,152 ; vmovdqu (%r8,%r11,4),%xmm4
DB 196,227,93,2,210,240 ; vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- DB 233,62,255,255,255 ; jmpq 236a9 <_sk_load_bgra_dst_hsw_8bit+0x29>
+ DB 233,62,255,255,255 ; jmpq 23695 <_sk_load_bgra_dst_hsw_8bit+0x29>
DB 196,129,121,110,84,152,40 ; vmovd 0x28(%r8,%r11,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33783,7 +33777,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,227,101,2,218,15 ; vpblendd $0xf,%ymm2,%ymm3,%ymm3
DB 196,129,121,110,84,152,32 ; vmovd 0x20(%r8,%r11,4),%xmm2
DB 196,227,101,2,218,1 ; vpblendd $0x1,%ymm2,%ymm3,%ymm3
- DB 233,2,255,255,255 ; jmpq 236a3 <_sk_load_bgra_dst_hsw_8bit+0x23>
+ DB 233,2,255,255,255 ; jmpq 2368f <_sk_load_bgra_dst_hsw_8bit+0x23>
DB 196,129,121,110,84,152,56 ; vmovd 0x38(%r8,%r11,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33797,7 +33791,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,129,126,111,20,152 ; vmovdqu (%r8,%r11,4),%ymm2
DB 196,129,122,111,100,152,32 ; vmovdqu 0x20(%r8,%r11,4),%xmm4
DB 196,227,93,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- DB 233,178,254,255,255 ; jmpq 236a9 <_sk_load_bgra_dst_hsw_8bit+0x29>
+ DB 233,178,254,255,255 ; jmpq 23695 <_sk_load_bgra_dst_hsw_8bit+0x29>
DB 144 ; nop
DB 243,254 ; repz (bad)
DB 255 ; (bad)
@@ -33844,11 +33838,11 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 197,253,111,37,77,152,0,0 ; vmovdqa 0x984d(%rip),%ymm4 # 2d0a0 <_sk_overlay_sse2_8bit+0xb34>
+ DB 197,253,111,37,193,150,0,0 ; vmovdqa 0x96c1(%rip),%ymm4 # 2cf00 <_sk_overlay_sse2_8bit+0x9a8>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 23873 <_sk_store_bgra_hsw_8bit+0x3f>
+ DB 117,17 ; jne 2385f <_sk_store_bgra_hsw_8bit+0x3f>
DB 196,129,126,127,36,152 ; vmovdqu %ymm4,(%r8,%r11,4)
DB 196,129,126,127,108,152,32 ; vmovdqu %ymm5,0x20(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33857,17 +33851,17 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,236 ; ja 2386f <_sk_store_bgra_hsw_8bit+0x3b>
+ DB 119,236 ; ja 2385b <_sk_store_bgra_hsw_8bit+0x3b>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,178,0,0,0 ; lea 0xb2(%rip),%r10 # 23940 <_sk_store_bgra_hsw_8bit+0x10c>
+ DB 76,141,21,178,0,0,0 ; lea 0xb2(%rip),%r10 # 2392c <_sk_store_bgra_hsw_8bit+0x10c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,129,121,126,36,152 ; vmovd %xmm4,(%r8,%r11,4)
- DB 235,208 ; jmp 2386f <_sk_store_bgra_hsw_8bit+0x3b>
+ DB 235,208 ; jmp 2385b <_sk_store_bgra_hsw_8bit+0x3b>
DB 196,131,121,22,100,152,8,2 ; vpextrd $0x2,%xmm4,0x8(%r8,%r11,4)
DB 196,129,121,214,36,152 ; vmovq %xmm4,(%r8,%r11,4)
- DB 235,192 ; jmp 2386f <_sk_store_bgra_hsw_8bit+0x3b>
+ DB 235,192 ; jmp 2385b <_sk_store_bgra_hsw_8bit+0x3b>
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,131,121,22,108,152,24,2 ; vpextrd $0x2,%xmm5,0x18(%r8,%r11,4)
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
@@ -33875,12 +33869,12 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,129,121,126,108,152,16 ; vmovd %xmm5,0x10(%r8,%r11,4)
DB 196,129,122,127,36,152 ; vmovdqu %xmm4,(%r8,%r11,4)
- DB 235,143 ; jmp 2386f <_sk_store_bgra_hsw_8bit+0x3b>
+ DB 235,143 ; jmp 2385b <_sk_store_bgra_hsw_8bit+0x3b>
DB 196,131,121,22,108,152,40,2 ; vpextrd $0x2,%xmm5,0x28(%r8,%r11,4)
DB 196,131,121,22,108,152,36,1 ; vpextrd $0x1,%xmm5,0x24(%r8,%r11,4)
DB 196,129,121,126,108,152,32 ; vmovd %xmm5,0x20(%r8,%r11,4)
DB 196,129,126,127,36,152 ; vmovdqu %ymm4,(%r8,%r11,4)
- DB 233,109,255,255,255 ; jmpq 2386f <_sk_store_bgra_hsw_8bit+0x3b>
+ DB 233,109,255,255,255 ; jmpq 2385b <_sk_store_bgra_hsw_8bit+0x3b>
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
DB 196,131,121,22,116,152,56,2 ; vpextrd $0x2,%xmm6,0x38(%r8,%r11,4)
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
@@ -33889,7 +33883,7 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 196,129,121,126,116,152,48 ; vmovd %xmm6,0x30(%r8,%r11,4)
DB 196,129,126,127,36,152 ; vmovdqu %ymm4,(%r8,%r11,4)
DB 196,129,122,127,108,152,32 ; vmovdqu %xmm5,0x20(%r8,%r11,4)
- DB 233,50,255,255,255 ; jmpq 2386f <_sk_store_bgra_hsw_8bit+0x3b>
+ DB 233,50,255,255,255 ; jmpq 2385b <_sk_store_bgra_hsw_8bit+0x3b>
DB 15,31,0 ; nopl (%rax)
DB 87 ; push %rdi
DB 255 ; (bad)
@@ -33902,7 +33896,7 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 125,255 ; jge 23955 <_sk_store_bgra_hsw_8bit+0x121>
+ DB 125,255 ; jge 23941 <_sk_store_bgra_hsw_8bit+0x121>
DB 255 ; (bad)
DB 255,111,255 ; ljmp *-0x1(%rdi)
DB 255 ; (bad)
@@ -33913,7 +33907,7 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 235,255 ; jmp 2396d <_sk_store_bgra_hsw_8bit+0x139>
+ DB 235,255 ; jmp 23959 <_sk_store_bgra_hsw_8bit+0x139>
DB 255 ; (bad)
DB 255 ; (bad)
DB 222,255 ; fdivrp %st,%st(7)
@@ -33935,17 +33929,17 @@ _sk_store_565_hsw_8bit LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 197,253,111,37,38,151,0,0 ; vmovdqa 0x9726(%rip),%ymm4 # 2d0c0 <_sk_overlay_sse2_8bit+0xb54>
+ DB 197,253,111,37,154,149,0,0 ; vmovdqa 0x959a(%rip),%ymm4 # 2cf20 <_sk_overlay_sse2_8bit+0x9c8>
DB 197,253,219,236 ; vpand %ymm4,%ymm0,%ymm5
DB 197,245,219,228 ; vpand %ymm4,%ymm1,%ymm4
DB 197,221,114,244,8 ; vpslld $0x8,%ymm4,%ymm4
DB 197,213,114,245,8 ; vpslld $0x8,%ymm5,%ymm5
- DB 197,253,111,53,44,151,0,0 ; vmovdqa 0x972c(%rip),%ymm6 # 2d0e0 <_sk_overlay_sse2_8bit+0xb74>
+ DB 197,253,111,53,160,149,0,0 ; vmovdqa 0x95a0(%rip),%ymm6 # 2cf40 <_sk_overlay_sse2_8bit+0x9e8>
DB 197,253,219,254 ; vpand %ymm6,%ymm0,%ymm7
DB 197,245,219,246 ; vpand %ymm6,%ymm1,%ymm6
DB 197,205,114,214,5 ; vpsrld $0x5,%ymm6,%ymm6
DB 197,197,114,215,5 ; vpsrld $0x5,%ymm7,%ymm7
- DB 197,125,111,5,50,151,0,0 ; vmovdqa 0x9732(%rip),%ymm8 # 2d100 <_sk_overlay_sse2_8bit+0xb94>
+ DB 197,125,111,5,166,149,0,0 ; vmovdqa 0x95a6(%rip),%ymm8 # 2cf60 <_sk_overlay_sse2_8bit+0xa08>
DB 196,65,117,219,200 ; vpand %ymm8,%ymm1,%ymm9
DB 196,65,125,219,192 ; vpand %ymm8,%ymm0,%ymm8
DB 196,193,61,114,208,19 ; vpsrld $0x13,%ymm8,%ymm8
@@ -33954,14 +33948,14 @@ _sk_store_565_hsw_8bit LABEL PROC
DB 197,221,235,230 ; vpor %ymm6,%ymm4,%ymm4
DB 196,193,93,235,225 ; vpor %ymm9,%ymm4,%ymm4
DB 196,193,85,235,232 ; vpor %ymm8,%ymm5,%ymm5
- DB 197,253,111,53,34,151,0,0 ; vmovdqa 0x9722(%rip),%ymm6 # 2d120 <_sk_overlay_sse2_8bit+0xbb4>
+ DB 197,253,111,53,150,149,0,0 ; vmovdqa 0x9596(%rip),%ymm6 # 2cf80 <_sk_overlay_sse2_8bit+0xa28>
DB 196,226,85,0,238 ; vpshufb %ymm6,%ymm5,%ymm5
DB 196,227,253,0,237,232 ; vpermq $0xe8,%ymm5,%ymm5
DB 196,226,93,0,230 ; vpshufb %ymm6,%ymm4,%ymm4
DB 196,227,253,0,228,232 ; vpermq $0xe8,%ymm4,%ymm4
DB 196,227,85,56,228,1 ; vinserti128 $0x1,%xmm4,%ymm5,%ymm4
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 23a29 <_sk_store_565_hsw_8bit+0xad>
+ DB 117,10 ; jne 23a15 <_sk_store_565_hsw_8bit+0xad>
DB 196,129,126,127,36,88 ; vmovdqu %ymm4,(%r8,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -33969,29 +33963,29 @@ _sk_store_565_hsw_8bit LABEL PROC
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,236 ; ja 23a25 <_sk_store_565_hsw_8bit+0xa9>
+ DB 119,236 ; ja 23a11 <_sk_store_565_hsw_8bit+0xa9>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,176,0,0,0 ; lea 0xb0(%rip),%r10 # 23af4 <_sk_store_565_hsw_8bit+0x178>
+ DB 76,141,21,176,0,0,0 ; lea 0xb0(%rip),%r10 # 23ae0 <_sk_store_565_hsw_8bit+0x178>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,131,121,21,36,88,0 ; vpextrw $0x0,%xmm4,(%r8,%r11,2)
- DB 235,207 ; jmp 23a25 <_sk_store_565_hsw_8bit+0xa9>
+ DB 235,207 ; jmp 23a11 <_sk_store_565_hsw_8bit+0xa9>
DB 196,131,121,21,100,88,4,2 ; vpextrw $0x2,%xmm4,0x4(%r8,%r11,2)
DB 196,129,121,126,36,88 ; vmovd %xmm4,(%r8,%r11,2)
- DB 235,191 ; jmp 23a25 <_sk_store_565_hsw_8bit+0xa9>
+ DB 235,191 ; jmp 23a11 <_sk_store_565_hsw_8bit+0xa9>
DB 196,131,121,21,100,88,12,6 ; vpextrw $0x6,%xmm4,0xc(%r8,%r11,2)
DB 196,131,121,21,100,88,10,5 ; vpextrw $0x5,%xmm4,0xa(%r8,%r11,2)
DB 196,131,121,21,100,88,8,4 ; vpextrw $0x4,%xmm4,0x8(%r8,%r11,2)
DB 196,129,121,214,36,88 ; vmovq %xmm4,(%r8,%r11,2)
- DB 235,159 ; jmp 23a25 <_sk_store_565_hsw_8bit+0xa9>
+ DB 235,159 ; jmp 23a11 <_sk_store_565_hsw_8bit+0xa9>
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,131,121,21,108,88,20,2 ; vpextrw $0x2,%xmm5,0x14(%r8,%r11,2)
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,131,121,21,108,88,18,1 ; vpextrw $0x1,%xmm5,0x12(%r8,%r11,2)
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,131,121,21,108,88,16,0 ; vpextrw $0x0,%xmm5,0x10(%r8,%r11,2)
- DB 235,55 ; jmp 23ae9 <_sk_store_565_hsw_8bit+0x16d>
+ DB 235,55 ; jmp 23ad5 <_sk_store_565_hsw_8bit+0x16d>
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,131,121,21,108,88,28,6 ; vpextrw $0x6,%xmm5,0x1c(%r8,%r11,2)
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
@@ -34001,7 +33995,7 @@ _sk_store_565_hsw_8bit LABEL PROC
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,129,121,214,108,88,16 ; vmovq %xmm5,0x10(%r8,%r11,2)
DB 196,129,122,127,36,88 ; vmovdqu %xmm4,(%r8,%r11,2)
- DB 233,49,255,255,255 ; jmpq 23a25 <_sk_store_565_hsw_8bit+0xa9>
+ DB 233,49,255,255,255 ; jmpq 23a11 <_sk_store_565_hsw_8bit+0xa9>
DB 89 ; pop %rcx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -34013,7 +34007,7 @@ _sk_store_565_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 122,255 ; jp 23b09 <_sk_store_565_hsw_8bit+0x18d>
+ DB 122,255 ; jp 23af5 <_sk_store_565_hsw_8bit+0x18d>
DB 255 ; (bad)
DB 255,114,255 ; pushq -0x1(%rdx)
DB 255 ; (bad)
@@ -34048,17 +34042,17 @@ _sk_load_565_dst_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,222,0,0,0 ; jne 23c2d <_sk_load_565_dst_hsw_8bit+0xfd>
+ DB 15,133,222,0,0,0 ; jne 23c19 <_sk_load_565_dst_hsw_8bit+0xfd>
DB 196,129,126,111,20,88 ; vmovdqu (%r8,%r11,2),%ymm2
DB 196,227,125,57,211,1 ; vextracti128 $0x1,%ymm2,%xmm3
DB 196,226,125,51,219 ; vpmovzxwd %xmm3,%ymm3
DB 196,226,125,51,210 ; vpmovzxwd %xmm2,%ymm2
- DB 196,226,125,88,37,230,142,0,0 ; vpbroadcastd 0x8ee6(%rip),%ymm4 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,226,125,88,37,202,151,0,0 ; vpbroadcastd 0x97ca(%rip),%ymm4 # 2d324 <_sk_overlay_sse2_8bit+0xdcc>
DB 197,237,219,236 ; vpand %ymm4,%ymm2,%ymm5
DB 197,229,219,228 ; vpand %ymm4,%ymm3,%ymm4
DB 197,221,114,212,8 ; vpsrld $0x8,%ymm4,%ymm4
DB 197,213,114,213,8 ; vpsrld $0x8,%ymm5,%ymm5
- DB 196,226,125,88,53,219,142,0,0 ; vpbroadcastd 0x8edb(%rip),%ymm6 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,226,125,88,53,191,151,0,0 ; vpbroadcastd 0x97bf(%rip),%ymm6 # 2d334 <_sk_overlay_sse2_8bit+0xddc>
DB 197,237,219,254 ; vpand %ymm6,%ymm2,%ymm7
DB 197,229,219,246 ; vpand %ymm6,%ymm3,%ymm6
DB 197,205,114,246,19 ; vpslld $0x13,%ymm6,%ymm6
@@ -34067,22 +34061,22 @@ _sk_load_565_dst_hsw_8bit LABEL PROC
DB 197,221,235,230 ; vpor %ymm6,%ymm4,%ymm4
DB 197,205,114,212,5 ; vpsrld $0x5,%ymm4,%ymm6
DB 197,197,114,213,5 ; vpsrld $0x5,%ymm5,%ymm7
- DB 196,98,125,88,5,182,143,0,0 ; vpbroadcastd 0x8fb6(%rip),%ymm8 # 2cb6c <_sk_overlay_sse2_8bit+0x600>
+ DB 196,98,125,88,5,154,152,0,0 ; vpbroadcastd 0x989a(%rip),%ymm8 # 2d43c <_sk_overlay_sse2_8bit+0xee4>
DB 196,193,69,219,248 ; vpand %ymm8,%ymm7,%ymm7
DB 196,193,77,219,240 ; vpand %ymm8,%ymm6,%ymm6
- DB 196,98,125,88,5,147,142,0,0 ; vpbroadcastd 0x8e93(%rip),%ymm8 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,98,125,88,5,119,151,0,0 ; vpbroadcastd 0x9777(%rip),%ymm8 # 2d32c <_sk_overlay_sse2_8bit+0xdd4>
DB 196,65,101,219,200 ; vpand %ymm8,%ymm3,%ymm9
DB 196,65,109,219,192 ; vpand %ymm8,%ymm2,%ymm8
DB 196,193,61,114,240,5 ; vpslld $0x5,%ymm8,%ymm8
DB 196,193,53,114,241,5 ; vpslld $0x5,%ymm9,%ymm9
- DB 196,98,125,88,21,136,143,0,0 ; vpbroadcastd 0x8f88(%rip),%ymm10 # 2cb70 <_sk_overlay_sse2_8bit+0x604>
+ DB 196,98,125,88,21,108,152,0,0 ; vpbroadcastd 0x986c(%rip),%ymm10 # 2d440 <_sk_overlay_sse2_8bit+0xee8>
DB 196,193,101,219,218 ; vpand %ymm10,%ymm3,%ymm3
DB 196,193,109,219,210 ; vpand %ymm10,%ymm2,%ymm2
DB 197,237,114,210,1 ; vpsrld $0x1,%ymm2,%ymm2
DB 197,229,114,211,1 ; vpsrld $0x1,%ymm3,%ymm3
DB 196,193,101,235,217 ; vpor %ymm9,%ymm3,%ymm3
DB 196,193,109,235,208 ; vpor %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,101,143,0,0 ; vpbroadcastd 0x8f65(%rip),%ymm8 # 2cb74 <_sk_overlay_sse2_8bit+0x608>
+ DB 196,98,125,88,5,73,152,0,0 ; vpbroadcastd 0x9849(%rip),%ymm8 # 2d444 <_sk_overlay_sse2_8bit+0xeec>
DB 197,237,235,213 ; vpor %ymm5,%ymm2,%ymm2
DB 197,229,235,220 ; vpor %ymm4,%ymm3,%ymm3
DB 196,193,109,235,208 ; vpor %ymm8,%ymm2,%ymm2
@@ -34096,21 +34090,21 @@ _sk_load_565_dst_hsw_8bit LABEL PROC
DB 197,237,239,210 ; vpxor %ymm2,%ymm2,%ymm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 15,135,16,255,255,255 ; ja 23b55 <_sk_load_565_dst_hsw_8bit+0x25>
+ DB 15,135,16,255,255,255 ; ja 23b41 <_sk_load_565_dst_hsw_8bit+0x25>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,28,1,0,0 ; lea 0x11c(%rip),%r10 # 23d6c <_sk_load_565_dst_hsw_8bit+0x23c>
+ DB 76,141,21,28,1,0,0 ; lea 0x11c(%rip),%r10 # 23d58 <_sk_load_565_dst_hsw_8bit+0x23c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
- DB 233,238,254,255,255 ; jmpq 23b55 <_sk_load_565_dst_hsw_8bit+0x25>
+ DB 233,238,254,255,255 ; jmpq 23b41 <_sk_load_565_dst_hsw_8bit+0x25>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,129,105,196,92,88,4,2 ; vpinsrw $0x2,0x4(%r8,%r11,2),%xmm2,%xmm3
DB 196,227,101,56,210,1 ; vinserti128 $0x1,%xmm2,%ymm3,%ymm2
DB 196,129,121,110,28,88 ; vmovd (%r8,%r11,2),%xmm3
DB 196,227,109,2,211,1 ; vpblendd $0x1,%ymm3,%ymm2,%ymm2
- DB 233,203,254,255,255 ; jmpq 23b55 <_sk_load_565_dst_hsw_8bit+0x25>
+ DB 233,203,254,255,255 ; jmpq 23b41 <_sk_load_565_dst_hsw_8bit+0x25>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,129,105,196,92,88,12,6 ; vpinsrw $0x6,0xc(%r8,%r11,2),%xmm2,%xmm3
DB 196,227,101,56,210,1 ; vinserti128 $0x1,%xmm2,%ymm3,%ymm2
@@ -34120,7 +34114,7 @@ _sk_load_565_dst_hsw_8bit LABEL PROC
DB 196,227,109,2,211,15 ; vpblendd $0xf,%ymm3,%ymm2,%ymm2
DB 196,129,122,126,28,88 ; vmovq (%r8,%r11,2),%xmm3
DB 196,227,109,2,211,3 ; vpblendd $0x3,%ymm3,%ymm2,%ymm2
- DB 233,140,254,255,255 ; jmpq 23b55 <_sk_load_565_dst_hsw_8bit+0x25>
+ DB 233,140,254,255,255 ; jmpq 23b41 <_sk_load_565_dst_hsw_8bit+0x25>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,129,105,196,92,88,20,2 ; vpinsrw $0x2,0x14(%r8,%r11,2),%xmm2,%xmm3
DB 196,227,109,56,211,1 ; vinserti128 $0x1,%xmm3,%ymm2,%ymm2
@@ -34132,7 +34126,7 @@ _sk_load_565_dst_hsw_8bit LABEL PROC
DB 196,227,109,56,211,1 ; vinserti128 $0x1,%xmm3,%ymm2,%ymm2
DB 196,129,122,111,28,88 ; vmovdqu (%r8,%r11,2),%xmm3
DB 196,227,101,2,210,240 ; vpblendd $0xf0,%ymm2,%ymm3,%ymm2
- DB 233,65,254,255,255 ; jmpq 23b55 <_sk_load_565_dst_hsw_8bit+0x25>
+ DB 233,65,254,255,255 ; jmpq 23b41 <_sk_load_565_dst_hsw_8bit+0x25>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,129,105,196,92,88,28,6 ; vpinsrw $0x6,0x1c(%r8,%r11,2),%xmm2,%xmm3
DB 196,227,109,56,211,1 ; vinserti128 $0x1,%xmm3,%ymm2,%ymm2
@@ -34146,11 +34140,11 @@ _sk_load_565_dst_hsw_8bit LABEL PROC
DB 196,129,122,111,36,88 ; vmovdqu (%r8,%r11,2),%xmm4
DB 196,227,93,56,219,1 ; vinserti128 $0x1,%xmm3,%ymm4,%ymm3
DB 196,227,101,2,210,192 ; vpblendd $0xc0,%ymm2,%ymm3,%ymm2
- DB 233,233,253,255,255 ; jmpq 23b55 <_sk_load_565_dst_hsw_8bit+0x25>
+ DB 233,233,253,255,255 ; jmpq 23b41 <_sk_load_565_dst_hsw_8bit+0x25>
DB 237 ; in (%dx),%eax
DB 254 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,251 ; decl -0x4000001(%rip) # fffffffffc023d74 <_sk_overlay_sse2_8bit+0xfffffffffbff7808>
+ DB 255,13,255,255,255,251 ; decl -0x4000001(%rip) # fffffffffc023d60 <_sk_overlay_sse2_8bit+0xfffffffffbff7808>
DB 254 ; (bad)
DB 255 ; (bad)
DB 255,76,255,255 ; decl -0x1(%rdi,%rdi,8)
@@ -34191,7 +34185,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,35 ; jne 23de3 <_sk_load_a8_hsw_8bit+0x3b>
+ DB 117,35 ; jne 23dcf <_sk_load_a8_hsw_8bit+0x3b>
DB 196,129,122,111,4,24 ; vmovdqu (%r8,%r11,1),%xmm0
DB 197,249,112,200,78 ; vpshufd $0x4e,%xmm0,%xmm1
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
@@ -34205,35 +34199,35 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,207 ; ja 23dc6 <_sk_load_a8_hsw_8bit+0x1e>
+ DB 119,207 ; ja 23db2 <_sk_load_a8_hsw_8bit+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,194,0,0,0 ; lea 0xc2(%rip),%r10 # 23ec4 <_sk_load_a8_hsw_8bit+0x11c>
+ DB 76,141,21,194,0,0,0 ; lea 0xc2(%rip),%r10 # 23eb0 <_sk_load_a8_hsw_8bit+0x11c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,176 ; jmp 23dc6 <_sk_load_a8_hsw_8bit+0x1e>
+ DB 235,176 ; jmp 23db2 <_sk_load_a8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,2,2 ; vpinsrb $0x2,0x2(%r8,%r11,1),%xmm0,%xmm0
DB 67,15,183,4,24 ; movzwl (%r8,%r11,1),%eax
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,227,121,14,193,1 ; vpblendw $0x1,%xmm1,%xmm0,%xmm0
- DB 235,147 ; jmp 23dc6 <_sk_load_a8_hsw_8bit+0x1e>
+ DB 235,147 ; jmp 23db2 <_sk_load_a8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,6,6 ; vpinsrb $0x6,0x6(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,5,5 ; vpinsrb $0x5,0x5(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,4,4 ; vpinsrb $0x4,0x4(%r8,%r11,1),%xmm0,%xmm0
DB 196,129,121,110,12,24 ; vmovd (%r8,%r11,1),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,102,255,255,255 ; jmpq 23dc6 <_sk_load_a8_hsw_8bit+0x1e>
+ DB 233,102,255,255,255 ; jmpq 23db2 <_sk_load_a8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,10,10 ; vpinsrb $0xa,0xa(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,9,9 ; vpinsrb $0x9,0x9(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,8,8 ; vpinsrb $0x8,0x8(%r8,%r11,1),%xmm0,%xmm0
DB 196,129,122,126,12,24 ; vmovq (%r8,%r11,1),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,57,255,255,255 ; jmpq 23dc6 <_sk_load_a8_hsw_8bit+0x1e>
+ DB 233,57,255,255,255 ; jmpq 23db2 <_sk_load_a8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,14,14 ; vpinsrb $0xe,0xe(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,13,13 ; vpinsrb $0xd,0xd(%r8,%r11,1),%xmm0,%xmm0
@@ -34241,7 +34235,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 196,129,122,126,12,24 ; vmovq (%r8,%r11,1),%xmm1
DB 196,131,113,34,76,24,8,2 ; vpinsrd $0x2,0x8(%r8,%r11,1),%xmm1,%xmm1
DB 196,227,113,2,192,8 ; vpblendd $0x8,%xmm0,%xmm1,%xmm0
- DB 233,4,255,255,255 ; jmpq 23dc6 <_sk_load_a8_hsw_8bit+0x1e>
+ DB 233,4,255,255,255 ; jmpq 23db2 <_sk_load_a8_hsw_8bit+0x1e>
DB 102,144 ; xchg %ax,%ax
DB 71,255 ; rex.RXB (bad)
DB 255 ; (bad)
@@ -34253,7 +34247,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 123,255 ; jnp 23ed9 <_sk_load_a8_hsw_8bit+0x131>
+ DB 123,255 ; jnp 23ec5 <_sk_load_a8_hsw_8bit+0x131>
DB 255 ; (bad)
DB 255,111,255 ; ljmp *-0x1(%rdi)
DB 255 ; (bad)
@@ -34287,7 +34281,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,35 ; jne 23f3b <_sk_load_a8_dst_hsw_8bit+0x3b>
+ DB 117,35 ; jne 23f27 <_sk_load_a8_dst_hsw_8bit+0x3b>
DB 196,129,122,111,20,24 ; vmovdqu (%r8,%r11,1),%xmm2
DB 197,249,112,218,78 ; vpshufd $0x4e,%xmm2,%xmm3
DB 196,226,125,49,219 ; vpmovzxbd %xmm3,%ymm3
@@ -34301,35 +34295,35 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,207 ; ja 23f1e <_sk_load_a8_dst_hsw_8bit+0x1e>
+ DB 119,207 ; ja 23f0a <_sk_load_a8_dst_hsw_8bit+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,194,0,0,0 ; lea 0xc2(%rip),%r10 # 2401c <_sk_load_a8_dst_hsw_8bit+0x11c>
+ DB 76,141,21,194,0,0,0 ; lea 0xc2(%rip),%r10 # 24008 <_sk_load_a8_dst_hsw_8bit+0x11c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
- DB 235,176 ; jmp 23f1e <_sk_load_a8_dst_hsw_8bit+0x1e>
+ DB 235,176 ; jmp 23f0a <_sk_load_a8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,2,2 ; vpinsrb $0x2,0x2(%r8,%r11,1),%xmm2,%xmm2
DB 67,15,183,4,24 ; movzwl (%r8,%r11,1),%eax
DB 197,249,110,216 ; vmovd %eax,%xmm3
DB 196,227,105,14,211,1 ; vpblendw $0x1,%xmm3,%xmm2,%xmm2
- DB 235,147 ; jmp 23f1e <_sk_load_a8_dst_hsw_8bit+0x1e>
+ DB 235,147 ; jmp 23f0a <_sk_load_a8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,6,6 ; vpinsrb $0x6,0x6(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,5,5 ; vpinsrb $0x5,0x5(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,4,4 ; vpinsrb $0x4,0x4(%r8,%r11,1),%xmm2,%xmm2
DB 196,129,121,110,28,24 ; vmovd (%r8,%r11,1),%xmm3
DB 196,227,105,2,211,1 ; vpblendd $0x1,%xmm3,%xmm2,%xmm2
- DB 233,102,255,255,255 ; jmpq 23f1e <_sk_load_a8_dst_hsw_8bit+0x1e>
+ DB 233,102,255,255,255 ; jmpq 23f0a <_sk_load_a8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,10,10 ; vpinsrb $0xa,0xa(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,9,9 ; vpinsrb $0x9,0x9(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,8,8 ; vpinsrb $0x8,0x8(%r8,%r11,1),%xmm2,%xmm2
DB 196,129,122,126,28,24 ; vmovq (%r8,%r11,1),%xmm3
DB 196,227,97,2,210,12 ; vpblendd $0xc,%xmm2,%xmm3,%xmm2
- DB 233,57,255,255,255 ; jmpq 23f1e <_sk_load_a8_dst_hsw_8bit+0x1e>
+ DB 233,57,255,255,255 ; jmpq 23f0a <_sk_load_a8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,14,14 ; vpinsrb $0xe,0xe(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,13,13 ; vpinsrb $0xd,0xd(%r8,%r11,1),%xmm2,%xmm2
@@ -34337,7 +34331,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 196,129,122,126,28,24 ; vmovq (%r8,%r11,1),%xmm3
DB 196,131,97,34,92,24,8,2 ; vpinsrd $0x2,0x8(%r8,%r11,1),%xmm3,%xmm3
DB 196,227,97,2,210,8 ; vpblendd $0x8,%xmm2,%xmm3,%xmm2
- DB 233,4,255,255,255 ; jmpq 23f1e <_sk_load_a8_dst_hsw_8bit+0x1e>
+ DB 233,4,255,255,255 ; jmpq 23f0a <_sk_load_a8_dst_hsw_8bit+0x1e>
DB 102,144 ; xchg %ax,%ax
DB 71,255 ; rex.RXB (bad)
DB 255 ; (bad)
@@ -34349,7 +34343,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 123,255 ; jnp 24031 <_sk_load_a8_dst_hsw_8bit+0x131>
+ DB 123,255 ; jnp 2401d <_sk_load_a8_dst_hsw_8bit+0x131>
DB 255 ; (bad)
DB 255,111,255 ; ljmp *-0x1(%rdi)
DB 255 ; (bad)
@@ -34382,17 +34376,17 @@ _sk_store_a8_hsw_8bit LABEL PROC
DB 77,15,175,193 ; imul %r9,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 197,253,111,37,205,144,0,0 ; vmovdqa 0x90cd(%rip),%ymm4 # 2d140 <_sk_overlay_sse2_8bit+0xbd4>
+ DB 197,253,111,37,65,143,0,0 ; vmovdqa 0x8f41(%rip),%ymm4 # 2cfa0 <_sk_overlay_sse2_8bit+0xa48>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,227,253,0,237,232 ; vpermq $0xe8,%ymm5,%ymm5
- DB 197,249,111,53,250,154,0,0 ; vmovdqa 0x9afa(%rip),%xmm6 # 2db80 <_sk_overlay_sse2_8bit+0x1614>
+ DB 197,249,111,53,14,155,0,0 ; vmovdqa 0x9b0e(%rip),%xmm6 # 2db80 <_sk_overlay_sse2_8bit+0x1628>
DB 196,226,81,0,238 ; vpshufb %xmm6,%xmm5,%xmm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 196,227,253,0,228,232 ; vpermq $0xe8,%ymm4,%ymm4
DB 196,226,89,0,230 ; vpshufb %xmm6,%xmm4,%xmm4
DB 197,217,108,229 ; vpunpcklqdq %xmm5,%xmm4,%xmm4
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 240ae <_sk_store_a8_hsw_8bit+0x56>
+ DB 117,10 ; jne 2409a <_sk_store_a8_hsw_8bit+0x56>
DB 196,129,122,127,36,24 ; vmovdqu %xmm4,(%r8,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -34400,34 +34394,34 @@ _sk_store_a8_hsw_8bit LABEL PROC
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,236 ; ja 240aa <_sk_store_a8_hsw_8bit+0x52>
+ DB 119,236 ; ja 24096 <_sk_store_a8_hsw_8bit+0x52>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,139,0,0,0 ; lea 0x8b(%rip),%r10 # 24154 <_sk_store_a8_hsw_8bit+0xfc>
+ DB 76,141,21,139,0,0,0 ; lea 0x8b(%rip),%r10 # 24140 <_sk_store_a8_hsw_8bit+0xfc>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,131,121,20,36,24,0 ; vpextrb $0x0,%xmm4,(%r8,%r11,1)
- DB 235,207 ; jmp 240aa <_sk_store_a8_hsw_8bit+0x52>
+ DB 235,207 ; jmp 24096 <_sk_store_a8_hsw_8bit+0x52>
DB 196,131,121,20,100,24,2,2 ; vpextrb $0x2,%xmm4,0x2(%r8,%r11,1)
DB 196,131,121,21,36,24,0 ; vpextrw $0x0,%xmm4,(%r8,%r11,1)
- DB 235,190 ; jmp 240aa <_sk_store_a8_hsw_8bit+0x52>
+ DB 235,190 ; jmp 24096 <_sk_store_a8_hsw_8bit+0x52>
DB 196,131,121,20,100,24,6,6 ; vpextrb $0x6,%xmm4,0x6(%r8,%r11,1)
DB 196,131,121,20,100,24,5,5 ; vpextrb $0x5,%xmm4,0x5(%r8,%r11,1)
DB 196,131,121,20,100,24,4,4 ; vpextrb $0x4,%xmm4,0x4(%r8,%r11,1)
DB 196,129,121,126,36,24 ; vmovd %xmm4,(%r8,%r11,1)
- DB 235,158 ; jmp 240aa <_sk_store_a8_hsw_8bit+0x52>
+ DB 235,158 ; jmp 24096 <_sk_store_a8_hsw_8bit+0x52>
DB 196,131,121,20,100,24,10,10 ; vpextrb $0xa,%xmm4,0xa(%r8,%r11,1)
DB 196,131,121,20,100,24,9,9 ; vpextrb $0x9,%xmm4,0x9(%r8,%r11,1)
DB 196,131,121,20,100,24,8,8 ; vpextrb $0x8,%xmm4,0x8(%r8,%r11,1)
- DB 235,32 ; jmp 24146 <_sk_store_a8_hsw_8bit+0xee>
+ DB 235,32 ; jmp 24132 <_sk_store_a8_hsw_8bit+0xee>
DB 196,131,121,20,100,24,14,14 ; vpextrb $0xe,%xmm4,0xe(%r8,%r11,1)
DB 196,131,121,20,100,24,13,13 ; vpextrb $0xd,%xmm4,0xd(%r8,%r11,1)
DB 196,131,121,20,100,24,12,12 ; vpextrb $0xc,%xmm4,0xc(%r8,%r11,1)
DB 196,131,121,22,100,24,8,2 ; vpextrd $0x2,%xmm4,0x8(%r8,%r11,1)
DB 196,129,121,214,36,24 ; vmovq %xmm4,(%r8,%r11,1)
- DB 233,89,255,255,255 ; jmpq 240aa <_sk_store_a8_hsw_8bit+0x52>
+ DB 233,89,255,255,255 ; jmpq 24096 <_sk_store_a8_hsw_8bit+0x52>
DB 15,31,0 ; nopl (%rax)
- DB 126,255 ; jle 24155 <_sk_store_a8_hsw_8bit+0xfd>
+ DB 126,255 ; jle 24141 <_sk_store_a8_hsw_8bit+0xfd>
DB 255 ; (bad)
DB 255,143,255,255,255,135 ; decl -0x78000001(%rdi)
DB 255 ; (bad)
@@ -34471,15 +34465,15 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,61 ; jne 241e5 <_sk_load_g8_hsw_8bit+0x55>
+ DB 117,61 ; jne 241d1 <_sk_load_g8_hsw_8bit+0x55>
DB 196,129,122,111,4,24 ; vmovdqu (%r8,%r11,1),%xmm0
DB 196,226,125,49,200 ; vpmovzxbd %xmm0,%ymm1
DB 197,249,112,192,78 ; vpshufd $0x4e,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
- DB 196,226,125,88,37,178,137,0,0 ; vpbroadcastd 0x89b2(%rip),%ymm4 # 2cb78 <_sk_overlay_sse2_8bit+0x60c>
+ DB 196,226,125,88,37,150,146,0,0 ; vpbroadcastd 0x9296(%rip),%ymm4 # 2d448 <_sk_overlay_sse2_8bit+0xef0>
DB 196,226,125,64,236 ; vpmulld %ymm4,%ymm0,%ymm5
DB 196,226,117,64,196 ; vpmulld %ymm4,%ymm1,%ymm0
- DB 196,226,125,88,13,155,137,0,0 ; vpbroadcastd 0x899b(%rip),%ymm1 # 2cb74 <_sk_overlay_sse2_8bit+0x608>
+ DB 196,226,125,88,13,127,146,0,0 ; vpbroadcastd 0x927f(%rip),%ymm1 # 2d444 <_sk_overlay_sse2_8bit+0xeec>
DB 197,253,235,193 ; vpor %ymm1,%ymm0,%ymm0
DB 197,213,235,201 ; vpor %ymm1,%ymm5,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -34489,35 +34483,35 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,181 ; ja 241ae <_sk_load_g8_hsw_8bit+0x1e>
+ DB 119,181 ; ja 2419a <_sk_load_g8_hsw_8bit+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,196,0,0,0 ; lea 0xc4(%rip),%r10 # 242c8 <_sk_load_g8_hsw_8bit+0x138>
+ DB 76,141,21,196,0,0,0 ; lea 0xc4(%rip),%r10 # 242b4 <_sk_load_g8_hsw_8bit+0x138>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,150 ; jmp 241ae <_sk_load_g8_hsw_8bit+0x1e>
+ DB 235,150 ; jmp 2419a <_sk_load_g8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,2,2 ; vpinsrb $0x2,0x2(%r8,%r11,1),%xmm0,%xmm0
DB 67,15,183,4,24 ; movzwl (%r8,%r11,1),%eax
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,227,121,14,193,1 ; vpblendw $0x1,%xmm1,%xmm0,%xmm0
- DB 233,118,255,255,255 ; jmpq 241ae <_sk_load_g8_hsw_8bit+0x1e>
+ DB 233,118,255,255,255 ; jmpq 2419a <_sk_load_g8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,6,6 ; vpinsrb $0x6,0x6(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,5,5 ; vpinsrb $0x5,0x5(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,4,4 ; vpinsrb $0x4,0x4(%r8,%r11,1),%xmm0,%xmm0
DB 196,129,121,110,12,24 ; vmovd (%r8,%r11,1),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,73,255,255,255 ; jmpq 241ae <_sk_load_g8_hsw_8bit+0x1e>
+ DB 233,73,255,255,255 ; jmpq 2419a <_sk_load_g8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,10,10 ; vpinsrb $0xa,0xa(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,9,9 ; vpinsrb $0x9,0x9(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,8,8 ; vpinsrb $0x8,0x8(%r8,%r11,1),%xmm0,%xmm0
DB 196,129,122,126,12,24 ; vmovq (%r8,%r11,1),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,28,255,255,255 ; jmpq 241ae <_sk_load_g8_hsw_8bit+0x1e>
+ DB 233,28,255,255,255 ; jmpq 2419a <_sk_load_g8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,14,14 ; vpinsrb $0xe,0xe(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,13,13 ; vpinsrb $0xd,0xd(%r8,%r11,1),%xmm0,%xmm0
@@ -34525,7 +34519,7 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 196,129,122,126,12,24 ; vmovq (%r8,%r11,1),%xmm1
DB 196,131,113,34,76,24,8,2 ; vpinsrd $0x2,0x8(%r8,%r11,1),%xmm1,%xmm1
DB 196,227,113,2,192,8 ; vpblendd $0x8,%xmm0,%xmm1,%xmm0
- DB 233,231,254,255,255 ; jmpq 241ae <_sk_load_g8_hsw_8bit+0x1e>
+ DB 233,231,254,255,255 ; jmpq 2419a <_sk_load_g8_hsw_8bit+0x1e>
DB 144 ; nop
DB 69,255 ; rex.RB (bad)
DB 255 ; (bad)
@@ -34535,7 +34529,7 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 255,140,255,255,255,132,255 ; decl -0x7b0001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 124,255 ; jl 242dd <_sk_load_g8_hsw_8bit+0x14d>
+ DB 124,255 ; jl 242c9 <_sk_load_g8_hsw_8bit+0x14d>
DB 255 ; (bad)
DB 255,112,255 ; pushq -0x1(%rax)
DB 255 ; (bad)
@@ -34569,15 +34563,15 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,61 ; jne 24359 <_sk_load_g8_dst_hsw_8bit+0x55>
+ DB 117,61 ; jne 24345 <_sk_load_g8_dst_hsw_8bit+0x55>
DB 196,129,122,111,20,24 ; vmovdqu (%r8,%r11,1),%xmm2
DB 196,226,125,49,218 ; vpmovzxbd %xmm2,%ymm3
DB 197,249,112,210,78 ; vpshufd $0x4e,%xmm2,%xmm2
DB 196,226,125,49,210 ; vpmovzxbd %xmm2,%ymm2
- DB 196,226,125,88,37,62,136,0,0 ; vpbroadcastd 0x883e(%rip),%ymm4 # 2cb78 <_sk_overlay_sse2_8bit+0x60c>
+ DB 196,226,125,88,37,34,145,0,0 ; vpbroadcastd 0x9122(%rip),%ymm4 # 2d448 <_sk_overlay_sse2_8bit+0xef0>
DB 196,226,109,64,236 ; vpmulld %ymm4,%ymm2,%ymm5
DB 196,226,101,64,212 ; vpmulld %ymm4,%ymm3,%ymm2
- DB 196,226,125,88,29,39,136,0,0 ; vpbroadcastd 0x8827(%rip),%ymm3 # 2cb74 <_sk_overlay_sse2_8bit+0x608>
+ DB 196,226,125,88,29,11,145,0,0 ; vpbroadcastd 0x910b(%rip),%ymm3 # 2d444 <_sk_overlay_sse2_8bit+0xeec>
DB 197,237,235,211 ; vpor %ymm3,%ymm2,%ymm2
DB 197,213,235,219 ; vpor %ymm3,%ymm5,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -34587,35 +34581,35 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,181 ; ja 24322 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ DB 119,181 ; ja 2430e <_sk_load_g8_dst_hsw_8bit+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,196,0,0,0 ; lea 0xc4(%rip),%r10 # 2443c <_sk_load_g8_dst_hsw_8bit+0x138>
+ DB 76,141,21,196,0,0,0 ; lea 0xc4(%rip),%r10 # 24428 <_sk_load_g8_dst_hsw_8bit+0x138>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
- DB 235,150 ; jmp 24322 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ DB 235,150 ; jmp 2430e <_sk_load_g8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,2,2 ; vpinsrb $0x2,0x2(%r8,%r11,1),%xmm2,%xmm2
DB 67,15,183,4,24 ; movzwl (%r8,%r11,1),%eax
DB 197,249,110,216 ; vmovd %eax,%xmm3
DB 196,227,105,14,211,1 ; vpblendw $0x1,%xmm3,%xmm2,%xmm2
- DB 233,118,255,255,255 ; jmpq 24322 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ DB 233,118,255,255,255 ; jmpq 2430e <_sk_load_g8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,6,6 ; vpinsrb $0x6,0x6(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,5,5 ; vpinsrb $0x5,0x5(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,4,4 ; vpinsrb $0x4,0x4(%r8,%r11,1),%xmm2,%xmm2
DB 196,129,121,110,28,24 ; vmovd (%r8,%r11,1),%xmm3
DB 196,227,105,2,211,1 ; vpblendd $0x1,%xmm3,%xmm2,%xmm2
- DB 233,73,255,255,255 ; jmpq 24322 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ DB 233,73,255,255,255 ; jmpq 2430e <_sk_load_g8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,10,10 ; vpinsrb $0xa,0xa(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,9,9 ; vpinsrb $0x9,0x9(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,8,8 ; vpinsrb $0x8,0x8(%r8,%r11,1),%xmm2,%xmm2
DB 196,129,122,126,28,24 ; vmovq (%r8,%r11,1),%xmm3
DB 196,227,97,2,210,12 ; vpblendd $0xc,%xmm2,%xmm3,%xmm2
- DB 233,28,255,255,255 ; jmpq 24322 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ DB 233,28,255,255,255 ; jmpq 2430e <_sk_load_g8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,14,14 ; vpinsrb $0xe,0xe(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,13,13 ; vpinsrb $0xd,0xd(%r8,%r11,1),%xmm2,%xmm2
@@ -34623,7 +34617,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 196,129,122,126,28,24 ; vmovq (%r8,%r11,1),%xmm3
DB 196,131,97,34,92,24,8,2 ; vpinsrd $0x2,0x8(%r8,%r11,1),%xmm3,%xmm3
DB 196,227,97,2,210,8 ; vpblendd $0x8,%xmm2,%xmm3,%xmm2
- DB 233,231,254,255,255 ; jmpq 24322 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ DB 233,231,254,255,255 ; jmpq 2430e <_sk_load_g8_dst_hsw_8bit+0x1e>
DB 144 ; nop
DB 69,255 ; rex.RB (bad)
DB 255 ; (bad)
@@ -34633,7 +34627,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 255,140,255,255,255,132,255 ; decl -0x7b0001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 124,255 ; jl 24451 <_sk_load_g8_dst_hsw_8bit+0x14d>
+ DB 124,255 ; jl 2443d <_sk_load_g8_dst_hsw_8bit+0x14d>
DB 255 ; (bad)
DB 255,112,255 ; pushq -0x1(%rax)
DB 255 ; (bad)
@@ -34668,10 +34662,10 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,222,0,0,0 ; jne 24576 <_sk_srcover_rgba_8888_hsw_8bit+0xfe>
+ DB 15,133,222,0,0,0 ; jne 24562 <_sk_srcover_rgba_8888_hsw_8bit+0xfe>
DB 196,1,126,111,76,152,32 ; vmovdqu 0x20(%r8,%r11,4),%ymm9
DB 196,1,126,111,28,152 ; vmovdqu (%r8,%r11,4),%ymm11
- DB 197,253,111,53,179,140,0,0 ; vmovdqa 0x8cb3(%rip),%ymm6 # 2d160 <_sk_overlay_sse2_8bit+0xbf4>
+ DB 197,253,111,53,39,139,0,0 ; vmovdqa 0x8b27(%rip),%ymm6 # 2cfc0 <_sk_overlay_sse2_8bit+0xa68>
DB 196,226,117,0,254 ; vpshufb %ymm6,%ymm1,%ymm7
DB 196,226,125,0,246 ; vpshufb %ymm6,%ymm0,%ymm6
DB 196,66,125,48,195 ; vpmovzxbw %xmm11,%ymm8
@@ -34709,7 +34703,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 197,221,252,224 ; vpaddb %ymm0,%ymm4,%ymm4
DB 197,213,252,233 ; vpaddb %ymm1,%ymm5,%ymm5
DB 72,133,255 ; test %rdi,%rdi
- DB 117,78 ; jne 245b3 <_sk_srcover_rgba_8888_hsw_8bit+0x13b>
+ DB 117,78 ; jne 2459f <_sk_srcover_rgba_8888_hsw_8bit+0x13b>
DB 196,129,126,127,36,152 ; vmovdqu %ymm4,(%r8,%r11,4)
DB 196,129,126,127,108,152,32 ; vmovdqu %ymm5,0x20(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -34720,26 +34714,26 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,65,37,239,219 ; vpxor %ymm11,%ymm11,%ymm11
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 15,135,17,255,255,255 ; ja 244a5 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ DB 15,135,17,255,255,255 ; ja 24491 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,237,1,0,0 ; lea 0x1ed(%rip),%r10 # 2478c <_sk_srcover_rgba_8888_hsw_8bit+0x314>
+ DB 76,141,21,237,1,0,0 ; lea 0x1ed(%rip),%r10 # 24778 <_sk_srcover_rgba_8888_hsw_8bit+0x314>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,1,121,110,28,152 ; vmovd (%r8,%r11,4),%xmm11
- DB 233,242,254,255,255 ; jmpq 244a5 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ DB 233,242,254,255,255 ; jmpq 24491 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,175 ; ja 24572 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ DB 119,175 ; ja 2455e <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 76,141,13,250,1,0,0 ; lea 0x1fa(%rip),%r9 # 247c8 <_sk_srcover_rgba_8888_hsw_8bit+0x350>
+ DB 76,141,13,250,1,0,0 ; lea 0x1fa(%rip),%r9 # 247b4 <_sk_srcover_rgba_8888_hsw_8bit+0x350>
DB 73,99,4,129 ; movslq (%r9,%rax,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
DB 196,129,121,126,36,152 ; vmovd %xmm4,(%r8,%r11,4)
- DB 235,147 ; jmp 24572 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ DB 235,147 ; jmp 2455e <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
DB 196,129,121,110,100,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm4
DB 196,226,121,89,236 ; vpbroadcastq %xmm4,%xmm5
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
@@ -34747,7 +34741,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,130,121,53,52,152 ; vpmovzxdq (%r8,%r11,4),%xmm6
DB 197,249,112,246,232 ; vpshufd $0xe8,%xmm6,%xmm6
DB 196,99,37,2,222,3 ; vpblendd $0x3,%ymm6,%ymm11,%ymm11
- DB 233,153,254,255,255 ; jmpq 244a5 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ DB 233,153,254,255,255 ; jmpq 24491 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
DB 196,129,121,110,100,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm4
DB 196,226,125,89,236 ; vpbroadcastq %xmm4,%ymm5
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
@@ -34760,7 +34754,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,99,37,56,222,1 ; vinserti128 $0x1,%xmm6,%ymm11,%ymm11
DB 196,129,122,111,52,152 ; vmovdqu (%r8,%r11,4),%xmm6
DB 196,67,77,2,219,240 ; vpblendd $0xf0,%ymm11,%ymm6,%ymm11
- DB 233,73,254,255,255 ; jmpq 244a5 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ DB 233,73,254,255,255 ; jmpq 24491 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
DB 196,129,121,110,100,152,40 ; vmovd 0x28(%r8,%r11,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -34769,7 +34763,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,99,53,2,205,15 ; vpblendd $0xf,%ymm5,%ymm9,%ymm9
DB 196,129,121,110,108,152,32 ; vmovd 0x20(%r8,%r11,4),%xmm5
DB 196,99,53,2,205,1 ; vpblendd $0x1,%ymm5,%ymm9,%ymm9
- DB 233,13,254,255,255 ; jmpq 2449f <_sk_srcover_rgba_8888_hsw_8bit+0x27>
+ DB 233,13,254,255,255 ; jmpq 2448b <_sk_srcover_rgba_8888_hsw_8bit+0x27>
DB 196,129,121,110,100,152,56 ; vmovd 0x38(%r8,%r11,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -34783,10 +34777,10 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,1,126,111,28,152 ; vmovdqu (%r8,%r11,4),%ymm11
DB 196,129,122,111,116,152,32 ; vmovdqu 0x20(%r8,%r11,4),%xmm6
DB 196,67,77,2,201,240 ; vpblendd $0xf0,%ymm9,%ymm6,%ymm9
- DB 233,189,253,255,255 ; jmpq 244a5 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ DB 233,189,253,255,255 ; jmpq 24491 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
DB 196,131,121,22,100,152,8,2 ; vpextrd $0x2,%xmm4,0x8(%r8,%r11,4)
DB 196,129,121,214,36,152 ; vmovq %xmm4,(%r8,%r11,4)
- DB 233,119,254,255,255 ; jmpq 24572 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ DB 233,119,254,255,255 ; jmpq 2455e <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,131,121,22,108,152,24,2 ; vpextrd $0x2,%xmm5,0x18(%r8,%r11,4)
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
@@ -34794,12 +34788,12 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,129,121,126,108,152,16 ; vmovd %xmm5,0x10(%r8,%r11,4)
DB 196,129,122,127,36,152 ; vmovdqu %xmm4,(%r8,%r11,4)
- DB 233,67,254,255,255 ; jmpq 24572 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ DB 233,67,254,255,255 ; jmpq 2455e <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
DB 196,131,121,22,108,152,40,2 ; vpextrd $0x2,%xmm5,0x28(%r8,%r11,4)
DB 196,131,121,22,108,152,36,1 ; vpextrd $0x1,%xmm5,0x24(%r8,%r11,4)
DB 196,129,121,126,108,152,32 ; vmovd %xmm5,0x20(%r8,%r11,4)
DB 196,129,126,127,36,152 ; vmovdqu %ymm4,(%r8,%r11,4)
- DB 233,33,254,255,255 ; jmpq 24572 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ DB 233,33,254,255,255 ; jmpq 2455e <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
DB 196,131,121,22,116,152,56,2 ; vpextrd $0x2,%xmm6,0x38(%r8,%r11,4)
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
@@ -34808,7 +34802,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,129,121,126,116,152,48 ; vmovd %xmm6,0x30(%r8,%r11,4)
DB 196,129,126,127,36,152 ; vmovdqu %ymm4,(%r8,%r11,4)
DB 196,129,122,127,108,152,32 ; vmovdqu %xmm5,0x20(%r8,%r11,4)
- DB 233,230,253,255,255 ; jmpq 24572 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ DB 233,230,253,255,255 ; jmpq 2455e <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
DB 28,254 ; sbb $0xfe,%al
DB 255 ; (bad)
DB 255,106,254 ; ljmp *-0x2(%rdx)
@@ -34861,7 +34855,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 126,255 ; jle 247e5 <_sk_srcover_rgba_8888_hsw_8bit+0x36d>
+ DB 126,255 ; jle 247d1 <_sk_srcover_rgba_8888_hsw_8bit+0x36d>
DB 255 ; (bad)
DB 255,119,255 ; pushq -0x1(%rdi)
DB 255 ; (bad)
@@ -34881,7 +34875,7 @@ PUBLIC _sk_scale_1_float_hsw_8bit
_sk_scale_1_float_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,250,16,32 ; vmovss (%rax),%xmm4
- DB 197,218,89,37,246,129,0,0 ; vmulss 0x81f6(%rip),%xmm4,%xmm4 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 197,218,89,37,218,138,0,0 ; vmulss 0x8ada(%rip),%xmm4,%xmm4 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 197,250,44,196 ; vcvttss2si %xmm4,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,120,228 ; vpbroadcastb %xmm4,%ymm4
@@ -34891,7 +34885,7 @@ _sk_scale_1_float_hsw_8bit LABEL PROC
DB 196,226,125,48,241 ; vpmovzxbw %xmm1,%ymm6
DB 196,227,125,57,201,1 ; vextracti128 $0x1,%ymm1,%xmm1
DB 196,226,125,48,201 ; vpmovzxbw %xmm1,%ymm1
- DB 197,221,219,37,57,137,0,0 ; vpand 0x8939(%rip),%ymm4,%ymm4 # 2d180 <_sk_overlay_sse2_8bit+0xc14>
+ DB 197,221,219,37,173,135,0,0 ; vpand 0x87ad(%rip),%ymm4,%ymm4 # 2cfe0 <_sk_overlay_sse2_8bit+0xa88>
DB 197,221,213,249 ; vpmullw %ymm1,%ymm4,%ymm7
DB 197,93,213,198 ; vpmullw %ymm6,%ymm4,%ymm8
DB 197,93,213,200 ; vpmullw %ymm0,%ymm4,%ymm9
@@ -34922,12 +34916,12 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,191,0,0,0 ; jne 2497a <_sk_scale_u8_hsw_8bit+0xdb>
+ DB 15,133,191,0,0,0 ; jne 24966 <_sk_scale_u8_hsw_8bit+0xdb>
DB 196,129,122,111,36,24 ; vmovdqu (%r8,%r11,1),%xmm4
DB 196,226,125,49,236 ; vpmovzxbd %xmm4,%ymm5
DB 197,249,112,228,78 ; vpshufd $0x4e,%xmm4,%xmm4
DB 196,226,125,49,228 ; vpmovzxbd %xmm4,%ymm4
- DB 197,253,111,53,200,136,0,0 ; vmovdqa 0x88c8(%rip),%ymm6 # 2d1a0 <_sk_overlay_sse2_8bit+0xc34>
+ DB 197,253,111,53,60,135,0,0 ; vmovdqa 0x873c(%rip),%ymm6 # 2d000 <_sk_overlay_sse2_8bit+0xaa8>
DB 196,226,93,0,230 ; vpshufb %ymm6,%ymm4,%ymm4
DB 196,226,85,0,238 ; vpshufb %ymm6,%ymm5,%ymm5
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -34967,35 +34961,35 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 15,135,47,255,255,255 ; ja 248c1 <_sk_scale_u8_hsw_8bit+0x22>
+ DB 15,135,47,255,255,255 ; ja 248ad <_sk_scale_u8_hsw_8bit+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,199,0,0,0 ; lea 0xc7(%rip),%r10 # 24a64 <_sk_scale_u8_hsw_8bit+0x1c5>
+ DB 76,141,21,199,0,0,0 ; lea 0xc7(%rip),%r10 # 24a50 <_sk_scale_u8_hsw_8bit+0x1c5>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,13,255,255,255 ; jmpq 248c1 <_sk_scale_u8_hsw_8bit+0x22>
+ DB 233,13,255,255,255 ; jmpq 248ad <_sk_scale_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,2,2 ; vpinsrb $0x2,0x2(%r8,%r11,1),%xmm4,%xmm4
DB 67,15,183,4,24 ; movzwl (%r8,%r11,1),%eax
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,227,89,14,229,1 ; vpblendw $0x1,%xmm5,%xmm4,%xmm4
- DB 233,237,254,255,255 ; jmpq 248c1 <_sk_scale_u8_hsw_8bit+0x22>
+ DB 233,237,254,255,255 ; jmpq 248ad <_sk_scale_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,6,6 ; vpinsrb $0x6,0x6(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,5,5 ; vpinsrb $0x5,0x5(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,4,4 ; vpinsrb $0x4,0x4(%r8,%r11,1),%xmm4,%xmm4
DB 196,129,121,110,44,24 ; vmovd (%r8,%r11,1),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,192,254,255,255 ; jmpq 248c1 <_sk_scale_u8_hsw_8bit+0x22>
+ DB 233,192,254,255,255 ; jmpq 248ad <_sk_scale_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,10,10 ; vpinsrb $0xa,0xa(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,9,9 ; vpinsrb $0x9,0x9(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,8,8 ; vpinsrb $0x8,0x8(%r8,%r11,1),%xmm4,%xmm4
DB 196,129,122,126,44,24 ; vmovq (%r8,%r11,1),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,147,254,255,255 ; jmpq 248c1 <_sk_scale_u8_hsw_8bit+0x22>
+ DB 233,147,254,255,255 ; jmpq 248ad <_sk_scale_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,14,14 ; vpinsrb $0xe,0xe(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,13,13 ; vpinsrb $0xd,0xd(%r8,%r11,1),%xmm4,%xmm4
@@ -35003,7 +34997,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 196,129,122,126,44,24 ; vmovq (%r8,%r11,1),%xmm5
DB 196,131,81,34,108,24,8,2 ; vpinsrd $0x2,0x8(%r8,%r11,1),%xmm5,%xmm5
DB 196,227,81,2,228,8 ; vpblendd $0x8,%xmm4,%xmm5,%xmm4
- DB 233,94,254,255,255 ; jmpq 248c1 <_sk_scale_u8_hsw_8bit+0x22>
+ DB 233,94,254,255,255 ; jmpq 248ad <_sk_scale_u8_hsw_8bit+0x22>
DB 144 ; nop
DB 66,255 ; rex.X (bad)
DB 255 ; (bad)
@@ -35013,7 +35007,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 255,140,255,255,255,132,255 ; decl -0x7b0001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 124,255 ; jl 24a79 <_sk_scale_u8_hsw_8bit+0x1da>
+ DB 124,255 ; jl 24a65 <_sk_scale_u8_hsw_8bit+0x1da>
DB 255 ; (bad)
DB 255,112,255 ; pushq -0x1(%rax)
DB 255 ; (bad)
@@ -35042,7 +35036,7 @@ PUBLIC _sk_lerp_1_float_hsw_8bit
_sk_lerp_1_float_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,250,16,32 ; vmovss (%rax),%xmm4
- DB 197,218,89,37,90,127,0,0 ; vmulss 0x7f5a(%rip),%xmm4,%xmm4 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 197,218,89,37,62,136,0,0 ; vmulss 0x883e(%rip),%xmm4,%xmm4 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 197,250,44,196 ; vcvttss2si %xmm4,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,120,228 ; vpbroadcastb %xmm4,%ymm4
@@ -35052,7 +35046,7 @@ _sk_lerp_1_float_hsw_8bit LABEL PROC
DB 196,226,125,48,241 ; vpmovzxbw %xmm1,%ymm6
DB 196,227,125,57,201,1 ; vextracti128 $0x1,%ymm1,%xmm1
DB 196,226,125,48,201 ; vpmovzxbw %xmm1,%ymm1
- DB 197,221,219,61,221,134,0,0 ; vpand 0x86dd(%rip),%ymm4,%ymm7 # 2d1c0 <_sk_overlay_sse2_8bit+0xc54>
+ DB 197,221,219,61,81,133,0,0 ; vpand 0x8551(%rip),%ymm4,%ymm7 # 2d020 <_sk_overlay_sse2_8bit+0xac8>
DB 197,69,213,193 ; vpmullw %ymm1,%ymm7,%ymm8
DB 197,69,213,206 ; vpmullw %ymm6,%ymm7,%ymm9
DB 197,69,213,208 ; vpmullw %ymm0,%ymm7,%ymm10
@@ -35114,12 +35108,12 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,106,1,0,0 ; jne 24d56 <_sk_lerp_u8_hsw_8bit+0x186>
+ DB 15,133,106,1,0,0 ; jne 24d42 <_sk_lerp_u8_hsw_8bit+0x186>
DB 196,129,122,111,36,24 ; vmovdqu (%r8,%r11,1),%xmm4
DB 196,226,125,49,236 ; vpmovzxbd %xmm4,%ymm5
DB 197,249,112,228,78 ; vpshufd $0x4e,%xmm4,%xmm4
DB 196,226,125,49,228 ; vpmovzxbd %xmm4,%ymm4
- DB 197,253,111,53,215,133,0,0 ; vmovdqa 0x85d7(%rip),%ymm6 # 2d1e0 <_sk_overlay_sse2_8bit+0xc74>
+ DB 197,253,111,53,75,132,0,0 ; vmovdqa 0x844b(%rip),%ymm6 # 2d040 <_sk_overlay_sse2_8bit+0xae8>
DB 196,98,93,0,206 ; vpshufb %ymm6,%ymm4,%ymm9
DB 196,98,85,0,222 ; vpshufb %ymm6,%ymm5,%ymm11
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -35194,35 +35188,35 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 15,135,132,254,255,255 ; ja 24bf2 <_sk_lerp_u8_hsw_8bit+0x22>
+ DB 15,135,132,254,255,255 ; ja 24bde <_sk_lerp_u8_hsw_8bit+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,199,0,0,0 ; lea 0xc7(%rip),%r10 # 24e40 <_sk_lerp_u8_hsw_8bit+0x270>
+ DB 76,141,21,199,0,0,0 ; lea 0xc7(%rip),%r10 # 24e2c <_sk_lerp_u8_hsw_8bit+0x270>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,98,254,255,255 ; jmpq 24bf2 <_sk_lerp_u8_hsw_8bit+0x22>
+ DB 233,98,254,255,255 ; jmpq 24bde <_sk_lerp_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,2,2 ; vpinsrb $0x2,0x2(%r8,%r11,1),%xmm4,%xmm4
DB 67,15,183,4,24 ; movzwl (%r8,%r11,1),%eax
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,227,89,14,229,1 ; vpblendw $0x1,%xmm5,%xmm4,%xmm4
- DB 233,66,254,255,255 ; jmpq 24bf2 <_sk_lerp_u8_hsw_8bit+0x22>
+ DB 233,66,254,255,255 ; jmpq 24bde <_sk_lerp_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,6,6 ; vpinsrb $0x6,0x6(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,5,5 ; vpinsrb $0x5,0x5(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,4,4 ; vpinsrb $0x4,0x4(%r8,%r11,1),%xmm4,%xmm4
DB 196,129,121,110,44,24 ; vmovd (%r8,%r11,1),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,21,254,255,255 ; jmpq 24bf2 <_sk_lerp_u8_hsw_8bit+0x22>
+ DB 233,21,254,255,255 ; jmpq 24bde <_sk_lerp_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,10,10 ; vpinsrb $0xa,0xa(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,9,9 ; vpinsrb $0x9,0x9(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,8,8 ; vpinsrb $0x8,0x8(%r8,%r11,1),%xmm4,%xmm4
DB 196,129,122,126,44,24 ; vmovq (%r8,%r11,1),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,232,253,255,255 ; jmpq 24bf2 <_sk_lerp_u8_hsw_8bit+0x22>
+ DB 233,232,253,255,255 ; jmpq 24bde <_sk_lerp_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,14,14 ; vpinsrb $0xe,0xe(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,13,13 ; vpinsrb $0xd,0xd(%r8,%r11,1),%xmm4,%xmm4
@@ -35230,7 +35224,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 196,129,122,126,44,24 ; vmovq (%r8,%r11,1),%xmm5
DB 196,131,81,34,108,24,8,2 ; vpinsrd $0x2,0x8(%r8,%r11,1),%xmm5,%xmm5
DB 196,227,81,2,228,8 ; vpblendd $0x8,%xmm4,%xmm5,%xmm4
- DB 233,179,253,255,255 ; jmpq 24bf2 <_sk_lerp_u8_hsw_8bit+0x22>
+ DB 233,179,253,255,255 ; jmpq 24bde <_sk_lerp_u8_hsw_8bit+0x22>
DB 144 ; nop
DB 66,255 ; rex.X (bad)
DB 255 ; (bad)
@@ -35240,7 +35234,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 255,140,255,255,255,132,255 ; decl -0x7b0001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 124,255 ; jl 24e55 <_sk_lerp_u8_hsw_8bit+0x285>
+ DB 124,255 ; jl 24e41 <_sk_lerp_u8_hsw_8bit+0x285>
DB 255 ; (bad)
DB 255,112,255 ; pushq -0x1(%rax)
DB 255 ; (bad)
@@ -35282,7 +35276,7 @@ _sk_move_dst_src_hsw_8bit LABEL PROC
PUBLIC _sk_black_color_hsw_8bit
_sk_black_color_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,213,124,0,0 ; vbroadcastss 0x7cd5(%rip),%ymm0 # 2cb74 <_sk_overlay_sse2_8bit+0x608>
+ DB 196,226,125,24,5,185,133,0,0 ; vbroadcastss 0x85b9(%rip),%ymm0 # 2d444 <_sk_overlay_sse2_8bit+0xeec>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 255,224 ; jmpq *%rax
@@ -35302,7 +35296,7 @@ _sk_clear_hsw_8bit LABEL PROC
PUBLIC _sk_srcatop_hsw_8bit
_sk_srcatop_hsw_8bit LABEL PROC
- DB 197,125,111,5,59,131,0,0 ; vmovdqa 0x833b(%rip),%ymm8 # 2d200 <_sk_overlay_sse2_8bit+0xc94>
+ DB 197,125,111,5,175,129,0,0 ; vmovdqa 0x81af(%rip),%ymm8 # 2d060 <_sk_overlay_sse2_8bit+0xb08>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,232 ; vpshufb %ymm8,%ymm2,%ymm5
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -35377,7 +35371,7 @@ _sk_srcatop_hsw_8bit LABEL PROC
PUBLIC _sk_dstatop_hsw_8bit
_sk_dstatop_hsw_8bit LABEL PROC
- DB 197,125,111,5,246,129,0,0 ; vmovdqa 0x81f6(%rip),%ymm8 # 2d220 <_sk_overlay_sse2_8bit+0xcb4>
+ DB 197,125,111,5,106,128,0,0 ; vmovdqa 0x806a(%rip),%ymm8 # 2d080 <_sk_overlay_sse2_8bit+0xb28>
DB 196,194,117,0,224 ; vpshufb %ymm8,%ymm1,%ymm4
DB 196,194,125,0,232 ; vpshufb %ymm8,%ymm0,%ymm5
DB 196,98,125,48,210 ; vpmovzxbw %xmm2,%ymm10
@@ -35452,7 +35446,7 @@ _sk_dstatop_hsw_8bit LABEL PROC
PUBLIC _sk_srcin_hsw_8bit
_sk_srcin_hsw_8bit LABEL PROC
- DB 197,253,111,37,173,128,0,0 ; vmovdqa 0x80ad(%rip),%ymm4 # 2d240 <_sk_overlay_sse2_8bit+0xcd4>
+ DB 197,253,111,37,33,127,0,0 ; vmovdqa 0x7f21(%rip),%ymm4 # 2d0a0 <_sk_overlay_sse2_8bit+0xb48>
DB 196,226,101,0,236 ; vpshufb %ymm4,%ymm3,%ymm5
DB 196,226,109,0,228 ; vpshufb %ymm4,%ymm2,%ymm4
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -35490,7 +35484,7 @@ _sk_srcin_hsw_8bit LABEL PROC
PUBLIC _sk_dstin_hsw_8bit
_sk_dstin_hsw_8bit LABEL PROC
- DB 197,253,111,37,35,128,0,0 ; vmovdqa 0x8023(%rip),%ymm4 # 2d260 <_sk_overlay_sse2_8bit+0xcf4>
+ DB 197,253,111,37,151,126,0,0 ; vmovdqa 0x7e97(%rip),%ymm4 # 2d0c0 <_sk_overlay_sse2_8bit+0xb68>
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,125,48,226 ; vpmovzxbw %xmm2,%ymm4
@@ -35528,7 +35522,7 @@ _sk_dstin_hsw_8bit LABEL PROC
PUBLIC _sk_srcout_hsw_8bit
_sk_srcout_hsw_8bit LABEL PROC
- DB 197,253,111,37,151,127,0,0 ; vmovdqa 0x7f97(%rip),%ymm4 # 2d280 <_sk_overlay_sse2_8bit+0xd14>
+ DB 197,253,111,37,11,126,0,0 ; vmovdqa 0x7e0b(%rip),%ymm4 # 2d0e0 <_sk_overlay_sse2_8bit+0xb88>
DB 196,226,109,0,236 ; vpshufb %ymm4,%ymm2,%ymm5
DB 196,226,101,0,228 ; vpshufb %ymm4,%ymm3,%ymm4
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
@@ -35569,7 +35563,7 @@ _sk_srcout_hsw_8bit LABEL PROC
PUBLIC _sk_dstout_hsw_8bit
_sk_dstout_hsw_8bit LABEL PROC
- DB 197,253,111,37,1,127,0,0 ; vmovdqa 0x7f01(%rip),%ymm4 # 2d2a0 <_sk_overlay_sse2_8bit+0xd34>
+ DB 197,253,111,37,117,125,0,0 ; vmovdqa 0x7d75(%rip),%ymm4 # 2d100 <_sk_overlay_sse2_8bit+0xba8>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 197,221,118,228 ; vpcmpeqd %ymm4,%ymm4,%ymm4
@@ -35610,7 +35604,7 @@ _sk_dstout_hsw_8bit LABEL PROC
PUBLIC _sk_srcover_hsw_8bit
_sk_srcover_hsw_8bit LABEL PROC
- DB 197,253,111,37,105,126,0,0 ; vmovdqa 0x7e69(%rip),%ymm4 # 2d2c0 <_sk_overlay_sse2_8bit+0xd54>
+ DB 197,253,111,37,221,124,0,0 ; vmovdqa 0x7cdd(%rip),%ymm4 # 2d120 <_sk_overlay_sse2_8bit+0xbc8>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 196,98,125,48,202 ; vpmovzxbw %xmm2,%ymm9
@@ -35652,7 +35646,7 @@ _sk_srcover_hsw_8bit LABEL PROC
PUBLIC _sk_dstover_hsw_8bit
_sk_dstover_hsw_8bit LABEL PROC
- DB 197,253,111,37,202,125,0,0 ; vmovdqa 0x7dca(%rip),%ymm4 # 2d2e0 <_sk_overlay_sse2_8bit+0xd74>
+ DB 197,253,111,37,62,124,0,0 ; vmovdqa 0x7c3e(%rip),%ymm4 # 2d140 <_sk_overlay_sse2_8bit+0xbe8>
DB 196,226,101,0,236 ; vpshufb %ymm4,%ymm3,%ymm5
DB 196,226,109,0,228 ; vpshufb %ymm4,%ymm2,%ymm4
DB 196,98,125,48,200 ; vpmovzxbw %xmm0,%ymm9
@@ -35732,7 +35726,7 @@ _sk_multiply_hsw_8bit LABEL PROC
DB 72,131,236,56 ; sub $0x38,%rsp
DB 197,253,111,243 ; vmovdqa %ymm3,%ymm6
DB 197,253,111,218 ; vmovdqa %ymm2,%ymm3
- DB 197,125,111,13,135,124,0,0 ; vmovdqa 0x7c87(%rip),%ymm9 # 2d300 <_sk_overlay_sse2_8bit+0xd94>
+ DB 197,125,111,13,251,122,0,0 ; vmovdqa 0x7afb(%rip),%ymm9 # 2d160 <_sk_overlay_sse2_8bit+0xc08>
DB 196,194,101,0,225 ; vpshufb %ymm9,%ymm3,%ymm4
DB 196,194,77,0,233 ; vpshufb %ymm9,%ymm6,%ymm5
DB 196,65,45,118,210 ; vpcmpeqd %ymm10,%ymm10,%ymm10
@@ -35873,7 +35867,7 @@ _sk_screen_hsw_8bit LABEL PROC
PUBLIC _sk_xor__hsw_8bit
_sk_xor__hsw_8bit LABEL PROC
- DB 197,125,111,13,19,122,0,0 ; vmovdqa 0x7a13(%rip),%ymm9 # 2d320 <_sk_overlay_sse2_8bit+0xdb4>
+ DB 197,125,111,13,135,120,0,0 ; vmovdqa 0x7887(%rip),%ymm9 # 2d180 <_sk_overlay_sse2_8bit+0xc28>
DB 196,194,109,0,225 ; vpshufb %ymm9,%ymm2,%ymm4
DB 196,194,101,0,249 ; vpshufb %ymm9,%ymm3,%ymm7
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -35957,7 +35951,7 @@ _sk_plus__hsw_8bit LABEL PROC
PUBLIC _sk_darken_hsw_8bit
_sk_darken_hsw_8bit LABEL PROC
- DB 197,125,111,5,181,120,0,0 ; vmovdqa 0x78b5(%rip),%ymm8 # 2d340 <_sk_overlay_sse2_8bit+0xdd4>
+ DB 197,125,111,5,41,119,0,0 ; vmovdqa 0x7729(%rip),%ymm8 # 2d1a0 <_sk_overlay_sse2_8bit+0xc48>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -36030,7 +36024,7 @@ _sk_darken_hsw_8bit LABEL PROC
DB 197,253,248,246 ; vpsubb %ymm6,%ymm0,%ymm6
DB 197,245,248,205 ; vpsubb %ymm5,%ymm1,%ymm1
DB 197,253,248,196 ; vpsubb %ymm4,%ymm0,%ymm0
- DB 196,226,125,88,37,130,111,0,0 ; vpbroadcastd 0x6f82(%rip),%ymm4 # 2cb7c <_sk_overlay_sse2_8bit+0x610>
+ DB 196,226,125,88,37,102,120,0,0 ; vpbroadcastd 0x7866(%rip),%ymm4 # 2d44c <_sk_overlay_sse2_8bit+0xef4>
DB 196,227,125,76,198,64 ; vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
DB 196,227,117,76,207,64 ; vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36038,7 +36032,7 @@ _sk_darken_hsw_8bit LABEL PROC
PUBLIC _sk_lighten_hsw_8bit
_sk_lighten_hsw_8bit LABEL PROC
- DB 197,125,111,5,78,119,0,0 ; vmovdqa 0x774e(%rip),%ymm8 # 2d360 <_sk_overlay_sse2_8bit+0xdf4>
+ DB 197,125,111,5,194,117,0,0 ; vmovdqa 0x75c2(%rip),%ymm8 # 2d1c0 <_sk_overlay_sse2_8bit+0xc68>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -36111,7 +36105,7 @@ _sk_lighten_hsw_8bit LABEL PROC
DB 197,253,248,246 ; vpsubb %ymm6,%ymm0,%ymm6
DB 197,245,248,205 ; vpsubb %ymm5,%ymm1,%ymm1
DB 197,253,248,196 ; vpsubb %ymm4,%ymm0,%ymm0
- DB 196,226,125,88,37,251,109,0,0 ; vpbroadcastd 0x6dfb(%rip),%ymm4 # 2cb7c <_sk_overlay_sse2_8bit+0x610>
+ DB 196,226,125,88,37,223,118,0,0 ; vpbroadcastd 0x76df(%rip),%ymm4 # 2d44c <_sk_overlay_sse2_8bit+0xef4>
DB 196,227,125,76,198,64 ; vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
DB 196,227,117,76,207,64 ; vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36149,7 +36143,7 @@ _sk_exclusion_hsw_8bit LABEL PROC
DB 196,227,77,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm6,%ymm7
DB 196,227,77,70,228,49 ; vperm2i128 $0x31,%ymm4,%ymm6,%ymm4
DB 197,197,103,228 ; vpackuswb %ymm4,%ymm7,%ymm4
- DB 197,253,111,53,80,117,0,0 ; vmovdqa 0x7550(%rip),%ymm6 # 2d380 <_sk_overlay_sse2_8bit+0xe14>
+ DB 197,253,111,53,196,115,0,0 ; vmovdqa 0x73c4(%rip),%ymm6 # 2d1e0 <_sk_overlay_sse2_8bit+0xc88>
DB 197,221,219,254 ; vpand %ymm6,%ymm4,%ymm7
DB 197,213,219,246 ; vpand %ymm6,%ymm5,%ymm6
DB 197,237,252,192 ; vpaddb %ymm0,%ymm2,%ymm0
@@ -36163,7 +36157,7 @@ _sk_exclusion_hsw_8bit LABEL PROC
PUBLIC _sk_difference_hsw_8bit
_sk_difference_hsw_8bit LABEL PROC
- DB 197,125,111,5,68,117,0,0 ; vmovdqa 0x7544(%rip),%ymm8 # 2d3a0 <_sk_overlay_sse2_8bit+0xe34>
+ DB 197,125,111,5,184,115,0,0 ; vmovdqa 0x73b8(%rip),%ymm8 # 2d200 <_sk_overlay_sse2_8bit+0xca8>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -36230,7 +36224,7 @@ _sk_difference_hsw_8bit LABEL PROC
DB 197,197,103,237 ; vpackuswb %ymm5,%ymm7,%ymm5
DB 197,181,218,228 ; vpminub %ymm4,%ymm9,%ymm4
DB 197,165,218,237 ; vpminub %ymm5,%ymm11,%ymm5
- DB 197,253,111,53,14,116,0,0 ; vmovdqa 0x740e(%rip),%ymm6 # 2d3c0 <_sk_overlay_sse2_8bit+0xe54>
+ DB 197,253,111,53,130,114,0,0 ; vmovdqa 0x7282(%rip),%ymm6 # 2d220 <_sk_overlay_sse2_8bit+0xcc8>
DB 197,213,219,254 ; vpand %ymm6,%ymm5,%ymm7
DB 197,221,219,246 ; vpand %ymm6,%ymm4,%ymm6
DB 197,237,252,192 ; vpaddb %ymm0,%ymm2,%ymm0
@@ -36253,7 +36247,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 196,227,125,57,204,1 ; vextracti128 $0x1,%ymm1,%xmm4
DB 196,98,125,48,196 ; vpmovzxbw %xmm4,%ymm8
DB 197,126,127,132,36,224,0,0,0 ; vmovdqu %ymm8,0xe0(%rsp)
- DB 197,253,111,45,206,115,0,0 ; vmovdqa 0x73ce(%rip),%ymm5 # 2d3e0 <_sk_overlay_sse2_8bit+0xe74>
+ DB 197,253,111,45,66,114,0,0 ; vmovdqa 0x7242(%rip),%ymm5 # 2d240 <_sk_overlay_sse2_8bit+0xce8>
DB 196,226,125,0,229 ; vpshufb %ymm5,%ymm0,%ymm4
DB 196,226,117,0,205 ; vpshufb %ymm5,%ymm1,%ymm1
DB 196,227,125,57,200,1 ; vextracti128 $0x1,%ymm1,%xmm0
@@ -36279,10 +36273,10 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 197,253,117,193 ; vpcmpeqw %ymm1,%ymm0,%ymm0
DB 197,254,127,132,36,0,1,0,0 ; vmovdqu %ymm0,0x100(%rsp)
DB 197,253,111,226 ; vmovdqa %ymm2,%ymm4
- DB 197,125,111,37,60,115,0,0 ; vmovdqa 0x733c(%rip),%ymm12 # 2d3e0 <_sk_overlay_sse2_8bit+0xe74>
+ DB 197,125,111,37,176,113,0,0 ; vmovdqa 0x71b0(%rip),%ymm12 # 2d240 <_sk_overlay_sse2_8bit+0xce8>
DB 196,66,93,0,196 ; vpshufb %ymm12,%ymm4,%ymm8
DB 196,194,125,48,208 ; vpmovzxbw %xmm8,%ymm2
- DB 196,226,125,121,5,73,115,0,0 ; vpbroadcastw 0x7349(%rip),%ymm0 # 2d400 <_sk_overlay_sse2_8bit+0xe94>
+ DB 196,226,125,121,5,189,113,0,0 ; vpbroadcastw 0x71bd(%rip),%ymm0 # 2d260 <_sk_overlay_sse2_8bit+0xd08>
DB 197,109,239,232 ; vpxor %ymm0,%ymm2,%ymm13
DB 197,149,213,207 ; vpmullw %ymm7,%ymm13,%ymm1
DB 197,254,127,140,36,96,1,0,0 ; vmovdqu %ymm1,0x160(%rsp)
@@ -36382,7 +36376,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 197,254,111,116,36,32 ; vmovdqu 0x20(%rsp),%ymm6
DB 197,205,253,116,36,64 ; vpaddw 0x40(%rsp),%ymm6,%ymm6
DB 196,193,53,253,252 ; vpaddw %ymm12,%ymm9,%ymm7
- DB 196,98,125,121,5,54,113,0,0 ; vpbroadcastw 0x7136(%rip),%ymm8 # 2d402 <_sk_overlay_sse2_8bit+0xe96>
+ DB 196,98,125,121,5,170,111,0,0 ; vpbroadcastw 0x6faa(%rip),%ymm8 # 2d262 <_sk_overlay_sse2_8bit+0xd0a>
DB 196,193,93,253,224 ; vpaddw %ymm8,%ymm4,%ymm4
DB 197,229,253,220 ; vpaddw %ymm4,%ymm3,%ymm3
DB 196,193,85,253,224 ; vpaddw %ymm8,%ymm5,%ymm4
@@ -36391,7 +36385,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 197,245,253,204 ; vpaddw %ymm4,%ymm1,%ymm1
DB 196,193,69,253,224 ; vpaddw %ymm8,%ymm7,%ymm4
DB 197,253,253,196 ; vpaddw %ymm4,%ymm0,%ymm0
- DB 196,226,125,121,37,11,113,0,0 ; vpbroadcastw 0x710b(%rip),%ymm4 # 2d404 <_sk_overlay_sse2_8bit+0xe98>
+ DB 196,226,125,121,37,127,111,0,0 ; vpbroadcastw 0x6f7f(%rip),%ymm4 # 2d264 <_sk_overlay_sse2_8bit+0xd0c>
DB 197,253,228,196 ; vpmulhuw %ymm4,%ymm0,%ymm0
DB 197,245,228,204 ; vpmulhuw %ymm4,%ymm1,%ymm1
DB 197,237,228,212 ; vpmulhuw %ymm4,%ymm2,%ymm2
@@ -36416,7 +36410,7 @@ PUBLIC _sk_overlay_hsw_8bit
_sk_overlay_hsw_8bit LABEL PROC
DB 72,129,236,24,2,0,0 ; sub $0x218,%rsp
DB 197,252,17,140,36,192,1,0,0 ; vmovups %ymm1,0x1c0(%rsp)
- DB 197,253,111,45,174,112,0,0 ; vmovdqa 0x70ae(%rip),%ymm5 # 2d420 <_sk_overlay_sse2_8bit+0xeb4>
+ DB 197,253,111,45,34,111,0,0 ; vmovdqa 0x6f22(%rip),%ymm5 # 2d280 <_sk_overlay_sse2_8bit+0xd28>
DB 197,253,111,226 ; vmovdqa %ymm2,%ymm4
DB 196,227,125,57,225,1 ; vextracti128 $0x1,%ymm4,%xmm1
DB 196,98,125,48,193 ; vpmovzxbw %xmm1,%ymm8
@@ -36451,7 +36445,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,93,117,251 ; vpcmpeqw %ymm3,%ymm4,%ymm15
DB 197,253,111,216 ; vmovdqa %ymm0,%ymm3
DB 196,226,125,48,227 ; vpmovzxbw %xmm3,%ymm4
- DB 196,226,125,121,5,8,112,0,0 ; vpbroadcastw 0x7008(%rip),%ymm0 # 2d440 <_sk_overlay_sse2_8bit+0xed4>
+ DB 196,226,125,121,5,124,110,0,0 ; vpbroadcastw 0x6e7c(%rip),%ymm0 # 2d2a0 <_sk_overlay_sse2_8bit+0xd48>
DB 197,117,239,232 ; vpxor %ymm0,%ymm1,%ymm13
DB 197,21,213,212 ; vpmullw %ymm4,%ymm13,%ymm10
DB 197,126,127,148,36,64,1,0,0 ; vmovdqu %ymm10,0x140(%rsp)
@@ -36552,7 +36546,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,254,111,116,36,64 ; vmovdqu 0x40(%rsp),%ymm6
DB 197,205,253,116,36,96 ; vpaddw 0x60(%rsp),%ymm6,%ymm6
DB 196,193,29,253,253 ; vpaddw %ymm13,%ymm12,%ymm7
- DB 196,98,125,121,5,251,109,0,0 ; vpbroadcastw 0x6dfb(%rip),%ymm8 # 2d442 <_sk_overlay_sse2_8bit+0xed6>
+ DB 196,98,125,121,5,111,108,0,0 ; vpbroadcastw 0x6c6f(%rip),%ymm8 # 2d2a2 <_sk_overlay_sse2_8bit+0xd4a>
DB 196,193,109,253,208 ; vpaddw %ymm8,%ymm2,%ymm2
DB 197,229,253,210 ; vpaddw %ymm2,%ymm3,%ymm2
DB 196,193,85,253,216 ; vpaddw %ymm8,%ymm5,%ymm3
@@ -36561,7 +36555,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,245,253,204 ; vpaddw %ymm4,%ymm1,%ymm1
DB 196,193,69,253,224 ; vpaddw %ymm8,%ymm7,%ymm4
DB 197,253,253,196 ; vpaddw %ymm4,%ymm0,%ymm0
- DB 196,226,125,121,37,208,109,0,0 ; vpbroadcastw 0x6dd0(%rip),%ymm4 # 2d444 <_sk_overlay_sse2_8bit+0xed8>
+ DB 196,226,125,121,37,68,108,0,0 ; vpbroadcastw 0x6c44(%rip),%ymm4 # 2d2a4 <_sk_overlay_sse2_8bit+0xd4c>
DB 197,253,228,196 ; vpmulhuw %ymm4,%ymm0,%ymm0
DB 197,245,228,204 ; vpmulhuw %ymm4,%ymm1,%ymm1
DB 197,229,228,220 ; vpmulhuw %ymm4,%ymm3,%ymm3
@@ -36616,13 +36610,13 @@ _sk_start_pipeline_sse41_8bit LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,101 ; jae 267ba <_sk_start_pipeline_sse41_8bit+0xe2>
+ DB 115,101 ; jae 267a6 <_sk_start_pipeline_sse41_8bit+0xe2>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,8 ; lea 0x8(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
- DB 119,38 ; ja 2679d <_sk_start_pipeline_sse41_8bit+0xc5>
+ DB 119,38 ; ja 26789 <_sk_start_pipeline_sse41_8bit+0xc5>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 49,255 ; xor %edi,%edi
DB 76,137,246 ; mov %r14,%rsi
@@ -36633,16 +36627,16 @@ _sk_start_pipeline_sse41_8bit LABEL PROC
DB 73,131,196,16 ; add $0x10,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,225 ; jbe 2677e <_sk_start_pipeline_sse41_8bit+0xa6>
+ DB 118,225 ; jbe 2676a <_sk_start_pipeline_sse41_8bit+0xa6>
DB 76,137,255 ; mov %r15,%rdi
DB 72,41,215 ; sub %rdx,%rdi
- DB 116,9 ; je 267ae <_sk_start_pipeline_sse41_8bit+0xd6>
+ DB 116,9 ; je 2679a <_sk_start_pipeline_sse41_8bit+0xd6>
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,173 ; jne 26767 <_sk_start_pipeline_sse41_8bit+0x8f>
+ DB 117,173 ; jne 26753 <_sk_start_pipeline_sse41_8bit+0x8f>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -36680,7 +36674,7 @@ _sk_uniform_color_sse41_8bit LABEL PROC
PUBLIC _sk_set_rgb_sse41_8bit
_sk_set_rgb_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,37,217,97,0,0 ; movss 0x61d9(%rip),%xmm4 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 243,15,16,37,189,106,0,0 ; movss 0x6abd(%rip),%xmm4 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 243,15,16,40 ; movss (%rax),%xmm5
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 243,76,15,44,197 ; cvttss2si %xmm5,%r8
@@ -36695,7 +36689,7 @@ _sk_set_rgb_sse41_8bit LABEL PROC
DB 68,9,200 ; or %r9d,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
- DB 102,15,111,45,30,115,0,0 ; movdqa 0x731e(%rip),%xmm5 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
+ DB 102,15,111,45,50,115,0,0 ; movdqa 0x7332(%rip),%xmm5 # 2db90 <_sk_overlay_sse2_8bit+0x1638>
DB 102,15,219,205 ; pand %xmm5,%xmm1
DB 102,15,219,197 ; pand %xmm5,%xmm0
DB 102,15,235,196 ; por %xmm4,%xmm0
@@ -36707,12 +36701,12 @@ PUBLIC _sk_premul_sse41_8bit
_sk_premul_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,10,115,0,0 ; movdqa 0x730a(%rip),%xmm0 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,15,111,5,30,115,0,0 ; movdqa 0x731e(%rip),%xmm0 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,15,111,253 ; movdqa %xmm5,%xmm7
DB 102,15,56,0,248 ; pshufb %xmm0,%xmm7
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,56,0,240 ; pshufb %xmm0,%xmm6
- DB 102,15,111,5,224,114,0,0 ; movdqa 0x72e0(%rip),%xmm0 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
+ DB 102,15,111,5,244,114,0,0 ; movdqa 0x72f4(%rip),%xmm0 # 2db90 <_sk_overlay_sse2_8bit+0x1638>
DB 102,15,235,240 ; por %xmm0,%xmm6
DB 102,15,235,248 ; por %xmm0,%xmm7
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -36743,7 +36737,7 @@ _sk_premul_sse41_8bit LABEL PROC
PUBLIC _sk_swap_rb_sse41_8bit
_sk_swap_rb_sse41_8bit LABEL PROC
- DB 102,15,111,37,125,114,0,0 ; movdqa 0x727d(%rip),%xmm4 # 2dbb0 <_sk_overlay_sse2_8bit+0x1644>
+ DB 102,15,111,37,145,114,0,0 ; movdqa 0x7291(%rip),%xmm4 # 2dbb0 <_sk_overlay_sse2_8bit+0x1658>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36767,7 +36761,7 @@ _sk_load_8888_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 2697e <_sk_load_8888_sse41_8bit+0x2d>
+ DB 117,17 ; jne 2696a <_sk_load_8888_sse41_8bit+0x2d>
DB 243,67,15,111,76,152,16 ; movdqu 0x10(%r8,%r11,4),%xmm1
DB 243,67,15,111,4,152 ; movdqu (%r8,%r11,4),%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36778,24 +36772,24 @@ _sk_load_8888_sse41_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,228 ; ja 2697a <_sk_load_8888_sse41_8bit+0x29>
+ DB 119,228 ; ja 26966 <_sk_load_8888_sse41_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,75,0,0,0 ; lea 0x4b(%rip),%r10 # 269ec <_sk_load_8888_sse41_8bit+0x9b>
+ DB 76,141,21,75,0,0,0 ; lea 0x4b(%rip),%r10 # 269d8 <_sk_load_8888_sse41_8bit+0x9b>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,110,4,152 ; movd (%r8,%r11,4),%xmm0
- DB 235,200 ; jmp 2697a <_sk_load_8888_sse41_8bit+0x29>
+ DB 235,200 ; jmp 26966 <_sk_load_8888_sse41_8bit+0x29>
DB 102,67,15,110,68,152,8 ; movd 0x8(%r8,%r11,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 243,67,15,126,36,152 ; movq (%r8,%r11,4),%xmm4
DB 102,15,58,14,196,15 ; pblendw $0xf,%xmm4,%xmm0
- DB 235,174 ; jmp 2697a <_sk_load_8888_sse41_8bit+0x29>
+ DB 235,174 ; jmp 26966 <_sk_load_8888_sse41_8bit+0x29>
DB 102,67,15,110,68,152,24 ; movd 0x18(%r8,%r11,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 102,67,15,58,34,76,152,20,1 ; pinsrd $0x1,0x14(%r8,%r11,4),%xmm1
DB 102,67,15,58,34,76,152,16,0 ; pinsrd $0x0,0x10(%r8,%r11,4),%xmm1
- DB 235,136 ; jmp 26974 <_sk_load_8888_sse41_8bit+0x23>
+ DB 235,136 ; jmp 26960 <_sk_load_8888_sse41_8bit+0x23>
DB 190,255,255,255,210 ; mov $0xd2ffffff,%esi
DB 255 ; (bad)
DB 255 ; (bad)
@@ -36824,7 +36818,7 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 26a35 <_sk_load_8888_dst_sse41_8bit+0x2d>
+ DB 117,17 ; jne 26a21 <_sk_load_8888_dst_sse41_8bit+0x2d>
DB 243,67,15,111,92,152,16 ; movdqu 0x10(%r8,%r11,4),%xmm3
DB 243,67,15,111,20,152 ; movdqu (%r8,%r11,4),%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36835,24 +36829,24 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,228 ; ja 26a31 <_sk_load_8888_dst_sse41_8bit+0x29>
+ DB 119,228 ; ja 26a1d <_sk_load_8888_dst_sse41_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,76,0,0,0 ; lea 0x4c(%rip),%r10 # 26aa4 <_sk_load_8888_dst_sse41_8bit+0x9c>
+ DB 76,141,21,76,0,0,0 ; lea 0x4c(%rip),%r10 # 26a90 <_sk_load_8888_dst_sse41_8bit+0x9c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,110,20,152 ; movd (%r8,%r11,4),%xmm2
- DB 235,200 ; jmp 26a31 <_sk_load_8888_dst_sse41_8bit+0x29>
+ DB 235,200 ; jmp 26a1d <_sk_load_8888_dst_sse41_8bit+0x29>
DB 102,67,15,110,84,152,8 ; movd 0x8(%r8,%r11,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 243,67,15,126,36,152 ; movq (%r8,%r11,4),%xmm4
DB 102,15,58,14,212,15 ; pblendw $0xf,%xmm4,%xmm2
- DB 235,174 ; jmp 26a31 <_sk_load_8888_dst_sse41_8bit+0x29>
+ DB 235,174 ; jmp 26a1d <_sk_load_8888_dst_sse41_8bit+0x29>
DB 102,67,15,110,84,152,24 ; movd 0x18(%r8,%r11,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 102,67,15,58,34,92,152,20,1 ; pinsrd $0x1,0x14(%r8,%r11,4),%xmm3
DB 102,67,15,58,34,92,152,16,0 ; pinsrd $0x0,0x10(%r8,%r11,4),%xmm3
- DB 235,136 ; jmp 26a2b <_sk_load_8888_dst_sse41_8bit+0x23>
+ DB 235,136 ; jmp 26a17 <_sk_load_8888_dst_sse41_8bit+0x23>
DB 144 ; nop
DB 189,255,255,255,209 ; mov $0xd1ffffff,%ebp
DB 255 ; (bad)
@@ -36864,7 +36858,7 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 235,255 ; jmp 26ab9 <_sk_load_8888_dst_sse41_8bit+0xb1>
+ DB 235,255 ; jmp 26aa5 <_sk_load_8888_dst_sse41_8bit+0xb1>
DB 255 ; (bad)
DB 255 ; (bad)
DB 223,255 ; (bad)
@@ -36881,7 +36875,7 @@ _sk_store_8888_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 26aed <_sk_store_8888_sse41_8bit+0x2d>
+ DB 117,17 ; jne 26ad9 <_sk_store_8888_sse41_8bit+0x2d>
DB 243,67,15,127,4,152 ; movdqu %xmm0,(%r8,%r11,4)
DB 243,67,15,127,76,152,16 ; movdqu %xmm1,0x10(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36890,22 +36884,22 @@ _sk_store_8888_sse41_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 26ae9 <_sk_store_8888_sse41_8bit+0x29>
+ DB 119,236 ; ja 26ad5 <_sk_store_8888_sse41_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,68,0,0,0 ; lea 0x44(%rip),%r10 # 26b4c <_sk_store_8888_sse41_8bit+0x8c>
+ DB 76,141,21,68,0,0,0 ; lea 0x44(%rip),%r10 # 26b38 <_sk_store_8888_sse41_8bit+0x8c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,126,4,152 ; movd %xmm0,(%r8,%r11,4)
- DB 235,208 ; jmp 26ae9 <_sk_store_8888_sse41_8bit+0x29>
+ DB 235,208 ; jmp 26ad5 <_sk_store_8888_sse41_8bit+0x29>
DB 102,67,15,58,22,68,152,8,2 ; pextrd $0x2,%xmm0,0x8(%r8,%r11,4)
DB 102,67,15,214,4,152 ; movq %xmm0,(%r8,%r11,4)
- DB 235,191 ; jmp 26ae9 <_sk_store_8888_sse41_8bit+0x29>
+ DB 235,191 ; jmp 26ad5 <_sk_store_8888_sse41_8bit+0x29>
DB 102,67,15,58,22,76,152,24,2 ; pextrd $0x2,%xmm1,0x18(%r8,%r11,4)
DB 102,67,15,58,22,76,152,20,1 ; pextrd $0x1,%xmm1,0x14(%r8,%r11,4)
DB 102,67,15,126,76,152,16 ; movd %xmm1,0x10(%r8,%r11,4)
DB 243,67,15,127,4,152 ; movdqu %xmm0,(%r8,%r11,4)
- DB 235,158 ; jmp 26ae9 <_sk_store_8888_sse41_8bit+0x29>
+ DB 235,158 ; jmp 26ad5 <_sk_store_8888_sse41_8bit+0x29>
DB 144 ; nop
DB 197,255,255 ; (bad)
DB 255,214 ; callq *%rsi
@@ -36938,10 +36932,10 @@ _sk_load_bgra_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,35 ; jne 26ba7 <_sk_load_bgra_sse41_8bit+0x3f>
+ DB 117,35 ; jne 26b93 <_sk_load_bgra_sse41_8bit+0x3f>
DB 243,67,15,111,76,152,16 ; movdqu 0x10(%r8,%r11,4),%xmm1
DB 243,67,15,111,4,152 ; movdqu (%r8,%r11,4),%xmm0
- DB 102,15,111,37,23,112,0,0 ; movdqa 0x7017(%rip),%xmm4 # 2dbb0 <_sk_overlay_sse2_8bit+0x1644>
+ DB 102,15,111,37,43,112,0,0 ; movdqa 0x702b(%rip),%xmm4 # 2dbb0 <_sk_overlay_sse2_8bit+0x1658>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36952,24 +36946,24 @@ _sk_load_bgra_sse41_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,210 ; ja 26b91 <_sk_load_bgra_sse41_8bit+0x29>
+ DB 119,210 ; ja 26b7d <_sk_load_bgra_sse41_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,78,0,0,0 ; lea 0x4e(%rip),%r10 # 26c18 <_sk_load_bgra_sse41_8bit+0xb0>
+ DB 76,141,21,78,0,0,0 ; lea 0x4e(%rip),%r10 # 26c04 <_sk_load_bgra_sse41_8bit+0xb0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,110,4,152 ; movd (%r8,%r11,4),%xmm0
- DB 235,182 ; jmp 26b91 <_sk_load_bgra_sse41_8bit+0x29>
+ DB 235,182 ; jmp 26b7d <_sk_load_bgra_sse41_8bit+0x29>
DB 102,67,15,110,68,152,8 ; movd 0x8(%r8,%r11,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 243,67,15,126,36,152 ; movq (%r8,%r11,4),%xmm4
DB 102,15,58,14,196,15 ; pblendw $0xf,%xmm4,%xmm0
- DB 235,156 ; jmp 26b91 <_sk_load_bgra_sse41_8bit+0x29>
+ DB 235,156 ; jmp 26b7d <_sk_load_bgra_sse41_8bit+0x29>
DB 102,67,15,110,68,152,24 ; movd 0x18(%r8,%r11,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 102,67,15,58,34,76,152,20,1 ; pinsrd $0x1,0x14(%r8,%r11,4),%xmm1
DB 102,67,15,58,34,76,152,16,0 ; pinsrd $0x0,0x10(%r8,%r11,4),%xmm1
- DB 233,115,255,255,255 ; jmpq 26b8b <_sk_load_bgra_sse41_8bit+0x23>
+ DB 233,115,255,255,255 ; jmpq 26b77 <_sk_load_bgra_sse41_8bit+0x23>
DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -36982,7 +36976,7 @@ _sk_load_bgra_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,221 ; jmpq ffffffffde026c30 <_sk_overlay_sse2_8bit+0xffffffffddffa6c4>
+ DB 233,255,255,255,221 ; jmpq ffffffffde026c1c <_sk_overlay_sse2_8bit+0xffffffffddffa6c4>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -36997,10 +36991,10 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,35 ; jne 26c73 <_sk_load_bgra_dst_sse41_8bit+0x3f>
+ DB 117,35 ; jne 26c5f <_sk_load_bgra_dst_sse41_8bit+0x3f>
DB 243,67,15,111,92,152,16 ; movdqu 0x10(%r8,%r11,4),%xmm3
DB 243,67,15,111,20,152 ; movdqu (%r8,%r11,4),%xmm2
- DB 102,15,111,37,75,111,0,0 ; movdqa 0x6f4b(%rip),%xmm4 # 2dbb0 <_sk_overlay_sse2_8bit+0x1644>
+ DB 102,15,111,37,95,111,0,0 ; movdqa 0x6f5f(%rip),%xmm4 # 2dbb0 <_sk_overlay_sse2_8bit+0x1658>
DB 102,15,56,0,212 ; pshufb %xmm4,%xmm2
DB 102,15,56,0,220 ; pshufb %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -37011,24 +37005,24 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,210 ; ja 26c5d <_sk_load_bgra_dst_sse41_8bit+0x29>
+ DB 119,210 ; ja 26c49 <_sk_load_bgra_dst_sse41_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,78,0,0,0 ; lea 0x4e(%rip),%r10 # 26ce4 <_sk_load_bgra_dst_sse41_8bit+0xb0>
+ DB 76,141,21,78,0,0,0 ; lea 0x4e(%rip),%r10 # 26cd0 <_sk_load_bgra_dst_sse41_8bit+0xb0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,110,20,152 ; movd (%r8,%r11,4),%xmm2
- DB 235,182 ; jmp 26c5d <_sk_load_bgra_dst_sse41_8bit+0x29>
+ DB 235,182 ; jmp 26c49 <_sk_load_bgra_dst_sse41_8bit+0x29>
DB 102,67,15,110,84,152,8 ; movd 0x8(%r8,%r11,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 243,67,15,126,36,152 ; movq (%r8,%r11,4),%xmm4
DB 102,15,58,14,212,15 ; pblendw $0xf,%xmm4,%xmm2
- DB 235,156 ; jmp 26c5d <_sk_load_bgra_dst_sse41_8bit+0x29>
+ DB 235,156 ; jmp 26c49 <_sk_load_bgra_dst_sse41_8bit+0x29>
DB 102,67,15,110,84,152,24 ; movd 0x18(%r8,%r11,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 102,67,15,58,34,92,152,20,1 ; pinsrd $0x1,0x14(%r8,%r11,4),%xmm3
DB 102,67,15,58,34,92,152,16,0 ; pinsrd $0x0,0x10(%r8,%r11,4),%xmm3
- DB 233,115,255,255,255 ; jmpq 26c57 <_sk_load_bgra_dst_sse41_8bit+0x23>
+ DB 233,115,255,255,255 ; jmpq 26c43 <_sk_load_bgra_dst_sse41_8bit+0x23>
DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -37041,7 +37035,7 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,221 ; jmpq ffffffffde026cfc <_sk_overlay_sse2_8bit+0xffffffffddffa790>
+ DB 233,255,255,255,221 ; jmpq ffffffffde026ce8 <_sk_overlay_sse2_8bit+0xffffffffddffa790>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -37055,13 +37049,13 @@ _sk_store_bgra_sse41_8bit LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 102,15,111,53,145,110,0,0 ; movdqa 0x6e91(%rip),%xmm6 # 2dbb0 <_sk_overlay_sse2_8bit+0x1644>
+ DB 102,15,111,53,165,110,0,0 ; movdqa 0x6ea5(%rip),%xmm6 # 2dbb0 <_sk_overlay_sse2_8bit+0x1658>
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
DB 102,15,56,0,238 ; pshufb %xmm6,%xmm5
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,56,0,230 ; pshufb %xmm6,%xmm4
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 26d47 <_sk_store_bgra_sse41_8bit+0x47>
+ DB 117,17 ; jne 26d33 <_sk_store_bgra_sse41_8bit+0x47>
DB 243,67,15,127,36,152 ; movdqu %xmm4,(%r8,%r11,4)
DB 243,67,15,127,108,152,16 ; movdqu %xmm5,0x10(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -37070,22 +37064,22 @@ _sk_store_bgra_sse41_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 26d43 <_sk_store_bgra_sse41_8bit+0x43>
+ DB 119,236 ; ja 26d2f <_sk_store_bgra_sse41_8bit+0x43>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,70,0,0,0 ; lea 0x46(%rip),%r10 # 26da8 <_sk_store_bgra_sse41_8bit+0xa8>
+ DB 76,141,21,70,0,0,0 ; lea 0x46(%rip),%r10 # 26d94 <_sk_store_bgra_sse41_8bit+0xa8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,126,36,152 ; movd %xmm4,(%r8,%r11,4)
- DB 235,208 ; jmp 26d43 <_sk_store_bgra_sse41_8bit+0x43>
+ DB 235,208 ; jmp 26d2f <_sk_store_bgra_sse41_8bit+0x43>
DB 102,67,15,58,22,100,152,8,2 ; pextrd $0x2,%xmm4,0x8(%r8,%r11,4)
DB 102,67,15,214,36,152 ; movq %xmm4,(%r8,%r11,4)
- DB 235,191 ; jmp 26d43 <_sk_store_bgra_sse41_8bit+0x43>
+ DB 235,191 ; jmp 26d2f <_sk_store_bgra_sse41_8bit+0x43>
DB 102,67,15,58,22,108,152,24,2 ; pextrd $0x2,%xmm5,0x18(%r8,%r11,4)
DB 102,67,15,58,22,108,152,20,1 ; pextrd $0x1,%xmm5,0x14(%r8,%r11,4)
DB 102,67,15,126,108,152,16 ; movd %xmm5,0x10(%r8,%r11,4)
DB 243,67,15,127,36,152 ; movdqu %xmm4,(%r8,%r11,4)
- DB 235,158 ; jmp 26d43 <_sk_store_bgra_sse41_8bit+0x43>
+ DB 235,158 ; jmp 26d2f <_sk_store_bgra_sse41_8bit+0x43>
DB 15,31,0 ; nopl (%rax)
DB 195 ; retq
DB 255 ; (bad)
@@ -37120,19 +37114,19 @@ _sk_store_565_sse41_8bit LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 102,68,15,111,13,221,109,0,0 ; movdqa 0x6ddd(%rip),%xmm9 # 2dbc0 <_sk_overlay_sse2_8bit+0x1654>
+ DB 102,68,15,111,13,241,109,0,0 ; movdqa 0x6df1(%rip),%xmm9 # 2dbc0 <_sk_overlay_sse2_8bit+0x1668>
DB 102,68,15,111,193 ; movdqa %xmm1,%xmm8
DB 102,69,15,219,193 ; pand %xmm9,%xmm8
DB 102,68,15,219,200 ; pand %xmm0,%xmm9
DB 102,65,15,114,241,8 ; pslld $0x8,%xmm9
DB 102,65,15,114,240,8 ; pslld $0x8,%xmm8
- DB 102,15,111,37,202,109,0,0 ; movdqa 0x6dca(%rip),%xmm4 # 2dbd0 <_sk_overlay_sse2_8bit+0x1664>
+ DB 102,15,111,37,222,109,0,0 ; movdqa 0x6dde(%rip),%xmm4 # 2dbd0 <_sk_overlay_sse2_8bit+0x1678>
DB 102,15,111,249 ; movdqa %xmm1,%xmm7
DB 102,15,219,252 ; pand %xmm4,%xmm7
DB 102,15,219,224 ; pand %xmm0,%xmm4
DB 102,15,114,212,5 ; psrld $0x5,%xmm4
DB 102,15,114,215,5 ; psrld $0x5,%xmm7
- DB 102,15,111,53,188,109,0,0 ; movdqa 0x6dbc(%rip),%xmm6 # 2dbe0 <_sk_overlay_sse2_8bit+0x1674>
+ DB 102,15,111,53,208,109,0,0 ; movdqa 0x6dd0(%rip),%xmm6 # 2dbe0 <_sk_overlay_sse2_8bit+0x1688>
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 102,15,219,241 ; pand %xmm1,%xmm6
@@ -37142,12 +37136,12 @@ _sk_store_565_sse41_8bit LABEL PROC
DB 102,65,15,235,225 ; por %xmm9,%xmm4
DB 102,15,235,229 ; por %xmm5,%xmm4
DB 102,15,235,254 ; por %xmm6,%xmm7
- DB 102,15,111,45,156,109,0,0 ; movdqa 0x6d9c(%rip),%xmm5 # 2dbf0 <_sk_overlay_sse2_8bit+0x1684>
+ DB 102,15,111,45,176,109,0,0 ; movdqa 0x6db0(%rip),%xmm5 # 2dbf0 <_sk_overlay_sse2_8bit+0x1698>
DB 102,15,56,0,253 ; pshufb %xmm5,%xmm7
DB 102,15,56,0,229 ; pshufb %xmm5,%xmm4
DB 102,15,108,231 ; punpcklqdq %xmm7,%xmm4
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 26e71 <_sk_store_565_sse41_8bit+0xad>
+ DB 117,10 ; jne 26e5d <_sk_store_565_sse41_8bit+0xad>
DB 243,67,15,127,36,88 ; movdqu %xmm4,(%r8,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -37155,22 +37149,22 @@ _sk_store_565_sse41_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 26e6d <_sk_store_565_sse41_8bit+0xa9>
+ DB 119,236 ; ja 26e59 <_sk_store_565_sse41_8bit+0xa9>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,72,0,0,0 ; lea 0x48(%rip),%r10 # 26ed4 <_sk_store_565_sse41_8bit+0x110>
+ DB 76,141,21,72,0,0,0 ; lea 0x48(%rip),%r10 # 26ec0 <_sk_store_565_sse41_8bit+0x110>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,58,21,36,88,0 ; pextrw $0x0,%xmm4,(%r8,%r11,2)
- DB 235,206 ; jmp 26e6d <_sk_store_565_sse41_8bit+0xa9>
+ DB 235,206 ; jmp 26e59 <_sk_store_565_sse41_8bit+0xa9>
DB 102,67,15,58,21,100,88,4,2 ; pextrw $0x2,%xmm4,0x4(%r8,%r11,2)
DB 102,67,15,126,36,88 ; movd %xmm4,(%r8,%r11,2)
- DB 235,189 ; jmp 26e6d <_sk_store_565_sse41_8bit+0xa9>
+ DB 235,189 ; jmp 26e59 <_sk_store_565_sse41_8bit+0xa9>
DB 102,67,15,58,21,100,88,12,6 ; pextrw $0x6,%xmm4,0xc(%r8,%r11,2)
DB 102,67,15,58,21,100,88,10,5 ; pextrw $0x5,%xmm4,0xa(%r8,%r11,2)
DB 102,67,15,58,21,100,88,8,4 ; pextrw $0x4,%xmm4,0x8(%r8,%r11,2)
DB 102,67,15,214,36,88 ; movq %xmm4,(%r8,%r11,2)
- DB 235,154 ; jmp 26e6d <_sk_store_565_sse41_8bit+0xa9>
+ DB 235,154 ; jmp 26e59 <_sk_store_565_sse41_8bit+0xa9>
DB 144 ; nop
DB 193,255,255 ; sar $0xff,%edi
DB 255,212 ; callq *%rsp
@@ -37204,18 +37198,18 @@ _sk_load_565_dst_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,216,0,0,0 ; jne 26fe7 <_sk_load_565_dst_sse41_8bit+0xf7>
+ DB 15,133,216,0,0,0 ; jne 26fd3 <_sk_load_565_dst_sse41_8bit+0xf7>
DB 243,67,15,111,28,88 ; movdqu (%r8,%r11,2),%xmm3
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,211 ; pmovzxwd %xmm3,%xmm2
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
- DB 102,15,111,53,166,103,0,0 ; movdqa 0x67a6(%rip),%xmm6 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
+ DB 102,15,111,53,186,103,0,0 ; movdqa 0x67ba(%rip),%xmm6 # 2d6d0 <_sk_overlay_sse2_8bit+0x1178>
DB 102,15,111,250 ; movdqa %xmm2,%xmm7
DB 102,15,219,254 ; pand %xmm6,%xmm7
DB 102,15,219,243 ; pand %xmm3,%xmm6
DB 102,15,114,214,8 ; psrld $0x8,%xmm6
DB 102,15,114,215,8 ; psrld $0x8,%xmm7
- DB 102,15,111,45,200,103,0,0 ; movdqa 0x67c8(%rip),%xmm5 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
+ DB 102,15,111,45,220,103,0,0 ; movdqa 0x67dc(%rip),%xmm5 # 2d710 <_sk_overlay_sse2_8bit+0x11b8>
DB 102,15,111,226 ; movdqa %xmm2,%xmm4
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,15,219,235 ; pand %xmm3,%xmm5
@@ -37223,11 +37217,11 @@ _sk_load_565_dst_sse41_8bit LABEL PROC
DB 102,15,114,244,19 ; pslld $0x13,%xmm4
DB 102,15,235,231 ; por %xmm7,%xmm4
DB 102,15,235,238 ; por %xmm6,%xmm5
- DB 102,15,111,53,130,103,0,0 ; movdqa 0x6782(%rip),%xmm6 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
+ DB 102,15,111,53,150,103,0,0 ; movdqa 0x6796(%rip),%xmm6 # 2d6f0 <_sk_overlay_sse2_8bit+0x1198>
DB 102,15,111,251 ; movdqa %xmm3,%xmm7
DB 102,15,219,254 ; pand %xmm6,%xmm7
DB 102,15,114,247,5 ; pslld $0x5,%xmm7
- DB 102,68,15,111,5,140,108,0,0 ; movdqa 0x6c8c(%rip),%xmm8 # 2dc10 <_sk_overlay_sse2_8bit+0x16a4>
+ DB 102,68,15,111,5,160,108,0,0 ; movdqa 0x6ca0(%rip),%xmm8 # 2dc10 <_sk_overlay_sse2_8bit+0x16b8>
DB 102,65,15,219,216 ; pand %xmm8,%xmm3
DB 102,15,114,211,1 ; psrld $0x1,%xmm3
DB 102,15,235,223 ; por %xmm7,%xmm3
@@ -37240,10 +37234,10 @@ _sk_load_565_dst_sse41_8bit LABEL PROC
DB 102,15,235,214 ; por %xmm6,%xmm2
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,114,212,5 ; psrld $0x5,%xmm4
- DB 102,15,111,53,61,108,0,0 ; movdqa 0x6c3d(%rip),%xmm6 # 2dc00 <_sk_overlay_sse2_8bit+0x1694>
+ DB 102,15,111,53,81,108,0,0 ; movdqa 0x6c51(%rip),%xmm6 # 2dc00 <_sk_overlay_sse2_8bit+0x16a8>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 102,15,219,238 ; pand %xmm6,%xmm5
- DB 102,15,111,53,189,107,0,0 ; movdqa 0x6bbd(%rip),%xmm6 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
+ DB 102,15,111,53,209,107,0,0 ; movdqa 0x6bd1(%rip),%xmm6 # 2db90 <_sk_overlay_sse2_8bit+0x1638>
DB 102,15,235,214 ; por %xmm6,%xmm2
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,235,222 ; por %xmm6,%xmm3
@@ -37255,27 +37249,27 @@ _sk_load_565_dst_sse41_8bit LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,22,255,255,255 ; ja 26f15 <_sk_load_565_dst_sse41_8bit+0x25>
+ DB 15,135,22,255,255,255 ; ja 26f01 <_sk_load_565_dst_sse41_8bit+0x25>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,98,0,0,0 ; lea 0x62(%rip),%r10 # 2706c <_sk_load_565_dst_sse41_8bit+0x17c>
+ DB 76,141,21,98,0,0,0 ; lea 0x62(%rip),%r10 # 27058 <_sk_load_565_dst_sse41_8bit+0x17c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 233,244,254,255,255 ; jmpq 26f15 <_sk_load_565_dst_sse41_8bit+0x25>
+ DB 233,244,254,255,255 ; jmpq 26f01 <_sk_load_565_dst_sse41_8bit+0x25>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,67,15,196,92,88,4,2 ; pinsrw $0x2,0x4(%r8,%r11,2),%xmm3
DB 102,67,15,110,20,88 ; movd (%r8,%r11,2),%xmm2
DB 102,15,58,14,218,3 ; pblendw $0x3,%xmm2,%xmm3
- DB 233,215,254,255,255 ; jmpq 26f15 <_sk_load_565_dst_sse41_8bit+0x25>
+ DB 233,215,254,255,255 ; jmpq 26f01 <_sk_load_565_dst_sse41_8bit+0x25>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,67,15,196,92,88,12,6 ; pinsrw $0x6,0xc(%r8,%r11,2),%xmm3
DB 102,67,15,196,92,88,10,5 ; pinsrw $0x5,0xa(%r8,%r11,2),%xmm3
DB 102,67,15,196,92,88,8,4 ; pinsrw $0x4,0x8(%r8,%r11,2),%xmm3
DB 243,67,15,126,20,88 ; movq (%r8,%r11,2),%xmm2
DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3
- DB 233,170,254,255,255 ; jmpq 26f15 <_sk_load_565_dst_sse41_8bit+0x25>
+ DB 233,170,254,255,255 ; jmpq 26f01 <_sk_load_565_dst_sse41_8bit+0x25>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -37306,9 +37300,9 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,42 ; jne 270ca <_sk_load_a8_sse41_8bit+0x42>
+ DB 117,42 ; jne 270b6 <_sk_load_a8_sse41_8bit+0x42>
DB 102,67,15,56,48,12,24 ; pmovzxbw (%r8,%r11,1),%xmm1
- DB 102,15,219,13,161,99,0,0 ; pand 0x63a1(%rip),%xmm1 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,13,181,99,0,0 ; pand 0x63b5(%rip),%xmm1 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
@@ -37321,15 +37315,15 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,201 ; ja 270a7 <_sk_load_a8_sse41_8bit+0x1f>
+ DB 119,201 ; ja 27093 <_sk_load_a8_sse41_8bit+0x1f>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 27160 <_sk_load_a8_sse41_8bit+0xd8>
+ DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 2714c <_sk_load_a8_sse41_8bit+0xd8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 235,170 ; jmp 270a7 <_sk_load_a8_sse41_8bit+0x1f>
+ DB 235,170 ; jmp 27093 <_sk_load_a8_sse41_8bit+0x1f>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,2 ; pinsrw $0x2,%eax,%xmm1
@@ -37337,7 +37331,7 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,3 ; pblendw $0x3,%xmm0,%xmm1
- DB 235,133 ; jmp 270a7 <_sk_load_a8_sse41_8bit+0x1f>
+ DB 235,133 ; jmp 27093 <_sk_load_a8_sse41_8bit+0x1f>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,6 ; pinsrw $0x6,%eax,%xmm1
@@ -37348,7 +37342,7 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,67,15,110,4,24 ; movd (%r8,%r11,1),%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,15 ; pblendw $0xf,%xmm0,%xmm1
- DB 233,74,255,255,255 ; jmpq 270a7 <_sk_load_a8_sse41_8bit+0x1f>
+ DB 233,74,255,255,255 ; jmpq 27093 <_sk_load_a8_sse41_8bit+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
@@ -37378,9 +37372,9 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,42 ; jne 271be <_sk_load_a8_dst_sse41_8bit+0x42>
+ DB 117,42 ; jne 271aa <_sk_load_a8_dst_sse41_8bit+0x42>
DB 102,67,15,56,48,28,24 ; pmovzxbw (%r8,%r11,1),%xmm3
- DB 102,15,219,29,173,98,0,0 ; pand 0x62ad(%rip),%xmm3 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,29,193,98,0,0 ; pand 0x62c1(%rip),%xmm3 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,211 ; pmovzxwd %xmm3,%xmm2
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
@@ -37393,15 +37387,15 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,201 ; ja 2719b <_sk_load_a8_dst_sse41_8bit+0x1f>
+ DB 119,201 ; ja 27187 <_sk_load_a8_dst_sse41_8bit+0x1f>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 27254 <_sk_load_a8_dst_sse41_8bit+0xd8>
+ DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 27240 <_sk_load_a8_dst_sse41_8bit+0xd8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 235,170 ; jmp 2719b <_sk_load_a8_dst_sse41_8bit+0x1f>
+ DB 235,170 ; jmp 27187 <_sk_load_a8_dst_sse41_8bit+0x1f>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3
@@ -37409,7 +37403,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,3 ; pblendw $0x3,%xmm2,%xmm3
- DB 235,133 ; jmp 2719b <_sk_load_a8_dst_sse41_8bit+0x1f>
+ DB 235,133 ; jmp 27187 <_sk_load_a8_dst_sse41_8bit+0x1f>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,6 ; pinsrw $0x6,%eax,%xmm3
@@ -37420,7 +37414,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,67,15,110,20,24 ; movd (%r8,%r11,1),%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3
- DB 233,74,255,255,255 ; jmpq 2719b <_sk_load_a8_dst_sse41_8bit+0x1f>
+ DB 233,74,255,255,255 ; jmpq 27187 <_sk_load_a8_dst_sse41_8bit+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
@@ -37449,15 +37443,15 @@ _sk_store_a8_sse41_8bit LABEL PROC
DB 77,15,175,193 ; imul %r9,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 102,15,111,45,149,105,0,0 ; movdqa 0x6995(%rip),%xmm5 # 2dc20 <_sk_overlay_sse2_8bit+0x16b4>
+ DB 102,15,111,45,169,105,0,0 ; movdqa 0x69a9(%rip),%xmm5 # 2dc20 <_sk_overlay_sse2_8bit+0x16c8>
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,56,0,245 ; pshufb %xmm5,%xmm6
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,56,0,229 ; pshufb %xmm5,%xmm4
DB 102,15,108,230 ; punpcklqdq %xmm6,%xmm4
DB 72,133,255 ; test %rdi,%rdi
- DB 117,19 ; jne 272b9 <_sk_store_a8_sse41_8bit+0x49>
- DB 102,15,56,0,37,209,104,0,0 ; pshufb 0x68d1(%rip),%xmm4 # 2db80 <_sk_overlay_sse2_8bit+0x1614>
+ DB 117,19 ; jne 272a5 <_sk_store_a8_sse41_8bit+0x49>
+ DB 102,15,56,0,37,229,104,0,0 ; pshufb 0x68e5(%rip),%xmm4 # 2db80 <_sk_overlay_sse2_8bit+0x1628>
DB 102,67,15,214,36,24 ; movq %xmm4,(%r8,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -37465,24 +37459,24 @@ _sk_store_a8_sse41_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 272b5 <_sk_store_a8_sse41_8bit+0x45>
+ DB 119,236 ; ja 272a1 <_sk_store_a8_sse41_8bit+0x45>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,92,0,0,0 ; lea 0x5c(%rip),%r10 # 27330 <_sk_store_a8_sse41_8bit+0xc0>
+ DB 76,141,21,92,0,0,0 ; lea 0x5c(%rip),%r10 # 2731c <_sk_store_a8_sse41_8bit+0xc0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,58,20,36,24,0 ; pextrb $0x0,%xmm4,(%r8,%r11,1)
- DB 235,206 ; jmp 272b5 <_sk_store_a8_sse41_8bit+0x45>
+ DB 235,206 ; jmp 272a1 <_sk_store_a8_sse41_8bit+0x45>
DB 102,67,15,58,20,100,24,2,4 ; pextrb $0x4,%xmm4,0x2(%r8,%r11,1)
- DB 102,15,56,0,37,103,97,0,0 ; pshufb 0x6167(%rip),%xmm4 # 2d460 <_sk_overlay_sse2_8bit+0xef4>
+ DB 102,15,56,0,37,123,97,0,0 ; pshufb 0x617b(%rip),%xmm4 # 2d460 <_sk_overlay_sse2_8bit+0xf08>
DB 102,67,15,58,21,36,24,0 ; pextrw $0x0,%xmm4,(%r8,%r11,1)
- DB 235,178 ; jmp 272b5 <_sk_store_a8_sse41_8bit+0x45>
+ DB 235,178 ; jmp 272a1 <_sk_store_a8_sse41_8bit+0x45>
DB 102,67,15,58,20,100,24,6,12 ; pextrb $0xc,%xmm4,0x6(%r8,%r11,1)
DB 102,67,15,58,20,100,24,5,10 ; pextrb $0xa,%xmm4,0x5(%r8,%r11,1)
DB 102,67,15,58,20,100,24,4,8 ; pextrb $0x8,%xmm4,0x4(%r8,%r11,1)
- DB 102,15,56,0,37,73,97,0,0 ; pshufb 0x6149(%rip),%xmm4 # 2d470 <_sk_overlay_sse2_8bit+0xf04>
+ DB 102,15,56,0,37,93,97,0,0 ; pshufb 0x615d(%rip),%xmm4 # 2d470 <_sk_overlay_sse2_8bit+0xf18>
DB 102,67,15,126,36,24 ; movd %xmm4,(%r8,%r11,1)
- DB 235,134 ; jmp 272b5 <_sk_store_a8_sse41_8bit+0x45>
+ DB 235,134 ; jmp 272a1 <_sk_store_a8_sse41_8bit+0x45>
DB 144 ; nop
DB 173 ; lods %ds:(%rsi),%eax
DB 255 ; (bad)
@@ -37513,16 +37507,16 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,66 ; jne 273a6 <_sk_load_g8_sse41_8bit+0x5a>
+ DB 117,66 ; jne 27392 <_sk_load_g8_sse41_8bit+0x5a>
DB 102,67,15,56,48,12,24 ; pmovzxbw (%r8,%r11,1),%xmm1
- DB 102,15,219,13,221,96,0,0 ; pand 0x60dd(%rip),%xmm1 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,13,241,96,0,0 ; pand 0x60f1(%rip),%xmm1 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
- DB 102,15,111,37,168,104,0,0 ; movdqa 0x68a8(%rip),%xmm4 # 2dc30 <_sk_overlay_sse2_8bit+0x16c4>
+ DB 102,15,111,37,188,104,0,0 ; movdqa 0x68bc(%rip),%xmm4 # 2dc30 <_sk_overlay_sse2_8bit+0x16d8>
DB 102,15,56,64,204 ; pmulld %xmm4,%xmm1
DB 102,15,56,64,196 ; pmulld %xmm4,%xmm0
- DB 102,15,111,37,246,103,0,0 ; movdqa 0x67f6(%rip),%xmm4 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
+ DB 102,15,111,37,10,104,0,0 ; movdqa 0x680a(%rip),%xmm4 # 2db90 <_sk_overlay_sse2_8bit+0x1638>
DB 102,15,235,196 ; por %xmm4,%xmm0
DB 102,15,235,204 ; por %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -37532,15 +37526,15 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,177 ; ja 2736b <_sk_load_g8_sse41_8bit+0x1f>
+ DB 119,177 ; ja 27357 <_sk_load_g8_sse41_8bit+0x1f>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 2743c <_sk_load_g8_sse41_8bit+0xf0>
+ DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 27428 <_sk_load_g8_sse41_8bit+0xf0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 235,146 ; jmp 2736b <_sk_load_g8_sse41_8bit+0x1f>
+ DB 235,146 ; jmp 27357 <_sk_load_g8_sse41_8bit+0x1f>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,2 ; pinsrw $0x2,%eax,%xmm1
@@ -37548,7 +37542,7 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,3 ; pblendw $0x3,%xmm0,%xmm1
- DB 233,106,255,255,255 ; jmpq 2736b <_sk_load_g8_sse41_8bit+0x1f>
+ DB 233,106,255,255,255 ; jmpq 27357 <_sk_load_g8_sse41_8bit+0x1f>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,6 ; pinsrw $0x6,%eax,%xmm1
@@ -37559,7 +37553,7 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,67,15,110,4,24 ; movd (%r8,%r11,1),%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,15 ; pblendw $0xf,%xmm0,%xmm1
- DB 233,47,255,255,255 ; jmpq 2736b <_sk_load_g8_sse41_8bit+0x1f>
+ DB 233,47,255,255,255 ; jmpq 27357 <_sk_load_g8_sse41_8bit+0x1f>
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -37589,16 +37583,16 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,66 ; jne 274b2 <_sk_load_g8_dst_sse41_8bit+0x5a>
+ DB 117,66 ; jne 2749e <_sk_load_g8_dst_sse41_8bit+0x5a>
DB 102,67,15,56,48,28,24 ; pmovzxbw (%r8,%r11,1),%xmm3
- DB 102,15,219,29,209,95,0,0 ; pand 0x5fd1(%rip),%xmm3 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,29,229,95,0,0 ; pand 0x5fe5(%rip),%xmm3 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,211 ; pmovzxwd %xmm3,%xmm2
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
- DB 102,15,111,37,156,103,0,0 ; movdqa 0x679c(%rip),%xmm4 # 2dc30 <_sk_overlay_sse2_8bit+0x16c4>
+ DB 102,15,111,37,176,103,0,0 ; movdqa 0x67b0(%rip),%xmm4 # 2dc30 <_sk_overlay_sse2_8bit+0x16d8>
DB 102,15,56,64,220 ; pmulld %xmm4,%xmm3
DB 102,15,56,64,212 ; pmulld %xmm4,%xmm2
- DB 102,15,111,37,234,102,0,0 ; movdqa 0x66ea(%rip),%xmm4 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
+ DB 102,15,111,37,254,102,0,0 ; movdqa 0x66fe(%rip),%xmm4 # 2db90 <_sk_overlay_sse2_8bit+0x1638>
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,235,220 ; por %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -37608,15 +37602,15 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,177 ; ja 27477 <_sk_load_g8_dst_sse41_8bit+0x1f>
+ DB 119,177 ; ja 27463 <_sk_load_g8_dst_sse41_8bit+0x1f>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 27548 <_sk_load_g8_dst_sse41_8bit+0xf0>
+ DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 27534 <_sk_load_g8_dst_sse41_8bit+0xf0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 235,146 ; jmp 27477 <_sk_load_g8_dst_sse41_8bit+0x1f>
+ DB 235,146 ; jmp 27463 <_sk_load_g8_dst_sse41_8bit+0x1f>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3
@@ -37624,7 +37618,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,3 ; pblendw $0x3,%xmm2,%xmm3
- DB 233,106,255,255,255 ; jmpq 27477 <_sk_load_g8_dst_sse41_8bit+0x1f>
+ DB 233,106,255,255,255 ; jmpq 27463 <_sk_load_g8_dst_sse41_8bit+0x1f>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,6 ; pinsrw $0x6,%eax,%xmm3
@@ -37635,7 +37629,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,67,15,110,20,24 ; movd (%r8,%r11,1),%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3
- DB 233,47,255,255,255 ; jmpq 27477 <_sk_load_g8_dst_sse41_8bit+0x1f>
+ DB 233,47,255,255,255 ; jmpq 27463 <_sk_load_g8_dst_sse41_8bit+0x1f>
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -37666,11 +37660,11 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,206,0,0,0 ; jne 27652 <_sk_srcover_rgba_8888_sse41_8bit+0xee>
+ DB 15,133,206,0,0,0 ; jne 2763e <_sk_srcover_rgba_8888_sse41_8bit+0xee>
DB 243,71,15,111,68,152,16 ; movdqu 0x10(%r8,%r11,4),%xmm8
DB 243,71,15,111,12,152 ; movdqu (%r8,%r11,4),%xmm9
DB 72,133,255 ; test %rdi,%rdi
- DB 102,15,111,37,4,102,0,0 ; movdqa 0x6604(%rip),%xmm4 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,15,111,37,24,102,0,0 ; movdqa 0x6618(%rip),%xmm4 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,56,0,244 ; pshufb %xmm4,%xmm6
DB 102,15,111,248 ; movdqa %xmm0,%xmm7
@@ -37704,7 +37698,7 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 102,68,15,248,204 ; psubb %xmm4,%xmm9
DB 102,68,15,252,200 ; paddb %xmm0,%xmm9
DB 102,68,15,252,193 ; paddb %xmm1,%xmm8
- DB 117,78 ; jne 2768f <_sk_srcover_rgba_8888_sse41_8bit+0x12b>
+ DB 117,78 ; jne 2767b <_sk_srcover_rgba_8888_sse41_8bit+0x12b>
DB 243,71,15,127,12,152 ; movdqu %xmm9,(%r8,%r11,4)
DB 243,71,15,127,68,152,16 ; movdqu %xmm8,0x10(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -37715,44 +37709,44 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,33,255,255,255 ; ja 27591 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
+ DB 15,135,33,255,255,255 ; ja 2757d <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,189,0,0,0 ; lea 0xbd(%rip),%r10 # 27738 <_sk_srcover_rgba_8888_sse41_8bit+0x1d4>
+ DB 76,141,21,189,0,0,0 ; lea 0xbd(%rip),%r10 # 27724 <_sk_srcover_rgba_8888_sse41_8bit+0x1d4>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,71,15,110,12,152 ; movd (%r8,%r11,4),%xmm9
- DB 233,2,255,255,255 ; jmpq 27591 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
+ DB 233,2,255,255,255 ; jmpq 2757d <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,175 ; ja 2764e <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ DB 119,175 ; ja 2763a <_sk_srcover_rgba_8888_sse41_8bit+0xea>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 76,141,13,170,0,0,0 ; lea 0xaa(%rip),%r9 # 27754 <_sk_srcover_rgba_8888_sse41_8bit+0x1f0>
+ DB 76,141,13,170,0,0,0 ; lea 0xaa(%rip),%r9 # 27740 <_sk_srcover_rgba_8888_sse41_8bit+0x1f0>
DB 73,99,4,129 ; movslq (%r9,%rax,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
DB 102,71,15,126,12,152 ; movd %xmm9,(%r8,%r11,4)
- DB 235,147 ; jmp 2764e <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ DB 235,147 ; jmp 2763a <_sk_srcover_rgba_8888_sse41_8bit+0xea>
DB 102,67,15,110,100,152,8 ; movd 0x8(%r8,%r11,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 243,67,15,126,36,152 ; movq (%r8,%r11,4),%xmm4
DB 102,68,15,58,14,204,15 ; pblendw $0xf,%xmm4,%xmm9
- DB 233,183,254,255,255 ; jmpq 27591 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
+ DB 233,183,254,255,255 ; jmpq 2757d <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
DB 102,67,15,110,100,152,24 ; movd 0x18(%r8,%r11,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
DB 102,71,15,58,34,68,152,20,1 ; pinsrd $0x1,0x14(%r8,%r11,4),%xmm8
DB 102,71,15,58,34,68,152,16,0 ; pinsrd $0x0,0x10(%r8,%r11,4),%xmm8
- DB 233,141,254,255,255 ; jmpq 2758b <_sk_srcover_rgba_8888_sse41_8bit+0x27>
+ DB 233,141,254,255,255 ; jmpq 27577 <_sk_srcover_rgba_8888_sse41_8bit+0x27>
DB 102,71,15,58,22,76,152,8,2 ; pextrd $0x2,%xmm9,0x8(%r8,%r11,4)
DB 102,71,15,214,12,152 ; movq %xmm9,(%r8,%r11,4)
- DB 233,60,255,255,255 ; jmpq 2764e <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ DB 233,60,255,255,255 ; jmpq 2763a <_sk_srcover_rgba_8888_sse41_8bit+0xea>
DB 102,71,15,58,22,68,152,24,2 ; pextrd $0x2,%xmm8,0x18(%r8,%r11,4)
DB 102,71,15,58,22,68,152,20,1 ; pextrd $0x1,%xmm8,0x14(%r8,%r11,4)
DB 102,71,15,126,68,152,16 ; movd %xmm8,0x10(%r8,%r11,4)
DB 243,71,15,127,12,152 ; movdqu %xmm9,(%r8,%r11,4)
- DB 233,24,255,255,255 ; jmpq 2764e <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ DB 233,24,255,255,255 ; jmpq 2763a <_sk_srcover_rgba_8888_sse41_8bit+0xea>
DB 102,144 ; xchg %ax,%ax
DB 76,255 ; rex.WR (bad)
DB 255 ; (bad)
@@ -37792,7 +37786,7 @@ _sk_scale_1_float_sse41_8bit LABEL PROC
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,0 ; movss (%rax),%xmm0
- DB 243,15,89,5,130,82,0,0 ; mulss 0x5282(%rip),%xmm0 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 243,15,89,5,102,91,0,0 ; mulss 0x5b66(%rip),%xmm0 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 243,15,44,192 ; cvttss2si %xmm0,%eax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,68,15,56,48,197 ; pmovzxbw %xmm5,%xmm8
@@ -37800,7 +37794,7 @@ _sk_scale_1_float_sse41_8bit LABEL PROC
DB 102,68,15,56,48,204 ; pmovzxbw %xmm4,%xmm9
DB 102,15,104,224 ; punpckhbw %xmm0,%xmm4
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 102,15,56,0,53,146,100,0,0 ; pshufb 0x6492(%rip),%xmm6 # 2dc40 <_sk_overlay_sse2_8bit+0x16d4>
+ DB 102,15,56,0,53,166,100,0,0 ; pshufb 0x64a6(%rip),%xmm6 # 2dc40 <_sk_overlay_sse2_8bit+0x16e8>
DB 102,15,111,206 ; movdqa %xmm6,%xmm1
DB 102,65,15,213,201 ; pmullw %xmm9,%xmm1
DB 102,15,111,198 ; movdqa %xmm6,%xmm0
@@ -37830,13 +37824,13 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,160,0,0,0 ; jne 278ba <_sk_scale_u8_sse41_8bit+0xbc>
+ DB 15,133,160,0,0,0 ; jne 278a6 <_sk_scale_u8_sse41_8bit+0xbc>
DB 102,67,15,56,48,52,24 ; pmovzxbw (%r8,%r11,1),%xmm6
- DB 102,15,219,53,39,92,0,0 ; pand 0x5c27(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,53,59,92,0,0 ; pand 0x5c3b(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
- DB 102,15,56,0,61,21,100,0,0 ; pshufb 0x6415(%rip),%xmm7 # 2dc50 <_sk_overlay_sse2_8bit+0x16e4>
- DB 102,15,56,0,53,28,100,0,0 ; pshufb 0x641c(%rip),%xmm6 # 2dc60 <_sk_overlay_sse2_8bit+0x16f4>
+ DB 102,15,56,0,61,41,100,0,0 ; pshufb 0x6429(%rip),%xmm7 # 2dc50 <_sk_overlay_sse2_8bit+0x16f8>
+ DB 102,15,56,0,53,48,100,0,0 ; pshufb 0x6430(%rip),%xmm6 # 2dc60 <_sk_overlay_sse2_8bit+0x1708>
DB 102,68,15,56,48,200 ; pmovzxbw %xmm0,%xmm9
DB 102,65,15,104,192 ; punpckhbw %xmm8,%xmm0
DB 102,68,15,56,48,209 ; pmovzxbw %xmm1,%xmm10
@@ -37868,15 +37862,15 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,79,255,255,255 ; ja 27821 <_sk_scale_u8_sse41_8bit+0x23>
+ DB 15,135,79,255,255,255 ; ja 2780d <_sk_scale_u8_sse41_8bit+0x23>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,123,0,0,0 ; lea 0x7b(%rip),%r10 # 27958 <_sk_scale_u8_sse41_8bit+0x15a>
+ DB 76,141,21,123,0,0,0 ; lea 0x7b(%rip),%r10 # 27944 <_sk_scale_u8_sse41_8bit+0x15a>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,45,255,255,255 ; jmpq 27821 <_sk_scale_u8_sse41_8bit+0x23>
+ DB 233,45,255,255,255 ; jmpq 2780d <_sk_scale_u8_sse41_8bit+0x23>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,15,196,240,2 ; pinsrw $0x2,%eax,%xmm6
@@ -37884,7 +37878,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,56,48,228 ; pmovzxbw %xmm4,%xmm4
DB 102,15,58,14,244,3 ; pblendw $0x3,%xmm4,%xmm6
- DB 233,5,255,255,255 ; jmpq 27821 <_sk_scale_u8_sse41_8bit+0x23>
+ DB 233,5,255,255,255 ; jmpq 2780d <_sk_scale_u8_sse41_8bit+0x23>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,15,196,240,6 ; pinsrw $0x6,%eax,%xmm6
@@ -37895,7 +37889,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,67,15,110,36,24 ; movd (%r8,%r11,1),%xmm4
DB 102,15,56,48,228 ; pmovzxbw %xmm4,%xmm4
DB 102,15,58,14,244,15 ; pblendw $0xf,%xmm4,%xmm6
- DB 233,202,254,255,255 ; jmpq 27821 <_sk_scale_u8_sse41_8bit+0x23>
+ DB 233,202,254,255,255 ; jmpq 2780d <_sk_scale_u8_sse41_8bit+0x23>
DB 144 ; nop
DB 142,255 ; mov %edi,%?
DB 255 ; (bad)
@@ -37903,7 +37897,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf027968 <_sk_overlay_sse2_8bit+0xffffffffdeffb3fc>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf027954 <_sk_overlay_sse2_8bit+0xffffffffdeffb3fc>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -37918,7 +37912,7 @@ PUBLIC _sk_lerp_1_float_sse41_8bit
_sk_lerp_1_float_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,32 ; movss (%rax),%xmm4
- DB 243,15,89,37,134,80,0,0 ; mulss 0x5086(%rip),%xmm4 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 243,15,89,37,106,89,0,0 ; mulss 0x596a(%rip),%xmm4 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 243,15,44,196 ; cvttss2si %xmm4,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4
@@ -37929,7 +37923,7 @@ _sk_lerp_1_float_sse41_8bit LABEL PROC
DB 102,65,15,104,193 ; punpckhbw %xmm9,%xmm0
DB 102,68,15,56,48,217 ; pmovzxbw %xmm1,%xmm11
DB 102,65,15,104,201 ; punpckhbw %xmm9,%xmm1
- DB 102,15,56,0,61,179,98,0,0 ; pshufb 0x62b3(%rip),%xmm7 # 2dc70 <_sk_overlay_sse2_8bit+0x1704>
+ DB 102,15,56,0,61,199,98,0,0 ; pshufb 0x62c7(%rip),%xmm7 # 2dc70 <_sk_overlay_sse2_8bit+0x1718>
DB 102,68,15,111,231 ; movdqa %xmm7,%xmm12
DB 102,69,15,213,227 ; pmullw %xmm11,%xmm12
DB 102,68,15,111,239 ; movdqa %xmm7,%xmm13
@@ -37987,13 +37981,13 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,46,1,0,0 ; jne 27be0 <_sk_lerp_u8_sse41_8bit+0x14a>
+ DB 15,133,46,1,0,0 ; jne 27bcc <_sk_lerp_u8_sse41_8bit+0x14a>
DB 102,67,15,56,48,60,24 ; pmovzxbw (%r8,%r11,1),%xmm7
- DB 102,15,219,61,143,89,0,0 ; pand 0x598f(%rip),%xmm7 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,61,163,89,0,0 ; pand 0x59a3(%rip),%xmm7 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,125,97,0,0 ; pshufb 0x617d(%rip),%xmm6 # 2dc50 <_sk_overlay_sse2_8bit+0x16e4>
- DB 102,15,56,0,61,132,97,0,0 ; pshufb 0x6184(%rip),%xmm7 # 2dc60 <_sk_overlay_sse2_8bit+0x16f4>
+ DB 102,15,56,0,53,145,97,0,0 ; pshufb 0x6191(%rip),%xmm6 # 2dc50 <_sk_overlay_sse2_8bit+0x16f8>
+ DB 102,15,56,0,61,152,97,0,0 ; pshufb 0x6198(%rip),%xmm7 # 2dc60 <_sk_overlay_sse2_8bit+0x1708>
DB 102,68,15,56,48,200 ; pmovzxbw %xmm0,%xmm9
DB 102,65,15,104,192 ; punpckhbw %xmm8,%xmm0
DB 102,68,15,56,48,209 ; pmovzxbw %xmm1,%xmm10
@@ -38054,15 +38048,15 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,193,254,255,255 ; ja 27ab9 <_sk_lerp_u8_sse41_8bit+0x23>
+ DB 15,135,193,254,255,255 ; ja 27aa5 <_sk_lerp_u8_sse41_8bit+0x23>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,125,0,0,0 ; lea 0x7d(%rip),%r10 # 27c80 <_sk_lerp_u8_sse41_8bit+0x1ea>
+ DB 76,141,21,125,0,0,0 ; lea 0x7d(%rip),%r10 # 27c6c <_sk_lerp_u8_sse41_8bit+0x1ea>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,159,254,255,255 ; jmpq 27ab9 <_sk_lerp_u8_sse41_8bit+0x23>
+ DB 233,159,254,255,255 ; jmpq 27aa5 <_sk_lerp_u8_sse41_8bit+0x23>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 102,15,196,248,2 ; pinsrw $0x2,%eax,%xmm7
@@ -38070,7 +38064,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,48,237 ; pmovzxbw %xmm5,%xmm5
DB 102,15,58,14,253,3 ; pblendw $0x3,%xmm5,%xmm7
- DB 233,119,254,255,255 ; jmpq 27ab9 <_sk_lerp_u8_sse41_8bit+0x23>
+ DB 233,119,254,255,255 ; jmpq 27aa5 <_sk_lerp_u8_sse41_8bit+0x23>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 102,15,196,248,6 ; pinsrw $0x6,%eax,%xmm7
@@ -38081,7 +38075,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,67,15,110,44,24 ; movd (%r8,%r11,1),%xmm5
DB 102,15,56,48,237 ; pmovzxbw %xmm5,%xmm5
DB 102,15,58,14,253,15 ; pblendw $0xf,%xmm5,%xmm7
- DB 233,60,254,255,255 ; jmpq 27ab9 <_sk_lerp_u8_sse41_8bit+0x23>
+ DB 233,60,254,255,255 ; jmpq 27aa5 <_sk_lerp_u8_sse41_8bit+0x23>
DB 15,31,0 ; nopl (%rax)
DB 140,255 ; mov %?,%edi
DB 255 ; (bad)
@@ -38119,7 +38113,7 @@ _sk_move_dst_src_sse41_8bit LABEL PROC
PUBLIC _sk_black_color_sse41_8bit
_sk_black_color_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,215,94,0,0 ; movaps 0x5ed7(%rip),%xmm0 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
+ DB 15,40,5,235,94,0,0 ; movaps 0x5eeb(%rip),%xmm0 # 2db90 <_sk_overlay_sse2_8bit+0x1638>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 255,224 ; jmpq *%rax
@@ -38139,7 +38133,7 @@ _sk_clear_sse41_8bit LABEL PROC
PUBLIC _sk_srcatop_sse41_8bit
_sk_srcatop_sse41_8bit LABEL PROC
- DB 102,68,15,111,21,195,94,0,0 ; movdqa 0x5ec3(%rip),%xmm10 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,68,15,111,21,215,94,0,0 ; movdqa 0x5ed7(%rip),%xmm10 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,195 ; pmovzxbw %xmm3,%xmm8
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
@@ -38207,7 +38201,7 @@ _sk_srcatop_sse41_8bit LABEL PROC
PUBLIC _sk_dstatop_sse41_8bit
_sk_dstatop_sse41_8bit LABEL PROC
- DB 102,68,15,111,29,136,93,0,0 ; movdqa 0x5d88(%rip),%xmm11 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,68,15,111,29,156,93,0,0 ; movdqa 0x5d9c(%rip),%xmm11 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,69,15,56,0,235 ; pshufb %xmm11,%xmm13
DB 102,68,15,111,248 ; movdqa %xmm0,%xmm15
@@ -38277,7 +38271,7 @@ PUBLIC _sk_srcin_sse41_8bit
_sk_srcin_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,63,92,0,0 ; movdqa 0x5c3f(%rip),%xmm0 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,15,111,5,83,92,0,0 ; movdqa 0x5c53(%rip),%xmm0 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
DB 102,15,56,0,240 ; pshufb %xmm0,%xmm6
DB 102,15,111,250 ; movdqa %xmm2,%xmm7
@@ -38311,7 +38305,7 @@ _sk_srcin_sse41_8bit LABEL PROC
PUBLIC _sk_dstin_sse41_8bit
_sk_dstin_sse41_8bit LABEL PROC
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,174,91,0,0 ; movdqa 0x5bae(%rip),%xmm0 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,15,111,5,194,91,0,0 ; movdqa 0x5bc2(%rip),%xmm0 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,15,56,0,200 ; pshufb %xmm0,%xmm1
DB 102,15,56,0,232 ; pshufb %xmm0,%xmm5
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
@@ -38347,7 +38341,7 @@ PUBLIC _sk_srcout_sse41_8bit
_sk_srcout_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,21,91,0,0 ; movdqa 0x5b15(%rip),%xmm0 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,15,111,5,41,91,0,0 ; movdqa 0x5b29(%rip),%xmm0 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,15,111,250 ; movdqa %xmm2,%xmm7
DB 102,15,56,0,248 ; pshufb %xmm0,%xmm7
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -38383,7 +38377,7 @@ _sk_srcout_sse41_8bit LABEL PROC
PUBLIC _sk_dstout_sse41_8bit
_sk_dstout_sse41_8bit LABEL PROC
- DB 102,15,111,37,124,90,0,0 ; movdqa 0x5a7c(%rip),%xmm4 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,15,111,37,144,90,0,0 ; movdqa 0x5a90(%rip),%xmm4 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 102,15,118,228 ; pcmpeqd %xmm4,%xmm4
@@ -38421,7 +38415,7 @@ _sk_dstout_sse41_8bit LABEL PROC
PUBLIC _sk_srcover_sse41_8bit
_sk_srcover_sse41_8bit LABEL PROC
- DB 102,15,111,53,219,89,0,0 ; movdqa 0x59db(%rip),%xmm6 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,15,111,53,239,89,0,0 ; movdqa 0x59ef(%rip),%xmm6 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,68,15,111,217 ; movdqa %xmm1,%xmm11
DB 102,68,15,56,0,222 ; pshufb %xmm6,%xmm11
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
@@ -38460,7 +38454,7 @@ _sk_srcover_sse41_8bit LABEL PROC
PUBLIC _sk_dstover_sse41_8bit
_sk_dstover_sse41_8bit LABEL PROC
- DB 102,68,15,111,5,43,89,0,0 ; movdqa 0x592b(%rip),%xmm8 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,68,15,111,5,63,89,0,0 ; movdqa 0x593f(%rip),%xmm8 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,68,15,111,209 ; movdqa %xmm1,%xmm10
DB 102,68,15,56,48,201 ; pmovzxbw %xmm1,%xmm9
DB 102,15,252,203 ; paddb %xmm3,%xmm1
@@ -38535,7 +38529,7 @@ _sk_multiply_sse41_8bit LABEL PROC
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,68,15,111,53,233,87,0,0 ; movdqa 0x57e9(%rip),%xmm14 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,68,15,111,53,253,87,0,0 ; movdqa 0x57fd(%rip),%xmm14 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,68,15,111,195 ; movdqa %xmm3,%xmm8
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
DB 102,65,15,56,0,238 ; pshufb %xmm14,%xmm5
@@ -38660,7 +38654,7 @@ _sk_screen_sse41_8bit LABEL PROC
PUBLIC _sk_xor__sse41_8bit
_sk_xor__sse41_8bit LABEL PROC
- DB 102,68,15,111,21,167,85,0,0 ; movdqa 0x55a7(%rip),%xmm10 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,68,15,111,21,187,85,0,0 ; movdqa 0x55bb(%rip),%xmm10 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,68,15,111,226 ; movdqa %xmm2,%xmm12
DB 102,68,15,56,48,194 ; pmovzxbw %xmm2,%xmm8
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
@@ -38738,7 +38732,7 @@ _sk_plus__sse41_8bit LABEL PROC
PUBLIC _sk_darken_sse41_8bit
_sk_darken_sse41_8bit LABEL PROC
DB 102,68,15,111,240 ; movdqa %xmm0,%xmm14
- DB 102,68,15,111,5,78,84,0,0 ; movdqa 0x544e(%rip),%xmm8 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,68,15,111,5,98,84,0,0 ; movdqa 0x5462(%rip),%xmm8 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -38805,7 +38799,7 @@ _sk_darken_sse41_8bit LABEL PROC
DB 102,15,248,231 ; psubb %xmm7,%xmm4
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,68,15,248,245 ; psubb %xmm5,%xmm14
- DB 15,40,5,226,83,0,0 ; movaps 0x53e2(%rip),%xmm0 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
+ DB 15,40,5,246,83,0,0 ; movaps 0x53f6(%rip),%xmm0 # 2dc80 <_sk_overlay_sse2_8bit+0x1728>
DB 102,68,15,56,16,244 ; pblendvb %xmm0,%xmm4,%xmm14
DB 102,65,15,56,16,200 ; pblendvb %xmm0,%xmm8,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38815,7 +38809,7 @@ _sk_darken_sse41_8bit LABEL PROC
PUBLIC _sk_lighten_sse41_8bit
_sk_lighten_sse41_8bit LABEL PROC
DB 102,68,15,111,240 ; movdqa %xmm0,%xmm14
- DB 102,68,15,111,5,223,82,0,0 ; movdqa 0x52df(%rip),%xmm8 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,68,15,111,5,243,82,0,0 ; movdqa 0x52f3(%rip),%xmm8 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -38882,7 +38876,7 @@ _sk_lighten_sse41_8bit LABEL PROC
DB 102,15,248,231 ; psubb %xmm7,%xmm4
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,68,15,248,245 ; psubb %xmm5,%xmm14
- DB 15,40,5,115,82,0,0 ; movaps 0x5273(%rip),%xmm0 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
+ DB 15,40,5,135,82,0,0 ; movaps 0x5287(%rip),%xmm0 # 2dc80 <_sk_overlay_sse2_8bit+0x1728>
DB 102,68,15,56,16,244 ; pblendvb %xmm0,%xmm4,%xmm14
DB 102,65,15,56,16,200 ; pblendvb %xmm0,%xmm8,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38920,7 +38914,7 @@ _sk_exclusion_sse41_8bit LABEL PROC
DB 102,15,113,215,8 ; psrlw $0x8,%xmm7
DB 102,15,103,253 ; packuswb %xmm5,%xmm7
DB 102,15,103,230 ; packuswb %xmm6,%xmm4
- DB 102,15,111,45,201,81,0,0 ; movdqa 0x51c9(%rip),%xmm5 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
+ DB 102,15,111,45,221,81,0,0 ; movdqa 0x51dd(%rip),%xmm5 # 2dc80 <_sk_overlay_sse2_8bit+0x1728>
DB 102,15,248,204 ; psubb %xmm4,%xmm1
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,15,219,239 ; pand %xmm7,%xmm5
@@ -38933,7 +38927,7 @@ _sk_exclusion_sse41_8bit LABEL PROC
PUBLIC _sk_difference_sse41_8bit
_sk_difference_sse41_8bit LABEL PROC
DB 102,68,15,111,193 ; movdqa %xmm1,%xmm8
- DB 102,15,111,13,192,80,0,0 ; movdqa 0x50c0(%rip),%xmm1 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,15,111,13,212,80,0,0 ; movdqa 0x50d4(%rip),%xmm1 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -38971,7 +38965,7 @@ _sk_difference_sse41_8bit LABEL PROC
DB 102,15,113,214,8 ; psrlw $0x8,%xmm6
DB 102,15,113,215,8 ; psrlw $0x8,%xmm7
DB 102,15,103,254 ; packuswb %xmm6,%xmm7
- DB 102,15,111,37,5,80,0,0 ; movdqa 0x5005(%rip),%xmm4 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,15,111,37,25,80,0,0 ; movdqa 0x5019(%rip),%xmm4 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 102,15,56,0,236 ; pshufb %xmm4,%xmm5
DB 102,69,15,104,236 ; punpckhbw %xmm12,%xmm13
@@ -38996,7 +38990,7 @@ _sk_difference_sse41_8bit LABEL PROC
DB 102,15,103,241 ; packuswb %xmm1,%xmm6
DB 102,65,15,218,230 ; pminub %xmm14,%xmm4
DB 102,15,218,247 ; pminub %xmm7,%xmm6
- DB 102,15,111,13,104,80,0,0 ; movdqa 0x5068(%rip),%xmm1 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
+ DB 102,15,111,13,124,80,0,0 ; movdqa 0x507c(%rip),%xmm1 # 2dc80 <_sk_overlay_sse2_8bit+0x1728>
DB 102,68,15,248,198 ; psubb %xmm6,%xmm8
DB 102,15,219,241 ; pand %xmm1,%xmm6
DB 102,15,219,204 ; pand %xmm4,%xmm1
@@ -39022,7 +39016,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,15,127,12,36 ; movdqa %xmm1,(%rsp)
DB 102,69,15,56,48,221 ; pmovzxbw %xmm13,%xmm11
DB 102,68,15,127,156,36,176,0,0,0 ; movdqa %xmm11,0xb0(%rsp)
- DB 102,15,111,13,22,79,0,0 ; movdqa 0x4f16(%rip),%xmm1 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,15,111,13,42,79,0,0 ; movdqa 0x4f2a(%rip),%xmm1 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,68,15,56,0,241 ; pshufb %xmm1,%xmm14
DB 102,68,15,56,0,233 ; pshufb %xmm1,%xmm13
DB 102,69,15,56,48,197 ; pmovzxbw %xmm13,%xmm8
@@ -39072,7 +39066,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,65,15,56,58,247 ; pminuw %xmm15,%xmm6
DB 102,15,117,240 ; pcmpeqw %xmm0,%xmm6
DB 102,15,127,180,36,192,0,0,0 ; movdqa %xmm6,0xc0(%rsp)
- DB 102,15,111,53,190,70,0,0 ; movdqa 0x46be(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,111,53,210,70,0,0 ; movdqa 0x46d2(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,15,213,196 ; pmullw %xmm4,%xmm0
@@ -39183,7 +39177,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,15,253,180,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm6
DB 102,68,15,253,68,36,32 ; paddw 0x20(%rsp),%xmm8
DB 102,15,253,60,36 ; paddw (%rsp),%xmm7
- DB 102,15,111,5,171,76,0,0 ; movdqa 0x4cab(%rip),%xmm0 # 2dc90 <_sk_overlay_sse2_8bit+0x1724>
+ DB 102,15,111,5,191,76,0,0 ; movdqa 0x4cbf(%rip),%xmm0 # 2dc90 <_sk_overlay_sse2_8bit+0x1738>
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
DB 102,68,15,253,219 ; paddw %xmm3,%xmm11
DB 102,15,253,240 ; paddw %xmm0,%xmm6
@@ -39192,7 +39186,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,68,15,253,196 ; paddw %xmm4,%xmm8
DB 102,15,253,248 ; paddw %xmm0,%xmm7
DB 102,15,253,250 ; paddw %xmm2,%xmm7
- DB 102,15,111,5,143,76,0,0 ; movdqa 0x4c8f(%rip),%xmm0 # 2dca0 <_sk_overlay_sse2_8bit+0x1734>
+ DB 102,15,111,5,163,76,0,0 ; movdqa 0x4ca3(%rip),%xmm0 # 2dca0 <_sk_overlay_sse2_8bit+0x1748>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
DB 102,15,228,248 ; pmulhuw %xmm0,%xmm7
@@ -39225,7 +39219,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,15,127,12,36 ; movdqa %xmm1,(%rsp)
DB 102,65,15,56,48,206 ; pmovzxbw %xmm14,%xmm1
DB 102,15,127,140,36,16,1,0,0 ; movdqa %xmm1,0x110(%rsp)
- DB 102,15,111,13,246,74,0,0 ; movdqa 0x4af6(%rip),%xmm1 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
+ DB 102,15,111,13,10,75,0,0 ; movdqa 0x4b0a(%rip),%xmm1 # 2dba0 <_sk_overlay_sse2_8bit+0x1648>
DB 102,68,15,56,0,249 ; pshufb %xmm1,%xmm15
DB 102,68,15,56,0,241 ; pshufb %xmm1,%xmm14
DB 102,65,15,56,48,238 ; pmovzxbw %xmm14,%xmm5
@@ -39277,7 +39271,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,65,15,56,58,221 ; pminuw %xmm13,%xmm3
DB 102,15,117,216 ; pcmpeqw %xmm0,%xmm3
DB 102,15,127,156,36,176,0,0,0 ; movdqa %xmm3,0xb0(%rsp)
- DB 102,15,111,53,137,66,0,0 ; movdqa 0x4289(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,111,53,157,66,0,0 ; movdqa 0x429d(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,15,213,196 ; pmullw %xmm4,%xmm0
@@ -39386,7 +39380,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,15,253,180,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm6
DB 102,68,15,253,132,36,128,0,0,0 ; paddw 0x80(%rsp),%xmm8
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
- DB 102,15,111,5,133,72,0,0 ; movdqa 0x4885(%rip),%xmm0 # 2dc90 <_sk_overlay_sse2_8bit+0x1724>
+ DB 102,15,111,5,153,72,0,0 ; movdqa 0x4899(%rip),%xmm0 # 2dc90 <_sk_overlay_sse2_8bit+0x1738>
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
DB 102,69,15,253,217 ; paddw %xmm9,%xmm11
DB 102,15,253,240 ; paddw %xmm0,%xmm6
@@ -39395,7 +39389,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,68,15,253,195 ; paddw %xmm3,%xmm8
DB 102,15,253,232 ; paddw %xmm0,%xmm5
DB 102,15,253,234 ; paddw %xmm2,%xmm5
- DB 102,15,111,5,105,72,0,0 ; movdqa 0x4869(%rip),%xmm0 # 2dca0 <_sk_overlay_sse2_8bit+0x1734>
+ DB 102,15,111,5,125,72,0,0 ; movdqa 0x487d(%rip),%xmm0 # 2dca0 <_sk_overlay_sse2_8bit+0x1748>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
@@ -39445,13 +39439,13 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,101 ; jae 2956e <_sk_start_pipeline_sse2_8bit+0xe2>
+ DB 115,101 ; jae 2955a <_sk_start_pipeline_sse2_8bit+0xe2>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,8 ; lea 0x8(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
- DB 119,38 ; ja 29551 <_sk_start_pipeline_sse2_8bit+0xc5>
+ DB 119,38 ; ja 2953d <_sk_start_pipeline_sse2_8bit+0xc5>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 49,255 ; xor %edi,%edi
DB 76,137,246 ; mov %r14,%rsi
@@ -39462,16 +39456,16 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 73,131,196,16 ; add $0x10,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,225 ; jbe 29532 <_sk_start_pipeline_sse2_8bit+0xa6>
+ DB 118,225 ; jbe 2951e <_sk_start_pipeline_sse2_8bit+0xa6>
DB 76,137,255 ; mov %r15,%rdi
DB 72,41,215 ; sub %rdx,%rdi
- DB 116,9 ; je 29562 <_sk_start_pipeline_sse2_8bit+0xd6>
+ DB 116,9 ; je 2954e <_sk_start_pipeline_sse2_8bit+0xd6>
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,173 ; jne 2951b <_sk_start_pipeline_sse2_8bit+0x8f>
+ DB 117,173 ; jne 29507 <_sk_start_pipeline_sse2_8bit+0x8f>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -39509,7 +39503,7 @@ _sk_uniform_color_sse2_8bit LABEL PROC
PUBLIC _sk_set_rgb_sse2_8bit
_sk_set_rgb_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,37,37,52,0,0 ; movss 0x3425(%rip),%xmm4 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 243,15,16,37,9,61,0,0 ; movss 0x3d09(%rip),%xmm4 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 243,15,16,40 ; movss (%rax),%xmm5
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 243,76,15,44,197 ; cvttss2si %xmm5,%r8
@@ -39524,7 +39518,7 @@ _sk_set_rgb_sse2_8bit LABEL PROC
DB 68,9,200 ; or %r9d,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
- DB 102,15,111,45,106,69,0,0 ; movdqa 0x456a(%rip),%xmm5 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
+ DB 102,15,111,45,126,69,0,0 ; movdqa 0x457e(%rip),%xmm5 # 2db90 <_sk_overlay_sse2_8bit+0x1638>
DB 102,15,219,205 ; pand %xmm5,%xmm1
DB 102,15,219,197 ; pand %xmm5,%xmm0
DB 102,15,235,196 ; por %xmm4,%xmm0
@@ -39547,7 +39541,7 @@ _sk_premul_sse2_8bit LABEL PROC
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 242,15,112,192,95 ; pshuflw $0x5f,%xmm0,%xmm0
DB 243,15,112,248,95 ; pshufhw $0x5f,%xmm0,%xmm7
- DB 102,15,111,5,14,69,0,0 ; movdqa 0x450e(%rip),%xmm0 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
+ DB 102,15,111,5,34,69,0,0 ; movdqa 0x4522(%rip),%xmm0 # 2db90 <_sk_overlay_sse2_8bit+0x1638>
DB 102,15,235,248 ; por %xmm0,%xmm7
DB 102,15,235,240 ; por %xmm0,%xmm6
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
@@ -39621,7 +39615,7 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,16 ; jne 2979d <_sk_load_8888_sse2_8bit+0x2c>
+ DB 117,16 ; jne 29789 <_sk_load_8888_sse2_8bit+0x2c>
DB 67,15,16,76,152,16 ; movups 0x10(%r8,%r11,4),%xmm1
DB 102,67,15,16,4,152 ; movupd (%r8,%r11,4),%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39632,18 +39626,18 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,228 ; ja 29799 <_sk_load_8888_sse2_8bit+0x28>
+ DB 119,228 ; ja 29785 <_sk_load_8888_sse2_8bit+0x28>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,80,0,0,0 ; lea 0x50(%rip),%r10 # 29810 <_sk_load_8888_sse2_8bit+0x9f>
+ DB 76,141,21,80,0,0,0 ; lea 0x50(%rip),%r10 # 297fc <_sk_load_8888_sse2_8bit+0x9f>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 243,67,15,16,4,152 ; movss (%r8,%r11,4),%xmm0
- DB 235,200 ; jmp 29799 <_sk_load_8888_sse2_8bit+0x28>
+ DB 235,200 ; jmp 29785 <_sk_load_8888_sse2_8bit+0x28>
DB 102,67,15,110,68,152,8 ; movd 0x8(%r8,%r11,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 102,67,15,18,4,152 ; movlpd (%r8,%r11,4),%xmm0
- DB 235,180 ; jmp 29799 <_sk_load_8888_sse2_8bit+0x28>
+ DB 235,180 ; jmp 29785 <_sk_load_8888_sse2_8bit+0x28>
DB 102,67,15,110,68,152,24 ; movd 0x18(%r8,%r11,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 243,67,15,16,68,152,20 ; movss 0x14(%r8,%r11,4),%xmm0
@@ -39652,7 +39646,7 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 243,67,15,16,68,152,16 ; movss 0x10(%r8,%r11,4),%xmm0
DB 243,15,16,200 ; movss %xmm0,%xmm1
- DB 235,131 ; jmp 29793 <_sk_load_8888_sse2_8bit+0x22>
+ DB 235,131 ; jmp 2977f <_sk_load_8888_sse2_8bit+0x22>
DB 185,255,255,255,205 ; mov $0xcdffffff,%ecx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -39680,7 +39674,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,16 ; jne 29858 <_sk_load_8888_dst_sse2_8bit+0x2c>
+ DB 117,16 ; jne 29844 <_sk_load_8888_dst_sse2_8bit+0x2c>
DB 67,15,16,92,152,16 ; movups 0x10(%r8,%r11,4),%xmm3
DB 102,67,15,16,20,152 ; movupd (%r8,%r11,4),%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39691,18 +39685,18 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,228 ; ja 29854 <_sk_load_8888_dst_sse2_8bit+0x28>
+ DB 119,228 ; ja 29840 <_sk_load_8888_dst_sse2_8bit+0x28>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,81,0,0,0 ; lea 0x51(%rip),%r10 # 298cc <_sk_load_8888_dst_sse2_8bit+0xa0>
+ DB 76,141,21,81,0,0,0 ; lea 0x51(%rip),%r10 # 298b8 <_sk_load_8888_dst_sse2_8bit+0xa0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 243,67,15,16,20,152 ; movss (%r8,%r11,4),%xmm2
- DB 235,200 ; jmp 29854 <_sk_load_8888_dst_sse2_8bit+0x28>
+ DB 235,200 ; jmp 29840 <_sk_load_8888_dst_sse2_8bit+0x28>
DB 102,67,15,110,84,152,8 ; movd 0x8(%r8,%r11,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,67,15,18,20,152 ; movlpd (%r8,%r11,4),%xmm2
- DB 235,180 ; jmp 29854 <_sk_load_8888_dst_sse2_8bit+0x28>
+ DB 235,180 ; jmp 29840 <_sk_load_8888_dst_sse2_8bit+0x28>
DB 102,67,15,110,84,152,24 ; movd 0x18(%r8,%r11,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 243,67,15,16,84,152,20 ; movss 0x14(%r8,%r11,4),%xmm2
@@ -39711,7 +39705,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 243,67,15,16,84,152,16 ; movss 0x10(%r8,%r11,4),%xmm2
DB 243,15,16,218 ; movss %xmm2,%xmm3
- DB 235,131 ; jmp 2984e <_sk_load_8888_dst_sse2_8bit+0x22>
+ DB 235,131 ; jmp 2983a <_sk_load_8888_dst_sse2_8bit+0x22>
DB 144 ; nop
DB 184,255,255,255,204 ; mov $0xccffffff,%eax
DB 255 ; (bad)
@@ -39740,7 +39734,7 @@ _sk_store_8888_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 29915 <_sk_store_8888_sse2_8bit+0x2d>
+ DB 117,17 ; jne 29901 <_sk_store_8888_sse2_8bit+0x2d>
DB 243,67,15,127,4,152 ; movdqu %xmm0,(%r8,%r11,4)
DB 243,67,15,127,76,152,16 ; movdqu %xmm1,0x10(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39749,25 +39743,25 @@ _sk_store_8888_sse2_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 29911 <_sk_store_8888_sse2_8bit+0x29>
+ DB 119,236 ; ja 298fd <_sk_store_8888_sse2_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,76,0,0,0 ; lea 0x4c(%rip),%r10 # 2997c <_sk_store_8888_sse2_8bit+0x94>
+ DB 76,141,21,76,0,0,0 ; lea 0x4c(%rip),%r10 # 29968 <_sk_store_8888_sse2_8bit+0x94>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,126,4,152 ; movd %xmm0,(%r8,%r11,4)
- DB 235,208 ; jmp 29911 <_sk_store_8888_sse2_8bit+0x29>
+ DB 235,208 ; jmp 298fd <_sk_store_8888_sse2_8bit+0x29>
DB 102,15,112,224,78 ; pshufd $0x4e,%xmm0,%xmm4
DB 102,67,15,126,100,152,8 ; movd %xmm4,0x8(%r8,%r11,4)
DB 102,67,15,214,4,152 ; movq %xmm0,(%r8,%r11,4)
- DB 235,188 ; jmp 29911 <_sk_store_8888_sse2_8bit+0x29>
+ DB 235,188 ; jmp 298fd <_sk_store_8888_sse2_8bit+0x29>
DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
DB 102,67,15,126,100,152,24 ; movd %xmm4,0x18(%r8,%r11,4)
DB 102,15,112,225,229 ; pshufd $0xe5,%xmm1,%xmm4
DB 102,67,15,126,100,152,20 ; movd %xmm4,0x14(%r8,%r11,4)
DB 102,67,15,126,76,152,16 ; movd %xmm1,0x10(%r8,%r11,4)
DB 243,67,15,127,4,152 ; movdqu %xmm0,(%r8,%r11,4)
- DB 235,149 ; jmp 29911 <_sk_store_8888_sse2_8bit+0x29>
+ DB 235,149 ; jmp 298fd <_sk_store_8888_sse2_8bit+0x29>
DB 189,255,255,255,209 ; mov $0xd1ffffff,%ebp
DB 255 ; (bad)
DB 255 ; (bad)
@@ -39799,7 +39793,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,92 ; jne 29a10 <_sk_load_bgra_sse2_8bit+0x78>
+ DB 117,92 ; jne 299fc <_sk_load_bgra_sse2_8bit+0x78>
DB 67,15,16,76,152,16 ; movups 0x10(%r8,%r11,4),%xmm1
DB 102,67,15,16,4,152 ; movupd (%r8,%r11,4),%xmm0
DB 102,15,239,228 ; pxor %xmm4,%xmm4
@@ -39827,18 +39821,18 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,152 ; ja 299c0 <_sk_load_bgra_sse2_8bit+0x28>
+ DB 119,152 ; ja 299ac <_sk_load_bgra_sse2_8bit+0x28>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,89,0,0,0 ; lea 0x59(%rip),%r10 # 29a8c <_sk_load_bgra_sse2_8bit+0xf4>
+ DB 76,141,21,89,0,0,0 ; lea 0x59(%rip),%r10 # 29a78 <_sk_load_bgra_sse2_8bit+0xf4>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 243,67,15,16,4,152 ; movss (%r8,%r11,4),%xmm0
- DB 233,121,255,255,255 ; jmpq 299c0 <_sk_load_bgra_sse2_8bit+0x28>
+ DB 233,121,255,255,255 ; jmpq 299ac <_sk_load_bgra_sse2_8bit+0x28>
DB 102,67,15,110,68,152,8 ; movd 0x8(%r8,%r11,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 102,67,15,18,4,152 ; movlpd (%r8,%r11,4),%xmm0
- DB 233,98,255,255,255 ; jmpq 299c0 <_sk_load_bgra_sse2_8bit+0x28>
+ DB 233,98,255,255,255 ; jmpq 299ac <_sk_load_bgra_sse2_8bit+0x28>
DB 102,67,15,110,68,152,24 ; movd 0x18(%r8,%r11,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 243,67,15,16,68,152,20 ; movss 0x14(%r8,%r11,4),%xmm0
@@ -39847,7 +39841,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 243,67,15,16,68,152,16 ; movss 0x10(%r8,%r11,4),%xmm0
DB 243,15,16,200 ; movss %xmm0,%xmm1
- DB 233,46,255,255,255 ; jmpq 299ba <_sk_load_bgra_sse2_8bit+0x22>
+ DB 233,46,255,255,255 ; jmpq 299a6 <_sk_load_bgra_sse2_8bit+0x22>
DB 176,255 ; mov $0xff,%al
DB 255 ; (bad)
DB 255,199 ; inc %edi
@@ -39878,7 +39872,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,92 ; jne 29b20 <_sk_load_bgra_dst_sse2_8bit+0x78>
+ DB 117,92 ; jne 29b0c <_sk_load_bgra_dst_sse2_8bit+0x78>
DB 67,15,16,92,152,16 ; movups 0x10(%r8,%r11,4),%xmm3
DB 102,67,15,16,20,152 ; movupd (%r8,%r11,4),%xmm2
DB 102,15,239,228 ; pxor %xmm4,%xmm4
@@ -39906,18 +39900,18 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,152 ; ja 29ad0 <_sk_load_bgra_dst_sse2_8bit+0x28>
+ DB 119,152 ; ja 29abc <_sk_load_bgra_dst_sse2_8bit+0x28>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,89,0,0,0 ; lea 0x59(%rip),%r10 # 29b9c <_sk_load_bgra_dst_sse2_8bit+0xf4>
+ DB 76,141,21,89,0,0,0 ; lea 0x59(%rip),%r10 # 29b88 <_sk_load_bgra_dst_sse2_8bit+0xf4>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 243,67,15,16,20,152 ; movss (%r8,%r11,4),%xmm2
- DB 233,121,255,255,255 ; jmpq 29ad0 <_sk_load_bgra_dst_sse2_8bit+0x28>
+ DB 233,121,255,255,255 ; jmpq 29abc <_sk_load_bgra_dst_sse2_8bit+0x28>
DB 102,67,15,110,84,152,8 ; movd 0x8(%r8,%r11,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,67,15,18,20,152 ; movlpd (%r8,%r11,4),%xmm2
- DB 233,98,255,255,255 ; jmpq 29ad0 <_sk_load_bgra_dst_sse2_8bit+0x28>
+ DB 233,98,255,255,255 ; jmpq 29abc <_sk_load_bgra_dst_sse2_8bit+0x28>
DB 102,67,15,110,84,152,24 ; movd 0x18(%r8,%r11,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 243,67,15,16,84,152,20 ; movss 0x14(%r8,%r11,4),%xmm2
@@ -39926,7 +39920,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 243,67,15,16,84,152,16 ; movss 0x10(%r8,%r11,4),%xmm2
DB 243,15,16,218 ; movss %xmm2,%xmm3
- DB 233,46,255,255,255 ; jmpq 29aca <_sk_load_bgra_dst_sse2_8bit+0x22>
+ DB 233,46,255,255,255 ; jmpq 29ab6 <_sk_load_bgra_dst_sse2_8bit+0x22>
DB 176,255 ; mov $0xff,%al
DB 255 ; (bad)
DB 255,199 ; inc %edi
@@ -39976,7 +39970,7 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 243,15,112,237,198 ; pshufhw $0xc6,%xmm5,%xmm5
DB 102,15,103,238 ; packuswb %xmm6,%xmm5
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 29c39 <_sk_store_bgra_sse2_8bit+0x81>
+ DB 117,17 ; jne 29c25 <_sk_store_bgra_sse2_8bit+0x81>
DB 243,67,15,127,44,152 ; movdqu %xmm5,(%r8,%r11,4)
DB 243,67,15,127,100,152,16 ; movdqu %xmm4,0x10(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39985,25 +39979,25 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 29c35 <_sk_store_bgra_sse2_8bit+0x7d>
+ DB 119,236 ; ja 29c21 <_sk_store_bgra_sse2_8bit+0x7d>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,76,0,0,0 ; lea 0x4c(%rip),%r10 # 29ca0 <_sk_store_bgra_sse2_8bit+0xe8>
+ DB 76,141,21,76,0,0,0 ; lea 0x4c(%rip),%r10 # 29c8c <_sk_store_bgra_sse2_8bit+0xe8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,126,44,152 ; movd %xmm5,(%r8,%r11,4)
- DB 235,208 ; jmp 29c35 <_sk_store_bgra_sse2_8bit+0x7d>
+ DB 235,208 ; jmp 29c21 <_sk_store_bgra_sse2_8bit+0x7d>
DB 102,15,112,229,78 ; pshufd $0x4e,%xmm5,%xmm4
DB 102,67,15,126,100,152,8 ; movd %xmm4,0x8(%r8,%r11,4)
DB 102,67,15,214,44,152 ; movq %xmm5,(%r8,%r11,4)
- DB 235,188 ; jmp 29c35 <_sk_store_bgra_sse2_8bit+0x7d>
+ DB 235,188 ; jmp 29c21 <_sk_store_bgra_sse2_8bit+0x7d>
DB 102,15,112,244,78 ; pshufd $0x4e,%xmm4,%xmm6
DB 102,67,15,126,116,152,24 ; movd %xmm6,0x18(%r8,%r11,4)
DB 102,15,112,244,229 ; pshufd $0xe5,%xmm4,%xmm6
DB 102,67,15,126,116,152,20 ; movd %xmm6,0x14(%r8,%r11,4)
DB 102,67,15,126,100,152,16 ; movd %xmm4,0x10(%r8,%r11,4)
DB 243,67,15,127,44,152 ; movdqu %xmm5,(%r8,%r11,4)
- DB 235,149 ; jmp 29c35 <_sk_store_bgra_sse2_8bit+0x7d>
+ DB 235,149 ; jmp 29c21 <_sk_store_bgra_sse2_8bit+0x7d>
DB 189,255,255,255,209 ; mov $0xd1ffffff,%ebp
DB 255 ; (bad)
DB 255 ; (bad)
@@ -40034,19 +40028,19 @@ _sk_store_565_sse2_8bit LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 102,68,15,111,13,229,62,0,0 ; movdqa 0x3ee5(%rip),%xmm9 # 2dbc0 <_sk_overlay_sse2_8bit+0x1654>
+ DB 102,68,15,111,13,249,62,0,0 ; movdqa 0x3ef9(%rip),%xmm9 # 2dbc0 <_sk_overlay_sse2_8bit+0x1668>
DB 102,68,15,111,193 ; movdqa %xmm1,%xmm8
DB 102,69,15,219,193 ; pand %xmm9,%xmm8
DB 102,68,15,219,200 ; pand %xmm0,%xmm9
DB 102,65,15,114,241,8 ; pslld $0x8,%xmm9
DB 102,65,15,114,240,8 ; pslld $0x8,%xmm8
- DB 102,15,111,37,210,62,0,0 ; movdqa 0x3ed2(%rip),%xmm4 # 2dbd0 <_sk_overlay_sse2_8bit+0x1664>
+ DB 102,15,111,37,230,62,0,0 ; movdqa 0x3ee6(%rip),%xmm4 # 2dbd0 <_sk_overlay_sse2_8bit+0x1678>
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,219,224 ; pand %xmm0,%xmm4
DB 102,15,114,212,5 ; psrld $0x5,%xmm4
DB 102,15,114,213,5 ; psrld $0x5,%xmm5
- DB 102,15,111,61,196,62,0,0 ; movdqa 0x3ec4(%rip),%xmm7 # 2dbe0 <_sk_overlay_sse2_8bit+0x1674>
+ DB 102,15,111,61,216,62,0,0 ; movdqa 0x3ed8(%rip),%xmm7 # 2dbe0 <_sk_overlay_sse2_8bit+0x1688>
DB 102,15,111,240 ; movdqa %xmm0,%xmm6
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 102,15,219,249 ; pand %xmm1,%xmm7
@@ -40062,7 +40056,7 @@ _sk_store_565_sse2_8bit LABEL PROC
DB 102,15,114,228,16 ; psrad $0x10,%xmm4
DB 102,15,107,229 ; packssdw %xmm5,%xmm4
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 29d6b <_sk_store_565_sse2_8bit+0xaf>
+ DB 117,10 ; jne 29d57 <_sk_store_565_sse2_8bit+0xaf>
DB 243,67,15,127,36,88 ; movdqu %xmm4,(%r8,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -40070,19 +40064,19 @@ _sk_store_565_sse2_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 29d67 <_sk_store_565_sse2_8bit+0xab>
+ DB 119,236 ; ja 29d53 <_sk_store_565_sse2_8bit+0xab>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,82,0,0,0 ; lea 0x52(%rip),%r10 # 29dd8 <_sk_store_565_sse2_8bit+0x11c>
+ DB 76,141,21,82,0,0,0 ; lea 0x52(%rip),%r10 # 29dc4 <_sk_store_565_sse2_8bit+0x11c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,15,126,224 ; movd %xmm4,%eax
DB 102,67,137,4,88 ; mov %ax,(%r8,%r11,2)
- DB 235,205 ; jmp 29d67 <_sk_store_565_sse2_8bit+0xab>
+ DB 235,205 ; jmp 29d53 <_sk_store_565_sse2_8bit+0xab>
DB 102,15,197,196,2 ; pextrw $0x2,%xmm4,%eax
DB 102,67,137,68,88,4 ; mov %ax,0x4(%r8,%r11,2)
DB 102,67,15,126,36,88 ; movd %xmm4,(%r8,%r11,2)
- DB 235,186 ; jmp 29d67 <_sk_store_565_sse2_8bit+0xab>
+ DB 235,186 ; jmp 29d53 <_sk_store_565_sse2_8bit+0xab>
DB 102,15,197,196,6 ; pextrw $0x6,%xmm4,%eax
DB 102,67,137,68,88,12 ; mov %ax,0xc(%r8,%r11,2)
DB 102,15,197,196,5 ; pextrw $0x5,%xmm4,%eax
@@ -40090,7 +40084,7 @@ _sk_store_565_sse2_8bit LABEL PROC
DB 102,15,197,196,4 ; pextrw $0x4,%xmm4,%eax
DB 102,67,137,68,88,8 ; mov %ax,0x8(%r8,%r11,2)
DB 102,67,15,214,36,88 ; movq %xmm4,(%r8,%r11,2)
- DB 235,145 ; jmp 29d67 <_sk_store_565_sse2_8bit+0xab>
+ DB 235,145 ; jmp 29d53 <_sk_store_565_sse2_8bit+0xab>
DB 102,144 ; xchg %ax,%ax
DB 183,255 ; mov $0xff,%bh
DB 255 ; (bad)
@@ -40104,7 +40098,7 @@ _sk_store_565_sse2_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 235,255 ; jmp 29de9 <_sk_store_565_sse2_8bit+0x12d>
+ DB 235,255 ; jmp 29dd5 <_sk_store_565_sse2_8bit+0x12d>
DB 255 ; (bad)
DB 255,224 ; jmpq *%rax
DB 255 ; (bad)
@@ -40124,19 +40118,19 @@ _sk_load_565_dst_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,219,0,0,0 ; jne 29eee <_sk_load_565_dst_sse2_8bit+0xfa>
+ DB 15,133,219,0,0,0 ; jne 29eda <_sk_load_565_dst_sse2_8bit+0xfa>
DB 243,67,15,111,20,88 ; movdqu (%r8,%r11,2),%xmm2
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
DB 102,15,97,212 ; punpcklwd %xmm4,%xmm2
- DB 102,15,111,53,159,56,0,0 ; movdqa 0x389f(%rip),%xmm6 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
+ DB 102,15,111,53,179,56,0,0 ; movdqa 0x38b3(%rip),%xmm6 # 2d6d0 <_sk_overlay_sse2_8bit+0x1178>
DB 102,15,111,250 ; movdqa %xmm2,%xmm7
DB 102,15,219,254 ; pand %xmm6,%xmm7
DB 102,15,219,243 ; pand %xmm3,%xmm6
DB 102,15,114,214,8 ; psrld $0x8,%xmm6
DB 102,15,114,215,8 ; psrld $0x8,%xmm7
- DB 102,15,111,45,193,56,0,0 ; movdqa 0x38c1(%rip),%xmm5 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
+ DB 102,15,111,45,213,56,0,0 ; movdqa 0x38d5(%rip),%xmm5 # 2d710 <_sk_overlay_sse2_8bit+0x11b8>
DB 102,15,111,226 ; movdqa %xmm2,%xmm4
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,15,219,235 ; pand %xmm3,%xmm5
@@ -40144,11 +40138,11 @@ _sk_load_565_dst_sse2_8bit LABEL PROC
DB 102,15,114,244,19 ; pslld $0x13,%xmm4
DB 102,15,235,231 ; por %xmm7,%xmm4
DB 102,15,235,238 ; por %xmm6,%xmm5
- DB 102,15,111,53,123,56,0,0 ; movdqa 0x387b(%rip),%xmm6 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
+ DB 102,15,111,53,143,56,0,0 ; movdqa 0x388f(%rip),%xmm6 # 2d6f0 <_sk_overlay_sse2_8bit+0x1198>
DB 102,15,111,251 ; movdqa %xmm3,%xmm7
DB 102,15,219,254 ; pand %xmm6,%xmm7
DB 102,15,114,247,5 ; pslld $0x5,%xmm7
- DB 102,68,15,111,5,133,61,0,0 ; movdqa 0x3d85(%rip),%xmm8 # 2dc10 <_sk_overlay_sse2_8bit+0x16a4>
+ DB 102,68,15,111,5,153,61,0,0 ; movdqa 0x3d99(%rip),%xmm8 # 2dc10 <_sk_overlay_sse2_8bit+0x16b8>
DB 102,65,15,219,216 ; pand %xmm8,%xmm3
DB 102,15,114,211,1 ; psrld $0x1,%xmm3
DB 102,15,235,223 ; por %xmm7,%xmm3
@@ -40161,10 +40155,10 @@ _sk_load_565_dst_sse2_8bit LABEL PROC
DB 102,15,235,214 ; por %xmm6,%xmm2
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,114,212,5 ; psrld $0x5,%xmm4
- DB 102,15,111,53,54,61,0,0 ; movdqa 0x3d36(%rip),%xmm6 # 2dc00 <_sk_overlay_sse2_8bit+0x1694>
+ DB 102,15,111,53,74,61,0,0 ; movdqa 0x3d4a(%rip),%xmm6 # 2dc00 <_sk_overlay_sse2_8bit+0x16a8>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 102,15,219,238 ; pand %xmm6,%xmm5
- DB 102,15,111,53,182,60,0,0 ; movdqa 0x3cb6(%rip),%xmm6 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
+ DB 102,15,111,53,202,60,0,0 ; movdqa 0x3cca(%rip),%xmm6 # 2db90 <_sk_overlay_sse2_8bit+0x1638>
DB 102,15,235,214 ; por %xmm6,%xmm2
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,235,222 ; por %xmm6,%xmm3
@@ -40176,26 +40170,26 @@ _sk_load_565_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,19,255,255,255 ; ja 29e19 <_sk_load_565_dst_sse2_8bit+0x25>
+ DB 15,135,19,255,255,255 ; ja 29e05 <_sk_load_565_dst_sse2_8bit+0x25>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,91,0,0,0 ; lea 0x5b(%rip),%r10 # 29f6c <_sk_load_565_dst_sse2_8bit+0x178>
+ DB 76,141,21,91,0,0,0 ; lea 0x5b(%rip),%r10 # 29f58 <_sk_load_565_dst_sse2_8bit+0x178>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,241,254,255,255 ; jmpq 29e19 <_sk_load_565_dst_sse2_8bit+0x25>
+ DB 233,241,254,255,255 ; jmpq 29e05 <_sk_load_565_dst_sse2_8bit+0x25>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,67,15,196,84,88,4,2 ; pinsrw $0x2,0x4(%r8,%r11,2),%xmm2
DB 243,67,15,16,28,88 ; movss (%r8,%r11,2),%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 233,214,254,255,255 ; jmpq 29e19 <_sk_load_565_dst_sse2_8bit+0x25>
+ DB 233,214,254,255,255 ; jmpq 29e05 <_sk_load_565_dst_sse2_8bit+0x25>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,67,15,196,84,88,12,6 ; pinsrw $0x6,0xc(%r8,%r11,2),%xmm2
DB 102,67,15,196,84,88,10,5 ; pinsrw $0x5,0xa(%r8,%r11,2),%xmm2
DB 102,67,15,196,84,88,8,4 ; pinsrw $0x4,0x8(%r8,%r11,2),%xmm2
DB 102,67,15,18,20,88 ; movlpd (%r8,%r11,2),%xmm2
- DB 233,175,254,255,255 ; jmpq 29e19 <_sk_load_565_dst_sse2_8bit+0x25>
+ DB 233,175,254,255,255 ; jmpq 29e05 <_sk_load_565_dst_sse2_8bit+0x25>
DB 102,144 ; xchg %ax,%ax
DB 174 ; scas %es:(%rdi),%al
DB 255 ; (bad)
@@ -40208,7 +40202,7 @@ _sk_load_565_dst_sse2_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 235,255 ; jmp 29f7d <_sk_load_565_dst_sse2_8bit+0x189>
+ DB 235,255 ; jmp 29f69 <_sk_load_565_dst_sse2_8bit+0x189>
DB 255 ; (bad)
DB 255,227 ; jmpq *%rbx
DB 255 ; (bad)
@@ -40227,10 +40221,10 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,48 ; jne 29fd0 <_sk_load_a8_sse2_8bit+0x48>
+ DB 117,48 ; jne 29fbc <_sk_load_a8_sse2_8bit+0x48>
DB 243,67,15,126,4,24 ; movq (%r8,%r11,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
- DB 102,15,219,5,158,52,0,0 ; pand 0x349e(%rip),%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,5,178,52,0,0 ; pand 0x34b2(%rip),%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
@@ -40244,15 +40238,15 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,198 ; ja 29faa <_sk_load_a8_sse2_8bit+0x22>
+ DB 119,198 ; ja 29f96 <_sk_load_a8_sse2_8bit+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,113,0,0,0 ; lea 0x71(%rip),%r10 # 2a060 <_sk_load_a8_sse2_8bit+0xd8>
+ DB 76,141,21,113,0,0,0 ; lea 0x71(%rip),%r10 # 2a04c <_sk_load_a8_sse2_8bit+0xd8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,167 ; jmp 29faa <_sk_load_a8_sse2_8bit+0x22>
+ DB 235,167 ; jmp 29f96 <_sk_load_a8_sse2_8bit+0x22>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0
@@ -40260,7 +40254,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 235,133 ; jmp 29faa <_sk_load_a8_sse2_8bit+0x22>
+ DB 235,133 ; jmp 29f96 <_sk_load_a8_sse2_8bit+0x22>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,6 ; pinsrw $0x6,%eax,%xmm0
@@ -40271,7 +40265,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,67,15,110,12,24 ; movd (%r8,%r11,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 233,77,255,255,255 ; jmpq 29faa <_sk_load_a8_sse2_8bit+0x22>
+ DB 233,77,255,255,255 ; jmpq 29f96 <_sk_load_a8_sse2_8bit+0x22>
DB 15,31,0 ; nopl (%rax)
DB 152 ; cwtl
DB 255 ; (bad)
@@ -40303,10 +40297,10 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,48 ; jne 2a0c4 <_sk_load_a8_dst_sse2_8bit+0x48>
+ DB 117,48 ; jne 2a0b0 <_sk_load_a8_dst_sse2_8bit+0x48>
DB 243,67,15,126,20,24 ; movq (%r8,%r11,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
- DB 102,15,219,21,170,51,0,0 ; pand 0x33aa(%rip),%xmm2 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,21,190,51,0,0 ; pand 0x33be(%rip),%xmm2 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
@@ -40320,15 +40314,15 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,198 ; ja 2a09e <_sk_load_a8_dst_sse2_8bit+0x22>
+ DB 119,198 ; ja 2a08a <_sk_load_a8_dst_sse2_8bit+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,113,0,0,0 ; lea 0x71(%rip),%r10 # 2a154 <_sk_load_a8_dst_sse2_8bit+0xd8>
+ DB 76,141,21,113,0,0,0 ; lea 0x71(%rip),%r10 # 2a140 <_sk_load_a8_dst_sse2_8bit+0xd8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 235,167 ; jmp 2a09e <_sk_load_a8_dst_sse2_8bit+0x22>
+ DB 235,167 ; jmp 2a08a <_sk_load_a8_dst_sse2_8bit+0x22>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,2 ; pinsrw $0x2,%eax,%xmm2
@@ -40336,7 +40330,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,110,216 ; movd %eax,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 235,133 ; jmp 2a09e <_sk_load_a8_dst_sse2_8bit+0x22>
+ DB 235,133 ; jmp 2a08a <_sk_load_a8_dst_sse2_8bit+0x22>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,6 ; pinsrw $0x6,%eax,%xmm2
@@ -40347,7 +40341,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,67,15,110,28,24 ; movd (%r8,%r11,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,77,255,255,255 ; jmpq 2a09e <_sk_load_a8_dst_sse2_8bit+0x22>
+ DB 233,77,255,255,255 ; jmpq 2a08a <_sk_load_a8_dst_sse2_8bit+0x22>
DB 15,31,0 ; nopl (%rax)
DB 152 ; cwtl
DB 255 ; (bad)
@@ -40389,8 +40383,8 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,114,228,16 ; psrad $0x10,%xmm4
DB 102,15,107,229 ; packssdw %xmm5,%xmm4
DB 72,133,255 ; test %rdi,%rdi
- DB 117,26 ; jne 2a1d0 <_sk_store_a8_sse2_8bit+0x60>
- DB 102,15,219,37,146,50,0,0 ; pand 0x3292(%rip),%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 117,26 ; jne 2a1bc <_sk_store_a8_sse2_8bit+0x60>
+ DB 102,15,219,37,166,50,0,0 ; pand 0x32a6(%rip),%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,67,15,214,36,24 ; movq %xmm4,(%r8,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -40400,24 +40394,24 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,232 ; ja 2a1c8 <_sk_store_a8_sse2_8bit+0x58>
+ DB 119,232 ; ja 2a1b4 <_sk_store_a8_sse2_8bit+0x58>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,133,0,0,0 ; lea 0x85(%rip),%r10 # 2a270 <_sk_store_a8_sse2_8bit+0x100>
+ DB 76,141,21,133,0,0,0 ; lea 0x85(%rip),%r10 # 2a25c <_sk_store_a8_sse2_8bit+0x100>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,15,127,100,36,64 ; movdqa %xmm4,0x40(%rsp)
DB 138,68,36,64 ; mov 0x40(%rsp),%al
DB 67,136,4,24 ; mov %al,(%r8,%r11,1)
- DB 235,196 ; jmp 2a1c8 <_sk_store_a8_sse2_8bit+0x58>
+ DB 235,196 ; jmp 2a1b4 <_sk_store_a8_sse2_8bit+0x58>
DB 102,15,127,100,36,48 ; movdqa %xmm4,0x30(%rsp)
DB 138,68,36,52 ; mov 0x34(%rsp),%al
DB 67,136,68,24,2 ; mov %al,0x2(%r8,%r11,1)
- DB 102,15,219,37,53,50,0,0 ; pand 0x3235(%rip),%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,37,73,50,0,0 ; pand 0x3249(%rip),%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,126,224 ; movd %xmm4,%eax
DB 102,67,137,4,24 ; mov %ax,(%r8,%r11,1)
- DB 235,158 ; jmp 2a1c8 <_sk_store_a8_sse2_8bit+0x58>
+ DB 235,158 ; jmp 2a1b4 <_sk_store_a8_sse2_8bit+0x58>
DB 102,15,127,100,36,32 ; movdqa %xmm4,0x20(%rsp)
DB 138,68,36,44 ; mov 0x2c(%rsp),%al
DB 67,136,68,24,6 ; mov %al,0x6(%r8,%r11,1)
@@ -40427,10 +40421,10 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,127,36,36 ; movdqa %xmm4,(%rsp)
DB 138,68,36,8 ; mov 0x8(%rsp),%al
DB 67,136,68,24,4 ; mov %al,0x4(%r8,%r11,1)
- DB 102,15,219,37,242,49,0,0 ; pand 0x31f2(%rip),%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,37,6,50,0,0 ; pand 0x3206(%rip),%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,67,15,126,36,24 ; movd %xmm4,(%r8,%r11,1)
- DB 233,91,255,255,255 ; jmpq 2a1c8 <_sk_store_a8_sse2_8bit+0x58>
+ DB 233,91,255,255,255 ; jmpq 2a1b4 <_sk_store_a8_sse2_8bit+0x58>
DB 15,31,0 ; nopl (%rax)
DB 132,255 ; test %bh,%bh
DB 255 ; (bad)
@@ -40461,15 +40455,15 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,116 ; jne 2a318 <_sk_load_g8_sse2_8bit+0x8c>
+ DB 117,116 ; jne 2a304 <_sk_load_g8_sse2_8bit+0x8c>
DB 243,67,15,126,4,24 ; movq (%r8,%r11,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
- DB 102,15,219,5,154,49,0,0 ; pand 0x319a(%rip),%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,5,174,49,0,0 ; pand 0x31ae(%rip),%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4
DB 102,15,105,193 ; punpckhwd %xmm1,%xmm0
- DB 102,15,111,45,98,57,0,0 ; movdqa 0x3962(%rip),%xmm5 # 2dc30 <_sk_overlay_sse2_8bit+0x16c4>
+ DB 102,15,111,45,118,57,0,0 ; movdqa 0x3976(%rip),%xmm5 # 2dc30 <_sk_overlay_sse2_8bit+0x16d8>
DB 102,15,112,240,245 ; pshufd $0xf5,%xmm0,%xmm6
DB 102,15,244,197 ; pmuludq %xmm5,%xmm0
DB 102,15,112,200,232 ; pshufd $0xe8,%xmm0,%xmm1
@@ -40482,7 +40476,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,244,245 ; pmuludq %xmm5,%xmm6
DB 102,15,112,230,232 ; pshufd $0xe8,%xmm6,%xmm4
DB 102,15,98,196 ; punpckldq %xmm4,%xmm0
- DB 102,15,111,37,132,56,0,0 ; movdqa 0x3884(%rip),%xmm4 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
+ DB 102,15,111,37,152,56,0,0 ; movdqa 0x3898(%rip),%xmm4 # 2db90 <_sk_overlay_sse2_8bit+0x1638>
DB 102,15,235,196 ; por %xmm4,%xmm0
DB 102,15,235,204 ; por %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -40492,15 +40486,15 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,130 ; ja 2a2ae <_sk_load_g8_sse2_8bit+0x22>
+ DB 119,130 ; ja 2a29a <_sk_load_g8_sse2_8bit+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,117,0,0,0 ; lea 0x75(%rip),%r10 # 2a3ac <_sk_load_g8_sse2_8bit+0x120>
+ DB 76,141,21,117,0,0,0 ; lea 0x75(%rip),%r10 # 2a398 <_sk_load_g8_sse2_8bit+0x120>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 233,96,255,255,255 ; jmpq 2a2ae <_sk_load_g8_sse2_8bit+0x22>
+ DB 233,96,255,255,255 ; jmpq 2a29a <_sk_load_g8_sse2_8bit+0x22>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0
@@ -40508,7 +40502,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 233,59,255,255,255 ; jmpq 2a2ae <_sk_load_g8_sse2_8bit+0x22>
+ DB 233,59,255,255,255 ; jmpq 2a29a <_sk_load_g8_sse2_8bit+0x22>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,6 ; pinsrw $0x6,%eax,%xmm0
@@ -40519,7 +40513,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,67,15,110,12,24 ; movd (%r8,%r11,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 233,3,255,255,255 ; jmpq 2a2ae <_sk_load_g8_sse2_8bit+0x22>
+ DB 233,3,255,255,255 ; jmpq 2a29a <_sk_load_g8_sse2_8bit+0x22>
DB 144 ; nop
DB 148 ; xchg %eax,%esp
DB 255 ; (bad)
@@ -40551,15 +40545,15 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,116 ; jne 2a454 <_sk_load_g8_dst_sse2_8bit+0x8c>
+ DB 117,116 ; jne 2a440 <_sk_load_g8_dst_sse2_8bit+0x8c>
DB 243,67,15,126,20,24 ; movq (%r8,%r11,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
- DB 102,15,219,21,94,48,0,0 ; pand 0x305e(%rip),%xmm2 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,21,114,48,0,0 ; pand 0x3072(%rip),%xmm2 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,111,226 ; movdqa %xmm2,%xmm4
DB 102,15,97,227 ; punpcklwd %xmm3,%xmm4
DB 102,15,105,211 ; punpckhwd %xmm3,%xmm2
- DB 102,15,111,45,38,56,0,0 ; movdqa 0x3826(%rip),%xmm5 # 2dc30 <_sk_overlay_sse2_8bit+0x16c4>
+ DB 102,15,111,45,58,56,0,0 ; movdqa 0x383a(%rip),%xmm5 # 2dc30 <_sk_overlay_sse2_8bit+0x16d8>
DB 102,15,112,242,245 ; pshufd $0xf5,%xmm2,%xmm6
DB 102,15,244,213 ; pmuludq %xmm5,%xmm2
DB 102,15,112,218,232 ; pshufd $0xe8,%xmm2,%xmm3
@@ -40572,7 +40566,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,244,245 ; pmuludq %xmm5,%xmm6
DB 102,15,112,230,232 ; pshufd $0xe8,%xmm6,%xmm4
DB 102,15,98,212 ; punpckldq %xmm4,%xmm2
- DB 102,15,111,37,72,55,0,0 ; movdqa 0x3748(%rip),%xmm4 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
+ DB 102,15,111,37,92,55,0,0 ; movdqa 0x375c(%rip),%xmm4 # 2db90 <_sk_overlay_sse2_8bit+0x1638>
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,235,220 ; por %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -40582,15 +40576,15 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,130 ; ja 2a3ea <_sk_load_g8_dst_sse2_8bit+0x22>
+ DB 119,130 ; ja 2a3d6 <_sk_load_g8_dst_sse2_8bit+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,117,0,0,0 ; lea 0x75(%rip),%r10 # 2a4e8 <_sk_load_g8_dst_sse2_8bit+0x120>
+ DB 76,141,21,117,0,0,0 ; lea 0x75(%rip),%r10 # 2a4d4 <_sk_load_g8_dst_sse2_8bit+0x120>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,96,255,255,255 ; jmpq 2a3ea <_sk_load_g8_dst_sse2_8bit+0x22>
+ DB 233,96,255,255,255 ; jmpq 2a3d6 <_sk_load_g8_dst_sse2_8bit+0x22>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,2 ; pinsrw $0x2,%eax,%xmm2
@@ -40598,7 +40592,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,110,216 ; movd %eax,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 233,59,255,255,255 ; jmpq 2a3ea <_sk_load_g8_dst_sse2_8bit+0x22>
+ DB 233,59,255,255,255 ; jmpq 2a3d6 <_sk_load_g8_dst_sse2_8bit+0x22>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,6 ; pinsrw $0x6,%eax,%xmm2
@@ -40609,7 +40603,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,67,15,110,28,24 ; movd (%r8,%r11,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,3,255,255,255 ; jmpq 2a3ea <_sk_load_g8_dst_sse2_8bit+0x22>
+ DB 233,3,255,255,255 ; jmpq 2a3d6 <_sk_load_g8_dst_sse2_8bit+0x22>
DB 144 ; nop
DB 148 ; xchg %eax,%esp
DB 255 ; (bad)
@@ -40642,7 +40636,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,253,0,0,0 ; jne 2a621 <_sk_srcover_rgba_8888_sse2_8bit+0x11d>
+ DB 15,133,253,0,0,0 ; jne 2a60d <_sk_srcover_rgba_8888_sse2_8bit+0x11d>
DB 71,15,16,68,152,16 ; movups 0x10(%r8,%r11,4),%xmm8
DB 102,71,15,16,12,152 ; movupd (%r8,%r11,4),%xmm9
DB 72,133,255 ; test %rdi,%rdi
@@ -40691,7 +40685,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,68,15,248,207 ; psubb %xmm7,%xmm9
DB 102,68,15,252,200 ; paddb %xmm0,%xmm9
DB 102,68,15,252,193 ; paddb %xmm1,%xmm8
- DB 117,78 ; jne 2a65e <_sk_srcover_rgba_8888_sse2_8bit+0x15a>
+ DB 117,78 ; jne 2a64a <_sk_srcover_rgba_8888_sse2_8bit+0x15a>
DB 243,71,15,127,12,152 ; movdqu %xmm9,(%r8,%r11,4)
DB 243,71,15,127,68,152,16 ; movdqu %xmm8,0x10(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -40702,30 +40696,30 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,241,254,255,255 ; ja 2a530 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
+ DB 15,135,241,254,255,255 ; ja 2a51c <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,210,0,0,0 ; lea 0xd2(%rip),%r10 # 2a71c <_sk_srcover_rgba_8888_sse2_8bit+0x218>
+ DB 76,141,21,210,0,0,0 ; lea 0xd2(%rip),%r10 # 2a708 <_sk_srcover_rgba_8888_sse2_8bit+0x218>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 243,71,15,16,12,152 ; movss (%r8,%r11,4),%xmm9
- DB 233,210,254,255,255 ; jmpq 2a530 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
+ DB 233,210,254,255,255 ; jmpq 2a51c <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,175 ; ja 2a61d <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ DB 119,175 ; ja 2a609 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 76,141,13,191,0,0,0 ; lea 0xbf(%rip),%r9 # 2a738 <_sk_srcover_rgba_8888_sse2_8bit+0x234>
+ DB 76,141,13,191,0,0,0 ; lea 0xbf(%rip),%r9 # 2a724 <_sk_srcover_rgba_8888_sse2_8bit+0x234>
DB 73,99,4,129 ; movslq (%r9,%rax,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
DB 102,71,15,126,12,152 ; movd %xmm9,(%r8,%r11,4)
- DB 235,147 ; jmp 2a61d <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ DB 235,147 ; jmp 2a609 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
DB 102,67,15,110,100,152,8 ; movd 0x8(%r8,%r11,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,71,15,18,12,152 ; movlpd (%r8,%r11,4),%xmm9
- DB 233,142,254,255,255 ; jmpq 2a530 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
+ DB 233,142,254,255,255 ; jmpq 2a51c <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
DB 102,67,15,110,100,152,24 ; movd 0x18(%r8,%r11,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
DB 243,67,15,16,100,152,20 ; movss 0x14(%r8,%r11,4),%xmm4
@@ -40734,24 +40728,24 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 68,15,40,196 ; movaps %xmm4,%xmm8
DB 243,67,15,16,100,152,16 ; movss 0x10(%r8,%r11,4),%xmm4
DB 243,68,15,16,196 ; movss %xmm4,%xmm8
- DB 233,85,254,255,255 ; jmpq 2a52a <_sk_srcover_rgba_8888_sse2_8bit+0x26>
+ DB 233,85,254,255,255 ; jmpq 2a516 <_sk_srcover_rgba_8888_sse2_8bit+0x26>
DB 102,65,15,112,225,78 ; pshufd $0x4e,%xmm9,%xmm4
DB 102,67,15,126,100,152,8 ; movd %xmm4,0x8(%r8,%r11,4)
DB 102,71,15,214,12,152 ; movq %xmm9,(%r8,%r11,4)
- DB 233,48,255,255,255 ; jmpq 2a61d <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ DB 233,48,255,255,255 ; jmpq 2a609 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
DB 102,65,15,112,224,78 ; pshufd $0x4e,%xmm8,%xmm4
DB 102,67,15,126,100,152,24 ; movd %xmm4,0x18(%r8,%r11,4)
DB 102,65,15,112,224,229 ; pshufd $0xe5,%xmm8,%xmm4
DB 102,67,15,126,100,152,20 ; movd %xmm4,0x14(%r8,%r11,4)
DB 102,71,15,126,68,152,16 ; movd %xmm8,0x10(%r8,%r11,4)
DB 243,71,15,127,12,152 ; movdqu %xmm9,(%r8,%r11,4)
- DB 233,4,255,255,255 ; jmpq 2a61d <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ DB 233,4,255,255,255 ; jmpq 2a609 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
DB 15,31,0 ; nopl (%rax)
DB 55 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 123,255 ; jnp 2a721 <_sk_srcover_rgba_8888_sse2_8bit+0x21d>
+ DB 123,255 ; jnp 2a70d <_sk_srcover_rgba_8888_sse2_8bit+0x21d>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -40787,7 +40781,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 102,68,15,111,200 ; movdqa %xmm0,%xmm9
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,0 ; movss (%rax),%xmm0
- DB 243,15,89,5,156,34,0,0 ; mulss 0x229c(%rip),%xmm0 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 243,15,89,5,128,43,0,0 ; mulss 0x2b80(%rip),%xmm0 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 243,15,44,192 ; cvttss2si %xmm0,%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
@@ -40799,7 +40793,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 102,15,96,246 ; punpcklbw %xmm6,%xmm6
DB 242,15,112,246,0 ; pshuflw $0x0,%xmm6,%xmm6
DB 102,15,112,246,80 ; pshufd $0x50,%xmm6,%xmm6
- DB 102,15,219,53,171,44,0,0 ; pand 0x2cab(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,53,191,44,0,0 ; pand 0x2cbf(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
DB 102,65,15,213,248 ; pmullw %xmm8,%xmm7
DB 102,15,111,230 ; movdqa %xmm6,%xmm4
@@ -40829,10 +40823,10 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,239,0,0,0 ; jne 2a900 <_sk_scale_u8_sse2_8bit+0x10b>
+ DB 15,133,239,0,0,0 ; jne 2a8ec <_sk_scale_u8_sse2_8bit+0x10b>
DB 243,67,15,126,36,24 ; movq (%r8,%r11,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
- DB 102,15,219,37,45,44,0,0 ; pand 0x2c2d(%rip),%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,37,65,44,0,0 ; pand 0x2c41(%rip),%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,111,236 ; movdqa %xmm4,%xmm5
DB 102,65,15,105,232 ; punpckhwd %xmm8,%xmm5
@@ -40886,15 +40880,15 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,3,255,255,255 ; ja 2a81b <_sk_scale_u8_sse2_8bit+0x26>
+ DB 15,135,3,255,255,255 ; ja 2a807 <_sk_scale_u8_sse2_8bit+0x26>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,117,0,0,0 ; lea 0x75(%rip),%r10 # 2a998 <_sk_scale_u8_sse2_8bit+0x1a3>
+ DB 76,141,21,117,0,0,0 ; lea 0x75(%rip),%r10 # 2a984 <_sk_scale_u8_sse2_8bit+0x1a3>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 233,225,254,255,255 ; jmpq 2a81b <_sk_scale_u8_sse2_8bit+0x26>
+ DB 233,225,254,255,255 ; jmpq 2a807 <_sk_scale_u8_sse2_8bit+0x26>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,196,224,2 ; pinsrw $0x2,%eax,%xmm4
@@ -40902,7 +40896,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 243,15,16,229 ; movss %xmm5,%xmm4
- DB 233,188,254,255,255 ; jmpq 2a81b <_sk_scale_u8_sse2_8bit+0x26>
+ DB 233,188,254,255,255 ; jmpq 2a807 <_sk_scale_u8_sse2_8bit+0x26>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,196,224,6 ; pinsrw $0x6,%eax,%xmm4
@@ -40913,7 +40907,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,67,15,110,44,24 ; movd (%r8,%r11,1),%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,132,254,255,255 ; jmpq 2a81b <_sk_scale_u8_sse2_8bit+0x26>
+ DB 233,132,254,255,255 ; jmpq 2a807 <_sk_scale_u8_sse2_8bit+0x26>
DB 144 ; nop
DB 148 ; xchg %eax,%esp
DB 255 ; (bad)
@@ -40940,7 +40934,7 @@ PUBLIC _sk_lerp_1_float_sse2_8bit
_sk_lerp_1_float_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,32 ; movss (%rax),%xmm4
- DB 243,15,89,37,70,32,0,0 ; mulss 0x2046(%rip),%xmm4 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 243,15,89,37,42,41,0,0 ; mulss 0x292a(%rip),%xmm4 # 2d2d8 <_sk_overlay_sse2_8bit+0xd80>
DB 243,15,44,196 ; cvttss2si %xmm4,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4
@@ -40953,7 +40947,7 @@ _sk_lerp_1_float_sse2_8bit LABEL PROC
DB 102,68,15,111,217 ; movdqa %xmm1,%xmm11
DB 102,69,15,96,217 ; punpcklbw %xmm9,%xmm11
DB 102,65,15,104,201 ; punpckhbw %xmm9,%xmm1
- DB 102,15,111,53,77,42,0,0 ; movdqa 0x2a4d(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,111,53,97,42,0,0 ; movdqa 0x2a61(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,65,15,219,240 ; pand %xmm8,%xmm6
DB 102,15,111,230 ; movdqa %xmm6,%xmm4
DB 102,15,213,225 ; pmullw %xmm1,%xmm4
@@ -41015,10 +41009,10 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,141,1,0,0 ; jne 2ac93 <_sk_lerp_u8_sse2_8bit+0x1a9>
+ DB 15,133,141,1,0,0 ; jne 2ac7f <_sk_lerp_u8_sse2_8bit+0x1a9>
DB 243,67,15,126,44,24 ; movq (%r8,%r11,1),%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
- DB 102,15,219,45,56,41,0,0 ; pand 0x2938(%rip),%xmm5 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,219,45,76,41,0,0 ; pand 0x294c(%rip),%xmm5 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,65,15,105,224 ; punpckhwd %xmm8,%xmm4
@@ -41105,15 +41099,15 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,101,254,255,255 ; ja 2ab10 <_sk_lerp_u8_sse2_8bit+0x26>
+ DB 15,135,101,254,255,255 ; ja 2aafc <_sk_lerp_u8_sse2_8bit+0x26>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,118,0,0,0 ; lea 0x76(%rip),%r10 # 2ad2c <_sk_lerp_u8_sse2_8bit+0x242>
+ DB 76,141,21,118,0,0,0 ; lea 0x76(%rip),%r10 # 2ad18 <_sk_lerp_u8_sse2_8bit+0x242>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,232 ; movd %eax,%xmm5
- DB 233,67,254,255,255 ; jmpq 2ab10 <_sk_lerp_u8_sse2_8bit+0x26>
+ DB 233,67,254,255,255 ; jmpq 2aafc <_sk_lerp_u8_sse2_8bit+0x26>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,196,232,2 ; pinsrw $0x2,%eax,%xmm5
@@ -41121,7 +41115,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 243,15,16,236 ; movss %xmm4,%xmm5
- DB 233,30,254,255,255 ; jmpq 2ab10 <_sk_lerp_u8_sse2_8bit+0x26>
+ DB 233,30,254,255,255 ; jmpq 2aafc <_sk_lerp_u8_sse2_8bit+0x26>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,196,232,6 ; pinsrw $0x6,%eax,%xmm5
@@ -41132,7 +41126,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,67,15,110,36,24 ; movd (%r8,%r11,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 242,15,16,236 ; movsd %xmm4,%xmm5
- DB 233,230,253,255,255 ; jmpq 2ab10 <_sk_lerp_u8_sse2_8bit+0x26>
+ DB 233,230,253,255,255 ; jmpq 2aafc <_sk_lerp_u8_sse2_8bit+0x26>
DB 102,144 ; xchg %ax,%ax
DB 147 ; xchg %eax,%ebx
DB 255 ; (bad)
@@ -41141,7 +41135,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 235,255 ; jmp 2ad39 <_sk_lerp_u8_sse2_8bit+0x24f>
+ DB 235,255 ; jmp 2ad25 <_sk_lerp_u8_sse2_8bit+0x24f>
DB 255 ; (bad)
DB 255,224 ; jmpq *%rax
DB 255 ; (bad)
@@ -41171,7 +41165,7 @@ _sk_move_dst_src_sse2_8bit LABEL PROC
PUBLIC _sk_black_color_sse2_8bit
_sk_black_color_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,43,46,0,0 ; movaps 0x2e2b(%rip),%xmm0 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
+ DB 15,40,5,63,46,0,0 ; movaps 0x2e3f(%rip),%xmm0 # 2db90 <_sk_overlay_sse2_8bit+0x1638>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 255,224 ; jmpq *%rax
@@ -42042,7 +42036,7 @@ _sk_darken_sse2_8bit LABEL PROC
DB 102,65,15,248,234 ; psubb %xmm10,%xmm5
DB 102,15,248,207 ; psubb %xmm7,%xmm1
DB 102,15,248,196 ; psubb %xmm4,%xmm0
- DB 102,15,111,37,21,32,0,0 ; movdqa 0x2015(%rip),%xmm4 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
+ DB 102,15,111,37,41,32,0,0 ; movdqa 0x2029(%rip),%xmm4 # 2dc80 <_sk_overlay_sse2_8bit+0x1728>
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,252 ; movdqa %xmm4,%xmm7
DB 102,15,223,248 ; pandn %xmm0,%xmm7
@@ -42148,7 +42142,7 @@ _sk_lighten_sse2_8bit LABEL PROC
DB 102,65,15,248,234 ; psubb %xmm10,%xmm5
DB 102,15,248,207 ; psubb %xmm7,%xmm1
DB 102,15,248,196 ; psubb %xmm4,%xmm0
- DB 102,15,111,37,41,30,0,0 ; movdqa 0x1e29(%rip),%xmm4 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
+ DB 102,15,111,37,61,30,0,0 ; movdqa 0x1e3d(%rip),%xmm4 # 2dc80 <_sk_overlay_sse2_8bit+0x1728>
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,252 ; movdqa %xmm4,%xmm7
DB 102,15,223,248 ; pandn %xmm0,%xmm7
@@ -42196,7 +42190,7 @@ _sk_exclusion_sse2_8bit LABEL PROC
DB 102,15,113,214,8 ; psrlw $0x8,%xmm6
DB 102,15,103,244 ; packuswb %xmm4,%xmm6
DB 102,15,103,239 ; packuswb %xmm7,%xmm5
- DB 102,15,111,37,92,29,0,0 ; movdqa 0x1d5c(%rip),%xmm4 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
+ DB 102,15,111,37,112,29,0,0 ; movdqa 0x1d70(%rip),%xmm4 # 2dc80 <_sk_overlay_sse2_8bit+0x1728>
DB 102,15,248,205 ; psubb %xmm5,%xmm1
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,219,230 ; pand %xmm6,%xmm4
@@ -42293,7 +42287,7 @@ _sk_difference_sse2_8bit LABEL PROC
DB 102,65,15,103,244 ; packuswb %xmm12,%xmm6
DB 102,65,15,218,226 ; pminub %xmm10,%xmm4
DB 102,65,15,218,243 ; pminub %xmm11,%xmm6
- DB 102,15,111,45,153,27,0,0 ; movdqa 0x1b99(%rip),%xmm5 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
+ DB 102,15,111,45,173,27,0,0 ; movdqa 0x1bad(%rip),%xmm5 # 2dc80 <_sk_overlay_sse2_8bit+0x1728>
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 102,15,219,236 ; pand %xmm4,%xmm5
@@ -42388,7 +42382,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,68,15,111,220 ; movdqa %xmm4,%xmm11
DB 102,69,15,217,211 ; psubusw %xmm11,%xmm10
DB 102,68,15,117,213 ; pcmpeqw %xmm5,%xmm10
- DB 102,15,111,45,156,17,0,0 ; movdqa 0x119c(%rip),%xmm5 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,111,45,176,17,0,0 ; movdqa 0x11b0(%rip),%xmm5 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,15,111,198 ; movdqa %xmm6,%xmm0
DB 102,15,239,197 ; pxor %xmm5,%xmm0
DB 102,65,15,213,198 ; pmullw %xmm14,%xmm0
@@ -42492,7 +42486,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,68,15,253,188,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm15
DB 102,68,15,253,68,36,16 ; paddw 0x10(%rsp),%xmm8
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
- DB 102,15,111,5,170,23,0,0 ; movdqa 0x17aa(%rip),%xmm0 # 2dc90 <_sk_overlay_sse2_8bit+0x1724>
+ DB 102,15,111,5,190,23,0,0 ; movdqa 0x17be(%rip),%xmm0 # 2dc90 <_sk_overlay_sse2_8bit+0x1738>
DB 102,15,253,208 ; paddw %xmm0,%xmm2
DB 102,68,15,253,210 ; paddw %xmm2,%xmm10
DB 102,68,15,253,248 ; paddw %xmm0,%xmm15
@@ -42501,7 +42495,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,69,15,253,200 ; paddw %xmm8,%xmm9
DB 102,15,253,232 ; paddw %xmm0,%xmm5
DB 102,15,253,233 ; paddw %xmm1,%xmm5
- DB 102,15,111,5,141,23,0,0 ; movdqa 0x178d(%rip),%xmm0 # 2dca0 <_sk_overlay_sse2_8bit+0x1734>
+ DB 102,15,111,5,161,23,0,0 ; movdqa 0x17a1(%rip),%xmm0 # 2dca0 <_sk_overlay_sse2_8bit+0x1748>
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
DB 102,68,15,228,200 ; pmulhuw %xmm0,%xmm9
DB 102,68,15,228,248 ; pmulhuw %xmm0,%xmm15
@@ -42604,7 +42598,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,217,234 ; psubusw %xmm2,%xmm5
DB 102,15,117,236 ; pcmpeqw %xmm4,%xmm5
DB 102,15,127,172,36,160,0,0,0 ; movdqa %xmm5,0xa0(%rsp)
- DB 102,15,111,53,49,13,0,0 ; movdqa 0xd31(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
+ DB 102,15,111,53,69,13,0,0 ; movdqa 0xd45(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xef8>
DB 102,15,111,194 ; movdqa %xmm2,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,65,15,213,199 ; pmullw %xmm15,%xmm0
@@ -42712,7 +42706,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,68,15,253,92,36,112 ; paddw 0x70(%rsp),%xmm11
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
DB 102,15,253,116,36,16 ; paddw 0x10(%rsp),%xmm6
- DB 102,15,111,5,59,19,0,0 ; movdqa 0x133b(%rip),%xmm0 # 2dc90 <_sk_overlay_sse2_8bit+0x1724>
+ DB 102,15,111,5,79,19,0,0 ; movdqa 0x134f(%rip),%xmm0 # 2dc90 <_sk_overlay_sse2_8bit+0x1738>
DB 102,68,15,253,224 ; paddw %xmm0,%xmm12
DB 102,68,15,253,227 ; paddw %xmm3,%xmm12
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
@@ -42721,7 +42715,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,253,234 ; paddw %xmm2,%xmm5
DB 102,15,253,240 ; paddw %xmm0,%xmm6
DB 102,15,253,241 ; paddw %xmm1,%xmm6
- DB 102,15,111,5,31,19,0,0 ; movdqa 0x131f(%rip),%xmm0 # 2dca0 <_sk_overlay_sse2_8bit+0x1734>
+ DB 102,15,111,5,51,19,0,0 ; movdqa 0x1333(%rip),%xmm0 # 2dca0 <_sk_overlay_sse2_8bit+0x1748>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
@@ -42740,179 +42734,21 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 72,129,196,72,1,0,0 ; add $0x148,%rsp
DB 255,224 ; jmpq *%rax
-ALIGN 4
+ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 128,63,1 ; cmpb $0x1,(%rdi)
- DB 0,0 ; add %al,(%rax)
- DB 0,4,0 ; add %al,(%rax,%rax,1)
- DB 0,0 ; add %al,(%rax)
- DB 2,0 ; add (%rax),%al
- DB 0,0 ; add %al,(%rax)
- DB 0,0 ; add %al,(%rax)
- DB 128,60,0,0 ; cmpb $0x0,(%rax,%rax,1)
- DB 252 ; cld
- DB 190,0,0,128,191 ; mov $0xbf800000,%esi
- DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2ca3c <.literal4+0x64>
- DB 154 ; (bad)
- DB 153 ; cltd
- DB 153 ; cltd
- DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 2ca45 <.literal4+0x6d>
- DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2ca4f <.literal4+0x77>
- DB 145 ; xchg %eax,%ecx
- DB 131,158,61,92,143,50,63 ; sbbl $0x3f,0x328f5c3d(%rsi)
- DB 10,215 ; or %bh,%dl
- DB 35,59 ; and (%rbx),%edi
- DB 174 ; scas %es:(%rdi),%al
- DB 71,97 ; rex.RXB (bad)
- DB 61,82,184,78,65 ; cmp $0x414eb852,%eax
- DB 186,159,98,60,57 ; mov $0x393c629f,%edx
- DB 215 ; xlat %ds:(%rbx)
- DB 32,187,109,165,144,63 ; and %bh,0x3f90a56d(%rbx)
- DB 252 ; cld
- DB 191,16,62,168,177 ; mov $0xb1a83e10,%edi
- DB 152 ; cwtl
- DB 59,0 ; cmp (%rax),%eax
- DB 0,192 ; add %al,%al
+ DB 192,63,0 ; sarb $0x0,(%rdi)
+ DB 0,32 ; add %ah,(%rax)
DB 64,0,0 ; add %al,(%rax)
- DB 0,64,0 ; add %al,0x0(%rax)
- DB 0,128,64,171,170,42 ; add %al,0x2aaaab40(%rax)
- DB 62,171 ; ds stos %eax,%es:(%rdi)
- DB 170 ; stos %al,%es:(%rdi)
- DB 170 ; stos %al,%es:(%rdi)
- DB 62,171 ; ds stos %eax,%es:(%rdi)
- DB 170 ; stos %al,%es:(%rdi)
- DB 42,63 ; sub (%rdi),%bh
- DB 171 ; stos %eax,%es:(%rdi)
- DB 170 ; stos %al,%es:(%rdi)
- DB 170 ; stos %al,%es:(%rdi)
- DB 190,129,128,128,59 ; mov $0x3b808081,%esi
- DB 0,248 ; add %bh,%al
- DB 0,0 ; add %al,(%rax)
- DB 8,33 ; or %ah,(%rcx)
- DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 2ca65 <.literal4+0x8d>
- DB 0,0 ; add %al,(%rax)
- DB 33,8 ; and %ecx,(%rax)
- DB 2,58 ; add (%rdx),%bh
- DB 31 ; (bad)
- DB 0,0 ; add %al,(%rax)
- DB 0,8 ; add %cl,(%rax)
- DB 33,4,61,128,0,128,55 ; and %eax,0x37800080(,%rdi,1)
- DB 0,0 ; add %al,(%rax)
- DB 0,52,255 ; add %dh,(%rdi,%rdi,8)
- DB 255 ; (bad)
- DB 127,0 ; jg 2ca78 <.literal4+0xa0>
- DB 119,115 ; ja 2caed <.literal4+0x115>
- DB 248 ; clc
- DB 194,117,191 ; retq $0xbf75
- DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
- DB 62,163,233,220,63,81,140,242,66,141 ; movabs %eax,%ds:0x8d42f28c513fdce9
- DB 188,190,63,248,245 ; mov $0xf5f83fbe,%esp
- DB 154 ; (bad)
- DB 64,254 ; rex (bad)
- DB 210,221 ; rcr %cl,%ch
- DB 65,0,0 ; add %al,(%r8)
- DB 0,75,0 ; add %cl,0x0(%rbx)
- DB 0,200 ; add %cl,%al
- DB 66,0,0 ; rex.X add %al,(%rax)
- DB 0,195 ; add %al,%bl
- DB 0,0 ; add %al,(%rax)
- DB 128,65,203,61 ; addb $0x3d,-0x35(%rcx)
- DB 13,60,111,18,3 ; or $0x3126f3c,%eax
- DB 59,10 ; cmp (%rdx),%ecx
- DB 215 ; xlat %ds:(%rbx)
- DB 163,59,194,24,17,60,203,61,13 ; movabs %eax,0xd3dcb3c1118c23b
- DB 190,80,128,3,62 ; mov $0x3e038050,%esi
- DB 31 ; (bad)
- DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2cb03 <.literal4+0x12b>
- DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
- DB 0,0 ; add %al,(%rax)
- DB 248 ; clc
- DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 2cb12 <.literal4+0x13a>
- DB 0,240 ; add %dh,%al
- DB 0,0 ; add %al,(%rax)
- DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax)
- DB 0,0 ; add %al,(%rax)
- DB 137,136,136,57,240,0 ; mov %ecx,0xf03988(%rax)
- DB 0,0 ; add %al,(%rax)
- DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax)
- DB 0,0 ; add %al,(%rax)
- DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax)
- DB 112,65 ; jo 2cb35 <.literal4+0x15d>
- DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2cb3f <.literal4+0x167>
- DB 208 ; (bad)
- DB 179,89 ; mov $0x59,%bl
- DB 62,89 ; ds pop %rcx
- DB 23 ; (bad)
- DB 55 ; (bad)
- DB 63 ; (bad)
- DB 152 ; cwtl
- DB 221,147,61,18,120,57 ; fstl 0x3978123d(%rbx)
- DB 64,45,16,17,192,32 ; rex sub $0x20c01110,%eax
- DB 148 ; xchg %eax,%esp
- DB 90 ; pop %rdx
- DB 62,4,157 ; ds add $0x9d,%al
- DB 30 ; (bad)
- DB 62,0,24 ; add %bl,%ds:(%rax)
- DB 161,57,111,43,231,187,159,215,202 ; movabs 0xcad79fbbe72b6f39,%eax
- DB 60,212 ; cmp $0xd4,%al
- DB 100,84 ; fs push %rsp
- DB 189,169,240,34,62 ; mov $0x3e22f0a9,%ebp
- DB 0,0 ; add %al,(%rax)
- DB 128,62,0 ; cmpb $0x0,(%rsi)
- DB 0,0 ; add %al,(%rax)
- DB 192,0,0 ; rolb $0x0,(%rax)
- DB 128,192,0 ; add $0x0,%al
- DB 0,0 ; add %al,(%rax)
- DB 128,0,0 ; addb $0x0,(%rax)
- DB 0,191,0,0,192,191 ; add %bh,-0x40400000(%rdi)
- DB 114,28 ; jb 2cb5e <.literal4+0x186>
- DB 199 ; (bad)
- DB 62,0,0 ; add %al,%ds:(%rax)
- DB 192,63,85 ; sarb $0x55,(%rdi)
- DB 85 ; push %rbp
- DB 149 ; xchg %eax,%ebp
- DB 191,57,142,99,61 ; mov $0x3d638e39,%edi
- DB 114,249 ; jb 2cb4b <.literal4+0x173>
- DB 127,63 ; jg 2cb93 <_sk_overlay_sse2_8bit+0x627>
- DB 3,0 ; add (%rax),%eax
- DB 0,0 ; add %al,(%rax)
- DB 0,128,0,0,0,4 ; add %al,0x4000000(%rax)
- DB 0,128,0,0,0,56 ; add %al,0x38000000(%rax)
- DB 0,0 ; add %al,(%rax)
- DB 128,56,0 ; cmpb $0x0,(%rax)
- DB 64,254 ; rex (bad)
- DB 255,7 ; incl (%rdi)
- DB 0,7 ; add %al,(%rdi)
- DB 0,0 ; add %al,(%rax)
- DB 12,0 ; or $0x0,%al
- DB 0,0 ; add %al,(%rax)
- DB 0,0 ; add %al,(%rax)
- DB 255,1 ; incl (%rcx)
- DB 1,1 ; add %eax,(%rcx)
- DB 0,255 ; add %bh,%bh
- DB 255 ; (bad)
- DB 255,0 ; incl (%rax)
-
-ALIGN 32
- DB 0,0 ; add %al,(%rax)
- DB 0,0 ; add %al,(%rax)
- DB 0,0 ; add %al,(%rax)
- DB 128,63,0 ; cmpb $0x0,(%rdi)
- DB 0,0 ; add %al,(%rax)
+ DB 96 ; (bad)
DB 64,0,0 ; add %al,(%rax)
- DB 64 ; rex
+ DB 144 ; nop
DB 64,0,0 ; add %al,(%rax)
- DB 128,64,0,0 ; addb $0x0,0x0(%rax)
- DB 160,64,0,0,192,64,0,0,224 ; movabs 0xe0000040c0000040,%al
+ DB 176,64 ; mov $0x40,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 208,64,0 ; rolb 0x0(%rax)
+ DB 0,240 ; add %dh,%al
DB 64,0,0 ; add %al,(%rax)
DB 0,0 ; add %al,(%rax)
DB 1,0 ; add %eax,(%rax)
@@ -42946,16 +42782,16 @@ ALIGN 32
DB 0,1 ; add %al,(%rcx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cbe8 <_sk_overlay_sse2_8bit+0xa00067c>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02ca48 <_sk_overlay_sse2_8bit+0xa0004f0>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cbf0 <_sk_overlay_sse2_8bit+0x12000684>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202ca50 <_sk_overlay_sse2_8bit+0x120004f8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cbf8 <_sk_overlay_sse2_8bit+0x1a00068c>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02ca58 <_sk_overlay_sse2_8bit+0x1a000500>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cc00 <_sk_overlay_sse2_8bit+0x3000694>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302ca60 <_sk_overlay_sse2_8bit+0x3000508>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42998,16 +42834,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cc48 <_sk_overlay_sse2_8bit+0xa0006dc>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02caa8 <_sk_overlay_sse2_8bit+0xa000550>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cc50 <_sk_overlay_sse2_8bit+0x120006e4>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cab0 <_sk_overlay_sse2_8bit+0x12000558>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cc58 <_sk_overlay_sse2_8bit+0x1a0006ec>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cab8 <_sk_overlay_sse2_8bit+0x1a000560>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cc60 <_sk_overlay_sse2_8bit+0x30006f4>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cac0 <_sk_overlay_sse2_8bit+0x3000568>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -43050,16 +42886,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cca8 <_sk_overlay_sse2_8bit+0xa00073c>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cb08 <_sk_overlay_sse2_8bit+0xa0005b0>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202ccb0 <_sk_overlay_sse2_8bit+0x12000744>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cb10 <_sk_overlay_sse2_8bit+0x120005b8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02ccb8 <_sk_overlay_sse2_8bit+0x1a00074c>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cb18 <_sk_overlay_sse2_8bit+0x1a0005c0>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302ccc0 <_sk_overlay_sse2_8bit+0x3000754>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cb20 <_sk_overlay_sse2_8bit+0x30005c8>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -43102,16 +42938,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cd08 <_sk_overlay_sse2_8bit+0xa00079c>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cb68 <_sk_overlay_sse2_8bit+0xa000610>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cd10 <_sk_overlay_sse2_8bit+0x120007a4>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cb70 <_sk_overlay_sse2_8bit+0x12000618>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cd18 <_sk_overlay_sse2_8bit+0x1a0007ac>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cb78 <_sk_overlay_sse2_8bit+0x1a000620>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cd20 <_sk_overlay_sse2_8bit+0x30007b4>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cb80 <_sk_overlay_sse2_8bit+0x3000628>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -43154,16 +42990,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cd68 <_sk_overlay_sse2_8bit+0xa0007fc>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cbc8 <_sk_overlay_sse2_8bit+0xa000670>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cd70 <_sk_overlay_sse2_8bit+0x12000804>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cbd0 <_sk_overlay_sse2_8bit+0x12000678>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cd78 <_sk_overlay_sse2_8bit+0x1a00080c>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cbd8 <_sk_overlay_sse2_8bit+0x1a000680>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cd80 <_sk_overlay_sse2_8bit+0x3000814>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cbe0 <_sk_overlay_sse2_8bit+0x3000688>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -43206,16 +43042,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cdc8 <_sk_overlay_sse2_8bit+0xa00085c>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cc28 <_sk_overlay_sse2_8bit+0xa0006d0>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cdd0 <_sk_overlay_sse2_8bit+0x12000864>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cc30 <_sk_overlay_sse2_8bit+0x120006d8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cdd8 <_sk_overlay_sse2_8bit+0x1a00086c>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cc38 <_sk_overlay_sse2_8bit+0x1a0006e0>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cde0 <_sk_overlay_sse2_8bit+0x3000874>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cc40 <_sk_overlay_sse2_8bit+0x30006e8>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -43258,16 +43094,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02ce28 <_sk_overlay_sse2_8bit+0xa0008bc>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cc88 <_sk_overlay_sse2_8bit+0xa000730>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202ce30 <_sk_overlay_sse2_8bit+0x120008c4>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cc90 <_sk_overlay_sse2_8bit+0x12000738>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02ce38 <_sk_overlay_sse2_8bit+0x1a0008cc>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cc98 <_sk_overlay_sse2_8bit+0x1a000740>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302ce40 <_sk_overlay_sse2_8bit+0x30008d4>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cca0 <_sk_overlay_sse2_8bit+0x3000748>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -43310,16 +43146,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02ce88 <_sk_overlay_sse2_8bit+0xa00091c>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cce8 <_sk_overlay_sse2_8bit+0xa000790>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202ce90 <_sk_overlay_sse2_8bit+0x12000924>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202ccf0 <_sk_overlay_sse2_8bit+0x12000798>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02ce98 <_sk_overlay_sse2_8bit+0x1a00092c>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02ccf8 <_sk_overlay_sse2_8bit+0x1a0007a0>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cea0 <_sk_overlay_sse2_8bit+0x3000934>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cd00 <_sk_overlay_sse2_8bit+0x30007a8>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -43345,13 +43181,19 @@ ALIGN 32
DB 255 ; (bad)
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
+ DB 63 ; (bad)
DB 0,0 ; add %al,(%rax)
- DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
+ DB 192,63,0 ; sarb $0x0,(%rdi)
+ DB 0,32 ; add %ah,(%rax)
DB 64,0,0 ; add %al,(%rax)
- DB 64 ; rex
+ DB 96 ; (bad)
DB 64,0,0 ; add %al,(%rax)
- DB 128,64,0,0 ; addb $0x0,0x0(%rax)
- DB 160,64,0,0,192,64,0,0,224 ; movabs 0xe0000040c0000040,%al
+ DB 144 ; nop
+ DB 64,0,0 ; add %al,(%rax)
+ DB 176,64 ; mov $0x40,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 208,64,0 ; rolb 0x0(%rax)
+ DB 0,240 ; add %dh,%al
DB 64,255,0 ; rex incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -44144,6 +43986,168 @@ ALIGN 32
DB 129 ; .byte 0x81
DB 128 ; .byte 0x80
+ALIGN 4
+ DB 0,0 ; add %al,(%rax)
+ DB 0,63 ; add %bh,(%rdi)
+ DB 0,0 ; add %al,(%rax)
+ DB 128,63,1 ; cmpb $0x1,(%rdi)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,4,0 ; add %al,(%rax,%rax,1)
+ DB 0,0 ; add %al,(%rax)
+ DB 2,0 ; add (%rax),%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 128,60,0,0 ; cmpb $0x0,(%rax,%rax,1)
+ DB 252 ; cld
+ DB 190,0,0,128,191 ; mov $0xbf800000,%esi
+ DB 0,0 ; add %al,(%rax)
+ DB 224,64 ; loopne 2d30c <.literal4+0x64>
+ DB 154 ; (bad)
+ DB 153 ; cltd
+ DB 153 ; cltd
+ DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
+ DB 71,225,61 ; rex.RXB loope 2d315 <.literal4+0x6d>
+ DB 0,0 ; add %al,(%rax)
+ DB 127,67 ; jg 2d31f <.literal4+0x77>
+ DB 145 ; xchg %eax,%ecx
+ DB 131,158,61,92,143,50,63 ; sbbl $0x3f,0x328f5c3d(%rsi)
+ DB 10,215 ; or %bh,%dl
+ DB 35,59 ; and (%rbx),%edi
+ DB 174 ; scas %es:(%rdi),%al
+ DB 71,97 ; rex.RXB (bad)
+ DB 61,82,184,78,65 ; cmp $0x414eb852,%eax
+ DB 186,159,98,60,57 ; mov $0x393c629f,%edx
+ DB 215 ; xlat %ds:(%rbx)
+ DB 32,187,109,165,144,63 ; and %bh,0x3f90a56d(%rbx)
+ DB 252 ; cld
+ DB 191,16,62,168,177 ; mov $0xb1a83e10,%edi
+ DB 152 ; cwtl
+ DB 59,0 ; cmp (%rax),%eax
+ DB 0,192 ; add %al,%al
+ DB 64,0,0 ; add %al,(%rax)
+ DB 0,64,0 ; add %al,0x0(%rax)
+ DB 0,128,64,171,170,42 ; add %al,0x2aaaab40(%rax)
+ DB 62,171 ; ds stos %eax,%es:(%rdi)
+ DB 170 ; stos %al,%es:(%rdi)
+ DB 170 ; stos %al,%es:(%rdi)
+ DB 62,171 ; ds stos %eax,%es:(%rdi)
+ DB 170 ; stos %al,%es:(%rdi)
+ DB 42,63 ; sub (%rdi),%bh
+ DB 171 ; stos %eax,%es:(%rdi)
+ DB 170 ; stos %al,%es:(%rdi)
+ DB 170 ; stos %al,%es:(%rdi)
+ DB 190,129,128,128,59 ; mov $0x3b808081,%esi
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 8,33 ; or %ah,(%rcx)
+ DB 132,55 ; test %dh,(%rdi)
+ DB 224,7 ; loopne 2d335 <.literal4+0x8d>
+ DB 0,0 ; add %al,(%rax)
+ DB 33,8 ; and %ecx,(%rax)
+ DB 2,58 ; add (%rdx),%bh
+ DB 31 ; (bad)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,8 ; add %cl,(%rax)
+ DB 33,4,61,128,0,128,55 ; and %eax,0x37800080(,%rdi,1)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,52,255 ; add %dh,(%rdi,%rdi,8)
+ DB 255 ; (bad)
+ DB 127,0 ; jg 2d348 <.literal4+0xa0>
+ DB 119,115 ; ja 2d3bd <.literal4+0x115>
+ DB 248 ; clc
+ DB 194,117,191 ; retq $0xbf75
+ DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
+ DB 62,163,233,220,63,81,140,242,66,141 ; movabs %eax,%ds:0x8d42f28c513fdce9
+ DB 188,190,63,248,245 ; mov $0xf5f83fbe,%esp
+ DB 154 ; (bad)
+ DB 64,254 ; rex (bad)
+ DB 210,221 ; rcr %cl,%ch
+ DB 65,0,0 ; add %al,(%r8)
+ DB 0,75,0 ; add %cl,0x0(%rbx)
+ DB 0,200 ; add %cl,%al
+ DB 66,0,0 ; rex.X add %al,(%rax)
+ DB 0,195 ; add %al,%bl
+ DB 0,0 ; add %al,(%rax)
+ DB 128,65,203,61 ; addb $0x3d,-0x35(%rcx)
+ DB 13,60,111,18,3 ; or $0x3126f3c,%eax
+ DB 59,10 ; cmp (%rdx),%ecx
+ DB 215 ; xlat %ds:(%rbx)
+ DB 163,59,194,24,17,60,203,61,13 ; movabs %eax,0xd3dcb3c1118c23b
+ DB 190,80,128,3,62 ; mov $0x3e038050,%esi
+ DB 31 ; (bad)
+ DB 215 ; xlat %ds:(%rbx)
+ DB 118,63 ; jbe 2d3d3 <.literal4+0x12b>
+ DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 248 ; clc
+ DB 65,0,0 ; add %al,(%r8)
+ DB 124,66 ; jl 2d3e2 <.literal4+0x13a>
+ DB 0,240 ; add %dh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 137,136,136,57,240,0 ; mov %ecx,0xf03988(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax)
+ DB 112,65 ; jo 2d405 <.literal4+0x15d>
+ DB 0,255 ; add %bh,%bh
+ DB 127,71 ; jg 2d40f <.literal4+0x167>
+ DB 208 ; (bad)
+ DB 179,89 ; mov $0x59,%bl
+ DB 62,89 ; ds pop %rcx
+ DB 23 ; (bad)
+ DB 55 ; (bad)
+ DB 63 ; (bad)
+ DB 152 ; cwtl
+ DB 221,147,61,18,120,57 ; fstl 0x3978123d(%rbx)
+ DB 64,45,16,17,192,32 ; rex sub $0x20c01110,%eax
+ DB 148 ; xchg %eax,%esp
+ DB 90 ; pop %rdx
+ DB 62,4,157 ; ds add $0x9d,%al
+ DB 30 ; (bad)
+ DB 62,0,24 ; add %bl,%ds:(%rax)
+ DB 161,57,111,43,231,187,159,215,202 ; movabs 0xcad79fbbe72b6f39,%eax
+ DB 60,212 ; cmp $0xd4,%al
+ DB 100,84 ; fs push %rsp
+ DB 189,169,240,34,62 ; mov $0x3e22f0a9,%ebp
+ DB 0,0 ; add %al,(%rax)
+ DB 128,62,0 ; cmpb $0x0,(%rsi)
+ DB 0,0 ; add %al,(%rax)
+ DB 192,0,0 ; rolb $0x0,(%rax)
+ DB 128,192,0 ; add $0x0,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 128,0,0 ; addb $0x0,(%rax)
+ DB 0,191,0,0,192,191 ; add %bh,-0x40400000(%rdi)
+ DB 114,28 ; jb 2d42e <.literal4+0x186>
+ DB 199 ; (bad)
+ DB 62,0,0 ; add %al,%ds:(%rax)
+ DB 192,63,85 ; sarb $0x55,(%rdi)
+ DB 85 ; push %rbp
+ DB 149 ; xchg %eax,%ebp
+ DB 191,57,142,99,61 ; mov $0x3d638e39,%edi
+ DB 114,249 ; jb 2d41b <.literal4+0x173>
+ DB 127,63 ; jg 2d463 <_sk_overlay_sse2_8bit+0xf0b>
+ DB 3,0 ; add (%rax),%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 0,128,0,0,0,4 ; add %al,0x4000000(%rax)
+ DB 0,128,0,0,0,56 ; add %al,0x38000000(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 128,56,0 ; cmpb $0x0,(%rax)
+ DB 64,254 ; rex (bad)
+ DB 255,7 ; incl (%rdi)
+ DB 0,7 ; add %al,(%rdi)
+ DB 0,0 ; add %al,(%rax)
+ DB 12,0 ; or $0x0,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 255,1 ; incl (%rcx)
+ DB 1,1 ; add %eax,(%rcx)
+ DB 0,255 ; add %bh,%bh
+ DB 255 ; (bad)
+ DB 255,0 ; incl (%rax)
+
ALIGN 16
DB 255,0 ; incl (%rax)
DB 255,0 ; incl (%rax)
@@ -44187,19 +44191,19 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 63 ; (bad)
DB 0,0 ; add %al,(%rax)
+ DB 192,63,0 ; sarb $0x0,(%rdi)
+ DB 0,32 ; add %ah,(%rax)
+ DB 64,0,0 ; add %al,(%rax)
+ DB 96 ; (bad)
+ DB 64,0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
+ DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 0,0 ; add %al,(%rax)
- DB 128,63,0 ; cmpb $0x0,(%rdi)
- DB 0,0 ; add %al,(%rax)
- DB 64,0,0 ; add %al,(%rax)
- DB 64 ; rex
- DB 64,0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
DB 63 ; (bad)
@@ -44284,10 +44288,10 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02d588 <_sk_overlay_sse2_8bit+0xa00101c>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02d588 <_sk_overlay_sse2_8bit+0xa001030>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 302d590 <_sk_overlay_sse2_8bit+0x3001024>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 302d590 <_sk_overlay_sse2_8bit+0x3001038>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -44556,7 +44560,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a617aa <_sk_overlay_sse2_8bit+0xffffffffe9a3523e>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a617aa <_sk_overlay_sse2_8bit+0xffffffffe9a35252>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -44809,7 +44813,7 @@ ALIGN 16
DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax
DB 152 ; cwtl
DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx)
- DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc2eb4a <_sk_overlay_sse2_8bit+0x2dc025de>
+ DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc2eb4a <_sk_overlay_sse2_8bit+0x2dc025f2>
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
DB 120,57 ; js 2da7c <.literal16+0x62c>
@@ -44902,7 +44906,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d666985 <_sk_overlay_sse2_8bit+0x3d63a419>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d666985 <_sk_overlay_sse2_8bit+0x3d63a42d>
DB 57,142,99,61,114,249 ; cmp %ecx,-0x68dc29d(%rsi)
DB 127,63 ; jg 2db93 <.literal16+0x743>
DB 114,249 ; jb 2db4f <.literal16+0x6ff>
@@ -45163,13 +45167,11 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,2 ; movd (%edx),%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,144,141,207,0,0 ; movaps 0xcf8d(%eax),%xmm2
- DB 15,88,194 ; addps %xmm2,%xmm0
- DB 15,88,128,157,207,0,0 ; addps 0xcf9d(%eax),%xmm0
+ DB 15,88,128,141,207,0,0 ; addps 0xcf8d(%eax),%xmm0
DB 102,15,110,74,4 ; movd 0x4(%edx),%xmm1
DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,88,202 ; addps %xmm2,%xmm1
+ DB 15,88,136,157,207,0,0 ; addps 0xcf9d(%eax),%xmm1
DB 141,113,4 ; lea 0x4(%ecx),%esi
DB 15,87,210 ; xorps %xmm2,%xmm2
DB 15,41,82,64 ; movaps %xmm2,0x40(%edx)
@@ -45197,25 +45199,25 @@ _sk_dither_sse2 LABEL PROC
DB 15,41,85,232 ; movaps %xmm2,-0x18(%ebp)
DB 15,40,217 ; movaps %xmm1,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 11e <_sk_dither_sse2+0x1a>
+ DB 232,0,0,0,0 ; call 118 <_sk_dither_sse2+0x1a>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 102,15,110,32 ; movd (%eax),%xmm4
DB 102,15,112,236,0 ; pshufd $0x0,%xmm4,%xmm5
- DB 102,15,254,169,66,207,0,0 ; paddd 0xcf42(%ecx),%xmm5
+ DB 102,15,254,169,72,207,0,0 ; paddd 0xcf48(%ecx),%xmm5
DB 102,15,110,96,4 ; movd 0x4(%eax),%xmm4
DB 102,15,112,252,0 ; pshufd $0x0,%xmm4,%xmm7
DB 102,15,239,253 ; pxor %xmm5,%xmm7
- DB 102,15,111,177,82,207,0,0 ; movdqa 0xcf52(%ecx),%xmm6
+ DB 102,15,111,177,88,207,0,0 ; movdqa 0xcf58(%ecx),%xmm6
DB 102,15,111,207 ; movdqa %xmm7,%xmm1
DB 102,15,219,206 ; pand %xmm6,%xmm1
DB 102,15,219,245 ; pand %xmm5,%xmm6
- DB 102,15,111,129,114,207,0,0 ; movdqa 0xcf72(%ecx),%xmm0
+ DB 102,15,111,129,120,207,0,0 ; movdqa 0xcf78(%ecx),%xmm0
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
DB 102,15,219,224 ; pand %xmm0,%xmm4
DB 102,15,219,197 ; pand %xmm5,%xmm0
- DB 102,15,219,185,98,207,0,0 ; pand 0xcf62(%ecx),%xmm7
- DB 102,15,219,169,98,207,0,0 ; pand 0xcf62(%ecx),%xmm5
+ DB 102,15,219,185,104,207,0,0 ; pand 0xcf68(%ecx),%xmm7
+ DB 102,15,219,169,104,207,0,0 ; pand 0xcf68(%ecx),%xmm5
DB 102,15,114,246,4 ; pslld $0x4,%xmm6
DB 102,15,254,192 ; paddd %xmm0,%xmm0
DB 102,15,235,198 ; por %xmm6,%xmm0
@@ -45230,8 +45232,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,15,114,215,1 ; psrld $0x1,%xmm7
DB 102,15,235,231 ; por %xmm7,%xmm4
DB 15,91,196 ; cvtdq2ps %xmm4,%xmm0
- DB 15,89,129,130,207,0,0 ; mulps 0xcf82(%ecx),%xmm0
- DB 15,88,129,146,207,0,0 ; addps 0xcf92(%ecx),%xmm0
+ DB 15,89,129,136,207,0,0 ; mulps 0xcf88(%ecx),%xmm0
+ DB 15,88,129,152,207,0,0 ; addps 0xcf98(%ecx),%xmm0
DB 243,15,16,14 ; movss (%esi),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
@@ -45290,12 +45292,12 @@ _sk_black_color_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 25a <_sk_black_color_sse2+0xb>
+ DB 232,0,0,0,0 ; call 254 <_sk_black_color_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,152,246,205,0,0 ; movaps 0xcdf6(%eax),%xmm3
+ DB 15,40,152,252,205,0,0 ; movaps 0xcdfc(%eax),%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -45311,12 +45313,12 @@ _sk_white_color_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 28a <_sk_white_color_sse2+0xb>
+ DB 232,0,0,0,0 ; call 284 <_sk_white_color_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,128,198,205,0,0 ; movaps 0xcdc6(%eax),%xmm0
+ DB 15,40,128,204,205,0,0 ; movaps 0xcdcc(%eax),%xmm0
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -45392,13 +45394,13 @@ _sk_srcatop_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 339 <_sk_srcatop_sse2+0xb>
+ DB 232,0,0,0,0 ; call 333 <_sk_srcatop_sse2+0xb>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 15,40,97,64 ; movaps 0x40(%ecx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,170,23,205,0,0 ; movaps 0xcd17(%edx),%xmm5
+ DB 15,40,170,29,205,0,0 ; movaps 0xcd1d(%edx),%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
@@ -45428,14 +45430,14 @@ _sk_dstatop_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 398 <_sk_dstatop_sse2+0xb>
+ DB 232,0,0,0,0 ; call 392 <_sk_dstatop_sse2+0xb>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
DB 15,89,243 ; mulps %xmm3,%xmm6
- DB 15,40,162,184,204,0,0 ; movaps 0xccb8(%edx),%xmm4
+ DB 15,40,162,190,204,0,0 ; movaps 0xccbe(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,198 ; addps %xmm6,%xmm0
@@ -45509,11 +45511,11 @@ _sk_srcout_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 459 <_sk_srcout_sse2+0xb>
+ DB 232,0,0,0,0 ; call 453 <_sk_srcout_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,247,203,0,0 ; movaps 0xcbf7(%eax),%xmm4
+ DB 15,40,160,253,203,0,0 ; movaps 0xcbfd(%eax),%xmm4
DB 15,92,98,64 ; subps 0x40(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
@@ -45533,11 +45535,11 @@ _sk_dstout_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 491 <_sk_dstout_sse2+0xb>
+ DB 232,0,0,0,0 ; call 48b <_sk_dstout_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,191,203,0,0 ; movaps 0xcbbf(%eax),%xmm4
+ DB 15,40,160,197,203,0,0 ; movaps 0xcbc5(%eax),%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
DB 15,40,66,16 ; movaps 0x10(%edx),%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -45561,11 +45563,11 @@ _sk_srcover_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 4d8 <_sk_srcover_sse2+0xb>
+ DB 232,0,0,0,0 ; call 4d2 <_sk_srcover_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,120,203,0,0 ; movaps 0xcb78(%eax),%xmm4
+ DB 15,40,160,126,203,0,0 ; movaps 0xcb7e(%eax),%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -45592,12 +45594,12 @@ _sk_dstover_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 528 <_sk_dstover_sse2+0xb>
+ DB 232,0,0,0,0 ; call 522 <_sk_dstover_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 15,40,106,64 ; movaps 0x40(%edx),%xmm5
- DB 15,40,160,40,203,0,0 ; movaps 0xcb28(%eax),%xmm4
+ DB 15,40,160,46,203,0,0 ; movaps 0xcb2e(%eax),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,66,16 ; addps 0x10(%edx),%xmm0
@@ -45644,12 +45646,12 @@ _sk_multiply_sse2 LABEL PROC
DB 131,236,56 ; sub $0x38,%esp
DB 15,41,85,216 ; movaps %xmm2,-0x28(%ebp)
DB 15,40,232 ; movaps %xmm0,%xmm5
- DB 232,0,0,0,0 ; call 5a7 <_sk_multiply_sse2+0x12>
+ DB 232,0,0,0,0 ; call 5a1 <_sk_multiply_sse2+0x12>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
- DB 15,40,129,169,202,0,0 ; movaps 0xcaa9(%ecx),%xmm0
+ DB 15,40,129,175,202,0,0 ; movaps 0xcaaf(%ecx),%xmm0
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
DB 15,40,254 ; movaps %xmm6,%xmm7
@@ -45702,12 +45704,12 @@ _sk_plus__sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 64d <_sk_plus__sse2+0xb>
+ DB 232,0,0,0,0 ; call 647 <_sk_plus__sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 15,88,66,16 ; addps 0x10(%edx),%xmm0
- DB 15,40,160,3,202,0,0 ; movaps 0xca03(%eax),%xmm4
+ DB 15,40,160,9,202,0,0 ; movaps 0xca09(%eax),%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
DB 15,88,74,32 ; addps 0x20(%edx),%xmm1
DB 15,93,204 ; minps %xmm4,%xmm1
@@ -45770,12 +45772,12 @@ _sk_xor__sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 232,0,0,0,0 ; call 6fb <_sk_xor__sse2+0xe>
+ DB 232,0,0,0,0 ; call 6f5 <_sk_xor__sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
- DB 15,40,154,85,201,0,0 ; movaps 0xc955(%edx),%xmm3
+ DB 15,40,154,91,201,0,0 ; movaps 0xc95b(%edx),%xmm3
DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,92,245 ; subps %xmm5,%xmm6
DB 15,89,198 ; mulps %xmm6,%xmm0
@@ -45809,7 +45811,7 @@ _sk_darken_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 763 <_sk_darken_sse2+0xe>
+ DB 232,0,0,0,0 ; call 75d <_sk_darken_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -45835,7 +45837,7 @@ _sk_darken_sse2 LABEL PROC
DB 15,89,203 ; mulps %xmm3,%xmm1
DB 15,95,209 ; maxps %xmm1,%xmm2
DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,40,138,237,200,0,0 ; movaps 0xc8ed(%edx),%xmm1
+ DB 15,40,138,243,200,0,0 ; movaps 0xc8f3(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -45856,7 +45858,7 @@ _sk_lighten_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 7e3 <_sk_lighten_sse2+0xe>
+ DB 232,0,0,0,0 ; call 7dd <_sk_lighten_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -45882,7 +45884,7 @@ _sk_lighten_sse2 LABEL PROC
DB 15,89,203 ; mulps %xmm3,%xmm1
DB 15,93,209 ; minps %xmm1,%xmm2
DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,40,138,109,200,0,0 ; movaps 0xc86d(%edx),%xmm1
+ DB 15,40,138,115,200,0,0 ; movaps 0xc873(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -45904,7 +45906,7 @@ _sk_difference_sse2 LABEL PROC
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,225 ; movaps %xmm1,%xmm4
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 866 <_sk_difference_sse2+0x11>
+ DB 232,0,0,0,0 ; call 860 <_sk_difference_sse2+0x11>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -45933,7 +45935,7 @@ _sk_difference_sse2 LABEL PROC
DB 15,93,214 ; minps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,146,234,199,0,0 ; movaps 0xc7ea(%edx),%xmm2
+ DB 15,40,146,240,199,0,0 ; movaps 0xc7f0(%edx),%xmm2
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -45953,7 +45955,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 8ec <_sk_exclusion_sse2+0xe>
+ DB 232,0,0,0,0 ; call 8e6 <_sk_exclusion_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -45975,7 +45977,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,202 ; mulps %xmm2,%xmm1
DB 15,88,201 ; addps %xmm1,%xmm1
DB 15,92,233 ; subps %xmm1,%xmm5
- DB 15,40,138,100,199,0,0 ; movaps 0xc764(%edx),%xmm1
+ DB 15,40,138,106,199,0,0 ; movaps 0xc76a(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,73,64 ; mulps 0x40(%ecx),%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -45999,7 +46001,7 @@ _sk_colorburn_sse2 LABEL PROC
DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 96b <_sk_colorburn_sse2+0x19>
+ DB 232,0,0,0,0 ; call 965 <_sk_colorburn_sse2+0x19>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
@@ -46014,7 +46016,7 @@ _sk_colorburn_sse2 LABEL PROC
DB 15,93,198 ; minps %xmm6,%xmm0
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,92,232 ; subps %xmm0,%xmm5
- DB 15,40,177,229,198,0,0 ; movaps 0xc6e5(%ecx),%xmm6
+ DB 15,40,177,235,198,0,0 ; movaps 0xc6eb(%ecx),%xmm6
DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,92,193 ; subps %xmm1,%xmm0
DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
@@ -46125,11 +46127,11 @@ _sk_colordodge_sse2 LABEL PROC
DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
DB 15,41,77,232 ; movaps %xmm1,-0x18(%ebp)
- DB 232,0,0,0,0 ; call af4 <_sk_colordodge_sse2+0x16>
+ DB 232,0,0,0,0 ; call aee <_sk_colordodge_sse2+0x16>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,16 ; movaps 0x10(%eax),%xmm1
- DB 15,40,145,92,197,0,0 ; movaps 0xc55c(%ecx),%xmm2
+ DB 15,40,145,98,197,0,0 ; movaps 0xc562(%ecx),%xmm2
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 15,92,214 ; subps %xmm6,%xmm2
DB 15,40,250 ; movaps %xmm2,%xmm7
@@ -46240,11 +46242,11 @@ _sk_hardlight_sse2 LABEL PROC
DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,41,85,168 ; movaps %xmm2,-0x58(%ebp)
DB 15,41,77,232 ; movaps %xmm1,-0x18(%ebp)
- DB 232,0,0,0,0 ; call c55 <_sk_hardlight_sse2+0x16>
+ DB 232,0,0,0,0 ; call c4f <_sk_hardlight_sse2+0x16>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
- DB 15,40,145,251,195,0,0 ; movaps 0xc3fb(%ecx),%xmm2
+ DB 15,40,145,1,196,0,0 ; movaps 0xc401(%ecx),%xmm2
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,40,225 ; movaps %xmm1,%xmm4
@@ -46348,11 +46350,11 @@ _sk_overlay_sse2 LABEL PROC
DB 15,41,85,152 ; movaps %xmm2,-0x68(%ebp)
DB 15,41,77,168 ; movaps %xmm1,-0x58(%ebp)
DB 15,40,232 ; movaps %xmm0,%xmm5
- DB 232,0,0,0,0 ; call da0 <_sk_overlay_sse2+0x1a>
+ DB 232,0,0,0,0 ; call d9a <_sk_overlay_sse2+0x1a>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
- DB 15,40,161,176,194,0,0 ; movaps 0xc2b0(%ecx),%xmm4
+ DB 15,40,161,182,194,0,0 ; movaps 0xc2b6(%ecx),%xmm4
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
@@ -46475,20 +46477,20 @@ _sk_softlight_sse2 LABEL PROC
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
DB 15,88,241 ; addps %xmm1,%xmm6
- DB 232,0,0,0,0 ; call f30 <_sk_softlight_sse2+0x52>
+ DB 232,0,0,0,0 ; call f2a <_sk_softlight_sse2+0x52>
DB 89 ; pop %ecx
DB 15,40,194 ; movaps %xmm2,%xmm0
- DB 15,40,137,144,193,0,0 ; movaps 0xc190(%ecx),%xmm1
+ DB 15,40,137,150,193,0,0 ; movaps 0xc196(%ecx),%xmm1
DB 15,41,141,104,255,255,255 ; movaps %xmm1,-0x98(%ebp)
DB 15,88,193 ; addps %xmm1,%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,185,32,193,0,0 ; movaps 0xc120(%ecx),%xmm7
+ DB 15,40,185,38,193,0,0 ; movaps 0xc126(%ecx),%xmm7
DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
DB 15,92,250 ; subps %xmm2,%xmm7
DB 15,82,242 ; rsqrtps %xmm2,%xmm6
DB 15,83,206 ; rcpps %xmm6,%xmm1
DB 15,92,202 ; subps %xmm2,%xmm1
- DB 15,40,161,160,193,0,0 ; movaps 0xc1a0(%ecx),%xmm4
+ DB 15,40,161,166,193,0,0 ; movaps 0xc1a6(%ecx),%xmm4
DB 15,41,101,152 ; movaps %xmm4,-0x68(%ebp)
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
@@ -46682,7 +46684,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,93,200 ; minps %xmm0,%xmm1
DB 15,92,225 ; subps %xmm1,%xmm4
DB 15,41,101,168 ; movaps %xmm4,-0x58(%ebp)
- DB 232,0,0,0,0 ; call 11f1 <_sk_hue_sse2+0x4f>
+ DB 232,0,0,0,0 ; call 11eb <_sk_hue_sse2+0x4f>
DB 89 ; pop %ecx
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,40,197 ; movaps %xmm5,%xmm0
@@ -46692,7 +46694,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
- DB 15,40,169,95,190,0,0 ; movaps 0xbe5f(%ecx),%xmm5
+ DB 15,40,169,101,190,0,0 ; movaps 0xbe65(%ecx),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
@@ -46725,17 +46727,17 @@ _sk_hue_sse2 LABEL PROC
DB 15,89,233 ; mulps %xmm1,%xmm5
DB 15,41,173,120,255,255,255 ; movaps %xmm5,-0x88(%ebp)
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,153,239,190,0,0 ; movaps 0xbeef(%ecx),%xmm3
+ DB 15,40,153,245,190,0,0 ; movaps 0xbef5(%ecx),%xmm3
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,117,152 ; movaps -0x68(%ebp),%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
DB 15,89,203 ; mulps %xmm3,%xmm1
- DB 15,40,153,255,190,0,0 ; movaps 0xbeff(%ecx),%xmm3
+ DB 15,40,153,5,191,0,0 ; movaps 0xbf05(%ecx),%xmm3
DB 15,40,109,136 ; movaps -0x78(%ebp),%xmm5
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,89,251 ; mulps %xmm3,%xmm7
DB 15,88,249 ; addps %xmm1,%xmm7
- DB 15,40,137,95,190,0,0 ; movaps 0xbe5f(%ecx),%xmm1
+ DB 15,40,137,101,190,0,0 ; movaps 0xbe65(%ecx),%xmm1
DB 15,92,77,184 ; subps -0x48(%ebp),%xmm1
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 15,41,117,152 ; movaps %xmm6,-0x68(%ebp)
@@ -46745,7 +46747,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 15,41,117,168 ; movaps %xmm6,-0x58(%ebp)
- DB 15,40,169,15,191,0,0 ; movaps 0xbf0f(%ecx),%xmm5
+ DB 15,40,169,21,191,0,0 ; movaps 0xbf15(%ecx),%xmm5
DB 15,89,205 ; mulps %xmm5,%xmm1
DB 15,88,207 ; addps %xmm7,%xmm1
DB 15,94,212 ; divps %xmm4,%xmm2
@@ -46934,19 +46936,19 @@ _sk_saturation_sse2 LABEL PROC
DB 15,89,221 ; mulps %xmm5,%xmm3
DB 15,40,211 ; movaps %xmm3,%xmm2
DB 15,89,253 ; mulps %xmm5,%xmm7
- DB 232,0,0,0,0 ; call 1545 <_sk_saturation_sse2+0xb0>
+ DB 232,0,0,0,0 ; call 153f <_sk_saturation_sse2+0xb0>
DB 89 ; pop %ecx
- DB 15,40,153,155,187,0,0 ; movaps 0xbb9b(%ecx),%xmm3
+ DB 15,40,153,161,187,0,0 ; movaps 0xbba1(%ecx),%xmm3
DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp)
DB 15,40,77,184 ; movaps -0x48(%ebp),%xmm1
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,40,153,171,187,0,0 ; movaps 0xbbab(%ecx),%xmm3
+ DB 15,40,153,177,187,0,0 ; movaps 0xbbb1(%ecx),%xmm3
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,238 ; movaps %xmm6,%xmm5
DB 15,89,235 ; mulps %xmm3,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,129,11,187,0,0 ; movaps 0xbb0b(%ecx),%xmm0
+ DB 15,40,129,17,187,0,0 ; movaps 0xbb11(%ecx),%xmm0
DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp)
DB 15,92,69,216 ; subps -0x28(%ebp),%xmm0
DB 15,89,200 ; mulps %xmm0,%xmm1
@@ -46958,7 +46960,7 @@ _sk_saturation_sse2 LABEL PROC
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,41,141,120,255,255,255 ; movaps %xmm1,-0x88(%ebp)
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 15,40,129,187,187,0,0 ; movaps 0xbbbb(%ecx),%xmm0
+ DB 15,40,129,193,187,0,0 ; movaps 0xbbc1(%ecx),%xmm0
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,40,109,168 ; movaps -0x58(%ebp),%xmm5
@@ -47110,21 +47112,21 @@ _sk_color_sse2 LABEL PROC
DB 15,41,165,104,255,255,255 ; movaps %xmm4,-0x98(%ebp)
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,41,173,120,255,255,255 ; movaps %xmm5,-0x88(%ebp)
- DB 232,0,0,0,0 ; call 17a0 <_sk_color_sse2+0x2a>
+ DB 232,0,0,0,0 ; call 179a <_sk_color_sse2+0x2a>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,16 ; movaps 0x10(%eax),%xmm2
DB 15,40,72,32 ; movaps 0x20(%eax),%xmm1
- DB 15,40,177,64,185,0,0 ; movaps 0xb940(%ecx),%xmm6
+ DB 15,40,177,70,185,0,0 ; movaps 0xb946(%ecx),%xmm6
DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp)
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,153,80,185,0,0 ; movaps 0xb950(%ecx),%xmm3
+ DB 15,40,153,86,185,0,0 ; movaps 0xb956(%ecx),%xmm3
DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,243 ; mulps %xmm3,%xmm6
DB 15,88,240 ; addps %xmm0,%xmm6
- DB 15,40,129,176,184,0,0 ; movaps 0xb8b0(%ecx),%xmm0
+ DB 15,40,129,182,184,0,0 ; movaps 0xb8b6(%ecx),%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
DB 15,92,69,200 ; subps -0x38(%ebp),%xmm0
DB 15,89,208 ; mulps %xmm0,%xmm2
@@ -47134,7 +47136,7 @@ _sk_color_sse2 LABEL PROC
DB 15,40,80,48 ; movaps 0x30(%eax),%xmm2
DB 15,89,194 ; mulps %xmm2,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
- DB 15,40,137,96,185,0,0 ; movaps 0xb960(%ecx),%xmm1
+ DB 15,40,137,102,185,0,0 ; movaps 0xb966(%ecx),%xmm1
DB 15,89,209 ; mulps %xmm1,%xmm2
DB 15,88,214 ; addps %xmm6,%xmm2
DB 15,40,88,64 ; movaps 0x40(%eax),%xmm3
@@ -47288,21 +47290,21 @@ _sk_luminosity_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 129,236,184,0,0,0 ; sub $0xb8,%esp
DB 15,40,242 ; movaps %xmm2,%xmm6
- DB 232,0,0,0,0 ; call 1a03 <_sk_luminosity_sse2+0x11>
+ DB 232,0,0,0,0 ; call 19fd <_sk_luminosity_sse2+0x11>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 15,40,161,221,182,0,0 ; movaps 0xb6dd(%ecx),%xmm4
+ DB 15,40,161,227,182,0,0 ; movaps 0xb6e3(%ecx),%xmm4
DB 15,41,101,232 ; movaps %xmm4,-0x18(%ebp)
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 15,40,161,237,182,0,0 ; movaps 0xb6ed(%ecx),%xmm4
+ DB 15,40,161,243,182,0,0 ; movaps 0xb6f3(%ecx),%xmm4
DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,88,234 ; addps %xmm2,%xmm5
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
DB 15,41,85,184 ; movaps %xmm2,-0x48(%ebp)
- DB 15,40,161,77,182,0,0 ; movaps 0xb64d(%ecx),%xmm4
+ DB 15,40,161,83,182,0,0 ; movaps 0xb653(%ecx),%xmm4
DB 15,40,252 ; movaps %xmm4,%xmm7
DB 15,92,250 ; subps %xmm2,%xmm7
DB 15,89,199 ; mulps %xmm7,%xmm0
@@ -47312,7 +47314,7 @@ _sk_luminosity_sse2 LABEL PROC
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,41,189,104,255,255,255 ; movaps %xmm7,-0x98(%ebp)
DB 15,40,214 ; movaps %xmm6,%xmm2
- DB 15,40,137,253,182,0,0 ; movaps 0xb6fd(%ecx),%xmm1
+ DB 15,40,137,3,183,0,0 ; movaps 0xb703(%ecx),%xmm1
DB 15,89,209 ; mulps %xmm1,%xmm2
DB 15,88,213 ; addps %xmm5,%xmm2
DB 15,40,104,16 ; movaps 0x10(%eax),%xmm5
@@ -47472,7 +47474,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 131,236,44 ; sub $0x2c,%esp
DB 102,15,127,85,200 ; movdqa %xmm2,-0x38(%ebp)
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
- DB 232,0,0,0,0 ; call 1c6e <_sk_srcover_rgba_8888_sse2+0x17>
+ DB 232,0,0,0,0 ; call 1c68 <_sk_srcover_rgba_8888_sse2+0x17>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -47484,9 +47486,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,49 ; mov (%ecx),%esi
- DB 15,133,224,0,0,0 ; jne 1d70 <_sk_srcover_rgba_8888_sse2+0x119>
+ DB 15,133,224,0,0,0 ; jne 1d6a <_sk_srcover_rgba_8888_sse2+0x119>
DB 243,15,111,20,178 ; movdqu (%edx,%esi,4),%xmm2
- DB 102,15,111,167,162,180,0,0 ; movdqa 0xb4a2(%edi),%xmm4
+ DB 102,15,111,167,168,180,0,0 ; movdqa 0xb4a8(%edi),%xmm4
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,242 ; movdqa %xmm2,%xmm6
@@ -47497,9 +47499,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 102,15,219,252 ; pand %xmm4,%xmm7
DB 15,91,229 ; cvtdq2ps %xmm5,%xmm4
DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx)
- DB 15,40,175,226,179,0,0 ; movaps 0xb3e2(%edi),%xmm5
+ DB 15,40,175,232,179,0,0 ; movaps 0xb3e8(%edi),%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
- DB 15,40,143,178,180,0,0 ; movaps 0xb4b2(%edi),%xmm1
+ DB 15,40,143,184,180,0,0 ; movaps 0xb4b8(%edi),%xmm1
DB 15,89,193 ; mulps %xmm1,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,88,224 ; addps %xmm0,%xmm4
@@ -47532,7 +47534,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 102,15,235,193 ; por %xmm1,%xmm0
DB 133,219 ; test %ebx,%ebx
- DB 117,95 ; jne 1dab <_sk_srcover_rgba_8888_sse2+0x154>
+ DB 117,95 ; jne 1da5 <_sk_srcover_rgba_8888_sse2+0x154>
DB 243,15,127,4,178 ; movdqu %xmm0,(%edx,%esi,4)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -47553,33 +47555,33 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 136,69,243 ; mov %al,-0xd(%ebp)
DB 128,101,243,3 ; andb $0x3,-0xd(%ebp)
DB 128,125,243,1 ; cmpb $0x1,-0xd(%ebp)
- DB 116,80 ; je 1dcf <_sk_srcover_rgba_8888_sse2+0x178>
+ DB 116,80 ; je 1dc9 <_sk_srcover_rgba_8888_sse2+0x178>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 128,125,243,2 ; cmpb $0x2,-0xd(%ebp)
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 116,21 ; je 1da1 <_sk_srcover_rgba_8888_sse2+0x14a>
+ DB 116,21 ; je 1d9b <_sk_srcover_rgba_8888_sse2+0x14a>
DB 128,125,243,3 ; cmpb $0x3,-0xd(%ebp)
- DB 15,133,255,254,255,255 ; jne 1c95 <_sk_srcover_rgba_8888_sse2+0x3e>
+ DB 15,133,255,254,255,255 ; jne 1c8f <_sk_srcover_rgba_8888_sse2+0x3e>
DB 102,15,110,84,178,8 ; movd 0x8(%edx,%esi,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,15,18,20,178 ; movlpd (%edx,%esi,4),%xmm2
- DB 233,234,254,255,255 ; jmp 1c95 <_sk_srcover_rgba_8888_sse2+0x3e>
+ DB 233,234,254,255,255 ; jmp 1c8f <_sk_srcover_rgba_8888_sse2+0x3e>
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,41 ; je 1ddc <_sk_srcover_rgba_8888_sse2+0x185>
+ DB 116,41 ; je 1dd6 <_sk_srcover_rgba_8888_sse2+0x185>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 1dc8 <_sk_srcover_rgba_8888_sse2+0x171>
+ DB 116,16 ; je 1dc2 <_sk_srcover_rgba_8888_sse2+0x171>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,148 ; jne 1d51 <_sk_srcover_rgba_8888_sse2+0xfa>
+ DB 117,148 ; jne 1d4b <_sk_srcover_rgba_8888_sse2+0xfa>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,15,126,76,178,8 ; movd %xmm1,0x8(%edx,%esi,4)
DB 102,15,214,4,178 ; movq %xmm0,(%edx,%esi,4)
- DB 235,130 ; jmp 1d51 <_sk_srcover_rgba_8888_sse2+0xfa>
+ DB 235,130 ; jmp 1d4b <_sk_srcover_rgba_8888_sse2+0xfa>
DB 102,15,110,20,178 ; movd (%edx,%esi,4),%xmm2
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 233,185,254,255,255 ; jmp 1c95 <_sk_srcover_rgba_8888_sse2+0x3e>
+ DB 233,185,254,255,255 ; jmp 1c8f <_sk_srcover_rgba_8888_sse2+0x3e>
DB 102,15,126,4,178 ; movd %xmm0,(%edx,%esi,4)
- DB 233,107,255,255,255 ; jmp 1d51 <_sk_srcover_rgba_8888_sse2+0xfa>
+ DB 233,107,255,255,255 ; jmp 1d4b <_sk_srcover_rgba_8888_sse2+0xfa>
PUBLIC _sk_clamp_0_sse2
_sk_clamp_0_sse2 LABEL PROC
@@ -47606,10 +47608,10 @@ _sk_clamp_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 1e1a <_sk_clamp_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 1e14 <_sk_clamp_1_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,160,54,178,0,0 ; movaps 0xb236(%eax),%xmm4
+ DB 15,40,160,60,178,0,0 ; movaps 0xb23c(%eax),%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
DB 15,93,204 ; minps %xmm4,%xmm1
DB 15,93,212 ; minps %xmm4,%xmm2
@@ -47628,10 +47630,10 @@ _sk_clamp_a_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 1e4d <_sk_clamp_a_sse2+0xb>
+ DB 232,0,0,0,0 ; call 1e47 <_sk_clamp_a_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,93,152,3,178,0,0 ; minps 0xb203(%eax),%xmm3
+ DB 15,93,152,9,178,0,0 ; minps 0xb209(%eax),%xmm3
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -47649,12 +47651,12 @@ _sk_clamp_a_dst_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 1e7d <_sk_clamp_a_dst_sse2+0xb>
+ DB 232,0,0,0,0 ; call 1e77 <_sk_clamp_a_dst_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 15,40,98,64 ; movaps 0x40(%edx),%xmm4
- DB 15,93,160,211,177,0,0 ; minps 0xb1d3(%eax),%xmm4
+ DB 15,93,160,217,177,0,0 ; minps 0xb1d9(%eax),%xmm4
DB 15,41,98,64 ; movaps %xmm4,0x40(%edx)
DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5
DB 15,93,236 ; minps %xmm4,%xmm5
@@ -47719,10 +47721,10 @@ _sk_invert_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 1f28 <_sk_invert_sse2+0xb>
+ DB 232,0,0,0,0 ; call 1f22 <_sk_invert_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,160,40,177,0,0 ; movaps 0xb128(%eax),%xmm4
+ DB 15,40,160,46,177,0,0 ; movaps 0xb12e(%eax),%xmm4
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,92,232 ; subps %xmm0,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
@@ -47831,11 +47833,11 @@ _sk_unpremul_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 2026 <_sk_unpremul_sse2+0xb>
+ DB 232,0,0,0,0 ; call 2020 <_sk_unpremul_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 15,40,168,42,176,0,0 ; movaps 0xb02a(%eax),%xmm5
+ DB 15,40,168,48,176,0,0 ; movaps 0xb030(%eax),%xmm5
DB 15,94,235 ; divps %xmm3,%xmm5
DB 15,194,227,4 ; cmpneqps %xmm3,%xmm4
DB 15,84,229 ; andps %xmm5,%xmm4
@@ -47860,23 +47862,23 @@ _sk_from_srgb_sse2 LABEL PROC
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,40,217 ; movaps %xmm1,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 2070 <_sk_from_srgb_sse2+0x18>
+ DB 232,0,0,0,0 ; call 206a <_sk_from_srgb_sse2+0x18>
DB 88 ; pop %eax
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,201 ; mulps %xmm1,%xmm1
- DB 15,40,160,112,176,0,0 ; movaps 0xb070(%eax),%xmm4
+ DB 15,40,160,118,176,0,0 ; movaps 0xb076(%eax),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,176,208,176,0,0 ; movaps 0xb0d0(%eax),%xmm6
+ DB 15,40,176,214,176,0,0 ; movaps 0xb0d6(%eax),%xmm6
DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp)
DB 15,88,198 ; addps %xmm6,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,176,192,176,0,0 ; movaps 0xb0c0(%eax),%xmm6
+ DB 15,40,176,198,176,0,0 ; movaps 0xb0c6(%eax),%xmm6
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,40,184,224,176,0,0 ; movaps 0xb0e0(%eax),%xmm7
+ DB 15,40,184,230,176,0,0 ; movaps 0xb0e6(%eax),%xmm7
DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,184,240,176,0,0 ; movaps 0xb0f0(%eax),%xmm7
+ DB 15,40,184,246,176,0,0 ; movaps 0xb0f6(%eax),%xmm7
DB 15,194,215,1 ; cmpltps %xmm7,%xmm2
DB 15,84,202 ; andps %xmm2,%xmm1
DB 15,85,208 ; andnps %xmm0,%xmm2
@@ -47928,24 +47930,24 @@ _sk_from_srgb_dst_sse2 LABEL PROC
DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp)
- DB 232,0,0,0,0 ; call 214b <_sk_from_srgb_dst_sse2+0x1b>
+ DB 232,0,0,0,0 ; call 2145 <_sk_from_srgb_dst_sse2+0x1b>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,16 ; movaps 0x10(%eax),%xmm1
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,40,161,149,175,0,0 ; movaps 0xaf95(%ecx),%xmm4
+ DB 15,40,161,155,175,0,0 ; movaps 0xaf9b(%ecx),%xmm4
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,177,245,175,0,0 ; movaps 0xaff5(%ecx),%xmm6
+ DB 15,40,177,251,175,0,0 ; movaps 0xaffb(%ecx),%xmm6
DB 15,88,198 ; addps %xmm6,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,169,229,175,0,0 ; movaps 0xafe5(%ecx),%xmm5
+ DB 15,40,169,235,175,0,0 ; movaps 0xafeb(%ecx),%xmm5
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,40,185,5,176,0,0 ; movaps 0xb005(%ecx),%xmm7
+ DB 15,40,185,11,176,0,0 ; movaps 0xb00b(%ecx),%xmm7
DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,153,21,176,0,0 ; movaps 0xb015(%ecx),%xmm3
+ DB 15,40,153,27,176,0,0 ; movaps 0xb01b(%ecx),%xmm3
DB 15,194,203,1 ; cmpltps %xmm3,%xmm1
DB 15,84,209 ; andps %xmm1,%xmm2
DB 15,85,200 ; andnps %xmm0,%xmm1
@@ -48002,28 +48004,28 @@ _sk_to_srgb_sse2 LABEL PROC
DB 15,40,250 ; movaps %xmm2,%xmm7
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 2236 <_sk_to_srgb_sse2+0x18>
+ DB 232,0,0,0,0 ; call 2230 <_sk_to_srgb_sse2+0x18>
DB 88 ; pop %eax
DB 15,82,218 ; rsqrtps %xmm2,%xmm3
- DB 15,40,160,74,175,0,0 ; movaps 0xaf4a(%eax),%xmm4
+ DB 15,40,160,80,175,0,0 ; movaps 0xaf50(%eax),%xmm4
DB 15,40,235 ; movaps %xmm3,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,40,128,90,175,0,0 ; movaps 0xaf5a(%eax),%xmm0
+ DB 15,40,128,96,175,0,0 ; movaps 0xaf60(%eax),%xmm0
DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp)
DB 15,88,232 ; addps %xmm0,%xmm5
DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,40,128,106,175,0,0 ; movaps 0xaf6a(%eax),%xmm0
+ DB 15,40,128,112,175,0,0 ; movaps 0xaf70(%eax),%xmm0
DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,128,122,175,0,0 ; movaps 0xaf7a(%eax),%xmm0
+ DB 15,40,128,128,175,0,0 ; movaps 0xaf80(%eax),%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 15,88,216 ; addps %xmm0,%xmm3
DB 15,83,195 ; rcpps %xmm3,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,168,58,175,0,0 ; movaps 0xaf3a(%eax),%xmm5
+ DB 15,40,168,64,175,0,0 ; movaps 0xaf40(%eax),%xmm5
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,40,152,138,175,0,0 ; movaps 0xaf8a(%eax),%xmm3
+ DB 15,40,152,144,175,0,0 ; movaps 0xaf90(%eax),%xmm3
DB 15,194,211,1 ; cmpltps %xmm3,%xmm2
DB 15,84,202 ; andps %xmm2,%xmm1
DB 15,85,208 ; andnps %xmm0,%xmm2
@@ -48078,7 +48080,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
DB 15,40,249 ; movaps %xmm1,%xmm7
DB 15,40,224 ; movaps %xmm0,%xmm4
- DB 232,0,0,0,0 ; call 232d <_sk_rgb_to_hsl_sse2+0x15>
+ DB 232,0,0,0,0 ; call 2327 <_sk_rgb_to_hsl_sse2+0x15>
DB 88 ; pop %eax
DB 15,40,199 ; movaps %xmm7,%xmm0
DB 15,95,194 ; maxps %xmm2,%xmm0
@@ -48092,14 +48094,14 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,92,193 ; subps %xmm1,%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
- DB 15,40,136,35,173,0,0 ; movaps 0xad23(%eax),%xmm1
+ DB 15,40,136,41,173,0,0 ; movaps 0xad29(%eax),%xmm1
DB 15,94,200 ; divps %xmm0,%xmm1
DB 15,40,199 ; movaps %xmm7,%xmm0
DB 15,92,194 ; subps %xmm2,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,194,234,1 ; cmpltps %xmm2,%xmm5
- DB 15,84,168,163,174,0,0 ; andps 0xaea3(%eax),%xmm5
+ DB 15,84,168,169,174,0,0 ; andps 0xaea9(%eax),%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,194,196,0 ; cmpeqps %xmm4,%xmm0
@@ -48109,9 +48111,9 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,92,231 ; subps %xmm7,%xmm4
DB 15,89,209 ; mulps %xmm1,%xmm2
DB 15,89,225 ; mulps %xmm1,%xmm4
- DB 15,40,136,179,174,0,0 ; movaps 0xaeb3(%eax),%xmm1
+ DB 15,40,136,185,174,0,0 ; movaps 0xaeb9(%eax),%xmm1
DB 15,88,209 ; addps %xmm1,%xmm2
- DB 15,88,160,195,174,0,0 ; addps 0xaec3(%eax),%xmm4
+ DB 15,88,160,201,174,0,0 ; addps 0xaec9(%eax),%xmm4
DB 15,84,214 ; andps %xmm6,%xmm2
DB 15,85,244 ; andnps %xmm4,%xmm6
DB 15,86,242 ; orps %xmm2,%xmm6
@@ -48123,7 +48125,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,194,226,4 ; cmpneqps %xmm2,%xmm4
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,88,218 ; addps %xmm2,%xmm3
- DB 15,40,168,3,173,0,0 ; movaps 0xad03(%eax),%xmm5
+ DB 15,40,168,25,173,0,0 ; movaps 0xad19(%eax),%xmm5
DB 15,92,202 ; subps %xmm2,%xmm1
DB 15,40,211 ; movaps %xmm3,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
@@ -48133,7 +48135,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,86,233 ; orps %xmm1,%xmm5
DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
DB 15,94,205 ; divps %xmm5,%xmm1
- DB 15,89,128,211,174,0,0 ; mulps 0xaed3(%eax),%xmm0
+ DB 15,89,128,217,174,0,0 ; mulps 0xaed9(%eax),%xmm0
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,84,204 ; andps %xmm4,%xmm1
DB 139,69,12 ; mov 0xc(%ebp),%eax
@@ -48154,9 +48156,9 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 129,236,200,0,0,0 ; sub $0xc8,%esp
DB 15,41,157,56,255,255,255 ; movaps %xmm3,-0xc8(%ebp)
DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
- DB 232,0,0,0,0 ; call 2428 <_sk_hsl_to_rgb_sse2+0x19>
+ DB 232,0,0,0,0 ; call 2422 <_sk_hsl_to_rgb_sse2+0x19>
DB 88 ; pop %eax
- DB 15,40,160,8,172,0,0 ; movaps 0xac08(%eax),%xmm4
+ DB 15,40,160,30,172,0,0 ; movaps 0xac1e(%eax),%xmm4
DB 15,40,220 ; movaps %xmm4,%xmm3
DB 15,41,165,104,255,255,255 ; movaps %xmm4,-0x98(%ebp)
DB 15,194,218,2 ; cmpleps %xmm2,%xmm3
@@ -48169,13 +48171,13 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,84,243 ; andps %xmm3,%xmm6
DB 15,85,217 ; andnps %xmm1,%xmm3
DB 15,86,222 ; orps %xmm6,%xmm3
- DB 15,40,168,232,173,0,0 ; movaps 0xade8(%eax),%xmm5
+ DB 15,40,168,238,173,0,0 ; movaps 0xadee(%eax),%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
DB 243,15,91,205 ; cvttps2dq %xmm5,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,193,1 ; cmpltps %xmm1,%xmm0
- DB 15,40,176,40,172,0,0 ; movaps 0xac28(%eax),%xmm6
+ DB 15,40,176,46,172,0,0 ; movaps 0xac2e(%eax),%xmm6
DB 15,41,117,136 ; movaps %xmm6,-0x78(%ebp)
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,200 ; subps %xmm0,%xmm1
@@ -48185,19 +48187,19 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
DB 15,88,210 ; addps %xmm2,%xmm2
DB 15,92,211 ; subps %xmm3,%xmm2
- DB 15,40,184,248,173,0,0 ; movaps 0xadf8(%eax),%xmm7
+ DB 15,40,184,254,173,0,0 ; movaps 0xadfe(%eax),%xmm7
DB 15,41,189,88,255,255,255 ; movaps %xmm7,-0xa8(%ebp)
DB 15,194,253,2 ; cmpleps %xmm5,%xmm7
DB 15,92,218 ; subps %xmm2,%xmm3
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
DB 15,40,204 ; movaps %xmm4,%xmm1
DB 15,194,205,2 ; cmpleps %xmm5,%xmm1
- DB 15,40,160,216,173,0,0 ; movaps 0xadd8(%eax),%xmm4
+ DB 15,40,160,222,173,0,0 ; movaps 0xadde(%eax),%xmm4
DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp)
DB 15,194,229,2 ; cmpleps %xmm5,%xmm4
- DB 15,40,176,168,173,0,0 ; movaps 0xada8(%eax),%xmm6
+ DB 15,40,176,174,173,0,0 ; movaps 0xadae(%eax),%xmm6
DB 15,89,238 ; mulps %xmm6,%xmm5
- DB 15,40,128,200,173,0,0 ; movaps 0xadc8(%eax),%xmm0
+ DB 15,40,128,206,173,0,0 ; movaps 0xadce(%eax),%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
DB 15,92,197 ; subps %xmm5,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
@@ -48223,18 +48225,18 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,194,200,1 ; cmpltps %xmm0,%xmm1
- DB 15,84,136,40,172,0,0 ; andps 0xac28(%eax),%xmm1
+ DB 15,84,136,46,172,0,0 ; andps 0xac2e(%eax),%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,92,200 ; subps %xmm0,%xmm1
- DB 15,40,128,248,173,0,0 ; movaps 0xadf8(%eax),%xmm0
+ DB 15,40,128,254,173,0,0 ; movaps 0xadfe(%eax),%xmm0
DB 15,194,193,2 ; cmpleps %xmm1,%xmm0
- DB 15,40,152,8,172,0,0 ; movaps 0xac08(%eax),%xmm3
+ DB 15,40,152,30,172,0,0 ; movaps 0xac1e(%eax),%xmm3
DB 15,194,217,2 ; cmpleps %xmm1,%xmm3
- DB 15,40,160,216,173,0,0 ; movaps 0xadd8(%eax),%xmm4
+ DB 15,40,160,222,173,0,0 ; movaps 0xadde(%eax),%xmm4
DB 15,194,225,2 ; cmpleps %xmm1,%xmm4
DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,40,168,200,173,0,0 ; movaps 0xadc8(%eax),%xmm5
+ DB 15,40,168,206,173,0,0 ; movaps 0xadce(%eax),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,89,239 ; mulps %xmm7,%xmm5
DB 15,88,234 ; addps %xmm2,%xmm5
@@ -48254,7 +48256,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,125,232 ; movaps -0x18(%ebp),%xmm7
DB 15,85,252 ; andnps %xmm4,%xmm7
DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
- DB 15,88,152,8,174,0,0 ; addps 0xae08(%eax),%xmm3
+ DB 15,88,152,14,174,0,0 ; addps 0xae0e(%eax),%xmm3
DB 243,15,91,195 ; cvttps2dq %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
@@ -48337,7 +48339,7 @@ _sk_scale_u8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 26a2 <_sk_scale_u8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 269c <_sk_scale_u8_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48348,13 +48350,13 @@ _sk_scale_u8_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,65 ; jne 26fe <_sk_scale_u8_sse2+0x6a>
+ DB 117,65 ; jne 26f8 <_sk_scale_u8_sse2+0x6a>
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,110,170,0,0 ; pand 0xaa6e(%edx),%xmm4
+ DB 102,15,219,162,116,170,0,0 ; pand 0xaa74(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,158,171,0,0 ; mulps 0xab9e(%edx),%xmm4
+ DB 15,89,162,164,171,0,0 ; mulps 0xaba4(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 15,89,212 ; mulps %xmm4,%xmm2
@@ -48373,12 +48375,12 @@ _sk_scale_u8_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 2738 <_sk_scale_u8_sse2+0xa4>
+ DB 116,50 ; je 2732 <_sk_scale_u8_sse2+0xa4>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 2722 <_sk_scale_u8_sse2+0x8e>
+ DB 116,19 ; je 271c <_sk_scale_u8_sse2+0x8e>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,182 ; jne 26ca <_sk_scale_u8_sse2+0x36>
+ DB 117,182 ; jne 26c4 <_sk_scale_u8_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -48387,10 +48389,10 @@ _sk_scale_u8_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,146 ; jmp 26ca <_sk_scale_u8_sse2+0x36>
+ DB 235,146 ; jmp 26c4 <_sk_scale_u8_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 235,136 ; jmp 26ca <_sk_scale_u8_sse2+0x36>
+ DB 235,136 ; jmp 26c4 <_sk_scale_u8_sse2+0x36>
PUBLIC _sk_scale_565_sse2
_sk_scale_565_sse2 LABEL PROC
@@ -48403,7 +48405,7 @@ _sk_scale_565_sse2 LABEL PROC
DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 275c <_sk_scale_565_sse2+0x1a>
+ DB 232,0,0,0,0 ; call 2756 <_sk_scale_565_sse2+0x1a>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48415,20 +48417,20 @@ _sk_scale_565_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,157,0,0,0 ; jne 281a <_sk_scale_565_sse2+0xd8>
+ DB 15,133,157,0,0,0 ; jne 2814 <_sk_scale_565_sse2+0xd8>
DB 243,15,126,52,126 ; movq (%esi,%edi,2),%xmm6
DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,111,162,244,170,0,0 ; movdqa 0xaaf4(%edx),%xmm4
+ DB 102,15,111,162,250,170,0,0 ; movdqa 0xaafa(%edx),%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,212 ; cvtdq2ps %xmm4,%xmm2
- DB 15,89,146,4,171,0,0 ; mulps 0xab04(%edx),%xmm2
- DB 102,15,111,170,20,171,0,0 ; movdqa 0xab14(%edx),%xmm5
+ DB 15,89,146,10,171,0,0 ; mulps 0xab0a(%edx),%xmm2
+ DB 102,15,111,170,26,171,0,0 ; movdqa 0xab1a(%edx),%xmm5
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,36,171,0,0 ; mulps 0xab24(%edx),%xmm5
- DB 102,15,219,178,52,171,0,0 ; pand 0xab34(%edx),%xmm6
+ DB 15,89,170,42,171,0,0 ; mulps 0xab2a(%edx),%xmm5
+ DB 102,15,219,178,58,171,0,0 ; pand 0xab3a(%edx),%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,178,68,171,0,0 ; mulps 0xab44(%edx),%xmm6
+ DB 15,89,178,74,171,0,0 ; mulps 0xab4a(%edx),%xmm6
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,93,254 ; minps %xmm6,%xmm7
DB 15,40,226 ; movaps %xmm2,%xmm4
@@ -48463,22 +48465,22 @@ _sk_scale_565_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 2854 <_sk_scale_565_sse2+0x112>
+ DB 116,50 ; je 284e <_sk_scale_565_sse2+0x112>
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,23 ; je 2842 <_sk_scale_565_sse2+0x100>
+ DB 116,23 ; je 283c <_sk_scale_565_sse2+0x100>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,82,255,255,255 ; jne 2786 <_sk_scale_565_sse2+0x44>
+ DB 15,133,82,255,255,255 ; jne 2780 <_sk_scale_565_sse2+0x44>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
DB 102,15,110,36,126 ; movd (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 242,15,16,244 ; movsd %xmm4,%xmm6
- DB 233,50,255,255,255 ; jmp 2786 <_sk_scale_565_sse2+0x44>
+ DB 233,50,255,255,255 ; jmp 2780 <_sk_scale_565_sse2+0x44>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,246 ; movd %esi,%xmm6
- DB 233,37,255,255,255 ; jmp 2786 <_sk_scale_565_sse2+0x44>
+ DB 233,37,255,255,255 ; jmp 2780 <_sk_scale_565_sse2+0x44>
PUBLIC _sk_lerp_1_float_sse2
_sk_lerp_1_float_sse2 LABEL PROC
@@ -48523,7 +48525,7 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 28c9 <_sk_lerp_u8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 28c3 <_sk_lerp_u8_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48534,13 +48536,13 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,102 ; jne 294a <_sk_lerp_u8_sse2+0x8f>
+ DB 117,102 ; jne 2944 <_sk_lerp_u8_sse2+0x8f>
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,71,168,0,0 ; pand 0xa847(%edx),%xmm4
+ DB 102,15,219,162,77,168,0,0 ; pand 0xa84d(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,119,169,0,0 ; mulps 0xa977(%edx),%xmm4
+ DB 15,89,162,125,169,0,0 ; mulps 0xa97d(%edx),%xmm4
DB 15,40,105,16 ; movaps 0x10(%ecx),%xmm5
DB 15,40,113,32 ; movaps 0x20(%ecx),%xmm6
DB 15,92,197 ; subps %xmm5,%xmm0
@@ -48570,12 +48572,12 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,53 ; je 2987 <_sk_lerp_u8_sse2+0xcc>
+ DB 116,53 ; je 2981 <_sk_lerp_u8_sse2+0xcc>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 296e <_sk_lerp_u8_sse2+0xb3>
+ DB 116,19 ; je 2968 <_sk_lerp_u8_sse2+0xb3>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,145 ; jne 28f1 <_sk_lerp_u8_sse2+0x36>
+ DB 117,145 ; jne 28eb <_sk_lerp_u8_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -48584,10 +48586,10 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,106,255,255,255 ; jmp 28f1 <_sk_lerp_u8_sse2+0x36>
+ DB 233,106,255,255,255 ; jmp 28eb <_sk_lerp_u8_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 233,93,255,255,255 ; jmp 28f1 <_sk_lerp_u8_sse2+0x36>
+ DB 233,93,255,255,255 ; jmp 28eb <_sk_lerp_u8_sse2+0x36>
PUBLIC _sk_lerp_565_sse2
_sk_lerp_565_sse2 LABEL PROC
@@ -48601,7 +48603,7 @@ _sk_lerp_565_sse2 LABEL PROC
DB 15,41,85,136 ; movaps %xmm2,-0x78(%ebp)
DB 15,41,77,152 ; movaps %xmm1,-0x68(%ebp)
DB 102,15,127,69,184 ; movdqa %xmm0,-0x48(%ebp)
- DB 232,0,0,0,0 ; call 29b3 <_sk_lerp_565_sse2+0x1f>
+ DB 232,0,0,0,0 ; call 29ad <_sk_lerp_565_sse2+0x1f>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48613,20 +48615,20 @@ _sk_lerp_565_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,211,0,0,0 ; jne 2aa7 <_sk_lerp_565_sse2+0x113>
+ DB 15,133,211,0,0,0 ; jne 2aa1 <_sk_lerp_565_sse2+0x113>
DB 243,15,126,44,126 ; movq (%esi,%edi,2),%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
- DB 102,15,111,162,157,168,0,0 ; movdqa 0xa89d(%edx),%xmm4
+ DB 102,15,111,162,163,168,0,0 ; movdqa 0xa8a3(%edx),%xmm4
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 15,91,204 ; cvtdq2ps %xmm4,%xmm1
- DB 15,89,138,173,168,0,0 ; mulps 0xa8ad(%edx),%xmm1
- DB 102,15,111,178,189,168,0,0 ; movdqa 0xa8bd(%edx),%xmm6
+ DB 15,89,138,179,168,0,0 ; mulps 0xa8b3(%edx),%xmm1
+ DB 102,15,111,178,195,168,0,0 ; movdqa 0xa8c3(%edx),%xmm6
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,178,205,168,0,0 ; mulps 0xa8cd(%edx),%xmm6
- DB 102,15,219,170,221,168,0,0 ; pand 0xa8dd(%edx),%xmm5
+ DB 15,89,178,211,168,0,0 ; mulps 0xa8d3(%edx),%xmm6
+ DB 102,15,219,170,227,168,0,0 ; pand 0xa8e3(%edx),%xmm5
DB 15,91,213 ; cvtdq2ps %xmm5,%xmm2
- DB 15,89,146,237,168,0,0 ; mulps 0xa8ed(%edx),%xmm2
+ DB 15,89,146,243,168,0,0 ; mulps 0xa8f3(%edx),%xmm2
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
DB 15,40,254 ; movaps %xmm6,%xmm7
@@ -48676,22 +48678,22 @@ _sk_lerp_565_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 2ae1 <_sk_lerp_565_sse2+0x14d>
+ DB 116,50 ; je 2adb <_sk_lerp_565_sse2+0x14d>
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,23 ; je 2acf <_sk_lerp_565_sse2+0x13b>
+ DB 116,23 ; je 2ac9 <_sk_lerp_565_sse2+0x13b>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,28,255,255,255 ; jne 29dd <_sk_lerp_565_sse2+0x49>
+ DB 15,133,28,255,255,255 ; jne 29d7 <_sk_lerp_565_sse2+0x49>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,236,69 ; pshufd $0x45,%xmm4,%xmm5
DB 102,15,110,36,126 ; movd (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 242,15,16,236 ; movsd %xmm4,%xmm5
- DB 233,252,254,255,255 ; jmp 29dd <_sk_lerp_565_sse2+0x49>
+ DB 233,252,254,255,255 ; jmp 29d7 <_sk_lerp_565_sse2+0x49>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,238 ; movd %esi,%xmm5
- DB 233,239,254,255,255 ; jmp 29dd <_sk_lerp_565_sse2+0x49>
+ DB 233,239,254,255,255 ; jmp 29d7 <_sk_lerp_565_sse2+0x49>
PUBLIC _sk_load_tables_sse2
_sk_load_tables_sse2 LABEL PROC
@@ -48701,7 +48703,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 2afc <_sk_load_tables_sse2+0xe>
+ DB 232,0,0,0,0 ; call 2af6 <_sk_load_tables_sse2+0xe>
DB 90 ; pop %edx
DB 139,117,12 ; mov 0xc(%ebp),%esi
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -48710,9 +48712,9 @@ _sk_load_tables_sse2 LABEL PROC
DB 133,192 ; test %eax,%eax
DB 139,54 ; mov (%esi),%esi
DB 139,30 ; mov (%esi),%ebx
- DB 15,133,19,1,0,0 ; jne 2c27 <_sk_load_tables_sse2+0x139>
+ DB 15,133,19,1,0,0 ; jne 2c21 <_sk_load_tables_sse2+0x139>
DB 243,15,111,28,187 ; movdqu (%ebx,%edi,4),%xmm3
- DB 102,15,111,146,20,166,0,0 ; movdqa 0xa614(%edx),%xmm2
+ DB 102,15,111,146,26,166,0,0 ; movdqa 0xa61a(%edx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
@@ -48768,7 +48770,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 15,20,215 ; unpcklps %xmm7,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,68,167,0,0 ; mulps 0xa744(%edx),%xmm3
+ DB 15,89,154,74,167,0,0 ; mulps 0xa74a(%edx),%xmm3
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 137,194 ; mov %eax,%edx
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -48784,18 +48786,18 @@ _sk_load_tables_sse2 LABEL PROC
DB 195 ; ret
DB 36,3 ; and $0x3,%al
DB 60,1 ; cmp $0x1,%al
- DB 116,37 ; je 2c52 <_sk_load_tables_sse2+0x164>
+ DB 116,37 ; je 2c4c <_sk_load_tables_sse2+0x164>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 60,2 ; cmp $0x2,%al
- DB 116,19 ; je 2c48 <_sk_load_tables_sse2+0x15a>
+ DB 116,19 ; je 2c42 <_sk_load_tables_sse2+0x15a>
DB 60,3 ; cmp $0x3,%al
- DB 15,133,220,254,255,255 ; jne 2b19 <_sk_load_tables_sse2+0x2b>
+ DB 15,133,220,254,255,255 ; jne 2b13 <_sk_load_tables_sse2+0x2b>
DB 102,15,110,68,187,8 ; movd 0x8(%ebx,%edi,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,18,28,187 ; movlpd (%ebx,%edi,4),%xmm3
- DB 233,199,254,255,255 ; jmp 2b19 <_sk_load_tables_sse2+0x2b>
+ DB 233,199,254,255,255 ; jmp 2b13 <_sk_load_tables_sse2+0x2b>
DB 102,15,110,28,187 ; movd (%ebx,%edi,4),%xmm3
- DB 233,189,254,255,255 ; jmp 2b19 <_sk_load_tables_sse2+0x2b>
+ DB 233,189,254,255,255 ; jmp 2b13 <_sk_load_tables_sse2+0x2b>
PUBLIC _sk_load_tables_u16_be_sse2
_sk_load_tables_u16_be_sse2 LABEL PROC
@@ -48805,7 +48807,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,44 ; sub $0x2c,%esp
- DB 232,0,0,0,0 ; call 2c6a <_sk_load_tables_u16_be_sse2+0xe>
+ DB 232,0,0,0,0 ; call 2c64 <_sk_load_tables_u16_be_sse2+0xe>
DB 90 ; pop %edx
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
@@ -48816,7 +48818,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 139,57 ; mov (%ecx),%edi
DB 139,15 ; mov (%edi),%ecx
DB 190,255,0,255,0 ; mov $0xff00ff,%esi
- DB 15,133,166,1,0,0 ; jne 2e30 <_sk_load_tables_u16_be_sse2+0x1d4>
+ DB 15,133,166,1,0,0 ; jne 2e2a <_sk_load_tables_u16_be_sse2+0x1d4>
DB 102,15,16,4,89 ; movupd (%ecx,%ebx,2),%xmm0
DB 243,15,111,76,89,16 ; movdqu 0x10(%ecx,%ebx,2),%xmm1
DB 102,15,40,216 ; movapd %xmm0,%xmm3
@@ -48913,7 +48915,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 243,15,126,93,208 ; movq -0x30(%ebp),%xmm3
DB 102,15,97,223 ; punpcklwd %xmm7,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,70,166,0,0 ; mulps 0xa646(%edx),%xmm3
+ DB 15,89,154,76,166,0,0 ; mulps 0xa64c(%edx),%xmm3
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 137,193 ; mov %eax,%ecx
DB 141,65,8 ; lea 0x8(%ecx),%eax
@@ -48930,12 +48932,12 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 242,15,16,4,89 ; movsd (%ecx,%ebx,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,248,1 ; cmp $0x1,%eax
- DB 15,132,83,254,255,255 ; je 2c95 <_sk_load_tables_u16_be_sse2+0x39>
+ DB 15,132,83,254,255,255 ; je 2c8f <_sk_load_tables_u16_be_sse2+0x39>
DB 102,15,22,68,89,8 ; movhpd 0x8(%ecx,%ebx,2),%xmm0
DB 131,248,3 ; cmp $0x3,%eax
- DB 15,130,68,254,255,255 ; jb 2c95 <_sk_load_tables_u16_be_sse2+0x39>
+ DB 15,130,68,254,255,255 ; jb 2c8f <_sk_load_tables_u16_be_sse2+0x39>
DB 243,15,126,76,89,16 ; movq 0x10(%ecx,%ebx,2),%xmm1
- DB 233,57,254,255,255 ; jmp 2c95 <_sk_load_tables_u16_be_sse2+0x39>
+ DB 233,57,254,255,255 ; jmp 2c8f <_sk_load_tables_u16_be_sse2+0x39>
PUBLIC _sk_load_tables_rgb_u16_be_sse2
_sk_load_tables_rgb_u16_be_sse2 LABEL PROC
@@ -48945,7 +48947,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,28 ; sub $0x1c,%esp
- DB 232,0,0,0,0 ; call 2e6a <_sk_load_tables_rgb_u16_be_sse2+0xe>
+ DB 232,0,0,0,0 ; call 2e64 <_sk_load_tables_rgb_u16_be_sse2+0xe>
DB 88 ; pop %eax
DB 137,69,240 ; mov %eax,-0x10(%ebp)
DB 139,69,12 ; mov 0xc(%ebp),%eax
@@ -48956,7 +48958,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 139,56 ; mov (%eax),%edi
DB 139,7 ; mov (%edi),%eax
DB 190,255,0,255,0 ; mov $0xff00ff,%esi
- DB 15,133,141,1,0,0 ; jne 3018 <_sk_load_tables_rgb_u16_be_sse2+0x1bc>
+ DB 15,133,141,1,0,0 ; jne 3012 <_sk_load_tables_rgb_u16_be_sse2+0x1bc>
DB 243,15,111,12,88 ; movdqu (%eax,%ebx,2),%xmm1
DB 243,15,111,92,88,8 ; movdqu 0x8(%eax,%ebx,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -49050,7 +49052,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 141,65,8 ; lea 0x8(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 139,85,240 ; mov -0x10(%ebp),%edx
- DB 15,40,162,230,161,0,0 ; movaps 0xa1e6(%edx),%xmm4
+ DB 15,40,162,236,161,0,0 ; movaps 0xa1ec(%edx),%xmm4
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,40,220 ; movaps %xmm4,%xmm3
DB 80 ; push %eax
@@ -49066,20 +49068,20 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,15,196,76,88,4,2 ; pinsrw $0x2,0x4(%eax,%ebx,2),%xmm1
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 131,249,1 ; cmp $0x1,%ecx
- DB 117,13 ; jne 303a <_sk_load_tables_rgb_u16_be_sse2+0x1de>
+ DB 117,13 ; jne 3034 <_sk_load_tables_rgb_u16_be_sse2+0x1de>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,115,254,255,255 ; jmp 2ead <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ DB 233,115,254,255,255 ; jmp 2ea7 <_sk_load_tables_rgb_u16_be_sse2+0x51>
DB 102,15,110,68,88,6 ; movd 0x6(%eax,%ebx,2),%xmm0
DB 102,15,196,68,88,10,2 ; pinsrw $0x2,0xa(%eax,%ebx,2),%xmm0
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 131,249,3 ; cmp $0x3,%ecx
- DB 114,18 ; jb 3062 <_sk_load_tables_rgb_u16_be_sse2+0x206>
+ DB 114,18 ; jb 305c <_sk_load_tables_rgb_u16_be_sse2+0x206>
DB 102,15,110,92,88,12 ; movd 0xc(%eax,%ebx,2),%xmm3
DB 102,15,196,92,88,16,2 ; pinsrw $0x2,0x10(%eax,%ebx,2),%xmm3
- DB 233,75,254,255,255 ; jmp 2ead <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ DB 233,75,254,255,255 ; jmp 2ea7 <_sk_load_tables_rgb_u16_be_sse2+0x51>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,66,254,255,255 ; jmp 2ead <_sk_load_tables_rgb_u16_be_sse2+0x51>
+ DB 233,66,254,255,255 ; jmp 2ea7 <_sk_load_tables_rgb_u16_be_sse2+0x51>
PUBLIC _sk_byte_tables_sse2
_sk_byte_tables_sse2 LABEL PROC
@@ -49089,11 +49091,11 @@ _sk_byte_tables_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 3079 <_sk_byte_tables_sse2+0xe>
+ DB 232,0,0,0,0 ; call 3073 <_sk_byte_tables_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
- DB 15,40,162,167,160,0,0 ; movaps 0xa0a7(%edx),%xmm4
+ DB 15,40,162,173,160,0,0 ; movaps 0xa0ad(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5
@@ -49115,7 +49117,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,15,196,192,0 ; pinsrw $0x0,%eax,%xmm0
DB 139,65,4 ; mov 0x4(%ecx),%eax
DB 102,15,196,195,1 ; pinsrw $0x1,%ebx,%xmm0
- DB 15,40,170,199,161,0,0 ; movaps 0xa1c7(%edx),%xmm5
+ DB 15,40,170,205,161,0,0 ; movaps 0xa1cd(%edx),%xmm5
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -49238,12 +49240,12 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 15,182,60,31 ; movzbl (%edi,%ebx,1),%edi
DB 193,231,8 ; shl $0x8,%edi
DB 9,215 ; or %edx,%edi
- DB 232,0,0,0,0 ; call 3279 <_sk_byte_tables_rgb_sse2+0x65>
+ DB 232,0,0,0,0 ; call 3273 <_sk_byte_tables_rgb_sse2+0x65>
DB 90 ; pop %edx
DB 102,15,196,199,0 ; pinsrw $0x0,%edi,%xmm0
DB 139,121,4 ; mov 0x4(%ecx),%edi
DB 102,15,196,198,1 ; pinsrw $0x1,%esi,%xmm0
- DB 15,40,170,199,159,0,0 ; movaps 0x9fc7(%edx),%xmm5
+ DB 15,40,170,205,159,0,0 ; movaps 0x9fcd(%edx),%xmm5
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -49469,7 +49471,7 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 3548 <_sk_parametric_r_sse2+0x18>
+ DB 232,0,0,0,0 ; call 3542 <_sk_parametric_r_sse2+0x18>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
@@ -49489,15 +49491,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,120,157,0,0 ; mulps 0x9d78(%edx),%xmm5
- DB 15,84,178,136,157,0,0 ; andps 0x9d88(%edx),%xmm6
- DB 15,86,178,232,154,0,0 ; orps 0x9ae8(%edx),%xmm6
- DB 15,88,170,152,157,0,0 ; addps 0x9d98(%edx),%xmm5
- DB 15,40,186,168,157,0,0 ; movaps 0x9da8(%edx),%xmm7
+ DB 15,89,170,126,157,0,0 ; mulps 0x9d7e(%edx),%xmm5
+ DB 15,84,178,142,157,0,0 ; andps 0x9d8e(%edx),%xmm6
+ DB 15,86,178,254,154,0,0 ; orps 0x9afe(%edx),%xmm6
+ DB 15,88,170,158,157,0,0 ; addps 0x9d9e(%edx),%xmm5
+ DB 15,40,186,174,157,0,0 ; movaps 0x9dae(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,184,157,0,0 ; addps 0x9db8(%edx),%xmm6
- DB 15,40,186,200,157,0,0 ; movaps 0x9dc8(%edx),%xmm7
+ DB 15,88,178,190,157,0,0 ; addps 0x9dbe(%edx),%xmm6
+ DB 15,40,186,206,157,0,0 ; movaps 0x9dce(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -49507,21 +49509,21 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,8,155,0,0 ; movaps 0x9b08(%edx),%xmm6
+ DB 15,40,178,14,155,0,0 ; movaps 0x9b0e(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,216,157,0,0 ; addps 0x9dd8(%edx),%xmm5
- DB 15,40,186,232,157,0,0 ; movaps 0x9de8(%edx),%xmm7
+ DB 15,88,170,222,157,0,0 ; addps 0x9dde(%edx),%xmm5
+ DB 15,40,186,238,157,0,0 ; movaps 0x9dee(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,248,157,0,0 ; movaps 0x9df8(%edx),%xmm7
+ DB 15,40,186,254,157,0,0 ; movaps 0x9dfe(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,8,158,0,0 ; movaps 0x9e08(%edx),%xmm0
+ DB 15,40,130,14,158,0,0 ; movaps 0x9e0e(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,24,158,0,0 ; mulps 0x9e18(%edx),%xmm0
+ DB 15,89,130,30,158,0,0 ; mulps 0x9e1e(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -49553,7 +49555,7 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 367f <_sk_parametric_g_sse2+0x15>
+ DB 232,0,0,0,0 ; call 3679 <_sk_parametric_g_sse2+0x15>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
@@ -49573,15 +49575,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,65,156,0,0 ; mulps 0x9c41(%edx),%xmm5
- DB 15,84,178,81,156,0,0 ; andps 0x9c51(%edx),%xmm6
- DB 15,86,178,177,153,0,0 ; orps 0x99b1(%edx),%xmm6
- DB 15,88,170,97,156,0,0 ; addps 0x9c61(%edx),%xmm5
- DB 15,40,186,113,156,0,0 ; movaps 0x9c71(%edx),%xmm7
+ DB 15,89,170,71,156,0,0 ; mulps 0x9c47(%edx),%xmm5
+ DB 15,84,178,87,156,0,0 ; andps 0x9c57(%edx),%xmm6
+ DB 15,86,178,199,153,0,0 ; orps 0x99c7(%edx),%xmm6
+ DB 15,88,170,103,156,0,0 ; addps 0x9c67(%edx),%xmm5
+ DB 15,40,186,119,156,0,0 ; movaps 0x9c77(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,129,156,0,0 ; addps 0x9c81(%edx),%xmm6
- DB 15,40,186,145,156,0,0 ; movaps 0x9c91(%edx),%xmm7
+ DB 15,88,178,135,156,0,0 ; addps 0x9c87(%edx),%xmm6
+ DB 15,40,186,151,156,0,0 ; movaps 0x9c97(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -49591,21 +49593,21 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,209,153,0,0 ; movaps 0x99d1(%edx),%xmm6
+ DB 15,40,178,215,153,0,0 ; movaps 0x99d7(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,161,156,0,0 ; addps 0x9ca1(%edx),%xmm5
- DB 15,40,186,177,156,0,0 ; movaps 0x9cb1(%edx),%xmm7
+ DB 15,88,170,167,156,0,0 ; addps 0x9ca7(%edx),%xmm5
+ DB 15,40,186,183,156,0,0 ; movaps 0x9cb7(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,193,156,0,0 ; movaps 0x9cc1(%edx),%xmm7
+ DB 15,40,186,199,156,0,0 ; movaps 0x9cc7(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,209,156,0,0 ; movaps 0x9cd1(%edx),%xmm0
+ DB 15,40,130,215,156,0,0 ; movaps 0x9cd7(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,225,156,0,0 ; mulps 0x9ce1(%edx),%xmm0
+ DB 15,89,130,231,156,0,0 ; mulps 0x9ce7(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -49636,7 +49638,7 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,217 ; movaps %xmm1,%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 37b3 <_sk_parametric_b_sse2+0x15>
+ DB 232,0,0,0,0 ; call 37ad <_sk_parametric_b_sse2+0x15>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
@@ -49656,15 +49658,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,13,155,0,0 ; mulps 0x9b0d(%edx),%xmm5
- DB 15,84,178,29,155,0,0 ; andps 0x9b1d(%edx),%xmm6
- DB 15,86,178,125,152,0,0 ; orps 0x987d(%edx),%xmm6
- DB 15,88,170,45,155,0,0 ; addps 0x9b2d(%edx),%xmm5
- DB 15,40,186,61,155,0,0 ; movaps 0x9b3d(%edx),%xmm7
+ DB 15,89,170,19,155,0,0 ; mulps 0x9b13(%edx),%xmm5
+ DB 15,84,178,35,155,0,0 ; andps 0x9b23(%edx),%xmm6
+ DB 15,86,178,147,152,0,0 ; orps 0x9893(%edx),%xmm6
+ DB 15,88,170,51,155,0,0 ; addps 0x9b33(%edx),%xmm5
+ DB 15,40,186,67,155,0,0 ; movaps 0x9b43(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,77,155,0,0 ; addps 0x9b4d(%edx),%xmm6
- DB 15,40,186,93,155,0,0 ; movaps 0x9b5d(%edx),%xmm7
+ DB 15,88,178,83,155,0,0 ; addps 0x9b53(%edx),%xmm6
+ DB 15,40,186,99,155,0,0 ; movaps 0x9b63(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -49674,21 +49676,21 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,157,152,0,0 ; movaps 0x989d(%edx),%xmm6
+ DB 15,40,178,163,152,0,0 ; movaps 0x98a3(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,109,155,0,0 ; addps 0x9b6d(%edx),%xmm5
- DB 15,40,186,125,155,0,0 ; movaps 0x9b7d(%edx),%xmm7
+ DB 15,88,170,115,155,0,0 ; addps 0x9b73(%edx),%xmm5
+ DB 15,40,186,131,155,0,0 ; movaps 0x9b83(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,141,155,0,0 ; movaps 0x9b8d(%edx),%xmm7
+ DB 15,40,186,147,155,0,0 ; movaps 0x9b93(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,157,155,0,0 ; movaps 0x9b9d(%edx),%xmm0
+ DB 15,40,130,163,155,0,0 ; movaps 0x9ba3(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,173,155,0,0 ; mulps 0x9bad(%edx),%xmm0
+ DB 15,89,130,179,155,0,0 ; mulps 0x9bb3(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -49719,7 +49721,7 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,41,85,232 ; movaps %xmm2,-0x18(%ebp)
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 38e7 <_sk_parametric_a_sse2+0x15>
+ DB 232,0,0,0,0 ; call 38e1 <_sk_parametric_a_sse2+0x15>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
@@ -49739,15 +49741,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,217,153,0,0 ; mulps 0x99d9(%edx),%xmm5
- DB 15,84,178,233,153,0,0 ; andps 0x99e9(%edx),%xmm6
- DB 15,86,178,73,151,0,0 ; orps 0x9749(%edx),%xmm6
- DB 15,88,170,249,153,0,0 ; addps 0x99f9(%edx),%xmm5
- DB 15,40,186,9,154,0,0 ; movaps 0x9a09(%edx),%xmm7
+ DB 15,89,170,223,153,0,0 ; mulps 0x99df(%edx),%xmm5
+ DB 15,84,178,239,153,0,0 ; andps 0x99ef(%edx),%xmm6
+ DB 15,86,178,95,151,0,0 ; orps 0x975f(%edx),%xmm6
+ DB 15,88,170,255,153,0,0 ; addps 0x99ff(%edx),%xmm5
+ DB 15,40,186,15,154,0,0 ; movaps 0x9a0f(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,25,154,0,0 ; addps 0x9a19(%edx),%xmm6
- DB 15,40,186,41,154,0,0 ; movaps 0x9a29(%edx),%xmm7
+ DB 15,88,178,31,154,0,0 ; addps 0x9a1f(%edx),%xmm6
+ DB 15,40,186,47,154,0,0 ; movaps 0x9a2f(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -49757,21 +49759,21 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,105,151,0,0 ; movaps 0x9769(%edx),%xmm6
+ DB 15,40,178,111,151,0,0 ; movaps 0x976f(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,57,154,0,0 ; addps 0x9a39(%edx),%xmm5
- DB 15,40,186,73,154,0,0 ; movaps 0x9a49(%edx),%xmm7
+ DB 15,88,170,63,154,0,0 ; addps 0x9a3f(%edx),%xmm5
+ DB 15,40,186,79,154,0,0 ; movaps 0x9a4f(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,89,154,0,0 ; movaps 0x9a59(%edx),%xmm7
+ DB 15,40,186,95,154,0,0 ; movaps 0x9a5f(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,105,154,0,0 ; movaps 0x9a69(%edx),%xmm0
+ DB 15,40,130,111,154,0,0 ; movaps 0x9a6f(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,121,154,0,0 ; mulps 0x9a79(%edx),%xmm0
+ DB 15,89,130,127,154,0,0 ; mulps 0x9a7f(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -49801,18 +49803,18 @@ _sk_gamma_sse2 LABEL PROC
DB 131,236,40 ; sub $0x28,%esp
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
DB 15,40,216 ; movaps %xmm0,%xmm3
- DB 232,0,0,0,0 ; call 3a18 <_sk_gamma_sse2+0x12>
+ DB 232,0,0,0,0 ; call 3a12 <_sk_gamma_sse2+0x12>
DB 88 ; pop %eax
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,128,168,152,0,0 ; mulps 0x98a8(%eax),%xmm0
- DB 15,84,152,184,152,0,0 ; andps 0x98b8(%eax),%xmm3
- DB 15,86,152,24,150,0,0 ; orps 0x9618(%eax),%xmm3
- DB 15,88,128,200,152,0,0 ; addps 0x98c8(%eax),%xmm0
+ DB 15,89,128,174,152,0,0 ; mulps 0x98ae(%eax),%xmm0
+ DB 15,84,152,190,152,0,0 ; andps 0x98be(%eax),%xmm3
+ DB 15,86,152,46,150,0,0 ; orps 0x962e(%eax),%xmm3
+ DB 15,88,128,206,152,0,0 ; addps 0x98ce(%eax),%xmm0
DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 15,89,160,216,152,0,0 ; mulps 0x98d8(%eax),%xmm4
+ DB 15,89,160,222,152,0,0 ; mulps 0x98de(%eax),%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,88,152,232,152,0,0 ; addps 0x98e8(%eax),%xmm3
- DB 15,40,160,248,152,0,0 ; movaps 0x98f8(%eax),%xmm4
+ DB 15,88,152,238,152,0,0 ; addps 0x98ee(%eax),%xmm3
+ DB 15,40,160,254,152,0,0 ; movaps 0x98fe(%eax),%xmm4
DB 15,94,227 ; divps %xmm3,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
DB 139,77,12 ; mov 0xc(%ebp),%ecx
@@ -49825,30 +49827,30 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,194,227,1 ; cmpltps %xmm3,%xmm4
- DB 15,84,160,56,150,0,0 ; andps 0x9638(%eax),%xmm4
+ DB 15,84,160,62,150,0,0 ; andps 0x963e(%eax),%xmm4
DB 15,92,220 ; subps %xmm4,%xmm3
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
- DB 15,88,128,8,153,0,0 ; addps 0x9908(%eax),%xmm0
- DB 15,40,176,40,153,0,0 ; movaps 0x9928(%eax),%xmm6
+ DB 15,88,128,14,153,0,0 ; addps 0x990e(%eax),%xmm0
+ DB 15,40,176,46,153,0,0 ; movaps 0x992e(%eax),%xmm6
DB 15,92,244 ; subps %xmm4,%xmm6
- DB 15,40,168,24,153,0,0 ; movaps 0x9918(%eax),%xmm5
+ DB 15,40,168,30,153,0,0 ; movaps 0x991e(%eax),%xmm5
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,40,152,56,153,0,0 ; movaps 0x9938(%eax),%xmm3
+ DB 15,40,152,62,153,0,0 ; movaps 0x993e(%eax),%xmm3
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,94,230 ; divps %xmm6,%xmm4
DB 15,88,224 ; addps %xmm0,%xmm4
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,128,168,152,0,0 ; mulps 0x98a8(%eax),%xmm0
- DB 15,84,136,184,152,0,0 ; andps 0x98b8(%eax),%xmm1
- DB 15,86,136,24,150,0,0 ; orps 0x9618(%eax),%xmm1
- DB 15,88,128,200,152,0,0 ; addps 0x98c8(%eax),%xmm0
+ DB 15,89,128,174,152,0,0 ; mulps 0x98ae(%eax),%xmm0
+ DB 15,84,136,190,152,0,0 ; andps 0x98be(%eax),%xmm1
+ DB 15,86,136,46,150,0,0 ; orps 0x962e(%eax),%xmm1
+ DB 15,88,128,206,152,0,0 ; addps 0x98ce(%eax),%xmm0
DB 15,40,241 ; movaps %xmm1,%xmm6
- DB 15,89,176,216,152,0,0 ; mulps 0x98d8(%eax),%xmm6
+ DB 15,89,176,222,152,0,0 ; mulps 0x98de(%eax),%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
- DB 15,88,136,232,152,0,0 ; addps 0x98e8(%eax),%xmm1
- DB 15,40,176,248,152,0,0 ; movaps 0x98f8(%eax),%xmm6
+ DB 15,88,136,238,152,0,0 ; addps 0x98ee(%eax),%xmm1
+ DB 15,40,176,254,152,0,0 ; movaps 0x98fe(%eax),%xmm6
DB 15,94,241 ; divps %xmm1,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
@@ -49856,12 +49858,12 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,194,241,1 ; cmpltps %xmm1,%xmm6
- DB 15,84,176,56,150,0,0 ; andps 0x9638(%eax),%xmm6
+ DB 15,84,176,62,150,0,0 ; andps 0x963e(%eax),%xmm6
DB 15,92,206 ; subps %xmm6,%xmm1
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,241 ; subps %xmm1,%xmm6
- DB 15,88,128,8,153,0,0 ; addps 0x9908(%eax),%xmm0
- DB 15,40,184,40,153,0,0 ; movaps 0x9928(%eax),%xmm7
+ DB 15,88,128,14,153,0,0 ; addps 0x990e(%eax),%xmm0
+ DB 15,40,184,46,153,0,0 ; movaps 0x992e(%eax),%xmm7
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
@@ -49869,15 +49871,15 @@ _sk_gamma_sse2 LABEL PROC
DB 15,94,207 ; divps %xmm7,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,128,168,152,0,0 ; mulps 0x98a8(%eax),%xmm0
- DB 15,84,144,184,152,0,0 ; andps 0x98b8(%eax),%xmm2
- DB 15,86,144,24,150,0,0 ; orps 0x9618(%eax),%xmm2
- DB 15,88,128,200,152,0,0 ; addps 0x98c8(%eax),%xmm0
- DB 15,40,176,216,152,0,0 ; movaps 0x98d8(%eax),%xmm6
+ DB 15,89,128,174,152,0,0 ; mulps 0x98ae(%eax),%xmm0
+ DB 15,84,144,190,152,0,0 ; andps 0x98be(%eax),%xmm2
+ DB 15,86,144,46,150,0,0 ; orps 0x962e(%eax),%xmm2
+ DB 15,88,128,206,152,0,0 ; addps 0x98ce(%eax),%xmm0
+ DB 15,40,176,222,152,0,0 ; movaps 0x98de(%eax),%xmm6
DB 15,89,242 ; mulps %xmm2,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
- DB 15,88,144,232,152,0,0 ; addps 0x98e8(%eax),%xmm2
- DB 15,40,176,248,152,0,0 ; movaps 0x98f8(%eax),%xmm6
+ DB 15,88,144,238,152,0,0 ; addps 0x98ee(%eax),%xmm2
+ DB 15,40,176,254,152,0,0 ; movaps 0x98fe(%eax),%xmm6
DB 15,94,242 ; divps %xmm2,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
DB 15,89,69,232 ; mulps -0x18(%ebp),%xmm0
@@ -49885,18 +49887,18 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,194,242,1 ; cmpltps %xmm2,%xmm6
- DB 15,84,176,56,150,0,0 ; andps 0x9638(%eax),%xmm6
+ DB 15,84,176,62,150,0,0 ; andps 0x963e(%eax),%xmm6
DB 15,92,214 ; subps %xmm6,%xmm2
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
- DB 15,88,128,8,153,0,0 ; addps 0x9908(%eax),%xmm0
+ DB 15,88,128,14,153,0,0 ; addps 0x990e(%eax),%xmm0
DB 15,89,238 ; mulps %xmm6,%xmm5
DB 15,92,197 ; subps %xmm5,%xmm0
- DB 15,40,144,40,153,0,0 ; movaps 0x9928(%eax),%xmm2
+ DB 15,40,144,46,153,0,0 ; movaps 0x992e(%eax),%xmm2
DB 15,92,214 ; subps %xmm6,%xmm2
DB 15,94,218 ; divps %xmm2,%xmm3
DB 15,88,216 ; addps %xmm0,%xmm3
- DB 15,40,128,72,153,0,0 ; movaps 0x9948(%eax),%xmm0
+ DB 15,40,128,78,153,0,0 ; movaps 0x994e(%eax),%xmm0
DB 15,89,224 ; mulps %xmm0,%xmm4
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,89,216 ; mulps %xmm0,%xmm3
@@ -49921,31 +49923,31 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 3c00 <_sk_lab_to_xyz_sse2+0x15>
+ DB 232,0,0,0,0 ; call 3bfa <_sk_lab_to_xyz_sse2+0x15>
DB 88 ; pop %eax
- DB 15,89,144,112,151,0,0 ; mulps 0x9770(%eax),%xmm2
- DB 15,40,160,32,149,0,0 ; movaps 0x9520(%eax),%xmm4
+ DB 15,89,144,118,151,0,0 ; mulps 0x9776(%eax),%xmm2
+ DB 15,40,160,38,149,0,0 ; movaps 0x9526(%eax),%xmm4
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,40,168,128,151,0,0 ; movaps 0x9780(%eax),%xmm5
+ DB 15,40,168,134,151,0,0 ; movaps 0x9786(%eax),%xmm5
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,89,220 ; mulps %xmm4,%xmm3
DB 15,88,221 ; addps %xmm5,%xmm3
- DB 15,88,144,144,151,0,0 ; addps 0x9790(%eax),%xmm2
- DB 15,89,144,160,151,0,0 ; mulps 0x97a0(%eax),%xmm2
- DB 15,89,136,176,151,0,0 ; mulps 0x97b0(%eax),%xmm1
+ DB 15,88,144,150,151,0,0 ; addps 0x9796(%eax),%xmm2
+ DB 15,89,144,166,151,0,0 ; mulps 0x97a6(%eax),%xmm2
+ DB 15,89,136,182,151,0,0 ; mulps 0x97b6(%eax),%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,89,152,192,151,0,0 ; mulps 0x97c0(%eax),%xmm3
+ DB 15,89,152,198,151,0,0 ; mulps 0x97c6(%eax),%xmm3
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,152,208,151,0,0 ; movaps 0x97d0(%eax),%xmm3
+ DB 15,40,152,214,151,0,0 ; movaps 0x97d6(%eax),%xmm3
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,194,224,1 ; cmpltps %xmm0,%xmm4
- DB 15,40,176,224,151,0,0 ; movaps 0x97e0(%eax),%xmm6
+ DB 15,40,176,230,151,0,0 ; movaps 0x97e6(%eax),%xmm6
DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,40,184,240,151,0,0 ; movaps 0x97f0(%eax),%xmm7
+ DB 15,40,184,246,151,0,0 ; movaps 0x97f6(%eax),%xmm7
DB 15,89,207 ; mulps %xmm7,%xmm1
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,85,225 ; andnps %xmm1,%xmm4
@@ -49970,8 +49972,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,85,221 ; andnps %xmm5,%xmm3
DB 15,86,216 ; orps %xmm0,%xmm3
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,89,160,0,152,0,0 ; mulps 0x9800(%eax),%xmm4
- DB 15,89,152,16,152,0,0 ; mulps 0x9810(%eax),%xmm3
+ DB 15,89,160,6,152,0,0 ; mulps 0x9806(%eax),%xmm4
+ DB 15,89,152,22,152,0,0 ; mulps 0x9816(%eax),%xmm3
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
@@ -49992,7 +49994,7 @@ _sk_load_a8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 3cf0 <_sk_load_a8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 3cea <_sk_load_a8_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50003,13 +50005,13 @@ _sk_load_a8_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,60 ; jne 3d47 <_sk_load_a8_sse2+0x65>
+ DB 117,60 ; jne 3d41 <_sk_load_a8_sse2+0x65>
DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,130,32,148,0,0 ; pand 0x9420(%edx),%xmm0
+ DB 102,15,219,130,38,148,0,0 ; pand 0x9426(%edx),%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,154,80,149,0,0 ; mulps 0x9550(%edx),%xmm3
+ DB 15,89,154,86,149,0,0 ; mulps 0x9556(%edx),%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -50026,12 +50028,12 @@ _sk_load_a8_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 3d81 <_sk_load_a8_sse2+0x9f>
+ DB 116,50 ; je 3d7b <_sk_load_a8_sse2+0x9f>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3d6b <_sk_load_a8_sse2+0x89>
+ DB 116,19 ; je 3d65 <_sk_load_a8_sse2+0x89>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,187 ; jne 3d18 <_sk_load_a8_sse2+0x36>
+ DB 117,187 ; jne 3d12 <_sk_load_a8_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -50040,10 +50042,10 @@ _sk_load_a8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,151 ; jmp 3d18 <_sk_load_a8_sse2+0x36>
+ DB 235,151 ; jmp 3d12 <_sk_load_a8_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,198 ; movd %esi,%xmm0
- DB 235,141 ; jmp 3d18 <_sk_load_a8_sse2+0x36>
+ DB 235,141 ; jmp 3d12 <_sk_load_a8_sse2+0x36>
PUBLIC _sk_load_a8_dst_sse2
_sk_load_a8_dst_sse2 LABEL PROC
@@ -50066,15 +50068,15 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,127,97,32 ; movdqa %xmm4,0x20(%ecx)
DB 102,15,127,97,16 ; movdqa %xmm4,0x10(%ecx)
DB 133,219 ; test %ebx,%ebx
- DB 232,0,0,0,0 ; call 3dc4 <_sk_load_a8_dst_sse2+0x39>
+ DB 232,0,0,0,0 ; call 3dbe <_sk_load_a8_dst_sse2+0x39>
DB 90 ; pop %edx
- DB 117,54 ; jne 3dfd <_sk_load_a8_dst_sse2+0x72>
+ DB 117,54 ; jne 3df7 <_sk_load_a8_dst_sse2+0x72>
DB 102,15,110,36,55 ; movd (%edi,%esi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,76,147,0,0 ; pand 0x934c(%edx),%xmm4
+ DB 102,15,219,162,82,147,0,0 ; pand 0x9352(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,124,148,0,0 ; mulps 0x947c(%edx),%xmm4
+ DB 15,89,162,130,148,0,0 ; mulps 0x9482(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -50089,11 +50091,11 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 3e33 <_sk_load_a8_dst_sse2+0xa8>
+ DB 116,46 ; je 3e2d <_sk_load_a8_dst_sse2+0xa8>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3e1d <_sk_load_a8_dst_sse2+0x92>
+ DB 116,19 ; je 3e17 <_sk_load_a8_dst_sse2+0x92>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,197 ; jne 3dd4 <_sk_load_a8_dst_sse2+0x49>
+ DB 117,197 ; jne 3dce <_sk_load_a8_dst_sse2+0x49>
DB 15,182,92,55,2 ; movzbl 0x2(%edi,%esi,1),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -50102,10 +50104,10 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,161 ; jmp 3dd4 <_sk_load_a8_dst_sse2+0x49>
+ DB 235,161 ; jmp 3dce <_sk_load_a8_dst_sse2+0x49>
DB 15,182,52,55 ; movzbl (%edi,%esi,1),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 235,151 ; jmp 3dd4 <_sk_load_a8_dst_sse2+0x49>
+ DB 235,151 ; jmp 3dce <_sk_load_a8_dst_sse2+0x49>
PUBLIC _sk_gather_a8_sse2
_sk_gather_a8_sse2 LABEL PROC
@@ -50144,13 +50146,13 @@ _sk_gather_a8_sse2 LABEL PROC
DB 9,202 ; or %ecx,%edx
DB 102,15,196,194,0 ; pinsrw $0x0,%edx,%xmm0
DB 102,15,196,199,1 ; pinsrw $0x1,%edi,%xmm0
- DB 232,0,0,0,0 ; call 3ec2 <_sk_gather_a8_sse2+0x85>
+ DB 232,0,0,0,0 ; call 3ebc <_sk_gather_a8_sse2+0x85>
DB 89 ; pop %ecx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,153,126,147,0,0 ; mulps 0x937e(%ecx),%xmm3
+ DB 15,89,153,132,147,0,0 ; mulps 0x9384(%ecx),%xmm3
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -50173,7 +50175,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,60 ; sub $0x3c,%esp
- DB 232,0,0,0,0 ; call 3f06 <_sk_store_a8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 3f00 <_sk_store_a8_sse2+0xe>
DB 94 ; pop %esi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50182,7 +50184,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 15,175,81,4 ; imul 0x4(%ecx),%edx
DB 3,23 ; add (%edi),%edx
DB 139,89,8 ; mov 0x8(%ecx),%ebx
- DB 15,40,166,26,146,0,0 ; movaps 0x921a(%esi),%xmm4
+ DB 15,40,166,32,146,0,0 ; movaps 0x9220(%esi),%xmm4
DB 15,89,227 ; mulps %xmm3,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
DB 102,15,114,244,16 ; pslld $0x10,%xmm4
@@ -50191,7 +50193,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,26 ; jne 3f5b <_sk_store_a8_sse2+0x63>
+ DB 117,26 ; jne 3f55 <_sk_store_a8_sse2+0x63>
DB 102,15,126,230 ; movd %xmm4,%esi
DB 137,52,58 ; mov %esi,(%edx,%edi,1)
DB 141,80,8 ; lea 0x8(%eax),%edx
@@ -50209,26 +50211,26 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,57 ; je 3fa4 <_sk_store_a8_sse2+0xac>
+ DB 116,57 ; je 3f9e <_sk_store_a8_sse2+0xac>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,17 ; je 3f81 <_sk_store_a8_sse2+0x89>
+ DB 116,17 ; je 3f7b <_sk_store_a8_sse2+0x89>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,211 ; jne 3f48 <_sk_store_a8_sse2+0x50>
+ DB 117,211 ; jne 3f42 <_sk_store_a8_sse2+0x50>
DB 102,15,127,101,200 ; movdqa %xmm4,-0x38(%ebp)
DB 138,93,208 ; mov -0x30(%ebp),%bl
DB 136,92,58,2 ; mov %bl,0x2(%edx,%edi,1)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
- DB 102,15,219,166,26,149,0,0 ; pand 0x951a(%esi),%xmm4
+ DB 102,15,219,166,32,149,0,0 ; pand 0x9520(%esi),%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,126,230 ; movd %xmm4,%esi
DB 102,137,52,58 ; mov %si,(%edx,%edi,1)
- DB 235,164 ; jmp 3f48 <_sk_store_a8_sse2+0x50>
+ DB 235,164 ; jmp 3f42 <_sk_store_a8_sse2+0x50>
DB 102,15,127,101,216 ; movdqa %xmm4,-0x28(%ebp)
DB 138,93,216 ; mov -0x28(%ebp),%bl
DB 136,28,58 ; mov %bl,(%edx,%edi,1)
- DB 235,151 ; jmp 3f48 <_sk_store_a8_sse2+0x50>
+ DB 235,151 ; jmp 3f42 <_sk_store_a8_sse2+0x50>
PUBLIC _sk_load_g8_sse2
_sk_load_g8_sse2 LABEL PROC
@@ -50238,7 +50240,7 @@ _sk_load_g8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 3fbf <_sk_load_g8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 3fb9 <_sk_load_g8_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50249,16 +50251,16 @@ _sk_load_g8_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,63 ; jne 4019 <_sk_load_g8_sse2+0x68>
+ DB 117,63 ; jne 4013 <_sk_load_g8_sse2+0x68>
DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,130,81,145,0,0 ; pand 0x9151(%edx),%xmm0
+ DB 102,15,219,130,87,145,0,0 ; pand 0x9157(%edx),%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,129,146,0,0 ; mulps 0x9281(%edx),%xmm0
+ DB 15,89,130,135,146,0,0 ; mulps 0x9287(%edx),%xmm0
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,145,144,0,0 ; movaps 0x9091(%edx),%xmm3
+ DB 15,40,154,151,144,0,0 ; movaps 0x9097(%edx),%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 86 ; push %esi
@@ -50272,12 +50274,12 @@ _sk_load_g8_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 4053 <_sk_load_g8_sse2+0xa2>
+ DB 116,50 ; je 404d <_sk_load_g8_sse2+0xa2>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 403d <_sk_load_g8_sse2+0x8c>
+ DB 116,19 ; je 4037 <_sk_load_g8_sse2+0x8c>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,184 ; jne 3fe7 <_sk_load_g8_sse2+0x36>
+ DB 117,184 ; jne 3fe1 <_sk_load_g8_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -50286,10 +50288,10 @@ _sk_load_g8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,148 ; jmp 3fe7 <_sk_load_g8_sse2+0x36>
+ DB 235,148 ; jmp 3fe1 <_sk_load_g8_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,198 ; movd %esi,%xmm0
- DB 235,138 ; jmp 3fe7 <_sk_load_g8_sse2+0x36>
+ DB 235,138 ; jmp 3fe1 <_sk_load_g8_sse2+0x36>
PUBLIC _sk_load_g8_dst_sse2
_sk_load_g8_dst_sse2 LABEL PROC
@@ -50299,7 +50301,7 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 406b <_sk_load_g8_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4065 <_sk_load_g8_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50310,17 +50312,17 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,73 ; jne 40cf <_sk_load_g8_dst_sse2+0x72>
+ DB 117,73 ; jne 40c9 <_sk_load_g8_dst_sse2+0x72>
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,165,144,0,0 ; pand 0x90a5(%edx),%xmm4
+ DB 102,15,219,162,171,144,0,0 ; pand 0x90ab(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,213,145,0,0 ; mulps 0x91d5(%edx),%xmm4
+ DB 15,89,162,219,145,0,0 ; mulps 0x91db(%edx),%xmm4
DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
DB 15,41,97,32 ; movaps %xmm4,0x20(%ecx)
DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx)
- DB 15,40,162,229,143,0,0 ; movaps 0x8fe5(%edx),%xmm4
+ DB 15,40,162,235,143,0,0 ; movaps 0x8feb(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -50335,12 +50337,12 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 4109 <_sk_load_g8_dst_sse2+0xac>
+ DB 116,50 ; je 4103 <_sk_load_g8_dst_sse2+0xac>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 40f3 <_sk_load_g8_dst_sse2+0x96>
+ DB 116,19 ; je 40ed <_sk_load_g8_dst_sse2+0x96>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,174 ; jne 4093 <_sk_load_g8_dst_sse2+0x36>
+ DB 117,174 ; jne 408d <_sk_load_g8_dst_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -50349,10 +50351,10 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,138 ; jmp 4093 <_sk_load_g8_dst_sse2+0x36>
+ DB 235,138 ; jmp 408d <_sk_load_g8_dst_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 235,128 ; jmp 4093 <_sk_load_g8_dst_sse2+0x36>
+ DB 235,128 ; jmp 408d <_sk_load_g8_dst_sse2+0x36>
PUBLIC _sk_gather_g8_sse2
_sk_gather_g8_sse2 LABEL PROC
@@ -50390,17 +50392,17 @@ _sk_gather_g8_sse2 LABEL PROC
DB 193,226,8 ; shl $0x8,%edx
DB 9,202 ; or %ecx,%edx
DB 102,15,196,194,0 ; pinsrw $0x0,%edx,%xmm0
- DB 232,0,0,0,0 ; call 4193 <_sk_gather_g8_sse2+0x80>
+ DB 232,0,0,0,0 ; call 418d <_sk_gather_g8_sse2+0x80>
DB 89 ; pop %ecx
DB 102,15,196,199,1 ; pinsrw $0x1,%edi,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,129,173,144,0,0 ; mulps 0x90ad(%ecx),%xmm0
+ DB 15,89,129,179,144,0,0 ; mulps 0x90b3(%ecx),%xmm0
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,153,189,142,0,0 ; movaps 0x8ebd(%ecx),%xmm3
+ DB 15,40,153,195,142,0,0 ; movaps 0x8ec3(%ecx),%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 82 ; push %edx
@@ -50420,7 +50422,7 @@ _sk_load_565_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 41de <_sk_load_565_sse2+0xe>
+ DB 232,0,0,0,0 ; call 41d8 <_sk_load_565_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50432,23 +50434,23 @@ _sk_load_565_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,97 ; jne 425c <_sk_load_565_sse2+0x8c>
+ DB 117,97 ; jne 4256 <_sk_load_565_sse2+0x8c>
DB 243,15,126,20,126 ; movq (%esi,%edi,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,130,114,144,0,0 ; movdqa 0x9072(%edx),%xmm0
+ DB 102,15,111,130,120,144,0,0 ; movdqa 0x9078(%edx),%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,130,144,0,0 ; mulps 0x9082(%edx),%xmm0
- DB 102,15,111,138,146,144,0,0 ; movdqa 0x9092(%edx),%xmm1
+ DB 15,89,130,136,144,0,0 ; mulps 0x9088(%edx),%xmm0
+ DB 102,15,111,138,152,144,0,0 ; movdqa 0x9098(%edx),%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,162,144,0,0 ; mulps 0x90a2(%edx),%xmm1
- DB 102,15,219,146,178,144,0,0 ; pand 0x90b2(%edx),%xmm2
+ DB 15,89,138,168,144,0,0 ; mulps 0x90a8(%edx),%xmm1
+ DB 102,15,219,146,184,144,0,0 ; pand 0x90b8(%edx),%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,194,144,0,0 ; mulps 0x90c2(%edx),%xmm2
+ DB 15,89,146,200,144,0,0 ; mulps 0x90c8(%edx),%xmm2
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,114,142,0,0 ; movaps 0x8e72(%edx),%xmm3
+ DB 15,40,154,120,142,0,0 ; movaps 0x8e78(%edx),%xmm3
DB 86 ; push %esi
DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
@@ -50460,22 +50462,22 @@ _sk_load_565_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 4292 <_sk_load_565_sse2+0xc2>
+ DB 116,46 ; je 428c <_sk_load_565_sse2+0xc2>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 4280 <_sk_load_565_sse2+0xb0>
+ DB 116,19 ; je 427a <_sk_load_565_sse2+0xb0>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,146 ; jne 4204 <_sk_load_565_sse2+0x34>
+ DB 117,146 ; jne 41fe <_sk_load_565_sse2+0x34>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,15,110,4,126 ; movd (%esi,%edi,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,208 ; movsd %xmm0,%xmm2
- DB 233,114,255,255,255 ; jmp 4204 <_sk_load_565_sse2+0x34>
+ DB 233,114,255,255,255 ; jmp 41fe <_sk_load_565_sse2+0x34>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,214 ; movd %esi,%xmm2
- DB 233,101,255,255,255 ; jmp 4204 <_sk_load_565_sse2+0x34>
+ DB 233,101,255,255,255 ; jmp 41fe <_sk_load_565_sse2+0x34>
PUBLIC _sk_load_565_dst_sse2
_sk_load_565_dst_sse2 LABEL PROC
@@ -50485,7 +50487,7 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 42ad <_sk_load_565_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 42a7 <_sk_load_565_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50497,24 +50499,24 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,113 ; jne 433b <_sk_load_565_dst_sse2+0x9c>
+ DB 117,113 ; jne 4335 <_sk_load_565_dst_sse2+0x9c>
DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,111,170,163,143,0,0 ; movdqa 0x8fa3(%edx),%xmm5
+ DB 102,15,111,170,169,143,0,0 ; movdqa 0x8fa9(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,179,143,0,0 ; mulps 0x8fb3(%edx),%xmm5
+ DB 15,89,170,185,143,0,0 ; mulps 0x8fb9(%edx),%xmm5
DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
- DB 102,15,111,170,195,143,0,0 ; movdqa 0x8fc3(%edx),%xmm5
+ DB 102,15,111,170,201,143,0,0 ; movdqa 0x8fc9(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,211,143,0,0 ; mulps 0x8fd3(%edx),%xmm5
+ DB 15,89,170,217,143,0,0 ; mulps 0x8fd9(%edx),%xmm5
DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
- DB 102,15,219,162,227,143,0,0 ; pand 0x8fe3(%edx),%xmm4
+ DB 102,15,219,162,233,143,0,0 ; pand 0x8fe9(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,243,143,0,0 ; mulps 0x8ff3(%edx),%xmm4
+ DB 15,89,162,249,143,0,0 ; mulps 0x8ff9(%edx),%xmm4
DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
- DB 15,40,162,163,141,0,0 ; movaps 0x8da3(%edx),%xmm4
+ DB 15,40,162,169,141,0,0 ; movaps 0x8da9(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -50529,22 +50531,22 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 4371 <_sk_load_565_dst_sse2+0xd2>
+ DB 116,46 ; je 436b <_sk_load_565_dst_sse2+0xd2>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 435f <_sk_load_565_dst_sse2+0xc0>
+ DB 116,19 ; je 4359 <_sk_load_565_dst_sse2+0xc0>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,130 ; jne 42d3 <_sk_load_565_dst_sse2+0x34>
+ DB 117,130 ; jne 42cd <_sk_load_565_dst_sse2+0x34>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,110,44,126 ; movd (%esi,%edi,2),%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,98,255,255,255 ; jmp 42d3 <_sk_load_565_dst_sse2+0x34>
+ DB 233,98,255,255,255 ; jmp 42cd <_sk_load_565_dst_sse2+0x34>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 233,85,255,255,255 ; jmp 42d3 <_sk_load_565_dst_sse2+0x34>
+ DB 233,85,255,255,255 ; jmp 42cd <_sk_load_565_dst_sse2+0x34>
PUBLIC _sk_gather_565_sse2
_sk_gather_565_sse2 LABEL PROC
@@ -50577,25 +50579,25 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,209,2 ; pinsrw $0x2,%ecx,%xmm2
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 15,183,12,74 ; movzwl (%edx,%ecx,2),%ecx
- DB 232,0,0,0,0 ; call 43f9 <_sk_gather_565_sse2+0x7b>
+ DB 232,0,0,0,0 ; call 43f3 <_sk_gather_565_sse2+0x7b>
DB 90 ; pop %edx
DB 102,15,196,209,3 ; pinsrw $0x3,%ecx,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,130,87,142,0,0 ; movdqa 0x8e57(%edx),%xmm0
+ DB 102,15,111,130,93,142,0,0 ; movdqa 0x8e5d(%edx),%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,103,142,0,0 ; mulps 0x8e67(%edx),%xmm0
- DB 102,15,111,138,119,142,0,0 ; movdqa 0x8e77(%edx),%xmm1
+ DB 15,89,130,109,142,0,0 ; mulps 0x8e6d(%edx),%xmm0
+ DB 102,15,111,138,125,142,0,0 ; movdqa 0x8e7d(%edx),%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,135,142,0,0 ; mulps 0x8e87(%edx),%xmm1
- DB 102,15,219,146,151,142,0,0 ; pand 0x8e97(%edx),%xmm2
+ DB 15,89,138,141,142,0,0 ; mulps 0x8e8d(%edx),%xmm1
+ DB 102,15,219,146,157,142,0,0 ; pand 0x8e9d(%edx),%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,167,142,0,0 ; mulps 0x8ea7(%edx),%xmm2
+ DB 15,89,146,173,142,0,0 ; mulps 0x8ead(%edx),%xmm2
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,87,140,0,0 ; movaps 0x8c57(%edx),%xmm3
+ DB 15,40,154,93,140,0,0 ; movaps 0x8c5d(%edx),%xmm3
DB 81 ; push %ecx
DB 255,117,8 ; pushl 0x8(%ebp)
DB 255,80,4 ; call *0x4(%eax)
@@ -50611,7 +50613,7 @@ _sk_store_565_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 446c <_sk_store_565_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4466 <_sk_store_565_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50621,8 +50623,8 @@ _sk_store_565_sse2 LABEL PROC
DB 1,210 ; add %edx,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,196,143,0,0 ; movaps 0x8fc4(%edi),%xmm4
- DB 15,40,175,212,143,0,0 ; movaps 0x8fd4(%edi),%xmm5
+ DB 15,40,167,202,143,0,0 ; movaps 0x8fca(%edi),%xmm4
+ DB 15,40,175,218,143,0,0 ; movaps 0x8fda(%edi),%xmm5
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,89,244 ; mulps %xmm4,%xmm6
@@ -50642,7 +50644,7 @@ _sk_store_565_sse2 LABEL PROC
DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
DB 102,15,126,109,236 ; movd %xmm5,-0x14(%ebp)
DB 133,219 ; test %ebx,%ebx
- DB 117,34 ; jne 4500 <_sk_store_565_sse2+0xa2>
+ DB 117,34 ; jne 44fa <_sk_store_565_sse2+0xa2>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,15,126,235 ; movd %xmm5,%ebx
DB 137,60,114 ; mov %edi,(%edx,%esi,2)
@@ -50662,20 +50664,20 @@ _sk_store_565_sse2 LABEL PROC
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,37 ; je 4536 <_sk_store_565_sse2+0xd8>
+ DB 116,37 ; je 4530 <_sk_store_565_sse2+0xd8>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,15 ; je 4525 <_sk_store_565_sse2+0xc7>
+ DB 116,15 ; je 451f <_sk_store_565_sse2+0xc7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,210 ; jne 44ed <_sk_store_565_sse2+0x8f>
+ DB 117,210 ; jne 44e7 <_sk_store_565_sse2+0x8f>
DB 102,15,197,252,4 ; pextrw $0x4,%xmm4,%edi
DB 102,137,124,114,4 ; mov %di,0x4(%edx,%esi,2)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
DB 242,15,112,228,232 ; pshuflw $0xe8,%xmm4,%xmm4
DB 102,15,126,36,114 ; movd %xmm4,(%edx,%esi,2)
- DB 235,183 ; jmp 44ed <_sk_store_565_sse2+0x8f>
+ DB 235,183 ; jmp 44e7 <_sk_store_565_sse2+0x8f>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,137,60,114 ; mov %di,(%edx,%esi,2)
- DB 235,173 ; jmp 44ed <_sk_store_565_sse2+0x8f>
+ DB 235,173 ; jmp 44e7 <_sk_store_565_sse2+0x8f>
PUBLIC _sk_load_4444_sse2
_sk_load_4444_sse2 LABEL PROC
@@ -50685,7 +50687,7 @@ _sk_load_4444_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 454e <_sk_load_4444_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4548 <_sk_load_4444_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50697,24 +50699,24 @@ _sk_load_4444_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,112 ; jne 45db <_sk_load_4444_sse2+0x9b>
+ DB 117,112 ; jne 45d5 <_sk_load_4444_sse2+0x9b>
DB 243,15,126,28,126 ; movq (%esi,%edi,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,130,2,143,0,0 ; movdqa 0x8f02(%edx),%xmm0
+ DB 102,15,111,130,8,143,0,0 ; movdqa 0x8f08(%edx),%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,18,143,0,0 ; mulps 0x8f12(%edx),%xmm0
- DB 102,15,111,138,34,143,0,0 ; movdqa 0x8f22(%edx),%xmm1
+ DB 15,89,130,24,143,0,0 ; mulps 0x8f18(%edx),%xmm0
+ DB 102,15,111,138,40,143,0,0 ; movdqa 0x8f28(%edx),%xmm1
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,50,143,0,0 ; mulps 0x8f32(%edx),%xmm1
- DB 102,15,111,146,66,143,0,0 ; movdqa 0x8f42(%edx),%xmm2
+ DB 15,89,138,56,143,0,0 ; mulps 0x8f38(%edx),%xmm1
+ DB 102,15,111,146,72,143,0,0 ; movdqa 0x8f48(%edx),%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,82,143,0,0 ; mulps 0x8f52(%edx),%xmm2
- DB 102,15,219,154,98,143,0,0 ; pand 0x8f62(%edx),%xmm3
+ DB 15,89,146,88,143,0,0 ; mulps 0x8f58(%edx),%xmm2
+ DB 102,15,219,154,104,143,0,0 ; pand 0x8f68(%edx),%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,114,143,0,0 ; mulps 0x8f72(%edx),%xmm3
+ DB 15,89,154,120,143,0,0 ; mulps 0x8f78(%edx),%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
DB 82 ; push %edx
@@ -50728,22 +50730,22 @@ _sk_load_4444_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 4611 <_sk_load_4444_sse2+0xd1>
+ DB 116,46 ; je 460b <_sk_load_4444_sse2+0xd1>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 45ff <_sk_load_4444_sse2+0xbf>
+ DB 116,19 ; je 45f9 <_sk_load_4444_sse2+0xbf>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,131 ; jne 4574 <_sk_load_4444_sse2+0x34>
+ DB 117,131 ; jne 456e <_sk_load_4444_sse2+0x34>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,110,4,126 ; movd (%esi,%edi,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,216 ; movsd %xmm0,%xmm3
- DB 233,99,255,255,255 ; jmp 4574 <_sk_load_4444_sse2+0x34>
+ DB 233,99,255,255,255 ; jmp 456e <_sk_load_4444_sse2+0x34>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,222 ; movd %esi,%xmm3
- DB 233,86,255,255,255 ; jmp 4574 <_sk_load_4444_sse2+0x34>
+ DB 233,86,255,255,255 ; jmp 456e <_sk_load_4444_sse2+0x34>
PUBLIC _sk_load_4444_dst_sse2
_sk_load_4444_dst_sse2 LABEL PROC
@@ -50753,7 +50755,7 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 462c <_sk_load_4444_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4626 <_sk_load_4444_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50765,27 +50767,27 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,128,0,0,0 ; jne 46cd <_sk_load_4444_dst_sse2+0xaf>
+ DB 15,133,128,0,0,0 ; jne 46c7 <_sk_load_4444_dst_sse2+0xaf>
DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,111,170,36,142,0,0 ; movdqa 0x8e24(%edx),%xmm5
+ DB 102,15,111,170,42,142,0,0 ; movdqa 0x8e2a(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,52,142,0,0 ; mulps 0x8e34(%edx),%xmm5
+ DB 15,89,170,58,142,0,0 ; mulps 0x8e3a(%edx),%xmm5
DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
- DB 102,15,111,170,68,142,0,0 ; movdqa 0x8e44(%edx),%xmm5
+ DB 102,15,111,170,74,142,0,0 ; movdqa 0x8e4a(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,84,142,0,0 ; mulps 0x8e54(%edx),%xmm5
+ DB 15,89,170,90,142,0,0 ; mulps 0x8e5a(%edx),%xmm5
DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
- DB 102,15,111,170,100,142,0,0 ; movdqa 0x8e64(%edx),%xmm5
+ DB 102,15,111,170,106,142,0,0 ; movdqa 0x8e6a(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,116,142,0,0 ; mulps 0x8e74(%edx),%xmm5
+ DB 15,89,170,122,142,0,0 ; mulps 0x8e7a(%edx),%xmm5
DB 15,41,105,48 ; movaps %xmm5,0x30(%ecx)
- DB 102,15,219,162,132,142,0,0 ; pand 0x8e84(%edx),%xmm4
+ DB 102,15,219,162,138,142,0,0 ; pand 0x8e8a(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,148,142,0,0 ; mulps 0x8e94(%edx),%xmm4
+ DB 15,89,162,154,142,0,0 ; mulps 0x8e9a(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -50800,22 +50802,22 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 4707 <_sk_load_4444_dst_sse2+0xe9>
+ DB 116,50 ; je 4701 <_sk_load_4444_dst_sse2+0xe9>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,23 ; je 46f5 <_sk_load_4444_dst_sse2+0xd7>
+ DB 116,23 ; je 46ef <_sk_load_4444_dst_sse2+0xd7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,111,255,255,255 ; jne 4656 <_sk_load_4444_dst_sse2+0x38>
+ DB 15,133,111,255,255,255 ; jne 4650 <_sk_load_4444_dst_sse2+0x38>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,110,44,126 ; movd (%esi,%edi,2),%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,79,255,255,255 ; jmp 4656 <_sk_load_4444_dst_sse2+0x38>
+ DB 233,79,255,255,255 ; jmp 4650 <_sk_load_4444_dst_sse2+0x38>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 233,66,255,255,255 ; jmp 4656 <_sk_load_4444_dst_sse2+0x38>
+ DB 233,66,255,255,255 ; jmp 4650 <_sk_load_4444_dst_sse2+0x38>
PUBLIC _sk_gather_4444_sse2
_sk_gather_4444_sse2 LABEL PROC
@@ -50849,25 +50851,25 @@ _sk_gather_4444_sse2 LABEL PROC
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 15,183,12,74 ; movzwl (%edx,%ecx,2),%ecx
DB 102,15,196,217,3 ; pinsrw $0x3,%ecx,%xmm3
- DB 232,0,0,0,0 ; call 4794 <_sk_gather_4444_sse2+0x80>
+ DB 232,0,0,0,0 ; call 478e <_sk_gather_4444_sse2+0x80>
DB 89 ; pop %ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,129,188,140,0,0 ; movdqa 0x8cbc(%ecx),%xmm0
+ DB 102,15,111,129,194,140,0,0 ; movdqa 0x8cc2(%ecx),%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,129,204,140,0,0 ; mulps 0x8ccc(%ecx),%xmm0
- DB 102,15,111,137,220,140,0,0 ; movdqa 0x8cdc(%ecx),%xmm1
+ DB 15,89,129,210,140,0,0 ; mulps 0x8cd2(%ecx),%xmm0
+ DB 102,15,111,137,226,140,0,0 ; movdqa 0x8ce2(%ecx),%xmm1
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,137,236,140,0,0 ; mulps 0x8cec(%ecx),%xmm1
- DB 102,15,111,145,252,140,0,0 ; movdqa 0x8cfc(%ecx),%xmm2
+ DB 15,89,137,242,140,0,0 ; mulps 0x8cf2(%ecx),%xmm1
+ DB 102,15,111,145,2,141,0,0 ; movdqa 0x8d02(%ecx),%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,145,12,141,0,0 ; mulps 0x8d0c(%ecx),%xmm2
- DB 102,15,219,153,28,141,0,0 ; pand 0x8d1c(%ecx),%xmm3
+ DB 15,89,145,18,141,0,0 ; mulps 0x8d12(%ecx),%xmm2
+ DB 102,15,219,153,34,141,0,0 ; pand 0x8d22(%ecx),%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,153,44,141,0,0 ; mulps 0x8d2c(%ecx),%xmm3
+ DB 15,89,153,50,141,0,0 ; mulps 0x8d32(%ecx),%xmm3
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
DB 81 ; push %ecx
@@ -50885,7 +50887,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4811 <_sk_store_4444_sse2+0xe>
+ DB 232,0,0,0,0 ; call 480b <_sk_store_4444_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50895,7 +50897,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 1,210 ; add %edx,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,191,140,0,0 ; movaps 0x8cbf(%edi),%xmm4
+ DB 15,40,167,197,140,0,0 ; movaps 0x8cc5(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -50921,7 +50923,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
DB 102,15,126,109,236 ; movd %xmm5,-0x14(%ebp)
DB 133,219 ; test %ebx,%ebx
- DB 117,34 ; jne 48b4 <_sk_store_4444_sse2+0xb1>
+ DB 117,34 ; jne 48ae <_sk_store_4444_sse2+0xb1>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,15,126,235 ; movd %xmm5,%ebx
DB 137,60,114 ; mov %edi,(%edx,%esi,2)
@@ -50941,20 +50943,20 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,37 ; je 48ea <_sk_store_4444_sse2+0xe7>
+ DB 116,37 ; je 48e4 <_sk_store_4444_sse2+0xe7>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,15 ; je 48d9 <_sk_store_4444_sse2+0xd6>
+ DB 116,15 ; je 48d3 <_sk_store_4444_sse2+0xd6>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,210 ; jne 48a1 <_sk_store_4444_sse2+0x9e>
+ DB 117,210 ; jne 489b <_sk_store_4444_sse2+0x9e>
DB 102,15,197,252,4 ; pextrw $0x4,%xmm4,%edi
DB 102,137,124,114,4 ; mov %di,0x4(%edx,%esi,2)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
DB 242,15,112,228,232 ; pshuflw $0xe8,%xmm4,%xmm4
DB 102,15,126,36,114 ; movd %xmm4,(%edx,%esi,2)
- DB 235,183 ; jmp 48a1 <_sk_store_4444_sse2+0x9e>
+ DB 235,183 ; jmp 489b <_sk_store_4444_sse2+0x9e>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,137,60,114 ; mov %di,(%edx,%esi,2)
- DB 235,173 ; jmp 48a1 <_sk_store_4444_sse2+0x9e>
+ DB 235,173 ; jmp 489b <_sk_store_4444_sse2+0x9e>
PUBLIC _sk_load_8888_sse2
_sk_load_8888_sse2 LABEL PROC
@@ -50964,7 +50966,7 @@ _sk_load_8888_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4902 <_sk_load_8888_sse2+0xe>
+ DB 232,0,0,0,0 ; call 48fc <_sk_load_8888_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -50976,13 +50978,13 @@ _sk_load_8888_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,102 ; jne 4986 <_sk_load_8888_sse2+0x92>
+ DB 117,102 ; jne 4980 <_sk_load_8888_sse2+0x92>
DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3
- DB 102,15,111,146,14,136,0,0 ; movdqa 0x880e(%edx),%xmm2
+ DB 102,15,111,146,20,136,0,0 ; movdqa 0x8814(%edx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,162,62,137,0,0 ; movaps 0x893e(%edx),%xmm4
+ DB 15,40,162,68,137,0,0 ; movaps 0x8944(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -51010,18 +51012,18 @@ _sk_load_8888_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,35 ; je 49b1 <_sk_load_8888_sse2+0xbd>
+ DB 116,35 ; je 49ab <_sk_load_8888_sse2+0xbd>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 49a7 <_sk_load_8888_sse2+0xb3>
+ DB 116,16 ; je 49a1 <_sk_load_8888_sse2+0xb3>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,137 ; jne 4925 <_sk_load_8888_sse2+0x31>
+ DB 117,137 ; jne 491f <_sk_load_8888_sse2+0x31>
DB 102,15,110,68,190,8 ; movd 0x8(%esi,%edi,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,18,28,190 ; movlpd (%esi,%edi,4),%xmm3
- DB 233,116,255,255,255 ; jmp 4925 <_sk_load_8888_sse2+0x31>
+ DB 233,116,255,255,255 ; jmp 491f <_sk_load_8888_sse2+0x31>
DB 102,15,110,28,190 ; movd (%esi,%edi,4),%xmm3
- DB 233,106,255,255,255 ; jmp 4925 <_sk_load_8888_sse2+0x31>
+ DB 233,106,255,255,255 ; jmp 491f <_sk_load_8888_sse2+0x31>
PUBLIC _sk_load_8888_dst_sse2
_sk_load_8888_dst_sse2 LABEL PROC
@@ -51031,7 +51033,7 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 49c9 <_sk_load_8888_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 49c3 <_sk_load_8888_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -51043,13 +51045,13 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,118 ; jne 4a5d <_sk_load_8888_dst_sse2+0xa2>
+ DB 117,118 ; jne 4a57 <_sk_load_8888_dst_sse2+0xa2>
DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4
- DB 102,15,111,170,71,135,0,0 ; movdqa 0x8747(%edx),%xmm5
+ DB 102,15,111,170,77,135,0,0 ; movdqa 0x874d(%edx),%xmm5
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,186,119,136,0,0 ; movaps 0x8877(%edx),%xmm7
+ DB 15,40,186,125,136,0,0 ; movaps 0x887d(%edx),%xmm7
DB 15,89,247 ; mulps %xmm7,%xmm6
DB 15,41,113,16 ; movaps %xmm6,0x10(%ecx)
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
@@ -51081,18 +51083,18 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,39 ; je 4a8c <_sk_load_8888_dst_sse2+0xd1>
+ DB 116,39 ; je 4a86 <_sk_load_8888_dst_sse2+0xd1>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,20 ; je 4a82 <_sk_load_8888_dst_sse2+0xc7>
+ DB 116,20 ; je 4a7c <_sk_load_8888_dst_sse2+0xc7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,117,255,255,255 ; jne 49ec <_sk_load_8888_dst_sse2+0x31>
+ DB 15,133,117,255,255,255 ; jne 49e6 <_sk_load_8888_dst_sse2+0x31>
DB 102,15,110,100,190,8 ; movd 0x8(%esi,%edi,4),%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,18,36,190 ; movlpd (%esi,%edi,4),%xmm4
- DB 233,96,255,255,255 ; jmp 49ec <_sk_load_8888_dst_sse2+0x31>
+ DB 233,96,255,255,255 ; jmp 49e6 <_sk_load_8888_dst_sse2+0x31>
DB 102,15,110,36,190 ; movd (%esi,%edi,4),%xmm4
- DB 233,86,255,255,255 ; jmp 49ec <_sk_load_8888_dst_sse2+0x31>
+ DB 233,86,255,255,255 ; jmp 49e6 <_sk_load_8888_dst_sse2+0x31>
PUBLIC _sk_gather_8888_sse2
_sk_gather_8888_sse2 LABEL PROC
@@ -51124,16 +51126,16 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,15,110,28,138 ; movd (%edx,%ecx,4),%xmm3
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 102,15,110,4,138 ; movd (%edx,%ecx,4),%xmm0
- DB 232,0,0,0,0 ; call 4b0c <_sk_gather_8888_sse2+0x76>
+ DB 232,0,0,0,0 ; call 4b06 <_sk_gather_8888_sse2+0x76>
DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
- DB 102,15,111,145,4,134,0,0 ; movdqa 0x8604(%ecx),%xmm2
+ DB 102,15,111,145,10,134,0,0 ; movdqa 0x860a(%ecx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,161,52,135,0,0 ; movaps 0x8734(%ecx),%xmm4
+ DB 15,40,161,58,135,0,0 ; movaps 0x873a(%ecx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -51165,7 +51167,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4b87 <_sk_store_8888_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4b81 <_sk_store_8888_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -51175,7 +51177,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 193,226,2 ; shl $0x2,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,153,133,0,0 ; movaps 0x8599(%edi),%xmm4
+ DB 15,40,167,159,133,0,0 ; movaps 0x859f(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -51195,7 +51197,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 102,15,235,229 ; por %xmm5,%xmm4
DB 102,15,235,230 ; por %xmm6,%xmm4
DB 133,219 ; test %ebx,%ebx
- DB 117,24 ; jne 4c04 <_sk_store_8888_sse2+0x8b>
+ DB 117,24 ; jne 4bfe <_sk_store_8888_sse2+0x8b>
DB 243,15,127,36,178 ; movdqu %xmm4,(%edx,%esi,4)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -51210,17 +51212,17 @@ _sk_store_8888_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,28 ; je 4c28 <_sk_store_8888_sse2+0xaf>
+ DB 116,28 ; je 4c22 <_sk_store_8888_sse2+0xaf>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 4c21 <_sk_store_8888_sse2+0xa8>
+ DB 116,16 ; je 4c1b <_sk_store_8888_sse2+0xa8>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,219 ; jne 4bf1 <_sk_store_8888_sse2+0x78>
+ DB 117,219 ; jne 4beb <_sk_store_8888_sse2+0x78>
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,15,126,108,178,8 ; movd %xmm5,0x8(%edx,%esi,4)
DB 102,15,214,36,178 ; movq %xmm4,(%edx,%esi,4)
- DB 235,201 ; jmp 4bf1 <_sk_store_8888_sse2+0x78>
+ DB 235,201 ; jmp 4beb <_sk_store_8888_sse2+0x78>
DB 102,15,126,36,178 ; movd %xmm4,(%edx,%esi,4)
- DB 235,194 ; jmp 4bf1 <_sk_store_8888_sse2+0x78>
+ DB 235,194 ; jmp 4beb <_sk_store_8888_sse2+0x78>
PUBLIC _sk_load_bgra_sse2
_sk_load_bgra_sse2 LABEL PROC
@@ -51230,7 +51232,7 @@ _sk_load_bgra_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4c3d <_sk_load_bgra_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4c37 <_sk_load_bgra_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -51242,13 +51244,13 @@ _sk_load_bgra_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,102 ; jne 4cc1 <_sk_load_bgra_sse2+0x92>
+ DB 117,102 ; jne 4cbb <_sk_load_bgra_sse2+0x92>
DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3
- DB 102,15,111,130,211,132,0,0 ; movdqa 0x84d3(%edx),%xmm0
+ DB 102,15,111,130,217,132,0,0 ; movdqa 0x84d9(%edx),%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 15,40,162,3,134,0,0 ; movaps 0x8603(%edx),%xmm4
+ DB 15,40,162,9,134,0,0 ; movaps 0x8609(%edx),%xmm4
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -51276,18 +51278,18 @@ _sk_load_bgra_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,35 ; je 4cec <_sk_load_bgra_sse2+0xbd>
+ DB 116,35 ; je 4ce6 <_sk_load_bgra_sse2+0xbd>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 4ce2 <_sk_load_bgra_sse2+0xb3>
+ DB 116,16 ; je 4cdc <_sk_load_bgra_sse2+0xb3>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,137 ; jne 4c60 <_sk_load_bgra_sse2+0x31>
+ DB 117,137 ; jne 4c5a <_sk_load_bgra_sse2+0x31>
DB 102,15,110,68,190,8 ; movd 0x8(%esi,%edi,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,18,28,190 ; movlpd (%esi,%edi,4),%xmm3
- DB 233,116,255,255,255 ; jmp 4c60 <_sk_load_bgra_sse2+0x31>
+ DB 233,116,255,255,255 ; jmp 4c5a <_sk_load_bgra_sse2+0x31>
DB 102,15,110,28,190 ; movd (%esi,%edi,4),%xmm3
- DB 233,106,255,255,255 ; jmp 4c60 <_sk_load_bgra_sse2+0x31>
+ DB 233,106,255,255,255 ; jmp 4c5a <_sk_load_bgra_sse2+0x31>
PUBLIC _sk_load_bgra_dst_sse2
_sk_load_bgra_dst_sse2 LABEL PROC
@@ -51297,7 +51299,7 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4d04 <_sk_load_bgra_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4cfe <_sk_load_bgra_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -51309,13 +51311,13 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,118 ; jne 4d98 <_sk_load_bgra_dst_sse2+0xa2>
+ DB 117,118 ; jne 4d92 <_sk_load_bgra_dst_sse2+0xa2>
DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4
- DB 102,15,111,170,12,132,0,0 ; movdqa 0x840c(%edx),%xmm5
+ DB 102,15,111,170,18,132,0,0 ; movdqa 0x8412(%edx),%xmm5
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,186,60,133,0,0 ; movaps 0x853c(%edx),%xmm7
+ DB 15,40,186,66,133,0,0 ; movaps 0x8542(%edx),%xmm7
DB 15,89,247 ; mulps %xmm7,%xmm6
DB 15,41,113,48 ; movaps %xmm6,0x30(%ecx)
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
@@ -51347,18 +51349,18 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,39 ; je 4dc7 <_sk_load_bgra_dst_sse2+0xd1>
+ DB 116,39 ; je 4dc1 <_sk_load_bgra_dst_sse2+0xd1>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,20 ; je 4dbd <_sk_load_bgra_dst_sse2+0xc7>
+ DB 116,20 ; je 4db7 <_sk_load_bgra_dst_sse2+0xc7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,117,255,255,255 ; jne 4d27 <_sk_load_bgra_dst_sse2+0x31>
+ DB 15,133,117,255,255,255 ; jne 4d21 <_sk_load_bgra_dst_sse2+0x31>
DB 102,15,110,100,190,8 ; movd 0x8(%esi,%edi,4),%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,18,36,190 ; movlpd (%esi,%edi,4),%xmm4
- DB 233,96,255,255,255 ; jmp 4d27 <_sk_load_bgra_dst_sse2+0x31>
+ DB 233,96,255,255,255 ; jmp 4d21 <_sk_load_bgra_dst_sse2+0x31>
DB 102,15,110,36,190 ; movd (%esi,%edi,4),%xmm4
- DB 233,86,255,255,255 ; jmp 4d27 <_sk_load_bgra_dst_sse2+0x31>
+ DB 233,86,255,255,255 ; jmp 4d21 <_sk_load_bgra_dst_sse2+0x31>
PUBLIC _sk_gather_bgra_sse2
_sk_gather_bgra_sse2 LABEL PROC
@@ -51390,16 +51392,16 @@ _sk_gather_bgra_sse2 LABEL PROC
DB 102,15,110,28,138 ; movd (%edx,%ecx,4),%xmm3
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 102,15,110,4,138 ; movd (%edx,%ecx,4),%xmm0
- DB 232,0,0,0,0 ; call 4e47 <_sk_gather_bgra_sse2+0x76>
+ DB 232,0,0,0,0 ; call 4e41 <_sk_gather_bgra_sse2+0x76>
DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
- DB 102,15,111,129,201,130,0,0 ; movdqa 0x82c9(%ecx),%xmm0
+ DB 102,15,111,129,207,130,0,0 ; movdqa 0x82cf(%ecx),%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 15,40,161,249,131,0,0 ; movaps 0x83f9(%ecx),%xmm4
+ DB 15,40,161,255,131,0,0 ; movaps 0x83ff(%ecx),%xmm4
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -51431,7 +51433,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4ec2 <_sk_store_bgra_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4ebc <_sk_store_bgra_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -51441,7 +51443,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 193,226,2 ; shl $0x2,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,94,130,0,0 ; movaps 0x825e(%edi),%xmm4
+ DB 15,40,167,100,130,0,0 ; movaps 0x8264(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -51461,7 +51463,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 102,15,235,229 ; por %xmm5,%xmm4
DB 102,15,235,230 ; por %xmm6,%xmm4
DB 133,219 ; test %ebx,%ebx
- DB 117,24 ; jne 4f3f <_sk_store_bgra_sse2+0x8b>
+ DB 117,24 ; jne 4f39 <_sk_store_bgra_sse2+0x8b>
DB 243,15,127,36,178 ; movdqu %xmm4,(%edx,%esi,4)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -51476,17 +51478,17 @@ _sk_store_bgra_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,28 ; je 4f63 <_sk_store_bgra_sse2+0xaf>
+ DB 116,28 ; je 4f5d <_sk_store_bgra_sse2+0xaf>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 4f5c <_sk_store_bgra_sse2+0xa8>
+ DB 116,16 ; je 4f56 <_sk_store_bgra_sse2+0xa8>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,219 ; jne 4f2c <_sk_store_bgra_sse2+0x78>
+ DB 117,219 ; jne 4f26 <_sk_store_bgra_sse2+0x78>
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,15,126,108,178,8 ; movd %xmm5,0x8(%edx,%esi,4)
DB 102,15,214,36,178 ; movq %xmm4,(%edx,%esi,4)
- DB 235,201 ; jmp 4f2c <_sk_store_bgra_sse2+0x78>
+ DB 235,201 ; jmp 4f26 <_sk_store_bgra_sse2+0x78>
DB 102,15,126,36,178 ; movd %xmm4,(%edx,%esi,4)
- DB 235,194 ; jmp 4f2c <_sk_store_bgra_sse2+0x78>
+ DB 235,194 ; jmp 4f26 <_sk_store_bgra_sse2+0x78>
PUBLIC _sk_load_f16_sse2
_sk_load_f16_sse2 LABEL PROC
@@ -51496,7 +51498,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,92 ; sub $0x5c,%esp
- DB 232,0,0,0,0 ; call 4f78 <_sk_load_f16_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4f72 <_sk_load_f16_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -51508,7 +51510,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,160,1,0,0 ; jne 513a <_sk_load_f16_sse2+0x1d0>
+ DB 15,133,160,1,0,0 ; jne 5134 <_sk_load_f16_sse2+0x1d0>
DB 102,15,16,4,254 ; movupd (%esi,%edi,8),%xmm0
DB 243,15,111,76,254,16 ; movdqu 0x10(%esi,%edi,8),%xmm1
DB 102,15,40,216 ; movapd %xmm0,%xmm3
@@ -51536,7 +51538,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,15,126,69,232 ; movd %xmm0,-0x18(%ebp)
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,111,154,104,133,0,0 ; movdqa 0x8568(%edx),%xmm3
+ DB 102,15,111,154,110,133,0,0 ; movdqa 0x856e(%edx),%xmm3
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,219,227 ; pand %xmm3,%xmm4
DB 102,15,239,204 ; pxor %xmm4,%xmm1
@@ -51569,15 +51571,15 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,114,240,13 ; pslld $0xd,%xmm0
DB 102,15,235,195 ; por %xmm3,%xmm0
- DB 102,15,111,154,120,133,0,0 ; movdqa 0x8578(%edx),%xmm3
+ DB 102,15,111,154,126,133,0,0 ; movdqa 0x857e(%edx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,254,243 ; paddd %xmm3,%xmm6
DB 102,15,254,235 ; paddd %xmm3,%xmm5
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,154,136,133,0,0 ; movdqa 0x8588(%edx),%xmm3
+ DB 102,15,111,154,142,133,0,0 ; movdqa 0x858e(%edx),%xmm3
DB 102,15,127,93,184 ; movdqa %xmm3,-0x48(%ebp)
DB 102,15,239,203 ; pxor %xmm3,%xmm1
- DB 102,15,111,154,152,133,0,0 ; movdqa 0x8598(%edx),%xmm3
+ DB 102,15,111,154,158,133,0,0 ; movdqa 0x859e(%edx),%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
DB 102,15,223,226 ; pandn %xmm2,%xmm4
@@ -51609,12 +51611,12 @@ _sk_load_f16_sse2 LABEL PROC
DB 242,15,16,4,254 ; movsd (%esi,%edi,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,251,1 ; cmp $0x1,%ebx
- DB 15,132,89,254,255,255 ; je 4fa5 <_sk_load_f16_sse2+0x3b>
+ DB 15,132,89,254,255,255 ; je 4f9f <_sk_load_f16_sse2+0x3b>
DB 102,15,22,68,254,8 ; movhpd 0x8(%esi,%edi,8),%xmm0
DB 131,251,3 ; cmp $0x3,%ebx
- DB 15,130,74,254,255,255 ; jb 4fa5 <_sk_load_f16_sse2+0x3b>
+ DB 15,130,74,254,255,255 ; jb 4f9f <_sk_load_f16_sse2+0x3b>
DB 243,15,126,76,254,16 ; movq 0x10(%esi,%edi,8),%xmm1
- DB 233,63,254,255,255 ; jmp 4fa5 <_sk_load_f16_sse2+0x3b>
+ DB 233,63,254,255,255 ; jmp 4f9f <_sk_load_f16_sse2+0x3b>
PUBLIC _sk_load_f16_dst_sse2
_sk_load_f16_dst_sse2 LABEL PROC
@@ -51628,7 +51630,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 15,41,149,120,255,255,255 ; movaps %xmm2,-0x88(%ebp)
DB 102,15,127,77,136 ; movdqa %xmm1,-0x78(%ebp)
DB 15,41,69,152 ; movaps %xmm0,-0x68(%ebp)
- DB 232,0,0,0,0 ; call 518e <_sk_load_f16_dst_sse2+0x28>
+ DB 232,0,0,0,0 ; call 5188 <_sk_load_f16_dst_sse2+0x28>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -51640,7 +51642,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,206,1,0,0 ; jne 537e <_sk_load_f16_dst_sse2+0x218>
+ DB 15,133,206,1,0,0 ; jne 5378 <_sk_load_f16_dst_sse2+0x218>
DB 102,15,16,4,254 ; movupd (%esi,%edi,8),%xmm0
DB 243,15,111,76,254,16 ; movdqu 0x10(%esi,%edi,8),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -51668,7 +51670,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,15,126,85,232 ; movd %xmm2,-0x18(%ebp)
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4
- DB 102,15,111,154,82,131,0,0 ; movdqa 0x8352(%edx),%xmm3
+ DB 102,15,111,154,88,131,0,0 ; movdqa 0x8358(%edx),%xmm3
DB 102,15,111,212 ; movdqa %xmm4,%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 102,15,239,226 ; pxor %xmm2,%xmm4
@@ -51676,13 +51678,13 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,15,111,204 ; movdqa %xmm4,%xmm1
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,15,111,146,114,131,0,0 ; movdqa 0x8372(%edx),%xmm2
+ DB 102,15,111,146,120,131,0,0 ; movdqa 0x8378(%edx),%xmm2
DB 102,15,127,85,168 ; movdqa %xmm2,-0x58(%ebp)
DB 102,15,239,226 ; pxor %xmm2,%xmm4
- DB 102,15,111,178,130,131,0,0 ; movdqa 0x8382(%edx),%xmm6
+ DB 102,15,111,178,136,131,0,0 ; movdqa 0x8388(%edx),%xmm6
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
DB 102,15,102,252 ; pcmpgtd %xmm4,%xmm7
- DB 102,15,111,146,98,131,0,0 ; movdqa 0x8362(%edx),%xmm2
+ DB 102,15,111,146,104,131,0,0 ; movdqa 0x8368(%edx),%xmm2
DB 102,15,127,85,184 ; movdqa %xmm2,-0x48(%ebp)
DB 102,15,254,202 ; paddd %xmm2,%xmm1
DB 102,15,223,249 ; pandn %xmm1,%xmm7
@@ -51750,12 +51752,12 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 242,15,16,4,254 ; movsd (%esi,%edi,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,251,1 ; cmp $0x1,%ebx
- DB 15,132,43,254,255,255 ; je 51bb <_sk_load_f16_dst_sse2+0x55>
+ DB 15,132,43,254,255,255 ; je 51b5 <_sk_load_f16_dst_sse2+0x55>
DB 102,15,22,68,254,8 ; movhpd 0x8(%esi,%edi,8),%xmm0
DB 131,251,3 ; cmp $0x3,%ebx
- DB 15,130,28,254,255,255 ; jb 51bb <_sk_load_f16_dst_sse2+0x55>
+ DB 15,130,28,254,255,255 ; jb 51b5 <_sk_load_f16_dst_sse2+0x55>
DB 243,15,126,76,254,16 ; movq 0x10(%esi,%edi,8),%xmm1
- DB 233,17,254,255,255 ; jmp 51bb <_sk_load_f16_dst_sse2+0x55>
+ DB 233,17,254,255,255 ; jmp 51b5 <_sk_load_f16_dst_sse2+0x55>
PUBLIC _sk_gather_f16_sse2
_sk_gather_f16_sse2 LABEL PROC
@@ -51791,7 +51793,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,126,194 ; movd %xmm0,%edx
DB 102,15,110,68,209,4 ; movd 0x4(%ecx,%edx,8),%xmm0
DB 102,15,110,60,209 ; movd (%ecx,%edx,8),%xmm7
- DB 232,0,0,0,0 ; call 5438 <_sk_gather_f16_sse2+0x8e>
+ DB 232,0,0,0,0 ; call 5432 <_sk_gather_f16_sse2+0x8e>
DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,227 ; punpckldq %xmm3,%xmm4
@@ -51824,7 +51826,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,126,69,248 ; movd %xmm0,-0x8(%ebp)
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,111,153,168,128,0,0 ; movdqa 0x80a8(%ecx),%xmm3
+ DB 102,15,111,153,174,128,0,0 ; movdqa 0x80ae(%ecx),%xmm3
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,219,227 ; pand %xmm3,%xmm4
DB 102,15,239,204 ; pxor %xmm4,%xmm1
@@ -51857,15 +51859,15 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,114,240,13 ; pslld $0xd,%xmm0
DB 102,15,235,195 ; por %xmm3,%xmm0
- DB 102,15,111,153,184,128,0,0 ; movdqa 0x80b8(%ecx),%xmm3
+ DB 102,15,111,153,190,128,0,0 ; movdqa 0x80be(%ecx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,254,243 ; paddd %xmm3,%xmm6
DB 102,15,254,235 ; paddd %xmm3,%xmm5
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,153,200,128,0,0 ; movdqa 0x80c8(%ecx),%xmm3
+ DB 102,15,111,153,206,128,0,0 ; movdqa 0x80ce(%ecx),%xmm3
DB 102,15,127,93,200 ; movdqa %xmm3,-0x38(%ebp)
DB 102,15,239,203 ; pxor %xmm3,%xmm1
- DB 102,15,111,153,216,128,0,0 ; movdqa 0x80d8(%ecx),%xmm3
+ DB 102,15,111,153,222,128,0,0 ; movdqa 0x80de(%ecx),%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
DB 102,15,223,226 ; pandn %xmm2,%xmm4
@@ -51902,20 +51904,20 @@ _sk_store_f16_sse2 LABEL PROC
DB 131,236,80 ; sub $0x50,%esp
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 55fb <_sk_store_f16_sse2+0x15>
+ DB 232,0,0,0,0 ; call 55f5 <_sk_store_f16_sse2+0x15>
DB 88 ; pop %eax
- DB 102,15,111,176,5,127,0,0 ; movdqa 0x7f05(%eax),%xmm6
+ DB 102,15,111,176,11,127,0,0 ; movdqa 0x7f0b(%eax),%xmm6
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,15,219,214 ; pand %xmm6,%xmm2
DB 102,15,127,69,200 ; movdqa %xmm0,-0x38(%ebp)
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
DB 102,15,239,234 ; pxor %xmm2,%xmm5
- DB 102,15,111,160,37,127,0,0 ; movdqa 0x7f25(%eax),%xmm4
+ DB 102,15,111,160,43,127,0,0 ; movdqa 0x7f2b(%eax),%xmm4
DB 102,15,114,210,16 ; psrld $0x10,%xmm2
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,15,102,197 ; pcmpgtd %xmm5,%xmm0
DB 102,15,114,213,13 ; psrld $0xd,%xmm5
- DB 102,15,111,184,53,127,0,0 ; movdqa 0x7f35(%eax),%xmm7
+ DB 102,15,111,184,59,127,0,0 ; movdqa 0x7f3b(%eax),%xmm7
DB 102,15,254,215 ; paddd %xmm7,%xmm2
DB 102,15,127,125,232 ; movdqa %xmm7,-0x18(%ebp)
DB 102,15,254,213 ; paddd %xmm5,%xmm2
@@ -51977,7 +51979,7 @@ _sk_store_f16_sse2 LABEL PROC
DB 3,55 ; add (%edi),%esi
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 133,255 ; test %edi,%edi
- DB 117,53 ; jne 576d <_sk_store_f16_sse2+0x187>
+ DB 117,53 ; jne 5767 <_sk_store_f16_sse2+0x187>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,98,197 ; punpckldq %xmm5,%xmm0
DB 243,15,127,4,214 ; movdqu %xmm0,(%esi,%edx,8)
@@ -52000,13 +52002,13 @@ _sk_store_f16_sse2 LABEL PROC
DB 102,15,98,213 ; punpckldq %xmm5,%xmm2
DB 102,15,214,20,214 ; movq %xmm2,(%esi,%edx,8)
DB 131,255,1 ; cmp $0x1,%edi
- DB 116,208 ; je 574f <_sk_store_f16_sse2+0x169>
+ DB 116,208 ; je 5749 <_sk_store_f16_sse2+0x169>
DB 102,15,23,84,214,8 ; movhpd %xmm2,0x8(%esi,%edx,8)
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,197 ; jb 574f <_sk_store_f16_sse2+0x169>
+ DB 114,197 ; jb 5749 <_sk_store_f16_sse2+0x169>
DB 102,15,106,205 ; punpckhdq %xmm5,%xmm1
DB 102,15,214,76,214,16 ; movq %xmm1,0x10(%esi,%edx,8)
- DB 235,185 ; jmp 574f <_sk_store_f16_sse2+0x169>
+ DB 235,185 ; jmp 5749 <_sk_store_f16_sse2+0x169>
PUBLIC _sk_load_u16_be_sse2
_sk_load_u16_be_sse2 LABEL PROC
@@ -52027,9 +52029,9 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 193,230,2 ; shl $0x2,%esi
DB 133,219 ; test %ebx,%ebx
- DB 232,0,0,0,0 ; call 57c1 <_sk_load_u16_be_sse2+0x2b>
+ DB 232,0,0,0,0 ; call 57bb <_sk_load_u16_be_sse2+0x2b>
DB 90 ; pop %edx
- DB 15,133,11,1,0,0 ; jne 58d3 <_sk_load_u16_be_sse2+0x13d>
+ DB 15,133,11,1,0,0 ; jne 58cd <_sk_load_u16_be_sse2+0x13d>
DB 102,15,16,4,119 ; movupd (%edi,%esi,2),%xmm0
DB 243,15,111,76,119,16 ; movdqu 0x10(%edi,%esi,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -52050,7 +52052,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,162,239,122,0,0 ; movaps 0x7aef(%edx),%xmm4
+ DB 15,40,162,245,122,0,0 ; movaps 0x7af5(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,205 ; movdqa %xmm5,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -52100,12 +52102,12 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 242,15,16,4,119 ; movsd (%edi,%esi,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,251,1 ; cmp $0x1,%ebx
- DB 15,132,238,254,255,255 ; je 57d3 <_sk_load_u16_be_sse2+0x3d>
+ DB 15,132,238,254,255,255 ; je 57cd <_sk_load_u16_be_sse2+0x3d>
DB 102,15,22,68,119,8 ; movhpd 0x8(%edi,%esi,2),%xmm0
DB 131,251,3 ; cmp $0x3,%ebx
- DB 15,130,223,254,255,255 ; jb 57d3 <_sk_load_u16_be_sse2+0x3d>
+ DB 15,130,223,254,255,255 ; jb 57cd <_sk_load_u16_be_sse2+0x3d>
DB 243,15,126,76,119,16 ; movq 0x10(%edi,%esi,2),%xmm1
- DB 233,212,254,255,255 ; jmp 57d3 <_sk_load_u16_be_sse2+0x3d>
+ DB 233,212,254,255,255 ; jmp 57cd <_sk_load_u16_be_sse2+0x3d>
PUBLIC _sk_load_rgb_u16_be_sse2
_sk_load_rgb_u16_be_sse2 LABEL PROC
@@ -52125,9 +52127,9 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 3,50 ; add (%edx),%esi
DB 107,25,3 ; imul $0x3,(%ecx),%ebx
DB 133,255 ; test %edi,%edi
- DB 232,0,0,0,0 ; call 5928 <_sk_load_rgb_u16_be_sse2+0x29>
+ DB 232,0,0,0,0 ; call 5922 <_sk_load_rgb_u16_be_sse2+0x29>
DB 90 ; pop %edx
- DB 15,133,240,0,0,0 ; jne 5a1f <_sk_load_rgb_u16_be_sse2+0x120>
+ DB 15,133,240,0,0,0 ; jne 5a19 <_sk_load_rgb_u16_be_sse2+0x120>
DB 243,15,111,20,94 ; movdqu (%esi,%ebx,2),%xmm2
DB 243,15,111,92,94,8 ; movdqu 0x8(%esi,%ebx,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -52152,7 +52154,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,170,136,121,0,0 ; movaps 0x7988(%edx),%xmm5
+ DB 15,40,170,142,121,0,0 ; movaps 0x798e(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 102,15,111,204 ; movdqa %xmm4,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -52178,7 +52180,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,40,119,0,0 ; movaps 0x7728(%edx),%xmm3
+ DB 15,40,154,46,119,0,0 ; movaps 0x772e(%edx),%xmm3
DB 86 ; push %esi
DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
@@ -52192,20 +52194,20 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,15,196,84,94,4,2 ; pinsrw $0x2,0x4(%esi,%ebx,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,255,1 ; cmp $0x1,%edi
- DB 117,13 ; jne 5a41 <_sk_load_rgb_u16_be_sse2+0x142>
+ DB 117,13 ; jne 5a3b <_sk_load_rgb_u16_be_sse2+0x142>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,16,255,255,255 ; jmp 5951 <_sk_load_rgb_u16_be_sse2+0x52>
+ DB 233,16,255,255,255 ; jmp 594b <_sk_load_rgb_u16_be_sse2+0x52>
DB 102,15,110,68,94,6 ; movd 0x6(%esi,%ebx,2),%xmm0
DB 102,15,196,68,94,10,2 ; pinsrw $0x2,0xa(%esi,%ebx,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,18 ; jb 5a69 <_sk_load_rgb_u16_be_sse2+0x16a>
+ DB 114,18 ; jb 5a63 <_sk_load_rgb_u16_be_sse2+0x16a>
DB 102,15,110,92,94,12 ; movd 0xc(%esi,%ebx,2),%xmm3
DB 102,15,196,92,94,16,2 ; pinsrw $0x2,0x10(%esi,%ebx,2),%xmm3
- DB 233,232,254,255,255 ; jmp 5951 <_sk_load_rgb_u16_be_sse2+0x52>
+ DB 233,232,254,255,255 ; jmp 594b <_sk_load_rgb_u16_be_sse2+0x52>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,223,254,255,255 ; jmp 5951 <_sk_load_rgb_u16_be_sse2+0x52>
+ DB 233,223,254,255,255 ; jmp 594b <_sk_load_rgb_u16_be_sse2+0x52>
PUBLIC _sk_store_u16_be_sse2
_sk_store_u16_be_sse2 LABEL PROC
@@ -52215,9 +52217,9 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 86 ; push %esi
DB 131,236,16 ; sub $0x10,%esp
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
- DB 232,0,0,0,0 ; call 5a83 <_sk_store_u16_be_sse2+0x11>
+ DB 232,0,0,0,0 ; call 5a7d <_sk_store_u16_be_sse2+0x11>
DB 88 ; pop %eax
- DB 15,40,176,189,122,0,0 ; movaps 0x7abd(%eax),%xmm6
+ DB 15,40,176,195,122,0,0 ; movaps 0x7ac3(%eax),%xmm6
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,89,230 ; mulps %xmm6,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
@@ -52270,7 +52272,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 193,226,2 ; shl $0x2,%edx
DB 133,255 ; test %edi,%edi
- DB 117,45 ; jne 5b85 <_sk_store_u16_be_sse2+0x113>
+ DB 117,45 ; jne 5b7f <_sk_store_u16_be_sse2+0x113>
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
DB 102,15,98,221 ; punpckldq %xmm5,%xmm3
DB 243,15,127,28,86 ; movdqu %xmm3,(%esi,%edx,2)
@@ -52291,13 +52293,13 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 102,15,98,245 ; punpckldq %xmm5,%xmm6
DB 102,15,214,52,86 ; movq %xmm6,(%esi,%edx,2)
DB 131,255,1 ; cmp $0x1,%edi
- DB 116,216 ; je 5b6f <_sk_store_u16_be_sse2+0xfd>
+ DB 116,216 ; je 5b69 <_sk_store_u16_be_sse2+0xfd>
DB 102,15,23,116,86,8 ; movhpd %xmm6,0x8(%esi,%edx,2)
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,205 ; jb 5b6f <_sk_store_u16_be_sse2+0xfd>
+ DB 114,205 ; jb 5b69 <_sk_store_u16_be_sse2+0xfd>
DB 102,15,106,229 ; punpckhdq %xmm5,%xmm4
DB 102,15,214,100,86,16 ; movq %xmm4,0x10(%esi,%edx,2)
- DB 235,193 ; jmp 5b6f <_sk_store_u16_be_sse2+0xfd>
+ DB 235,193 ; jmp 5b69 <_sk_store_u16_be_sse2+0xfd>
PUBLIC _sk_load_f32_sse2
_sk_load_f32_sse2 LABEL PROC
@@ -52318,7 +52320,7 @@ _sk_load_f32_sse2 LABEL PROC
DB 15,16,36,23 ; movups (%edi,%edx,1),%xmm4
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 133,255 ; test %edi,%edi
- DB 117,71 ; jne 5c25 <_sk_load_f32_sse2+0x77>
+ DB 117,71 ; jne 5c1f <_sk_load_f32_sse2+0x77>
DB 15,16,84,178,16 ; movups 0x10(%edx,%esi,4),%xmm2
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
DB 15,16,68,178,48 ; movups 0x30(%edx,%esi,4),%xmm0
@@ -52346,17 +52348,17 @@ _sk_load_f32_sse2 LABEL PROC
DB 195 ; ret
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 131,255,1 ; cmp $0x1,%edi
- DB 117,8 ; jne 5c35 <_sk_load_f32_sse2+0x87>
+ DB 117,8 ; jne 5c2f <_sk_load_f32_sse2+0x87>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,210 ; xorps %xmm2,%xmm2
- DB 235,184 ; jmp 5bed <_sk_load_f32_sse2+0x3f>
+ DB 235,184 ; jmp 5be7 <_sk_load_f32_sse2+0x3f>
DB 15,16,84,178,16 ; movups 0x10(%edx,%esi,4),%xmm2
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,7 ; jb 5c46 <_sk_load_f32_sse2+0x98>
+ DB 114,7 ; jb 5c40 <_sk_load_f32_sse2+0x98>
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
- DB 235,167 ; jmp 5bed <_sk_load_f32_sse2+0x3f>
+ DB 235,167 ; jmp 5be7 <_sk_load_f32_sse2+0x3f>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,162 ; jmp 5bed <_sk_load_f32_sse2+0x3f>
+ DB 235,162 ; jmp 5be7 <_sk_load_f32_sse2+0x3f>
PUBLIC _sk_load_f32_dst_sse2
_sk_load_f32_dst_sse2 LABEL PROC
@@ -52380,7 +52382,7 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 15,16,52,23 ; movups (%edi,%edx,1),%xmm6
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 133,255 ; test %edi,%edi
- DB 117,97 ; jne 5ce7 <_sk_load_f32_dst_sse2+0x9c>
+ DB 117,97 ; jne 5ce1 <_sk_load_f32_dst_sse2+0x9c>
DB 15,16,124,178,16 ; movups 0x10(%edx,%esi,4),%xmm7
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
DB 15,16,84,178,48 ; movups 0x30(%edx,%esi,4),%xmm2
@@ -52414,17 +52416,17 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 195 ; ret
DB 15,87,210 ; xorps %xmm2,%xmm2
DB 131,255,1 ; cmp $0x1,%edi
- DB 117,8 ; jne 5cf7 <_sk_load_f32_dst_sse2+0xac>
+ DB 117,8 ; jne 5cf1 <_sk_load_f32_dst_sse2+0xac>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,158 ; jmp 5c95 <_sk_load_f32_dst_sse2+0x4a>
+ DB 235,158 ; jmp 5c8f <_sk_load_f32_dst_sse2+0x4a>
DB 15,16,124,178,16 ; movups 0x10(%edx,%esi,4),%xmm7
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,7 ; jb 5d08 <_sk_load_f32_dst_sse2+0xbd>
+ DB 114,7 ; jb 5d02 <_sk_load_f32_dst_sse2+0xbd>
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
- DB 235,141 ; jmp 5c95 <_sk_load_f32_dst_sse2+0x4a>
+ DB 235,141 ; jmp 5c8f <_sk_load_f32_dst_sse2+0x4a>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,136 ; jmp 5c95 <_sk_load_f32_dst_sse2+0x4a>
+ DB 235,136 ; jmp 5c8f <_sk_load_f32_dst_sse2+0x4a>
PUBLIC _sk_store_f32_sse2
_sk_store_f32_sse2 LABEL PROC
@@ -52460,7 +52462,7 @@ _sk_store_f32_sse2 LABEL PROC
DB 15,40,238 ; movaps %xmm6,%xmm5
DB 102,15,20,239 ; unpcklpd %xmm7,%xmm5
DB 133,255 ; test %edi,%edi
- DB 117,40 ; jne 5d93 <_sk_store_f32_sse2+0x86>
+ DB 117,40 ; jne 5d8d <_sk_store_f32_sse2+0x86>
DB 102,15,21,247 ; unpckhpd %xmm7,%xmm6
DB 15,17,100,178,16 ; movups %xmm4,0x10(%edx,%esi,4)
DB 102,15,17,108,178,32 ; movupd %xmm5,0x20(%edx,%esi,4)
@@ -52477,12 +52479,12 @@ _sk_store_f32_sse2 LABEL PROC
DB 93 ; pop %ebp
DB 195 ; ret
DB 131,255,1 ; cmp $0x1,%edi
- DB 116,232 ; je 5d80 <_sk_store_f32_sse2+0x73>
+ DB 116,232 ; je 5d7a <_sk_store_f32_sse2+0x73>
DB 15,17,100,178,16 ; movups %xmm4,0x10(%edx,%esi,4)
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,222 ; jb 5d80 <_sk_store_f32_sse2+0x73>
+ DB 114,222 ; jb 5d7a <_sk_store_f32_sse2+0x73>
DB 102,15,17,108,178,32 ; movupd %xmm5,0x20(%edx,%esi,4)
- DB 235,214 ; jmp 5d80 <_sk_store_f32_sse2+0x73>
+ DB 235,214 ; jmp 5d7a <_sk_store_f32_sse2+0x73>
PUBLIC _sk_clamp_x_sse2
_sk_clamp_x_sse2 LABEL PROC
@@ -52537,7 +52539,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5e27 <_sk_repeat_x_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5e21 <_sk_repeat_x_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -52548,7 +52550,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,15,91,230 ; cvttps2dq %xmm6,%xmm4
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,41,114,0,0 ; andps 0x7229(%ecx),%xmm6
+ DB 15,84,177,47,114,0,0 ; andps 0x722f(%ecx),%xmm6
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -52573,7 +52575,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5e8d <_sk_repeat_y_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5e87 <_sk_repeat_y_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -52584,7 +52586,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,15,91,230 ; cvttps2dq %xmm6,%xmm4
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,195,113,0,0 ; andps 0x71c3(%ecx),%xmm6
+ DB 15,84,177,201,113,0,0 ; andps 0x71c9(%ecx),%xmm6
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -52609,7 +52611,7 @@ _sk_mirror_x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5ef3 <_sk_mirror_x_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5eed <_sk_mirror_x_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -52618,13 +52620,13 @@ _sk_mirror_x_sse2 LABEL PROC
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 243,15,89,177,173,120,0,0 ; mulss 0x78ad(%ecx),%xmm6
+ DB 243,15,89,177,179,120,0,0 ; mulss 0x78b3(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,93,113,0,0 ; andps 0x715d(%ecx),%xmm6
+ DB 15,84,177,99,113,0,0 ; andps 0x7163(%ecx),%xmm6
DB 15,92,254 ; subps %xmm6,%xmm7
DB 243,15,88,237 ; addss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -52653,7 +52655,7 @@ _sk_mirror_y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5f78 <_sk_mirror_y_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5f72 <_sk_mirror_y_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -52662,13 +52664,13 @@ _sk_mirror_y_sse2 LABEL PROC
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,204 ; subps %xmm4,%xmm1
- DB 243,15,89,177,40,120,0,0 ; mulss 0x7828(%ecx),%xmm6
+ DB 243,15,89,177,46,120,0,0 ; mulss 0x782e(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,216,112,0,0 ; andps 0x70d8(%ecx),%xmm6
+ DB 15,84,177,222,112,0,0 ; andps 0x70de(%ecx),%xmm6
DB 15,92,254 ; subps %xmm6,%xmm7
DB 243,15,88,237 ; addss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -52697,12 +52699,12 @@ _sk_clamp_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5ffd <_sk_clamp_x_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5ff7 <_sk_clamp_x_1_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,95,224 ; maxps %xmm0,%xmm4
- DB 15,93,160,83,112,0,0 ; minps 0x7053(%eax),%xmm4
+ DB 15,93,160,89,112,0,0 ; minps 0x7059(%eax),%xmm4
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
@@ -52718,14 +52720,14 @@ _sk_repeat_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 602d <_sk_repeat_x_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 6027 <_sk_repeat_x_1_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 243,15,91,224 ; cvttps2dq %xmm0,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,194,236,1 ; cmpltps %xmm4,%xmm5
- DB 15,84,168,35,112,0,0 ; andps 0x7023(%eax),%xmm5
+ DB 15,84,168,41,112,0,0 ; andps 0x7029(%eax),%xmm5
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
DB 141,65,4 ; lea 0x4(%ecx),%eax
@@ -52742,17 +52744,17 @@ _sk_mirror_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 6068 <_sk_mirror_x_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 6062 <_sk_mirror_x_1_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 15,40,161,88,112,0,0 ; movaps 0x7058(%ecx),%xmm4
+ DB 15,40,161,94,112,0,0 ; movaps 0x705e(%ecx),%xmm4
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,40,169,200,111,0,0 ; movaps 0x6fc8(%ecx),%xmm5
+ DB 15,40,169,222,111,0,0 ; movaps 0x6fde(%ecx),%xmm5
DB 15,89,232 ; mulps %xmm0,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,194,238,1 ; cmpltps %xmm6,%xmm5
- DB 15,84,169,232,111,0,0 ; andps 0x6fe8(%ecx),%xmm5
+ DB 15,84,169,238,111,0,0 ; andps 0x6fee(%ecx),%xmm5
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,92,245 ; subps %xmm5,%xmm6
DB 15,88,246 ; addps %xmm6,%xmm6
@@ -52775,13 +52777,13 @@ _sk_luminance_to_alpha_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 60c6 <_sk_luminance_to_alpha_sse2+0xe>
+ DB 232,0,0,0,0 ; call 60c0 <_sk_luminance_to_alpha_sse2+0xe>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,89,128,138,116,0,0 ; mulps 0x748a(%eax),%xmm0
- DB 15,89,136,154,116,0,0 ; mulps 0x749a(%eax),%xmm1
+ DB 15,89,128,144,116,0,0 ; mulps 0x7490(%eax),%xmm0
+ DB 15,89,136,160,116,0,0 ; mulps 0x74a0(%eax),%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,152,170,116,0,0 ; mulps 0x74aa(%eax),%xmm3
+ DB 15,89,152,176,116,0,0 ; mulps 0x74b0(%eax),%xmm3
DB 15,88,217 ; addps %xmm1,%xmm3
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -53155,7 +53157,7 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 86 ; push %esi
DB 131,236,60 ; sub $0x3c,%esp
DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
- DB 232,0,0,0,0 ; call 6563 <_sk_evenly_spaced_gradient_sse2+0x12>
+ DB 232,0,0,0,0 ; call 655d <_sk_evenly_spaced_gradient_sse2+0x12>
DB 90 ; pop %edx
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,65,4 ; lea 0x4(%ecx),%eax
@@ -53166,12 +53168,12 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 78 ; dec %esi
DB 102,15,110,206 ; movd %esi,%xmm1
DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
- DB 102,15,111,146,29,112,0,0 ; movdqa 0x701d(%edx),%xmm2
+ DB 102,15,111,146,35,112,0,0 ; movdqa 0x7023(%edx),%xmm2
DB 102,15,219,209 ; pand %xmm1,%xmm2
- DB 102,15,235,146,253,109,0,0 ; por 0x6dfd(%edx),%xmm2
+ DB 102,15,235,146,3,110,0,0 ; por 0x6e03(%edx),%xmm2
DB 102,15,114,209,16 ; psrld $0x10,%xmm1
- DB 102,15,235,138,45,112,0,0 ; por 0x702d(%edx),%xmm1
- DB 15,88,138,61,112,0,0 ; addps 0x703d(%edx),%xmm1
+ DB 102,15,235,138,51,112,0,0 ; por 0x7033(%edx),%xmm1
+ DB 15,88,138,67,112,0,0 ; addps 0x7043(%edx),%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1
@@ -53276,18 +53278,18 @@ _sk_gauss_a_to_rgba_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 6719 <_sk_gauss_a_to_rgba_sse2+0xb>
+ DB 232,0,0,0,0 ; call 6713 <_sk_gauss_a_to_rgba_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,128,151,110,0,0 ; movaps 0x6e97(%eax),%xmm0
+ DB 15,40,128,157,110,0,0 ; movaps 0x6e9d(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,167,110,0,0 ; addps 0x6ea7(%eax),%xmm0
+ DB 15,88,128,173,110,0,0 ; addps 0x6ead(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,183,110,0,0 ; addps 0x6eb7(%eax),%xmm0
+ DB 15,88,128,189,110,0,0 ; addps 0x6ebd(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,199,110,0,0 ; addps 0x6ec7(%eax),%xmm0
+ DB 15,88,128,205,110,0,0 ; addps 0x6ecd(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,215,110,0,0 ; addps 0x6ed7(%eax),%xmm0
+ DB 15,88,128,221,110,0,0 ; addps 0x6edd(%eax),%xmm0
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,200 ; movaps %xmm0,%xmm1
@@ -53308,7 +53310,7 @@ _sk_gradient_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,60 ; sub $0x3c,%esp
- DB 232,0,0,0,0 ; call 6774 <_sk_gradient_sse2+0xe>
+ DB 232,0,0,0,0 ; call 676e <_sk_gradient_sse2+0xe>
DB 95 ; pop %edi
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
@@ -53317,12 +53319,12 @@ _sk_gradient_sse2 LABEL PROC
DB 139,17 ; mov (%ecx),%edx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,250,2 ; cmp $0x2,%edx
- DB 114,43 ; jb 67b6 <_sk_gradient_sse2+0x50>
+ DB 114,43 ; jb 67b0 <_sk_gradient_sse2+0x50>
DB 139,113,36 ; mov 0x24(%ecx),%esi
DB 74 ; dec %edx
DB 131,198,4 ; add $0x4,%esi
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,151,252,104,0,0 ; movaps 0x68fc(%edi),%xmm2
+ DB 15,40,151,2,105,0,0 ; movaps 0x6902(%edi),%xmm2
DB 243,15,16,30 ; movss (%esi),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -53330,7 +53332,7 @@ _sk_gradient_sse2 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 131,198,4 ; add $0x4,%esi
DB 74 ; dec %edx
- DB 117,231 ; jne 679d <_sk_gradient_sse2+0x37>
+ DB 117,231 ; jne 6797 <_sk_gradient_sse2+0x37>
DB 102,15,126,202 ; movd %xmm1,%edx
DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
DB 102,15,126,214 ; movd %xmm2,%esi
@@ -53478,7 +53480,7 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 69b0 <_sk_xy_to_unit_angle_sse2+0x18>
+ DB 232,0,0,0,0 ; call 69aa <_sk_xy_to_unit_angle_sse2+0x18>
DB 88 ; pop %eax
DB 15,87,237 ; xorps %xmm5,%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
@@ -53493,30 +53495,30 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 15,94,247 ; divps %xmm7,%xmm6
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,255 ; mulps %xmm7,%xmm7
- DB 15,40,128,80,108,0,0 ; movaps 0x6c50(%eax),%xmm0
+ DB 15,40,128,86,108,0,0 ; movaps 0x6c56(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,96,108,0,0 ; addps 0x6c60(%eax),%xmm0
+ DB 15,88,128,102,108,0,0 ; addps 0x6c66(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,112,108,0,0 ; addps 0x6c70(%eax),%xmm0
+ DB 15,88,128,118,108,0,0 ; addps 0x6c76(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,128,108,0,0 ; addps 0x6c80(%eax),%xmm0
+ DB 15,88,128,134,108,0,0 ; addps 0x6c86(%eax),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,194,236,1 ; cmpltps %xmm4,%xmm5
- DB 15,40,176,144,108,0,0 ; movaps 0x6c90(%eax),%xmm6
+ DB 15,40,176,150,108,0,0 ; movaps 0x6c96(%eax),%xmm6
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,84,245 ; andps %xmm5,%xmm6
DB 15,85,232 ; andnps %xmm0,%xmm5
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,86,238 ; orps %xmm6,%xmm5
DB 15,194,204,1 ; cmpltps %xmm4,%xmm1
- DB 15,40,128,128,102,0,0 ; movaps 0x6680(%eax),%xmm0
+ DB 15,40,128,150,102,0,0 ; movaps 0x6696(%eax),%xmm0
DB 15,92,197 ; subps %xmm5,%xmm0
DB 15,84,193 ; andps %xmm1,%xmm0
DB 15,85,205 ; andnps %xmm5,%xmm1
DB 15,86,200 ; orps %xmm0,%xmm1
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,194,196,1 ; cmpltps %xmm4,%xmm0
- DB 15,40,168,160,102,0,0 ; movaps 0x66a0(%eax),%xmm5
+ DB 15,40,168,166,102,0,0 ; movaps 0x66a6(%eax),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,84,232 ; andps %xmm0,%xmm5
DB 15,85,193 ; andnps %xmm1,%xmm0
@@ -53573,15 +53575,15 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
DB 15,88,240 ; addps %xmm0,%xmm6
- DB 232,0,0,0,0 ; call 6acd <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
+ DB 232,0,0,0,0 ; call 6ac7 <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
DB 90 ; pop %edx
DB 243,15,89,237 ; mulss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,92,245 ; subps %xmm5,%xmm6
DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 15,89,162,131,107,0,0 ; mulps 0x6b83(%edx),%xmm4
- DB 15,89,130,147,107,0,0 ; mulps 0x6b93(%edx),%xmm0
+ DB 15,89,162,137,107,0,0 ; mulps 0x6b89(%edx),%xmm4
+ DB 15,89,130,153,107,0,0 ; mulps 0x6b99(%edx),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
@@ -53589,11 +53591,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 15,81,237 ; sqrtps %xmm5,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,162,51,106,0,0 ; xorps 0x6a33(%edx),%xmm4
+ DB 15,87,162,57,106,0,0 ; xorps 0x6a39(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,89,170,99,101,0,0 ; mulps 0x6563(%edx),%xmm5
+ DB 15,89,170,121,101,0,0 ; mulps 0x6579(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,95,196 ; maxps %xmm4,%xmm0
@@ -53622,15 +53624,15 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
DB 15,88,240 ; addps %xmm0,%xmm6
- DB 232,0,0,0,0 ; call 6b6b <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
+ DB 232,0,0,0,0 ; call 6b65 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
DB 90 ; pop %edx
DB 243,15,89,237 ; mulss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,92,245 ; subps %xmm5,%xmm6
DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 15,89,162,229,106,0,0 ; mulps 0x6ae5(%edx),%xmm4
- DB 15,89,130,245,106,0,0 ; mulps 0x6af5(%edx),%xmm0
+ DB 15,89,162,235,106,0,0 ; mulps 0x6aeb(%edx),%xmm4
+ DB 15,89,130,251,106,0,0 ; mulps 0x6afb(%edx),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
@@ -53638,11 +53640,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 15,81,237 ; sqrtps %xmm5,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,162,149,105,0,0 ; xorps 0x6995(%edx),%xmm4
+ DB 15,87,162,155,105,0,0 ; xorps 0x699b(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,89,170,197,100,0,0 ; mulps 0x64c5(%edx),%xmm5
+ DB 15,89,170,219,100,0,0 ; mulps 0x64db(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
@@ -53660,7 +53662,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 6be3 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
+ DB 232,0,0,0,0 ; call 6bdd <_sk_xy_to_2pt_conical_linear_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -53669,7 +53671,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,89,169,109,106,0,0 ; mulps 0x6a6d(%ecx),%xmm5
+ DB 15,89,169,115,106,0,0 ; mulps 0x6a73(%ecx),%xmm5
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
@@ -53677,7 +53679,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,15,89,228 ; mulss %xmm4,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,129,29,105,0,0 ; xorps 0x691d(%ecx),%xmm0
+ DB 15,87,129,35,105,0,0 ; xorps 0x6923(%ecx),%xmm0
DB 15,94,197 ; divps %xmm5,%xmm0
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
@@ -53745,16 +53747,16 @@ _sk_save_xy_sse2 LABEL PROC
DB 131,236,24 ; sub $0x18,%esp
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 6cc0 <_sk_save_xy_sse2+0x12>
+ DB 232,0,0,0,0 ; call 6cba <_sk_save_xy_sse2+0x12>
DB 88 ; pop %eax
- DB 15,40,160,112,99,0,0 ; movaps 0x6370(%eax),%xmm4
+ DB 15,40,160,134,99,0,0 ; movaps 0x6386(%eax),%xmm4
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,88,236 ; addps %xmm4,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
- DB 15,40,144,144,99,0,0 ; movaps 0x6390(%eax),%xmm2
+ DB 15,40,144,150,99,0,0 ; movaps 0x6396(%eax),%xmm2
DB 15,84,250 ; andps %xmm2,%xmm7
DB 15,92,247 ; subps %xmm7,%xmm6
DB 15,92,238 ; subps %xmm6,%xmm5
@@ -53825,15 +53827,15 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6da2 <_sk_bilinear_nx_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6d9c <_sk_bilinear_nx_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,206,104,0,0 ; addps 0x68ce(%eax),%xmm0
- DB 15,40,168,174,98,0,0 ; movaps 0x62ae(%eax),%xmm5
+ DB 15,88,128,212,104,0,0 ; addps 0x68d4(%eax),%xmm0
+ DB 15,40,168,180,98,0,0 ; movaps 0x62b4(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -53852,14 +53854,14 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6de5 <_sk_bilinear_px_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6ddf <_sk_bilinear_px_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,75,98,0,0 ; addps 0x624b(%eax),%xmm0
+ DB 15,88,128,97,98,0,0 ; addps 0x6261(%eax),%xmm0
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -53877,15 +53879,15 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6e1e <_sk_bilinear_ny_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6e18 <_sk_bilinear_ny_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,82,104,0,0 ; addps 0x6852(%eax),%xmm1
- DB 15,40,168,50,98,0,0 ; movaps 0x6232(%eax),%xmm5
+ DB 15,88,136,88,104,0,0 ; addps 0x6858(%eax),%xmm1
+ DB 15,40,168,56,98,0,0 ; movaps 0x6238(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -53904,14 +53906,14 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6e62 <_sk_bilinear_py_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6e5c <_sk_bilinear_py_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,206,97,0,0 ; addps 0x61ce(%eax),%xmm1
+ DB 15,88,136,228,97,0,0 ; addps 0x61e4(%eax),%xmm1
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -53929,20 +53931,20 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6e9c <_sk_bicubic_n3x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6e96 <_sk_bicubic_n3x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,228,103,0,0 ; addps 0x67e4(%eax),%xmm0
- DB 15,40,168,180,97,0,0 ; movaps 0x61b4(%eax),%xmm5
+ DB 15,88,128,234,103,0,0 ; addps 0x67ea(%eax),%xmm0
+ DB 15,40,168,186,97,0,0 ; movaps 0x61ba(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,89,228 ; mulps %xmm4,%xmm4
- DB 15,89,168,244,103,0,0 ; mulps 0x67f4(%eax),%xmm5
- DB 15,88,168,148,99,0,0 ; addps 0x6394(%eax),%xmm5
+ DB 15,89,168,250,103,0,0 ; mulps 0x67fa(%eax),%xmm5
+ DB 15,88,168,154,99,0,0 ; addps 0x639a(%eax),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -53961,23 +53963,23 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6ef6 <_sk_bicubic_n1x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6ef0 <_sk_bicubic_n1x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,122,103,0,0 ; addps 0x677a(%eax),%xmm0
- DB 15,40,168,90,97,0,0 ; movaps 0x615a(%eax),%xmm5
+ DB 15,88,128,128,103,0,0 ; addps 0x6780(%eax),%xmm0
+ DB 15,40,168,96,97,0,0 ; movaps 0x6160(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,160,170,103,0,0 ; movaps 0x67aa(%eax),%xmm4
+ DB 15,40,160,176,103,0,0 ; movaps 0x67b0(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,186,103,0,0 ; addps 0x67ba(%eax),%xmm4
+ DB 15,88,160,192,103,0,0 ; addps 0x67c0(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,58,97,0,0 ; addps 0x613a(%eax),%xmm4
+ DB 15,88,160,80,97,0,0 ; addps 0x6150(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,202,103,0,0 ; addps 0x67ca(%eax),%xmm4
+ DB 15,88,160,208,103,0,0 ; addps 0x67d0(%eax),%xmm4
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -53995,22 +53997,22 @@ _sk_bicubic_p1x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6f5e <_sk_bicubic_p1x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6f58 <_sk_bicubic_p1x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
- DB 15,40,160,210,96,0,0 ; movaps 0x60d2(%eax),%xmm4
+ DB 15,40,160,232,96,0,0 ; movaps 0x60e8(%eax),%xmm4
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,110,64 ; movups 0x40(%esi),%xmm5
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,40,176,66,103,0,0 ; movaps 0x6742(%eax),%xmm6
+ DB 15,40,176,72,103,0,0 ; movaps 0x6748(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,82,103,0,0 ; addps 0x6752(%eax),%xmm6
+ DB 15,88,176,88,103,0,0 ; addps 0x6758(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,98,103,0,0 ; addps 0x6762(%eax),%xmm6
+ DB 15,88,176,104,103,0,0 ; addps 0x6768(%eax),%xmm6
DB 15,17,182,128,0,0,0 ; movups %xmm6,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -54028,18 +54030,18 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6fbb <_sk_bicubic_p3x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6fb5 <_sk_bicubic_p3x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,245,102,0,0 ; addps 0x66f5(%eax),%xmm0
+ DB 15,88,128,251,102,0,0 ; addps 0x66fb(%eax),%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,89,160,213,102,0,0 ; mulps 0x66d5(%eax),%xmm4
- DB 15,88,160,117,98,0,0 ; addps 0x6275(%eax),%xmm4
+ DB 15,89,160,219,102,0,0 ; mulps 0x66db(%eax),%xmm4
+ DB 15,88,160,123,98,0,0 ; addps 0x627b(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -54058,20 +54060,20 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 700b <_sk_bicubic_n3y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 7005 <_sk_bicubic_n3y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,117,102,0,0 ; addps 0x6675(%eax),%xmm1
- DB 15,40,168,69,96,0,0 ; movaps 0x6045(%eax),%xmm5
+ DB 15,88,136,123,102,0,0 ; addps 0x667b(%eax),%xmm1
+ DB 15,40,168,75,96,0,0 ; movaps 0x604b(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,89,228 ; mulps %xmm4,%xmm4
- DB 15,89,168,133,102,0,0 ; mulps 0x6685(%eax),%xmm5
- DB 15,88,168,37,98,0,0 ; addps 0x6225(%eax),%xmm5
+ DB 15,89,168,139,102,0,0 ; mulps 0x668b(%eax),%xmm5
+ DB 15,88,168,43,98,0,0 ; addps 0x622b(%eax),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -54090,23 +54092,23 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 7066 <_sk_bicubic_n1y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 7060 <_sk_bicubic_n1y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,10,102,0,0 ; addps 0x660a(%eax),%xmm1
- DB 15,40,168,234,95,0,0 ; movaps 0x5fea(%eax),%xmm5
+ DB 15,88,136,16,102,0,0 ; addps 0x6610(%eax),%xmm1
+ DB 15,40,168,240,95,0,0 ; movaps 0x5ff0(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,160,58,102,0,0 ; movaps 0x663a(%eax),%xmm4
+ DB 15,40,160,64,102,0,0 ; movaps 0x6640(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,74,102,0,0 ; addps 0x664a(%eax),%xmm4
+ DB 15,88,160,80,102,0,0 ; addps 0x6650(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,202,95,0,0 ; addps 0x5fca(%eax),%xmm4
+ DB 15,88,160,224,95,0,0 ; addps 0x5fe0(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,90,102,0,0 ; addps 0x665a(%eax),%xmm4
+ DB 15,88,160,96,102,0,0 ; addps 0x6660(%eax),%xmm4
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -54124,22 +54126,22 @@ _sk_bicubic_p1y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 70cf <_sk_bicubic_p1y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 70c9 <_sk_bicubic_p1y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
- DB 15,40,160,97,95,0,0 ; movaps 0x5f61(%eax),%xmm4
+ DB 15,40,160,119,95,0,0 ; movaps 0x5f77(%eax),%xmm4
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,110,96 ; movups 0x60(%esi),%xmm5
DB 15,88,204 ; addps %xmm4,%xmm1
- DB 15,40,176,209,101,0,0 ; movaps 0x65d1(%eax),%xmm6
+ DB 15,40,176,215,101,0,0 ; movaps 0x65d7(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,225,101,0,0 ; addps 0x65e1(%eax),%xmm6
+ DB 15,88,176,231,101,0,0 ; addps 0x65e7(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,241,101,0,0 ; addps 0x65f1(%eax),%xmm6
+ DB 15,88,176,247,101,0,0 ; addps 0x65f7(%eax),%xmm6
DB 15,17,182,160,0,0,0 ; movups %xmm6,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -54157,18 +54159,18 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 712d <_sk_bicubic_p3y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 7127 <_sk_bicubic_p3y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,131,101,0,0 ; addps 0x6583(%eax),%xmm1
+ DB 15,88,136,137,101,0,0 ; addps 0x6589(%eax),%xmm1
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,89,160,99,101,0,0 ; mulps 0x6563(%eax),%xmm4
- DB 15,88,160,3,97,0,0 ; addps 0x6103(%eax),%xmm4
+ DB 15,89,160,105,101,0,0 ; mulps 0x6569(%eax),%xmm4
+ DB 15,88,160,9,97,0,0 ; addps 0x6109(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -54309,7 +54311,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,98,233 ; punpckldq %xmm1,%xmm5
DB 102,15,127,173,104,255,255,255 ; movdqa %xmm5,-0x98(%ebp)
- DB 232,0,0,0,0 ; call 7321 <_sk_clut_3D_sse2+0xff>
+ DB 232,0,0,0,0 ; call 731b <_sk_clut_3D_sse2+0xff>
DB 90 ; pop %edx
DB 243,15,91,196 ; cvttps2dq %xmm4,%xmm0
DB 102,15,127,133,232,254,255,255 ; movdqa %xmm0,-0x118(%ebp)
@@ -54318,7 +54320,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,111,205 ; movdqa %xmm5,%xmm1
DB 102,15,254,202 ; paddd %xmm2,%xmm1
- DB 102,15,111,130,191,99,0,0 ; movdqa 0x63bf(%edx),%xmm0
+ DB 102,15,111,130,197,99,0,0 ; movdqa 0x63c5(%edx),%xmm0
DB 102,15,127,133,88,255,255,255 ; movdqa %xmm0,-0xa8(%ebp)
DB 102,15,112,225,245 ; pshufd $0xf5,%xmm1,%xmm4
DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
@@ -54342,7 +54344,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,196 ; unpcklps %xmm4,%xmm0
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
- DB 102,15,111,130,79,93,0,0 ; movdqa 0x5d4f(%edx),%xmm0
+ DB 102,15,111,130,85,93,0,0 ; movdqa 0x5d55(%edx),%xmm0
DB 102,15,127,133,72,255,255,255 ; movdqa %xmm0,-0xb8(%ebp)
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,254,224 ; paddd %xmm0,%xmm4
@@ -54360,7 +54362,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,15,16,36,185 ; movss (%ecx,%edi,4),%xmm4
DB 15,20,252 ; unpcklps %xmm4,%xmm7
DB 15,20,248 ; unpcklps %xmm0,%xmm7
- DB 102,15,111,130,111,93,0,0 ; movdqa 0x5d6f(%edx),%xmm0
+ DB 102,15,111,130,117,93,0,0 ; movdqa 0x5d75(%edx),%xmm0
DB 102,15,127,69,216 ; movdqa %xmm0,-0x28(%ebp)
DB 102,15,254,200 ; paddd %xmm0,%xmm1
DB 102,15,112,193,229 ; pshufd $0xe5,%xmm1,%xmm0
@@ -54377,7 +54379,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,15,16,4,177 ; movss (%ecx,%esi,4),%xmm0
DB 15,20,232 ; unpcklps %xmm0,%xmm5
DB 15,20,236 ; unpcklps %xmm4,%xmm5
- DB 15,40,130,175,99,0,0 ; movaps 0x63af(%edx),%xmm0
+ DB 15,40,130,181,99,0,0 ; movaps 0x63b5(%edx),%xmm0
DB 15,88,240 ; addps %xmm0,%xmm6
DB 15,41,117,184 ; movaps %xmm6,-0x48(%ebp)
DB 15,40,141,56,255,255,255 ; movaps -0xc8(%ebp),%xmm1
@@ -54988,7 +54990,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,98,209 ; punpckldq %xmm1,%xmm2
DB 102,15,127,85,168 ; movdqa %xmm2,-0x58(%ebp)
- DB 232,0,0,0,0 ; call 7e97 <_sk_clut_4D_sse2+0x179>
+ DB 232,0,0,0,0 ; call 7e91 <_sk_clut_4D_sse2+0x179>
DB 89 ; pop %ecx
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,41,165,120,254,255,255 ; movaps %xmm4,-0x188(%ebp)
@@ -55001,7 +55003,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,245 ; paddd %xmm5,%xmm6
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,15,254,206 ; paddd %xmm6,%xmm1
- DB 102,15,111,153,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm3
+ DB 102,15,111,153,79,88,0,0 ; movdqa 0x584f(%ecx),%xmm3
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
@@ -55024,7 +55026,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
- DB 102,15,111,153,217,81,0,0 ; movdqa 0x51d9(%ecx),%xmm3
+ DB 102,15,111,153,223,81,0,0 ; movdqa 0x51df(%ecx),%xmm3
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,234,229 ; pshufd $0xe5,%xmm2,%xmm5
@@ -55042,7 +55044,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,215 ; unpcklps %xmm7,%xmm2
DB 15,20,213 ; unpcklps %xmm5,%xmm2
DB 15,41,149,136,254,255,255 ; movaps %xmm2,-0x178(%ebp)
- DB 102,15,254,137,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm1
+ DB 102,15,254,137,255,81,0,0 ; paddd 0x51ff(%ecx),%xmm1
DB 102,15,112,233,229 ; pshufd $0xe5,%xmm1,%xmm5
DB 102,15,126,232 ; movd %xmm5,%eax
DB 102,15,112,233,78 ; pshufd $0x4e,%xmm1,%xmm5
@@ -55058,7 +55060,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,207 ; unpcklps %xmm7,%xmm1
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,41,141,152,254,255,255 ; movaps %xmm1,-0x168(%ebp)
- DB 15,40,185,57,88,0,0 ; movaps 0x5839(%ecx),%xmm7
+ DB 15,40,185,63,88,0,0 ; movaps 0x583f(%ecx),%xmm7
DB 15,88,231 ; addps %xmm7,%xmm4
DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp)
DB 15,40,141,232,254,255,255 ; movaps -0x118(%ebp),%xmm1
@@ -55079,7 +55081,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,127,77,184 ; movdqa %xmm1,-0x48(%ebp)
DB 102,15,254,241 ; paddd %xmm1,%xmm6
DB 102,15,112,254,245 ; pshufd $0xf5,%xmm6,%xmm7
- DB 102,15,111,137,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm1
+ DB 102,15,111,137,79,88,0,0 ; movdqa 0x584f(%ecx),%xmm1
DB 102,15,244,241 ; pmuludq %xmm1,%xmm6
DB 102,15,112,198,232 ; pshufd $0xe8,%xmm6,%xmm0
DB 102,15,244,249 ; pmuludq %xmm1,%xmm7
@@ -55116,7 +55118,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,44,178 ; movss (%edx,%esi,4),%xmm5
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 15,20,217 ; unpcklps %xmm1,%xmm3
- DB 102,15,111,177,249,81,0,0 ; movdqa 0x51f9(%ecx),%xmm6
+ DB 102,15,111,177,255,81,0,0 ; movdqa 0x51ff(%ecx),%xmm6
DB 102,15,254,198 ; paddd %xmm6,%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
DB 102,15,126,200 ; movd %xmm1,%eax
@@ -55164,7 +55166,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
DB 102,15,254,77,168 ; paddd -0x58(%ebp),%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,129,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm0
+ DB 102,15,111,129,79,88,0,0 ; movdqa 0x584f(%ecx),%xmm0
DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
@@ -55186,7 +55188,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,195 ; unpcklps %xmm3,%xmm0
DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp)
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,111,129,217,81,0,0 ; movdqa 0x51d9(%ecx),%xmm0
+ DB 102,15,111,129,223,81,0,0 ; movdqa 0x51df(%ecx),%xmm0
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3
@@ -55222,7 +55224,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,197 ; movdqa %xmm5,%xmm0
DB 102,15,254,69,184 ; paddd -0x48(%ebp),%xmm0
DB 102,15,112,216,245 ; pshufd $0xf5,%xmm0,%xmm3
- DB 102,15,111,137,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm1
+ DB 102,15,111,137,79,88,0,0 ; movdqa 0x584f(%ecx),%xmm1
DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,217 ; pmuludq %xmm1,%xmm3
@@ -55258,7 +55260,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
DB 15,20,224 ; unpcklps %xmm0,%xmm4
DB 15,20,227 ; unpcklps %xmm3,%xmm4
- DB 102,15,111,153,249,81,0,0 ; movdqa 0x51f9(%ecx),%xmm3
+ DB 102,15,111,153,255,81,0,0 ; movdqa 0x51ff(%ecx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
DB 102,15,126,192 ; movd %xmm0,%eax
@@ -55322,7 +55324,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,197 ; movdqa %xmm5,%xmm0
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,145,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm2
+ DB 102,15,111,145,79,88,0,0 ; movdqa 0x584f(%ecx),%xmm2
DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
@@ -55344,7 +55346,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,214 ; unpcklps %xmm6,%xmm2
DB 15,41,85,136 ; movaps %xmm2,-0x78(%ebp)
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,111,145,217,81,0,0 ; movdqa 0x51d9(%ecx),%xmm2
+ DB 102,15,111,145,223,81,0,0 ; movdqa 0x51df(%ecx),%xmm2
DB 102,15,254,202 ; paddd %xmm2,%xmm1
DB 102,15,112,241,229 ; pshufd $0xe5,%xmm1,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
@@ -55377,7 +55379,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,206 ; unpcklps %xmm6,%xmm1
DB 102,15,254,109,184 ; paddd -0x48(%ebp),%xmm5
DB 102,15,112,245,245 ; pshufd $0xf5,%xmm5,%xmm6
- DB 102,15,111,129,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm0
+ DB 102,15,111,129,79,88,0,0 ; movdqa 0x584f(%ecx),%xmm0
DB 102,15,244,232 ; pmuludq %xmm0,%xmm5
DB 102,15,112,253,232 ; pshufd $0xe8,%xmm5,%xmm7
DB 102,15,244,240 ; pmuludq %xmm0,%xmm6
@@ -55413,7 +55415,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
DB 15,20,234 ; unpcklps %xmm2,%xmm5
DB 15,20,238 ; unpcklps %xmm6,%xmm5
- DB 102,15,111,153,249,81,0,0 ; movdqa 0x51f9(%ecx),%xmm3
+ DB 102,15,111,153,255,81,0,0 ; movdqa 0x51ff(%ecx),%xmm3
DB 102,15,254,251 ; paddd %xmm3,%xmm7
DB 102,15,112,215,229 ; pshufd $0xe5,%xmm7,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
@@ -55447,7 +55449,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,177,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm6
+ DB 102,15,111,177,79,88,0,0 ; movdqa 0x584f(%ecx),%xmm6
DB 102,15,244,198 ; pmuludq %xmm6,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,206 ; pmuludq %xmm6,%xmm1
@@ -55469,7 +55471,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,193 ; unpcklps %xmm1,%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
- DB 102,15,254,137,217,81,0,0 ; paddd 0x51d9(%ecx),%xmm1
+ DB 102,15,254,137,223,81,0,0 ; paddd 0x51df(%ecx),%xmm1
DB 102,15,112,241,229 ; pshufd $0xe5,%xmm1,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -55503,7 +55505,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,212 ; movdqa %xmm4,%xmm2
DB 102,15,254,85,184 ; paddd -0x48(%ebp),%xmm2
DB 102,15,112,194,245 ; pshufd $0xf5,%xmm2,%xmm0
- DB 102,15,111,137,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm1
+ DB 102,15,111,137,79,88,0,0 ; movdqa 0x584f(%ecx),%xmm1
DB 102,15,244,209 ; pmuludq %xmm1,%xmm2
DB 102,15,112,226,232 ; pshufd $0xe8,%xmm2,%xmm4
DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
@@ -55524,7 +55526,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,200 ; unpcklps %xmm0,%xmm1
DB 15,20,206 ; unpcklps %xmm6,%xmm1
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
- DB 102,15,254,129,217,81,0,0 ; paddd 0x51d9(%ecx),%xmm0
+ DB 102,15,254,129,223,81,0,0 ; paddd 0x51df(%ecx),%xmm0
DB 102,15,112,240,229 ; pshufd $0xe5,%xmm0,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
DB 102,15,112,240,78 ; pshufd $0x4e,%xmm0,%xmm6
@@ -55539,7 +55541,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
DB 15,20,208 ; unpcklps %xmm0,%xmm2
DB 15,20,214 ; unpcklps %xmm6,%xmm2
- DB 102,15,254,161,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm4
+ DB 102,15,254,161,255,81,0,0 ; paddd 0x51ff(%ecx),%xmm4
DB 102,15,112,196,229 ; pshufd $0xe5,%xmm4,%xmm0
DB 102,15,126,192 ; movd %xmm0,%eax
DB 102,15,112,196,78 ; pshufd $0x4e,%xmm4,%xmm0
@@ -55607,7 +55609,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,69,168 ; movdqa -0x58(%ebp),%xmm0
DB 102,15,254,193 ; paddd %xmm1,%xmm0
DB 102,15,112,224,245 ; pshufd $0xf5,%xmm0,%xmm4
- DB 102,15,111,145,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm2
+ DB 102,15,111,145,79,88,0,0 ; movdqa 0x584f(%ecx),%xmm2
DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
DB 102,15,112,216,232 ; pshufd $0xe8,%xmm0,%xmm3
DB 102,15,244,226 ; pmuludq %xmm2,%xmm4
@@ -55630,7 +55632,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,196 ; unpcklps %xmm4,%xmm0
DB 15,41,133,120,255,255,255 ; movaps %xmm0,-0x88(%ebp)
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
- DB 102,15,111,145,217,81,0,0 ; movdqa 0x51d9(%ecx),%xmm2
+ DB 102,15,111,145,223,81,0,0 ; movdqa 0x51df(%ecx),%xmm2
DB 102,15,254,226 ; paddd %xmm2,%xmm4
DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
DB 102,15,126,232 ; movd %xmm5,%eax
@@ -55646,7 +55648,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4
DB 15,20,236 ; unpcklps %xmm4,%xmm5
DB 15,20,238 ; unpcklps %xmm6,%xmm5
- DB 102,15,254,153,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm3
+ DB 102,15,254,153,255,81,0,0 ; paddd 0x51ff(%ecx),%xmm3
DB 102,15,112,227,229 ; pshufd $0xe5,%xmm3,%xmm4
DB 102,15,126,224 ; movd %xmm4,%eax
DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
@@ -55698,7 +55700,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,20,223 ; unpcklps %xmm7,%xmm3
- DB 102,15,254,161,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm4
+ DB 102,15,254,161,255,81,0,0 ; paddd 0x51ff(%ecx),%xmm4
DB 102,15,112,212,229 ; pshufd $0xe5,%xmm4,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,15,112,212,78 ; pshufd $0x4e,%xmm4,%xmm2
@@ -55731,7 +55733,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,127,133,56,255,255,255 ; movdqa %xmm0,-0xc8(%ebp)
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,208,245 ; pshufd $0xf5,%xmm0,%xmm2
- DB 102,15,111,137,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm1
+ DB 102,15,111,137,79,88,0,0 ; movdqa 0x584f(%ecx),%xmm1
DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
DB 102,15,112,240,232 ; pshufd $0xe8,%xmm0,%xmm6
DB 102,15,244,209 ; pmuludq %xmm1,%xmm2
@@ -55753,7 +55755,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,194 ; unpcklps %xmm2,%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 102,15,111,214 ; movdqa %xmm6,%xmm2
- DB 102,15,111,153,217,81,0,0 ; movdqa 0x51d9(%ecx),%xmm3
+ DB 102,15,111,153,223,81,0,0 ; movdqa 0x51df(%ecx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,234,229 ; pshufd $0xe5,%xmm2,%xmm5
DB 102,15,126,232 ; movd %xmm5,%eax
@@ -55769,7 +55771,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
DB 15,20,234 ; unpcklps %xmm2,%xmm5
DB 15,20,239 ; unpcklps %xmm7,%xmm5
- DB 102,15,254,177,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm6
+ DB 102,15,254,177,255,81,0,0 ; paddd 0x51ff(%ecx),%xmm6
DB 102,15,112,214,229 ; pshufd $0xe5,%xmm6,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,15,112,214,78 ; pshufd $0x4e,%xmm6,%xmm2
@@ -55822,7 +55824,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
DB 15,20,216 ; unpcklps %xmm0,%xmm3
DB 15,20,218 ; unpcklps %xmm2,%xmm3
- DB 102,15,254,185,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm7
+ DB 102,15,254,185,255,81,0,0 ; paddd 0x51ff(%ecx),%xmm7
DB 102,15,112,199,229 ; pshufd $0xe5,%xmm7,%xmm0
DB 102,15,126,192 ; movd %xmm0,%eax
DB 102,15,112,199,78 ; pshufd $0x4e,%xmm7,%xmm0
@@ -55872,7 +55874,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,153,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm3
+ DB 102,15,111,153,79,88,0,0 ; movdqa 0x584f(%ecx),%xmm3
DB 102,15,244,195 ; pmuludq %xmm3,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
@@ -55894,7 +55896,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,193 ; unpcklps %xmm1,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
- DB 102,15,111,177,217,81,0,0 ; movdqa 0x51d9(%ecx),%xmm6
+ DB 102,15,111,177,223,81,0,0 ; movdqa 0x51df(%ecx),%xmm6
DB 102,15,254,206 ; paddd %xmm6,%xmm1
DB 102,15,112,217,229 ; pshufd $0xe5,%xmm1,%xmm3
DB 102,15,126,216 ; movd %xmm3,%eax
@@ -55910,7 +55912,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,203 ; unpcklps %xmm3,%xmm1
- DB 102,15,111,185,249,81,0,0 ; movdqa 0x51f9(%ecx),%xmm7
+ DB 102,15,111,185,255,81,0,0 ; movdqa 0x51ff(%ecx),%xmm7
DB 102,15,254,215 ; paddd %xmm7,%xmm2
DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3
DB 102,15,126,216 ; movd %xmm3,%eax
@@ -55929,7 +55931,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,221 ; movdqa %xmm5,%xmm3
DB 102,15,254,93,184 ; paddd -0x48(%ebp),%xmm3
DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
- DB 102,15,111,129,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm0
+ DB 102,15,111,129,79,88,0,0 ; movdqa 0x584f(%ecx),%xmm0
DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
DB 102,15,244,224 ; pmuludq %xmm0,%xmm4
@@ -55998,7 +56000,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,193 ; paddd %xmm1,%xmm0
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,145,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm2
+ DB 102,15,111,145,79,88,0,0 ; movdqa 0x584f(%ecx),%xmm2
DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
@@ -56021,7 +56023,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,41,93,168 ; movaps %xmm3,-0x58(%ebp)
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,137,217,81,0,0 ; paddd 0x51d9(%ecx),%xmm1
+ DB 102,15,254,137,223,81,0,0 ; paddd 0x51df(%ecx),%xmm1
DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
@@ -56037,7 +56039,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,217 ; unpcklps %xmm1,%xmm3
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp)
- DB 102,15,254,129,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm0
+ DB 102,15,254,129,255,81,0,0 ; paddd 0x51ff(%ecx),%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
DB 102,15,126,200 ; movd %xmm1,%eax
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
@@ -56074,7 +56076,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,60,178 ; movss (%edx,%esi,4),%xmm7
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
- DB 102,15,111,177,217,81,0,0 ; movdqa 0x51d9(%ecx),%xmm6
+ DB 102,15,111,177,223,81,0,0 ; movdqa 0x51df(%ecx),%xmm6
DB 102,15,254,242 ; paddd %xmm2,%xmm6
DB 102,15,112,206,229 ; pshufd $0xe5,%xmm6,%xmm1
DB 102,15,126,200 ; movd %xmm1,%eax
@@ -56090,7 +56092,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,52,178 ; movss (%edx,%esi,4),%xmm6
DB 15,20,206 ; unpcklps %xmm6,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,254,145,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm2
+ DB 102,15,254,145,255,81,0,0 ; paddd 0x51ff(%ecx),%xmm2
DB 102,15,112,242,229 ; pshufd $0xe5,%xmm2,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
DB 102,15,112,242,78 ; pshufd $0x4e,%xmm2,%xmm6
@@ -56160,7 +56162,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 139,117,12 ; mov 0xc(%ebp),%esi
DB 141,86,8 ; lea 0x8(%esi),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,153,185,81,0,0 ; movaps 0x51b9(%ecx),%xmm3
+ DB 15,40,153,191,81,0,0 ; movaps 0x51bf(%ecx),%xmm3
DB 82 ; push %edx
DB 80 ; push %eax
DB 255,86,4 ; call *0x4(%esi)
@@ -56170,6 +56172,8 @@ _sk_clut_4D_sse2 LABEL PROC
DB 91 ; pop %ebx
DB 93 ; pop %ebp
DB 195 ; ret
+ DB 144 ; nop
+ DB 144 ; nop
PUBLIC _sk_start_pipeline_sse2_8bit
_sk_start_pipeline_sse2_8bit LABEL PROC
@@ -56182,7 +56186,7 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 131,236,16 ; sub $0x10,%esp
DB 139,93,12 ; mov 0xc(%ebp),%ebx
DB 59,93,20 ; cmp 0x14(%ebp),%ebx
- DB 115,97 ; jae 936d <_sk_start_pipeline_sse2_8bit+0x75>
+ DB 115,97 ; jae 9369 <_sk_start_pipeline_sse2_8bit+0x75>
DB 139,85,16 ; mov 0x10(%ebp),%edx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 139,117,24 ; mov 0x18(%ebp),%esi
@@ -56194,7 +56198,7 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 57,84,36,8 ; cmp %edx,0x8(%esp)
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 137,243 ; mov %esi,%ebx
- DB 119,31 ; ja 934f <_sk_start_pipeline_sse2_8bit+0x57>
+ DB 119,31 ; ja 934b <_sk_start_pipeline_sse2_8bit+0x57>
DB 139,117,8 ; mov 0x8(%ebp),%esi
DB 255,116,36,4 ; pushl 0x4(%esp)
DB 86 ; push %esi
@@ -56207,12 +56211,12 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 131,198,16 ; add $0x10,%esi
DB 57,214 ; cmp %edx,%esi
DB 137,198 ; mov %eax,%esi
- DB 118,228 ; jbe 9333 <_sk_start_pipeline_sse2_8bit+0x3b>
+ DB 118,228 ; jbe 932f <_sk_start_pipeline_sse2_8bit+0x3b>
DB 137,209 ; mov %edx,%ecx
DB 41,193 ; sub %eax,%ecx
DB 137,222 ; mov %ebx,%esi
DB 139,92,36,4 ; mov 0x4(%esp),%ebx
- DB 116,12 ; je 9367 <_sk_start_pipeline_sse2_8bit+0x6f>
+ DB 116,12 ; je 9363 <_sk_start_pipeline_sse2_8bit+0x6f>
DB 83 ; push %ebx
DB 80 ; push %eax
DB 86 ; push %esi
@@ -56222,7 +56226,7 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 131,196,16 ; add $0x10,%esp
DB 67 ; inc %ebx
DB 59,93,20 ; cmp 0x14(%ebp),%ebx
- DB 117,180 ; jne 9321 <_sk_start_pipeline_sse2_8bit+0x29>
+ DB 117,180 ; jne 931d <_sk_start_pipeline_sse2_8bit+0x29>
DB 141,101,244 ; lea -0xc(%ebp),%esp
DB 94 ; pop %esi
DB 95 ; pop %edi
@@ -56262,15 +56266,15 @@ _sk_set_rgb_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 93b2 <_sk_set_rgb_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call 93ae <_sk_set_rgb_sse2_8bit+0xe>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
- DB 243,15,16,161,242,67,0,0 ; movss 0x43f2(%ecx),%xmm4
+ DB 243,15,16,161,246,67,0,0 ; movss 0x43f6(%ecx),%xmm4
DB 243,15,16,50 ; movss (%edx),%xmm6
DB 243,15,89,244 ; mulss %xmm4,%xmm6
DB 243,15,44,246 ; cvttss2si %xmm6,%esi
- DB 243,15,16,169,246,67,0,0 ; movss 0x43f6(%ecx),%xmm5
+ DB 243,15,16,169,250,67,0,0 ; movss 0x43fa(%ecx),%xmm5
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 243,15,92,253 ; subss %xmm5,%xmm7
DB 243,15,44,255 ; cvttss2si %xmm7,%edi
@@ -56300,7 +56304,7 @@ _sk_set_rgb_sse2_8bit LABEL PROC
DB 9,247 ; or %esi,%edi
DB 102,15,110,231 ; movd %edi,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
- DB 102,15,111,169,62,67,0,0 ; movdqa 0x433e(%ecx),%xmm5
+ DB 102,15,111,169,66,67,0,0 ; movdqa 0x4342(%ecx),%xmm5
DB 102,15,219,205 ; pand %xmm5,%xmm1
DB 102,15,219,197 ; pand %xmm5,%xmm0
DB 102,15,235,196 ; por %xmm4,%xmm0
@@ -56326,7 +56330,7 @@ _sk_premul_sse2_8bit LABEL PROC
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
DB 102,15,127,85,216 ; movdqa %xmm2,-0x28(%ebp)
DB 102,15,111,216 ; movdqa %xmm0,%xmm3
- DB 232,0,0,0,0 ; call 948a <_sk_premul_sse2_8bit+0x18>
+ DB 232,0,0,0,0 ; call 9486 <_sk_premul_sse2_8bit+0x18>
DB 88 ; pop %eax
DB 242,15,112,227,231 ; pshuflw $0xe7,%xmm3,%xmm4
DB 243,15,112,228,231 ; pshufhw $0xe7,%xmm4,%xmm4
@@ -56340,7 +56344,7 @@ _sk_premul_sse2_8bit LABEL PROC
DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4
DB 242,15,112,228,95 ; pshuflw $0x5f,%xmm4,%xmm4
DB 243,15,112,252,95 ; pshufhw $0x5f,%xmm4,%xmm7
- DB 102,15,111,160,102,66,0,0 ; movdqa 0x4266(%eax),%xmm4
+ DB 102,15,111,160,106,66,0,0 ; movdqa 0x426a(%eax),%xmm4
DB 102,15,235,252 ; por %xmm4,%xmm7
DB 102,15,235,244 ; por %xmm4,%xmm6
DB 102,15,239,210 ; pxor %xmm2,%xmm2
@@ -56447,7 +56451,7 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 9616 <_sk_load_8888_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call 9612 <_sk_load_8888_sse2_8bit+0xe>
DB 91 ; pop %ebx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -56458,7 +56462,7 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 117,30 ; jne 9650 <_sk_load_8888_sse2_8bit+0x48>
+ DB 117,30 ; jne 964c <_sk_load_8888_sse2_8bit+0x48>
DB 15,16,76,183,16 ; movups 0x10(%edi,%esi,4),%xmm1
DB 102,15,16,4,183 ; movupd (%edi,%esi,4),%xmm0
DB 141,72,8 ; lea 0x8(%eax),%ecx
@@ -56479,16 +56483,16 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 119,216 ; ja 963c <_sk_load_8888_sse2_8bit+0x34>
+ DB 119,216 ; ja 9638 <_sk_load_8888_sse2_8bit+0x34>
DB 15,182,201 ; movzbl %cl,%ecx
DB 3,156,139,158,0,0,0 ; add 0x9e(%ebx,%ecx,4),%ebx
DB 255,227 ; jmp *%ebx
DB 243,15,16,4,183 ; movss (%edi,%esi,4),%xmm0
- DB 235,197 ; jmp 963c <_sk_load_8888_sse2_8bit+0x34>
+ DB 235,197 ; jmp 9638 <_sk_load_8888_sse2_8bit+0x34>
DB 102,15,110,68,183,8 ; movd 0x8(%edi,%esi,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 102,15,18,4,183 ; movlpd (%edi,%esi,4),%xmm0
- DB 235,179 ; jmp 963c <_sk_load_8888_sse2_8bit+0x34>
+ DB 235,179 ; jmp 9638 <_sk_load_8888_sse2_8bit+0x34>
DB 102,15,110,68,183,24 ; movd 0x18(%edi,%esi,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 243,15,16,68,183,20 ; movss 0x14(%edi,%esi,4),%xmm0
@@ -56497,7 +56501,7 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 243,15,16,68,183,16 ; movss 0x10(%edi,%esi,4),%xmm0
DB 243,15,16,200 ; movss %xmm0,%xmm1
- DB 235,134 ; jmp 9637 <_sk_load_8888_sse2_8bit+0x2f>
+ DB 235,134 ; jmp 9633 <_sk_load_8888_sse2_8bit+0x2f>
DB 15,31,0 ; nopl (%eax)
DB 90 ; pop %edx
DB 0,0 ; add %al,(%eax)
@@ -56508,9 +56512,9 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 0,0 ; add %al,(%eax)
DB 143,0 ; popl (%eax)
DB 0,0 ; add %al,(%eax)
- DB 126,0 ; jle 96ca <_sk_load_8888_sse2_8bit+0xc2>
+ DB 126,0 ; jle 96c6 <_sk_load_8888_sse2_8bit+0xc2>
DB 0,0 ; add %al,(%eax)
- DB 115,0 ; jae 96ce <_sk_load_8888_sse2_8bit+0xc6>
+ DB 115,0 ; jae 96ca <_sk_load_8888_sse2_8bit+0xc6>
DB 0,0 ; add %al,(%eax)
PUBLIC _sk_load_8888_dst_sse2_8bit
@@ -56521,7 +56525,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 96de <_sk_load_8888_dst_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call 96da <_sk_load_8888_dst_sse2_8bit+0xe>
DB 91 ; pop %ebx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -56532,7 +56536,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 117,30 ; jne 9718 <_sk_load_8888_dst_sse2_8bit+0x48>
+ DB 117,30 ; jne 9714 <_sk_load_8888_dst_sse2_8bit+0x48>
DB 15,16,92,183,16 ; movups 0x10(%edi,%esi,4),%xmm3
DB 102,15,16,20,183 ; movupd (%edi,%esi,4),%xmm2
DB 141,72,8 ; lea 0x8(%eax),%ecx
@@ -56553,16 +56557,16 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 119,216 ; ja 9704 <_sk_load_8888_dst_sse2_8bit+0x34>
+ DB 119,216 ; ja 9700 <_sk_load_8888_dst_sse2_8bit+0x34>
DB 15,182,201 ; movzbl %cl,%ecx
DB 3,156,139,158,0,0,0 ; add 0x9e(%ebx,%ecx,4),%ebx
DB 255,227 ; jmp *%ebx
DB 243,15,16,20,183 ; movss (%edi,%esi,4),%xmm2
- DB 235,197 ; jmp 9704 <_sk_load_8888_dst_sse2_8bit+0x34>
+ DB 235,197 ; jmp 9700 <_sk_load_8888_dst_sse2_8bit+0x34>
DB 102,15,110,84,183,8 ; movd 0x8(%edi,%esi,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,15,18,20,183 ; movlpd (%edi,%esi,4),%xmm2
- DB 235,179 ; jmp 9704 <_sk_load_8888_dst_sse2_8bit+0x34>
+ DB 235,179 ; jmp 9700 <_sk_load_8888_dst_sse2_8bit+0x34>
DB 102,15,110,84,183,24 ; movd 0x18(%edi,%esi,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 243,15,16,84,183,20 ; movss 0x14(%edi,%esi,4),%xmm2
@@ -56571,7 +56575,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 243,15,16,84,183,16 ; movss 0x10(%edi,%esi,4),%xmm2
DB 243,15,16,218 ; movss %xmm2,%xmm3
- DB 235,134 ; jmp 96ff <_sk_load_8888_dst_sse2_8bit+0x2f>
+ DB 235,134 ; jmp 96fb <_sk_load_8888_dst_sse2_8bit+0x2f>
DB 15,31,0 ; nopl (%eax)
DB 90 ; pop %edx
DB 0,0 ; add %al,(%eax)
@@ -56582,9 +56586,9 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 0,0 ; add %al,(%eax)
DB 143,0 ; popl (%eax)
DB 0,0 ; add %al,(%eax)
- DB 126,0 ; jle 9792 <_sk_load_8888_dst_sse2_8bit+0xc2>
+ DB 126,0 ; jle 978e <_sk_load_8888_dst_sse2_8bit+0xc2>
DB 0,0 ; add %al,(%eax)
- DB 115,0 ; jae 9796 <_sk_load_8888_dst_sse2_8bit+0xc6>
+ DB 115,0 ; jae 9792 <_sk_load_8888_dst_sse2_8bit+0xc6>
DB 0,0 ; add %al,(%eax)
PUBLIC _sk_store_8888_sse2_8bit
@@ -56595,7 +56599,7 @@ _sk_store_8888_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 97a6 <_sk_store_8888_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call 97a2 <_sk_store_8888_sse2_8bit+0xe>
DB 91 ; pop %ebx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -56606,7 +56610,7 @@ _sk_store_8888_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 117,31 ; jne 97e1 <_sk_store_8888_sse2_8bit+0x49>
+ DB 117,31 ; jne 97dd <_sk_store_8888_sse2_8bit+0x49>
DB 243,15,127,4,183 ; movdqu %xmm0,(%edi,%esi,4)
DB 243,15,127,76,183,16 ; movdqu %xmm1,0x10(%edi,%esi,4)
DB 141,72,8 ; lea 0x8(%eax),%ecx
@@ -56625,23 +56629,23 @@ _sk_store_8888_sse2_8bit LABEL PROC
DB 128,225,7 ; and $0x7,%cl
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 119,224 ; ja 97cd <_sk_store_8888_sse2_8bit+0x35>
+ DB 119,224 ; ja 97c9 <_sk_store_8888_sse2_8bit+0x35>
DB 15,182,201 ; movzbl %cl,%ecx
DB 3,156,139,146,0,0,0 ; add 0x92(%ebx,%ecx,4),%ebx
DB 255,227 ; jmp *%ebx
DB 102,15,126,4,183 ; movd %xmm0,(%edi,%esi,4)
- DB 235,205 ; jmp 97cd <_sk_store_8888_sse2_8bit+0x35>
+ DB 235,205 ; jmp 97c9 <_sk_store_8888_sse2_8bit+0x35>
DB 102,15,112,224,78 ; pshufd $0x4e,%xmm0,%xmm4
DB 102,15,126,100,183,8 ; movd %xmm4,0x8(%edi,%esi,4)
DB 102,15,214,4,183 ; movq %xmm0,(%edi,%esi,4)
- DB 235,187 ; jmp 97cd <_sk_store_8888_sse2_8bit+0x35>
+ DB 235,187 ; jmp 97c9 <_sk_store_8888_sse2_8bit+0x35>
DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
DB 102,15,126,100,183,24 ; movd %xmm4,0x18(%edi,%esi,4)
DB 102,15,112,225,229 ; pshufd $0xe5,%xmm1,%xmm4
DB 102,15,126,100,183,20 ; movd %xmm4,0x14(%edi,%esi,4)
DB 102,15,126,76,183,16 ; movd %xmm1,0x10(%edi,%esi,4)
DB 243,15,127,4,183 ; movdqu %xmm0,(%edi,%esi,4)
- DB 235,152 ; jmp 97cd <_sk_store_8888_sse2_8bit+0x35>
+ DB 235,152 ; jmp 97c9 <_sk_store_8888_sse2_8bit+0x35>
DB 15,31,0 ; nopl (%eax)
DB 83 ; push %ebx
DB 0,0 ; add %al,(%eax)
@@ -56665,7 +56669,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 9862 <_sk_load_bgra_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call 985e <_sk_load_bgra_sse2_8bit+0xe>
DB 91 ; pop %ebx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -56676,7 +56680,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 117,106 ; jne 98e8 <_sk_load_bgra_sse2_8bit+0x94>
+ DB 117,106 ; jne 98e4 <_sk_load_bgra_sse2_8bit+0x94>
DB 15,16,76,183,16 ; movups 0x10(%edi,%esi,4),%xmm1
DB 102,15,16,4,183 ; movupd (%edi,%esi,4),%xmm0
DB 102,15,239,228 ; pxor %xmm4,%xmm4
@@ -56714,16 +56718,16 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 119,140 ; ja 9888 <_sk_load_bgra_sse2_8bit+0x34>
+ DB 119,140 ; ja 9884 <_sk_load_bgra_sse2_8bit+0x34>
DB 15,182,201 ; movzbl %cl,%ecx
DB 3,156,139,242,0,0,0 ; add 0xf2(%ebx,%ecx,4),%ebx
DB 255,227 ; jmp *%ebx
DB 243,15,16,4,183 ; movss (%edi,%esi,4),%xmm0
- DB 233,118,255,255,255 ; jmp 9888 <_sk_load_bgra_sse2_8bit+0x34>
+ DB 233,118,255,255,255 ; jmp 9884 <_sk_load_bgra_sse2_8bit+0x34>
DB 102,15,110,68,183,8 ; movd 0x8(%edi,%esi,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 102,15,18,4,183 ; movlpd (%edi,%esi,4),%xmm0
- DB 233,97,255,255,255 ; jmp 9888 <_sk_load_bgra_sse2_8bit+0x34>
+ DB 233,97,255,255,255 ; jmp 9884 <_sk_load_bgra_sse2_8bit+0x34>
DB 102,15,110,68,183,24 ; movd 0x18(%edi,%esi,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 243,15,16,68,183,20 ; movss 0x14(%edi,%esi,4),%xmm0
@@ -56732,7 +56736,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 243,15,16,68,183,16 ; movss 0x10(%edi,%esi,4),%xmm0
DB 243,15,16,200 ; movss %xmm0,%xmm1
- DB 233,49,255,255,255 ; jmp 9883 <_sk_load_bgra_sse2_8bit+0x2f>
+ DB 233,49,255,255,255 ; jmp 987f <_sk_load_bgra_sse2_8bit+0x2f>
DB 102,144 ; xchg %ax,%ax
DB 166 ; cmpsb %es:(%edi),%ds:(%esi)
DB 0,0 ; add %al,(%eax)
@@ -56756,7 +56760,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 997e <_sk_load_bgra_dst_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call 997a <_sk_load_bgra_dst_sse2_8bit+0xe>
DB 91 ; pop %ebx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -56767,7 +56771,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 117,106 ; jne 9a04 <_sk_load_bgra_dst_sse2_8bit+0x94>
+ DB 117,106 ; jne 9a00 <_sk_load_bgra_dst_sse2_8bit+0x94>
DB 15,16,92,183,16 ; movups 0x10(%edi,%esi,4),%xmm3
DB 102,15,16,20,183 ; movupd (%edi,%esi,4),%xmm2
DB 102,15,239,228 ; pxor %xmm4,%xmm4
@@ -56805,16 +56809,16 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 119,140 ; ja 99a4 <_sk_load_bgra_dst_sse2_8bit+0x34>
+ DB 119,140 ; ja 99a0 <_sk_load_bgra_dst_sse2_8bit+0x34>
DB 15,182,201 ; movzbl %cl,%ecx
DB 3,156,139,242,0,0,0 ; add 0xf2(%ebx,%ecx,4),%ebx
DB 255,227 ; jmp *%ebx
DB 243,15,16,20,183 ; movss (%edi,%esi,4),%xmm2
- DB 233,118,255,255,255 ; jmp 99a4 <_sk_load_bgra_dst_sse2_8bit+0x34>
+ DB 233,118,255,255,255 ; jmp 99a0 <_sk_load_bgra_dst_sse2_8bit+0x34>
DB 102,15,110,84,183,8 ; movd 0x8(%edi,%esi,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,15,18,20,183 ; movlpd (%edi,%esi,4),%xmm2
- DB 233,97,255,255,255 ; jmp 99a4 <_sk_load_bgra_dst_sse2_8bit+0x34>
+ DB 233,97,255,255,255 ; jmp 99a0 <_sk_load_bgra_dst_sse2_8bit+0x34>
DB 102,15,110,84,183,24 ; movd 0x18(%edi,%esi,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 243,15,16,84,183,20 ; movss 0x14(%edi,%esi,4),%xmm2
@@ -56823,7 +56827,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 243,15,16,84,183,16 ; movss 0x10(%edi,%esi,4),%xmm2
DB 243,15,16,218 ; movss %xmm2,%xmm3
- DB 233,49,255,255,255 ; jmp 999f <_sk_load_bgra_dst_sse2_8bit+0x2f>
+ DB 233,49,255,255,255 ; jmp 999b <_sk_load_bgra_dst_sse2_8bit+0x2f>
DB 102,144 ; xchg %ax,%ax
DB 166 ; cmpsb %es:(%edi),%ds:(%esi)
DB 0,0 ; add %al,(%eax)
@@ -56847,7 +56851,7 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 9a9a <_sk_store_bgra_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call 9a96 <_sk_store_bgra_sse2_8bit+0xe>
DB 95 ; pop %edi
DB 139,77,20 ; mov 0x14(%ebp),%ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
@@ -56878,7 +56882,7 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 102,15,103,238 ; packuswb %xmm6,%xmm5
DB 133,210 ; test %edx,%edx
DB 139,93,16 ; mov 0x10(%ebp),%ebx
- DB 117,29 ; jne 9b29 <_sk_store_bgra_sse2_8bit+0x9d>
+ DB 117,29 ; jne 9b25 <_sk_store_bgra_sse2_8bit+0x9d>
DB 243,15,127,44,158 ; movdqu %xmm5,(%esi,%ebx,4)
DB 243,15,127,100,158,16 ; movdqu %xmm4,0x10(%esi,%ebx,4)
DB 141,112,8 ; lea 0x8(%eax),%esi
@@ -56900,19 +56904,19 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 128,101,243,7 ; andb $0x7,-0xd(%ebp)
DB 254,77,243 ; decb -0xd(%ebp)
DB 128,125,243,6 ; cmpb $0x6,-0xd(%ebp)
- DB 119,213 ; ja 9b17 <_sk_store_bgra_sse2_8bit+0x8b>
+ DB 119,213 ; ja 9b13 <_sk_store_bgra_sse2_8bit+0x8b>
DB 15,182,125,243 ; movzbl -0xd(%ebp),%edi
DB 139,77,236 ; mov -0x14(%ebp),%ecx
DB 3,140,185,254,0,0,0 ; add 0xfe(%ecx,%edi,4),%ecx
DB 255,225 ; jmp *%ecx
DB 102,15,126,44,158 ; movd %xmm5,(%esi,%ebx,4)
DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 235,187 ; jmp 9b17 <_sk_store_bgra_sse2_8bit+0x8b>
+ DB 235,187 ; jmp 9b13 <_sk_store_bgra_sse2_8bit+0x8b>
DB 102,15,112,229,78 ; pshufd $0x4e,%xmm5,%xmm4
DB 102,15,126,100,158,8 ; movd %xmm4,0x8(%esi,%ebx,4)
DB 102,15,214,44,158 ; movq %xmm5,(%esi,%ebx,4)
DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 235,166 ; jmp 9b17 <_sk_store_bgra_sse2_8bit+0x8b>
+ DB 235,166 ; jmp 9b13 <_sk_store_bgra_sse2_8bit+0x8b>
DB 102,15,112,244,78 ; pshufd $0x4e,%xmm4,%xmm6
DB 102,15,126,116,158,24 ; movd %xmm6,0x18(%esi,%ebx,4)
DB 102,15,112,244,229 ; pshufd $0xe5,%xmm4,%xmm6
@@ -56920,7 +56924,7 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 102,15,126,100,158,16 ; movd %xmm4,0x10(%esi,%ebx,4)
DB 243,15,127,44,158 ; movdqu %xmm5,(%esi,%ebx,4)
DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 235,128 ; jmp 9b17 <_sk_store_bgra_sse2_8bit+0x8b>
+ DB 235,128 ; jmp 9b13 <_sk_store_bgra_sse2_8bit+0x8b>
DB 144 ; nop
DB 184,0,0,0,205 ; mov $0xcd000000,%eax
DB 0,0 ; add %al,(%eax)
@@ -56944,22 +56948,22 @@ _sk_store_565_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 9bc2 <_sk_store_565_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call 9bbe <_sk_store_565_sse2_8bit+0xe>
DB 88 ; pop %eax
- DB 102,15,111,176,62,59,0,0 ; movdqa 0x3b3e(%eax),%xmm6
+ DB 102,15,111,176,66,59,0,0 ; movdqa 0x3b42(%eax),%xmm6
DB 102,15,111,249 ; movdqa %xmm1,%xmm7
DB 102,15,219,254 ; pand %xmm6,%xmm7
DB 102,15,219,240 ; pand %xmm0,%xmm6
DB 102,15,114,246,8 ; pslld $0x8,%xmm6
DB 102,15,114,247,8 ; pslld $0x8,%xmm7
- DB 102,15,111,160,78,59,0,0 ; movdqa 0x3b4e(%eax),%xmm4
+ DB 102,15,111,160,82,59,0,0 ; movdqa 0x3b52(%eax),%xmm4
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,219,224 ; pand %xmm0,%xmm4
DB 102,15,114,212,5 ; psrld $0x5,%xmm4
DB 102,15,114,213,5 ; psrld $0x5,%xmm5
DB 102,15,235,239 ; por %xmm7,%xmm5
- DB 102,15,111,184,94,59,0,0 ; movdqa 0x3b5e(%eax),%xmm7
+ DB 102,15,111,184,98,59,0,0 ; movdqa 0x3b62(%eax),%xmm7
DB 102,15,235,230 ; por %xmm6,%xmm4
DB 102,15,111,240 ; movdqa %xmm0,%xmm6
DB 102,15,219,247 ; pand %xmm7,%xmm6
@@ -56983,7 +56987,7 @@ _sk_store_565_sse2_8bit LABEL PROC
DB 139,93,8 ; mov 0x8(%ebp),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 117,23 ; jne 9c78 <_sk_store_565_sse2_8bit+0xc4>
+ DB 117,23 ; jne 9c74 <_sk_store_565_sse2_8bit+0xc4>
DB 243,15,127,36,119 ; movdqu %xmm4,(%edi,%esi,2)
DB 141,65,8 ; lea 0x8(%ecx),%eax
DB 82 ; push %edx
@@ -57003,19 +57007,19 @@ _sk_store_565_sse2_8bit LABEL PROC
DB 128,101,243,7 ; andb $0x7,-0xd(%ebp)
DB 254,77,243 ; decb -0xd(%ebp)
DB 128,125,243,6 ; cmpb $0x6,-0xd(%ebp)
- DB 119,216 ; ja 9c66 <_sk_store_565_sse2_8bit+0xb2>
+ DB 119,216 ; ja 9c62 <_sk_store_565_sse2_8bit+0xb2>
DB 15,182,85,243 ; movzbl -0xd(%ebp),%edx
DB 3,132,144,34,1,0,0 ; add 0x122(%eax,%edx,4),%eax
DB 255,224 ; jmp *%eax
DB 102,15,126,224 ; movd %xmm4,%eax
DB 102,137,4,119 ; mov %ax,(%edi,%esi,2)
DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 235,190 ; jmp 9c66 <_sk_store_565_sse2_8bit+0xb2>
+ DB 235,190 ; jmp 9c62 <_sk_store_565_sse2_8bit+0xb2>
DB 102,15,197,196,2 ; pextrw $0x2,%xmm4,%eax
DB 102,137,68,119,4 ; mov %ax,0x4(%edi,%esi,2)
DB 102,15,126,36,119 ; movd %xmm4,(%edi,%esi,2)
DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 235,170 ; jmp 9c66 <_sk_store_565_sse2_8bit+0xb2>
+ DB 235,170 ; jmp 9c62 <_sk_store_565_sse2_8bit+0xb2>
DB 102,15,197,196,6 ; pextrw $0x6,%xmm4,%eax
DB 102,137,68,119,12 ; mov %ax,0xc(%edi,%esi,2)
DB 102,15,197,196,5 ; pextrw $0x5,%xmm4,%eax
@@ -57024,7 +57028,7 @@ _sk_store_565_sse2_8bit LABEL PROC
DB 102,137,68,119,8 ; mov %ax,0x8(%edi,%esi,2)
DB 102,15,214,36,119 ; movq %xmm4,(%edi,%esi,2)
DB 139,85,20 ; mov 0x14(%ebp),%edx
- DB 235,130 ; jmp 9c66 <_sk_store_565_sse2_8bit+0xb2>
+ DB 235,130 ; jmp 9c62 <_sk_store_565_sse2_8bit+0xb2>
DB 217,0 ; flds (%eax)
DB 0,0 ; add %al,(%eax)
DB 240,0,0 ; lock add %al,(%eax)
@@ -57049,7 +57053,7 @@ _sk_load_565_dst_sse2_8bit LABEL PROC
DB 86 ; push %esi
DB 131,236,28 ; sub $0x1c,%esp
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
- DB 232,0,0,0,0 ; call 9d12 <_sk_load_565_dst_sse2_8bit+0x12>
+ DB 232,0,0,0,0 ; call 9d0e <_sk_load_565_dst_sse2_8bit+0x12>
DB 94 ; pop %esi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -57060,19 +57064,19 @@ _sk_load_565_dst_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 15,133,235,0,0,0 ; jne 9e1c <_sk_load_565_dst_sse2_8bit+0x11c>
+ DB 15,133,235,0,0,0 ; jne 9e18 <_sk_load_565_dst_sse2_8bit+0x11c>
DB 243,15,111,20,123 ; movdqu (%ebx,%edi,2),%xmm2
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
DB 102,15,97,212 ; punpcklwd %xmm4,%xmm2
- DB 102,15,111,182,62,53,0,0 ; movdqa 0x353e(%esi),%xmm6
+ DB 102,15,111,182,66,53,0,0 ; movdqa 0x3542(%esi),%xmm6
DB 102,15,111,250 ; movdqa %xmm2,%xmm7
DB 102,15,219,254 ; pand %xmm6,%xmm7
DB 102,15,219,243 ; pand %xmm3,%xmm6
DB 102,15,114,214,8 ; psrld $0x8,%xmm6
DB 102,15,114,215,8 ; psrld $0x8,%xmm7
- DB 102,15,111,174,126,53,0,0 ; movdqa 0x357e(%esi),%xmm5
+ DB 102,15,111,174,130,53,0,0 ; movdqa 0x3582(%esi),%xmm5
DB 102,15,111,226 ; movdqa %xmm2,%xmm4
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,15,219,235 ; pand %xmm3,%xmm5
@@ -57080,11 +57084,11 @@ _sk_load_565_dst_sse2_8bit LABEL PROC
DB 102,15,114,244,19 ; pslld $0x13,%xmm4
DB 102,15,235,231 ; por %xmm7,%xmm4
DB 102,15,235,238 ; por %xmm6,%xmm5
- DB 102,15,111,182,94,53,0,0 ; movdqa 0x355e(%esi),%xmm6
+ DB 102,15,111,182,98,53,0,0 ; movdqa 0x3562(%esi),%xmm6
DB 102,15,111,251 ; movdqa %xmm3,%xmm7
DB 102,15,219,254 ; pand %xmm6,%xmm7
DB 102,15,219,242 ; pand %xmm2,%xmm6
- DB 102,15,111,142,46,58,0,0 ; movdqa 0x3a2e(%esi),%xmm1
+ DB 102,15,111,142,50,58,0,0 ; movdqa 0x3a32(%esi),%xmm1
DB 102,15,219,217 ; pand %xmm1,%xmm3
DB 102,15,219,209 ; pand %xmm1,%xmm2
DB 102,15,114,247,5 ; pslld $0x5,%xmm7
@@ -57097,10 +57101,10 @@ _sk_load_565_dst_sse2_8bit LABEL PROC
DB 102,15,235,214 ; por %xmm6,%xmm2
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,114,212,5 ; psrld $0x5,%xmm4
- DB 102,15,111,142,30,58,0,0 ; movdqa 0x3a1e(%esi),%xmm1
+ DB 102,15,111,142,34,58,0,0 ; movdqa 0x3a22(%esi),%xmm1
DB 102,15,219,225 ; pand %xmm1,%xmm4
DB 102,15,219,233 ; pand %xmm1,%xmm5
- DB 102,15,111,142,222,57,0,0 ; movdqa 0x39de(%esi),%xmm1
+ DB 102,15,111,142,226,57,0,0 ; movdqa 0x39e2(%esi),%xmm1
DB 102,15,235,209 ; por %xmm1,%xmm2
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,235,217 ; por %xmm1,%xmm3
@@ -57123,25 +57127,25 @@ _sk_load_565_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 15,135,6,255,255,255 ; ja 9d36 <_sk_load_565_dst_sse2_8bit+0x36>
+ DB 15,135,6,255,255,255 ; ja 9d32 <_sk_load_565_dst_sse2_8bit+0x36>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,142,118,1,0,0 ; mov 0x176(%esi,%ecx,4),%ecx
DB 1,241 ; add %esi,%ecx
DB 255,225 ; jmp *%ecx
DB 15,183,12,123 ; movzwl (%ebx,%edi,2),%ecx
DB 102,15,110,209 ; movd %ecx,%xmm2
- DB 233,235,254,255,255 ; jmp 9d36 <_sk_load_565_dst_sse2_8bit+0x36>
+ DB 233,235,254,255,255 ; jmp 9d32 <_sk_load_565_dst_sse2_8bit+0x36>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,84,123,4,2 ; pinsrw $0x2,0x4(%ebx,%edi,2),%xmm2
DB 243,15,16,28,123 ; movss (%ebx,%edi,2),%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 233,210,254,255,255 ; jmp 9d36 <_sk_load_565_dst_sse2_8bit+0x36>
+ DB 233,210,254,255,255 ; jmp 9d32 <_sk_load_565_dst_sse2_8bit+0x36>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,84,123,12,6 ; pinsrw $0x6,0xc(%ebx,%edi,2),%xmm2
DB 102,15,196,84,123,10,5 ; pinsrw $0x5,0xa(%ebx,%edi,2),%xmm2
DB 102,15,196,84,123,8,4 ; pinsrw $0x4,0x8(%ebx,%edi,2),%xmm2
DB 102,15,18,20,123 ; movlpd (%ebx,%edi,2),%xmm2
- DB 233,175,254,255,255 ; jmp 9d36 <_sk_load_565_dst_sse2_8bit+0x36>
+ DB 233,175,254,255,255 ; jmp 9d32 <_sk_load_565_dst_sse2_8bit+0x36>
DB 144 ; nop
DB 44,1 ; sub $0x1,%al
DB 0,0 ; add %al,(%eax)
@@ -57166,7 +57170,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 9eb2 <_sk_load_a8_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call 9eae <_sk_load_a8_sse2_8bit+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -57176,10 +57180,10 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 117,63 ; jne 9f0a <_sk_load_a8_sse2_8bit+0x66>
+ DB 117,63 ; jne 9f06 <_sk_load_a8_sse2_8bit+0x66>
DB 243,15,126,4,51 ; movq (%ebx,%esi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
- DB 102,15,219,135,158,56,0,0 ; pand 0x389e(%edi),%xmm0
+ DB 102,15,219,135,162,56,0,0 ; pand 0x38a2(%edi),%xmm0
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
@@ -57203,14 +57207,14 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 119,186 ; ja 9ed4 <_sk_load_a8_sse2_8bit+0x30>
+ DB 119,186 ; ja 9ed0 <_sk_load_a8_sse2_8bit+0x30>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,143,214,0,0,0 ; mov 0xd6(%edi,%ecx,4),%ecx
DB 1,249 ; add %edi,%ecx
DB 255,225 ; jmp *%ecx
DB 15,182,12,51 ; movzbl (%ebx,%esi,1),%ecx
DB 102,15,110,193 ; movd %ecx,%xmm0
- DB 235,162 ; jmp 9ed4 <_sk_load_a8_sse2_8bit+0x30>
+ DB 235,162 ; jmp 9ed0 <_sk_load_a8_sse2_8bit+0x30>
DB 15,182,76,51,2 ; movzbl 0x2(%ebx,%esi,1),%ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,193,2 ; pinsrw $0x2,%ecx,%xmm0
@@ -57218,7 +57222,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,110,201 ; movd %ecx,%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 235,130 ; jmp 9ed4 <_sk_load_a8_sse2_8bit+0x30>
+ DB 235,130 ; jmp 9ed0 <_sk_load_a8_sse2_8bit+0x30>
DB 15,182,76,51,6 ; movzbl 0x6(%ebx,%esi,1),%ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,193,6 ; pinsrw $0x6,%ecx,%xmm0
@@ -57229,9 +57233,9 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,110,12,51 ; movd (%ebx,%esi,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 233,78,255,255,255 ; jmp 9ed4 <_sk_load_a8_sse2_8bit+0x30>
+ DB 233,78,255,255,255 ; jmp 9ed0 <_sk_load_a8_sse2_8bit+0x30>
DB 102,144 ; xchg %ax,%ax
- DB 118,0 ; jbe 9f8a <_sk_load_a8_sse2_8bit+0xe6>
+ DB 118,0 ; jbe 9f86 <_sk_load_a8_sse2_8bit+0xe6>
DB 0,0 ; add %al,(%eax)
DB 142,0 ; mov (%eax),%es
DB 0,0 ; add %al,(%eax)
@@ -57253,7 +57257,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 9fb2 <_sk_load_a8_dst_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call 9fae <_sk_load_a8_dst_sse2_8bit+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -57263,10 +57267,10 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 117,63 ; jne a00a <_sk_load_a8_dst_sse2_8bit+0x66>
+ DB 117,63 ; jne a006 <_sk_load_a8_dst_sse2_8bit+0x66>
DB 243,15,126,20,51 ; movq (%ebx,%esi,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
- DB 102,15,219,151,158,55,0,0 ; pand 0x379e(%edi),%xmm2
+ DB 102,15,219,151,162,55,0,0 ; pand 0x37a2(%edi),%xmm2
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
@@ -57290,14 +57294,14 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 119,186 ; ja 9fd4 <_sk_load_a8_dst_sse2_8bit+0x30>
+ DB 119,186 ; ja 9fd0 <_sk_load_a8_dst_sse2_8bit+0x30>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,143,214,0,0,0 ; mov 0xd6(%edi,%ecx,4),%ecx
DB 1,249 ; add %edi,%ecx
DB 255,225 ; jmp *%ecx
DB 15,182,12,51 ; movzbl (%ebx,%esi,1),%ecx
DB 102,15,110,209 ; movd %ecx,%xmm2
- DB 235,162 ; jmp 9fd4 <_sk_load_a8_dst_sse2_8bit+0x30>
+ DB 235,162 ; jmp 9fd0 <_sk_load_a8_dst_sse2_8bit+0x30>
DB 15,182,76,51,2 ; movzbl 0x2(%ebx,%esi,1),%ecx
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,209,2 ; pinsrw $0x2,%ecx,%xmm2
@@ -57305,7 +57309,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,110,217 ; movd %ecx,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 235,130 ; jmp 9fd4 <_sk_load_a8_dst_sse2_8bit+0x30>
+ DB 235,130 ; jmp 9fd0 <_sk_load_a8_dst_sse2_8bit+0x30>
DB 15,182,76,51,6 ; movzbl 0x6(%ebx,%esi,1),%ecx
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,209,6 ; pinsrw $0x6,%ecx,%xmm2
@@ -57316,9 +57320,9 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,110,28,51 ; movd (%ebx,%esi,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,78,255,255,255 ; jmp 9fd4 <_sk_load_a8_dst_sse2_8bit+0x30>
+ DB 233,78,255,255,255 ; jmp 9fd0 <_sk_load_a8_dst_sse2_8bit+0x30>
DB 102,144 ; xchg %ax,%ax
- DB 118,0 ; jbe a08a <_sk_load_a8_dst_sse2_8bit+0xe6>
+ DB 118,0 ; jbe a086 <_sk_load_a8_dst_sse2_8bit+0xe6>
DB 0,0 ; add %al,(%eax)
DB 142,0 ; mov (%eax),%es
DB 0,0 ; add %al,(%eax)
@@ -57340,7 +57344,7 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,92 ; sub $0x5c,%esp
- DB 232,0,0,0,0 ; call a0b2 <_sk_store_a8_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call a0ae <_sk_store_a8_sse2_8bit+0xe>
DB 91 ; pop %ebx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -57359,8 +57363,8 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,107,229 ; packssdw %xmm5,%xmm4
DB 133,210 ; test %edx,%edx
DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 117,37 ; jne a11a <_sk_store_a8_sse2_8bit+0x76>
- DB 102,15,219,163,158,54,0,0 ; pand 0x369e(%ebx),%xmm4
+ DB 117,37 ; jne a116 <_sk_store_a8_sse2_8bit+0x76>
+ DB 102,15,219,163,162,54,0,0 ; pand 0x36a2(%ebx),%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,214,36,62 ; movq %xmm4,(%esi,%edi,1)
DB 141,72,8 ; lea 0x8(%eax),%ecx
@@ -57379,7 +57383,7 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 128,225,7 ; and $0x7,%cl
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 119,224 ; ja a106 <_sk_store_a8_sse2_8bit+0x62>
+ DB 119,224 ; ja a102 <_sk_store_a8_sse2_8bit+0x62>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,139,238,0,0,0 ; mov 0xee(%ebx,%ecx,4),%ecx
DB 1,217 ; add %ebx,%ecx
@@ -57387,15 +57391,15 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,127,101,152 ; movdqa %xmm4,-0x68(%ebp)
DB 138,77,152 ; mov -0x68(%ebp),%cl
DB 136,12,62 ; mov %cl,(%esi,%edi,1)
- DB 235,197 ; jmp a106 <_sk_store_a8_sse2_8bit+0x62>
+ DB 235,197 ; jmp a102 <_sk_store_a8_sse2_8bit+0x62>
DB 102,15,127,101,168 ; movdqa %xmm4,-0x58(%ebp)
DB 138,77,172 ; mov -0x54(%ebp),%cl
DB 136,76,62,2 ; mov %cl,0x2(%esi,%edi,1)
- DB 102,15,219,163,158,54,0,0 ; pand 0x369e(%ebx),%xmm4
+ DB 102,15,219,163,162,54,0,0 ; pand 0x36a2(%ebx),%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,126,225 ; movd %xmm4,%ecx
DB 102,137,12,62 ; mov %cx,(%esi,%edi,1)
- DB 235,163 ; jmp a106 <_sk_store_a8_sse2_8bit+0x62>
+ DB 235,163 ; jmp a102 <_sk_store_a8_sse2_8bit+0x62>
DB 102,15,127,101,184 ; movdqa %xmm4,-0x48(%ebp)
DB 138,77,196 ; mov -0x3c(%ebp),%cl
DB 136,76,62,6 ; mov %cl,0x6(%esi,%edi,1)
@@ -57405,10 +57409,10 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,127,101,216 ; movdqa %xmm4,-0x28(%ebp)
DB 138,77,224 ; mov -0x20(%ebp),%cl
DB 136,76,62,4 ; mov %cl,0x4(%esi,%edi,1)
- DB 102,15,219,163,158,54,0,0 ; pand 0x369e(%ebx),%xmm4
+ DB 102,15,219,163,162,54,0,0 ; pand 0x36a2(%ebx),%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,126,36,62 ; movd %xmm4,(%esi,%edi,1)
- DB 233,105,255,255,255 ; jmp a106 <_sk_store_a8_sse2_8bit+0x62>
+ DB 233,105,255,255,255 ; jmp a102 <_sk_store_a8_sse2_8bit+0x62>
DB 15,31,0 ; nopl (%eax)
DB 130,0,0 ; addb $0x0,(%eax)
DB 0,155,0,0,0,143 ; add %bl,-0x71000000(%ebx)
@@ -57429,7 +57433,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call a1ca <_sk_load_g8_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call a1c6 <_sk_load_g8_sse2_8bit+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -57439,15 +57443,15 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,131,0,0,0 ; jne a26a <_sk_load_g8_sse2_8bit+0xae>
+ DB 15,133,131,0,0,0 ; jne a266 <_sk_load_g8_sse2_8bit+0xae>
DB 243,15,126,4,51 ; movq (%ebx,%esi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
- DB 102,15,219,135,134,53,0,0 ; pand 0x3586(%edi),%xmm0
+ DB 102,15,219,135,138,53,0,0 ; pand 0x358a(%edi),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4
DB 102,15,105,193 ; punpckhwd %xmm1,%xmm0
- DB 102,15,111,175,150,53,0,0 ; movdqa 0x3596(%edi),%xmm5
+ DB 102,15,111,175,154,53,0,0 ; movdqa 0x359a(%edi),%xmm5
DB 102,15,112,240,245 ; pshufd $0xf5,%xmm0,%xmm6
DB 102,15,244,197 ; pmuludq %xmm5,%xmm0
DB 102,15,112,200,232 ; pshufd $0xe8,%xmm0,%xmm1
@@ -57460,7 +57464,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,244,245 ; pmuludq %xmm5,%xmm6
DB 102,15,112,230,232 ; pshufd $0xe8,%xmm6,%xmm4
DB 102,15,98,196 ; punpckldq %xmm4,%xmm0
- DB 102,15,111,167,38,53,0,0 ; movdqa 0x3526(%edi),%xmm4
+ DB 102,15,111,167,42,53,0,0 ; movdqa 0x352a(%edi),%xmm4
DB 102,15,235,196 ; por %xmm4,%xmm0
DB 102,15,235,204 ; por %xmm4,%xmm1
DB 141,72,8 ; lea 0x8(%eax),%ecx
@@ -57480,14 +57484,14 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 15,135,114,255,255,255 ; ja a1f0 <_sk_load_g8_sse2_8bit+0x34>
+ DB 15,135,114,255,255,255 ; ja a1ec <_sk_load_g8_sse2_8bit+0x34>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,143,38,1,0,0 ; mov 0x126(%edi,%ecx,4),%ecx
DB 1,249 ; add %edi,%ecx
DB 255,225 ; jmp *%ecx
DB 15,182,12,51 ; movzbl (%ebx,%esi,1),%ecx
DB 102,15,110,193 ; movd %ecx,%xmm0
- DB 233,87,255,255,255 ; jmp a1f0 <_sk_load_g8_sse2_8bit+0x34>
+ DB 233,87,255,255,255 ; jmp a1ec <_sk_load_g8_sse2_8bit+0x34>
DB 15,182,76,51,2 ; movzbl 0x2(%ebx,%esi,1),%ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,193,2 ; pinsrw $0x2,%ecx,%xmm0
@@ -57495,7 +57499,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,110,201 ; movd %ecx,%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 233,52,255,255,255 ; jmp a1f0 <_sk_load_g8_sse2_8bit+0x34>
+ DB 233,52,255,255,255 ; jmp a1ec <_sk_load_g8_sse2_8bit+0x34>
DB 15,182,76,51,6 ; movzbl 0x6(%ebx,%esi,1),%ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,193,6 ; pinsrw $0x6,%ecx,%xmm0
@@ -57506,7 +57510,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,110,12,51 ; movd (%ebx,%esi,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 233,0,255,255,255 ; jmp a1f0 <_sk_load_g8_sse2_8bit+0x34>
+ DB 233,0,255,255,255 ; jmp a1ec <_sk_load_g8_sse2_8bit+0x34>
DB 194,0,0 ; ret $0x0
DB 0,221 ; add %bl,%ch
DB 0,0 ; add %al,(%eax)
@@ -57529,7 +57533,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call a31a <_sk_load_g8_dst_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call a316 <_sk_load_g8_dst_sse2_8bit+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -57539,15 +57543,15 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,131,0,0,0 ; jne a3ba <_sk_load_g8_dst_sse2_8bit+0xae>
+ DB 15,133,131,0,0,0 ; jne a3b6 <_sk_load_g8_dst_sse2_8bit+0xae>
DB 243,15,126,20,51 ; movq (%ebx,%esi,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
- DB 102,15,219,151,54,52,0,0 ; pand 0x3436(%edi),%xmm2
+ DB 102,15,219,151,58,52,0,0 ; pand 0x343a(%edi),%xmm2
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,111,226 ; movdqa %xmm2,%xmm4
DB 102,15,97,227 ; punpcklwd %xmm3,%xmm4
DB 102,15,105,211 ; punpckhwd %xmm3,%xmm2
- DB 102,15,111,175,70,52,0,0 ; movdqa 0x3446(%edi),%xmm5
+ DB 102,15,111,175,74,52,0,0 ; movdqa 0x344a(%edi),%xmm5
DB 102,15,112,242,245 ; pshufd $0xf5,%xmm2,%xmm6
DB 102,15,244,213 ; pmuludq %xmm5,%xmm2
DB 102,15,112,218,232 ; pshufd $0xe8,%xmm2,%xmm3
@@ -57560,7 +57564,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,244,245 ; pmuludq %xmm5,%xmm6
DB 102,15,112,230,232 ; pshufd $0xe8,%xmm6,%xmm4
DB 102,15,98,212 ; punpckldq %xmm4,%xmm2
- DB 102,15,111,167,214,51,0,0 ; movdqa 0x33d6(%edi),%xmm4
+ DB 102,15,111,167,218,51,0,0 ; movdqa 0x33da(%edi),%xmm4
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,235,220 ; por %xmm4,%xmm3
DB 141,72,8 ; lea 0x8(%eax),%ecx
@@ -57580,14 +57584,14 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 15,135,114,255,255,255 ; ja a340 <_sk_load_g8_dst_sse2_8bit+0x34>
+ DB 15,135,114,255,255,255 ; ja a33c <_sk_load_g8_dst_sse2_8bit+0x34>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,143,38,1,0,0 ; mov 0x126(%edi,%ecx,4),%ecx
DB 1,249 ; add %edi,%ecx
DB 255,225 ; jmp *%ecx
DB 15,182,12,51 ; movzbl (%ebx,%esi,1),%ecx
DB 102,15,110,209 ; movd %ecx,%xmm2
- DB 233,87,255,255,255 ; jmp a340 <_sk_load_g8_dst_sse2_8bit+0x34>
+ DB 233,87,255,255,255 ; jmp a33c <_sk_load_g8_dst_sse2_8bit+0x34>
DB 15,182,76,51,2 ; movzbl 0x2(%ebx,%esi,1),%ecx
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,209,2 ; pinsrw $0x2,%ecx,%xmm2
@@ -57595,7 +57599,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,110,217 ; movd %ecx,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 233,52,255,255,255 ; jmp a340 <_sk_load_g8_dst_sse2_8bit+0x34>
+ DB 233,52,255,255,255 ; jmp a33c <_sk_load_g8_dst_sse2_8bit+0x34>
DB 15,182,76,51,6 ; movzbl 0x6(%ebx,%esi,1),%ecx
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,209,6 ; pinsrw $0x6,%ecx,%xmm2
@@ -57606,7 +57610,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,110,28,51 ; movd (%ebx,%esi,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,0,255,255,255 ; jmp a340 <_sk_load_g8_dst_sse2_8bit+0x34>
+ DB 233,0,255,255,255 ; jmp a33c <_sk_load_g8_dst_sse2_8bit+0x34>
DB 194,0,0 ; ret $0x0
DB 0,221 ; add %bl,%ch
DB 0,0 ; add %al,(%eax)
@@ -57631,7 +57635,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 131,236,124 ; sub $0x7c,%esp
DB 15,41,157,120,255,255,255 ; movaps %xmm3,-0x88(%ebp)
DB 102,15,127,85,136 ; movdqa %xmm2,-0x78(%ebp)
- DB 232,0,0,0,0 ; call a476 <_sk_srcover_rgba_8888_sse2_8bit+0x1a>
+ DB 232,0,0,0,0 ; call a472 <_sk_srcover_rgba_8888_sse2_8bit+0x1a>
DB 91 ; pop %ebx
DB 139,77,20 ; mov 0x14(%ebp),%ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
@@ -57643,7 +57647,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,51,1,0,0 ; jne a5cb <_sk_srcover_rgba_8888_sse2_8bit+0x16f>
+ DB 15,133,51,1,0,0 ; jne a5c7 <_sk_srcover_rgba_8888_sse2_8bit+0x16f>
DB 15,16,116,183,16 ; movups 0x10(%edi,%esi,4),%xmm6
DB 102,15,16,20,183 ; movupd (%edi,%esi,4),%xmm2
DB 102,15,41,85,200 ; movapd %xmm2,-0x38(%ebp)
@@ -57703,7 +57707,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 133,210 ; test %edx,%edx
DB 102,15,252,232 ; paddb %xmm0,%xmm5
DB 102,15,252,217 ; paddb %xmm1,%xmm3
- DB 117,98 ; jne a602 <_sk_srcover_rgba_8888_sse2_8bit+0x1a6>
+ DB 117,98 ; jne a5fe <_sk_srcover_rgba_8888_sse2_8bit+0x1a6>
DB 243,15,127,44,183 ; movdqu %xmm5,(%edi,%esi,4)
DB 243,15,127,92,183,16 ; movdqu %xmm3,0x10(%edi,%esi,4)
DB 141,120,8 ; lea 0x8(%eax),%edi
@@ -57728,33 +57732,33 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 254,77,200 ; decb -0x38(%ebp)
DB 128,125,200,6 ; cmpb $0x6,-0x38(%ebp)
- DB 119,66 ; ja a62a <_sk_srcover_rgba_8888_sse2_8bit+0x1ce>
+ DB 119,66 ; ja a626 <_sk_srcover_rgba_8888_sse2_8bit+0x1ce>
DB 15,182,93,200 ; movzbl -0x38(%ebp),%ebx
DB 139,69,216 ; mov -0x28(%ebp),%eax
DB 139,156,152,70,2,0,0 ; mov 0x246(%eax,%ebx,4),%ebx
DB 3,93,216 ; add -0x28(%ebp),%ebx
DB 255,227 ; jmp *%ebx
DB 243,15,16,20,183 ; movss (%edi,%esi,4),%xmm2
- DB 235,109 ; jmp a66f <_sk_srcover_rgba_8888_sse2_8bit+0x213>
+ DB 235,109 ; jmp a66b <_sk_srcover_rgba_8888_sse2_8bit+0x213>
DB 137,93,216 ; mov %ebx,-0x28(%ebp)
DB 137,211 ; mov %edx,%ebx
DB 128,227,7 ; and $0x7,%bl
DB 254,203 ; dec %bl
DB 128,251,6 ; cmp $0x6,%bl
- DB 119,154 ; ja a5ab <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ DB 119,154 ; ja a5a7 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
DB 15,182,219 ; movzbl %bl,%ebx
DB 139,77,216 ; mov -0x28(%ebp),%ecx
DB 3,140,153,98,2,0,0 ; add 0x262(%ecx,%ebx,4),%ecx
DB 255,225 ; jmp *%ecx
DB 102,15,126,44,183 ; movd %xmm5,(%edi,%esi,4)
DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 235,129 ; jmp a5ab <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ DB 235,129 ; jmp a5a7 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
DB 139,93,216 ; mov -0x28(%ebp),%ebx
- DB 233,112,254,255,255 ; jmp a4a2 <_sk_srcover_rgba_8888_sse2_8bit+0x46>
+ DB 233,112,254,255,255 ; jmp a49e <_sk_srcover_rgba_8888_sse2_8bit+0x46>
DB 102,15,110,92,183,8 ; movd 0x8(%edi,%esi,4),%xmm3
DB 102,15,112,211,69 ; pshufd $0x45,%xmm3,%xmm2
DB 102,15,18,20,183 ; movlpd (%edi,%esi,4),%xmm2
- DB 235,43 ; jmp a66f <_sk_srcover_rgba_8888_sse2_8bit+0x213>
+ DB 235,43 ; jmp a66b <_sk_srcover_rgba_8888_sse2_8bit+0x213>
DB 102,15,110,84,183,24 ; movd 0x18(%edi,%esi,4),%xmm2
DB 102,15,112,242,69 ; pshufd $0x45,%xmm2,%xmm6
DB 243,15,16,92,183,20 ; movss 0x14(%edi,%esi,4),%xmm3
@@ -57766,12 +57770,12 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,15,16,20,183 ; movupd (%edi,%esi,4),%xmm2
DB 139,93,216 ; mov -0x28(%ebp),%ebx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 233,40,254,255,255 ; jmp a4a2 <_sk_srcover_rgba_8888_sse2_8bit+0x46>
+ DB 233,40,254,255,255 ; jmp a49e <_sk_srcover_rgba_8888_sse2_8bit+0x46>
DB 102,15,112,213,78 ; pshufd $0x4e,%xmm5,%xmm2
DB 102,15,126,84,183,8 ; movd %xmm2,0x8(%edi,%esi,4)
DB 102,15,214,44,183 ; movq %xmm5,(%edi,%esi,4)
DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 233,25,255,255,255 ; jmp a5ab <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ DB 233,25,255,255,255 ; jmp a5a7 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
DB 102,15,112,211,78 ; pshufd $0x4e,%xmm3,%xmm2
DB 102,15,126,84,183,24 ; movd %xmm2,0x18(%edi,%esi,4)
DB 102,15,112,211,229 ; pshufd $0xe5,%xmm3,%xmm2
@@ -57779,7 +57783,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,15,126,92,183,16 ; movd %xmm3,0x10(%edi,%esi,4)
DB 243,15,127,44,183 ; movdqu %xmm5,(%edi,%esi,4)
DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 233,240,254,255,255 ; jmp a5ab <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ DB 233,240,254,255,255 ; jmp a5a7 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
DB 144 ; nop
DB 133,1 ; test %eax,(%ecx)
DB 0,0 ; add %al,(%eax)
@@ -57815,12 +57819,12 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 15,41,85,232 ; movaps %xmm2,-0x18(%ebp)
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 232,0,0,0,0 ; call a70f <_sk_scale_1_float_sse2_8bit+0x1b>
+ DB 232,0,0,0,0 ; call a70b <_sk_scale_1_float_sse2_8bit+0x1b>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
DB 243,15,16,2 ; movss (%edx),%xmm0
- DB 243,15,89,129,149,48,0,0 ; mulss 0x3095(%ecx),%xmm0
+ DB 243,15,89,129,153,48,0,0 ; mulss 0x3099(%ecx),%xmm0
DB 243,15,44,208 ; cvttss2si %xmm0,%edx
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,15,111,213 ; movdqa %xmm5,%xmm2
@@ -57832,7 +57836,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 102,15,96,246 ; punpcklbw %xmm6,%xmm6
DB 242,15,112,246,0 ; pshuflw $0x0,%xmm6,%xmm6
DB 102,15,112,246,80 ; pshufd $0x50,%xmm6,%xmm6
- DB 102,15,219,177,65,48,0,0 ; pand 0x3041(%ecx),%xmm6
+ DB 102,15,219,177,69,48,0,0 ; pand 0x3045(%ecx),%xmm6
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
DB 102,15,111,222 ; movdqa %xmm6,%xmm3
DB 102,15,111,198 ; movdqa %xmm6,%xmm0
@@ -57873,7 +57877,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 131,236,60 ; sub $0x3c,%esp
DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
DB 102,15,127,85,200 ; movdqa %xmm2,-0x38(%ebp)
- DB 232,0,0,0,0 ; call a7d7 <_sk_scale_u8_sse2_8bit+0x17>
+ DB 232,0,0,0,0 ; call a7d3 <_sk_scale_u8_sse2_8bit+0x17>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -57883,10 +57887,10 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,11,1,0,0 ; jne a8ff <_sk_scale_u8_sse2_8bit+0x13f>
+ DB 15,133,11,1,0,0 ; jne a8fb <_sk_scale_u8_sse2_8bit+0x13f>
DB 243,15,126,36,51 ; movq (%ebx,%esi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
- DB 102,15,219,167,121,47,0,0 ; pand 0x2f79(%edi),%xmm4
+ DB 102,15,219,167,125,47,0,0 ; pand 0x2f7d(%edi),%xmm4
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,111,236 ; movdqa %xmm4,%xmm5
DB 102,15,105,234 ; punpckhwd %xmm2,%xmm5
@@ -57957,14 +57961,14 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 15,135,234,254,255,255 ; ja a7fd <_sk_scale_u8_sse2_8bit+0x3d>
+ DB 15,135,234,254,255,255 ; ja a7f9 <_sk_scale_u8_sse2_8bit+0x3d>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,143,177,1,0,0 ; mov 0x1b1(%edi,%ecx,4),%ecx
DB 1,249 ; add %edi,%ecx
DB 255,225 ; jmp *%ecx
DB 15,182,12,51 ; movzbl (%ebx,%esi,1),%ecx
DB 102,15,110,225 ; movd %ecx,%xmm4
- DB 233,207,254,255,255 ; jmp a7fd <_sk_scale_u8_sse2_8bit+0x3d>
+ DB 233,207,254,255,255 ; jmp a7f9 <_sk_scale_u8_sse2_8bit+0x3d>
DB 15,182,76,51,2 ; movzbl 0x2(%ebx,%esi,1),%ecx
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,196,225,2 ; pinsrw $0x2,%ecx,%xmm4
@@ -57972,7 +57976,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,110,217 ; movd %ecx,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,227 ; movss %xmm3,%xmm4
- DB 233,172,254,255,255 ; jmp a7fd <_sk_scale_u8_sse2_8bit+0x3d>
+ DB 233,172,254,255,255 ; jmp a7f9 <_sk_scale_u8_sse2_8bit+0x3d>
DB 15,182,76,51,6 ; movzbl 0x6(%ebx,%esi,1),%ecx
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,196,225,6 ; pinsrw $0x6,%ecx,%xmm4
@@ -57983,7 +57987,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,110,28,51 ; movd (%ebx,%esi,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,227 ; movsd %xmm3,%xmm4
- DB 233,120,254,255,255 ; jmp a7fd <_sk_scale_u8_sse2_8bit+0x3d>
+ DB 233,120,254,255,255 ; jmp a7f9 <_sk_scale_u8_sse2_8bit+0x3d>
DB 15,31,0 ; nopl (%eax)
DB 74 ; dec %edx
DB 1,0 ; add %eax,(%eax)
@@ -57995,7 +57999,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 0,0 ; add %al,(%eax)
DB 136,1 ; mov %al,(%ecx)
DB 0,0 ; add %al,(%eax)
- DB 122,1 ; jp a9a3 <_sk_scale_u8_sse2_8bit+0x1e3>
+ DB 122,1 ; jp a99f <_sk_scale_u8_sse2_8bit+0x1e3>
DB 0,0 ; add %al,(%eax)
PUBLIC _sk_lerp_1_float_sse2_8bit
@@ -58007,12 +58011,12 @@ _sk_lerp_1_float_sse2_8bit LABEL PROC
DB 15,41,85,232 ; movaps %xmm2,-0x18(%ebp)
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 232,0,0,0,0 ; call a9bf <_sk_lerp_1_float_sse2_8bit+0x1b>
+ DB 232,0,0,0,0 ; call a9bb <_sk_lerp_1_float_sse2_8bit+0x1b>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
DB 243,15,16,34 ; movss (%edx),%xmm4
- DB 243,15,89,161,229,45,0,0 ; mulss 0x2de5(%ecx),%xmm4
+ DB 243,15,89,161,233,45,0,0 ; mulss 0x2de9(%ecx),%xmm4
DB 243,15,44,212 ; cvttss2si %xmm4,%edx
DB 102,15,110,226 ; movd %edx,%xmm4
DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4
@@ -58021,7 +58025,7 @@ _sk_lerp_1_float_sse2_8bit LABEL PROC
DB 102,15,127,85,200 ; movdqa %xmm2,-0x38(%ebp)
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,96,197 ; punpcklbw %xmm5,%xmm0
- DB 102,15,111,153,145,45,0,0 ; movdqa 0x2d91(%ecx),%xmm3
+ DB 102,15,111,153,149,45,0,0 ; movdqa 0x2d95(%ecx),%xmm3
DB 102,15,219,218 ; pand %xmm2,%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
@@ -58102,7 +58106,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 131,236,92 ; sub $0x5c,%esp
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
DB 102,15,127,85,216 ; movdqa %xmm2,-0x28(%ebp)
- DB 232,0,0,0,0 ; call ab25 <_sk_lerp_u8_sse2_8bit+0x17>
+ DB 232,0,0,0,0 ; call ab21 <_sk_lerp_u8_sse2_8bit+0x17>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -58112,10 +58116,10 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,181,1,0,0 ; jne acf7 <_sk_lerp_u8_sse2_8bit+0x1e9>
+ DB 15,133,181,1,0,0 ; jne acf3 <_sk_lerp_u8_sse2_8bit+0x1e9>
DB 243,15,126,44,51 ; movq (%ebx,%esi,1),%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
- DB 102,15,219,175,43,44,0,0 ; pand 0x2c2b(%edi),%xmm5
+ DB 102,15,219,175,47,44,0,0 ; pand 0x2c2f(%edi),%xmm5
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,111,221 ; movdqa %xmm5,%xmm3
DB 102,15,105,218 ; punpckhwd %xmm2,%xmm3
@@ -58226,14 +58230,14 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 15,135,64,254,255,255 ; ja ab4b <_sk_lerp_u8_sse2_8bit+0x3d>
+ DB 15,135,64,254,255,255 ; ja ab47 <_sk_lerp_u8_sse2_8bit+0x3d>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,143,91,2,0,0 ; mov 0x25b(%edi,%ecx,4),%ecx
DB 1,249 ; add %edi,%ecx
DB 255,225 ; jmp *%ecx
DB 15,182,12,51 ; movzbl (%ebx,%esi,1),%ecx
DB 102,15,110,233 ; movd %ecx,%xmm5
- DB 233,37,254,255,255 ; jmp ab4b <_sk_lerp_u8_sse2_8bit+0x3d>
+ DB 233,37,254,255,255 ; jmp ab47 <_sk_lerp_u8_sse2_8bit+0x3d>
DB 15,182,76,51,2 ; movzbl 0x2(%ebx,%esi,1),%ecx
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,196,233,2 ; pinsrw $0x2,%ecx,%xmm5
@@ -58241,7 +58245,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,110,217 ; movd %ecx,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,235 ; movss %xmm3,%xmm5
- DB 233,2,254,255,255 ; jmp ab4b <_sk_lerp_u8_sse2_8bit+0x3d>
+ DB 233,2,254,255,255 ; jmp ab47 <_sk_lerp_u8_sse2_8bit+0x3d>
DB 15,182,76,51,6 ; movzbl 0x6(%ebx,%esi,1),%ecx
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,196,233,6 ; pinsrw $0x6,%ecx,%xmm5
@@ -58252,7 +58256,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,110,28,51 ; movd (%ebx,%esi,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,235 ; movsd %xmm3,%xmm5
- DB 233,206,253,255,255 ; jmp ab4b <_sk_lerp_u8_sse2_8bit+0x3d>
+ DB 233,206,253,255,255 ; jmp ab47 <_sk_lerp_u8_sse2_8bit+0x3d>
DB 15,31,0 ; nopl (%eax)
DB 244 ; hlt
DB 1,0 ; add %eax,(%eax)
@@ -58310,11 +58314,11 @@ _sk_black_color_sse2_8bit LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call aded <_sk_black_color_sse2_8bit+0xb>
+ DB 232,0,0,0,0 ; call ade9 <_sk_black_color_sse2_8bit+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
- DB 15,40,128,3,41,0,0 ; movaps 0x2903(%eax),%xmm0
+ DB 15,40,128,7,41,0,0 ; movaps 0x2907(%eax),%xmm0
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 255,117,20 ; pushl 0x14(%ebp)
DB 255,117,16 ; pushl 0x10(%ebp)
@@ -59519,12 +59523,12 @@ _sk_darken_sse2_8bit LABEL PROC
DB 102,15,252,218 ; paddb %xmm2,%xmm3
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
DB 102,15,248,238 ; psubb %xmm6,%xmm5
- DB 232,0,0,0,0 ; call c010 <_sk_darken_sse2_8bit+0x1f7>
+ DB 232,0,0,0,0 ; call c00c <_sk_darken_sse2_8bit+0x1f7>
DB 88 ; pop %eax
DB 102,15,248,207 ; psubb %xmm7,%xmm1
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,248,216 ; psubb %xmm0,%xmm3
- DB 102,15,111,128,96,23,0,0 ; movdqa 0x1760(%eax),%xmm0
+ DB 102,15,111,128,100,23,0,0 ; movdqa 0x1764(%eax),%xmm0
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,15,223,203 ; pandn %xmm3,%xmm1
DB 102,15,219,232 ; pand %xmm0,%xmm5
@@ -59663,12 +59667,12 @@ _sk_lighten_sse2_8bit LABEL PROC
DB 102,15,252,218 ; paddb %xmm2,%xmm3
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
DB 102,15,248,238 ; psubb %xmm6,%xmm5
- DB 232,0,0,0,0 ; call c25e <_sk_lighten_sse2_8bit+0x1f7>
+ DB 232,0,0,0,0 ; call c25a <_sk_lighten_sse2_8bit+0x1f7>
DB 88 ; pop %eax
DB 102,15,248,207 ; psubb %xmm7,%xmm1
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,248,216 ; psubb %xmm0,%xmm3
- DB 102,15,111,128,18,21,0,0 ; movdqa 0x1512(%eax),%xmm0
+ DB 102,15,111,128,22,21,0,0 ; movdqa 0x1516(%eax),%xmm0
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,15,223,203 ; pandn %xmm3,%xmm1
DB 102,15,219,232 ; pand %xmm0,%xmm5
@@ -59734,12 +59738,12 @@ _sk_exclusion_sse2_8bit LABEL PROC
DB 102,15,113,209,8 ; psrlw $0x8,%xmm1
DB 102,15,113,212,8 ; psrlw $0x8,%xmm4
DB 102,15,103,225 ; packuswb %xmm1,%xmm4
- DB 232,0,0,0,0 ; call c367 <_sk_exclusion_sse2_8bit+0xb2>
+ DB 232,0,0,0,0 ; call c363 <_sk_exclusion_sse2_8bit+0xb2>
DB 88 ; pop %eax
DB 102,15,113,208,8 ; psrlw $0x8,%xmm0
DB 102,15,113,213,8 ; psrlw $0x8,%xmm5
DB 102,15,103,232 ; packuswb %xmm0,%xmm5
- DB 102,15,111,128,9,20,0,0 ; movdqa 0x1409(%eax),%xmm0
+ DB 102,15,111,128,13,20,0,0 ; movdqa 0x140d(%eax),%xmm0
DB 102,15,111,242 ; movdqa %xmm2,%xmm6
DB 102,15,252,254 ; paddb %xmm6,%xmm7
DB 102,15,248,253 ; psubb %xmm5,%xmm7
@@ -59866,10 +59870,10 @@ _sk_difference_sse2_8bit LABEL PROC
DB 102,15,113,208,8 ; psrlw $0x8,%xmm0
DB 102,15,103,194 ; packuswb %xmm2,%xmm0
DB 102,15,218,125,152 ; pminub -0x68(%ebp),%xmm7
- DB 232,0,0,0,0 ; call c582 <_sk_difference_sse2_8bit+0x1b8>
+ DB 232,0,0,0,0 ; call c57e <_sk_difference_sse2_8bit+0x1b8>
DB 88 ; pop %eax
DB 102,15,218,198 ; pminub %xmm6,%xmm0
- DB 102,15,111,136,238,17,0,0 ; movdqa 0x11ee(%eax),%xmm1
+ DB 102,15,111,136,242,17,0,0 ; movdqa 0x11f2(%eax),%xmm1
DB 102,15,111,101,136 ; movdqa -0x78(%ebp),%xmm4
DB 102,15,111,93,232 ; movdqa -0x18(%ebp),%xmm3
DB 102,15,252,227 ; paddb %xmm3,%xmm4
@@ -59989,9 +59993,9 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,15,217,229 ; psubusw %xmm5,%xmm4
DB 102,15,117,231 ; pcmpeqw %xmm7,%xmm4
DB 102,15,127,165,72,255,255,255 ; movdqa %xmm4,-0xb8(%ebp)
- DB 232,0,0,0,0 ; call c7b3 <_sk_hardlight_sse2_8bit+0x1ce>
+ DB 232,0,0,0,0 ; call c7af <_sk_hardlight_sse2_8bit+0x1ce>
DB 88 ; pop %eax
- DB 102,15,111,176,157,15,0,0 ; movdqa 0xf9d(%eax),%xmm6
+ DB 102,15,111,176,161,15,0,0 ; movdqa 0xfa1(%eax),%xmm6
DB 102,15,111,157,88,255,255,255 ; movdqa -0xa8(%ebp),%xmm3
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,239,206 ; pxor %xmm6,%xmm1
@@ -60126,7 +60130,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,15,111,69,216 ; movdqa -0x28(%ebp),%xmm0
DB 102,15,253,133,104,255,255,255 ; paddw -0x98(%ebp),%xmm0
DB 102,15,253,117,136 ; paddw -0x78(%ebp),%xmm6
- DB 102,15,111,152,205,15,0,0 ; movdqa 0xfcd(%eax),%xmm3
+ DB 102,15,111,152,209,15,0,0 ; movdqa 0xfd1(%eax),%xmm3
DB 102,15,253,227 ; paddw %xmm3,%xmm4
DB 102,15,111,149,72,255,255,255 ; movdqa -0xb8(%ebp),%xmm2
DB 102,15,253,212 ; paddw %xmm4,%xmm2
@@ -60136,7 +60140,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,15,253,200 ; paddw %xmm0,%xmm1
DB 102,15,253,243 ; paddw %xmm3,%xmm6
DB 102,15,253,245 ; paddw %xmm5,%xmm6
- DB 102,15,111,152,221,15,0,0 ; movdqa 0xfdd(%eax),%xmm3
+ DB 102,15,111,152,225,15,0,0 ; movdqa 0xfe1(%eax),%xmm3
DB 102,15,228,243 ; pmulhuw %xmm3,%xmm6
DB 102,15,228,203 ; pmulhuw %xmm3,%xmm1
DB 102,15,228,251 ; pmulhuw %xmm3,%xmm7
@@ -60254,9 +60258,9 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,217,236 ; psubusw %xmm4,%xmm5
DB 102,15,117,238 ; pcmpeqw %xmm6,%xmm5
DB 102,15,127,173,72,255,255,255 ; movdqa %xmm5,-0xb8(%ebp)
- DB 232,0,0,0,0 ; call ccd9 <_sk_overlay_sse2_8bit+0x1c5>
+ DB 232,0,0,0,0 ; call ccd5 <_sk_overlay_sse2_8bit+0x1c5>
DB 88 ; pop %eax
- DB 102,15,111,152,119,10,0,0 ; movdqa 0xa77(%eax),%xmm3
+ DB 102,15,111,152,123,10,0,0 ; movdqa 0xa7b(%eax),%xmm3
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,15,239,195 ; pxor %xmm3,%xmm0
DB 102,15,111,181,120,255,255,255 ; movdqa -0x88(%ebp),%xmm6
@@ -60389,7 +60393,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,253,189,120,255,255,255 ; paddw -0x88(%ebp),%xmm7
DB 102,15,253,173,104,255,255,255 ; paddw -0x98(%ebp),%xmm5
DB 102,15,253,157,216,254,255,255 ; paddw -0x128(%ebp),%xmm3
- DB 102,15,111,144,167,10,0,0 ; movdqa 0xaa7(%eax),%xmm2
+ DB 102,15,111,144,171,10,0,0 ; movdqa 0xaab(%eax),%xmm2
DB 102,15,253,194 ; paddw %xmm2,%xmm0
DB 102,15,253,133,72,255,255,255 ; paddw -0xb8(%ebp),%xmm0
DB 102,15,253,250 ; paddw %xmm2,%xmm7
@@ -60398,7 +60402,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,253,233 ; paddw %xmm1,%xmm5
DB 102,15,253,218 ; paddw %xmm2,%xmm3
DB 102,15,253,220 ; paddw %xmm4,%xmm3
- DB 102,15,111,144,183,10,0,0 ; movdqa 0xab7(%eax),%xmm2
+ DB 102,15,111,144,187,10,0,0 ; movdqa 0xabb(%eax),%xmm2
DB 102,15,228,218 ; pmulhuw %xmm2,%xmm3
DB 102,15,228,234 ; pmulhuw %xmm2,%xmm5
DB 102,15,228,250 ; pmulhuw %xmm2,%xmm7
@@ -60427,20 +60431,20 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
- DB 0,63 ; add %bh,(%edi)
+ DB 192,63,0 ; sarb $0x0,(%edi)
+ DB 0,32 ; add %ah,(%eax)
+ DB 64 ; inc %eax
DB 0,0 ; add %al,(%eax)
- DB 0,63 ; add %bh,(%edi)
+ DB 96 ; pusha
+ DB 64 ; inc %eax
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
+ DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
+ DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
- DB 128,63,0 ; cmpb $0x0,(%edi)
- DB 0,0 ; add %al,(%eax)
- DB 64 ; inc %eax
- DB 0,0 ; add %al,(%eax)
- DB 64 ; inc %eax
- DB 64 ; inc %eax
+ DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -60768,7 +60772,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a412f6 <_sk_overlay_sse2_8bit+0xe9a347e2>
+ DB 233,220,63,163,233 ; jmp e9a412f6 <_sk_overlay_sse2_8bit+0xe9a347e6>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,81 ; mov %eax,0x513fdce9
DB 140,242 ; mov %?,%edx
@@ -61263,7 +61267,7 @@ ALIGN 4
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg d7eb <_sk_overlay_sse2_8bit+0xcd7>
+ DB 127,67 ; jg d7eb <_sk_overlay_sse2_8bit+0xcdb>
DB 0,0 ; add %al,(%eax)
DB 0 ; .byte 0x0
DB 79 ; dec %edi
diff --git a/src/jumper/SkJumper_stages.cpp b/src/jumper/SkJumper_stages.cpp
index 4b23892a9a..18fff43bd4 100644
--- a/src/jumper/SkJumper_stages.cpp
+++ b/src/jumper/SkJumper_stages.cpp
@@ -221,8 +221,8 @@ STAGE(seed_shader) {
// It's important for speed to explicitly cast(x) and cast(y),
// which has the effect of splatting them to vectors before converting to floats.
// On Intel this breaks a data dependency on previous loop iterations' registers.
- float iota[] = { 0,1,2,3,4,5,6,7 };
- r = cast(x) + 0.5f + unaligned_load<F>(iota);
+ float iota[] = { 0.5f,1.5f,2.5f,3.5f,4.5f,5.5f,6.5f,7.5f };
+ r = cast(x) + unaligned_load<F>(iota);
g = cast(y) + 0.5f;
b = 1.0f;
a = 0;